charset: prefer manual definitions over continuations
[sheet.git] / charset-unicode.inc.pl
1 use utf8;
2 +{
3         # bmp
4         0x0000 => [0x02, 'X Cc joinr',         'control'],
5         0x0002 => [0x02, 'X L Po joinl joinr', 'comn'],
6         0x0004 => [0x04, 'X L Latin joinl',    'basic latin'],
7         0x0008 => [0x02, 'X Cc joinr',         'control'],
8         0x000A => [0x02, 'X L So joinl joinr', 'comn'],
9         0x000C => [0x04, 'X L Latin joinl',    'latin1'],
10         0x0010 => [0x08, 'X L Latin',          'latin extended-A'],
11         0x0018 => [0x08, 'X L Latin',          'latin extended-B'],
12         0x0020 => [0x05, 'X L Latin',          'latin ext-B'],
13         0x0025 => [0x06, 'X L Latin',          'IPA'],
14         0x002B => [0x05, 'X Sk',               'spacing modifier'],
15         0x0030 => [0x08, 'X Mn',               'diacritics'],
16         0x0038 => [0x08, 'X L Greek',          'greek'],
17         0x0040 => [0x10, 'X L Cyrillic',       'cyrillic'],
18         0x0050 => [0x03, 'X L Cyrillic',       'cyrillic+'],
19         0x0053 => [0x05, 'X L Armenian',       'armenian'],
20         0x0058 => [0x08, 'X L Hebrew',         'hebrew'],
21         0x0060 => [0x10, 'X L Arabic',         'arabic'],
22         0x0070 => [0x05, 'X L Aramaic',        'syriac'],
23         0x0075 => [0x03, 'X L Arabic',         'arabic+'],
24         0x0078 => [0x04, 'X L African',        'thaana'],
25         0x007C => [0x04, 'X L African',        'n\'ko'],
26         0x0080 => [0x04, 'X L Hebrew',         'samaritan'],
27         0x0084 => [0x02, 'X L Aramaic',        'manda'],
28         0x0086 => [0x01, 'X Xr L Aramaic',     'syr'],
29         0x0087 => [0x03],
30         0x008A => [0x06, 'X L Arabic',         'arabic ext-A'],
31         0x0090 => [0x08, 'X L Brahmic',        'devanagari'],
32         0x0098 => [0x08, 'X L Brahmic',        'bengali'],
33         0x00A0 => [0x08, 'X L Brahmic',        'gurmukhi'],
34         0x00A8 => [0x08, 'X L Brahmic',        'gujarati'],
35         0x00B0 => [0x08, 'X L Brahmic',        'oriya'],
36         0x00B8 => [0x08, 'X L Brahmic',        'tamil'],
37         0x00C0 => [0x08, 'X L Brahmic',        'telugu'],
38         0x00C8 => [0x08, 'X L Brahmic',        'kannada'],
39         0x00D0 => [0x08, 'X L Brahmic',        'malayalam'],
40         0x00D8 => [0x08, 'X L Brahmic',        'sinhala'],
41         0x00E0 => [0x08, 'X L Brahmic Khmer',  'thai'],
42         0x00E8 => [0x08, 'X L Brahmic Khmer',  'lao'],
43         0x00F0 => [0x10, 'X L Brahmic',        'tibetan'],
44         0x0100 => [0x0A, 'X L Brahmic',        'myanmar'],
45         0x010A => [0x06, 'X L Aramaic',        'georgian'],
46         0x0110 => [0x10, 'X L Hangul',         'hangeul jamo'],
47         0x0120 => [0x10, 'X L African',        'ethiopic'],
48         0x0130 => [0x08, 'X L African',        'ethiopic'],
49         0x0138 => [0x02, 'X L African',        'eth+'],
50         0x013A => [0x06, 'X L Syllabic',       'cherokee'],
51         0x0140 => [0x20, 'X L Syllabic',       'unified canadian aboriginal syllabics'],
52         0x0160 => [0x08, 'X L Syllabic',       'unified canadian syllabics'],
53         0x0168 => [0x02, 'X L Alpha',          'ogham'],
54         0x016A => [0x06, 'X L Alpha',          'runic'],
55         0x0170 => [0x02, 'X L Brahmic',        'tagalog'],
56         0x0172 => [0x02, 'X L Brahmic',        'hanun'],
57         0x0174 => [0x02, 'X L Brahmic',        'buhid'],
58         0x0176 => [0x02, 'X L Brahmic',        'tagb', 'tagbanwa'],
59         0x0178 => [0x08, 'X L Brahmic Khmer',  'khmer'],
60         0x0180 => [0x0B, 'X L Aramaic',        'mongolian'],
61         0x018B => [0x05, 'X L Syllabic',       'canadian+'],
62         0x0190 => [0x05, 'X L Brahmic',        'limbu'],
63         0x0195 => [0x03, 'X L Brahmic',        'tai le'],
64         0x0198 => [0x06, 'X L Brahmic',        'new tai lue'],
65         0x019E => [0x02, 'X L Brahmic Khmer',  'khmer', 'khmer symbols'],
66         0x01A0 => [0x02, 'X L Brahmic',        'lontara'],
67         0x01A2 => [0x09, 'X L Brahmic',        'tai tham'],
68         0x01AB => [0x05, 'X Mn',               'diacritics+'],
69         0x01B0 => [0x08, 'X L Brahmic',        'balinese'],
70         0x01B8 => [0x04, 'X L Brahmic',        'sundanese'],
71         0x01BC => [0x04, 'X L Brahmic',        'batak'],
72         0x01C0 => [0x05, 'X L Brahmic',        'lepcha'],
73         0x01C5 => [0x03, 'X L Alpha',          'ol chiki'],
74         0x01C8 => [0x01, 'X L Cyrillic',       'cyr'],
75         0x01C9 => [0x03, 'X Xr L Aramaic',     'georg+'],
76         0x01CC => [0x01, 'X L Brahmic',        'sn'],
77         0x01CD => [0x03, 'X L Brahmic',        'vedic'],
78         0x01D0 => [0x08, 'X L Latin',          'phonetic'],
79         0x01D8 => [0x04, 'X L Latin',          'phonetic+'],
80         0x01DC => [0x04, 'X Mn',               'diacritics+'],
81         0x01E0 => [0x10, 'X L Latin',          'latin extended additional'],
82         0x01F0 => [0x10, 'X L Greek',          'greek+'],
83         0x0200 => [0x07, 'X Po',               'general punctuation'],
84         0x0207 => [0x03, 'X L Latin',          'suþscript'], # suth now means "sub and/or sup"
85         0x020A => [0x03, 'X Sc',               'currency'],
86         0x020D => [0x03, 'X Mn',               'overlay'],
87         0x0210 => [0x05, 'X So',               'letterlike'],
88         0x0215 => [0x04, 'X Latin',            'number'],
89         0x0219 => [0x07, 'X So',               'arrows'],
90         0x0220 => [0x10, 'X Sm',               'mathematical symbols'],
91         0x0230 => [0x10, 'X So',               'miscellaneous technical'],
92         0x0240 => [0x04, 'X So',               'control'],
93         0x0244 => [0x02, 'X So',               'OCR'],
94         0x0246 => [0x0A, 'X Latin',            'enclosed alphanumerics'],
95         0x0250 => [0x08, 'X So',               'box drawing'],
96         0x0258 => [0x02, 'X So',               'blocks'],
97         0x025A => [0x06, 'X So',               'geometric shapes'],
98         0x0260 => [0x10, 'X So',               'miscellaneous symbols'],
99         0x0270 => [0x0C, 'X So',               'dingbats'],
100         0x027C => [0x03, 'X Sm',               'maths-A'],
101         0x027F => [0x01, 'X So',               'arr', 'supplemental arrows-A'],
102         0x0280 => [0x10, 'X L Alpha',          'braille'],
103         0x0290 => [0x08, 'X So',               'supplemental arrows-B'],
104         0x0298 => [0x08, 'X Sm',               'mathematical symbols-B'],
105         0x02A0 => [0x10, 'X Sm',               'supplemental mathematical operators'],
106         0x02B0 => [0x10, 'X So',               'miscellaneous symbols and arrows'],
107         0x02C0 => [0x06, 'X L Cyrillic',       'glagolitic'],
108         0x02C6 => [0x02, 'X L Latin',          'latin-C'],
109         0x02C8 => [0x08, 'X L Greek',          'coptic'],
110         0x02D0 => [0x03, 'X L Aramaic',        'georgian+'],
111         0x02D3 => [0x05, 'X L Alpha',          'tifinagh'], #TODO: proto-canaanite
112         0x02D8 => [0x06, 'X L African',        'ethiopic+'],
113         0x02DE => [0x02, 'X L Cyrillic',       'cyrl-A'],
114         0x02E0 => [0x08, 'X Po',               'punctuation+'],
115         0x02E8 => [0x08, 'X L Han',            'cjk radicals'],
116         0x02F0 => [0x0E, 'X L Han',            'kangxi radicals'],
117         0x02FE => [0x01],
118         0x02FF => [0x01, 'X So Han',           'idc'],
119         0x0300 => [0x04, 'X Po Han',           'cjk misc'],
120         0x0304 => [0x06, 'X L Hiragana',       'hiragana'],
121         0x030A => [0x06, 'X L Katakana',       'katakana'],
122         0x0310 => [0x03, 'X L Bopomofo',       'bopomofo'],
123         0x0313 => [0x06, 'X L Katakana',       'hangeul compat'],
124         0x0319 => [0x01, 'X L Han',            'kbn', 'kanbun'],
125         0x031A => [0x02, 'X L Bopomofo',       'bpmf', 'bopomofo extended'],
126         0x031C => [0x03, 'X L Han',            'strokes', 'CJK strokes'],
127         0x031F => [0x01, 'X L Katakana',       'k+', 'katakana phonetic extensions'],
128         0x0320 => [0x10, 'X L Han',            'enclosed cjk characters'],
129         0x0330 => [0x10, 'X Xd L Han',         'cjk compatibility'],
130         0x0340 => [0x19C,'X L Han',            'cjk unified ideographs extension A'],
131         0x04DC => [0x04, 'X So',               'hexagrams'],
132         0x04E0 => [0x520,'X L Han',            'cjk unified ideographs'],
133         0x0A00 => [0x49, 'X L Syllabic',       'yi'],
134         0x0A49 => [0x04, 'X L Syllabic',       'yi radicals'],
135         0x0A4D => [0x03, 'X L Latin',          'lisu'],
136         0x0A50 => [0x14, 'X L Syllabic',       'vai'],
137         0x0A64 => [0x06, 'X L Cyrillic',       'cyrillic extended-B'],
138         0x0A6A => [0x06, 'X L Syllabic',       'bamum'],
139         0x0A70 => [0x02, 'X L Mn',             'tones'],
140         0x0A72 => [0x0E, 'X L Latin',          'latin extended-D'],
141         0x0A80 => [0x03, 'X L Brahmic',        'sylheti'],
142         0x0A83 => [0x01, 'X No',               'in'],
143         0x0A84 => [0x04, 'X L Brahmic',        'phags-pa'],
144         0x0A88 => [0x06, 'X L Brahmic',        'saurashtra'],
145         0x0A8E => [0x02, 'X L Brahmic',        'deva+'],
146         0x0A90 => [0x03, 'X L Brahmic',        'kayah li'],
147         0x0A93 => [0x03, 'X L Brahmic',        'rejang'],
148         0x0A96 => [0x02, 'X L Hangul',         'jamo-A'],
149         0x0A98 => [0x06, 'X L Brahmic',        'javanese'],
150         0x0A9E => [0x02, 'X L Brahmic',        'mm-B', 'myanmar extended-B'],
151         0x0AA0 => [0x06, 'X L Brahmic',        'cham'],
152         0x0AA6 => [0x02, 'X L Brahmic',        'mm-A', 'myanmar extended-A'],
153         0x0AA8 => [0x06, 'X L Brahmic Khmer',  'tai viet'],
154         0x0AAE => [0x02, 'X L Brahmic',        'mtei+', 'meetei mayek extended'],
155         0x0AB0 => [0x03, 'X L African',        'ethiopic-A'],
156         0x0AB3 => [0x04, 'X L Latin',          'latin ext-E'],
157         0x0AB7 => [0x05, 'X L Syllabic',       'cherokee+'],
158         0x0ABC => [0x04, 'X L Brahmic',        'meithei', 'meetai mayek'],
159         0x0AC0 => [0x2BB,'X L Hangul',         'hangeul syllables'],
160         0x0D7B => [0x05, 'X L Hangul',         'haungeul jamo-B'],
161         0x0D80 => [0x40, 'X Cs',               'high surrogates'],
162         0x0DC0 => [0x40, 'X Cs',               'low surrogates'],
163         0x0E00 => [0x190,'X Co',               'private use'],
164         0x0F90 => [0x20, 'X L Han',            'cjk compatibility ideographs'],
165         0x0FB0 => [0x05, 'X Xd L Alpha',       'presentation'],
166         0x0FB5 => [0x28, 'X Xd L Arabic',      'arabic presentation forms A'],
167         0x0FDD => [0x02, 'Xi',                 '?'],
168         0x0FDF => [0x01, 'X Xd L Arabic joinu', ''], # continue after brief intermission
169         0x0FE0 => [0x01, 'X Cc',               'var'],
170         0x0FE1 => [0x01, 'X L Pd',             'ver'],
171         0x0FE2 => [0x01, 'X L Mn',             '½'],
172         0x0FE3 => [0x02, 'X Xd Pd Han',        'comp'],
173         0x0FE5 => [0x02, 'X Xd L Latin',       'small'],
174         0x0FE7 => [0x09, 'X Xd L Arabic',      'arabic presentation B'],
175         0x0FF0 => [0x0F, 'X L Latin',          'halfwidth & fullwidth forms'],
176         0x0FFF => [0x01, 'X Cc',               'sp'],
177
178         # smp
179         0x1000 => [0x08, 'X L Syllabic',       'linear B syllabary'],
180         0x1008 => [0x08, 'X L Syllabic',       'linear B ideograms'],
181         0x1010 => [0x04, 'X No',               'aegean num'],
182         0x1014 => [0x05, 'X No',               'greek numbers'],
183         0x1019 => [0x04, 'X So',               'ancient sym'],
184         0x101D => [0x03, 'X L Syllabic',       'phaistos'],
185         0x1020 => [0x04, 'X Xr L Greek',       'iberian'],
186         0x1024 => [0x04],
187         0x1028 => [0x02, 'X L Greek',          'lycian'],
188         0x102A => [0x04, 'X L Greek',          'carian'],
189         0x102E => [0x02, 'X L No',             'coptic'],
190         0x1030 => [0x03, 'X L Greek',          'italic'],
191         0x1033 => [0x02, 'X L Greek',          'gothic'],
192         0x1035 => [0x03, 'X L Cyrillic',       'permic'],
193         0x1038 => [0x02, 'X L Alpha',          'ugarit'],
194         0x103A => [0x04, 'X L Alpha',          'old persian'],
195         0x103E => [0x02, 'X Xr L Alpha',       'sh.qs'],
196         0x1040 => [0x05, 'X L Alpha',          'deseret'],
197         0x1045 => [0x03, 'X L Alpha',          'shavian'],
198         0x1048 => [0x03, 'X L Alpha',          'osmanya'],
199         0x104B => [0x05, 'X L Alpha',          'osage'],
200         0x1050 => [0x03, 'X L Alpha',          'elbasan'],
201         0x1053 => [0x04, 'X L Alpha',          'c albanian'],
202         0x1057 => [0x05, 'X Xr L Alpha',       'vithkuqi'],
203         0x105C => [0x04, 'X Xr L Alpha',       'todhri'],
204         0x1060 => [0x18, 'X L Syllabic',       'linear A'],
205         0x1078 => [0x08, 'X Xr L Syllabic',    'cypro-minoan'],
206         0x1080 => [0x04, 'X L Syllabic',       'cypriot'],
207         0x1084 => [0x02, 'X L Aramaic',        'aram'],
208         0x1086 => [0x02, 'X L Aramaic',        'palmr'],
209         0x1088 => [0x03, 'X L Aramaic',        'nabataean'],
210         0x108A => [0x01],
211         0x108C => [0x02, 'X Xr L Alpha',       'numid'],
212         0x108E => [0x02, 'X L Aramaic',        'hatr'],
213         0x1090 => [0x02, 'X L Aramaic',        'phoen'],
214         0x1092 => [0x02, 'X L Greek',          'lydian'],
215         0x1094 => [0x04],
216         0x1098 => [0x02, 'X L Alpha',          'mero h', 'meroitic hieroglyphs'],
217         0x109A => [0x06, 'X L Alpha',          'meroitic cursive'],
218         0x10A0 => [0x06, 'X L Syllabic',       'kharoshthi'],
219         0x10A6 => [0x02, 'X L Aramaic',        's arab'],
220         0x10A8 => [0x02, 'X L Aramaic',        'n arab'],
221         0x10AA => [0x02, 'X Xr L Brahmic',     'balti'],
222         0x10AC => [0x04, 'X L Aramaic',        'manichaean'],
223         0x10B0 => [0x04, 'X L Aramaic',        'avestan'],
224         0x10B4 => [0x02, 'X L Aramaic',        'parth'],
225         0x10B6 => [0x02, 'X L Aramaic',        'pahlav', 'inscriptional pahlavi'],
226         0x10B8 => [0x03, 'X L Aramaic',        'psalt pahl', 'psalter pahlavi'],
227         0x10BB => [0x03, 'X Xr L Aramaic',     'book pahl', 'book pahlavi'],
228         0x10BE => [0x02, 'X Xr L Alpha',       'babur'],
229         0x10C0 => [0x05, 'X L Aramaic',        'old turkic'],
230         0x10C5 => [0x03],
231         0x10C8 => [0x08, 'X L Aramaic',        'old hungarian'],
232         0x10D0 => [0x04, 'X Xr L Alpha',       'rohingya'],
233         0x10D4 => [0x04, 'X Xr L Alpha',       'garay'],
234         0x10D8 => [0x08, 'X Xr L Syllabic',    'byblos'],
235         0x10E0 => [0x06],
236         0x10E6 => [0x02, 'X No',               'rumi'],
237         0x10E8 => [0x06],
238         0x10EE => [0x02, 'X Xr L Aramaic',     'elym'],
239         0x10F0 => [0x03, 'X Xr L Aramaic',     'old sog'],
240         0x10F3 => [0x04, 'X Xr L Aramaic',     'sogdian'],
241         0x10F7 => [0x01],
242         0x10F8 => [0x08, 'X Xr L Aramaic',     'uyghur'],
243         0x1100 => [0x08, 'X L Brahmic',        'brahmi'],
244         0x1108 => [0x05, 'X L Brahmic',        'kaithi'],
245         0x110D => [0x03, 'X L Brahmic',        'sora som'],
246         0x1110 => [0x05, 'X L Brahmic',        'chakma'],
247         0x1115 => [0x03, 'X L Brahmic',        'mahajani'],
248         0x1118 => [0x06, 'X L Brahmic',        'sharada'],
249         0x111E => [0x02, 'X No Brahmic',       'sinhal'],
250         0x1120 => [0x05, 'X L Brahmic',        'khojki'],
251         0x1125 => [0x03, 'X Xr L Brahmic',     'landa'],
252         0x1128 => [0x03, 'X L Brahmic',        'multani'],
253         0x112B => [0x05, 'X L Brahmic',        'khudabadi'],
254         0x1130 => [0x08, 'X L Brahmic',        'grantha'],
255         0x1138 => [0x06, 'X Xr L Brahmic',     'tulu'],
256         0x113E => [0x02, 'X Xr L Brahmic',     'shar+', 'sharada extension'],
257         0x1140 => [0x08, 'X L Brahmic',        'newar'],
258         0x1148 => [0x06, 'X L Brahmic',        'tirhuta'],
259         0x114E => [0x02, 'X Xr L Alpha',       'tani'],
260         0x1150 => [0x08, 'X Xr L Brahmic',     'ranjana'],
261         0x1158 => [0x08, 'X L Brahmic',        'siddham'],
262         0x1160 => [0x06, 'X L Brahmic',        'modi'],
263         0x1166 => [0x02, 'X L Aramaic',        'mong', 'mongolian extension'],
264         0x1168 => [0x05, 'X L Brahmic',        'takri'],
265         0x116D => [0x03, 'X Xr L Brahmic',     'jenticha'],
266         0x1170 => [0x04, 'X Xr L Brahmic',     'ahom'],
267         0x1174 => [0x06, 'X Xr L Alpha',       'zou'],
268         0x117A => [0x06, 'X Xr L Brahmic',     'pyu'],
269         0x1180 => [0x05, 'X Xr L Brahmic',     'dogra'],
270         0x1185 => [0x04, 'X Xr L Brahmic',     'sirmauri'],
271         0x1189 => [0x01],
272         0x118A => [0x06, 'X L Syllabic',       'warang citi'],
273         0x1190 => [0x04, 'X Xr L Brahmic',     'tolong siki'],
274         0x1194 => [0x04, 'X Xr L Brahmic',     'tikamuli'],
275         0x1198 => [0x04, 'X Xr L Brahmic',     'khambu rai'],
276         0x119C => [0x04, 'X Xr L Brahmic',     'kirat rai'],
277         0x11A0 => [0x05, 'X Xr L Brahmic',     'zanabazar square'],
278         0x11A5 => [0x06, 'X Xr L Brahmic',     'soyombo'],
279         0x11AB => [0x01],
280         0x11AC => [0x04, 'X L Alpha',          'pau cin hau'],
281         0x11B0 => [0x05, 'X Xr L Brahmic',     'dhives akuru'],
282         0x11B5 => [0x04, 'X Xr L Brahmic',     'leke'],
283         0x11B9 => [0x06, 'X Xr L Brahmic',     'nandinagari'],
284         0x11BF => [0x01],
285         0x11C0 => [0x07, 'X L Brahmic',        'bhaiksuki'],
286         0x11C7 => [0x05, 'X L Brahmic',        'marchen'],
287         0x11CC => [0x04, 'X Xr L Brahmic',     'balti B'],
288         0x11D0 => [0x06, 'X Xr L Brahmic',     'masaram gondi'],
289         0x11D6 => [0x05, 'X Xr L Brahmic',     'gunjala gondi'],
290         0x11DB => [0x05, 'X Xr L Brahmic',     'kawi'],
291         0x11E0 => [0x07, 'X Xr L Brahmic',     'tocharian'],
292         0x11E7 => [0x06, 'X Xr L Brahmic',     'khotanese'],
293         0x11ED => [0x01],
294         0x11EE => [0x02, 'X Xr L Brahmic',     'makas', 'makasar'],
295         0x11F0 => [0x04, 'X Xr L Brahmic',     'vatteluttu'],
296         0x11F4 => [0x02],
297         0x11F6 => [0x06, 'X Xr L Brahmic',     'chola'],
298         0x11FC => [0x04, 'X Xr L Brahmic',     'tamil+'],
299         0x1200 => [0x40, 'X L Syllabic',       'cuneiform'],
300         0x1240 => [0x08, 'X No',               'cuneiform numbers'],
301         0x1248 => [0x08, 'X L Syllabic',       'early dynastic cuneiform'], #TODO: join bottom but title at top
302         0x1250 => [0x05, 'X L Syllabic',       'e. dyn. cuneiform'],
303         0x1255 => [0x0B],
304         0x1260 => [0x80, 'X Xr L Syllabic',    'proto-cuneiform'],
305         0x12E0 => [0x19, 'X Xr L Syllabic',    'indus'],
306         0x12F9 => [0x07],
307         0x1300 => [0x43, 'X L Syllabic',       'egyptian hieroglyphs'],
308         0x1343 => [0x01, 'X Xr L Syllabic',    'eg.c', 'Egyptian control characters'],
309         0x1344 => [0xFC, 'X Xr L Syllabic',    'egyptian hieroglyphs extended-A'],
310         0x1440 => [0x28, 'X L Syllabic',       'anatolian hieroglyphs'],
311         0x1468 => [0x98, 'X Xr L Syllabic',    'egyptian hieroglyphs extended-B'],
312         0x1500 => [0x04, 'X Xr L Brahmic',     'lampung'],
313         0x1504 => [0x03, 'X Xr L Brahmic',     'kerinci'],
314         0x1507 => [0x01],
315         0x1508 => [0x48, 'X Xr L Syllabic',    'mandombe'],
316         0x1550 => [0x50, 'X Xr L Syllabic',    'maya hieroglyphs'],
317         0x15A0 => [0x20],
318         0x15C0 => [0x40, 'X Xr L Syllabic',    'aztec pictograms'],
319         0x1600 => [0x08, 'X Xr L Alpha',       'cirth'],
320         0x1608 => [0x08, 'X Xr L Alpha',       'tengwar'],
321         0x1610 => [0x04, 'X Xr L Brahmic',     'khema'],
322         0x1614 => [0x04, 'X Xr L Brahmic',     'khe prih'],
323         0x1618 => [0x02],
324         0x161A => [0x06, 'X Xr L Alpha',       'moon'],
325         0x1620 => [0x50, 'X Xr L Syllabic',    'blissymbols'],
326         0x1670 => [0x0B, 'X Xr L Syllabic',    'bagam'],
327         0x167B => [0x05, 'X Xr L Syllabic',    'iban'],
328         0x1680 => [0x24, 'X L Syllabic',       'bamum supplement'],
329         0x16A4 => [0x03, 'X L Alpha',          'mro'],
330         0x16A7 => [0x06, 'X Xr L Alpha',       'mossang tangsa'],
331         0x16AD => [0x03, 'X L Alpha',          'bassa vah'],
332         0x16B0 => [0x09, 'X L Syllabic',       'pahawh hmong'],
333         0x16B9 => [0x07, 'X Xr L Syllabic',    'woleai'],
334         0x16C0 => [0x08, 'X Xr L Syllabic',    'kpelle'],
335         0x16C8 => [0x05, 'X Xr L Syllabic',    'afaka'],
336         0x16CD => [0x03, 'X Xr L Syllabic',    'lk tangsa', 'Latsam Khimhun Tangsa'],
337         0x16D0 => [0x0D],
338         0x16DD => [0x03, 'X Xr L Brahmic',     'kulitan'],
339         0x16E0 => [0x04, 'X Xr L Alpha',       'mwangwego'],
340         0x16E4 => [0x06, 'X Xr L Alpha',       'medefaidrin'],
341         0x16EA => [0x06, 'X Xr L Brahmic',     'lontara+', 'buginese'],
342         0x16F0 => [0x0A, 'X L Syllabic',       'miao'],
343         0x16FA => [0x04, 'X Xr L Brahmic',     'lontara b-b'],
344         0x16FE => [0x02, 'X So',               'ideo', 'Ideographic Symbols and Punctuation'],
345         0x1700 => [0x180,'X L Syllabic',       'tangut ideographs'],
346         0x1880 => [0x30, 'X L Syllabic',       'tangut components'],
347         0x18B0 => [0x20, 'X Xr L Han',         'khitan small'],
348         0x18D0 => [0x90, 'X Xr L Han',         'khitan ideographs'],
349         0x1960 => [0x56, 'X Xr L Han',         'jurchen'],
350         0x19B6 => [0x04, 'X Xr L Han',         'jurchen rad'],
351         0x19BA => [0x06],
352         0x19C0 => [0x20],
353         0x19E0 => [0x50, 'X Xr L Syllabic',    'pau cin hau syllabary'],
354         0x1A30 => [0x50, 'X Xr L Syllabic',    'eskaya'],
355         0x1A80 => [0x2B, 'X Xr L Syllabic',    'naxi geba'],
356         0x1AAB => [0x01],
357         0x1AAC => [0x54, 'X Xr L Syllabic',    'naxi dongba'],
358         0x1B00 => [0x10, 'X L Hiragana',       'kana supplement'],
359         0x1B10 => [0x03, 'X Xr L Hiragana',    'kana+A'],
360         0x1B13 => [0x04, 'X Xr L Syllabic',    'kaidā'],
361         0x1B17 => [0x19, 'X Xr L Han',         'nushu'],
362         0x1B30 => [0x20, 'X Xr L Han',         'shuishu'],
363         0x1B50 => [0x70, 'X Xr L Syllabic',    'proto-elamite'],
364         0x1BC0 => [0x0A, 'X L Alpha',          'duployan'],
365         0x1BCA => [0x01, 'X L Cc',             'sh', 'Shorthand Formatting'],
366         0x1BCB => [0x05, 'X Xr L Alpha',       'pitman'],
367         0x1BD0 => [0x30, 'X Xr L Alpha',       'shorthands?'],
368         0x1C00 => [0xB0, 'X Xr L Alpha',       'micmac hieroglyphs'],
369         0x1CB0 => [0x30, 'X Xr L Syllabic',    'rongorongo'],
370         0x1CE0 => [0x20],
371         0x1D00 => [0x10, 'X So',               'byzantine musical'],
372         0x1D10 => [0x10, 'X So',               'musical symbols'],
373         0x1D20 => [0x05, 'X So',               'anc greek music'],
374         0x1D25 => [0x09],
375         0x1D2E => [0x02, 'X Xr No',            'mayan', 'Mayan Numerals'],
376         0x1D30 => [0x06, 'X So',               'tai xuan jing', 'tetragrams'],
377         0x1D36 => [0x02, 'X No',               'rod'],
378         0x1D38 => [0x08, 'X Xr L Sm',          'mathematical alphanumeric+'],
379         0x1D40 => [0x40, 'X L Sm',             'mathematical alphanumeric'],
380         0x1D80 => [0x2B, 'X L Alpha',          'sutton'],
381         0x1DAB => [0x55],
382         0x1E00 => [0x03, 'X L Cyrillic',       'glagol+'],
383         0x1E03 => [0x05, 'X Xr L Brahmic',     'pallava'],
384         0x1E08 => [0x06, 'X Xr L Brahmic',     'chalukya'],
385         0x1E0E => [0x02],
386         0x1E10 => [0x0B, 'X Xr L Alpha',       'eebee hmong'],
387         0x1E1B => [0x05, 'X Xr L Alpha',       'cher vang hm.'],
388         0x1E20 => [0x06, 'X Xr L Brahmic',     'western cham'],
389         0x1E26 => [0x03, 'X Xr L Alpha',       'beria', 'zaghawa'],
390         0x1E29 => [0x07],
391         0x1E30 => [0x20, 'X Xr L Syllabic',    'loma'],
392         0x1E50 => [0x30],
393         0x1E80 => [0x0E, 'X L Syllabic',       'mende kikakui'],
394         0x1E8E => [0x02],
395         0x1E90 => [0x06, 'X L Alpha',          'adlam'],
396         0x1E96 => [0x2A],
397         0x1EC0 => [0x07, 'X Xr No',            'persian siyaq'],
398         0x1EC7 => [0x05, 'X Xr No',            'indic siyaq'],
399         0x1ECC => [0x04, 'X Xr No',            'diwani siyaq'],
400         0x1ED0 => [0x05, 'X Xr No',            'ottoman siyaq'],
401         0x1ED5 => [0x0B],
402         0x1EE0 => [0x10, 'X L Arabic',         'arabic mathematical alphabetic'], # Sm
403         0x1EF0 => [0x10],
404         0x1F00 => [0x03, 'X So',               'mahjong'],
405         0x1F03 => [0x07, 'X So',               'domino tiles'],
406         0x1F0A => [0x06, 'X So',               'playing cards'],
407         0x1F10 => [0x10, 'X L Latin',          'enclosed alphanumeric supplement'], # So
408         0x1F20 => [0x10, 'X L Han',            'enclosed ideographic supplement'], # So
409         0x1F30 => [0x30, 'X So',               'miscellaneous symbols and pictographs'],
410         0x1F60 => [0x05, 'X So',               'emoticons'],
411         0x1F65 => [0x03, 'X So',               'ornament'],
412         0x1F68 => [0x08, 'X So',               'transport'],
413         0x1F70 => [0x08, 'X So',               'alchemical'],
414         0x1F78 => [0x08, 'X So',               'geometric shapes ext'],
415         0x1F80 => [0x10, 'X So',               'supplemental arrows-C'],
416         0x1F90 => [0x10, 'X So',               'supplemental symbols and pictographs'],
417         0x1FA0 => [0x60],
418 };