38449ab2cc632260ca33b9506c503dfdd8601062
[sheet.git] / charset-unicode.inc.pl
1 use utf8;
2 +{
3         # bmp
4         0x0000 => [0x02, 'X Cc joinr',         'control'],
5         0x0002 => [0x02, 'X L Po joinl joinr', 'comn'],
6         0x0004 => [0x04, 'X L Latin joinl',    'basic latin'],
7         0x0008 => [0x02, 'X Cc joinr',         'control'],
8         0x000A => [0x02, 'X L So joinl joinr', 'comn'],
9         0x000C => [0x04, 'X L Latin joinl',    'latin1'],
10         0x0010 => [0x08, 'X L Latin',          'latin extended-A'],
11         0x0018 => [0x08, 'X L Latin',          'latin extended-B'],
12         0x0020 => [0x05, 'X L Latin',          'latin ext-B'],
13         0x0025 => [0x06, 'X L Latin',          'IPA'],
14         0x002B => [0x05, 'X Sk',               'spacing modifier'],
15         0x0030 => [0x08, 'X Mn',               'diacritics'],
16         0x0038 => [0x08, 'X L Greek',          'greek'],
17         0x0040 => [0x10, 'X L Cyrillic',       'cyrillic'],
18         0x0050 => [0x03, 'X L Cyrillic',       'cyrillic+'],
19         0x0053 => [0x05, 'X L Armenian',       'armenian'],
20         0x0058 => [0x08, 'X L Hebrew',         'hebrew'],
21         0x0060 => [0x10, 'X L Arabic',         'arabic'],
22         0x0070 => [0x05, 'X L Aramaic',        'syriac'],
23         0x0075 => [0x03, 'X L Arabic',         'arabic+'],
24         0x0078 => [0x04, 'X L African',        'thaana'],
25         0x007C => [0x04, 'X L African',        q(n'ko)],
26         0x0080 => [0x04, 'X L Hebrew',         'samaritan'],
27         0x0084 => [0x02, 'X L Aramaic',        'manda'],
28         0x0086 => [0x01, 'X Xr L Aramaic',     'syr'],
29         0x0087 => [0x03],
30         0x008A => [0x06, 'X L Arabic',         'arabic ext-A'],
31         0x0090 => [0x08, 'X L Brahmic',        'devanagari'],
32         0x0098 => [0x08, 'X L Brahmic',        'bengali'],
33         0x00A0 => [0x08, 'X L Brahmic',        'gurmukhi'],
34         0x00A8 => [0x08, 'X L Brahmic',        'gujarati'],
35         0x00B0 => [0x08, 'X L Brahmic',        'oriya'],
36         0x00B8 => [0x08, 'X L Brahmic',        'tamil'],
37         0x00C0 => [0x08, 'X L Brahmic',        'telugu'],
38         0x00C8 => [0x08, 'X L Brahmic',        'kannada'],
39         0x00D0 => [0x08, 'X L Brahmic',        'malayalam'],
40         0x00D8 => [0x08, 'X L Brahmic',        'sinhala'],
41         0x00E0 => [0x08, 'X L Brahmic Khmer',  'thai'],
42         0x00E8 => [0x08, 'X L Brahmic Khmer',  'lao'],
43         0x00F0 => [0x10, 'X L Brahmic',        'tibetan'],
44         0x0100 => [0x0A, 'X L Brahmic',        'myanmar'],
45         0x010A => [0x06, 'X L Aramaic',        'georgian'],
46         0x0110 => [0x10, 'X L Hangul',         'hangeul jamo'],
47         0x0120 => [0x10, 'X L African',        'ethiopic'],
48         0x0130 => [0x08, 'X L African',        'ethiopic'],
49         0x0138 => [0x02, 'X L African',        'eth+'],
50         0x013A => [0x06, 'X L Syllabic',       'cherokee'],
51         0x0140 => [0x28, 'X L Syllabic',       'unified canadian aboriginal syllabics'],
52         0x0168 => [0x02, 'X L Alpha',          'ogham'],
53         0x016A => [0x06, 'X L Alpha',          'runic'],
54         0x0170 => [0x02, 'X L Brahmic',        'tagalog'],
55         0x0172 => [0x02, 'X L Brahmic',        'hanun'],
56         0x0174 => [0x02, 'X L Brahmic',        'buhid'],
57         0x0176 => [0x02, 'X L Brahmic',        'tagb', 'tagbanwa'],
58         0x0178 => [0x08, 'X L Brahmic Khmer',  'khmer'],
59         0x0180 => [0x0B, 'X L Aramaic',        'mongolian'],
60         0x018B => [0x05, 'X L Syllabic',       'canadian+'],
61         0x0190 => [0x05, 'X L Brahmic',        'limbu'],
62         0x0195 => [0x03, 'X L Brahmic',        'tai le'],
63         0x0198 => [0x06, 'X L Brahmic',        'new tai lue'],
64         0x019E => [0x02, 'X L Brahmic Khmer',  'khmer', 'khmer symbols'],
65         0x01A0 => [0x02, 'X L Brahmic',        'lontara'],
66         0x01A2 => [0x09, 'X L Brahmic',        'tai tham'],
67         0x01AB => [0x05, 'X Mn',               'diacritics+'],
68         0x01B0 => [0x08, 'X L Brahmic',        'balinese'],
69         0x01B8 => [0x04, 'X L Brahmic',        'sundanese'],
70         0x01BC => [0x04, 'X L Brahmic',        'batak'],
71         0x01C0 => [0x05, 'X L Brahmic',        'lepcha'],
72         0x01C5 => [0x03, 'X L Alpha',          'ol chiki'],
73         0x01C8 => [0x01, 'X L Cyrillic',       'cyr'],
74         0x01C9 => [0x03, 'X Xr L Aramaic',     'georg+'],
75         0x01CC => [0x01, 'X L Brahmic',        'sn'],
76         0x01CD => [0x03, 'X L Brahmic',        'vedic'],
77         0x01D0 => [0x08, 'X L Latin',          'phonetic'],
78         0x01D8 => [0x04, 'X L Latin',          'phonetic+'],
79         0x01DC => [0x04, 'X Mn',               'diacritics+'],
80         0x01E0 => [0x10, 'X L Latin',          'latin extended additional'],
81         0x01F0 => [0x10, 'X L Greek',          'greek+'],
82         0x0200 => [0x07, 'X Po',               'general punctuation'],
83         0x0207 => [0x03, 'X L Latin',          'suþscript'], # suth now means "sub and/or sup"
84         0x020A => [0x03, 'X Sc',               'currency'],
85         0x020D => [0x03, 'X Mn',               'overlay'],
86         0x0210 => [0x05, 'X So',               'letterlike'],
87         0x0215 => [0x04, 'X Latin',            'number'],
88         0x0219 => [0x07, 'X So',               'arrows'],
89         0x0220 => [0x10, 'X Sm',               'mathematical symbols'],
90         0x0230 => [0x10, 'X So',               'miscellaneous technical'],
91         0x0240 => [0x04, 'X So',               'control'],
92         0x0244 => [0x02, 'X So',               'OCR'],
93         0x0246 => [0x0A, 'X Latin',            'enclosed alphanumerics'],
94         0x0250 => [0x08, 'X So',               'box drawing'],
95         0x0258 => [0x02, 'X So',               'blocks'],
96         0x025A => [0x06, 'X So',               'geometric shapes'],
97         0x0260 => [0x10, 'X So',               'miscellaneous symbols'],
98         0x0270 => [0x0C, 'X So',               'dingbats'],
99         0x027C => [0x03, 'X Sm',               'maths-A'],
100         0x027F => [0x01, 'X So',               'arr', 'supplemental arrows-A'],
101         0x0280 => [0x10, 'X L Alpha',          'braille'],
102         0x0290 => [0x08, 'X So',               'supplemental arrows-B'],
103         0x0298 => [0x08, 'X Sm',               'mathematical symbols-B'],
104         0x02A0 => [0x10, 'X Sm',               'supplemental mathematical operators'],
105         0x02B0 => [0x10, 'X So',               'miscellaneous symbols and arrows'],
106         0x02C0 => [0x06, 'X L Cyrillic',       'glagolitic'],
107         0x02C6 => [0x02, 'X L Latin',          'latin-C'],
108         0x02C8 => [0x08, 'X L Greek',          'coptic'],
109         0x02D0 => [0x03, 'X L Aramaic',        'georgian+'],
110         0x02D3 => [0x05, 'X L Alpha',          'tifinagh'], #TODO: proto-canaanite
111         0x02D8 => [0x06, 'X L African',        'ethiopic+'],
112         0x02DE => [0x02, 'X L Cyrillic',       'cyrl-A'],
113         0x02E0 => [0x08, 'X Po',               'punctuation+'],
114         0x02E8 => [0x08, 'X L Han',            'cjk radicals'],
115         0x02F0 => [0x0E, 'X L Han',            'kangxi radicals'],
116         0x02FE => [0x01],
117         0x02FF => [0x01, 'X So Han',           'idc'],
118         0x0300 => [0x04, 'X Po Han',           'cjk misc'],
119         0x0304 => [0x06, 'X L Hiragana',       'hiragana'],
120         0x030A => [0x06, 'X L Katakana',       'katakana'],
121         0x0310 => [0x03, 'X L Bopomofo',       'bopomofo'],
122         0x0313 => [0x06, 'X L Katakana',       'hangeul compat'],
123         0x0319 => [0x01, 'X L Han',            'kbn', 'kanbun'],
124         0x031A => [0x02, 'X L Bopomofo',       'bpmf', 'bopomofo extended'],
125         0x031C => [0x03, 'X L Han',            'strokes', 'CJK strokes'],
126         0x031F => [0x01, 'X L Katakana',       'k+', 'katakana phonetic extensions'],
127         0x0320 => [0x10, 'X L Han',            'enclosed cjk characters'],
128         0x0330 => [0x10, 'X Xd L Han',         'cjk compatibility'],
129         0x0340 => [0x19C,'X L Han',            'cjk unified ideographs extension A'],
130         0x04DC => [0x04, 'X So',               'hexagrams'],
131         0x04E0 => [0x520,'X L Han',            'cjk unified ideographs'],
132         0x0A00 => [0x49, 'X L Syllabic',       'yi'],
133         0x0A49 => [0x04, 'X L Syllabic',       'yi radicals'],
134         0x0A4D => [0x03, 'X L Latin',          'lisu'],
135         0x0A50 => [0x14, 'X L Syllabic',       'vai'],
136         0x0A64 => [0x06, 'X L Cyrillic',       'cyrillic extended-B'],
137         0x0A6A => [0x06, 'X L Syllabic',       'bamum'],
138         0x0A70 => [0x02, 'X L Mn',             'tones'],
139         0x0A72 => [0x0E, 'X L Latin',          'latin extended-D'],
140         0x0A80 => [0x03, 'X L Brahmic',        'sylheti'],
141         0x0A83 => [0x01, 'X No',               'in'],
142         0x0A84 => [0x04, 'X L Brahmic',        'phags-pa'],
143         0x0A88 => [0x06, 'X L Brahmic',        'saurashtra'],
144         0x0A8E => [0x02, 'X L Brahmic',        'deva+'],
145         0x0A90 => [0x03, 'X L Brahmic',        'kayah li'],
146         0x0A93 => [0x03, 'X L Brahmic',        'rejang'],
147         0x0A96 => [0x02, 'X L Hangul',         'jamo-A'],
148         0x0A98 => [0x06, 'X L Brahmic',        'javanese'],
149         0x0A9E => [0x02, 'X L Brahmic',        'mm-B', 'myanmar extended-B'],
150         0x0AA0 => [0x06, 'X L Brahmic',        'cham'],
151         0x0AA6 => [0x02, 'X L Brahmic',        'mm-A', 'myanmar extended-A'],
152         0x0AA8 => [0x06, 'X L Brahmic Khmer',  'tai viet'],
153         0x0AAE => [0x02, 'X L Brahmic',        'mtei+', 'meetei mayek extended'],
154         0x0AB0 => [0x03, 'X L African',        'ethiopic-A'],
155         0x0AB3 => [0x04, 'X L Latin',          'latin ext-E'],
156         0x0AB7 => [0x05, 'X L Syllabic',       'cherokee+'],
157         0x0ABC => [0x04, 'X L Brahmic',        'meithei', 'meetai mayek'],
158         0x0AC0 => [0x2BB,'X L Hangul',         'hangeul syllables'],
159         0x0D7B => [0x05, 'X L Hangul',         'haungeul jamo-B'],
160         0x0D80 => [0x40, 'X Cs',               'high surrogates'],
161         0x0DC0 => [0x40, 'X Cs',               'low surrogates'],
162         0x0E00 => [0x190,'X Co',               'private use'],
163         0x0F90 => [0x20, 'X L Han',            'cjk compatibility ideographs'],
164         0x0FB0 => [0x05, 'X Xd L Alpha',       'presentation'],
165         0x0FB5 => [0x28, 'X Xd L Arabic',      'arabic presentation forms A'],
166         0x0FDD => [0x02, 'Xi',                 '?'],
167         0x0FDF => [0x01, 'X Xd L Arabic joinu', ''], # continue after brief intermission
168         0x0FE0 => [0x01, 'X Cc',               'var'],
169         0x0FE1 => [0x01, 'X L Pd',             'ver'],
170         0x0FE2 => [0x01, 'X L Mn',             '½'],
171         0x0FE3 => [0x02, 'X Xd Pd Han',        'comp'],
172         0x0FE5 => [0x02, 'X Xd L Latin',       'small'],
173         0x0FE7 => [0x09, 'X Xd L Arabic',      'arabic presentation B'],
174         0x0FF0 => [0x0F, 'X L Latin',          'halfwidth & fullwidth forms'],
175         0x0FFF => [0x01, 'X Cc',               'sp'],
176
177         # smp
178         0x1000 => [0x08, 'X L Syllabic',       'linear B syllabary'],
179         0x1008 => [0x08, 'X L Syllabic',       'linear B ideograms'],
180         0x1010 => [0x04, 'X No',               'aegean num'],
181         0x1014 => [0x05, 'X No',               'greek numbers'],
182         0x1019 => [0x04, 'X So',               'ancient sym'],
183         0x101D => [0x03, 'X L Syllabic',       'phaistos'],
184         0x1020 => [0x04, 'X Xr L Greek',       'iberian'],
185         0x1024 => [0x04],
186         0x1028 => [0x02, 'X L Greek',          'lycian'],
187         0x102A => [0x04, 'X L Greek',          'carian'],
188         0x102E => [0x02, 'X L No',             'coptic'],
189         0x1030 => [0x03, 'X L Greek',          'italic'],
190         0x1033 => [0x02, 'X L Greek',          'gothic'],
191         0x1035 => [0x03, 'X L Cyrillic',       'permic'],
192         0x1038 => [0x02, 'X L Alpha',          'ugarit'],
193         0x103A => [0x04, 'X L Alpha',          'old persian'],
194         0x103E => [0x02, 'X Xr L Alpha',       'sh.qs'],
195         0x1040 => [0x05, 'X L Alpha',          'deseret'],
196         0x1045 => [0x03, 'X L Alpha',          'shavian'],
197         0x1048 => [0x03, 'X L Alpha',          'osmanya'],
198         0x104B => [0x05, 'X L Alpha',          'osage'],
199         0x1050 => [0x03, 'X L Alpha',          'elbasan'],
200         0x1053 => [0x04, 'X L Alpha',          'c albanian'],
201         0x1057 => [0x05, 'X Xr L Alpha',       'vithkuqi'],
202         0x105C => [0x04, 'X Xr L Alpha',       'todhri'],
203         0x1060 => [0x18, 'X L Syllabic',       'linear A'],
204         0x1078 => [0x08, 'X Xr L Syllabic',    'cypro-minoan'],
205         0x1080 => [0x04, 'X L Syllabic',       'cypriot'],
206         0x1084 => [0x02, 'X L Aramaic',        'aram'],
207         0x1086 => [0x02, 'X L Aramaic',        'palmr'],
208         0x1088 => [0x03, 'X L Aramaic',        'nabataean'],
209         0x108A => [0x01],
210         0x108C => [0x02, 'X Xr L Alpha',       'numid'],
211         0x108E => [0x02, 'X L Aramaic',        'hatr'],
212         0x1090 => [0x02, 'X L Aramaic',        'phoen'],
213         0x1092 => [0x02, 'X L Greek',          'lydian'],
214         0x1094 => [0x04],
215         0x1098 => [0x02, 'X L Alpha',          'mero h', 'meroitic hieroglyphs'],
216         0x109A => [0x06, 'X L Alpha',          'meroitic cursive'],
217         0x10A0 => [0x06, 'X L Syllabic',       'kharoshthi'],
218         0x10A6 => [0x02, 'X L Aramaic',        's arab'],
219         0x10A8 => [0x02, 'X L Aramaic',        'n arab'],
220         0x10AA => [0x02, 'X Xr L Brahmic',     'balti'],
221         0x10AC => [0x04, 'X L Aramaic',        'manichaean'],
222         0x10B0 => [0x04, 'X L Aramaic',        'avestan'],
223         0x10B4 => [0x02, 'X L Aramaic',        'parth'],
224         0x10B6 => [0x02, 'X L Aramaic',        'pahlav', 'inscriptional pahlavi'],
225         0x10B8 => [0x03, 'X L Aramaic',        'psalt pahl', 'psalter pahlavi'],
226         0x10BB => [0x03, 'X Xr L Aramaic',     'book pahl', 'book pahlavi'],
227         0x10BE => [0x02, 'X Xr L Alpha',       'babur'],
228         0x10C0 => [0x05, 'X L Aramaic',        'old turkic'],
229         0x10C5 => [0x03],
230         0x10C8 => [0x08, 'X L Aramaic',        'old hungarian'],
231         0x10D0 => [0x04, 'X Xr L Alpha',       'rohingya'],
232         0x10D4 => [0x04, 'X Xr L Alpha',       'garay'],
233         0x10D8 => [0x08, 'X Xr L Syllabic',    'byblos'],
234         0x10E0 => [0x06],
235         0x10E6 => [0x02, 'X No',               'rumi'],
236         0x10E8 => [0x06],
237         0x10EE => [0x02, 'X Xr L Aramaic',     'elym'],
238         0x10F0 => [0x03, 'X Xr L Aramaic',     'old sog'],
239         0x10F3 => [0x04, 'X Xr L Aramaic',     'sogdian'],
240         0x10F7 => [0x01],
241         0x10F8 => [0x08, 'X Xr L Aramaic',     'uyghur'],
242         0x1100 => [0x08, 'X L Brahmic',        'brahmi'],
243         0x1108 => [0x05, 'X L Brahmic',        'kaithi'],
244         0x110D => [0x03, 'X L Brahmic',        'sora som'],
245         0x1110 => [0x05, 'X L Brahmic',        'chakma'],
246         0x1115 => [0x03, 'X L Brahmic',        'mahajani'],
247         0x1118 => [0x06, 'X L Brahmic',        'sharada'],
248         0x111E => [0x02, 'X No Brahmic',       'sinhal'],
249         0x1120 => [0x05, 'X L Brahmic',        'khojki'],
250         0x1125 => [0x03, 'X Xr L Brahmic',     'landa'],
251         0x1128 => [0x03, 'X L Brahmic',        'multani'],
252         0x112B => [0x05, 'X L Brahmic',        'khudabadi'],
253         0x1130 => [0x08, 'X L Brahmic',        'grantha'],
254         0x1138 => [0x06, 'X Xr L Brahmic',     'tulu'],
255         0x113E => [0x02, 'X Xr L Brahmic',     'shar+', 'sharada extension'],
256         0x1140 => [0x08, 'X L Brahmic',        'newar'],
257         0x1148 => [0x06, 'X L Brahmic',        'tirhuta'],
258         0x114E => [0x02, 'X Xr L Alpha',       'tani'],
259         0x1150 => [0x08, 'X Xr L Brahmic',     'ranjana'],
260         0x1158 => [0x08, 'X L Brahmic',        'siddham'],
261         0x1160 => [0x06, 'X L Brahmic',        'modi'],
262         0x1166 => [0x02, 'X L Aramaic',        'mong', 'mongolian extension'],
263         0x1168 => [0x05, 'X L Brahmic',        'takri'],
264         0x116D => [0x03, 'X Xr L Brahmic',     'jenticha'],
265         0x1170 => [0x04, 'X Xr L Brahmic',     'ahom'],
266         0x1174 => [0x06, 'X Xr L Alpha',       'zou'],
267         0x117A => [0x06, 'X Xr L Brahmic',     'pyu'],
268         0x1180 => [0x05, 'X Xr L Brahmic',     'dogra'],
269         0x1185 => [0x04, 'X Xr L Brahmic',     'sirmauri'],
270         0x1189 => [0x01],
271         0x118A => [0x06, 'X L Syllabic',       'warang citi'],
272         0x1190 => [0x04, 'X Xr L Brahmic',     'tolong siki'],
273         0x1194 => [0x04, 'X Xr L Brahmic',     'tikamuli'],
274         0x1198 => [0x04, 'X Xr L Brahmic',     'khambu rai'],
275         0x119C => [0x04, 'X Xr L Brahmic',     'kirat rai'],
276         0x11A0 => [0x05, 'X Xr L Brahmic',     'zanabazar square'],
277         0x11A5 => [0x06, 'X Xr L Brahmic',     'soyombo'],
278         0x11AB => [0x01],
279         0x11AC => [0x04, 'X L Alpha',          'pau cin hau'],
280         0x11B0 => [0x05, 'X Xr L Brahmic',     'dhives akuru'],
281         0x11B5 => [0x04, 'X Xr L Brahmic',     'leke'],
282         0x11B9 => [0x06, 'X Xr L Brahmic',     'nandinagari'],
283         0x11BF => [0x01],
284         0x11C0 => [0x07, 'X L Brahmic',        'bhaiksuki'],
285         0x11C7 => [0x05, 'X L Brahmic',        'marchen'],
286         0x11CC => [0x04, 'X Xr L Brahmic',     'balti B'],
287         0x11D0 => [0x06, 'X Xr L Brahmic',     'masaram gondi'],
288         0x11D6 => [0x05, 'X Xr L Brahmic',     'gunjala gondi'],
289         0x11DB => [0x05, 'X Xr L Brahmic',     'kawi'],
290         0x11E0 => [0x07, 'X Xr L Brahmic',     'tocharian'],
291         0x11E7 => [0x06, 'X Xr L Brahmic',     'khotanese'],
292         0x11ED => [0x01],
293         0x11EE => [0x02, 'X Xr L Brahmic',     'makas', 'makasar'],
294         0x11F0 => [0x04, 'X Xr L Brahmic',     'vatteluttu'],
295         0x11F4 => [0x02],
296         0x11F6 => [0x06, 'X Xr L Brahmic',     'chola'],
297         0x11FC => [0x04, 'X Xr L Brahmic',     'tamil+'],
298         0x1200 => [0x40, 'X L Syllabic',       'cuneiform'],
299         0x1240 => [0x08, 'X No',               'cuneiform numbers'],
300         0x1248 => [0x08, 'X L Syllabic',       'early dynastic cuneiform'], #TODO: join bottom but title at top
301         0x1250 => [0x05, 'X L Syllabic',       'e. dyn. cuneiform'],
302         0x1255 => [0x0B],
303         0x1260 => [0x80, 'X Xr L Syllabic',    'proto-cuneiform'],
304         0x12E0 => [0x19, 'X Xr L Syllabic',    'indus'],
305         0x12F9 => [0x07],
306         0x1300 => [0x43, 'X L Syllabic',       'egyptian hieroglyphs'],
307         0x1343 => [0x01, 'X Xr L Syllabic',    'eg.c', 'Egyptian control characters'],
308         0x1344 => [0xFC, 'X Xr L Syllabic',    'egyptian hieroglyphs extended-A'],
309         0x1440 => [0x28, 'X L Syllabic',       'anatolian hieroglyphs'],
310         0x1468 => [0x98, 'X Xr L Syllabic',    'egyptian hieroglyphs extended-B'],
311         0x1500 => [0x04, 'X Xr L Brahmic',     'lampung'],
312         0x1504 => [0x03, 'X Xr L Brahmic',     'kerinci'],
313         0x1507 => [0x01],
314         0x1508 => [0x48, 'X Xr L Syllabic',    'mandombe'],
315         0x1550 => [0x50, 'X Xr L Syllabic',    'maya hieroglyphs'],
316         0x15A0 => [0x20],
317         0x15C0 => [0x40, 'X Xr L Syllabic',    'aztec pictograms'],
318         0x1600 => [0x08, 'X Xr L Alpha',       'cirth'],
319         0x1608 => [0x08, 'X Xr L Alpha',       'tengwar'],
320         0x1610 => [0x04, 'X Xr L Brahmic',     'khema'],
321         0x1614 => [0x04, 'X Xr L Brahmic',     'khe prih'],
322         0x1618 => [0x02],
323         0x161A => [0x06, 'X Xr L Alpha',       'moon'],
324         0x1620 => [0x50, 'X Xr L Syllabic',    'blissymbols'],
325         0x1670 => [0x0B, 'X Xr L Syllabic',    'bagam'],
326         0x167B => [0x05, 'X Xr L Syllabic',    'iban'],
327         0x1680 => [0x24, 'X L Syllabic',       'bamum supplement'],
328         0x16A4 => [0x03, 'X L Alpha',          'mro'],
329         0x16A7 => [0x06, 'X Xr L Alpha',       'mossang tangsa'],
330         0x16AD => [0x03, 'X L Alpha',          'bassa vah'],
331         0x16B0 => [0x09, 'X L Syllabic',       'pahawh hmong'],
332         0x16B9 => [0x07, 'X Xr L Syllabic',    'woleai'],
333         0x16C0 => [0x08, 'X Xr L Syllabic',    'kpelle'],
334         0x16C8 => [0x05, 'X Xr L Syllabic',    'afaka'],
335         0x16CD => [0x03, 'X Xr L Syllabic',    'lk tangsa', 'Latsam Khimhun Tangsa'],
336         0x16D0 => [0x0D],
337         0x16DD => [0x03, 'X Xr L Brahmic',     'kulitan'],
338         0x16E0 => [0x04, 'X Xr L Alpha',       'mwangwego'],
339         0x16E4 => [0x06, 'X Xr L Alpha',       'medefaidrin'],
340         0x16EA => [0x06, 'X Xr L Brahmic',     'lontara+', 'buginese'],
341         0x16F0 => [0x0A, 'X L Syllabic',       'miao'],
342         0x16FA => [0x04, 'X Xr L Brahmic',     'lontara b-b'],
343         0x16FE => [0x02, 'X So',               'ideo', 'Ideographic Symbols and Punctuation'],
344         0x1700 => [0x180,'X L Syllabic',       'tangut ideographs'],
345         0x1880 => [0x30, 'X L Syllabic',       'tangut components'],
346         0x18B0 => [0x20, 'X Xr L Han',         'khitan small'],
347         0x18D0 => [0x90, 'X Xr L Han',         'khitan ideographs'],
348         0x1960 => [0x56, 'X Xr L Han',         'jurchen'],
349         0x19B6 => [0x04, 'X Xr L Han',         'jurchen rad'],
350         0x19BA => [0x06],
351         0x19C0 => [0x20],
352         0x19E0 => [0x50, 'X Xr L Syllabic',    'pau cin hau syllabary'],
353         0x1A30 => [0x50, 'X Xr L Syllabic',    'eskaya'],
354         0x1A80 => [0x2B, 'X Xr L Syllabic',    'naxi geba'],
355         0x1AAB => [0x01],
356         0x1AAC => [0x54, 'X Xr L Syllabic',    'naxi dongba'],
357         0x1B00 => [0x10, 'X L Hiragana',       'kana supplement'],
358         0x1B10 => [0x03, 'X Xr L Hiragana',    'kana+A'],
359         0x1B13 => [0x04, 'X Xr L Syllabic',    'kaidā'],
360         0x1B17 => [0x19, 'X Xr L Han',         'nushu'],
361         0x1B30 => [0x20, 'X Xr L Han',         'shuishu'],
362         0x1B50 => [0x70, 'X Xr L Syllabic',    'proto-elamite'],
363         0x1BC0 => [0x0A, 'X L Alpha',          'duployan'],
364         0x1BCA => [0x01, 'X L Cc',             'sh', 'Shorthand Formatting'],
365         0x1BCB => [0x05, 'X Xr L Alpha',       'pitman'],
366         0x1BD0 => [0x30, 'X Xr L Alpha',       'shorthands?'],
367         0x1C00 => [0xB0, 'X Xr L Alpha',       'micmac hieroglyphs'],
368         0x1CB0 => [0x30, 'X Xr L Syllabic',    'rongorongo'],
369         0x1CE0 => [0x20],
370         0x1D00 => [0x10, 'X So',               'byzantine musical'],
371         0x1D10 => [0x10, 'X So',               'musical symbols'],
372         0x1D20 => [0x05, 'X So',               'anc greek music'],
373         0x1D25 => [0x09],
374         0x1D2E => [0x02, 'X Xr No',            'mayan', 'Mayan Numerals'],
375         0x1D30 => [0x06, 'X So',               'tai xuan jing', 'tetragrams'],
376         0x1D36 => [0x02, 'X No',               'rod'],
377         0x1D38 => [0x08, 'X Xr L Sm',          'mathematical alphanumeric+'],
378         0x1D40 => [0x40, 'X L Sm',             'mathematical alphanumeric'],
379         0x1D80 => [0x2B, 'X L Alpha',          'sutton'],
380         0x1DAB => [0x55],
381         0x1E00 => [0x03, 'X L Cyrillic',       'glagol+'],
382         0x1E03 => [0x05, 'X Xr L Brahmic',     'pallava'],
383         0x1E08 => [0x06, 'X Xr L Brahmic',     'chalukya'],
384         0x1E0E => [0x02],
385         0x1E10 => [0x0B, 'X Xr L Alpha',       'eebee hmong'],
386         0x1E1B => [0x05, 'X Xr L Alpha',       'cher vang hm.'],
387         0x1E20 => [0x06, 'X Xr L Brahmic',     'western cham'],
388         0x1E26 => [0x03, 'X Xr L Alpha',       'beria', 'zaghawa'],
389         0x1E29 => [0x07],
390         0x1E30 => [0x20, 'X Xr L Syllabic',    'loma'],
391         0x1E50 => [0x30],
392         0x1E80 => [0x0E, 'X L Syllabic',       'mende kikakui'],
393         0x1E8E => [0x02],
394         0x1E90 => [0x06, 'X L Alpha',          'adlam'],
395         0x1E96 => [0x2A],
396         0x1EC0 => [0x07, 'X Xr No',            'persian siyaq'],
397         0x1EC7 => [0x05, 'X Xr No',            'indic siyaq'],
398         0x1ECC => [0x04, 'X Xr No',            'diwani siyaq'],
399         0x1ED0 => [0x05, 'X Xr No',            'ottoman siyaq'],
400         0x1ED5 => [0x0B],
401         0x1EE0 => [0x10, 'X L Arabic',         'arabic mathematical alphabetic'], # Sm
402         0x1EF0 => [0x10],
403         0x1F00 => [0x03, 'X So',               'mahjong'],
404         0x1F03 => [0x07, 'X So',               'domino tiles'],
405         0x1F0A => [0x06, 'X So',               'playing cards'],
406         0x1F10 => [0x10, 'X L Latin',          'enclosed alphanumeric supplement'], # So
407         0x1F20 => [0x10, 'X L Han',            'enclosed ideographic supplement'], # So
408         0x1F30 => [0x30, 'X So',               'miscellaneous symbols and pictographs'],
409         0x1F60 => [0x05, 'X So',               'emoticons'],
410         0x1F65 => [0x03, 'X So',               'ornament'],
411         0x1F68 => [0x08, 'X So',               'transport'],
412         0x1F70 => [0x08, 'X So',               'alchemical'],
413         0x1F78 => [0x08, 'X So',               'geometric shapes ext'],
414         0x1F80 => [0x10, 'X So',               'supplemental arrows-C'],
415         0x1F90 => [0x10, 'X So',               'supplemental symbols and pictographs'],
416         0x1FA0 => [0x60],
417 };