charset: update smp allocation to unicode v10.0.1 roadmap
authorMischa POSLAWSKY <perl@shiar.org>
Sat, 3 Mar 2018 16:50:20 +0000 (17:50 +0100)
committerMischa POSLAWSKY <perl@shiar.org>
Mon, 5 Mar 2018 22:51:17 +0000 (23:51 +0100)
From recent http://www.unicode.org/roadmaps/smp/ updated 2018-01-10.

charset-unicode.inc.pl
charset.plp

index 1d668a9..6c21dcf 100644 (file)
@@ -26,7 +26,7 @@ use utf8;
        0x007C0 => [0x040, 'X L African',        q(n'ko)],
        0x00800 => [0x040, 'X L Hebrew',         'samaritan'],
        0x00840 => [0x020, 'X L Aramaic',        'manda', 'mandaic'],
-       0x00860 => [0x010, 'X Xr L Aramaic',     'syr', 'syriac malayalam'],
+       0x00860 => [0x010, 'X L Aramaic',        'syr', 'syriac malayalam'],
        0x00870 => [0x030],
        0x008A0 => [0x060, 'X L Arabic',         'arabic ext-A'],
        0x00900 => [0x080, 'X L Brahmic',        'devanāgarī'],
@@ -212,7 +212,7 @@ use utf8;
        0x10900 => [0x020, 'X L Aramaic',        'phoen', 'phoenician'],
        0x10920 => [0x020, 'X L Greek',          'lydian'],
        0x10940 => [0x040],
-       0x10980 => [0x020, 'X L Alpha',          'mero h', 'meroitic hieroglyphs'],
+       0x10980 => [0x020, 'X L Alpha',          'mer h', 'meroitic hieroglyphs'],
        0x109A0 => [0x060, 'X L Alpha',          'meroitic cursive'],
        0x10A00 => [0x060, 'X L Syllabic',       'kharoshthi'],
        0x10A60 => [0x020, 'X L Aramaic',        's arab'],
@@ -233,9 +233,10 @@ use utf8;
        0x10D80 => [0x080, 'X Xr L Syllabic',    'byblos'],
        0x10E00 => [0x060],
        0x10E60 => [0x020, 'X No',               'rumi', 'rumi numeral symbols'],
-       0x10E80 => [0x060],
-       0x10EE0 => [0x020, 'X Xr L Aramaic',     'elym'],
-       0x10F00 => [0x030, 'X Xr L Aramaic',     'old sog'],
+       0x10E80 => [0x040],
+       0x10EC0 => [0x020, 'X Xr L Aramaic',     'elym', 'elymaic'],
+       0x10EE0 => [0x020, 'X Xr L Aramaic',     'khwar', 'khwarezmian'],
+       0x10F00 => [0x030, 'X Xr L Aramaic',     'old sogd', 'old sogdian'],
        0x10F30 => [0x040, 'X Xr L Aramaic',     'sogdian'],
        0x10F70 => [0x010],
        0x10F80 => [0x080, 'X Xr L Aramaic',     'uyghur'],
@@ -251,8 +252,7 @@ use utf8;
        0x11280 => [0x030, 'X L Brahmic',        'multani'],
        0x112B0 => [0x050, 'X L Brahmic',        'khudabadi'],
        0x11300 => [0x080, 'X L Brahmic',        'grantha'],
-       0x11380 => [0x060, 'X Xr L Brahmic',     'tulu'],
-       0x113E0 => [0x020, 'X Xr L Brahmic',     'shar+', 'sharada extension'],
+       0x11380 => [0x080, 'X Xr L Brahmic',     'tigalari'], # tulu
        0x11400 => [0x080, 'X L Brahmic',        'newar'],
        0x11480 => [0x060, 'X L Brahmic',        'tirhuta'],
        0x114E0 => [0x020, 'X Xr L Alpha',       'tani'],
@@ -262,44 +262,46 @@ use utf8;
        0x11660 => [0x020, 'X L Aramaic',        'mong', 'mongolian extension'],
        0x11680 => [0x050, 'X L Brahmic',        'takri'],
        0x116D0 => [0x030, 'X Xr L Brahmic',     'jenticha'],
-       0x11700 => [0x040, 'X Xr L Brahmic',     'ahom'],
+       0x11700 => [0x040, 'X L Brahmic',        'ahom'],
        0x11740 => [0x060, 'X Xr L Alpha',       'zou'],
        0x117A0 => [0x060, 'X Xr L Brahmic',     'pyu'],
        0x11800 => [0x050, 'X Xr L Brahmic',     'dogra'],
        0x11850 => [0x040, 'X Xr L Brahmic',     'sirmauri'],
        0x11890 => [0x010],
        0x118A0 => [0x060, 'X L Syllabic',       'warang citi'],
-       0x11900 => [0x040, 'X Xr L Brahmic',     'tolong siki'],
-       0x11940 => [0x040, 'X Xr L Brahmic',     'tikamuli'],
-       0x11980 => [0x040, 'X Xr L Brahmic',     'khambu rai'],
-       0x119C0 => [0x040, 'X Xr L Brahmic',     'kirat rai'],
-       0x11A00 => [0x050, 'X Xr L Brahmic',     'zanabazar square'],
-       0x11A50 => [0x060, 'X Xr L Brahmic',     'soyombo'],
+       0x11900 => [0x060, 'X Xr L Brahmic',     'dives akuru'],
+       0x11960 => [0x040, 'X Xr L Brahmic',     'vatteluttu'],
+       0x119A0 => [0x060, 'X Xr L Brahmic',     'nandinagari'],
+       0x11A00 => [0x050, 'X L Brahmic',        'zanabazar square'],
+       0x11A50 => [0x060, 'X L Brahmic',        'soyombo'],
        0x11AB0 => [0x010],
        0x11AC0 => [0x040, 'X L Alpha',          'pau cin hau'],
-       0x11B00 => [0x050, 'X Xr L Brahmic',     'dhives akuru'],
-       0x11B50 => [0x040, 'X Xr L Brahmic',     'leke'],
-       0x11B90 => [0x060, 'X Xr L Brahmic',     'nandinagari'],
-       0x11BF0 => [0x010],
+       0x11B00 => [0x050, 'X Xr L Brahmic',     'devanāgarī ext-A'],
+       0x11B50 => [0x020, 'X Xr L Brahmic',     'shar+', 'sharada extension'],
+       0x11B70 => [0x010],
+       0x11B80 => [0x040, 'X Xr L Brahmic',     'tolong siki'],
+       0x11BC0 => [0x040, 'X Xr L Brahmic',     'khambu rai'],
        0x11C00 => [0x070, 'X L Brahmic',        'bhaiksuki'],
        0x11C70 => [0x050, 'X L Brahmic',        'marchen'],
        0x11CC0 => [0x040, 'X Xr L Brahmic',     'balti B'],
-       0x11D00 => [0x060, 'X Xr L Brahmic',     'masaram gondi'],
+       0x11D00 => [0x060, 'X L Brahmic',        'masaram gondi'],
        0x11D60 => [0x050, 'X Xr L Brahmic',     'gunjala gondi'],
        0x11DB0 => [0x050, 'X Xr L Brahmic',     'kawi'],
        0x11E00 => [0x070, 'X Xr L Brahmic',     'tocharian'],
        0x11E70 => [0x060, 'X Xr L Brahmic',     'khotanese'],
        0x11ED0 => [0x010],
        0x11EE0 => [0x020, 'X Xr L Brahmic',     'makas', 'makasar'],
-       0x11F00 => [0x040, 'X Xr L Brahmic',     'vatteluttu'],
+       0x11F00 => [0x040, 'X Xr L Brahmic',     'leke'],
        0x11F40 => [0x020],
        0x11F60 => [0x060, 'X Xr L Brahmic',     'chola'],
        0x11FC0 => [0x040, 'X Xr L Brahmic',     'tamil+'],
        0x12000 => [0x400, 'X L Syllabic',       'cuneiform'],
        0x12400 => [0x080, 'X No',               'cuneiform numbers'],
        0x12480 => [0x0D0, 'X L Syllabic',       'early dynastic cuneiform'],
-       0x12550 => [0x0B0],
-       0x12600 => [0x800, 'X Xr L Syllabic',    'proto-cuneiform'],
+       0x12550 => [0x030],
+       0x12580 => [0x100, 'X Xr L Syllabic',    'proto-cuneiform'],
+       0x12680 => [0x050, 'X Xr No',            'proto-cun numb'],
+       0x126D0 => [0x730],
        0x12E00 => [0x190, 'X Xr L Syllabic',    'indus'],
        0x12F90 => [0x070],
        0x13000 => [0x430, 'X L Syllabic',       'egyptian hieroglyphs'],
@@ -332,7 +334,9 @@ use utf8;
        0x16C00 => [0x080, 'X Xr L Syllabic',    'kpelle'],
        0x16C80 => [0x050, 'X Xr L Syllabic',    'afaka'],
        0x16CD0 => [0x030, 'X Xr L Syllabic',    'lk tangsa', 'Latsam Khimhun Tangsa'],
-       0x16D00 => [0x0D0],
+       0x16D00 => [0x040, 'X Xr L Syllabic',    'tikamuli'],
+       0x16D40 => [0x040, 'X Xr L Brahmic',     'kirat rai'],
+       0x16D80 => [0x050],
        0x16DD0 => [0x030, 'X Xr L Brahmic',     'kulitan'],
        0x16E00 => [0x040, 'X Xr L Alpha',       'mwangwego'],
        0x16E40 => [0x060, 'X Xr L Alpha',       'medefaidrin'],
@@ -349,16 +353,17 @@ use utf8;
        0x19BA0 => [0x060],
        0x19C00 => [0x200],
        0x19E00 => [0x500, 'X Xr L Syllabic',    'pau cin hau syllabary'],
-       0x1A300 => [0x500, 'X Xr L Syllabic',    'eskaya'],
-       0x1A800 => [0x2B0, 'X Xr L Syllabic',    'naxi geba'],
-       0x1AAB0 => [0x010],
-       0x1AAC0 => [0x540, 'X Xr L Syllabic',    'naxi dongba'],
+       0x1A300 => [0x460, 'X Xr L Syllabic',    'eskaya'],
+       0x1A760 => [0x020],
+       0x1A780 => [0x080, 'X Xr L Syllabic',    'kaidā'],
+       0x1A800 => [0x500, 'X Xr L Syllabic',    'naxi dongba'],
+       0x1AD00 => [0x300, 'X Xr L Syllabic',    'naxi geba'],
        0x1B000 => [0x100, 'X L Hiragana',       'kana supplement'],
-       0x1B100 => [0x030, 'X Xr L Hiragana',    'kana+A'],
-       0x1B130 => [0x040, 'X Xr L Syllabic',    'kaidā'],
-       0x1B170 => [0x190, 'X Xr L Han',         'nüshu'],
-       0x1B300 => [0x200, 'X Xr L Han',         'shuishu'],
-       0x1B500 => [0x700, 'X Xr L Syllabic',    'proto-elamite'],
+       0x1B100 => [0x030, 'X L Hiragana',       'kana+A', 'hentaigana'],
+       0x1B130 => [0x040, 'X Xr L Hiragana',    'small kana+'],
+       0x1B170 => [0x190, 'X L Han',            'nüshu'],
+       0x1B300 => [0x230, 'X Xr L Han',         'shuishu'],
+       0x1B530 => [0x700, 'X Xr L Syllabic',    'proto-elamite'],
        0x1BC00 => [0x0A0, 'X L Alpha',          'duployan'],
        0x1BCA0 => [0x010, 'X L Cc',             'sh', 'Shorthand Formatting'],
        0x1BCB0 => [0x050, 'X Xr L Alpha',       'pitman'],
@@ -369,7 +374,10 @@ use utf8;
        0x1D000 => [0x100, 'X So',               'byzantine musical'],
        0x1D100 => [0x100, 'X So',               'musical symbols'],
        0x1D200 => [0x050, 'X So',               'anc greek music'],
-       0x1D250 => [0x090],
+       0x1D250 => [0x030],
+       0x1D280 => [0x030, 'X Xr So',            'lute'], # pípa
+       0x1D2B0 => [0x020, 'X Xr So',            'flute'], # súzìpǔ
+       0x1D2D0 => [0x010],
        0x1D2E0 => [0x020, 'X Xr No',            'mayan', 'Mayan Numerals'],
        0x1D300 => [0x060, 'X So',               'tai xuan jing', 'tetragrams'],
        0x1D360 => [0x020, 'X No',               'rod'],
@@ -381,13 +389,19 @@ use utf8;
        0x1E030 => [0x050, 'X Xr L Brahmic',     'pallava'],
        0x1E080 => [0x060, 'X Xr L Brahmic',     'chalukya'],
        0x1E0E0 => [0x020],
-       0x1E100 => [0x0B0, 'X Xr L Alpha',       'eebee hmong'],
-       0x1E1B0 => [0x050, 'X Xr L Alpha',       'cher vang hm.'],
+       0x1E100 => [0x050, 'X Xr L Alpha',       'chervang hmong', 'nyiakeng puachue hmong'],
+       0x1E150 => [0x0B0, 'X Xr L Alpha',       'eebee hmong'],
        0x1E200 => [0x060, 'X Xr L Brahmic',     'western cham'],
        0x1E260 => [0x030, 'X Xr L Alpha',       'beria', 'zaghawa'],
-       0x1E290 => [0x070],
-       0x1E300 => [0x200, 'X Xr L Syllabic',    'loma'],
-       0x1E500 => [0x300],
+       0x1E290 => [0x030],
+       0x1E2C0 => [0x040, 'X Xr L Alpha',       'wancho'],
+       0x1E300 => [0x120, 'X Xr L Syllabic',    'loma'],
+       0x1E420 => [0x0E0],
+       0x1E500 => [0x030, 'X Xr L Brahmic',     'pungchen'],
+       0x1E530 => [0x030, 'X Xr L Brahmic',     'pungchuŋ', 'pungchung'],
+       0x1E560 => [0x040, 'X Xr L Brahmic',     'marchung'],
+       0x1E5A0 => [0x030, 'X Xr L Brahmic',     'brusha'],
+       0x1E5D0 => [0x230],
        0x1E800 => [0x0E0, 'X L Syllabic',       'mende kikakui'],
        0x1E8E0 => [0x020],
        0x1E900 => [0x060, 'X L Alpha',          'adlam'],
@@ -412,5 +426,10 @@ use utf8;
        0x1F780 => [0x080, 'X So',               'geometric shapes ext'],
        0x1F800 => [0x100, 'X So',               'supplemental arrows-C'],
        0x1F900 => [0x100, 'X So',               'supplemental symbols and pictographs'],
-       0x1FA00 => [0x600],
+       0x1FA00 => [0x070, 'X Xr So',            'chess'],
+       0x1FA70 => [0x010],
+       0x1FA80 => [0x060, 'X Xr So',            'flag identification'],
+       0x1FAE0 => [0x020],
+       0x1FB00 => [0x100, 'X Xr So',            'legacy computing graphics'],
+       0x1FC00 => [0x400],
 };
index 0dd1537..4272b6a 100644 (file)
@@ -390,7 +390,7 @@ for my $row (@request) {
        </table>
 
        <table class="glyphs"><tr>
-       <td class="X">unicode 7.0
+       <td class="X">unicode 10.0
        <td class="X Xr">proposed
        <td class="X Xd">deprecated
        <td class="">unassigned