common: enable perl v5.14 features everywhere
[sheet.git] / charset-ucplanes.inc.pl
index ce57a941ab0a5410e9a001e125714850d0764743..fce05ffdffd8c4eeac540f5151dd80c024664990 100644 (file)
@@ -1,77 +1,86 @@
 use utf8;
-my %uniblock = (
-       0x000, '<td colspan="1" class="X Po">ascii',
-       0x001, '<td colspan="4" class="X L Latin">latin',
-#      0x005, '<td colspan="5" class="X Sk">spacing modifier',
-       0x005, '<td colspan="2" class="X Mn">comb',
-       0x007, '<td colspan="1" class="X L Greek">grk',
-       0x008, '<td colspan="2" class="X L Cyrillic">cyr',
-       0x00A, '<td colspan="1" class="X L Armenian">arm',
-       0x00B, '<td colspan="6" class="X L Aramaic">aramaic',
-       0x011, '<td colspan="1" class="Xr">',
-       0x012, '<td colspan="15" class="X L Brahmic">brahmic',
-       0x020, '<td colspan="1" class="X L Brahmic">mm',
-       0x021, '<td colspan="1" class="X L Aramaic">geor',
-       0x022, '<td colspan="2" class="X L Hangul">jamo',
-       0x024, '<td colspan="3" class="X L African">ethiopic',
-       0x027, '<td colspan="6" class="X L Syllabic">aboriginal',
-       0x02D, '<td colspan="1" class="X L Alpha">ger',
-       0x02E, '<td colspan="2" class="X L Brahmic">brahm',
-       0x030, '<td colspan="1" class="X L Aramaic">mon',
-       0x031, '<td colspan="1" class="X Xr L Syllabic">can',
-       0x032, '<td colspan="8" class="X L Brahmic">brahmic',
-       0x03A, '<td colspan="4" class="X L Latin">extensions',
-       0x03E, '<td colspan="2" class="X L Greek">greek',
-       0x040, '<td colspan="1" class="X Po">·…',
-       0x041, '<td colspan="3" class="X So">misc',
-       0x044, '<td colspan="2" class="X Sm">maths',
-       0x046, '<td colspan="3" class="X So">technical',
-       0x049, '<td colspan="1" class="X Latin">()',
-       0x04A, '<td colspan="2" class="X So">draw',
-       0x04C, '<td colspan="4" class="X So">symbols',
-       0x050, '<td colspan="2" class="X L Alpha">braille',
-       0x052, '<td colspan="1" class="X So">→',
-       0x053, '<td colspan="3" class="X Sm">math',
-       0x056, '<td colspan="2" class="X So">misc',
-       0x058, '<td colspan="2" class="X L Greek">ancient',
-       0x05A, '<td colspan="2" class="X L Alpha">ext',
-       0x05C, '<td colspan="1" class="X Po">·+',
-       0x05D, '<td colspan="3" class="X L Han">radicals',
-       0x060, '<td colspan="2" class="X L Katakana">japanese',
-       0x062, '<td colspan="4" class="X L Han">cjk+',
-       0x066, '<td colspan="2" class="X Xd L Han">compat',
-       0x068, '<td colspan="8" class="X L Han" style="border-bottom:none">',
-       0x070, '<td colspan="16" rowspan="2" class="X L Han" style="border-top:none">cjk ideographs A', #+2
-       0x09C, '<td colspan="16" rowspan="10" class="X L Han">cjk unified ideographs',
-       0x140, '<td colspan="9" class="X L Syllabic">yi',
-       0x149, '<td colspan="1" class="X Xr L Latin">lisu',
-       0x14A, '<td colspan="2" class="X L Syllabic">vai',
-       0x14C, '<td colspan="1" class="X L Cyrillic">cyr',
-       0x14D, '<td colspan="1" class="X Xr L Syllabic">bam',
-       0x14E, '<td colspan="2" class="X L Latin">lat-D',
-       0x150, '<td colspan="8" class="X L Brahmic">brahmic',
-       0x158, '<td colspan="8" class="X L Hangul">hangeul syllables',
-       0x160, '<td colspan="16" rowspan="5" class="X L Hangul" style="border-top:none">hangeul syllables',
-       0x1B0, '<td colspan="16" class="X Cs">surrogates',
-       0x1C0, '<td colspan="16" rowspan="3" class="X Co">private use',
-       0x1F0, '<td colspan="4" class="X L Han">cjk compat',
-       0xFB0, '<td colspan="5" class="X Xd L">presentation',
-       0xFB5, '<td colspan="11" class="X Xd L Arabic" style="border-bottom:none">',
-       0xFC0, '<td colspan="16" class="X Xd L Arabic" style="border-top:none; border-bottom:none">arabic presentation forms A',
-       0xFD0, '<td colspan="13" class="X Xd L Arabic" style="border-top:none">',
-       0xFDD, '<td colspan="2" class="Xi">?',
-       0xFDF, '<td colspan="1" class="X Xd L Arabic" style="border-top:none">',
-       0xFE0, '<td colspan="1" class="X Cc">var',
-       0xFE1, '<td colspan="1" class="X L Pd">ver',
-       0xFE2, '<td colspan="1" class="X L Mn">½',
-       0xFE3, '<td colspan="2" class="X Xd Pd Han">comp',
-       0xFE5, '<td colspan="2" class="X Xd L Latin">small',
-       0xFE7, '<td colspan="9" class="X Xd L Arabic">arabic presentation B',
-       0xFF0, '<td colspan="15" class="X L Latin">halfwidth &amp; fullwidth forms',
-       0xFFF, '<td colspan="1" class="X Cc">sp',
-);
-
-sub {
-       return defined $uniblock{$_[0]} ? $uniblock{$_[0]} : ();
-}
-
++{
+       0x0000 => [0x008, 'X Po',               'ascii'],
+       0x0008 => [0x020, 'X L Latin',          'latin'],
+       0x0028 => [0x010, 'X Mn',               'comb'], # also spacing Sk
+       0x0038 => [0x008, 'X L Greek',          'grk'],
+       0x0040 => [0x010, 'X L Cyrillic',       'cyr'],
+       0x0050 => [0x008, 'X L Armenian',       'arm'],
+       0x0058 => [0x008, 'X L Aramaic',        'heb'],
+       0x0060 => [0x010, 'X L Arabic',         'arabic'],
+       0x0070 => [0x010, 'X L Aramaic',        'aram'],
+       0x0080 => [0x010, 'X L Aramaic',        'aramaic'],
+       0x0090 => [0x070, 'X L Brahmic',        'brahmic'],
+       0x0100 => [0x008, 'X L Brahmic',        'mm'],
+       0x0108 => [0x008, 'X L Aramaic',        'geor'],
+       0x0110 => [0x010, 'X L Hangul',         'jamo'],
+       0x0120 => [0x018, 'X L African',        'ethiopic'],
+       0x0138 => [0x030, 'X L Syllabic',       'aboriginal'],
+       0x0168 => [0x008, 'X L Alpha',          'ger'],
+       0x0170 => [0x010, 'X L Brahmic',        'brahm'],
+       0x0180 => [0x008, 'X L Aramaic',        'mon'],
+       0x0188 => [0x008, 'X L Syllabic',       'can'],
+       0x0190 => [0x040, 'X L Brahmic',        'brahmic'],
+       0x01D0 => [0x020, 'X L Latin',          'extensions'],
+       0x01F0 => [0x010, 'X L Greek',          'greek'],
+       0x0200 => [0x008, 'X Po',               '·…'],
+       0x0208 => [0x018, 'X So',               'symbols'],
+       0x0220 => [0x010, 'X Sm',               'maths'],
+       0x0230 => [0x018, 'X So',               'technical'],
+       0x0248 => [0x008, 'X Latin',            '()'],
+       0x0250 => [0x010, 'X So',               'draw'],
+       0x0260 => [0x020, 'X So',               'symbols'],
+       0x0280 => [0x010, 'X L Alpha',          'braille'],
+       0x0290 => [0x008, 'X So',               'arr'],
+       0x0298 => [0x018, 'X Sm',               'maths'],
+       0x02B0 => [0x010, 'X So',               'misc'],
+       0x02C0 => [0x010, 'X L Greek',          'ancient'],
+       0x02D0 => [0x010, 'X L Alpha',          'ext'],
+       0x02E0 => [0x008, 'X Po',               '·+'],
+       0x02E8 => [0x018, 'X L Han',            'radicals'],
+       0x0300 => [0x010, 'X L Katakana',       'japanese'],
+       0x0310 => [0x020, 'X L Han',            'cjk+'],
+       0x0330 => [0x010, 'X Xd L Han',         'compat'],
+       0x0340 => [0x1A0, 'X L Han',            'cjk ideographs A'],
+       0x04E0 => [0x520, 'X L Han',            'cjk unified ideographs'],
+       0x0A00 => [0x048, 'X L Syllabic',       'yi'],
+       0x0A48 => [0x008, 'X L Latin',          'lisu'],
+       0x0A50 => [0x010, 'X L Syllabic',       'vai'],
+       0x0A60 => [0x008, 'X L Cyrillic',       'cyr'],
+       0x0A68 => [0x008, 'X L Syllabic',       'bam'],
+       0x0A70 => [0x010, 'X L Latin',          'lat-D'],
+       0x0A80 => [0x030, 'X L Brahmic',        'brahmic'],
+       0x0AB0 => [0x010, 'X L Alpha',          'ext'],
+       0x0AC0 => [0x2C0, 'X L Hangul',         'hangeul syllables'],
+       0x0D80 => [0x080, 'X Cs',               'surrogates'],
+       0x0E00 => [0x190, 'X Co',               'private use'],
+       0x0F90 => [0x020, 'X L Han',            'cjk compat'],
+       0x0FB0 => [0x040, 'X L Arabic',         'presentation'],
+       0x0FF0 => [0x010, 'X L Latin',          'width'],
+       0x1000 => [0x010, 'X L Syllabic',       'linear B'],
+       0x1010 => [0x010, 'X No',               'a num'],
+       0x1020 => [0x040, 'X L Alpha',          'ltr'],
+       0x1060 => [0x018, 'X L Syllabic',       'linear A'],
+       0x1078 => [0x008, 'X L Alpha',          'ltr'],
+       0x1080 => [0x080, 'X L Aramaic',        'rtl'],
+       0x1100 => [0x100, 'X L Brahmic',        'brahmic'],
+       0x1200 => [0x100, 'X L Syllabic',       'cuneiform'],
+       0x1300 => [0x100, 'X L Syllabic',       'egyptian hieroglyphs'],
+       0x1400 => [0x200, 'X L Syllabic',       'other large scripts'],
+       0x1600 => [0x100, 'X L Alpha',          'recent'],
+       0x1700 => [0x450, 'X L Han',            'east asian'],
+       0x1B50 => [0x070, 'X L Syllabic',       'proto-elamite'],
+       0x1BC0 => [0x040, 'X L Alpha',          'shorthands'],
+       0x1C00 => [0x100, '',                   'other large scripts'],
+       0x1D00 => [0x040, 'X So',               'notational systems'],
+       0x1D40 => [0x040, 'X L Latin',          'mathematical'], # Sm
+       0x1D80 => [0x040, 'X L Alpha',          'sutton signs'],
+       0x1DC0 => [0x040, '',                   'notational'],
+       0x1E00 => [0x080, 'X L Alpha',          'ltr'],
+       0x1E80 => [0x080, 'X L Alpha',          'rtl'],
+       0x1F00 => [0x010, 'X So',               'game'],
+       0x1F10 => [0x020, 'X L So',             'enclosed'],
+       0x1F30 => [0x050, 'X So',               'pictographic'],
+       0x1F80 => [0x010, 'X So',               'arrows'],
+       0x1F90 => [0x070, '',                   'unassigned'],
+};