charset: describe unicode BMP blocks upto U+27Xx
authorMischa POSLAWSKY <perl@shiar.org>
Sun, 19 Apr 2009 19:49:03 +0000 (19:49 +0000)
committerMischa POSLAWSKY <perl@shiar.org>
Wed, 22 Apr 2009 00:01:21 +0000 (00:01 +0000)
charset.plp

index e5ca8bf..777e0ee 100644 (file)
@@ -55,7 +55,7 @@ my @request = map {
                }
                if ($row{set} = resolve_alias($input)) {
                        if ($row{set} eq 'Internal') {
-                               $row{table} = ' 'x512;
+                               $row{table} = ' 'x640;
                                $row{set} = 'Unicode BMP';
                        }
                        elsif ($row{set} eq 'utf-8-strict') {
@@ -96,7 +96,7 @@ sub quote {
 
 sub printcell_unicode {
        my ($value) = @_;
-       if ($value > 0x1FF) {
+       if ($value > 0x27F) {
                print "\n".'<td class="X">?';
        }
        elsif ($value == 0) {
@@ -226,7 +226,7 @@ sub printcell_unicode {
                print '<td colspan="2" class="X Ll African">eth+';
        }
        elsif ($value == 0x13A) {
-               print '<td colspan="6" class="X Ll X">cherokee';
+               print '<td colspan="6" class="X Ll Syllabic">cherokee';
        }
        elsif ($value == 0x140) {
                print '<td colspan="16" rowspan="2" class="X Ll Syllabic">unified canadian aboriginal syllabics';
@@ -318,6 +318,63 @@ sub printcell_unicode {
        elsif ($value == 0x1F0) {
                print '<td colspan="16" class="X Ll Greek">greek+';
        }
+       elsif ($value == 0x200) {
+               print '<td colspan="7" class="X Pd">general punctuation';
+       }
+       elsif ($value == 0x207) {
+               print '<td colspan="3" class="X Latin">su[bp]script';
+       }
+       elsif ($value == 0x20A) {
+               print '<td colspan="3" class="X Sc">currency';
+       }
+       elsif ($value == 0x20D) {
+               print '<td colspan="3" class="X Mn">overlay';
+       }
+       elsif ($value == 0x210) {
+               print '<td colspan="5" class="X So">letterlike';
+       }
+       elsif ($value == 0x215) {
+               print '<td colspan="4" class="X Latin">number';
+       }
+       elsif ($value == 0x219) {
+               print '<td colspan="7" class="X So">arrows';
+       }
+       elsif ($value == 0x220) {
+               print '<td colspan="16" class="X Sm">mathematical symbols';
+       }
+       elsif ($value == 0x230) {
+               print '<td colspan="16" class="X So">miscellaneous technical';
+       }
+       elsif ($value == 0x240) {
+               print '<td colspan="4" class="X So">control';
+       }
+       elsif ($value == 0x244) {
+               print '<td colspan="2" class="X So">OCR';
+       }
+       elsif ($value == 0x246) {
+               print '<td colspan="10" class="X Latin">enclosed alphanumerics';
+       }
+       elsif ($value == 0x250) {
+               print '<td colspan="8" class="X So">box drawing';
+       }
+       elsif ($value == 0x258) {
+               print '<td colspan="2" class="X So">blocks';
+       }
+       elsif ($value == 0x25A) {
+               print '<td colspan="6" class="X So">geometric shapes';
+       }
+       elsif ($value == 0x260) {
+               print '<td colspan="16" class="X So">miscellaneous symbols';
+       }
+       elsif ($value == 0x270) {
+               print '<td colspan="12" class="X So">dingbats';
+       }
+       elsif ($value == 0x27C) {
+               print '<td colspan="3" class="X So">maths-A';
+       }
+       elsif ($value == 0x27F) {
+               print '<td colspan="1" class="X So" title="supplemental arrows-A">arr';
+       }
 }
 
 sub printcell_utf8 {