font: aggregate counts for unicode versions
[sheet.git] / font.plp
index e0a9663df6945bb46d2c6ec84d37a53b2ddbaece..a93835cf4a96c2ee1695fb314187098ad2e2114a 100644 (file)
--- a/font.plp
+++ b/font.plp
@@ -16,7 +16,18 @@ if (my $font = $ENV{PATH_INFO} =~ s{^/}{}r) {
        my ($fontmeta, @cover) = do "ttfsupport/$font.inc.pl";
        $fontmeta or die "Unknown font $font\n";
 
-       my $offset = $get{q} || 0;
+       require Unicode::UCD;
+
+       my $pagerows = 0x200;
+       my $pagecols = 32;
+       my $offset = eval {
+               local $_ = $get{q} || 0;
+               return $_ if /\A\d+\z/;  # numeric
+               return hex $1 if /\A (?: 0?x | u\W* ) ([0-9a-f]+) \z/ix;  # hexadecimal
+               return $_->[0]->[0] for Unicode::UCD::charblock(ucfirst) || ();  # block
+               die "Unknown offset query '$_'\n";
+       };
+       die $@ if $@;
 
        say "<h1>Font coverage</h1>";
        say "<h2>$_</h2>" for EscapeHTML($fontmeta->{name});
@@ -42,21 +53,51 @@ if (my $font = $ENV{PATH_INFO} =~ s{^/}{}r) {
        say <<"EOT";
 
 <style>
-       .glyphs tbody th { text-align: right }
+       .glyphs tbody th[!colspan] { text-align: right }
        .glyphs tbody td { font-family: "$fontmeta->{name}" }
+       .glyphs tbody td:nth-child(18) { border-left-width: 2px }
 </style>
 EOT
        say '<table class="glyphs big">';
-       for my $cp ($offset .. $offset+0x1FF) {
+
+       say "<caption>$_</caption>" for join(' ', grep {$_}
+               $offset > $pagerows && sprintf('<a rel="start" href="?q=%d">◄</a>', 0),
+               $offset > 0 && sprintf(
+                       '<a rel="prev" href="?q=%d" title="U+%1$04X">◅</a>',
+                       $offset - $pagerows,
+               ),
+               sprintf('U+%04X', $offset),
+               Unicode::UCD::charblock($offset),
+               $offset + $pagerows < 0x11_0000 && sprintf(
+                       '<a rel="next" href="?q=%d" title="U+%1$04X">▻</a>',
+                       $offset + $pagerows,
+               ),
+       );
+
+       for my $cp ($offset .. $offset+$pagerows-1) {
+               state $colpos;
+               my $block = Unicode::UCD::charblock($cp);
+               if ($block ne (state $sameblock = $block) and $block ne 'No_Block') {
+                       print '<tbody>';
+                       printf '<tr><th colspan=%d>%s', $pagecols+1, $block
+                               unless $block eq 'No_Block';
+                       say '';
+                       $sameblock = $block;
+                       $colpos = 0;
+               }
+
+               say sprintf '<tr><th>%X', $cp if $colpos++ % $pagecols == 0;
+
                my $info = $glyphs->glyph_info($cp);
                my ($class, $name, $mnem, $html, $string) = @{$info};
                my $np = $class =~ /\bC\S\b/;  # noprint if control or invalid
-               say sprintf '<tr><th>%X', $cp if $cp % 32 == 0;
+               # display literal character, with placeholder circle if non-spacing/enclosing
+               my $html = ($class =~ /\bM[ne]\b/ && chr 9676) . EscapeHTML(chr $cp);
                say sprintf '<td class="%s" title="U+%04X%s">%s',
                        !$class ? ('l0', $cp, '', '') :
                        $cover{$cp} ? $np ? 'l2' : 'l5' : $np ? 'Xi' : 'l1',
                        $cp, !!$name && ": $name",
-                       ($cover{$cp} || !$np) && EscapeHTML(chr $cp);
+                       ($cover{$cp} || !$np) && $html;
        }
        say '</table>';
 
@@ -81,6 +122,8 @@ my @ossel = @{ $cover->{osdefault} };
 my @fontlist = map { @{ $cover->{os}->{$_} } } @ossel;
 
 my @rows = (
+       'version/11',
+       'version/63',
        'block/Latin-1 Supplement',
        'block/Latin Extended-A',
        'block/Latin Extended Additional',
@@ -141,6 +184,7 @@ for (@rows) {
        my $row = $cover->{$group}->{$name};
 
        print '<tr>';
+       $name = sprintf 'Unicode v%.1f', $name / 10 if $group eq 'version';
        $name = sprintf '<a href="%s">%s</a>', EncodeURI("/chars/$group/$name"), EscapeHTML($name)
                if $row->{count} and $row->{count} < 1280;
        print '<th>', $name;