charset: omit unassigned half of ascii table
[sheet.git] / font.plp
index 2af6133da08094172b381f169d80ddebd726dbf7..d4d7debf24147e339fc81579840c33d55aed6fa0 100644 (file)
--- a/font.plp
+++ b/font.plp
@@ -1,9 +1,10 @@
 <(common.inc.plp)><:
-use 5.014;
+
+my $font = $Request;
 
 Html({
-       title => 'character support sheet',
-       version => 'v1.1',
+       title => 'font coverage '.($font ? "for $font" : 'sheet'),
+       version => '1.2',
        keywords => [qw(
                unicode font glyph char character support overview cover coverage
                script block symbol sign mark reference table
@@ -12,17 +13,50 @@ Html({
        data => [qw( unicode-cover.inc.pl )],
 });
 
-if (my $font = $ENV{PATH_INFO} =~ s{^/}{}r) {
+if ($font) {
        my ($fontmeta, @cover) = do "ttfsupport/$font.inc.pl";
        $fontmeta or die "Unknown font $font\n";
 
-       my $offset = $get{q} || 0;
-       $offset < 0 and $offset = 0;
-       my $size = 0x200;
+       my $map = eval {
+               $get{map} or return;
+
+               my $groupinfo = do 'unicode-cover.inc.pl' or die $@ || $!;
+
+               my ($cat, $name) = split m{/}, $get{map}, 2 or die "invalid map\n";
+               if (!$name) {
+                       ($cat, $name) = ('table', $cat);
+               }
+
+               my $row = $groupinfo->{$cat}->{$name}
+                       or die "unknown character group $cat/$name\n";
+               my $query = $row->{query};
+
+               my @map;
+               for (map { split /[^\d-]/ } $query) {
+                       my @range = split /-/, $_, 2;
+                       m/^[0-9]+$/ or die "Invalid code point $_ in query $query\n" for @range;
+                       push @map, $_ for $range[0] .. ($range[1] // $range[0]);
+               }
+               return \@map;
+       };
+       die $@ if $@;
+
+       require Unicode::UCD;
+
+       my $pagerows = 0x200;
+       my $pagecols = 32;
+       my $offset = eval {
+               local $_ = $get{q} || 0;
+               return $_ if /\A\d+\z/;  # numeric
+               return hex $1 if /\A (?: 0?x | u\W* ) ([0-9a-f]+) \z/ix;  # hexadecimal
+               return $_->[0]->[0] for Unicode::UCD::charblock(ucfirst) || ();  # block
+               die "Unknown offset query '$_'\n";
+       };
+       die $@ if $@;
 
        say "<h1>Font coverage</h1>";
        say "<h2>$_</h2>" for EscapeHTML($fontmeta->{name});
-       printf("<p>Version <strong%s>%s</strong> released %s contains %d glyphs.</p>\n",
+       printf("<p>Version <strong%s>%s</strong> released %s contains %d glyphs.",
                !!$_->[2] && qq( title="revision $_->[2]"),
                $_->[1], $_->[0],
                scalar @cover,
@@ -32,9 +66,22 @@ if (my $font = $ENV{PATH_INFO} =~ s{^/}{}r) {
                EscapeHTML($fontmeta->{version}),
                $fontmeta->{revision},
        ];
-       printf "<p>%s</p>\n", join('<br>', map { $_ ? EscapeHTML($_) : () }
-               $fontmeta->{copyright}, $fontmeta->{license},
-       );
+       for ($fontmeta->{os}) {
+               say '<br>';
+               print ucfirst join(' ',
+                       "distributed",
+                       (map { "by $_" } $fontmeta->{oscorp} || "various sources"),
+                       (map { "with <em>$_</em>" } $_ || ()),
+                       ('and published as freeware "Core Web font"') x ($_ eq 'Windows 2000'),
+                       (map { "under a $_ license" }
+                               map { $fontmeta->{license} ? qq(<a href="$fontmeta->{license}" rel=nofollow>$_</a>) : $_ }
+                               $_ && $_ ne 'Android' ? 'proprietary' : 'free',
+                       ),
+               );
+               print '.';
+       }
+       say '</p>';
+       say "<p>$_</p>" for EscapeHTML($fontmeta->{copyright}) || ();
 
        require Shiar_Sheet::FormatChar;
        my $glyphs = Shiar_Sheet::FormatChar->new;
@@ -44,33 +91,77 @@ if (my $font = $ENV{PATH_INFO} =~ s{^/}{}r) {
        say <<"EOT";
 
 <style>
-       .glyphs tbody th { text-align: right }
+       .glyphs tbody th[!colspan] { text-align: right }
        .glyphs tbody td { font-family: "$fontmeta->{name}" }
+       .glyphs tbody td:nth-child(18) { border-left-width: 2px }
+       \@font-face {
+               font-family: "$fontmeta->{name}";
+               src: url(/data/font/$font.ttf);
+       }
 </style>
 EOT
        say '<table class="glyphs big">';
+
+       my $offsetlink = '?' . join('&amp;',
+               (map { $_ . '=' . EncodeURI($get{$_}) } grep { defined $get{$_} } qw{ map }),
+               'q',
+       );
        say "<caption>$_</caption>" for join(' ', grep {$_}
-               $offset > $size && sprintf('<a rel="start" href="?q=%d">◄</a>', 0),
+               $offset > $pagerows && sprintf('<a rel="start" href="%s=%d">◄</a>', $offsetlink, 0),
                $offset > 0 && sprintf(
-                       '<a rel="prev" href="?q=%d" title="U+%1$04X">◅</a>',
-                       $offset - $size,
+                       '<a rel="prev" href="%s=%d" title="U+%2$04X">◅</a>',
+                       $offsetlink, $offset - $pagerows,
                ),
-               sprintf('U+%04X', $offset), #TODO: block name
-               $offset + $size < 0x11_0000 && sprintf(
-                       '<a rel="next" href="?q=%d" title="U+%1$04X">▻</a>',
-                       $offset + $size,
+               sprintf('U+%04X', $map ? $map->[$offset] : $offset),
+               Unicode::UCD::charblock($map ? $map->[$offset] : $offset),
+               $offset + $pagerows < ($map ? @{$map} : 0x11_0000) && sprintf(
+                       '<a rel="next" href="%s=%d" title="U+%2$04X">▻</a>',
+                       $offsetlink, $offset + $pagerows,
                ),
        );
-       for my $cp ($offset .. $offset+$size-1) {
+
+       for my $cp ($offset .. $offset+$pagerows-1) {
+               $cp = $map->[$cp] or next if $map;
+
+               state $colpos;
+               my $block = Unicode::UCD::charblock($cp);
+               if ($block ne (state $sameblock = $block) and $block ne 'No_Block') {
+                       print '<tbody>';
+                       printf '<tr><th colspan=%d>%s', $pagecols+1, $block
+                               unless $block eq 'No_Block';
+                       say '';
+                       $sameblock = $block;
+                       $colpos = 0;
+               }
+
+               if ($map) {
+                       # compare previous code point and indicate gaps
+                       state $lastcp = 0;
+                       if ($cp != ++$lastcp) {
+                               if (!$colpos or $colpos++ % $pagecols > $pagecols - 3) {
+                                       # nearly last column, start new row
+                                       $colpos = 0;
+                               }
+                               else {
+                                       # mark repositioning in existing row
+                                       printf '<th>%X', $cp;
+                               }
+                               $lastcp = $cp;
+                       }
+               }
+
+               say sprintf '<tr><th>%X', $cp if $colpos++ % $pagecols == 0;
+
                my $info = $glyphs->glyph_info($cp);
-               my ($class, $name, $mnem, $html, $string) = @{$info};
+               my ($class, $name, $mnem, $entity, $string) = @{$info};
                my $np = $class =~ /\bC\S\b/;  # noprint if control or invalid
-               say sprintf '<tr><th>%X', $cp if $cp % 32 == 0;
+               # display literal character, with placeholder circle if non-spacing/enclosing
+               my $html = ($class =~ /\bM[ne]\b/ && chr 9676) . EscapeHTML(chr $cp);
                say sprintf '<td class="%s" title="U+%04X%s">%s',
                        !$class ? ('l0', $cp, '', '') :
                        $cover{$cp} ? $np ? 'l2' : 'l5' : $np ? 'Xi' : 'l1',
                        $cp, !!$name && ": $name",
-                       ($cover{$cp} || !$np) && EscapeHTML(chr $cp);
+                       ($cover{$cp} || !$np) && $html;
        }
        say '</table>';
 
@@ -95,6 +186,8 @@ my @ossel = @{ $cover->{osdefault} };
 my @fontlist = map { @{ $cover->{os}->{$_} } } @ossel;
 
 my @rows = (
+       'version/11',
+       'version/63',
        'block/Latin-1 Supplement',
        'block/Latin Extended-A',
        'block/Latin Extended Additional',
@@ -131,15 +224,18 @@ if (my $group = $get{q}) {
 
 # output character list
 
-print '<table class=mapped>';
+print '<table class="mapped cover">';
 print '<col><col>';
 print "<colgroup span=$_>"
        for map { scalar @{ $cover->{os}->{$_} } } @ossel;
 
 print '<thead><tr>';
 print '<th colspan=2>';
-printf '<td colspan=%d>%s fonts', scalar @{ $cover->{os}->{$_} }, $_
-       for @ossel;
+for my $os (@ossel) {
+       my $osfonts = $cover->{os}->{$os};
+       my $osfont = $cover->{fonts}->[ $osfonts->[0] ]; # first font
+       printf '<td colspan=%d>%s', scalar @{$osfonts}, $osfont->{os} || ''
+}
 
 print '<tr>';
 print '<th colspan=2>';
@@ -155,6 +251,7 @@ for (@rows) {
        my $row = $cover->{$group}->{$name};
 
        print '<tr>';
+       $name = sprintf 'Unicode v%.1f', $name / 10 if $group eq 'version';
        $name = sprintf '<a href="%s">%s</a>', EncodeURI("/chars/$group/$name"), EscapeHTML($name)
                if $row->{count} and $row->{count} < 1280;
        print '<th>', $name;
@@ -175,7 +272,7 @@ for (@rows) {
 
                my $rel = $count / $row->{count};
                my $class = $rel < .5 ? 2 : $rel < .9 ? 3 : 4;
-               printf '<td class="%s">%d%%', "l$class", $rel*100;
+               printf '<td class="%s">%d', "l$class", $rel*10;
        }
        say '</tr>';
 }