font: do not align columns to a power of 32
[sheet.git] / font.plp
index b081ac2749567468c920a663f81b52ffafed1372..a03990508905532bf62f2d914f41c4e5ee090848 100644 (file)
--- a/font.plp
+++ b/font.plp
 <(common.inc.plp)><:
+use 5.014;
 
 Html({
        title => 'character support sheet',
-       version => 'v1.0',
-       keywords => [qw'
-               unicode glyph char character reference common ipa symbol sign mark table digraph
-       '],
-       stylesheet => [qw'light dark mono circus red'],
-       data => [qw'unicode-table.inc.pl unicode-char.inc.pl'],
+       version => 'v1.1',
+       keywords => [qw(
+               unicode font glyph char character support overview cover coverage
+               script block symbol sign mark reference table
+       )],
+       stylesheet => [qw( light dark mono circus red )],
+       data => [qw( unicode-cover.inc.pl )],
 });
 
+if (my $font = $ENV{PATH_INFO} =~ s{^/}{}r) {
+       my ($fontmeta, @cover) = do "ttfsupport/$font.inc.pl";
+       $fontmeta or die "Unknown font $font\n";
+
+       require Unicode::UCD;
+
+       my $pagerows = 0x200;
+       my $pagecols = 32;
+       my $offset = eval {
+               local $_ = $get{q} || 0;
+               return $_ if /\A\d+\z/;  # numeric
+               return hex $1 if /\A (?: 0?x | u\W* ) ([0-9a-f]+) \z/ix;  # hexadecimal
+               return $_->[0]->[0] for Unicode::UCD::charblock(ucfirst) || ();  # block
+               die "Unknown offset query '$_'\n";
+       };
+       die $@ if $@;
+
+       say "<h1>Font coverage</h1>";
+       say "<h2>$_</h2>" for EscapeHTML($fontmeta->{name});
+       printf("<p>Version <strong%s>%s</strong> released %s contains %d glyphs.</p>\n",
+               !!$_->[2] && qq( title="revision $_->[2]"),
+               $_->[1], $_->[0],
+               scalar @cover,
+       ) for [
+               grep { $_ }
+               ($fontmeta->{date} || '?') =~ s/T.*//r,
+               EscapeHTML($fontmeta->{version}),
+               $fontmeta->{revision},
+       ];
+       printf "<p>%s</p>\n", join('<br>', map { $_ ? EscapeHTML($_) : () }
+               $fontmeta->{copyright}, $fontmeta->{license},
+       );
+
+       require Shiar_Sheet::FormatChar;
+       my $glyphs = Shiar_Sheet::FormatChar->new;
+
+       my %cover = map { ($_ => 1) } @cover;  # lookup map
+
+       say <<"EOT";
+
+<style>
+       .glyphs tbody th[!colspan] { text-align: right }
+       .glyphs tbody td { font-family: "$fontmeta->{name}" }
+</style>
+EOT
+       say '<table class="glyphs big">';
+
+       say "<caption>$_</caption>" for join(' ', grep {$_}
+               $offset > $pagerows && sprintf('<a rel="start" href="?q=%d">◄</a>', 0),
+               $offset > 0 && sprintf(
+                       '<a rel="prev" href="?q=%d" title="U+%1$04X">◅</a>',
+                       $offset - $pagerows,
+               ),
+               sprintf('U+%04X', $offset),
+               Unicode::UCD::charblock($offset),
+               $offset + $pagerows < 0x11_0000 && sprintf(
+                       '<a rel="next" href="?q=%d" title="U+%1$04X">▻</a>',
+                       $offset + $pagerows,
+               ),
+       );
+
+       for my $cp ($offset .. $offset+$pagerows-1) {
+               state $colpos;
+               my $block = Unicode::UCD::charblock($cp);
+               if ($block ne (state $sameblock = $block) and $block ne 'No_Block') {
+                       print '<tbody>';
+                       printf '<tr><th colspan=%d>%s', $pagecols+1, $block
+                               unless $block eq 'No_Block';
+                       say '';
+                       $sameblock = $block;
+                       $colpos = 0;
+               }
+
+               say sprintf '<tr><th>%X', $cp if $colpos++ % $pagecols == 0;
+
+               my $info = $glyphs->glyph_info($cp);
+               my ($class, $name, $mnem, $html, $string) = @{$info};
+               my $np = $class =~ /\bC\S\b/;  # noprint if control or invalid
+               say sprintf '<td class="%s" title="U+%04X%s">%s',
+                       !$class ? ('l0', $cp, '', '') :
+                       $cover{$cp} ? $np ? 'l2' : 'l5' : $np ? 'Xi' : 'l1',
+                       $cp, !!$name && ": $name",
+                       ($cover{$cp} || !$np) && EscapeHTML(chr $cp);
+       }
+       say '</table>';
+
+       exit;
+}
+
 :>
-<h1>Character support</h1>
+<h1>Font coverage</h1>
 
 <p>
-Selected characters from Unicode <a href="/unicode">preset</a>
-or <a href="/charset">range</a>.
+Character support of Unicode
+<a href="/charset">blocks</a> and <a href="/unicode">presets</a>.
 </p>
 
 <div>
 
 <:
-use 5.010;
-use Shiar_Sheet::FormatChar;
-my $glyphs = Shiar_Sheet::FormatChar->new;
-
-my %oslist = (
-       win95   => [qw( arial ariuni verdana times )],  # microsoft
-       mac10   => [qw( )],  # apple
-       android => [qw( droidsans )],  # google
-       oss     => [qw( dvsans c2k unifont )],
+
+my $cover = do 'unicode-cover.inc.pl' or die $@ || $!;
+
+my @ossel = @{ $cover->{osdefault} };
+my @fontlist = map { @{ $cover->{os}->{$_} } } @ossel;
+
+my @rows = (
+       'block/Latin-1 Supplement',
+       'block/Latin Extended-A',
+       'block/Latin Extended Additional',
+       'block/Latin Extended-B',
+       'script/Latin',
+       'script/Greek',
+       'script/Cyrillic',
+       'script/Arabic',
+       'script/Hebrew',
+       'script/Devanagari',
+       'script/Thai',
+       'script/Hangul',
+       'table/japanese',
+       'script/Han',
+       'table/ipa',
+       'table/punctuation',
+       'block/Dingbats',
+       'table/symbols',
+       'category/Sc', # currency
+       'table/math',
+       'category/Sm', # mathematical
+       'table/arrows/single',
+       'table/lines/single',
+       'table/block',
+       'table/lines',
+       'table/html',
 );
-my @ossel = qw( win95 oss android );
-
-my $tables = do 'unicode-table.inc.pl' or die $@ || $!;
-my (%font, @fontlist);
-for my $os (@ossel) {
-       my $osfonts = $oslist{$os};
-       for my $fontid (@{$osfonts}) {
-               push @fontlist, $fontid;
-               my ($fontmeta, @fontrange) = do "ttfsupport/$fontid.inc.pl";
-               $fontmeta or next;
-               $font{$fontid} = {
-                       -id   => $fontmeta->{id} || $fontid,
-                       -name => $fontmeta->{name},
-                       map { (chr $_ => 1) } @fontrange
-               };
-       }
-}
 
-# parse input
-
-my @chars;
-my @querydesc;
-
-my $query = $ENV{PATH_INFO} || $get{q} || 'ipa';
-for ($query) {
-       s{^/}{};
-       when (qr{^[a-z]+(?:/|\z)}) {
-               for (split / /) {
-                       push @querydesc, "preset group $_";
-                       my ($tablegroup, $tablename) = split m{/}, $_, 2;
-                       my @tables = $tablename ? $tables->{$tablegroup}->{$tablename}
-                                  : sort values %{ $tables->{$tablegroup} };
-                       for (@tables) {
-                               my $includerows;  # ignore rows before body row
-                               for (@{$_}) {
-                                       $includerows ||= m/^[.]/ or next;
-                                       next if /^[.-]/;
-                                       next if $_ eq '>' or $_ eq '=';
-                                       push @chars, $_;
-                               }
-                       }
-               }
-               when ('ipa') {
-                       @chars = grep { !m/[a-zA-Z]/ } @chars;
-               }
-       }
-       when (qr{[\d,;\s+-]+}) {
-               push @querydesc, "character codepoints $_";
-               for (map { split /[^\d-]/ } $_) {
-                       my ($charnum, $range) = split /-/, $_;
-                       push @chars, chr $_ for $charnum .. ($range // $charnum);
-               }
-       }
-       when (qr{[A-Z]}) {
-               push @querydesc, "unicode match $_";
-               eval {
-                       my $match = qr/\A\p{$_}\z/;
-                       push @chars, grep { m/$match/ } map { chr $_ }
-                               0..0xD7FF, 0xE000..0xFDCF, 0xFDF0..0xFFFD;
-               } or die "invalid unicode match: $_\n";
-       }
-       default {
-               die "unknown parameter: $_\n";
-       }
+if (my $group = $get{q}) {
+       my $grouprows = $cover->{$group}
+               or die "Unknown character category $_\n";
+       @rows = map { "$group/$_" } sort keys %{$grouprows};
 }
 
-@chars <= 1500 or die sprintf(
-       'too many matches (%d) for %s'."\n",
-       scalar @chars, join(', ', @querydesc),
-);
-
 # output character list
 
 print '<table class=mapped>';
-say '<caption>'.EscapeHTML(join ', ', @querydesc).'</caption>';
-print '<col>' x 3;
-print "<colgroup span=$_>" for 2, map { scalar @{$oslist{$_}} } @ossel;
+print '<col><col>';
+print "<colgroup span=$_>"
+       for map { scalar @{ $cover->{os}->{$_} } } @ossel;
 
 print '<thead><tr>';
-print '<td colspan=3>character';
-print '<td colspan=2>input';
-printf '<td colspan=%d>%s fonts', scalar @{ $oslist{$_} }, $_
+print '<th colspan=2>';
+printf '<td colspan=%d>%s fonts', scalar @{ $cover->{os}->{$_} }, $_
        for @ossel;
 
 print '<tr>';
-print '<td colspan=2>unicode';
-print '<td>name';
-print '<td><a href="/digraphs" title="digraph">di</a><td>html';
-printf '<td title="%s">%s', $font{$_}->{-name}, $font{$_}->{-id} // $_
-       for @fontlist;
+print '<th colspan=2>';
+printf('<td title="%s"><a href="%s">%s</a>', map { EscapeHTML($_) }
+       join("\n", $_->{name}, $_->{description}),
+       "/font/$_->{file}",
+       $_->{abbr},
+) for @{ $cover->{fonts} }[@fontlist];
 say '</thead>';
 
-for my $chr (@chars) {
-       my $codepoint = ord $chr;
-       my $ascii = $codepoint <= 127;
-
-       print "<tr><th>$chr\n";
-       my $info = $glyphs->glyph_info($codepoint);
-       my ($class, $name, $mnem, $html, $string) = @$info;
-       print "<td>$_" for sprintf('%X', $codepoint), EscapeHTML($name || '?');
-       printf '<td class="%s">%s', @$_ for (
-               [$ascii ? 'l0' : defined $mnem ? $class =~ /\bu-di\b/ ? 'l4' : 'l3' : 'l1', $mnem // ''],
-               [$ascii ? 'l0' : defined $html ? 'l4' : 'l1', $html // ''],
-               (map {
-                       !$font{$_}->{-id} ? [l0 => '?'] :
-                       $font{$_}->{$chr} ? [l4 => '✔'] : [l1 => '✘']
-               } @fontlist),
-       );
+for (@rows) {
+       my ($group, $name) = split m{/}, $_, 2;
+       my $row = $cover->{$group}->{$name};
+
+       print '<tr>';
+       $name = sprintf '<a href="%s">%s</a>', EncodeURI("/chars/$group/$name"), EscapeHTML($name)
+               if $row->{count} and $row->{count} < 1280;
+       print '<th>', $name;
+       print '<td class=right>', $row->{count};
+       for my $count (@{ $row->{support} }[@fontlist]) {
+               if (not defined $count) {
+                       print '<td class="l0">?';
+                       next;
+               }
+               if (not $count) {
+                       print '<td class="l1">✘';
+                       next;
+               }
+               if ($count == $row->{count}) {
+                       print '<td class="l5">✔';
+                       next;
+               }
+
+               my $rel = $count / $row->{count};
+               my $class = $rel < .5 ? 2 : $rel < .9 ? 3 : 4;
+               printf '<td class="%s">%d%%', "l$class", $rel*100;
+       }
+       say '</tr>';
 }
 
 say "</table>\n";