unicode: option for common number derivatives
authorMischa POSLAWSKY <perl@shiar.org>
Tue, 8 Feb 2011 19:12:43 +0000 (20:12 +0100)
committerMischa POSLAWSKY <perl@shiar.org>
Tue, 10 Apr 2012 01:03:24 +0000 (03:03 +0200)
Notable characters missing for latin1 coverage:
superscript 1-3 (2 already present) and quarter fractions.

unicode-table.inc.pl
unicode.plp

index 7ab3dd3..5e79610 100644 (file)
@@ -3,7 +3,11 @@ use utf8;
 
 punctuation => {
        quoting  => [qw{. « » . ‹ › . ‘ ’ . “ ” . „ ‚ . ‟ ‛}],
-       common   => [qw{. † ‡ • . § ¶ # . © ® ™ . ° ′ ″ . − × ÷ . ± ² √ . 年 月 日}],
+       common   => [qw{
+               . † ‡ • . § ¶ # . © ® ™
+               . ° ′ ″ . − × ÷ . ± ² √
+               . ¹ ⁿ ³ . ¼ ½ ¾ . 年 月 日
+       }],
        marks    => [qw{. ¿ … 〃 ‐ – . ‽ · ※ ‒ — }],
        spacing  => [split / /, join ' ',
                ". \x{2003} \x{2009} \x{2007} \x{A0} \x{200B}",
index 76c31ec..7a70b27 100644 (file)
@@ -46,7 +46,7 @@ our $verbose = exists $get{v};
 my @config = qw(
        Popular
                punctuation/quoting
-                       common=-5
+                       common=-5?common
                symbols/binary?symbols/binary=-5
                latin/sample=-1
                        ?sample=2-