digraphs: proposals for common formatting control characters
authorMischa POSLAWSKY <perl@shiar.org>
Thu, 19 Feb 2015 23:07:47 +0000 (00:07 +0100)
committerMischa POSLAWSKY <perl@shiar.org>
Tue, 9 Jun 2015 03:43:41 +0000 (05:43 +0200)
Cover HTML4 entities.

shiar.inc.txt
tools/mkcharinfo
tools/mkdigraphlist

index c5064ca993d4d1cb4d343013165190c28d8fa277..e784cc9a2fe937749155460ddd214fa11fb20676 100644 (file)
@@ -504,6 +504,13 @@ oK ㅛ
 eK ㅕ
 EK ㅖ
 
+# common formatting control
+ZS ​  # ZWSP; capitals like other Cc
+ZN ‌  # ZWNJ;                           less obvious alt: 'Z
+ZW ‍  # ZWJ; ZJ somewhy used for tsadi; less obvious alt: "Z
+LR ‎  # LRM
+RL ‏  # RLM; keep rl for ɼ
+
 ###
 # under development or temporary
 
@@ -535,9 +542,6 @@ $vy ױ
 $yy ײ
 $g1 ׳
 $g2 ״
-$lr ‎
-$rl ‏
-$zw ‍
 
 # rfc (incorrectly?) maps double to heavy
 $vL ╡
index 27c11d93bcf53b34c50fdc3d895900cc1579c16c..ef1e2150c535892c30afe789580a549f759c2203 100755 (executable)
@@ -11,9 +11,13 @@ use Data::Dump 'pp';
 our $VERSION = '1.00';
 
 my %info = (
+       # prepare presentational string for some control(lish) entries
        "\xAD"     => {string => '-'},
        "\x{200E}" => {string => '→'},
        "\x{200F}" => {string => '←'},
+       "\x{200B}" => {string => '␣'},
+       "\x{200C}" => {string => '|'}, # ISO-9995-7-081 lookalike (alt: ∣ ⊺ ⟙)
+       "\x{200D}" => {string => '⁀'}, # join (alt: ∤ |ͯ ⨝)
 );
 $info{chr $_} //= {} for 32 .. 126;
 
index a1bfbcd05476d2bd77c6ee52365a1529d26256fd..d50f7b518f2f37b453ff26dcea979c407dd91383 100755 (executable)
@@ -141,6 +141,9 @@ for (keys %di) {
 }
 # presentational string for some control(lish) entries
 $info{$_}->{string} = '-' for grep { $di{$_} == 0x00AD } keys %di;
+$info{$_}->{string} = '␣' for grep { $di{$_} == 0x200B } keys %di;
+$info{$_}->{string} = '|' for grep { $di{$_} == 0x200C } keys %di;
+$info{$_}->{string} = '⁀' for grep { $di{$_} == 0x200D } keys %di;
 $info{$_}->{string} = '→' for grep { $di{$_} == 0x200E } keys %di;
 $info{$_}->{string} = '←' for grep { $di{$_} == 0x200F } keys %di;