digraphs: categorise additions to useful characters
[sheet.git] / shiar.inc.txt
1 # common meaning of second character
2         !       Grave
3         "       Double acute accent
4         '       Acute accent
5         (       Breve
6         ) +?    Inverted Breve
7         ,       Cedilla
8         -       Macron
9         .       Dot Above
10         /       Stroke
11         0       Ring above
12         2       Hook
13         8 +?    Double Grave
14         9       Horn
15         9 +     Curl
16         :       Diaeresis
17         ;       Ogonek (+Retroflex Hook/Tail)
18         <       Caron
19         >       Circumflex accent
20         ?       Tilde
21         _       Line below
22         c +     Smallcaps
23         I +     Turned
24         S       Superscript
25         s       Subscript
26
27         =       Cyrillic
28         *       Greek
29         %       Greek/Cyrillic special
30         +       lc: Arabic, uc: Hebrew
31         3       some Latin/Greek/Cyrillic letters
32         4       Bopomofo
33         5       Hiragana (also lc + a/e/i/o/u)
34         6       Katakana (also uc + a/e/i/o/u)
35         J +     Korean Jamo (also K)
36         p +     IPA extensions
37
38 # common first character
39         "       combining diacritic
40         '       spacing diacritic
41         R       square
42
43
44 # currency
45 #=e €  # in vim
46 #Eu €  # in zsh and vim
47 =B ฿  # more like B/, but prefer that for diacritical letter
48 =d ₫
49 =g ₴  # derived from cursive g= (soundalike h= or lookalike 2= seem bad options)
50 =L ₺
51 =N ₦
52 #=P ₽  # in vim
53 =p ₱  # =P conflicts with vim alternative for ruble
54 =R ₹  # conflicts with vim alternative for ruble
55 =t ₮
56 K/ ₭
57 Rs ₨
58 Sq ₪
59 m/ ₥
60
61 # useful characters
62 3: …  # opposite of ⋮ (more logical would be to swap with .3 ⋯)
63 .> ‣  # similar to .=
64 .1 ․  # obvious location, even though ‥ and … are at inconsistent .. and 3:
65 ** ⁑
66 *3 ⁂
67 8< ✂  # ascii scissors
68 :* ☃  # unicodesnowmanforyou.com
69 0Q ◔  # quarter black
70 0q ◕  # quarter not black, completes sequence 0m 0q 0R 0Q 0M
71
72 # missing mathematical symbols
73 (/ ⊄  # similar to (_
74 )/ ⊅  # similar to )_
75 (+ ∉  # (- with stroke
76 +) ∌  # -) with stroke
77 !3 ≢  # !=3
78 *+ ⋆  # apl star operator
79
80 # circled maths
81 *0 ⍟  # circle star, 0* is asterisk
82 0X ⊗  # *X like 0.
83 +0 ⊕  # 0+ already in use
84 0/ ⊘
85 0- ⊖
86 0* ⊛
87 0: ⨸
88 0% ⦼  # no circled percent, but close
89 0< ⧀
90 0= ⊜
91 0> ⧁
92 0! ⦶  # no circled exclamation mark
93 0I ⌽  # circle stile
94 0T ⍉  # circle backslash = APL Transpose
95
96 # greek-derived symbols
97 *a ⍺  # a* apl
98 *i ⍳  # i* apl
99 *I ⍸  # shifted *i
100 *r ⍴  # r* apl
101 *w ⍵  # w* apl
102 *f ϕ  # stroked f* symbol
103 *p ϖ  # omega p* symbol
104 *k ϗ  # k* abbreviation
105 *R ϱ  # tailed r* symbol
106 *h ϑ  # script h* symbol
107
108 # diagonal arrows
109 /! ↗  # /> in use
110 v/ ↙  # </ in use
111 !/ ↖  # /< (home)
112 /v ↘  # >/ (end)
113 *! ⇞  # page-up
114 *v ⇟  # page-down
115
116 # control/modifier keys
117 >I ⇥  # tab = Ctrl-I (also arrow-to-bar lookalike)
118 <I ⇤  # I< in use
119 <X ⌫  # erase left (bs)
120 X> ⌦  # erase right (del)
121 =X ⌧  # erase
122 aV ⎀  # insertation, commonly represented as a with caron below (V)
123 88 ⌘  # command (apple, windows, super)
124 #=/ ⌥  # option (alt)
125 CO ⎄  # composition (shift+altgr)
126 XO ⎈  # helm (ctrl)
127 +! ⇧  # white arrow (shift); like =!
128 Cr ↵  # &crarr; (carriage return); CR in use for actual control
129
130 # software command icons
131 Cv 📋  # clipboard (Ctrl-V)
132 Cs 💾  # floppy (Ctrl-S)
133 Cl 📂  # open file (Ctrl-L/O but co in use)
134 Cn 🗋  # empty document (Ctrl-N)
135 Cp 🖶  # print (Ctrl-P)
136 -O 🔎  # magnifying glass (search/details)
137
138 # xorg compatibility
139 .= •  # previously ()
140 <3 ♥  # rfc has trigraph cH-
141 :) ☺  # easy alias to 0u
142 :( ☹
143 FU 🖕  # common abbreviation for middle finger
144 #88 ∞  # alias to 00, prefer lookalike ⌘
145 #v/ √  # alias to RT
146 !? ‽  # previously ?!
147 ?! ⸘
148 fs ſ  # previously sl
149
150 # emoji
151 >- ☮  # peace; yahoo :)>-
152 %) ☯  # yin yang; yahoo (%)
153 !P ⚐  # flag; yahoo **==
154 bd 👍  # thumbsup; ms (Y) yahoo :-bd github :+1:
155 pq 👎  # thumbsdown; ms (N) yahoo :-q github :-1:
156 /m ✊  # fist; gmail \m/
157 C) ☕  # coffee; ms (c) yahoo ~O)
158 ~@ 💩  # poo; gmail ~@~
159 +O 🍎  # apple (also private U+F8FF)
160 X) ❖  # turned microsoft logo (similar to ms (xx) xbox logo)
161
162 # smiley faces
163 :o 😲  # astonished; ms surprised
164 :D 😃  # open mouth :smiley:
165 B) 😎  # sunglasses; cool; ms (H)
166 TT 😢  # cry; :'(
167 ;) 😉  # wink
168 #:! 😞  # disappointed; ms :|
169 :! 😐  # neutral; gmail straight :-| yahoo straight :|
170 :/ 😕  # confused; gmail slant :-/ twitch undecided :/
171 :s 😖  # confounded; wordpress :? ms confused :s skype worried :s
172 :P 😝  # tongue; literally 😛
173 8O 😲  # astonished; ms/wordpress shocked 8O
174 >) 😈  # devil; gmail }:-) yahoo >:) facebook 3:)
175 >( 😠  # angry; ms :@ yahoo/skype X( facebook >:( twitch >(
176 :x 😚  # kissing; gmail :* or :-x (mad in ms)
177 :z 😴  # sleeping; twitch bored :z (sleepy 😪 tired 😫)
178
179 # animals
180 @_ 🐌  # snail
181 :@ 🐷  # pig; gmail :(:) ms yahoo :@)
182 #:3 🐱  # cat; ms (@) facebook/skype :3 (already in use, as is :X)
183 :> 🐔  # chicken; yahoo ~:>
184 <) 🐧  # penguin; facebook <(")
185
186 # obvious line drawing gaps
187 ll ╴
188 rr ╶
189 uu ╵
190 dD ╷  # goddamn! stupid arabic dad got there first
191 LL ╸
192 RR ╺
193 UU ╹
194 DD ╻
195 Hh ╾
196 hH ╼
197 Vv ╿
198 vV ╽
199 2- ╌  # exactly like to 3 and 4
200 2_ ╍
201 2! ╎
202 2/ ╏
203 BF ╳  # FD and BD combined; FB already in use
204
205 # additional letters
206 HW Ƕ  # HV conflicts with vh line drawing
207 hw ƕ
208 db ȸ
209 qp ȹ
210 # old/middle english (uncommon)
211 WY Ƿ  # replaced by UU, later W
212 wy ƿ
213 YG Ȝ  # g-derived Y
214 yg ȝ
215 # common ipa
216 s2 ʃ  # can't use sh, keep es for subscript; no S-hook since (retroflex) hook is at S;
217 #S2 Ʃ  # derived uppercase, not ipa; occupied by SHIFT-TWO control
218 l2 ɬ  # only belt, but same place of articulation as r2 s2 d2
219 ?. ʔ
220 ?/ ʡ
221 # clicks
222 !C ǀ  # corresponding zulu letter
223 !Q ǃ  # idem; !. for lookalike (previously ʗ)
224 !X ǁ  # idem; !/ for lookalike (previously ʖ)
225 !A ǂ  # Alveolar; !- looks alike, != even more so but already occupied
226 !B ʘ  # Bilabial
227 !R ‼  # Retroflex (or Repeated); !! looks alike but occupied
228 # grave (or similar)
229 R! Ȑ  # no R-grave; double down
230 r! ȑ
231 S! Ș  # no S-grave; comma in use for cedilla, so misusing grave seems only fair
232 s! ș
233 T! Ț  # no T-grave; like S!
234 t! ț
235
236 # subscripts
237 as ₐ
238 #es ₑ  #TODO: move esh
239 @s ₔ
240 hs ₕ
241 is ᵢ
242 js ⱼ
243 ks ₖ
244 ls ₗ
245 ms ₘ
246 ns ₙ
247 os ₒ
248 ps ₚ
249 rs ᵣ
250 Ss ₛ  # ss is ß
251 #ts ₜ  # both ts and Ts in use for Ћ
252 us ᵤ
253 vs ᵥ
254 xs ₓ
255
256 # superscripts (modifier letters)
257 AS ᵃ  # alef was first for aS
258 bS ᵇ
259 CS ᶜ  # cS is ♠
260 dS ᵈ
261 eS ᵉ
262 #fS ᶠ  # both fS and FS in use
263 gS ᵍ
264 hS ʰ  # ipa release
265 iS ⁱ
266 jS ʲ  # ipa release
267 kS ᵏ
268 lS ˡ  # ipa release
269 mS ᵐ
270 #nS ⁿ  # already present
271 oS ᵒ
272 pS ᵖ
273 rS ʳ
274 sS ˢ
275 tS ᵗ
276 uS ᵘ
277 vS ᵛ
278 wS ʷ  # ipa release
279 xS ˣ
280 yS ʸ
281 zS ᶻ
282
283 # capital superscripts; avoid as most *S are in use
284 #AS ᴬ
285 ##BS ᴮ
286 ##DS ᴰ
287 ##ES ᴱ
288 ##GS ᴳ
289 ##HS ᴴ
290 ##IS ᴵ
291 #JS ᴶ
292 #KS ᴷ
293 #LS ᴸ
294 #MS ᴹ
295 ##NS ᴺ
296 ##OS ᴼ
297 #PS ᴾ
298 ##RS ᴿ
299 ##TS ᵀ
300 ##US ᵁ
301 ##VS ⱽ
302 #WS ᵂ
303
304 # expected but missing
305 A. Ȧ
306 a. ȧ
307 #A0 Ǻ  # normal A-ring already provided by AA
308 #a0 ǻ
309 H< Ȟ
310 h< ȟ
311 j. ȷ
312 O. Ȯ
313 o. ȯ
314 N! Ǹ
315 n! ǹ
316 Y- Ȳ  # conflicts with vim alternative for yen
317 y- ȳ
318 'i ͺ # spacing iota subscript (like "i for combining)
319 =v ⇓
320 =! ⇑
321 Ac ℀  # prefer common A-smallcap for ac
322 As ℁  # prefer common a-subscript for as
323 cu ℆  # co ís present though
324 1/ ⅟
325 03 ↉
326 17 ⅐
327 19 ⅑
328 10 ⅒
329
330 # relocate
331 a" ǟ  # a1 # long umlauted, very similar to double acute
332 A" Ǟ  # A1
333 jo ё  # io # consistent with ja/ju
334 JO Ё  # IO
335 ji ї  # yi # idem
336 JI Ї  # YI
337 Z1 Ʒ  # ED # doesn't make sense, put it with S1
338 z1 ʒ  # ed # not in vim
339 =Y ¥  # Ye # also Y- in vim
340
341 # bars and strokes
342 A/ Ⱥ
343 a/ ⱥ
344 B/ Ƀ
345 B- Ƃ
346 b- ƃ
347 b/ ƀ
348 C/ Ȼ
349 c/ ȼ
350 E/ Ɇ
351 e/ ɇ
352 F/ Ꞙ
353 f/ ꞙ
354 I/ Ɨ
355 i/ ɨ
356 J/ Ɉ
357 j/ ɉ
358 L- Ƚ
359 l- ƚ  # not really a macron, but wouldn't really make sense anyway otherwise
360 l? ɫ  # idem
361 L? Ɫ
362 P/ Ᵽ
363 p/ ᵽ
364 R/ Ɍ
365 r/ ɍ
366 U/ Ʉ
367 u/ ʉ
368 Y/ Ɏ
369 y/ ɏ
370
371 # middle tilde  #XXX: not tilde above
372 #b? ᵬ
373 #d? ᵭ
374 #f? ᵮ
375 #m? ᵯ
376 ##n? ᵰ  # already a tilde above
377 #p? ᵱ
378 #r? ᵲ
379 #s? ᵴ
380 #t? ᵵ
381 #z? ᵶ
382
383 # inverted breves
384         # not used all that much, better leave x) free
385 #")
386 #')
387 #A) Ȃ
388 #a) ȃ
389 #E) Ȇ
390 #e) ȇ
391 #I) Ȋ  # )I exists, but should not confuse
392 #i) ȋ
393 #O) Ȏ
394 #o) ȏ
395 #R) Ȓ
396 #r) ȓ
397 #U) Ȗ  # )U exists
398 #u) ȗ
399
400 # double grave
401         # usage is similar to inverted breve, just as rare
402 #"8
403 #'8
404 #A8 Ȁ
405 #a8 ȁ
406 #E8 Ȅ
407 #e8 ȅ
408 #I8 Ȉ
409 #i8 ȉ
410 #O8 Ȍ
411 #o8 ȍ
412 #R8 Ȑ
413 #r8 ȑ
414 #U8 Ȕ
415 #u8 ȕ
416
417 # hooks
418 #"2
419 #'2
420 B2 Ɓ
421 b2 ɓ
422 C2 Ƈ
423 c2 ƈ
424 #D2 Ɗ  # in use by control char
425 d2 ɗ  # hook
426 d; ɖ  # R (tail)
427 D; Ɖ
428 E, Ȩ
429 e, ȩ
430 F, Ƒ  # described as hook, but similar to cedilla
431 f, ƒ  # replaces more specialised f( and Fl, unified nowadays
432 G2 Ɠ
433 g2 ɠ
434 H2 Ɦ  # different hook from lowercase
435 h2 ɦ
436 HG Ꜧ  # similar to NG, distinct from ꞕ ḩ ⱨ
437 hg ꜧ
438 K2 Ƙ
439 k2 ƙ
440 l; ɭ  # R
441 MG Ɱ  # M2 in use
442 mg ɱ  # similar to ng
443 N2 Ɲ  # left hook
444 n2 ɲ
445 n; ɳ  # R
446 #P2 Ƥ  # in use by control char
447 p2 ƥ
448 Q; Ɋ  # hook tail
449 q; ɋ  # hook tail
450 q2 ʠ  # hook
451 R; Ɽ  # R (tail)
452 r; ɽ
453 s; ʂ  # R
454 T2 Ƭ  # hook
455 t2 ƭ
456 T; Ʈ  # R
457 t; ʈ
458 V2 Ʋ
459 v2 ʋ
460 v; ⱱ
461 W; Ⱳ
462 w; ⱳ
463 Y; Ƴ  # not a hook below, but Y2 hook above is already present
464 y; ƴ
465 Z, Ȥ  # prefer cedilla similarity like F,
466 z, ȥ
467 z; ʐ  # R
468
469 # curls (9 is mostly free because horns are so rare)
470 c9 ɕ
471 d9 ȡ
472 j9 ʝ  # crossed-tail actually
473 l9 ȴ
474 n9 ȵ
475 t9 ȶ
476 v9 ⱴ
477 z9 ʑ
478 #S9 ʆ
479 #Z9 ʓ
480
481 # tone letters
482 #2/ ƻ  # rarely used, and double dash is far more logical
483 %2 Ƨ
484 2% ƨ
485 %6 Ƅ
486 6% ƅ
487 %5 Ƽ
488 5% ƽ
489
490 # turned/inverted (trailing I is uncommon for lowercase, and already used thusly for !I, ?I and NI)
491 AI Ɐ
492 aI ɐ
493 cI ɔ  # open o
494 #EI Ǝ  # would be confusing, as it's not uppercase schwa eI
495 eI ə  # schwa, not turned E (latter is very uncommon)
496 FI Ⅎ  # not a letter
497 fI ⅎ  # idem
498 gI ᵷ
499 hI ɥ
500 iI ᴉ
501 KI Ʞ
502 kI ʞ
503 LI Ꞁ
504 lI ꞁ
505 MI Ɯ
506 mI ɯ
507 #nI ᴎ  # reversed capital N, but NI already in use
508 rI ɹ
509 #RI ᴚ  # conflicts with RI control char
510 TI Ʇ
511 tI ʇ
512 VI Ʌ
513 vI ʌ
514 wI ʍ
515 yI ʎ
516
517 # open/ipa vowels
518 oE ɶ  # Oe also available, but E looks capital
519 ap ɑ  #XXX ao
520 Ap ɒ  #XXX Ao? (AO in use)
521 ep ɛ  #XXX eo
522  # Ɛ  #XXX Eo or EO
523 3p ɜ  #XXX 3o
524 up ʊ  #XXX uo
525  # Ʊ  #XXX Uo or UO
526
527 # ipa (*p)
528 #:> ː  # :p
529 #:< ˑ  # .p -p
530 8p ɞ
531 Ep ɘ
532 op ɵ
533 Op ɤ  #XXX oy would look alike
534 ?p ʕ
535 ww ʬ
536 gp ɡ
537 #lp ɬ  #XXX: lb for 'belt'
538 jp ɟ
539 lz ɮ  #XXX
540 r2 ɾ  #XXX: fishhook
541 Jp ʄ
542 Gp ɣ
543 rl ɼ
544 rL ɺ
545 rp ɻ
546 Rp ʁ
547 mL ɰ  # like rL (XXX mp?)
548
549 # small caps (*c)
550 bc ʙ
551 gc ɢ
552 hc ʜ
553 ic ɪ
554 lc ʟ
555 nc ɴ
556 rc ʀ
557 yc ʏ
558 # more from phonetics extensions
559 ac ᴀ
560 cc ᴄ
561 dc ᴅ
562 ec ᴇ
563 fc ꜰ
564 jc ᴊ
565 kc ᴋ
566 mc ᴍ
567 oc ᴏ
568 pc ᴘ
569 tc ᴛ
570 sC ꜱ  # sc/Sc/SC in use
571 uc ᴜ
572 vc ᴠ
573 wc ᴡ
574 zc ᴢ
575
576 # hangeul jamo consonants at *J
577 gJ ㄱ
578 GJ ㄲ
579 xJ ㄳ
580 nJ ㄴ
581 dJ ㄷ
582 DJ ㄸ
583 rJ ㄹ
584 mJ ㅁ
585 bJ ㅂ
586 BJ ㅃ
587 sJ ㅅ
588 SJ ㅆ
589 0J ㅇ
590 jJ ㅈ
591 JJ ㅉ
592 cJ ㅊ
593 kJ ㅋ
594 tJ ㅌ
595 pJ ㅍ
596 hJ ㅎ
597
598 # hangeul jamo vowels at *J
599 aJ ㅏ
600 AJ ㅐ
601 eJ ㅓ
602 EJ ㅔ
603 oJ ㅗ
604 OJ ㅚ
605 uJ ㅜ
606 UJ ㅝ
607 iJ ㅣ
608 vJ ㅝ
609 VJ ㅞ
610 wJ ㅘ
611 WJ ㅙ
612 yJ ㅑ
613 YJ ㅒ
614 -J ㅡ  # qJ?
615 +J ㅢ  # QJ?
616
617 # hangeul jamo iotized vowels at *K (for Korean)
618 uK ㅠ
619 UK ㆌ
620 oK ㅛ
621 eK ㅕ
622 EK ㅖ
623
624 # eastern arabic digits (0a-9a are persian variants)
625 1A ١
626 2A ٢
627 3A ٣
628 4A ٤
629 5A ٥
630 6A ٦
631 7A ٧
632 8A ٨
633 9A ٩
634 0A ٠
635
636 # common formatting control
637 ZS ​  # ZWSP; capitals like other Cc
638 ZN ‌  # ZWNJ;                           less obvious alt: 'Z
639 ZW ‍  # ZWJ; ZJ somewhy used for tsadi; less obvious alt: "Z
640 LR ‎  # LRM
641 RL ‏  # RLM; keep rl for ɼ
642
643 ###
644 # under development or temporary
645
646 # incompatible
647 $PR ► # current PR should be TR
648 $PL ◄ # current PL should be TL
649 $XX ✘ # current XX should be xx
650 $OK ✔ # current OK should be ok
651 $'> ˆ # where to put ^?
652 $'? ˜ # where to put ~?
653 $?' ΄ # tonos
654 $?" ΅ # tonos+dialytika
655 $!: ῏ # psili+peris
656 $?, ῞ # dasia+oxia
657 $,! ῝ # dasia+varia
658 $,' ῾ # dasia
659 $;! ῍ # psili+varia
660 $;' ᾿ # psili
661 $?: ῟ # dasia+peris
662 $?; ῎ # psili+oxia
663
664 # undecided
665 $!D ‼ # !! in use
666 $<> ♦
667 $ud ↨ # UD with base
668 $FS   # figure space
669 $!o ϕ # Ph?
670 $D= ₯
671 $vv װ
672 $vy ױ
673 $yy ײ
674 $g1 ׳
675 $g2 ״
676
677 # rfc (incorrectly?) maps double to heavy
678 $vL ╡
679 $Vl ╢
680 $Dl ╖
681 $dL ╕
682 $VL ╣
683 $VV ║
684 $DL ╗
685 $UL ╝
686 $Ul ╜
687 $uL ╛
688 $vR ╞
689 $Vr ╟
690 $UR ╚
691 $DR ╔
692 $UH ╩
693 $DH ╦
694 $VR ╠
695 $HH ═
696 $VH ╬
697 $uH ╧
698 $Uh ╨
699 $dH ╤
700 $Dh ╥
701 $Ur ╙
702 $uR ╘
703 $dR ╒
704 $Dr ╓
705 $Vh ╫
706 $vH ╪
707