digraphs: distinguishing class for rfc-only in include
[sheet.git] / shiar.inc.txt
1 # common meaning of second character
2         !       Grave
3         "       Double acute accent
4         '       Acute accent
5         (       Breve
6         ) +?    Inverted Breve
7         ,       Cedilla
8         -       Macron
9         .       Dot Above
10         /       Stroke
11         0       Ring above
12         2       Hook
13         8 +?    Double Grave
14         9       Horn
15         9 +     Curl
16         :       Diaeresis
17         ;       Ogonek (+Retroflex Hook/Tail)
18         <       Caron
19         >       Circumflex accent
20         ?       Tilde
21         _       Line below
22         c +     Smallcaps
23         I +     Turned
24         S       Superscript
25         s       Subscript
26
27         =       Cyrillic
28         *       Greek
29         %       Greek/Cyrillic special
30         +       lc: Arabic, uc: Hebrew
31         3       some Latin/Greek/Cyrillic letters
32         4       Bopomofo
33         5       Hiragana (also lc + a/e/i/o/u)
34         6       Katakana (also uc + a/e/i/o/u)
35         J +     Korean Jamo (also K)
36         p +     IPA extensions
37
38 # common first character
39         "       combining diacritic
40         '       spacing diacritic
41         R       square
42
43
44 # currency
45 #=e €  # in vim
46 #Eu €  # in zsh and vim
47 =B ฿  # more like B/, but prefer that for diacritical letter
48 =d ₫
49 =g ₴  # derived from cursive g= (soundalike h= or lookalike 2= seem bad options)
50 =L ₺
51 =N ₦
52 #=P ₽  # in vim
53 =p ₱  # =P conflicts with vim alternative for ruble
54 =R ₹  # conflicts with vim alternative for ruble
55 =t ₮
56 K/ ₭
57 Rs ₨
58 Sq ₪
59 m/ ₥
60
61 # useful characters
62 3: …  # opposite of ⋮ (more logical would be to swap with .3 ⋯)
63 .> ‣  # similar to .=
64 (/ ⊄  # similar to (_
65 )/ ⊅  # similar to )_
66 (+ ∉  # (- with stroke
67 +) ∌  # -) with stroke
68 0X ⊗  # *X like 0.
69 +0 ⊕  # 0+ already in use
70 0/ ⊘
71 0- ⊖
72 0* ⊛  #XXX alternatively ⍟
73 0: ⨸
74 0% ⦼  # no circled percent, but close
75 0< ⧀
76 0= ⊜
77 0> ⧁
78 0! ⦶  # no circled exclamation mark
79 .1 ․  # obvious location, even though ‥ and … are at inconsistent .. and 3:
80 ** ⁑
81 *3 ⁂
82
83 # xorg compatibility
84 .= •  # previously ()
85 <3 ♥  # rfc has trigraph cH-
86 :) ☺  # easy alias to 0u
87 :( ☹
88 FU 🖕  # common abbreviation for middle finger
89 #88 ∞  # alias to 00
90 #v/ √  # alias to RT
91 !? ‽  # previously ?!
92 ?! ⸘
93 fs ſ  # previously sl
94
95 # obvious line drawing gaps
96 ll ╴
97 rr ╶
98 uu ╵
99 dD ╷  # goddamn! stupid arabic dad got there first
100 LL ╸
101 RR ╺
102 UU ╹
103 DD ╻
104 Hh ╾
105 hH ╼
106 Vv ╿
107 vV ╽
108 2- ╌  # exactly like to 3 and 4
109 2_ ╍
110 2! ╎
111 2/ ╏
112 BF ╳  # FD and BD combined; FB already in use
113
114 # additional letters
115 HW Ƕ  # HV conflicts with vh line drawing
116 hw ƕ
117 db ȸ
118 qp ȹ
119 # old/middle english (uncommon)
120 WY Ƿ  # replaced by UU, later W
121 wy ƿ
122 YG Ȝ  # g-derived Y
123 yg ȝ
124 # common ipa
125 S1 Ʃ  # can't use SH or ES
126 s1 ʃ  # can't use sh; keep es for subscript
127 ?. ʔ
128 ?/ ʡ
129 # clicks
130 !C ǀ  # corresponding zulu letter
131 !Q ǃ  # idem; !. for lookalike (previously ʗ)
132 !X ǁ  # idem; !/ for lookalike (previously ʖ)
133 !A ǂ  # Alveolar; !- looks alike, != even more so but already occupied
134 !B ʘ  # Bilabial
135 !R ‼  # Retroflex (or Repeated); !! looks alike but occupied
136 # grave (or similar)
137 R! Ȑ  # no R-grave; double down
138 r! ȑ
139 S! Ș  # no S-grave; comma in use for cedilla, so misusing grave seems only fair
140 s! ș
141 T! Ț  # no T-grave; like S!
142 t! ț
143
144 # subscripts
145 as ₐ
146 #es ₑ  #TODO: move esh
147 @s ₔ
148 hs ₕ
149 is ᵢ
150 js ⱼ
151 ks ₖ
152 ls ₗ
153 ms ₘ
154 ns ₙ
155 os ₒ
156 ps ₚ
157 rs ᵣ
158 Ss ₛ  # ss is ß
159 #ts ₜ  # both ts and Ts in use for Ћ
160 us ᵤ
161 vs ᵥ
162 xs ₓ
163
164 # superscripts (modifier letters)
165 AS ᵃ  # alef was first for aS
166 bS ᵇ
167 CS ᶜ  # cS is ♠
168 dS ᵈ
169 eS ᵉ
170 #fS ᶠ  # both fS and FS in use
171 gS ᵍ
172 hS ʰ  # ipa release
173 iS ⁱ
174 jS ʲ  # ipa release
175 kS ᵏ
176 lS ˡ  # ipa release
177 mS ᵐ
178 #nS ⁿ  # already present
179 oS ᵒ
180 pS ᵖ
181 rS ʳ
182 sS ˢ
183 tS ᵗ
184 uS ᵘ
185 vS ᵛ
186 wS ʷ  # ipa release
187 xS ˣ
188 yS ʸ
189 zS ᶻ
190
191 # capital superscripts; avoid as most *S are in use
192 #AS ᴬ
193 ##BS ᴮ
194 ##DS ᴰ
195 ##ES ᴱ
196 ##GS ᴳ
197 ##HS ᴴ
198 ##IS ᴵ
199 #JS ᴶ
200 #KS ᴷ
201 #LS ᴸ
202 #MS ᴹ
203 ##NS ᴺ
204 ##OS ᴼ
205 #PS ᴾ
206 ##RS ᴿ
207 ##TS ᵀ
208 ##US ᵁ
209 ##VS ⱽ
210 #WS ᵂ
211
212 # expected but missing
213 A. Ȧ
214 a. ȧ
215 #A0 Ǻ  # normal A-ring already provided by AA
216 #a0 ǻ
217 H< Ȟ
218 h< ȟ
219 j. ȷ
220 O. Ȯ
221 o. ȯ
222 N! Ǹ
223 n! ǹ
224 Y- Ȳ  # conflicts with vim alternative for yen
225 y- ȳ
226 'i ͺ # spacing iota subscript (like "i for combining)
227 =v ⇓
228 =! ⇑
229 Ac ℀  # prefer common A-smallcap for ac
230 As ℁  # prefer common a-subscript for as
231 cu ℆  # co ís present though
232 1/ ⅟
233 03 ↉
234 17 ⅐
235 19 ⅑
236 10 ⅒
237
238 # relocate
239 a" ǟ  # a1 # long umlauted, very similar to double acute
240 A" Ǟ  # A1
241 jo ё  # io # consistent with ja/ju
242 JO Ё  # IO
243 ji ї  # yi # idem
244 JI Ї  # YI
245 Z1 Ʒ  # ED # doesn't make sense, put it with S1
246 z1 ʒ  # ed # not in vim
247 =Y ¥  # Ye # also Y- in vim
248
249 # bars and strokes
250 A/ Ⱥ
251 a/ ⱥ
252 B/ Ƀ
253 B- Ƃ
254 b- ƃ
255 b/ ƀ
256 C/ Ȼ
257 c/ ȼ
258 E/ Ɇ
259 e/ ɇ
260 F/ Ꞙ
261 f/ ꞙ
262 I/ Ɨ
263 i/ ɨ
264 J/ Ɉ
265 j/ ɉ
266 L- Ƚ
267 l- ƚ  # not really a macron, but wouldn't really make sense anyway otherwise
268 l? ɫ  # idem
269 L? Ɫ
270 P/ Ᵽ
271 p/ ᵽ
272 R/ Ɍ
273 r/ ɍ
274 U/ Ʉ
275 u/ ʉ
276 Y/ Ɏ
277 y/ ɏ
278
279 # middle tilde  #XXX: not tilde above
280 #b? ᵬ
281 #d? ᵭ
282 #f? ᵮ
283 #m? ᵯ
284 ##n? ᵰ  # already a tilde above
285 #p? ᵱ
286 #r? ᵲ
287 #s? ᵴ
288 #t? ᵵ
289 #z? ᵶ
290
291 # inverted breves
292         # not used all that much, better leave x) free
293 #")
294 #')
295 #A) Ȃ
296 #a) ȃ
297 #E) Ȇ
298 #e) ȇ
299 #I) Ȋ  # )I exists, but should not confuse
300 #i) ȋ
301 #O) Ȏ
302 #o) ȏ
303 #R) Ȓ
304 #r) ȓ
305 #U) Ȗ  # )U exists
306 #u) ȗ
307
308 # double grave
309         # usage is similar to inverted breve, just as rare
310 #"8
311 #'8
312 #A8 Ȁ
313 #a8 ȁ
314 #E8 Ȅ
315 #e8 ȅ
316 #I8 Ȉ
317 #i8 ȉ
318 #O8 Ȍ
319 #o8 ȍ
320 #R8 Ȑ
321 #r8 ȑ
322 #U8 Ȕ
323 #u8 ȕ
324
325 # hooks
326 #"2
327 #'2
328 B2 Ɓ
329 b2 ɓ
330 C2 Ƈ
331 c2 ƈ
332 #D2 Ɗ  # in use by control char
333 d2 ɗ  # hook
334 d; ɖ  # R (tail)
335 D; Ɖ
336 E, Ȩ
337 e, ȩ
338 F, Ƒ  # described as hook, but similar to cedilla
339 f, ƒ  # replaces more specialised f( and Fl, unified nowadays
340 G2 Ɠ
341 g2 ɠ
342 H2 Ɦ  # different hook from lowercase
343 h2 ɦ
344 HG Ꜧ  # similar to NG, distinct from ꞕ ḩ ⱨ
345 hg ꜧ
346 K2 Ƙ
347 k2 ƙ
348 l; ɭ  # R
349 MG Ɱ  # M2 in use
350 mg ɱ  # similar to ng
351 N2 Ɲ  # left hook
352 n2 ɲ
353 n; ɳ  # R
354 #P2 Ƥ  # in use by control char
355 p2 ƥ
356 Q; Ɋ  # hook tail
357 q; ɋ  # hook tail
358 q2 ʠ  # hook
359 R; Ɽ  # R (tail)
360 r; ɽ
361 s; ʂ  # R
362 T2 Ƭ  # hook
363 t2 ƭ
364 T; Ʈ  # R
365 t; ʈ
366 V2 Ʋ
367 v2 ʋ
368 v; ⱱ
369 W; Ⱳ
370 w; ⱳ
371 Y; Ƴ  # not a hook below, but Y2 hook above is already present
372 y; ƴ
373 Z, Ȥ  # prefer cedilla similarity like F,
374 z, ȥ
375 z; ʐ  # R
376
377 # curls (9 is mostly free because horns are so rare)
378 c9 ɕ
379 d9 ȡ
380 j9 ʝ  # crossed-tail actually
381 l9 ȴ
382 n9 ȵ
383 t9 ȶ
384 v9 ⱴ
385 z9 ʑ
386 #S9 ʆ
387 #Z9 ʓ
388
389 # tone letters
390 #2/ ƻ  # rarely used, and double dash is far more logical
391 %2 Ƨ
392 2% ƨ
393 %6 Ƅ
394 6% ƅ
395 %5 Ƽ
396 5% ƽ
397
398 # turned/inverted (trailing I is uncommon for lowercase, and already used thusly for !I, ?I and NI)
399 AI Ɐ
400 aI ɐ
401 cI ɔ  # open o
402 #EI Ǝ  # would be confusing, as it's not uppercase schwa eI
403 eI ə  # schwa, not turned E (latter is very uncommon)
404 FI Ⅎ  # not a letter
405 fI ⅎ  # idem
406 gI ᵷ
407 hI ɥ
408 iI ᴉ
409 KI Ʞ
410 kI ʞ
411 LI Ꞁ
412 lI ꞁ
413 MI Ɯ
414 mI ɯ
415 #nI ᴎ  # reversed capital N, but NI already in use
416 rI ɹ
417 #RI ᴚ  # conflicts with RI control char
418 TI Ʇ
419 tI ʇ
420 VI Ʌ
421 vI ʌ
422 wI ʍ
423 yI ʎ
424
425 # open/ipa vowels
426 oE ɶ  # Oe also available, but E looks capital
427 ap ɑ  #XXX ao
428 Ap ɒ  #XXX Ao? (AO in use)
429 ep ɛ  #XXX eo
430  # Ɛ  #XXX Eo or EO
431 3p ɜ  #XXX 3o
432 up ʊ  #XXX uo
433  # Ʊ  #XXX Uo or UO
434
435 # ipa (*p)
436 #:> ː  # :p
437 #:< ˑ  # .p -p
438 8p ɞ
439 Ep ɘ
440 op ɵ
441 Op ɤ  #XXX oy would look alike
442 ?p ʕ
443 ww ʬ
444 gp ɡ
445 #lp ɬ  #XXX: lb for 'belt'
446 jp ɟ
447 lz ɮ  #XXX
448 r2 ɾ  #XXX: fishhook
449 Jp ʄ
450 Gp ɣ
451 rl ɼ
452 rL ɺ
453 rp ɻ
454 Rp ʁ
455 mL ɰ  # like rL (XXX mp?)
456
457 # small caps (also possible at *s)
458 bc ʙ
459 gc ɢ
460 hc ʜ
461 ic ɪ
462 lc ʟ
463 nc ɴ
464 rc ʀ
465 yc ʏ
466 # more from phonetics extensions
467 ac ᴀ
468 cc ᴄ
469 dc ᴅ
470 ec ᴇ
471 fc ꜰ
472 jc ᴊ
473 kc ᴋ
474 mc ᴍ
475 oc ᴏ
476 pc ᴘ
477 tc ᴛ
478 sC ꜱ  # sc/Sc/SC in use
479 uc ᴜ
480 vc ᴠ
481 wc ᴡ
482 zc ᴢ
483
484 # hangeul jamo consonants at *J
485 gJ ㄱ
486 GJ ㄲ
487 xJ ㄳ
488 nJ ㄴ
489 dJ ㄷ
490 DJ ㄸ
491 rJ ㄹ
492 mJ ㅁ
493 bJ ㅂ
494 BJ ㅃ
495 sJ ㅅ
496 SJ ㅆ
497 0J ㅇ
498 jJ ㅈ
499 JJ ㅉ
500 cJ ㅊ
501 kJ ㅋ
502 tJ ㅌ
503 pJ ㅍ
504 hJ ㅎ
505
506 # hangeul jamo vowels at *J
507 aJ ㅏ
508 AJ ㅐ
509 eJ ㅓ
510 EJ ㅔ
511 oJ ㅗ
512 OJ ㅚ
513 uJ ㅜ
514 UJ ㅝ
515 iJ ㅣ
516 vJ ㅝ
517 VJ ㅞ
518 wJ ㅘ
519 WJ ㅙ
520 yJ ㅑ
521 YJ ㅒ
522 -J ㅡ  # qJ?
523 +J ㅢ  # QJ?
524
525 # hangeul jamo iotized vowels at *K (for Korean)
526 uK ㅠ
527 UK ㆌ
528 oK ㅛ
529 eK ㅕ
530 EK ㅖ
531
532 # common formatting control
533 ZS ​  # ZWSP; capitals like other Cc
534 ZN ‌  # ZWNJ;                           less obvious alt: 'Z
535 ZW ‍  # ZWJ; ZJ somewhy used for tsadi; less obvious alt: "Z
536 LR ‎  # LRM
537 RL ‏  # RLM; keep rl for ɼ
538
539 ###
540 # under development or temporary
541
542 # incompatible
543 $PR ► # current PR should be TR
544 $PL ◄ # current PL should be TL
545 $'> ˆ # where to put ^?
546 $'? ˜ # where to put ~?
547 $?' ΄ # tonos
548 $?" ΅ # tonos+dialytika
549 $!: ῏ # psili+peris
550 $?, ῞ # dasia+oxia
551 $,! ῝ # dasia+varia
552 $,' ῾ # dasia
553 $;! ῍ # psili+varia
554 $;' ᾿ # psili
555 $?: ῟ # dasia+peris
556 $?; ῎ # psili+oxia
557
558 # undecided
559 $!D ‼ # !! in use
560 $<> ♦
561 $ud ↨ # UD with base
562 $FS   # figure space
563 $!o ϕ # Ph?
564 $D= ₯
565 $vv װ
566 $vy ױ
567 $yy ײ
568 $g1 ׳
569 $g2 ״
570
571 # rfc (incorrectly?) maps double to heavy
572 $vL ╡
573 $Vl ╢
574 $Dl ╖
575 $dL ╕
576 $VL ╣
577 $VV ║
578 $DL ╗
579 $UL ╝
580 $Ul ╜
581 $uL ╛
582 $vR ╞
583 $Vr ╟
584 $UR ╚
585 $DR ╔
586 $UH ╩
587 $DH ╦
588 $VR ╠
589 $HH ═
590 $VH ╬
591 $uH ╧
592 $Uh ╨
593 $dH ╤
594 $Dh ╥
595 $Ur ╙
596 $uR ╘
597 $dR ╒
598 $Dr ╓
599 $Vh ╫
600 $vH ╪
601