common line break after ethiopic header
[unicode-sampler.git] / unicode.txt
index 770e629a3c1c53c52fdb416f4ac10bbaf2ec36fd..2ccf1736c58ee3f00fbd1d4079114546abe68c38 100644 (file)
@@ -1,9 +1,9 @@
 Unicode sampler
 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
-Test support of various text encoded with Unicode up to version 8.0 (2015).
+Test support of various text encoded with Unicode up to version 10.0 (2017).
 
 Based on file by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
-Updated by Mischa Poslawsky <http://shiar.nl/> 2015-09-13
+Updated by Mischa Poslawsky <http://shiar.nl/> 2020-03-10
 
 Compact font overview:
 
@@ -11,19 +11,29 @@ Compact font overview:
   ║ _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏØṆⱣÞß АБВГДЯѢЌ ΑΒΓΔΩὮ ႠႡႢჇ ԱԲԳ אבגױ ║
   ║ -abcdefghijklmnopqrstuvwxyz åāčếəøṇᵽþſ абвгдяѣќ αβγδωὦ აბგჷ աբգ ابجݰ ║
   ║ −0123456789 <=>+÷× ¤¢$€¥£元 (/)[\]{|} ,;:.…!¿?‽· ^`'"~ ✔✘☺☹ @#&§¶†©• ║
-  ║ ¯½₁²↋ %‰√∞∧¬∈≠≥±∶*∀∅ ฿₺₽₹₩₪ ␣⌫⌥���↵␀    ☉♀♁♂✂☆♥⚐☯∎ «“’”» ○☓□△ ↗┌╁╖░█ � ║
+  ║ ¯½₁²↋ %‰√∞∧¬∈≠≥±∶*∀∅ ฿₺₽₹₩₪ ␣⌫⌥���⌘↵␤␀ ☉♀♁♂✂✎☆♥⚐☯∎ «“’”» ○☓□△ ↗┌╁╖░█ � ║
   ╚══════════════════════════════════════════════════════════════════════╝
 
+Unicode blocks:
+          0__ 1__ 2__ 3__ 4__ 5__ 6__ 7__ 8__ 9__ A__ B__ C__ D__ E__ F__
+  U+00*__ A Á Ă Ȁ ɐ ʶ ◌̌ Ω Я Ԙ Ա א ب ݓ ܐ ߐ ࡁ ࢶ क ক ਕ ક କ க క ಕ ക ක ท ລ ཀ
+  U+01*__ က დ ㅎ  አ ፩ ᎃ Ꮳ ᓀ ᙽ     ᚏ ᚠ ᜃ ក ᠦ ᣈ ᤁ ᦂ ᨠ ◌᪱ ᬓ ᯂ᯦ ᰀ Დ ᴂ ᶐ ◌ᷲ Ậ ᾮ
+  U+02*__ ※ ₿⃕ ™ ⇅ √ ⋲ ⌘ ⏻ ␛ Ⓐ ╩ ▛ ◈ ☺ ✈ ⟇ ⟴ ⡽ ⤱ ⦖ ⨖ ⫻ ⬀ ⯒ Ⰳ Ⲁ ⵣ ⷔ ⹋ ⺾⼬
+  U+03-0A ひカㄅ㇂㊥  ㌁  㐀  ䷃ 中    ꊈ꒸ꓯ ꕉ Ꙗ ꚩ Ꜽ Ꞻ ꡀ ꢒ ꤰ ꦏ ꨀ ꪁ ꬰ ꯀ 가
+  U+10*__ 𐀀 𐂛 𐅄 𐇑 𐊀 𐊷 𐌰 𐎠 𐑗 𐒱 𐔀 𐔰 𐘐     𐠎 𐡀 𐢀 𐤀 𐦠 𐩱 𐪑 𐬁 𐭠 𐰢 𐲘 𐴀   𐹠   𐼁 𐿠
+
 Code:
 
   <html><pre><span class=""><!-- H&#x54;M --></span>
 
   Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
 
-  while ((c = *l++) != '\0') { m->stat[2] = IO | (~OK & X_8); }
+  while ((c = *l++) != '\0') { m->stat[2] = IO | (~OK & X_8); } /* C */
 
   perl -pe's/\w/$^ =~ $& > chop($^ = $& . $^) ? "@-" : $&/ge'
 
+  fix$(<$>)<$>(:)<*>((<$>((:[{- hs -}])<$>))(=<<)<$>(*)<$>(>>=)(+)($))$1
+
   ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
 
 Mathematics and sciences:
@@ -40,7 +50,7 @@ Mathematics and sciences:
 
 Proper typography:
 
-  • Lookalikes: 1lI|, 0OD, 8B, 2Z, 5S$
+  • Lookalikes: 1lI|, 0ODØ, 8B, 2Z, 5S$, AАΑꓮᎪ𝖠𖽀
   • “It’s ‘quoted’”, „deutsche ‚Gänsefüßchen‘“, « guillemets ‹comme ci› »
   • u + ¨ + ´ = ǘ, o + ~ + ¯ = ȭ, e + ^ + ` = ề, e + ¸ + ˘ = ḝ
   • 1 + 2 − 3 × 4 ÷ 5 ≈ 0–1‰ — 0° 21′ 36″
@@ -50,16 +60,16 @@ Proper typography:
 English panphone (traditional, IPA, Shavian, Braille):
 
   Just as the French queen looked for it, she heard that symphony again.
-  A beige hue on the waters of the loch impressed all, including young Arthur.
+  A beige hue of the loch water impressed all, including young Arthur.
 
   ʤʌst æz ðə fɹɛnʧ kʰʍin lʊk̚t fo ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈgɛn
-  ə beʒ çʉ ��n ðə ˈwɔt̠ɚz əv ðə lɒχ ɪmˈpʰɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jɐŋ ˈɑɹθɚ
+  ə beʒ çʉ ��v ðə lɒχ ˈwɔt̠ɚ ɪmˈpʰɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jɐŋ ˈɑɹθɝ
 
   𐑡𐑳𐑕𐑑 𐑨𐑟 𐑞 𐑓𐑮𐑧𐑯𐑗 𐑒𐑢𐑰𐑯 𐑤𐑫𐑒𐑑 𐑓 𐑦𐑑, 𐑖𐑰 𐑣𐑽𐑛 𐑞𐑨𐑑 𐑕𐑦𐑥𐑓𐑩𐑯𐑰 𐑩𐑜𐑧𐑯.
-  𐑩 𐑚𐑱𐑠 𐑣𐑿 ��𐑯 𐑞 𐑢𐑷𐑑𐑼𐑟 𐑝 𐑞 𐑤𐑪𐑒 𐑦𐑥𐑐𐑮𐑧𐑕𐑑 𐑷𐑤, 𐑦𐑙𐑒𐑤𐑵𐑛𐑦𐑙 𐑘𐑳𐑙 ·𐑸𐑔𐑻.
+  𐑩 𐑚𐑱𐑠 𐑣𐑿 �� 𐑞 𐑤𐑪𐑒 𐑢𐑷𐑑𐑼 𐑦𐑥𐑐𐑮𐑧𐑕𐑑 𐑷𐑤, 𐑦𐑙𐑒𐑤𐑵𐑛𐑦𐑙 𐑘𐑳𐑙 ·𐑸𐑔𐑻.
 
   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
-  ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀��⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
+  ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀��⠀⠮⠀⠇⠕⠡⠀⠺⠁⠞⠻⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
 
 Ænglisc Ōhthere & Ƿulfstān:
 
@@ -72,7 +82,7 @@ Precomposed and combining diacritics:
   Muļķa hipiji mēģina nogaršot žņaudzējčūsku. Trâu chậm uống nước đục.
   Mul̦k̦a hipiji mēg̓ina nogaršot žn̦audzējčūsku. Trâu chậm uống nước đục.
 
-  STARGɅ̊TE • a = v̇ = r̈, a⃑ ⊥ b⃑ • 1̴·2⃯⃗·3̶̮̑·4̣̤̇̈·5⃘̜̹͑͗
+  STARGɅ̊TE • a = v̇ = r̈, a⃑ ⊥ b⃑ • 1̴·2⃯⃗·3̶̮̑·4̣̤̇̈·5⃘̜̹͑͗ • Z̴͔̎a̷̤̲̙̟̼̯͑̌̈́̎͋͟l̸̮̲͉̪͆̿̉̐͆͛̈͊͘͟͜͡ģ̸̖̬̘̈͛̂̄̃̚͟ǫ̸̨̨̠͕̤̫̜̩̟̋͌̔͐͑̈́̉͑!͓͇̠͈̬̪̇̂̎̎̒͘̕͠͝
 
 Pangrams:
 
@@ -100,10 +110,6 @@ German with presentational ligatures:
   Im finſteren Jagdſchloß am offenen Felsquellwaſſer patzte der affig‐flatterhafte
   kauzig‐höf‌liche Bäcker über ſeinem verſifften kniffligen C‐Xylophon.
 
-Common homographs:
-
-  AΑАᎪꓮ𝖠𖽀 OΟОՕⲞס߀Ჿꓳ𐐄𐊒𐊫𐌏ዐ𐓂᠐ꢝ𐰗𖫩ⵔ𖩠0𝙾○ㆁ꒨
-
 Modern Greek Ύμνος εις την Ελευθερίαν:
 
   Σε γνωρίζω από την κόψη του σπαθιού την τρομερή,
@@ -173,11 +179,8 @@ Zarka Table (Torah cantillation):
   זַרְקָא֮ סְגוֹלְתָּא֒ מוּנַח־לְגַרְמֵ֣הּ׀ מוּנַ֣ח רְבִ֗יעַ פָּזֵר־קָטָ֡ן תְּלִישָׁא־גְ֠דוֹלָה תְּלִישָׁא־קְטַנָה֩ אַזְלָ֨א גֶּ֜רֶשׁ
   מְהֻפָּ֤ךְ פַּשְׁטָא֙ זָקֵף־קָטָ֔ן טִפְחָ֖א אַתְנָ֑ח דַּרְגָּ֧א תְּבִ֛יר טִפְחָ֖א מֵרְכָ֥א סִלּֽוּק׃
 
-Zalgo text:
-
-  T̫̺̳o̬̜ ì̬͎̲̟nv̖̗̻̣̹̕o͖̗̠̜̤k͍͚̹͖̼e̦̗̪͍̪͍ ̬ͅt̕h̠͙̮͕͓e̱̜̗͙̭ ̥͔̫͙̪͍̣͝ḥi̼̦͈̼v҉̩̟͚̞͎e͈̟̻͙̦̤-m̷̘̝̱í͚̞̦̳n̝̲̯̙̮͞d̴̺̦͕̫ ̗̭̘͎͖r̞͎̜̜͖͎̫͢ep͇r̝̯̝͖͉͎̺e̴s̥e̵̖̳͉͍̩̗n̢͓̪͕̜̰̠̦t̺̞̰i͟n҉̮̦̖̟g̮͍̱̻͍̜̳ ̳c̖̮̙̣̰̠̩h̷̗͍̖͙̭͇͈a̧͎̯̹̲̺̫ó̭̞̜̣̯͕s̶̤̮̩̘.̨̻̪̖͔ ̳̭̦̭̭̦̞́I̠͍̮n͇̹̪̬v̴͖̭̗̖o̸k҉̬̤͓͚̠͍i͜n̛̩̹͉̘̹g͙ ̠̥ͅt̰͖͞h̫̼̪e̟̩̝ ̭̠̲̫͔fe̤͇̝̱e͖̮̠̹̭͖͕l͖̲̘͖̠̪i̢̖͎̮̗̯͓̩n̸̰g̙̱̘̗͚̬ͅ ͍o͍͍̩̮͢f̖͓̦̥ ̘͘c̵̫̱̗͚͓̦h͝a̝͍͍̳̣͖͉o͙̟s̤̞.̙̝̭̣̳̼͟
-
 Ethiopic (Amharic, Blin, Sebatbeit):
+
   ዩኒኮድ ለእያንዳንዱ ፊደል፣       ዩኒኮድ ላፍደልድክ፡       ዩኒኮድ እንም ኤነት ፊደል፤
   ማንኛውም ዓይነት ኮምፒውተር ቢሆን፣  ኣኻ ኮምፕዩተርልክ ኣኽን፡   ሟኒም ኤነት ኮምፒተር ቢኸር፤
   ማንኛውም ዓይነት ፕሮግራም ቢሆን፣   ኣኻ ፕሮግራምልክ ኣኽን፡    ሟኒም ኤነት ይቾቺቃር ቢኸር፤
@@ -290,6 +293,8 @@ Japanese Iroha:
   浅き夢見じ   あさきゆめみし   アサキユメミジ   アサキユメミジ   阿佐伎喩女美之
   酔ひもせず   ゑひもせす     ヱヒモセズン    ウェヒモセズン   恵比毛勢須
 
+  hentaigana 変体仮名: 𛀆𛄆𛂦𛂌𛃀𛂶𛁻 𛁦𛃶𛂏𛃸𛄚 𛄋𛀙𛃫𛁟𛄀𛁚 𛁩𛂒𛂄𛃭𛃑
+
 Chinese:
 
   ‣ Most common characters:
@@ -310,6 +315,11 @@ Chinese:
   律   • ㄌㄩˋ  lǜ   /ly˥˩/  • leot⁶ /løt̚˨/
   驢/驴 • ㄌㄩˊ  lǘ   /ly˧˥/  • leoi⁴ /løy˨˩/
 
+Alternate English (Deseret):
+
+  𐐖𐐲𐑅𐐻 𐐰𐑆 𐑄 𐐙𐑉𐐯𐑌𐐽 𐐿𐐶𐐨𐑌 𐑊𐐳𐐿𐐼 𐑁𐐫𐑉 𐐮𐐻, 𐑇𐐨 𐐸𐐲𐑉𐐼 𐑄𐐰𐐻 𐑅𐐮𐑋𐑁𐐲𐑌𐐨 𐐰𐑀𐐯𐑌.
+  𐐂 𐐺𐐩𐑈 𐐸𐑏 𐐱𐑂 𐑄 𐑊𐐪𐐿 𐐶𐐫𐐻𐐲𐑉 𐐮𐑋𐐹𐑉𐐯𐑅𐐼 𐐫𐑊, 𐐮𐑌𐐿𐑊𐐭𐐼𐐮𐑍 𐐷𐐲𐑍 𐐂𐑉𐑃𐑉.
+
 Box drawing alignment tests:
 
   ┌┬───╥┐  ╒══╤══╕  ┏━━┳━━┓  ┎┒┏┑ ╻╷  ┌╌╌┄┄┈┒  ▏   ▁▂▃▄▅▆▇█▓▓▒▒░░