common line break after ethiopic header
[unicode-sampler.git] / unicode.txt
index 2e38944e7d2db487e67bd16bc700bfeae0d1659c..2ccf1736c58ee3f00fbd1d4079114546abe68c38 100644 (file)
@@ -1,29 +1,39 @@
 Unicode sampler
 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
-Test support of various text encoded with Unicode up to version 8.0 (2015).
+Test support of various text encoded with Unicode up to version 10.0 (2017).
 
 Based on file by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
-Updated by Mischa Poslawsky <http://shiar.nl/> 2015-09-13
+Updated by Mischa Poslawsky <http://shiar.nl/> 2020-03-10
 
 Compact font overview:
 
   ╔══════════════════════════════════════════════════════════════════════╗
-  ║ _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏØṆⱣÞß ΑΒΓΔΩὮ АБВГДЯѢЌ ԱԲԳ ႠႡႢჇ אבגױ ║
-  ║ @abcdefghijklmnopqrstuvwxyz åāčếəøṇᵽþſ αβγδωὦ абвгдяѣќ աբգ აბგჷ ابجݰ ║
-  ║ -0123456789 (/)[\]{|} ^`"'~ «“’”» ,;:.…!¿?‽ •&#§¶†©%‰ −±+*×÷ <>=≠∀∧∅ ║
-  ║ ��¤¢₥$€£¥₹₽ ฿₫֏₭₺₦₩₪ ✂℻☆♥⚐☺☯☹ ☉♀♁♂♉ ✔✘ ○☓□△ ␣⌫⌥⌘↵␀ ¯₁½²√¬∈∞ ↗┌╁╖░█∎ � ║
+  ║ _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏØṆⱣÞß АБВГДЯѢЌ ΑΒΓΔΩὮ ႠႡႢჇ ԱԲԳ אבגױ ║
+  ║ -abcdefghijklmnopqrstuvwxyz åāčếəøṇᵽþſ абвгдяѣќ αβγδωὦ აბგჷ աբգ ابجݰ ║
+  ║ −0123456789 <=>+÷× ¤¢$€¥£元 (/)[\]{|} ,;:.…!¿?‽· ^`'"~ ✔✘☺☹ @#&§¶†©• ║
+  ║ ��½₁²↋ %‰√∞∧¬∈≠≥±∶*∀∅ ฿₺₽₹₩₪ ␣⌫⌥⎇⌘↵␤␀ ☉♀♁♂✂✎☆♥⚐☯∎ «“’”» ○☓□△ ↗┌╁╖░█ � ║
   ╚══════════════════════════════════════════════════════════════════════╝
 
+Unicode blocks:
+          0__ 1__ 2__ 3__ 4__ 5__ 6__ 7__ 8__ 9__ A__ B__ C__ D__ E__ F__
+  U+00*__ A Á Ă Ȁ ɐ ʶ ◌̌ Ω Я Ԙ Ա א ب ݓ ܐ ߐ ࡁ ࢶ क ক ਕ ક କ க క ಕ ക ක ท ລ ཀ
+  U+01*__ က დ ㅎ  አ ፩ ᎃ Ꮳ ᓀ ᙽ     ᚏ ᚠ ᜃ ក ᠦ ᣈ ᤁ ᦂ ᨠ ◌᪱ ᬓ ᯂ᯦ ᰀ Დ ᴂ ᶐ ◌ᷲ Ậ ᾮ
+  U+02*__ ※ ₿⃕ ™ ⇅ √ ⋲ ⌘ ⏻ ␛ Ⓐ ╩ ▛ ◈ ☺ ✈ ⟇ ⟴ ⡽ ⤱ ⦖ ⨖ ⫻ ⬀ ⯒ Ⰳ Ⲁ ⵣ ⷔ ⹋ ⺾⼬
+  U+03-0A ひカㄅ㇂㊥  ㌁  㐀  ䷃ 中    ꊈ꒸ꓯ ꕉ Ꙗ ꚩ Ꜽ Ꞻ ꡀ ꢒ ꤰ ꦏ ꨀ ꪁ ꬰ ꯀ 가
+  U+10*__ 𐀀 𐂛 𐅄 𐇑 𐊀 𐊷 𐌰 𐎠 𐑗 𐒱 𐔀 𐔰 𐘐     𐠎 𐡀 𐢀 𐤀 𐦠 𐩱 𐪑 𐬁 𐭠 𐰢 𐲘 𐴀   𐹠   𐼁 𐿠
+
 Code:
 
   <html><pre><span class=""><!-- H&#x54;M --></span>
 
   Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
 
-  while ((c = *l++) != '\0') { m->stat[2] = IO | (~OK & X_8); }
+  while ((c = *l++) != '\0') { m->stat[2] = IO | (~OK & X_8); } /* C */
 
   perl -pe's/\w/$^ =~ $& > chop($^ = $& . $^) ? "@-" : $&/ge'
 
+  fix$(<$>)<$>(:)<*>((<$>((:[{- hs -}])<$>))(=<<)<$>(*)<$>(>>=)(+)($))$1
+
   ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
 
 Mathematics and sciences:
@@ -40,7 +50,7 @@ Mathematics and sciences:
 
 Proper typography:
 
-  • Lookalikes: 1lI|, 0OD, 8B, 2Z, 5S$
+  • Lookalikes: 1lI|, 0ODØ, 8B, 2Z, 5S$, AАΑꓮᎪ𝖠𖽀
   • “It’s ‘quoted’”, „deutsche ‚Gänsefüßchen‘“, « guillemets ‹comme ci› »
   • u + ¨ + ´ = ǘ, o + ~ + ¯ = ȭ, e + ^ + ` = ề, e + ¸ + ˘ = ḝ
   • 1 + 2 − 3 × 4 ÷ 5 ≈ 0–1‰ — 0° 21′ 36″
@@ -50,16 +60,16 @@ Proper typography:
 English panphone (traditional, IPA, Shavian, Braille):
 
   Just as the French queen looked for it, she heard that symphony again.
-  A beige hue on the waters of the loch impressed all, including young Arthur.
+  A beige hue of the loch water impressed all, including young Arthur.
 
   ʤʌst æz ðə fɹɛnʧ kʰʍin lʊk̚t fo ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈgɛn
-  ə beʒ çʉ ��n ðə ˈwɔt̠ɚz əv ðə lɒχ ɪmˈpʰɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jɐŋ ˈɑɹθɚ
+  ə beʒ çʉ ��v ðə lɒχ ˈwɔt̠ɚ ɪmˈpʰɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jɐŋ ˈɑɹθɝ
 
   𐑡𐑳𐑕𐑑 𐑨𐑟 𐑞 𐑓𐑮𐑧𐑯𐑗 𐑒𐑢𐑰𐑯 𐑤𐑫𐑒𐑑 𐑓 𐑦𐑑, 𐑖𐑰 𐑣𐑽𐑛 𐑞𐑨𐑑 𐑕𐑦𐑥𐑓𐑩𐑯𐑰 𐑩𐑜𐑧𐑯.
-  𐑩 𐑚𐑱𐑠 𐑣𐑿 ��𐑯 𐑞 𐑢𐑷𐑑𐑼𐑟 𐑝 𐑞 𐑤𐑪𐑒 𐑦𐑥𐑐𐑮𐑧𐑕𐑑 𐑷𐑤, 𐑦𐑙𐑒𐑤𐑵𐑛𐑦𐑙 𐑘𐑳𐑙 ·𐑸𐑔𐑻.
+  𐑩 𐑚𐑱𐑠 𐑣𐑿 �� 𐑞 𐑤𐑪𐑒 𐑢𐑷𐑑𐑼 𐑦𐑥𐑐𐑮𐑧𐑕𐑑 𐑷𐑤, 𐑦𐑙𐑒𐑤𐑵𐑛𐑦𐑙 𐑘𐑳𐑙 ·𐑸𐑔𐑻.
 
   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
-  ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀��⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
+  ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀��⠀⠮⠀⠇⠕⠡⠀⠺⠁⠞⠻⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
 
 Ænglisc Ōhthere & Ƿulfstān:
 
@@ -72,7 +82,7 @@ Precomposed and combining diacritics:
   Muļķa hipiji mēģina nogaršot žņaudzējčūsku. Trâu chậm uống nước đục.
   Mul̦k̦a hipiji mēg̓ina nogaršot žn̦audzējčūsku. Trâu chậm uống nước đục.
 
-  STARGɅ̊TE, a = v̇ = r̈, a⃑ ⊥ b⃑
+  STARGɅ̊TE • a = v̇ = r̈, a⃑ ⊥ b⃑ • 1̴·2⃯⃗·3̶̮̑·4̣̤̇̈·5⃘̜̹͑͗ • Z̴͔̎a̷̤̲̙̟̼̯͑̌̈́̎͋͟l̸̮̲͉̪͆̿̉̐͆͛̈͊͘͟͜͡ģ̸̖̬̘̈͛̂̄̃̚͟ǫ̸̨̨̠͕̤̫̜̩̟̋͌̔͐͑̈́̉͑!͓͇̠͈̬̪̇̂̎̎̒͘̕͠͝
 
 Pangrams:
 
@@ -92,7 +102,7 @@ Pangrams:
   se: Vuol Ruoŧa geđggiid leat máŋga luosa ja čuovžža.
   sk: Päťtýždňové vĺčatá nervózne štekajú na môjho ďatľa v tŕní.
   tr: PİJAMALİ HASTA, yağız şoföre çabucak güvendi.
-  vt: Do bạch kim rất quý, sẽ để lắp vô xương.
+  vt: Do bạch kim rất quý, sẽ để lắp vô xương.  Bất ₫ồng [ˀɓɜt̚˧˦.ˀɗɜ̤wŋ͡m˨˩]
   yo: Ìwò̩fà ń yò̩ séji tó gbojúmó̩, ó hàn pákànpò̩ gan-an nis̩é̩ rè̩ bó dò̩la.
 
 German with presentational ligatures:
@@ -114,6 +124,11 @@ Ancient Greek Iliad:
   ϙύνεσσιν οἰωνοῖσί τε πᾶσι· Διὸς δ᾽ ἐτελείετο βουλή· ἐξ οὗ δὴ τὰ πρῶτα
   διαστήτην ἐρίσαντε Ἀτρεΐδης τε ϝάναξ ἀνδρῶν καὶ δῑος Ἀχιλλεύς.
 
+Coptic:
+
+  ⲕⲧ̅ⲕⲁ ⲅⲉⲗⲅⲟ̅ⲥⲛ ⲓ̈ⲏ̅ⲥⲟⲩⲥⲓ ⲛⲁⳡⲁⲛ ⲧⲣⲓⲕⲁ• ⲇⲟⲗⲗⲉ ⲡⲟⲗⲅⲁⲣⲁ ⲡⲉⲥⲥⲛⲁ• ⲡⲁⲡⲟ ⲥ̅ⲕⲟⲉⲗⲙ̅ⲙⲉ ⲉⲕ̅ⲕⲁ
+  κτ̄κα γελγελο̄ϲουανον ῑη̄ϲουϲι ναϫαν τρικα• δολλε πολγαρα πεϲϲνα• παπο ϲ̄κοελμ̄με εκ̄κα
+
 Georgian:
 
   ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
@@ -165,6 +180,7 @@ Zarka Table (Torah cantillation):
   מְהֻפָּ֤ךְ פַּשְׁטָא֙ זָקֵף־קָטָ֔ן טִפְחָ֖א אַתְנָ֑ח דַּרְגָּ֧א תְּבִ֛יר טִפְחָ֖א מֵרְכָ֥א סִלּֽוּק׃
 
 Ethiopic (Amharic, Blin, Sebatbeit):
+
   ዩኒኮድ ለእያንዳንዱ ፊደል፣       ዩኒኮድ ላፍደልድክ፡       ዩኒኮድ እንም ኤነት ፊደል፤
   ማንኛውም ዓይነት ኮምፒውተር ቢሆን፣  ኣኻ ኮምፕዩተርልክ ኣኽን፡   ሟኒም ኤነት ኮምፒተር ቢኸር፤
   ማንኛውም ዓይነት ፕሮግራም ቢሆን፣   ኣኻ ፕሮግራምልክ ኣኽን፡    ሟኒም ኤነት ይቾቺቃር ቢኸር፤
@@ -277,6 +293,8 @@ Japanese Iroha:
   浅き夢見じ   あさきゆめみし   アサキユメミジ   アサキユメミジ   阿佐伎喩女美之
   酔ひもせず   ゑひもせす     ヱヒモセズン    ウェヒモセズン   恵比毛勢須
 
+  hentaigana 変体仮名: 𛀆𛄆𛂦𛂌𛃀𛂶𛁻 𛁦𛃶𛂏𛃸𛄚 𛄋𛀙𛃫𛁟𛄀𛁚 𛁩𛂒𛂄𛃭𛃑
+
 Chinese:
 
   ‣ Most common characters:
@@ -297,6 +315,11 @@ Chinese:
   律   • ㄌㄩˋ  lǜ   /ly˥˩/  • leot⁶ /løt̚˨/
   驢/驴 • ㄌㄩˊ  lǘ   /ly˧˥/  • leoi⁴ /løy˨˩/
 
+Alternate English (Deseret):
+
+  𐐖𐐲𐑅𐐻 𐐰𐑆 𐑄 𐐙𐑉𐐯𐑌𐐽 𐐿𐐶𐐨𐑌 𐑊𐐳𐐿𐐼 𐑁𐐫𐑉 𐐮𐐻, 𐑇𐐨 𐐸𐐲𐑉𐐼 𐑄𐐰𐐻 𐑅𐐮𐑋𐑁𐐲𐑌𐐨 𐐰𐑀𐐯𐑌.
+  𐐂 𐐺𐐩𐑈 𐐸𐑏 𐐱𐑂 𐑄 𐑊𐐪𐐿 𐐶𐐫𐐻𐐲𐑉 𐐮𐑋𐐹𐑉𐐯𐑅𐐼 𐐫𐑊, 𐐮𐑌𐐿𐑊𐐭𐐼𐐮𐑍 𐐷𐐲𐑍 𐐂𐑉𐑃𐑉.
+
 Box drawing alignment tests:
 
   ┌┬───╥┐  ╒══╤══╕  ┏━━┳━━┓  ┎┒┏┑ ╻╷  ┌╌╌┄┄┈┒  ▏   ▁▂▃▄▅▆▇█▓▓▒▒░░