reorder languages to transition from semitic to indic
[unicode-sampler.git] / unicode.txt
index 4ce5977ff78410a1e04b03eeda803809a208dbaa..c020963feac5f76d0962cdbc5d41360e294fe41b 100644 (file)
@@ -5,6 +5,15 @@ Test support of various text encoded with Unicode up to version 8.0 (2015).
 Based on file by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
 
+Compact font overview:
+
+  ╔══════════════════════════════════════════════════════════════════════╗
+  ║ _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏØṆⱣÞß ΑΒΓΔΩὮ АБВГДЯѢЌ ԱԲԳ ႠႡႢჇ אבגױ ║
+  ║ @abcdefghijklmnopqrstuvwxyz åāčếəøṇᵽþſ αβγδωὦ абвгдяѣќ աբգ აბგჷ ابجݰ ║
+  ║ -0123456789 (/)[\]{|} ^`"'~ «“’”» ,;:.…!¿?‽ •&#§¶†©%‰ −±+*×÷ <>=≠∀∧∅ ║
+  ║ ·¤¢₥$€£¥₹₽ ฿₫֏₭₺₦₩₪ ✂℻☆♥⚐☺☯☹ ☉♀♁♂♉ ✔✘ ○☓□△ ␣⌫⌥⌘↵␀ ¯₁½²√¬∈∞ ↗┌╁╖░█∎ � ║
+  ╚══════════════════════════════════════════════════════════════════════╝
+
 Code:
 
   <html><pre><span class=""><!-- H&#x54;M --></span>
@@ -31,14 +40,14 @@ Mathematics and sciences:
 
   ⒶⒷⒸ 𝐀𝐁𝐂 𝐴𝐵𝐶 𝑨𝑩𝑪 𝒜ℬ𝒞 𝓐𝓑𝓒 𝔄𝔅ℭ 𝔸𝔹ℂ 𝕬𝕭𝕮 𝖠𝖡𝖢 𝗔𝗕𝗖 𝘈𝘉𝘊 𝘼𝘽𝘾 𝙰𝙱𝙲 🅰🅱🆎
 
-Compact font overview:
+Proper typography:
 
-  ���══════════════════════════════════════════════════════════════════════╗
-  ��� _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏØṆⱣÞß ΑΒΓΔΩὮ АБВГДЯѢЌ ԱԲԳ ႠႡႢჇ אבגױ ║
-  ��� @abcdefghijklmnopqrstuvwxyz åāčếəøṇᵽþſ αβγδωὦ абвгдяѣќ աբգ აბგჷ ابجݰ ║
-  ��� -0123456789 (/)[\]{|} ^`"'~ «“’”» ,;:.…!¿?‽ •&#§¶†©%‰ −±+*×÷ <>=≠∀∧∅ ║
-  ��� ·¤¢₥$€£¥₹₽ ฿₫֏₭₺₦₩₪ ✂℻☆♥⚐☺☯☹ ☉♀♁♂♉ ✔✘ ○☓□△ ␣⌫⌥⌘↵␀ ¯₁½²√¬∈∞ ↗┌╁╖░█∎ � ║
-  ���══════════════════════════════════════════════════════════════════════╝
+  ��� Lookalikes: 1lI|, 0OD, 8B, 2Z, 5S$
+  ��� “It’s ‘quoted’”, „deutsche ‚Gänsefüßchen‘“, « guillemets ‹comme ci› »
+  ��� u + ¨ + ´ = ǘ, o + ~ + ¯ = ȭ, e + ^ + ` = ề, e + ¸ + ˘ = ḝ
+  ��� 1 + 2 − 3 × 4 ÷ 5 ≈ 0–1‰ — 0° 21′ 36″
+  ��� 0,89€ ℆ / @ $1.⁰⁰ / 一ヶ120円
+  ��� ⒈ ♙e4 ♟e5 ⒉ f4 e×f4 ⒊ ♗c4 ♛h4† ⒋ ♔f1 b5⁈ ⒌ ♗×b5 ♞f6 ⒍ ♘f3 ♛h6 … 2⒊ ♗e7‡
 
 English panphone (traditional, IPA, Shavian, Braille):
 
@@ -54,20 +63,12 @@ English panphone (traditional, IPA, Shavian, Braille):
   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
   ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
 
-Ænglisc:
+Ænglisc Ōhthere & Ƿulfstān:
 
   ᚻᛖ᛫ᚳᚹᚫᚦ᛫ᚦᚫᛏ᛫ᚻᛖ᛫ᛒᚢᛞᛖ᛫ᚩᚾ᛫ᚦᚫᛗ᛫ᛚᚪᚾᛞᛖ᛫ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ᛫ᚹᛁᚦ᛫ᚦᚪ᛫ᚹᛖᛥᚫ᛬
   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
   He said that he lived in the northern land near the Western Sea.
 
-Proper typography:
-
-  • Lookalikes: 1lI|, 0OD, 8B, 2Z, 5S$
-  • “It’s ‘quoted’”, „deutsche ‚Gänsefüßchen‘“, « guillemets ‹comme ci› »
-  • u + ¨ + ´ = ǘ, o + ~ + ¯ = ȭ, e + ^ + ` = ề, e + ¸ + ˘ = ḝ
-  • ‰, •, 3–4, —, −5/+5, ™, €1, …
-  • ⒈ ♙e4 ♟e5 ⒉ f4 e×f4 ⒊ ♗c4 ♛h4† ⒋ ♔f1 b5⁈ ⒌ ♗×b5 ♞f6 ⒍ ♘f3 ♛h6 … 2⒊ ♗e7‡
-
 Precomposed and combining diacritics:
 
   Muļķa hipiji mēģina nogaršot žņaudzējčūsku. Trâu chậm uống nước đục.
@@ -96,7 +97,7 @@ Pangrams:
   vt: Do bạch kim rất quý, sẽ để lắp vô xương.
   yo: Ìwò̩fà ń yò̩ séji tó gbojúmó̩, ó hàn pákànpò̩ gan-an nis̩é̩ rè̩ bó dò̩la.
 
-German ligatures:
+German with presentational ligatures:
 
   Im finſteren Jagdſchloß am offenen Felsquellwaſſer patzte der affig‐flatterhafte
   kauzig‐höfliche Bäcker über ſeinem verſifften kniffligen C‐Xylophon.
@@ -161,6 +162,19 @@ Zarka Table (Torah cantillation):
   זַרְקָא֮ סְגוֹלְתָּא֒ מוּנַח־לְגַרְמֵ֣הּ׀ מוּנַ֣ח רְבִ֗יעַ פָּזֵר־קָטָ֡ן תְּלִישָׁא־גְ֠דוֹלָה תְּלִישָׁא־קְטַנָה֩ אַזְלָ֨א גֶּ֜רֶשׁ
   מְהֻפָּ֤ךְ פַּשְׁטָא֙ זָקֵף־קָטָ֔ן טִפְחָ֖א אַתְנָ֑ח דַּרְגָּ֧א תְּבִ֛יר טִפְחָ֖א מֵרְכָ֥א סִלּֽוּק׃
 
+Ethiopic (Amharic, Blin, Sebatbeit):
+  ዩኒኮድ ለእያንዳንዱ ፊደል፣       ዩኒኮድ ላፍደልድክ፡       ዩኒኮድ እንም ኤነት ፊደል፤
+  ማንኛውም ዓይነት ኮምፒውተር ቢሆን፣  ኣኻ ኮምፕዩተርልክ ኣኽን፡   ሟኒም ኤነት ኮምፒተር ቢኸር፤
+  ማንኛውም ዓይነት ፕሮግራም ቢሆን፣   ኣኻ ፕሮግራምልክ ኣኽን፡    ሟኒም ኤነት ይቾቺቃር ቢኸር፤
+  ማንኛውም ዓይነት ቋንቋ ቢሆን፣     ኣኻ ጋበልክ ኣኽን፡       ሟኒም ኤነት ይዝረኵᎏ ቢኸር፤
+  ልዩ የሆነ ቍጥር ያዘጋጃል።       ላዅ ፍሩግ ሺብ ደለምደኵ።   ᎇችርም ኤነት ቍጥር ቢኸር ይጠፍ።
+
+Thai pangram by The Computer Association of Thailand:
+
+  เป็นมนุษย์สุดประเสริฐเลิศคุณค่า กว่าบรรดาฝูงสัตว์เดรัจฉาน   จงฝ่าฟันพัฒนาวิชาการ
+  อย่าล้างผลาญฤๅเข่นฆ่าบีฑาใคร ไม่ถือโทษโกรธแช่งซัดฮึดฮัดด่า หัดอภัยเหมือนกีฬาอัชฌาสัย
+  ปฏิบัติประพฤติกฎกำหนดใจ     พูดจาให้จ๊ะๆ จ๋าๆ น่าฟังเอยฯ ๚ะ๛
+
 Hindi:
 
   हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
@@ -171,12 +185,6 @@ Hindi:
   अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
   रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
 
-Thai pangram by The Computer Association of Thailand:
-
-  เป็นมนุษย์สุดประเสริฐเลิศคุณค่า กว่าบรรดาฝูงสัตว์เดรัจฉาน   จงฝ่าฟันพัฒนาวิชาการ
-  อย่าล้างผลาญฤๅเข่นฆ่าบีฑาใคร ไม่ถือโทษโกรธแช่งซัดฮึดฮัดด่า หัดอภัยเหมือนกีฬาอัชฌาสัย
-  ปฏิบัติประพฤติกฎกำหนดใจ     พูดจาให้จ๊ะๆ จ๋าๆ น่าฟังเอยฯ ๚ะ๛
-
 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
 
   யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
@@ -184,7 +192,7 @@ Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பார
   நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
   தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
 
-Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
+Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು:
 
   ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
@@ -194,13 +202,6 @@ Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
   ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
 
-Ethiopic (Amharic, Blin, Sebatbeit):
-  ዩኒኮድ ለእያንዳንዱ ፊደል፣       ዩኒኮድ ላፍደልድክ፡       ዩኒኮድ እንም ኤነት ፊደል፤
-  ማንኛውም ዓይነት ኮምፒውተር ቢሆን፣  ኣኻ ኮምፕዩተርልክ ኣኽን፡   ሟኒም ኤነት ኮምፒተር ቢኸር፤
-  ማንኛውም ዓይነት ፕሮግራም ቢሆን፣   ኣኻ ፕሮግራምልክ ኣኽን፡    ሟኒም ኤነት ይቾቺቃር ቢኸር፤
-  ማንኛውም ዓይነት ቋንቋ ቢሆን፣     ኣኻ ጋበልክ ኣኽን፡       ሟኒም ኤነት ይዝረኵᎏ ቢኸር፤
-  ልዩ የሆነ ቍጥር ያዘጋጃል።       ላዅ ፍሩግ ሺብ ደለምደኵ።   ᎇችርም ኤነት ቍጥር ቢኸር ይጠፍ።
-
 Tibetan Declaration of Rights:
 
   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
@@ -208,7 +209,7 @@ Tibetan Declaration of Rights:
   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
 
-Korean pangram:
+Hangeul decomposition:
 
   “웬 초콜릿? 제가 원했던 건 뻥튀기 쬐끔과 의류예요.” “얘야, 왜 또 불평?”
   “웬 초콜릿? 제가 원했던 건 뻥튀기 쬐끔과 의류예요.” “얘야, 왜 또 불평?”
@@ -218,28 +219,28 @@ Korean pangram:
 
 Korean 훈민정음:
 
-  Modern korean hangeul:
+  ‣ Modern korean hangeul:
   나라말이 중국과 달라, 문자끼리 서로 맞지 아니할세.
   이런 전차(이유)로 어린(어리석은) 백성이 이르고자 할 바 있어도
   마침내 제 뜻을 실히 펴지 못할 놈이 하니라(많으니라).
   내 이를 위하여 어여삐 여겨 새로 28 자를 만드노니
   모든 사람으로 하여금 쉬이 익혀 날로 씀에 편안케 하고자 할 따름이니라.
 
-  Original Korean hangeul (separate jamo):
+  ‣ Original Korean hangeul (separate jamo):
   나랏말ᄊᆞ미 中듀ᇰ國귁에 달아 文문字ᄍᆞᆼ와로 서르 ᄉᆞᄆᆞᆺ디 아니ᄒᆞᆯᄊᆡ
   이런 젼ᄎᆞ로 어린 百ᄇᆡᆨ姓셔ᇰ이 니르고져 호ᇙ배 이셔도
   ᄆᆞᄎᆞᆷ내 제 ᄠᅳ들 시러 펴디 몯ᄒᆞᇙ 노미 하니라
   내 이ᄅᆞᆯ 爲윙ᄒᆞ야 어엿비 너겨 새로 스믈여듧 字ᄍᆞᆼᄅᆞᆯ ᄆᆡᇰᄀᆞ노니
   사ᄅᆞᆷ마다 ᄒᆡᅇᅧ 수ᄫᅵ 니겨 날로 ᄡᅮ메 便뼌安ᅙᅡᆫ킈 ᄒᆞ고져 ᄒᆞᇙ ᄯᆞᄅᆞ미니라
 
-  Last line in mixed hanja/hangeul:
+  ‣ Last line in mixed hanja/hangeul:
   欲·욕使:ᄉᆞᆼ人ᅀᅵᆫ人ᅀᅵᆫ·ᄋᆞ·로 易·잉習·씹·ᄒᆞ·야 便뼌於ᅙᅥᆼ日·ᅀᅵᇙ用·요ᇰ耳:ᅀᅵᆼ니·라
 
-  Original Chinese hanja:
+  ‣ Original Classical Chinese hanja:
   國之語音 異乎中國 與文字不相流通 故愚民 有所欲言 而終不得伸其情者 多矣
   予 為此憫然 新制二十八字 欲使人人易習 便於日用矣(耳)。
 
-Japanese Iroha いろは:
+Japanese Iroha:
 
   kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
 
@@ -254,21 +255,17 @@ Japanese Iroha いろは:
 
 Chinese:
 
-  Most common characters:
-
+  ‣ Most common characters:
   的一是不了在人有我他这个们中来上大为和国地到以说时
   要就出会可也你对生能而子那得于着下自之年过发后作里
 
-  Transliteration test:
-
+  ‣ Transliteration test:
   女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
 
-  Extension blocks:
-
+  ‣ Extension blocks:
   A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
 
-  Qiān zì wén 千字文 by Xing Si Zhou:
-
+  ‣ Qiān zì wén 千字文 by Xing Si Zhou:
   天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
   閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
   劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔