reorder languages to transition from semitic to indic
[unicode-sampler.git] / unicode.txt
index b394515387dc0d7210fe61b684fde186ad36fff8..c020963feac5f76d0962cdbc5d41360e294fe41b 100644 (file)
@@ -5,6 +5,15 @@ Test support of various text encoded with Unicode up to version 8.0 (2015).
 Based on file by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
 
 Based on file by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
 
+Compact font overview:
+
+  ╔══════════════════════════════════════════════════════════════════════╗
+  ║ _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏØṆⱣÞß ΑΒΓΔΩὮ АБВГДЯѢЌ ԱԲԳ ႠႡႢჇ אבגױ ║
+  ║ @abcdefghijklmnopqrstuvwxyz åāčếəøṇᵽþſ αβγδωὦ абвгдяѣќ աբգ აბგჷ ابجݰ ║
+  ║ -0123456789 (/)[\]{|} ^`"'~ «“’”» ,;:.…!¿?‽ •&#§¶†©%‰ −±+*×÷ <>=≠∀∧∅ ║
+  ║ ·¤¢₥$€£¥₹₽ ฿₫֏₭₺₦₩₪ ✂℻☆♥⚐☺☯☹ ☉♀♁♂♉ ✔✘ ○☓□△ ␣⌫⌥⌘↵␀ ¯₁½²√¬∈∞ ↗┌╁╖░█∎ � ║
+  ╚══════════════════════════════════════════════════════════════════════╝
+
 Code:
 
   <html><pre><span class=""><!-- H&#x54;M --></span>
 Code:
 
   <html><pre><span class=""><!-- H&#x54;M --></span>
@@ -31,14 +40,14 @@ Mathematics and sciences:
 
   ⒶⒷⒸ 𝐀𝐁𝐂 𝐴𝐵𝐶 𝑨𝑩𝑪 𝒜ℬ𝒞 𝓐𝓑𝓒 𝔄𝔅ℭ 𝔸𝔹ℂ 𝕬𝕭𝕮 𝖠𝖡𝖢 𝗔𝗕𝗖 𝘈𝘉𝘊 𝘼𝘽𝘾 𝙰𝙱𝙲 🅰🅱🆎
 
 
   ⒶⒷⒸ 𝐀𝐁𝐂 𝐴𝐵𝐶 𝑨𝑩𝑪 𝒜ℬ𝒞 𝓐𝓑𝓒 𝔄𝔅ℭ 𝔸𝔹ℂ 𝕬𝕭𝕮 𝖠𝖡𝖢 𝗔𝗕𝗖 𝘈𝘉𝘊 𝘼𝘽𝘾 𝙰𝙱𝙲 🅰🅱🆎
 
-Compact font overview:
+Proper typography:
 
 
-  ���══════════════════════════════════════════════════════════════════════╗
-  ��� _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏØṆⱣÞß ΑΒΓΔΩὮ АБВГДЯѢЌ ԱԲԳ ႠႡႢჇ אבגױ ║
-  ��� @abcdefghijklmnopqrstuvwxyz åāčếəøṇᵽþſ αβγδωὦ абвгдяѣќ աբգ აბგჷ ابجݰ ║
-  ��� -0123456789 (/)[\]{|} ^`"'~ «“’”» ,;:.…!¿?‽ •&#§¶†©%‰ −±+*×÷ <>=≠∀∧∅ ║
-  ��� ·¤¢₥$€£¥₹₽ ฿₫֏₭₺₦₩₪ ✂℻☆♥⚐☺☯☹ ☉♀♁♂♉ ✔✘ ○☓□△ ␣⌫⌥⌘↵␀ ¯₁½²√¬∈∞ ↗┌╁╖░█∎ � ║
-  ���══════════════════════════════════════════════════════════════════════╝
+  ��� Lookalikes: 1lI|, 0OD, 8B, 2Z, 5S$
+  ��� “It’s ‘quoted’”, „deutsche ‚Gänsefüßchen‘“, « guillemets ‹comme ci› »
+  ��� u + ¨ + ´ = ǘ, o + ~ + ¯ = ȭ, e + ^ + ` = ề, e + ¸ + ˘ = ḝ
+  ��� 1 + 2 − 3 × 4 ÷ 5 ≈ 0–1‰ — 0° 21′ 36″
+  ��� 0,89€ ℆ / @ $1.⁰⁰ / 一ヶ120円
+  ��� ⒈ ♙e4 ♟e5 ⒉ f4 e×f4 ⒊ ♗c4 ♛h4† ⒋ ♔f1 b5⁈ ⒌ ♗×b5 ♞f6 ⒍ ♘f3 ♛h6 … 2⒊ ♗e7‡
 
 English panphone (traditional, IPA, Shavian, Braille):
 
 
 English panphone (traditional, IPA, Shavian, Braille):
 
@@ -60,14 +69,6 @@ English panphone (traditional, IPA, Shavian, Braille):
   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
   He said that he lived in the northern land near the Western Sea.
 
   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
   He said that he lived in the northern land near the Western Sea.
 
-Proper typography:
-
-  • Lookalikes: 1lI|, 0OD, 8B, 2Z, 5S$
-  • “It’s ‘quoted’”, „deutsche ‚Gänsefüßchen‘“, « guillemets ‹comme ci› »
-  • u + ¨ + ´ = ǘ, o + ~ + ¯ = ȭ, e + ^ + ` = ề, e + ¸ + ˘ = ḝ
-  • ‰, •, 3–4, —, −5/+5, ™, €1, …
-  • ⒈ ♙e4 ♟e5 ⒉ f4 e×f4 ⒊ ♗c4 ♛h4† ⒋ ♔f1 b5⁈ ⒌ ♗×b5 ♞f6 ⒍ ♘f3 ♛h6 … 2⒊ ♗e7‡
-
 Precomposed and combining diacritics:
 
   Muļķa hipiji mēģina nogaršot žņaudzējčūsku. Trâu chậm uống nước đục.
 Precomposed and combining diacritics:
 
   Muļķa hipiji mēģina nogaršot žņaudzējčūsku. Trâu chậm uống nước đục.
@@ -161,6 +162,19 @@ Zarka Table (Torah cantillation):
   זַרְקָא֮ סְגוֹלְתָּא֒ מוּנַח־לְגַרְמֵ֣הּ׀ מוּנַ֣ח רְבִ֗יעַ פָּזֵר־קָטָ֡ן תְּלִישָׁא־גְ֠דוֹלָה תְּלִישָׁא־קְטַנָה֩ אַזְלָ֨א גֶּ֜רֶשׁ
   מְהֻפָּ֤ךְ פַּשְׁטָא֙ זָקֵף־קָטָ֔ן טִפְחָ֖א אַתְנָ֑ח דַּרְגָּ֧א תְּבִ֛יר טִפְחָ֖א מֵרְכָ֥א סִלּֽוּק׃
 
   זַרְקָא֮ סְגוֹלְתָּא֒ מוּנַח־לְגַרְמֵ֣הּ׀ מוּנַ֣ח רְבִ֗יעַ פָּזֵר־קָטָ֡ן תְּלִישָׁא־גְ֠דוֹלָה תְּלִישָׁא־קְטַנָה֩ אַזְלָ֨א גֶּ֜רֶשׁ
   מְהֻפָּ֤ךְ פַּשְׁטָא֙ זָקֵף־קָטָ֔ן טִפְחָ֖א אַתְנָ֑ח דַּרְגָּ֧א תְּבִ֛יר טִפְחָ֖א מֵרְכָ֥א סִלּֽוּק׃
 
+Ethiopic (Amharic, Blin, Sebatbeit):
+  ዩኒኮድ ለእያንዳንዱ ፊደል፣       ዩኒኮድ ላፍደልድክ፡       ዩኒኮድ እንም ኤነት ፊደል፤
+  ማንኛውም ዓይነት ኮምፒውተር ቢሆን፣  ኣኻ ኮምፕዩተርልክ ኣኽን፡   ሟኒም ኤነት ኮምፒተር ቢኸር፤
+  ማንኛውም ዓይነት ፕሮግራም ቢሆን፣   ኣኻ ፕሮግራምልክ ኣኽን፡    ሟኒም ኤነት ይቾቺቃር ቢኸር፤
+  ማንኛውም ዓይነት ቋንቋ ቢሆን፣     ኣኻ ጋበልክ ኣኽን፡       ሟኒም ኤነት ይዝረኵᎏ ቢኸር፤
+  ልዩ የሆነ ቍጥር ያዘጋጃል።       ላዅ ፍሩግ ሺብ ደለምደኵ።   ᎇችርም ኤነት ቍጥር ቢኸር ይጠፍ።
+
+Thai pangram by The Computer Association of Thailand:
+
+  เป็นมนุษย์สุดประเสริฐเลิศคุณค่า กว่าบรรดาฝูงสัตว์เดรัจฉาน   จงฝ่าฟันพัฒนาวิชาการ
+  อย่าล้างผลาญฤๅเข่นฆ่าบีฑาใคร ไม่ถือโทษโกรธแช่งซัดฮึดฮัดด่า หัดอภัยเหมือนกีฬาอัชฌาสัย
+  ปฏิบัติประพฤติกฎกำหนดใจ     พูดจาให้จ๊ะๆ จ๋าๆ น่าฟังเอยฯ ๚ะ๛
+
 Hindi:
 
   हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
 Hindi:
 
   हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
@@ -171,12 +185,6 @@ Hindi:
   अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
   रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
 
   अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
   रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
 
-Thai pangram by The Computer Association of Thailand:
-
-  เป็นมนุษย์สุดประเสริฐเลิศคุณค่า กว่าบรรดาฝูงสัตว์เดรัจฉาน   จงฝ่าฟันพัฒนาวิชาการ
-  อย่าล้างผลาญฤๅเข่นฆ่าบีฑาใคร ไม่ถือโทษโกรธแช่งซัดฮึดฮัดด่า หัดอภัยเหมือนกีฬาอัชฌาสัย
-  ปฏิบัติประพฤติกฎกำหนดใจ     พูดจาให้จ๊ะๆ จ๋าๆ น่าฟังเอยฯ ๚ะ๛
-
 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
 
   யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
 
   யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
@@ -194,13 +202,6 @@ Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು:
   ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
 
   ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
 
-Ethiopic (Amharic, Blin, Sebatbeit):
-  ዩኒኮድ ለእያንዳንዱ ፊደል፣       ዩኒኮድ ላፍደልድክ፡       ዩኒኮድ እንም ኤነት ፊደል፤
-  ማንኛውም ዓይነት ኮምፒውተር ቢሆን፣  ኣኻ ኮምፕዩተርልክ ኣኽን፡   ሟኒም ኤነት ኮምፒተር ቢኸር፤
-  ማንኛውም ዓይነት ፕሮግራም ቢሆን፣   ኣኻ ፕሮግራምልክ ኣኽን፡    ሟኒም ኤነት ይቾቺቃር ቢኸር፤
-  ማንኛውም ዓይነት ቋንቋ ቢሆን፣     ኣኻ ጋበልክ ኣኽን፡       ሟኒም ኤነት ይዝረኵᎏ ቢኸር፤
-  ልዩ የሆነ ቍጥር ያዘጋጃል።       ላዅ ፍሩግ ሺብ ደለምደኵ።   ᎇችርም ኤነት ቍጥር ቢኸር ይጠፍ።
-
 Tibetan Declaration of Rights:
 
   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
 Tibetan Declaration of Rights:
 
   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།