korean pangram to compare jamo decomposition
[unicode-sampler.git] / unicode.txt
index 283c47fb13efbc074dec514fce56de203dfecb1b..25c4170594956ce7e12c60757c1833e37ff182b0 100644 (file)
@@ -2,7 +2,7 @@ Unicode sampler
 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
 Test support of various text encoded with Unicode up to version 8.0 (2015).
 
 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
 Test support of various text encoded with Unicode up to version 8.0 (2015).
 
-Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
+Based on file by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
 
 Code:
 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
 
 Code:
@@ -35,7 +35,7 @@ Compact font overview:
   ║ [-0123456789] !¿?#%‰&©/*•† (.:;,…) {'"|“’”} +×=≠½²∈∞ ↗┌╁╖░☺ � ║
   ╚═══════════════════════════════════════════════════════════════╝
 
   ║ [-0123456789] !¿?#%‰&©/*•† (.:;,…) {'"|“’”} +×=≠½²∈∞ ↗┌╁╖░☺ � ║
   ╚═══════════════════════════════════════════════════════════════╝
 
-English panphone (traditional, IPA, Braille):
+English panphone (traditional, IPA, Shavian, Braille):
 
   Just as the French queen looked for it, she heard that symphony again.
   A beige hue on the waters of the loch impressed all, including young Arthur.
 
   Just as the French queen looked for it, she heard that symphony again.
   A beige hue on the waters of the loch impressed all, including young Arthur.
@@ -43,12 +43,15 @@ English panphone (traditional, IPA, Braille):
   ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
   ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
 
   ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
   ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
 
+  𐑡𐑳𐑕𐑑 𐑨𐑟 𐑞 𐑓𐑮𐑧𐑯𐑗 𐑒𐑢𐑰𐑯 𐑤𐑫𐑒𐑑 𐑓 𐑦𐑑, 𐑖𐑰 𐑣𐑻𐑛 𐑞𐑨𐑑 𐑕𐑦𐑥𐑓𐑩𐑯𐑰 𐑩𐑜𐑧𐑯.
+  𐑩 𐑚𐑱𐑠 𐑣𐑿 𐑪𐑯 𐑞 𐑢𐑶𐑑𐑼𐑟 𐑝 𐑞 𐑤𐑪𐑒 𐑦𐑥𐑐𐑮𐑧𐑕𐑑 𐑷𐑤, 𐑦𐑙𐑒𐑤𐑵𐑛𐑦𐑙 𐑘𐑳𐑙 ·𐑸𐑔𐑻.
+
   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
   ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
 
 Ænglisc:
 
   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
   ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
 
 Ænglisc:
 
-  ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
+  ᚻᛖ᛫ᚳᚹᚫᚦ᛫ᚦᚫᛏ᛫ᚻᛖ᛫ᛒᚢᛞᛖ᛫ᚩᚾ᛫ᚦᚫᛗ᛫ᛚᚪᚾᛞᛖ᛫ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ᛫ᚹᛁᚦ᛫ᚦᚪ᛫ᚹᛖᛥᚫ᛬
   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
   He said that he lived in the northern land near the Western Sea.
 
   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
   He said that he lived in the northern land near the Western Sea.
 
@@ -69,9 +72,12 @@ Proper typography:
   • the euro symbol: │ 14.95 € │
                      ╰─────────╯
 
   • the euro symbol: │ 14.95 € │
                      ╰─────────╯
 
-Combining characters:
+Precomposed and combining diacritics:
+
+  Četri psihi faķīri vēlu vakarā zāģēja guļbūvei durvis, fonā šņācot mežam.
+  Četri psihi fak̦īri vēlu vakarā zāg̓ēja gul̦būvei durvis, fonā šn̦ācot mežam.
 
 
-  STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
+  STARGΛ̊TE, a = v̇ = r̈, a⃑ ⊥ b⃑
 
 Pangrams:
 
 
 Pangrams:
 
@@ -237,6 +243,34 @@ Tibetan Declaration of Rights:
   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
 
   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
 
+Korean pangram:
+
+  “웬 초콜릿? 제가 원했던 건 뻥튀기 쬐끔과 의류예요.” “얘야, 왜 또 불평?”
+  “웬 초콜릿? 제가 원했던 건 뻥튀기 쬐끔과 의류예요.” “얘야, 왜 또 불평?”
+
+Korean 훈민정음:
+
+  Modern korean hangeul:
+  나라말이 중국과 달라, 문자끼리 서로 맞지 아니할세.
+  이런 전차(이유)로 어린(어리석은) 백성이 이르고자 할 바 있어도
+  마침내 제 뜻을 실히 펴지 못할 놈이 하니라(많으니라).
+  내 이를 위하여 어여삐 여겨 새로 28 자를 만드노니
+  모든 사람으로 하여금 쉬이 익혀 날로 씀에 편안케 하고자 할 따름이니라.
+
+  Original Korean hangeul (separate jamo):
+  나랏말ᄊᆞ미 中듀ᇰ國귁에 달아 文문字ᄍᆞᆼ와로 서르 ᄉᆞᄆᆞᆺ디 아니ᄒᆞᆯᄊᆡ
+  이런 젼ᄎᆞ로 어린 百ᄇᆡᆨ姓셔ᇰ이 니르고져 호ᇙ배 이셔도
+  ᄆᆞᄎᆞᆷ내 제 ᄠᅳ들 시러 펴디 몯ᄒᆞᇙ 노미 하니라
+  내 이ᄅᆞᆯ 爲윙ᄒᆞ야 어엿비 너겨 새로 스믈여듧 字ᄍᆞᆼᄅᆞᆯ ᄆᆡᇰᄀᆞ노니
+  사ᄅᆞᆷ마다 ᄒᆡᅇᅧ 수ᄫᅵ 니겨 날로 ᄡᅮ메 便뼌安ᅙᅡᆫ킈 ᄒᆞ고져 ᄒᆞᇙ ᄯᆞᄅᆞ미니라
+
+  Last line in mixed hanja/hangeul:
+  欲·욕使:ᄉᆞᆼ人ᅀᅵᆫ人ᅀᅵᆫ·ᄋᆞ·로 易·잉習·씹·ᄒᆞ·야 便뼌於ᅙᅥᆼ日·ᅀᅵᇙ用·요ᇰ耳:ᅀᅵᆼ니·라
+
+  Original Chinese hanja:
+  國之語音 異乎中國 與文字不相流通 故愚民 有所欲言 而終不得伸其情者 多矣
+  予 為此憫然 新制二十八字 欲使人人易習 便於日用矣(耳)。
+
 Japanese Iroha いろは:
 
   kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
 Japanese Iroha いろは:
 
   kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名