korean pangram to compare jamo decomposition
[unicode-sampler.git] / unicode.txt
index cc0d0e78288298b152d669fddd8ab0fd286eb22f..25c4170594956ce7e12c60757c1833e37ff182b0 100644 (file)
@@ -2,7 +2,7 @@ Unicode sampler
 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
 Test support of various text encoded with Unicode up to version 8.0 (2015).
 
-Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
+Based on file by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
 
 Code:
@@ -29,11 +29,13 @@ Mathematics and sciences:
 
 Compact font overview:
 
-  ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏṆÞß ΑΒΓΔΩὮ АБВГДЯ ԱႠא $€
-  abcdefghijklmnopqrstuvwxyz åāčếəṇþſ αβγδωὦ абвгдя աაا ¥£
-  -0123456789_ !¿?@#%/‰&©†*• (.:;…) '"|“’” +×=≠½²∈∞ ↗┌╁╖░☺ �
+  ╔═══════════════════════════════════════════════════════════════╗
+  ║ _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏṆÞß ΑΒΓΔΩὮ АБВГДЯ ԱႠא $€     ║
+  ║ @abcdefghijklmnopqrstuvwxyz åāčếəṇþſ αβγδωὦ абвгдя աაا ¥£     ║
+  ║ [-0123456789] !¿?#%‰&©/*•† (.:;,…) {'"|“’”} +×=≠½²∈∞ ↗┌╁╖░☺ � ║
+  ╚═══════════════════════════════════════════════════════════════╝
 
-English panphone (traditional, IPA, Braille):
+English panphone (traditional, IPA, Shavian, Braille):
 
   Just as the French queen looked for it, she heard that symphony again.
   A beige hue on the waters of the loch impressed all, including young Arthur.
@@ -41,32 +43,69 @@ English panphone (traditional, IPA, Braille):
   ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
   ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
 
+  𐑡𐑳𐑕𐑑 𐑨𐑟 𐑞 𐑓𐑮𐑧𐑯𐑗 𐑒𐑢𐑰𐑯 𐑤𐑫𐑒𐑑 𐑓 𐑦𐑑, 𐑖𐑰 𐑣𐑻𐑛 𐑞𐑨𐑑 𐑕𐑦𐑥𐑓𐑩𐑯𐑰 𐑩𐑜𐑧𐑯.
+  𐑩 𐑚𐑱𐑠 𐑣𐑿 𐑪𐑯 𐑞 𐑢𐑶𐑑𐑼𐑟 𐑝 𐑞 𐑤𐑪𐑒 𐑦𐑥𐑐𐑮𐑧𐑕𐑑 𐑷𐑤, 𐑦𐑙𐑒𐑤𐑵𐑛𐑦𐑙 𐑘𐑳𐑙 ·𐑸𐑔𐑻.
+
   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
   ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
 
-Nicer typography in plain text files:
-
-  ╔══════════════════════════════════════════╗
-  ║                                          ║
-  ║   • ‘single’ and “double” quotes         ║
-  ║                                          ║
-  ║   • Curly apostrophes: “We’ve been here” ║
-  ║                                          ║
-  ║   • Latin-1 apostrophe and accents: '´`  ║
-  ║                                          ║
-  ║   • ‚deutsche‘ „Anführungszeichen“       ║
-  ║                                          ║
-  ║   • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …      ║
-  ║                                          ║
-  ║   • ASCII safety test: 1lI|, 0OD, 8B     ║
-  ║                      ╭─────────╮         ║
-  ║   • the euro symbol: │ 14.95 € │         ║
-  ║                      ╰─────────╯         ║
-  ╚══════════════════════════════════════════╝
-
-Combining characters:
-
-  STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
+Ænglisc:
+
+  ᚻᛖ᛫ᚳᚹᚫᚦ᛫ᚦᚫᛏ᛫ᚻᛖ᛫ᛒᚢᛞᛖ᛫ᚩᚾ᛫ᚦᚫᛗ᛫ᛚᚪᚾᛞᛖ᛫ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ᛫ᚹᛁᚦ᛫ᚦᚪ᛫ᚹᛖᛥᚫ᛬
+  Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
+  He said that he lived in the northern land near the Western Sea.
+
+Proper typography:
+
+  • ‘single’ and “double” quotes
+
+  • Curly apostrophes: “We’ve been here”
+
+  • Latin-1 apostrophe and accents: '´`
+
+  • ‚deutsche‘ „Anführungszeichen“
+
+  • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …
+
+  • ASCII safety test: 1lI|, 0OD, 8B
+                     ╭─────────╮
+  • the euro symbol: │ 14.95 € │
+                     ╰─────────╯
+
+Precomposed and combining diacritics:
+
+  Četri psihi faķīri vēlu vakarā zāģēja guļbūvei durvis, fonā šņācot mežam.
+  Četri psihi fak̦īri vēlu vakarā zāg̓ēja gul̦būvei durvis, fonā šn̦ācot mežam.
+
+  STARGΛ̊TE, a = v̇ = r̈, a⃑ ⊥ b⃑
+
+Pangrams:
+
+  cz: Příliš žluťoučký kůň úpěl ďábelské ódy.
+  eo: Ĉeĥa ĉiuliteraĵo ŝajne kontraŭĉapeliĝis.  (ϗ eĥoŝanĝº ĉiĵaŭde)
+  fr: Le cœur déçu mais l'âme plutôt naïve, Louÿs rêva de crapaüter en
+      canoë au delà des îles, près du mälström où brûlent les novæ.
+  hu: Új, „Exvőd = fél pár” című show közügy Quitóban.
+  ig: Nne, nna, wepụ he’l’ụjọ dum n’ime ọzụzụ ụmụ, vufesi obi nye Chukwu,
+      ṅụrịanụ, gbakọọnụ kpaa, kwee ya ka o guzoshie ike; ọ ghaghị ito,
+      nwapụta ezi agwa.
+  ir: Ċuaiġ bé ṁórṡáċ le dlúṫspád fíorḟinn trí hata mo ḋea-ṗorcáin ḃig, ⁊ꞃl.
+  is: Sævör grét áðan því úlpan var ónýt.
+  lv: Glāžšķūņa rūķīši dzērumā čiepj Baha koncertflīģeļu vākus.
+  nl: Wijf lokt u cq 'r pa dmv 'n zg sexy bh. (af: én ʼn kwêvoëltjie)
+  pl: Pchnąć w tę łódź jeża lub ośm skrzyń fig. (Zażółć gęślą jaźń)
+  ro: Muzicologă în bej vând whisky și tequila, preț fix.
+  se: Vuol Ruoŧa geđggiid leat máŋga luosa ja čuovžža.
+  sk: Starý kôň na hŕbe kníh žuje tíško povädnuté ruže,
+      na stĺpe sa ďateľ učí kvákať novú ódu o živote.
+  tr: PİJAMALİ HASTA, yağız şoföre çabucak güvendi.
+  vt: Do bạch kim rất quý, sẽ để lắp vô xương.
+  yo: Ìwò̩fà ń yò̩ séji tó gbojúmó̩, ó hàn pákànpò̩ gan-an nis̩é̩ rè̩ bó dò̩la.
+
+German ligatures:
+
+  Im finſteren Jagdſchloß am offenen Felsquellwaſſer patzte der affig‐flatterhafte
+  kauzig‐höfliche Bäcker über ſeinem verſifften kniffligen C‐Xylophon.
 
 Greek (Polytonic):
 
@@ -197,13 +236,6 @@ Ethiopian:
   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
   እግርህን በፍራሽህ ልክ ዘርጋ።
 
-Ænglisc:
-
-  ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
-
-  Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
-  He said that he lived in the northern land near the Western Sea.
-
 Tibetan Declaration of Rights:
 
   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
@@ -211,6 +243,34 @@ Tibetan Declaration of Rights:
   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
 
+Korean pangram:
+
+  “웬 초콜릿? 제가 원했던 건 뻥튀기 쬐끔과 의류예요.” “얘야, 왜 또 불평?”
+  “웬 초콜릿? 제가 원했던 건 뻥튀기 쬐끔과 의류예요.” “얘야, 왜 또 불평?”
+
+Korean 훈민정음:
+
+  Modern korean hangeul:
+  나라말이 중국과 달라, 문자끼리 서로 맞지 아니할세.
+  이런 전차(이유)로 어린(어리석은) 백성이 이르고자 할 바 있어도
+  마침내 제 뜻을 실히 펴지 못할 놈이 하니라(많으니라).
+  내 이를 위하여 어여삐 여겨 새로 28 자를 만드노니
+  모든 사람으로 하여금 쉬이 익혀 날로 씀에 편안케 하고자 할 따름이니라.
+
+  Original Korean hangeul (separate jamo):
+  나랏말ᄊᆞ미 中듀ᇰ國귁에 달아 文문字ᄍᆞᆼ와로 서르 ᄉᆞᄆᆞᆺ디 아니ᄒᆞᆯᄊᆡ
+  이런 젼ᄎᆞ로 어린 百ᄇᆡᆨ姓셔ᇰ이 니르고져 호ᇙ배 이셔도
+  ᄆᆞᄎᆞᆷ내 제 ᄠᅳ들 시러 펴디 몯ᄒᆞᇙ 노미 하니라
+  내 이ᄅᆞᆯ 爲윙ᄒᆞ야 어엿비 너겨 새로 스믈여듧 字ᄍᆞᆼᄅᆞᆯ ᄆᆡᇰᄀᆞ노니
+  사ᄅᆞᆷ마다 ᄒᆡᅇᅧ 수ᄫᅵ 니겨 날로 ᄡᅮ메 便뼌安ᅙᅡᆫ킈 ᄒᆞ고져 ᄒᆞᇙ ᄯᆞᄅᆞ미니라
+
+  Last line in mixed hanja/hangeul:
+  欲·욕使:ᄉᆞᆼ人ᅀᅵᆫ人ᅀᅵᆫ·ᄋᆞ·로 易·잉習·씹·ᄒᆞ·야 便뼌於ᅙᅥᆼ日·ᅀᅵᇙ用·요ᇰ耳:ᅀᅵᆼ니·라
+
+  Original Chinese hanja:
+  國之語音 異乎中國 與文字不相流通 故愚民 有所欲言 而終不得伸其情者 多矣
+  予 為此憫然 新制二十八字 欲使人人易習 便於日用矣(耳)。
+
 Japanese Iroha いろは:
 
   kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
@@ -245,10 +305,6 @@ Chinese:
   閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
   劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
 
-Greetings in various languages:
-
-  Hello world, Καλημέρα κόσμε, コンニチハ
-
 Box drawing alignment tests:                                          █
                                                                       ▉
   ╔══╦══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   ╷  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳