generic font overview at beginning
[unicode-sampler.git] / unicode.txt
index c537b2e3a4200999e755d9cba67d7b3a1f2f7ab7..f078728530e0d00b3ea1b22a78d97586aefbce75 100644 (file)
@@ -1,15 +1,19 @@
+Unicode sampler
+‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Test support of various text encoded with Unicode up to version 8.0 (2015).
 
-UTF-8 encoded sample plain-text file
-‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
+Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
 
-Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25
+Code:
 
+  <html><pre><span class=""><!-- H&#x54;M --></span>
 
-The ASCII compatible UTF-8 encoding used in this plain-text file
-is defined in Unicode, ISO 10646-1, and RFC 2279.
+  Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
 
+  perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
 
-Using Unicode/UTF-8, you can write in emails and source code things such as
+  ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
 
 Mathematics and sciences:
 
@@ -23,15 +27,23 @@ Mathematics and sciences:
                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
 
-Linguistics and dictionaries:
+Compact font overview:
+
+  ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
+  abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
+  –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
+  ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
+
+English panphone (traditional, IPA, Braille):
 
-  ði ıntəˈnæʃənəl fəˈnɛtık əsoʊsiˈeıʃn
-  Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ]
+  Just as the French queen looked for it, she heard that symphony again.
+  A beige hue on the waters of the loch impressed all, including young Arthur.
 
-APL:
+  ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
+  ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
 
-  ((V⍳V)=⍳⍴V)/V←,V    ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
-  ���1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
+  ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
+  ���⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
 
 Nicer typography in plain text files:
 
@@ -104,6 +116,22 @@ Russian:
   применению Unicode в различных операционных системах и программных
   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
 
+Sakha (Yakut) Declaration of Rights:
+
+  Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
+  Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
+  бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
+
+Kazakh equivalents:
+
+  Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
+  дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
+  бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
+
+  بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
+  دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
+  ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
+
 Hebrew:
 
   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
@@ -177,29 +205,6 @@ Ethiopian:
   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
   He said that he lived in the northern land near the Western Sea.
 
-Braille:
-
-  ⡌⠁⠧⠑ ⠼⠁⠒  ⡍⠜⠇⠑⠹⠰⠎ ⡣⠕⠌
-
-  ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠙⠑⠁⠙⠒ ⠞⠕ ⠃⠑⠛⠔ ⠺⠊⠹⠲ ⡹⠻⠑ ⠊⠎ ⠝⠕ ⠙⠳⠃⠞
-  ⠱⠁⠞⠑⠧⠻ ⠁⠃⠳⠞ ⠹⠁⠞⠲ ⡹⠑ ⠗⠑⠛⠊⠌⠻ ⠕⠋ ⠙⠊⠎ ⠃⠥⠗⠊⠁⠇ ⠺⠁⠎
-  ⠎⠊⠛⠝⠫ ⠃⠹ ⠹⠑ ⠊⠇⠻⠛⠹⠍⠁⠝⠂ ⠹⠑ ⠊⠇⠻⠅⠂ ⠹⠑ ⠥⠝⠙⠻⠞⠁⠅⠻⠂
-  ⠁⠝⠙ ⠹⠑ ⠡⠊⠑⠋ ⠍⠳⠗⠝⠻⠲ ⡎⠊⠗⠕⠕⠛⠑ ⠎⠊⠛⠝⠫ ⠊⠞⠲ ⡁⠝⠙
-  ⡎⠊⠗⠕⠕⠛⠑⠰⠎ ⠝⠁⠍⠑ ⠺⠁⠎ ⠛⠕⠕⠙ ⠥⠏⠕⠝ ⠰⡡⠁⠝⠛⠑⠂ ⠋⠕⠗ ⠁⠝⠹⠹⠔⠛ ⠙⠑
-  ⠡⠕⠎⠑ ⠞⠕ ⠏⠥⠞ ⠙⠊⠎ ⠙⠁⠝⠙ ⠞⠕⠲
-
-  ⡕⠇⠙ ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
-
-  ⡍⠔⠙⠖ ⡊ ⠙⠕⠝⠰⠞ ⠍⠑⠁⠝ ⠞⠕ ⠎⠁⠹ ⠹⠁⠞ ⡊ ⠅⠝⠪⠂ ⠕⠋ ⠍⠹
-  ⠪⠝ ⠅⠝⠪⠇⠫⠛⠑⠂ ⠱⠁⠞ ⠹⠻⠑ ⠊⠎ ⠏⠜⠞⠊⠊⠥⠇⠜⠇⠹ ⠙⠑⠁⠙ ⠁⠃⠳⠞
-  ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ ⡊ ⠍⠊⠣⠞ ⠙⠁⠧⠑ ⠃⠑⠲ ⠔⠊⠇⠔⠫⠂ ⠍⠹⠎⠑⠇⠋⠂ ⠞⠕
-  ⠗⠑⠛⠜⠙ ⠁ ⠊⠕⠋⠋⠔⠤⠝⠁⠊⠇ ⠁⠎ ⠹⠑ ⠙⠑⠁⠙⠑⠌ ⠏⠊⠑⠊⠑ ⠕⠋ ⠊⠗⠕⠝⠍⠕⠝⠛⠻⠹
-  ⠔ ⠹⠑ ⠞⠗⠁⠙⠑⠲ ⡃⠥⠞ ⠹⠑ ⠺⠊⠎⠙⠕⠍ ⠕⠋ ⠳⠗ ⠁⠝⠊⠑⠌⠕⠗⠎
-  ⠊⠎ ⠔ ⠹⠑ ⠎⠊⠍⠊⠇⠑⠆ ⠁⠝⠙ ⠍⠹ ⠥⠝⠙⠁⠇⠇⠪⠫ ⠙⠁⠝⠙⠎
-  ⠩⠁⠇⠇ ⠝⠕⠞ ⠙⠊⠌⠥⠗⠃ ⠊⠞⠂ ⠕⠗ ⠹⠑ ⡊⠳⠝⠞⠗⠹⠰⠎ ⠙⠕⠝⠑ ⠋⠕⠗⠲ ⡹⠳
-  ⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞
-  ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
-
 Tibetan Declaration of Rights:
 
   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
@@ -207,12 +212,39 @@ Tibetan Declaration of Rights:
   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
 
-Compact font selection example text:
+Japanese Iroha いろは:
 
-  ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
-  abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
-  –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
-  ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
+  kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
+
+  色は匂へど   いろはにほへと   イロハニホヘト   イロハニホヘド   以呂波耳本部止
+  散りぬるを   ちりぬるを       チリヌルヲ       チリヌルヲ      千利奴流乎
+  我が世誰ぞ   わかよたれそ    ワカヨタレソ    ワカヨタレソ     和加餘多連曽
+  常ならん     つねならむ       ツネナラム       ツネナラム      津祢那良牟
+  有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
+  今日越えて   けふこえて       ケフコエテ       ケフコエテ      計不己衣天
+  浅き夢見じ   あさきゆめみし   アサキユメミシ   アサキユメミシ    阿佐伎喩女美之
+  酔ひもせず   ゑひもせす       ヱヒモセスン     ウェヒモセスン    恵比毛勢須
+
+Chinese:
+
+  Most common characters:
+
+  的一是不了在人有我他这个们中来上大为和国地到以说时
+  要就出会可也你对生能而子那得于着下自之年过发后作里
+
+  Transliteration test:
+
+  女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
+
+  Extension blocks:
+
+  A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
+
+  Qiān zì wén 千字文 by Xing Si Zhou:
+
+  天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
+  閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
+  劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
 
 Greetings in various languages: