generic font overview at beginning
[unicode-sampler.git] / unicode.txt
index ef9cc282c1afc94cbbfd389db1a48bafb7b23a12..f078728530e0d00b3ea1b22a78d97586aefbce75 100644 (file)
@@ -1,15 +1,19 @@
+Unicode sampler
+‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Test support of various text encoded with Unicode up to version 8.0 (2015).
 
 
-UTF-8 encoded sample plain-text file
-‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
+Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
 
 
-Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25
+Code:
 
 
+  <html><pre><span class=""><!-- H&#x54;M --></span>
 
 
-The ASCII compatible UTF-8 encoding used in this plain-text file
-is defined in Unicode, ISO 10646-1, and RFC 2279.
+  Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
 
 
+  perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
 
 
-Using Unicode/UTF-8, you can write in emails and source code things such as
+  ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
 
 Mathematics and sciences:
 
 
 Mathematics and sciences:
 
@@ -23,15 +27,23 @@ Mathematics and sciences:
                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
 
                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
 
-Linguistics and dictionaries:
+Compact font overview:
 
 
-  ði ıntəˈnæʃənəl fəˈnɛtık əsoʊsiˈeıʃn
-  Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ]
+  ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
+  abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
+  –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
+  ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
 
 
-APL:
+English panphone (traditional, IPA, Braille):
 
 
-  ((V⍳V)=⍳⍴V)/V←,V    ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
-  ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
+  Just as the French queen looked for it, she heard that symphony again.
+  A beige hue on the waters of the loch impressed all, including young Arthur.
+
+  ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
+  ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
+
+  ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
+  ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
 
 Nicer typography in plain text files:
 
 
 Nicer typography in plain text files:
 
@@ -104,6 +116,22 @@ Russian:
   применению Unicode в различных операционных системах и программных
   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
 
   применению Unicode в различных операционных системах и программных
   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
 
+Sakha (Yakut) Declaration of Rights:
+
+  Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
+  Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
+  бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
+
+Kazakh equivalents:
+
+  Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
+  дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
+  бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
+
+  بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
+  دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
+  ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
+
 Hebrew:
 
   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
 Hebrew:
 
   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
@@ -177,35 +205,46 @@ Ethiopian:
   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
   He said that he lived in the northern land near the Western Sea.
 
   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
   He said that he lived in the northern land near the Western Sea.
 
-Braille:
+Tibetan Declaration of Rights:
 
 
-  ⡌⠁⠧⠑ ⠼⠁⠒  ⡍⠜⠇⠑⠹⠰⠎ ⡣⠕⠌
+  ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
+  འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
+  ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
+  དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
 
 
-  ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠙⠑⠁⠙⠒ ⠞⠕ ⠃⠑⠛⠔ ⠺⠊⠹⠲ ⡹⠻⠑ ⠊⠎ ⠝⠕ ⠙⠳⠃⠞
-  ⠱⠁⠞⠑⠧⠻ ⠁⠃⠳⠞ ⠹⠁⠞⠲ ⡹⠑ ⠗⠑⠛⠊⠌⠻ ⠕⠋ ⠙⠊⠎ ⠃⠥⠗⠊⠁⠇ ⠺⠁⠎
-  ⠎⠊⠛⠝⠫ ⠃⠹ ⠹⠑ ⠊⠇⠻⠛⠹⠍⠁⠝⠂ ⠹⠑ ⠊⠇⠻⠅⠂ ⠹⠑ ⠥⠝⠙⠻⠞⠁⠅⠻⠂
-  ⠁⠝⠙ ⠹⠑ ⠡⠊⠑⠋ ⠍⠳⠗⠝⠻⠲ ⡎⠊⠗⠕⠕⠛⠑ ⠎⠊⠛⠝⠫ ⠊⠞⠲ ⡁⠝⠙
-  ⡎⠊⠗⠕⠕⠛⠑⠰⠎ ⠝⠁⠍⠑ ⠺⠁⠎ ⠛⠕⠕⠙ ⠥⠏⠕⠝ ⠰⡡⠁⠝⠛⠑⠂ ⠋⠕⠗ ⠁⠝⠹⠹⠔⠛ ⠙⠑
-  ⠡⠕⠎⠑ ⠞⠕ ⠏⠥⠞ ⠙⠊⠎ ⠙⠁⠝⠙ ⠞⠕⠲
+Japanese Iroha いろは:
 
 
-  ⡕⠇⠙ ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
+  kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
 
 
-  ⡍⠔⠙⠖ ⡊ ⠙⠕⠝⠰⠞ ⠍⠑⠁⠝ ⠞⠕ ⠎⠁⠹ ⠹⠁⠞ ⡊ ⠅⠝⠪⠂ ⠕⠋ ⠍⠹
-  ⠪⠝ ⠅⠝⠪⠇⠫⠛⠑⠂ ⠱⠁⠞ ⠹⠻⠑ ⠊⠎ ⠏⠜⠞⠊⠊⠥⠇⠜⠇⠹ ⠙⠑⠁⠙ ⠁⠃⠳⠞
-  ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ ⡊ ⠍⠊⠣⠞ ⠙⠁⠧⠑ ⠃⠑⠲ ⠔⠊⠇⠔⠫⠂ ⠍⠹⠎⠑⠇⠋⠂ ⠞⠕
-  ⠗⠑⠛⠜⠙ ⠁ ⠊⠕⠋⠋⠔⠤⠝⠁⠊⠇ ⠁⠎ ⠹⠑ ⠙⠑⠁⠙⠑⠌ ⠏⠊⠑⠊⠑ ⠕⠋ ⠊⠗⠕⠝⠍⠕⠝⠛⠻⠹
-  ⠔ ⠹⠑ ⠞⠗⠁⠙⠑⠲ ⡃⠥⠞ ⠹⠑ ⠺⠊⠎⠙⠕⠍ ⠕⠋ ⠳⠗ ⠁⠝⠊⠑⠌⠕⠗⠎
-  ⠊⠎ ⠔ ⠹⠑ ⠎⠊⠍⠊⠇⠑⠆ ⠁⠝⠙ ⠍⠹ ⠥⠝⠙⠁⠇⠇⠪⠫ ⠙⠁⠝⠙⠎
-  ⠩⠁⠇⠇ ⠝⠕⠞ ⠙⠊⠌⠥⠗⠃ ⠊⠞⠂ ⠕⠗ ⠹⠑ ⡊⠳⠝⠞⠗⠹⠰⠎ ⠙⠕⠝⠑ ⠋⠕⠗⠲ ⡹⠳
-  ⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞
-  ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
+  色は匂へど   いろはにほへと   イロハニホヘト   イロハニホヘド   以呂波耳本部止
+  散りぬるを   ちりぬるを       チリヌルヲ       チリヌルヲ      千利奴流乎
+  我が世誰ぞ   わかよたれそ    ワカヨタレソ    ワカヨタレソ     和加餘多連曽
+  常ならん     つねならむ       ツネナラム       ツネナラム      津祢那良牟
+  有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
+  今日越えて   けふこえて       ケフコエテ       ケフコエテ      計不己衣天
+  浅き夢見じ   あさきゆめみし   アサキユメミシ   アサキユメミシ    阿佐伎喩女美之
+  酔ひもせず   ゑひもせす       ヱヒモセスン     ウェヒモセスン    恵比毛勢須
 
 
-Compact font selection example text:
+Chinese:
 
 
-  ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
-  abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
-  –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
-  ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
+  Most common characters:
+
+  的一是不了在人有我他这个们中来上大为和国地到以说时
+  要就出会可也你对生能而子那得于着下自之年过发后作里
+
+  Transliteration test:
+
+  女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
+
+  Extension blocks:
+
+  A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
+
+  Qiān zì wén 千字文 by Xing Si Zhou:
+
+  天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
+  閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
+  劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
 
 Greetings in various languages:
 
 
 Greetings in various languages: