generic font overview at beginning
[unicode-sampler.git] / unicode.txt
1 Unicode sampler
2 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
3 Test support of various text encoded with Unicode up to version 8.0 (2015).
4
5 Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
6 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
7
8 Code:
9
10   <html><pre><span class=""><!-- H&#x54;M --></span>
11
12   Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
13
14   perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
15
16   ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
17
18 Mathematics and sciences:
19
20   ∮ E⋅da = Q,  n → ∞, ∑ f(i) = ∏ g(i),      ⎧⎡⎛┌─────┐⎞⎤⎫
21                                             ⎪⎢⎜│a²+b³ ⎟⎥⎪
22   ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β),    ⎪⎢⎜│───── ⎟⎥⎪
23                                             ⎪⎢⎜⎷ c₈   ⎟⎥⎪
24   ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ,                   ⎨⎢⎜       ⎟⎥⎬
25                                             ⎪⎢⎜ ∞     ⎟⎥⎪
26   ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
27                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
28   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
29
30 Compact font overview:
31
32   ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
33   abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
34   –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
35   ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
36
37 English panphone (traditional, IPA, Braille):
38
39   Just as the French queen looked for it, she heard that symphony again.
40   A beige hue on the waters of the loch impressed all, including young Arthur.
41
42   ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
43   ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
44
45   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
46   ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
47
48 Nicer typography in plain text files:
49
50   ╔══════════════════════════════════════════╗
51   ║                                          ║
52   ║   • ‘single’ and “double” quotes         ║
53   ║                                          ║
54   ║   • Curly apostrophes: “We’ve been here” ║
55   ║                                          ║
56   ║   • Latin-1 apostrophe and accents: '´`  ║
57   ║                                          ║
58   ║   • ‚deutsche‘ „Anführungszeichen“       ║
59   ║                                          ║
60   ║   • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …      ║
61   ║                                          ║
62   ║   • ASCII safety test: 1lI|, 0OD, 8B     ║
63   ║                      ╭─────────╮         ║
64   ║   • the euro symbol: │ 14.95 € │         ║
65   ║                      ╰─────────╯         ║
66   ╚══════════════════════════════════════════╝
67
68 Combining characters:
69
70   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
71
72 Greek (Polytonic):
73
74   Σὲ γνωρίζω ἀπὸ τὴν κόψη
75   τοῦ σπαθιοῦ τὴν τρομερή,
76   σὲ γνωρίζω ἀπὸ τὴν ὄψη
77   ποὺ μὲ βία μετράει τὴ γῆ.
78
79   ᾿Απ᾿ τὰ κόκκαλα βγαλμένη
80   τῶν ῾Ελλήνων τὰ ἱερά
81   καὶ σὰν πρῶτα ἀνδρειωμένη
82   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
83
84   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
85   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
86   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
87   τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿
88   εἰς τοῦτο προήκοντα,  ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ
89   πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν
90   οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι,
91   οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν
92   ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον
93   τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι
94   γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν
95   προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους
96   σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ
97   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
98   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
99   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
100                                   Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
101
102 Georgian:
103
104   ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
105
106   ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
107   მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
108   ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
109
110 Russian:
111
112   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
113   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
114   Конференция соберет широкий круг экспертов по  вопросам глобального
115   Интернета и Unicode, локализации и интернационализации, воплощению и
116   применению Unicode в различных операционных системах и программных
117   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
118
119 Sakha (Yakut) Declaration of Rights:
120
121   Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
122   Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
123   бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
124
125 Kazakh equivalents:
126
127   Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
128   дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
129   бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
130
131   بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
132   دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
133   ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
134
135 Hebrew:
136
137   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
138   הבינלאומי העשירי, שייערך בין התאריכים 12־10 במרץ 1997, בְּמָיְינְץ שבגרמניה.
139
140 Hindi:
141
142   हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
143   हैं, पर इन में कितनी सच्चाई है यह कहना कठिन है।
144   कहा जाता है उनका जन्म सन् १४७८
145   में दिल्ली के पास एक ग़रीब ब्राह्मीण परिवार में हुआ।
146   जनश्रुति के अनुसार सूरदास जन्म से ही अंधे थे। आजकल थी
147   अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
148   रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
149
150 Thai (UCS Level 2):
151
152     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
153   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
154     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
155   โฮจิ๋นเรียกทัพทั่วหัวเมืองมา         หมายจะฆ่ามดชั่วตัวสำคัญ
156     เหมือนขับไสไล่เสือจากเคหา      รับหมาป่าเข้ามาเลยอาสัญ
157   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
158     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
159   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
160   [----------------------------|------------------------]
161    (second column should align ⬏)
162
163 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
164
165   யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
166   பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
167   நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
168   தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
169
170 Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
171
172   ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
173   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
174
175   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
176   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
177   ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
178   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
179
180 Ethiopian:
181
182   ሰማይ አይታረስ ንጉሥ አይከሰስ።
183   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
184   ጌጥ ያለቤቱ ቁምጥና ነው።
185   ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው።
186   የአፍ ወለምታ በቅቤ አይታሽም።
187   አይጥ በበላ ዳዋ ተመታ።
188   ሲተረጉሙ ይደረግሙ።
189   ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።
190   ድር ቢያብር አንበሳ ያስር።
191   ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም።
192   እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም።
193   የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ።
194   ሥራ ከመፍታት ልጄን ላፋታት።
195   ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል።
196   የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ።
197   ተንጋሎ ቢተፉ ተመልሶ ባፉ።
198   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
199   እግርህን በፍራሽህ ልክ ዘርጋ።
200
201 Ænglisc:
202
203   ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
204
205   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
206   He said that he lived in the northern land near the Western Sea.
207
208 Tibetan Declaration of Rights:
209
210   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
211   འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
212   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
213   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
214
215 Japanese Iroha いろは:
216
217   kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
218
219   色は匂へど   いろはにほへと   イロハニホヘト   イロハニホヘド   以呂波耳本部止
220   散りぬるを   ちりぬるを       チリヌルヲ       チリヌルヲ      千利奴流乎
221   我が世誰ぞ   わかよたれそ    ワカヨタレソ    ワカヨタレソ     和加餘多連曽
222   常ならん     つねならむ       ツネナラム       ツネナラム      津祢那良牟
223   有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
224   今日越えて   けふこえて       ケフコエテ       ケフコエテ      計不己衣天
225   浅き夢見じ   あさきゆめみし   アサキユメミシ   アサキユメミシ    阿佐伎喩女美之
226   酔ひもせず   ゑひもせす       ヱヒモセスン     ウェヒモセスン    恵比毛勢須
227
228 Chinese:
229
230   Most common characters:
231
232   的一是不了在人有我他这个们中来上大为和国地到以说时
233   要就出会可也你对生能而子那得于着下自之年过发后作里
234
235   Transliteration test:
236
237   女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
238
239   Extension blocks:
240
241   A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
242
243   Qiān zì wén 千字文 by Xing Si Zhou:
244
245   天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
246   閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
247   劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
248
249 Greetings in various languages:
250
251   Hello world, Καλημέρα κόσμε, コンニチハ
252
253 Box drawing alignment tests:                                          █
254                                                                       ▉
255   ╔══╦══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   ╷  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳
256   ║┌─╨─┐║  │╔═╧═╗│  │╒═╪═╕│  │╓─╁─╖│  ┃┌─╂─┐┃  ┗╃╄┙  ╶┼╴╺╋╸┠┼┨ ┝╋┥    ▋ ╲╱╲╱╳╳╳
257   ║│╲ ╱│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╿ │┃  ┍╅╆┓   ╵  ╹ ┗┷┛ └┸┘    ▌ ╱╲╱╲╳╳╳
258   ╠╡ ╳ ╞╣  ├╢   ╟┤  ├┼─┼─┼┤  ├╫─╂─╫┤  ┣┿╾┼╼┿┫  ┕┛┖┚     ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳
259   ║│╱ ╲│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╽ │┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▎
260   ║└─╥─┘║  │╚═╤═╝│  │╘═╪═╛│  │╙─╀─╜│  ┃└─╂─┘┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▏
261   ╚══╩══╝  └──┴──┘  ╰──┴──╯  ╰──┴──╯  ┗━━┻━━┛  ▗▄▖▛▀▜   └╌╌┘ ╎ ┗╍╍┛ ┋  ▁▂▃▄▅▆▇█
262                                                ▝▀▘▙▄▟