border around font overview instead of typography list
[unicode-sampler.git] / unicode.txt
1 Unicode sampler
2 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
3 Test support of various text encoded with Unicode up to version 8.0 (2015).
4
5 Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
6 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
7
8 Code:
9
10   <html><pre><span class=""><!-- H&#x54;M --></span>
11
12   Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
13
14   perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
15
16   ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
17
18 Mathematics and sciences:
19
20   ∮ E⋅da = Q,  n → ∞, ∑ f(i) = ∏ g(i),      ⎧⎡⎛┌─────┐⎞⎤⎫
21                                             ⎪⎢⎜│a²+b³ ⎟⎥⎪
22   ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β),    ⎪⎢⎜│───── ⎟⎥⎪
23                                             ⎪⎢⎜⎷ c₈   ⎟⎥⎪
24   ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ,                   ⎨⎢⎜       ⎟⎥⎬
25                                             ⎪⎢⎜ ∞     ⎟⎥⎪
26   ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
27                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
28   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
29
30 Compact font overview:
31
32   ╔═══════════════════════════════════════════════════════════════╗
33   ║ _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏṆÞß ΑΒΓΔΩὮ АБВГДЯ ԱႠא $€     ║
34   ║ @abcdefghijklmnopqrstuvwxyz åāčếəṇþſ αβγδωὦ абвгдя աაا ¥£     ║
35   ║ [-0123456789] !¿?#%‰&©/*•† (.:;,…) {'"|“’”} +×=≠½²∈∞ ↗┌╁╖░☺ � ║
36   ╚═══════════════════════════════════════════════════════════════╝
37
38 English panphone (traditional, IPA, Braille):
39
40   Just as the French queen looked for it, she heard that symphony again.
41   A beige hue on the waters of the loch impressed all, including young Arthur.
42
43   ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
44   ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
45
46   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
47   ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
48
49 Proper typography:
50
51   • ‘single’ and “double” quotes
52
53   • Curly apostrophes: “We’ve been here”
54
55   • Latin-1 apostrophe and accents: '´`
56
57   • ‚deutsche‘ „Anführungszeichen“
58
59   • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …
60
61   • ASCII safety test: 1lI|, 0OD, 8B
62                      ╭─────────╮
63   • the euro symbol: │ 14.95 € │
64                      ╰─────────╯
65
66 Combining characters:
67
68   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
69
70 Pangrams:
71
72   cz: Příliš žluťoučký kůň úpěl ďábelské ódy.
73   eo: Ĉeĥa ĉiuliteraĵo ŝajne kontraŭĉapeliĝis.  (ϗ eĥoŝanĝº ĉiĵaŭde)
74   fr: Le cœur déçu mais l'âme plutôt naïve, Louÿs rêva de crapaüter en
75       canoë au delà des îles, près du mälström où brûlent les novæ.
76   hu: Új, „Exvőd = fél pár” című show közügy Quitóban.
77   ig: Nne, nna, wepụ he’l’ụjọ dum n’ime ọzụzụ ụmụ, vufesi obi nye Chukwu,
78       ṅụrịanụ, gbakọọnụ kpaa, kwee ya ka o guzoshie ike; ọ ghaghị ito,
79       nwapụta ezi agwa.
80   ir: Ċuaiġ bé ṁórṡáċ le dlúṫspád fíorḟinn trí hata mo ḋea-ṗorcáin ḃig, ⁊ꞃl.
81   is: Sævör grét áðan því úlpan var ónýt.
82   lv: Glāžšķūņa rūķīši dzērumā čiepj Baha koncertflīģeļu vākus.
83   nl: Wijf lokt u cq 'r pa dmv 'n zg sexy bh. (af: én ʼn kwêvoëltjie)
84   pl: Pchnąć w tę łódź jeża lub ośm skrzyń fig. (Zażółć gęślą jaźń)
85   ro: Muzicologă în bej vând whisky și tequila, preț fix.
86   se: Vuol Ruoŧa geđggiid leat máŋga luosa ja čuovžža.
87   sk: Starý kôň na hŕbe kníh žuje tíško povädnuté ruže,
88       na stĺpe sa ďateľ učí kvákať novú ódu o živote.
89   tr: PİJAMALİ HASTA, yağız şoföre çabucak güvendi.
90   vt: Do bạch kim rất quý, sẽ để lắp vô xương.
91   yo: Ìwò̩fà ń yò̩ séji tó gbojúmó̩, ó hàn pákànpò̩ gan-an nis̩é̩ rè̩ bó dò̩la.
92
93 German ligatures:
94
95   Im finſteren Jagdſchloß am offenen Felsquellwaſſer patzte der affig‐flatterhafte
96   kauzig‐höfliche Bäcker über ſeinem verſifften kniffligen C‐Xylophon.
97
98 Greek (Polytonic):
99
100   Σὲ γνωρίζω ἀπὸ τὴν κόψη
101   τοῦ σπαθιοῦ τὴν τρομερή,
102   σὲ γνωρίζω ἀπὸ τὴν ὄψη
103   ποὺ μὲ βία μετράει τὴ γῆ.
104
105   ᾿Απ᾿ τὰ κόκκαλα βγαλμένη
106   τῶν ῾Ελλήνων τὰ ἱερά
107   καὶ σὰν πρῶτα ἀνδρειωμένη
108   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
109
110   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
111   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
112   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
113   τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿
114   εἰς τοῦτο προήκοντα,  ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ
115   πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν
116   οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι,
117   οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν
118   ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον
119   τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι
120   γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν
121   προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους
122   σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ
123   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
124   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
125   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
126                                   Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
127
128 Georgian:
129
130   ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
131
132   ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
133   მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
134   ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
135
136 Russian:
137
138   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
139   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
140   Конференция соберет широкий круг экспертов по  вопросам глобального
141   Интернета и Unicode, локализации и интернационализации, воплощению и
142   применению Unicode в различных операционных системах и программных
143   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
144
145 Sakha (Yakut) Declaration of Rights:
146
147   Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
148   Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
149   бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
150
151 Kazakh equivalents:
152
153   Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
154   дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
155   бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
156
157   بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
158   دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
159   ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
160
161 Hebrew:
162
163   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
164   הבינלאומי העשירי, שייערך בין התאריכים 12־10 במרץ 1997, בְּמָיְינְץ שבגרמניה.
165
166 Hindi:
167
168   हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
169   हैं, पर इन में कितनी सच्चाई है यह कहना कठिन है।
170   कहा जाता है उनका जन्म सन् १४७८
171   में दिल्ली के पास एक ग़रीब ब्राह्मीण परिवार में हुआ।
172   जनश्रुति के अनुसार सूरदास जन्म से ही अंधे थे। आजकल थी
173   अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
174   रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
175
176 Thai (UCS Level 2):
177
178     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
179   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
180     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
181   โฮจิ๋นเรียกทัพทั่วหัวเมืองมา         หมายจะฆ่ามดชั่วตัวสำคัญ
182     เหมือนขับไสไล่เสือจากเคหา      รับหมาป่าเข้ามาเลยอาสัญ
183   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
184     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
185   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
186   [----------------------------|------------------------]
187    (second column should align ⬏)
188
189 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
190
191   யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
192   பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
193   நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
194   தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
195
196 Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
197
198   ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
199   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
200
201   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
202   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
203   ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
204   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
205
206 Ethiopian:
207
208   ሰማይ አይታረስ ንጉሥ አይከሰስ።
209   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
210   ጌጥ ያለቤቱ ቁምጥና ነው።
211   ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው።
212   የአፍ ወለምታ በቅቤ አይታሽም።
213   አይጥ በበላ ዳዋ ተመታ።
214   ሲተረጉሙ ይደረግሙ።
215   ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።
216   ድር ቢያብር አንበሳ ያስር።
217   ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም።
218   እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም።
219   የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ።
220   ሥራ ከመፍታት ልጄን ላፋታት።
221   ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል።
222   የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ።
223   ተንጋሎ ቢተፉ ተመልሶ ባፉ።
224   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
225   እግርህን በፍራሽህ ልክ ዘርጋ።
226
227 Ænglisc:
228
229   ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
230
231   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
232   He said that he lived in the northern land near the Western Sea.
233
234 Tibetan Declaration of Rights:
235
236   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
237   འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
238   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
239   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
240
241 Japanese Iroha いろは:
242
243   kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
244
245   色は匂へど   いろはにほへと   イロハニホヘト   イロハニホヘド   以呂波耳本部止
246   散りぬるを   ちりぬるを       チリヌルヲ       チリヌルヲ      千利奴流乎
247   我が世誰ぞ   わかよたれそ    ワカヨタレソ    ワカヨタレソ     和加餘多連曽
248   常ならん     つねならむ       ツネナラム       ツネナラム      津祢那良牟
249   有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
250   今日越えて   けふこえて       ケフコエテ       ケフコエテ      計不己衣天
251   浅き夢見じ   あさきゆめみし   アサキユメミシ   アサキユメミシ    阿佐伎喩女美之
252   酔ひもせず   ゑひもせす       ヱヒモセスン     ウェヒモセスン    恵比毛勢須
253
254 Chinese:
255
256   Most common characters:
257
258   的一是不了在人有我他这个们中来上大为和国地到以说时
259   要就出会可也你对生能而子那得于着下自之年过发后作里
260
261   Transliteration test:
262
263   女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
264
265   Extension blocks:
266
267   A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
268
269   Qiān zì wén 千字文 by Xing Si Zhou:
270
271   天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
272   閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
273   劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
274
275 Box drawing alignment tests:                                          █
276                                                                       ▉
277   ╔══╦══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   ╷  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳
278   ║┌─╨─┐║  │╔═╧═╗│  │╒═╪═╕│  │╓─╁─╖│  ┃┌─╂─┐┃  ┗╃╄┙  ╶┼╴╺╋╸┠┼┨ ┝╋┥    ▋ ╲╱╲╱╳╳╳
279   ║│╲ ╱│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╿ │┃  ┍╅╆┓   ╵  ╹ ┗┷┛ └┸┘    ▌ ╱╲╱╲╳╳╳
280   ╠╡ ╳ ╞╣  ├╢   ╟┤  ├┼─┼─┼┤  ├╫─╂─╫┤  ┣┿╾┼╼┿┫  ┕┛┖┚     ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳
281   ║│╱ ╲│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╽ │┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▎
282   ║└─╥─┘║  │╚═╤═╝│  │╘═╪═╛│  │╙─╀─╜│  ┃└─╂─┘┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▏
283   ╚══╩══╝  └──┴──┘  ╰──┴──╯  ╰──┴──╯  ┗━━┻━━┛  ▗▄▖▛▀▜   └╌╌┘ ╎ ┗╍╍┛ ┋  ▁▂▃▄▅▆▇█
284                                                ▝▀▘▙▄▟