amend dutch pangram with short afrikaans to cover accents
[unicode-sampler.git] / unicode.txt
1 Unicode sampler
2 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
3 Test support of various text encoded with Unicode up to version 8.0 (2015).
4
5 Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
6 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
7
8 Code:
9
10   <html><pre><span class=""><!-- H&#x54;M --></span>
11
12   Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
13
14   perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
15
16   ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
17
18 Mathematics and sciences:
19
20   ∮ E⋅da = Q,  n → ∞, ∑ f(i) = ∏ g(i),      ⎧⎡⎛┌─────┐⎞⎤⎫
21                                             ⎪⎢⎜│a²+b³ ⎟⎥⎪
22   ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β),    ⎪⎢⎜│───── ⎟⎥⎪
23                                             ⎪⎢⎜⎷ c₈   ⎟⎥⎪
24   ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ,                   ⎨⎢⎜       ⎟⎥⎬
25                                             ⎪⎢⎜ ∞     ⎟⎥⎪
26   ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
27                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
28   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
29
30 Compact font overview:
31
32   ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏṆÞß ΑΒΓΔΩὮ АБВГДЯ ԱႠא $€
33   abcdefghijklmnopqrstuvwxyz åāčếəṇþſ αβγδωὦ абвгдя աაا ¥£
34   -0123456789_ !¿?@#%/‰&©†*• (.:;…) '"|“’” +×=≠½²∈∞ ↗┌╁╖░☺ �
35
36 English panphone (traditional, IPA, Braille):
37
38   Just as the French queen looked for it, she heard that symphony again.
39   A beige hue on the waters of the loch impressed all, including young Arthur.
40
41   ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
42   ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
43
44   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
45   ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
46
47 Nicer typography in plain text files:
48
49   ╔══════════════════════════════════════════╗
50   ║                                          ║
51   ║   • ‘single’ and “double” quotes         ║
52   ║                                          ║
53   ║   • Curly apostrophes: “We’ve been here” ║
54   ║                                          ║
55   ║   • Latin-1 apostrophe and accents: '´`  ║
56   ║                                          ║
57   ║   • ‚deutsche‘ „Anführungszeichen“       ║
58   ║                                          ║
59   ║   • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …      ║
60   ║                                          ║
61   ║   • ASCII safety test: 1lI|, 0OD, 8B     ║
62   ║                      ╭─────────╮         ║
63   ║   • the euro symbol: │ 14.95 € │         ║
64   ║                      ╰─────────╯         ║
65   ╚══════════════════════════════════════════╝
66
67 Combining characters:
68
69   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
70
71 Pangrams:
72
73   cz: Příliš žluťoučký kůň úpěl ďábelské ódy.
74   eo: Ĉeĥa ĉiuliteraĵo ŝajne kontraŭĉapeliĝis.  (ϗ eĥoŝanĝº ĉiĵaŭde)
75   fr: Le cœur déçu mais l'âme plutôt naïve, Louÿs rêva de crapaüter en
76       canoë au delà des îles, près du mälström où brûlent les novæ.
77   hu: Új, „Exvőd = fél pár” című show közügy Quitóban.
78   ig: Nne, nna, wepụ he’l’ụjọ dum n’ime ọzụzụ ụmụ, vufesi obi nye Chukwu,
79       ṅụrịanụ, gbakọọnụ kpaa, kwee ya ka o guzoshie ike; ọ ghaghị ito,
80       nwapụta ezi agwa.
81   ir: Ċuaiġ bé ṁórṡáċ le dlúṫspád fíorḟinn trí hata mo ḋea-ṗorcáin ḃig, ⁊ꞃl.
82   is: Sævör grét áðan því úlpan var ónýt.
83   lv: Glāžšķūņa rūķīši dzērumā čiepj Baha koncertflīģeļu vākus.
84   nl: Wijf lokt u cq 'r pa dmv 'n zg sexy bh. (af: én ʼn kwêvoëltjie)
85   pl: Pchnąć w tę łódź jeża lub ośm skrzyń fig. (Zażółć gęślą jaźń)
86   ro: Muzicologă în bej vând whisky și tequila, preț fix.
87   se: Vuol Ruoŧa geđggiid leat máŋga luosa ja čuovžža.
88   sk: Starý kôň na hŕbe kníh žuje tíško povädnuté ruže,
89       na stĺpe sa ďateľ učí kvákať novú ódu o živote.
90   tr: PİJAMALİ HASTA, yağız şoföre çabucak güvendi.
91   vt: Do bạch kim rất quý, sẽ để lắp vô xương.
92   yo: Ìwò̩fà ń yò̩ séji tó gbojúmó̩, ó hàn pákànpò̩ gan-an nis̩é̩ rè̩ bó dò̩la.
93
94 Greek (Polytonic):
95
96   Σὲ γνωρίζω ἀπὸ τὴν κόψη
97   τοῦ σπαθιοῦ τὴν τρομερή,
98   σὲ γνωρίζω ἀπὸ τὴν ὄψη
99   ποὺ μὲ βία μετράει τὴ γῆ.
100
101   ᾿Απ᾿ τὰ κόκκαλα βγαλμένη
102   τῶν ῾Ελλήνων τὰ ἱερά
103   καὶ σὰν πρῶτα ἀνδρειωμένη
104   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
105
106   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
107   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
108   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
109   τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿
110   εἰς τοῦτο προήκοντα,  ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ
111   πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν
112   οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι,
113   οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν
114   ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον
115   τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι
116   γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν
117   προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους
118   σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ
119   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
120   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
121   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
122                                   Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
123
124 Georgian:
125
126   ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
127
128   ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
129   მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
130   ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
131
132 Russian:
133
134   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
135   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
136   Конференция соберет широкий круг экспертов по  вопросам глобального
137   Интернета и Unicode, локализации и интернационализации, воплощению и
138   применению Unicode в различных операционных системах и программных
139   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
140
141 Sakha (Yakut) Declaration of Rights:
142
143   Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
144   Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
145   бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
146
147 Kazakh equivalents:
148
149   Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
150   дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
151   бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
152
153   بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
154   دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
155   ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
156
157 Hebrew:
158
159   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
160   הבינלאומי העשירי, שייערך בין התאריכים 12־10 במרץ 1997, בְּמָיְינְץ שבגרמניה.
161
162 Hindi:
163
164   हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
165   हैं, पर इन में कितनी सच्चाई है यह कहना कठिन है।
166   कहा जाता है उनका जन्म सन् १४७८
167   में दिल्ली के पास एक ग़रीब ब्राह्मीण परिवार में हुआ।
168   जनश्रुति के अनुसार सूरदास जन्म से ही अंधे थे। आजकल थी
169   अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
170   रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
171
172 Thai (UCS Level 2):
173
174     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
175   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
176     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
177   โฮจิ๋นเรียกทัพทั่วหัวเมืองมา         หมายจะฆ่ามดชั่วตัวสำคัญ
178     เหมือนขับไสไล่เสือจากเคหา      รับหมาป่าเข้ามาเลยอาสัญ
179   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
180     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
181   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
182   [----------------------------|------------------------]
183    (second column should align ⬏)
184
185 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
186
187   யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
188   பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
189   நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
190   தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
191
192 Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
193
194   ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
195   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
196
197   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
198   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
199   ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
200   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
201
202 Ethiopian:
203
204   ሰማይ አይታረስ ንጉሥ አይከሰስ።
205   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
206   ጌጥ ያለቤቱ ቁምጥና ነው።
207   ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው።
208   የአፍ ወለምታ በቅቤ አይታሽም።
209   አይጥ በበላ ዳዋ ተመታ።
210   ሲተረጉሙ ይደረግሙ።
211   ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።
212   ድር ቢያብር አንበሳ ያስር።
213   ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም።
214   እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም።
215   የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ።
216   ሥራ ከመፍታት ልጄን ላፋታት።
217   ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል።
218   የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ።
219   ተንጋሎ ቢተፉ ተመልሶ ባፉ።
220   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
221   እግርህን በፍራሽህ ልክ ዘርጋ።
222
223 Ænglisc:
224
225   ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
226
227   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
228   He said that he lived in the northern land near the Western Sea.
229
230 Tibetan Declaration of Rights:
231
232   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
233   འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
234   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
235   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
236
237 Japanese Iroha いろは:
238
239   kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
240
241   色は匂へど   いろはにほへと   イロハニホヘト   イロハニホヘド   以呂波耳本部止
242   散りぬるを   ちりぬるを       チリヌルヲ       チリヌルヲ      千利奴流乎
243   我が世誰ぞ   わかよたれそ    ワカヨタレソ    ワカヨタレソ     和加餘多連曽
244   常ならん     つねならむ       ツネナラム       ツネナラム      津祢那良牟
245   有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
246   今日越えて   けふこえて       ケフコエテ       ケフコエテ      計不己衣天
247   浅き夢見じ   あさきゆめみし   アサキユメミシ   アサキユメミシ    阿佐伎喩女美之
248   酔ひもせず   ゑひもせす       ヱヒモセスン     ウェヒモセスン    恵比毛勢須
249
250 Chinese:
251
252   Most common characters:
253
254   的一是不了在人有我他这个们中来上大为和国地到以说时
255   要就出会可也你对生能而子那得于着下自之年过发后作里
256
257   Transliteration test:
258
259   女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
260
261   Extension blocks:
262
263   A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
264
265   Qiān zì wén 千字文 by Xing Si Zhou:
266
267   天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
268   閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
269   劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
270
271 Box drawing alignment tests:                                          █
272                                                                       ▉
273   ╔══╦══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   ╷  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳
274   ║┌─╨─┐║  │╔═╧═╗│  │╒═╪═╕│  │╓─╁─╖│  ┃┌─╂─┐┃  ┗╃╄┙  ╶┼╴╺╋╸┠┼┨ ┝╋┥    ▋ ╲╱╲╱╳╳╳
275   ║│╲ ╱│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╿ │┃  ┍╅╆┓   ╵  ╹ ┗┷┛ └┸┘    ▌ ╱╲╱╲╳╳╳
276   ╠╡ ╳ ╞╣  ├╢   ╟┤  ├┼─┼─┼┤  ├╫─╂─╫┤  ┣┿╾┼╼┿┫  ┕┛┖┚     ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳
277   ║│╱ ╲│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╽ │┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▎
278   ║└─╥─┘║  │╚═╤═╝│  │╘═╪═╛│  │╙─╀─╜│  ┃└─╂─┘┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▏
279   ╚══╩══╝  └──┴──┘  ╰──┴──╯  ╰──┴──╯  ┗━━┻━━┛  ▗▄▖▛▀▜   └╌╌┘ ╎ ┗╍╍┛ ┋  ▁▂▃▄▅▆▇█
280                                                ▝▀▘▙▄▟