drop greetings in "various" [3] languages
[unicode-sampler.git] / unicode.txt
1 Unicode sampler
2 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
3 Test support of various text encoded with Unicode up to version 8.0 (2015).
4
5 Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
6 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
7
8 Code:
9
10   <html><pre><span class=""><!-- H&#x54;M --></span>
11
12   Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
13
14   perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
15
16   ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
17
18 Mathematics and sciences:
19
20   ∮ E⋅da = Q,  n → ∞, ∑ f(i) = ∏ g(i),      ⎧⎡⎛┌─────┐⎞⎤⎫
21                                             ⎪⎢⎜│a²+b³ ⎟⎥⎪
22   ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β),    ⎪⎢⎜│───── ⎟⎥⎪
23                                             ⎪⎢⎜⎷ c₈   ⎟⎥⎪
24   ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ,                   ⎨⎢⎜       ⎟⎥⎬
25                                             ⎪⎢⎜ ∞     ⎟⎥⎪
26   ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
27                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
28   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
29
30 Compact font overview:
31
32   ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏṆÞß ΑΒΓΔΩὮ АБВГДЯ ԱႠא $€
33   abcdefghijklmnopqrstuvwxyz åāčếəṇþſ αβγδωὦ абвгдя աაا ¥£
34   -0123456789_ !¿?@#%/‰&©†*• (.:;…) '"|“’” +×=≠½²∈∞ ↗┌╁╖░☺ �
35
36 English panphone (traditional, IPA, Braille):
37
38   Just as the French queen looked for it, she heard that symphony again.
39   A beige hue on the waters of the loch impressed all, including young Arthur.
40
41   ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
42   ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
43
44   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
45   ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
46
47 Nicer typography in plain text files:
48
49   ╔══════════════════════════════════════════╗
50   ║                                          ║
51   ║   • ‘single’ and “double” quotes         ║
52   ║                                          ║
53   ║   • Curly apostrophes: “We’ve been here” ║
54   ║                                          ║
55   ║   • Latin-1 apostrophe and accents: '´`  ║
56   ║                                          ║
57   ║   • ‚deutsche‘ „Anführungszeichen“       ║
58   ║                                          ║
59   ║   • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …      ║
60   ║                                          ║
61   ║   • ASCII safety test: 1lI|, 0OD, 8B     ║
62   ║                      ╭─────────╮         ║
63   ║   • the euro symbol: │ 14.95 € │         ║
64   ║                      ╰─────────╯         ║
65   ╚══════════════════════════════════════════╝
66
67 Combining characters:
68
69   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
70
71 Greek (Polytonic):
72
73   Σὲ γνωρίζω ἀπὸ τὴν κόψη
74   τοῦ σπαθιοῦ τὴν τρομερή,
75   σὲ γνωρίζω ἀπὸ τὴν ὄψη
76   ποὺ μὲ βία μετράει τὴ γῆ.
77
78   ᾿Απ᾿ τὰ κόκκαλα βγαλμένη
79   τῶν ῾Ελλήνων τὰ ἱερά
80   καὶ σὰν πρῶτα ἀνδρειωμένη
81   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
82
83   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
84   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
85   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
86   τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿
87   εἰς τοῦτο προήκοντα,  ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ
88   πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν
89   οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι,
90   οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν
91   ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον
92   τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι
93   γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν
94   προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους
95   σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ
96   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
97   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
98   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
99                                   Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
100
101 Georgian:
102
103   ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
104
105   ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
106   მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
107   ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
108
109 Russian:
110
111   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
112   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
113   Конференция соберет широкий круг экспертов по  вопросам глобального
114   Интернета и Unicode, локализации и интернационализации, воплощению и
115   применению Unicode в различных операционных системах и программных
116   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
117
118 Sakha (Yakut) Declaration of Rights:
119
120   Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
121   Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
122   бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
123
124 Kazakh equivalents:
125
126   Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
127   дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
128   бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
129
130   بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
131   دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
132   ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
133
134 Hebrew:
135
136   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
137   הבינלאומי העשירי, שייערך בין התאריכים 12־10 במרץ 1997, בְּמָיְינְץ שבגרמניה.
138
139 Hindi:
140
141   हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
142   हैं, पर इन में कितनी सच्चाई है यह कहना कठिन है।
143   कहा जाता है उनका जन्म सन् १४७८
144   में दिल्ली के पास एक ग़रीब ब्राह्मीण परिवार में हुआ।
145   जनश्रुति के अनुसार सूरदास जन्म से ही अंधे थे। आजकल थी
146   अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
147   रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
148
149 Thai (UCS Level 2):
150
151     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
152   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
153     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
154   โฮจิ๋นเรียกทัพทั่วหัวเมืองมา         หมายจะฆ่ามดชั่วตัวสำคัญ
155     เหมือนขับไสไล่เสือจากเคหา      รับหมาป่าเข้ามาเลยอาสัญ
156   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
157     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
158   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
159   [----------------------------|------------------------]
160    (second column should align ⬏)
161
162 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
163
164   யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
165   பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
166   நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
167   தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
168
169 Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
170
171   ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
172   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
173
174   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
175   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
176   ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
177   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
178
179 Ethiopian:
180
181   ሰማይ አይታረስ ንጉሥ አይከሰስ።
182   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
183   ጌጥ ያለቤቱ ቁምጥና ነው።
184   ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው።
185   የአፍ ወለምታ በቅቤ አይታሽም።
186   አይጥ በበላ ዳዋ ተመታ።
187   ሲተረጉሙ ይደረግሙ።
188   ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።
189   ድር ቢያብር አንበሳ ያስር።
190   ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም።
191   እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም።
192   የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ።
193   ሥራ ከመፍታት ልጄን ላፋታት።
194   ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል።
195   የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ።
196   ተንጋሎ ቢተፉ ተመልሶ ባፉ።
197   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
198   እግርህን በፍራሽህ ልክ ዘርጋ።
199
200 Ænglisc:
201
202   ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
203
204   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
205   He said that he lived in the northern land near the Western Sea.
206
207 Tibetan Declaration of Rights:
208
209   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
210   འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
211   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
212   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
213
214 Japanese Iroha いろは:
215
216   kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
217
218   色は匂へど   いろはにほへと   イロハニホヘト   イロハニホヘド   以呂波耳本部止
219   散りぬるを   ちりぬるを       チリヌルヲ       チリヌルヲ      千利奴流乎
220   我が世誰ぞ   わかよたれそ    ワカヨタレソ    ワカヨタレソ     和加餘多連曽
221   常ならん     つねならむ       ツネナラム       ツネナラム      津祢那良牟
222   有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
223   今日越えて   けふこえて       ケフコエテ       ケフコエテ      計不己衣天
224   浅き夢見じ   あさきゆめみし   アサキユメミシ   アサキユメミシ    阿佐伎喩女美之
225   酔ひもせず   ゑひもせす       ヱヒモセスン     ウェヒモセスン    恵比毛勢須
226
227 Chinese:
228
229   Most common characters:
230
231   的一是不了在人有我他这个们中来上大为和国地到以说时
232   要就出会可也你对生能而子那得于着下自之年过发后作里
233
234   Transliteration test:
235
236   女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
237
238   Extension blocks:
239
240   A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
241
242   Qiān zì wén 千字文 by Xing Si Zhou:
243
244   天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
245   閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
246   劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
247
248 Box drawing alignment tests:                                          █
249                                                                       ▉
250   ╔══╦══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   ╷  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳
251   ║┌─╨─┐║  │╔═╧═╗│  │╒═╪═╕│  │╓─╁─╖│  ┃┌─╂─┐┃  ┗╃╄┙  ╶┼╴╺╋╸┠┼┨ ┝╋┥    ▋ ╲╱╲╱╳╳╳
252   ║│╲ ╱│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╿ │┃  ┍╅╆┓   ╵  ╹ ┗┷┛ └┸┘    ▌ ╱╲╱╲╳╳╳
253   ╠╡ ╳ ╞╣  ├╢   ╟┤  ├┼─┼─┼┤  ├╫─╂─╫┤  ┣┿╾┼╼┿┫  ┕┛┖┚     ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳
254   ║│╱ ╲│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╽ │┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▎
255   ║└─╥─┘║  │╚═╤═╝│  │╘═╪═╛│  │╙─╀─╜│  ┃└─╂─┘┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▏
256   ╚══╩══╝  └──┴──┘  ╰──┴──╯  ╰──┴──╯  ┗━━┻━━┛  ▗▄▖▛▀▜   └╌╌┘ ╎ ┗╍╍┛ ┋  ▁▂▃▄▅▆▇█
257                                                ▝▀▘▙▄▟