perl code snippet for additional programming symbols
[unicode-sampler.git] / unicode.txt
1 Unicode sampler
2 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
3 Test support of various text encoded with Unicode up to version 8.0 (2015).
4
5 Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
6 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
7
8 Code:
9
10   <html><pre><span class=""><!-- H&#x54;M --></span>
11
12   Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
13
14   perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
15
16 Mathematics and sciences:
17
18   ∮ E⋅da = Q,  n → ∞, ∑ f(i) = ∏ g(i),      ⎧⎡⎛┌─────┐⎞⎤⎫
19                                             ⎪⎢⎜│a²+b³ ⎟⎥⎪
20   ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β),    ⎪⎢⎜│───── ⎟⎥⎪
21                                             ⎪⎢⎜⎷ c₈   ⎟⎥⎪
22   ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ,                   ⎨⎢⎜       ⎟⎥⎬
23                                             ⎪⎢⎜ ∞     ⎟⎥⎪
24   ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
25                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
26   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
27
28 English panphone (traditional, IPA, Braille):
29
30   Just as the French queen looked for it, she heard that symphony again.
31   A beige hue on the waters of the loch impressed all, including young Arthur.
32
33   ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
34   ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
35
36   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
37   ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
38
39 APL:
40
41   ((V⍳V)=⍳⍴V)/V←,V    ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
42   ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
43
44 Nicer typography in plain text files:
45
46   ╔══════════════════════════════════════════╗
47   ║                                          ║
48   ║   • ‘single’ and “double” quotes         ║
49   ║                                          ║
50   ║   • Curly apostrophes: “We’ve been here” ║
51   ║                                          ║
52   ║   • Latin-1 apostrophe and accents: '´`  ║
53   ║                                          ║
54   ║   • ‚deutsche‘ „Anführungszeichen“       ║
55   ║                                          ║
56   ║   • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …      ║
57   ║                                          ║
58   ║   • ASCII safety test: 1lI|, 0OD, 8B     ║
59   ║                      ╭─────────╮         ║
60   ║   • the euro symbol: │ 14.95 € │         ║
61   ║                      ╰─────────╯         ║
62   ╚══════════════════════════════════════════╝
63
64 Combining characters:
65
66   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
67
68 Greek (Polytonic):
69
70   Σὲ γνωρίζω ἀπὸ τὴν κόψη
71   τοῦ σπαθιοῦ τὴν τρομερή,
72   σὲ γνωρίζω ἀπὸ τὴν ὄψη
73   ποὺ μὲ βία μετράει τὴ γῆ.
74
75   ᾿Απ᾿ τὰ κόκκαλα βγαλμένη
76   τῶν ῾Ελλήνων τὰ ἱερά
77   καὶ σὰν πρῶτα ἀνδρειωμένη
78   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
79
80   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
81   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
82   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
83   τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿
84   εἰς τοῦτο προήκοντα,  ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ
85   πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν
86   οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι,
87   οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν
88   ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον
89   τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι
90   γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν
91   προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους
92   σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ
93   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
94   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
95   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
96                                   Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
97
98 Georgian:
99
100   ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
101
102   ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
103   მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
104   ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
105
106 Russian:
107
108   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
109   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
110   Конференция соберет широкий круг экспертов по  вопросам глобального
111   Интернета и Unicode, локализации и интернационализации, воплощению и
112   применению Unicode в различных операционных системах и программных
113   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
114
115 Sakha (Yakut) Declaration of Rights:
116
117   Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
118   Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
119   бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
120
121 Kazakh equivalents:
122
123   Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
124   дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
125   бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
126
127   بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
128   دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
129   ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
130
131 Hebrew:
132
133   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
134   הבינלאומי העשירי, שייערך בין התאריכים 12־10 במרץ 1997, בְּמָיְינְץ שבגרמניה.
135
136 Hindi:
137
138   हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
139   हैं, पर इन में कितनी सच्चाई है यह कहना कठिन है।
140   कहा जाता है उनका जन्म सन् १४७८
141   में दिल्ली के पास एक ग़रीब ब्राह्मीण परिवार में हुआ।
142   जनश्रुति के अनुसार सूरदास जन्म से ही अंधे थे। आजकल थी
143   अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
144   रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
145
146 Thai (UCS Level 2):
147
148     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
149   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
150     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
151   โฮจิ๋นเรียกทัพทั่วหัวเมืองมา         หมายจะฆ่ามดชั่วตัวสำคัญ
152     เหมือนขับไสไล่เสือจากเคหา      รับหมาป่าเข้ามาเลยอาสัญ
153   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
154     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
155   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
156   [----------------------------|------------------------]
157    (second column should align ⬏)
158
159 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
160
161   யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
162   பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
163   நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
164   தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
165
166 Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
167
168   ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
169   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
170
171   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
172   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
173   ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
174   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
175
176 Ethiopian:
177
178   ሰማይ አይታረስ ንጉሥ አይከሰስ።
179   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
180   ጌጥ ያለቤቱ ቁምጥና ነው።
181   ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው።
182   የአፍ ወለምታ በቅቤ አይታሽም።
183   አይጥ በበላ ዳዋ ተመታ።
184   ሲተረጉሙ ይደረግሙ።
185   ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።
186   ድር ቢያብር አንበሳ ያስር።
187   ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም።
188   እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም።
189   የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ።
190   ሥራ ከመፍታት ልጄን ላፋታት።
191   ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል።
192   የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ።
193   ተንጋሎ ቢተፉ ተመልሶ ባፉ።
194   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
195   እግርህን በፍራሽህ ልክ ዘርጋ።
196
197 Ænglisc:
198
199   ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
200
201   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
202   He said that he lived in the northern land near the Western Sea.
203
204 Tibetan Declaration of Rights:
205
206   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
207   འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
208   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
209   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
210
211 Japanese Iroha いろは:
212
213   kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
214
215   色は匂へど   いろはにほへと   イロハニホヘト   イロハニホヘド   以呂波耳本部止
216   散りぬるを   ちりぬるを       チリヌルヲ       チリヌルヲ      千利奴流乎
217   我が世誰ぞ   わかよたれそ    ワカヨタレソ    ワカヨタレソ     和加餘多連曽
218   常ならん     つねならむ       ツネナラム       ツネナラム      津祢那良牟
219   有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
220   今日越えて   けふこえて       ケフコエテ       ケフコエテ      計不己衣天
221   浅き夢見じ   あさきゆめみし   アサキユメミシ   アサキユメミシ    阿佐伎喩女美之
222   酔ひもせず   ゑひもせす       ヱヒモセスン     ウェヒモセスン    恵比毛勢須
223
224 Chinese:
225
226   Most common characters:
227
228   的一是不了在人有我他这个们中来上大为和国地到以说时
229   要就出会可也你对生能而子那得于着下自之年过发后作里
230
231   Transliteration test:
232
233   女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
234
235   Extension blocks:
236
237   A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
238
239   Qiān zì wén 千字文 by Xing Si Zhou:
240
241   天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
242   閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
243   劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
244
245 Compact font selection example text:
246
247   ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
248   abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
249   –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
250   ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
251
252 Greetings in various languages:
253
254   Hello world, Καλημέρα κόσμε, コンニチハ
255
256 Box drawing alignment tests:                                          █
257                                                                       ▉
258   ╔══╦══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   ╷  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳
259   ║┌─╨─┐║  │╔═╧═╗│  │╒═╪═╕│  │╓─╁─╖│  ┃┌─╂─┐┃  ┗╃╄┙  ╶┼╴╺╋╸┠┼┨ ┝╋┥    ▋ ╲╱╲╱╳╳╳
260   ║│╲ ╱│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╿ │┃  ┍╅╆┓   ╵  ╹ ┗┷┛ └┸┘    ▌ ╱╲╱╲╳╳╳
261   ╠╡ ╳ ╞╣  ├╢   ╟┤  ├┼─┼─┼┤  ├╫─╂─╫┤  ┣┿╾┼╼┿┫  ┕┛┖┚     ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳
262   ║│╱ ╲│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╽ │┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▎
263   ║└─╥─┘║  │╚═╤═╝│  │╘═╪═╛│  │╙─╀─╜│  ┃└─╂─┘┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▏
264   ╚══╩══╝  └──┴──┘  ╰──┴──╯  ╰──┴──╯  ┗━━┻━━┛  ▗▄▖▛▀▜   └╌╌┘ ╎ ┗╍╍┛ ┋  ▁▂▃▄▅▆▇█
265                                                ▝▀▘▙▄▟