ruby code for basic programming language overview
[unicode-sampler.git] / unicode.txt
1 Unicode sampler
2 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
3 Test support of various text encoded with Unicode up to version 8.0 (2015).
4
5 Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
6 Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
7
8 Code:
9
10   <html><pre><span class=""><!-- H&#x54;M --></span>
11
12   Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
13
14 Mathematics and sciences:
15
16   ∮ E⋅da = Q,  n → ∞, ∑ f(i) = ∏ g(i),      ⎧⎡⎛┌─────┐⎞⎤⎫
17                                             ⎪⎢⎜│a²+b³ ⎟⎥⎪
18   ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β),    ⎪⎢⎜│───── ⎟⎥⎪
19                                             ⎪⎢⎜⎷ c₈   ⎟⎥⎪
20   ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ,                   ⎨⎢⎜       ⎟⎥⎬
21                                             ⎪⎢⎜ ∞     ⎟⎥⎪
22   ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
23                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
24   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
25
26 English panphone (traditional, IPA, Braille):
27
28   Just as the French queen looked for it, she heard that symphony again.
29   A beige hue on the waters of the loch impressed all, including young Arthur.
30
31   ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
32   ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
33
34   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
35   ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
36
37 APL:
38
39   ((V⍳V)=⍳⍴V)/V←,V    ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
40   ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
41
42 Nicer typography in plain text files:
43
44   ╔══════════════════════════════════════════╗
45   ║                                          ║
46   ║   • ‘single’ and “double” quotes         ║
47   ║                                          ║
48   ║   • Curly apostrophes: “We’ve been here” ║
49   ║                                          ║
50   ║   • Latin-1 apostrophe and accents: '´`  ║
51   ║                                          ║
52   ║   • ‚deutsche‘ „Anführungszeichen“       ║
53   ║                                          ║
54   ║   • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …      ║
55   ║                                          ║
56   ║   • ASCII safety test: 1lI|, 0OD, 8B     ║
57   ║                      ╭─────────╮         ║
58   ║   • the euro symbol: │ 14.95 € │         ║
59   ║                      ╰─────────╯         ║
60   ╚══════════════════════════════════════════╝
61
62 Combining characters:
63
64   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
65
66 Greek (Polytonic):
67
68   Σὲ γνωρίζω ἀπὸ τὴν κόψη
69   τοῦ σπαθιοῦ τὴν τρομερή,
70   σὲ γνωρίζω ἀπὸ τὴν ὄψη
71   ποὺ μὲ βία μετράει τὴ γῆ.
72
73   ᾿Απ᾿ τὰ κόκκαλα βγαλμένη
74   τῶν ῾Ελλήνων τὰ ἱερά
75   καὶ σὰν πρῶτα ἀνδρειωμένη
76   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
77
78   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
79   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
80   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
81   τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿
82   εἰς τοῦτο προήκοντα,  ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ
83   πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν
84   οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι,
85   οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν
86   ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον
87   τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι
88   γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν
89   προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους
90   σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ
91   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
92   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
93   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
94                                   Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
95
96 Georgian:
97
98   ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
99
100   ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
101   მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
102   ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
103
104 Russian:
105
106   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
107   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
108   Конференция соберет широкий круг экспертов по  вопросам глобального
109   Интернета и Unicode, локализации и интернационализации, воплощению и
110   применению Unicode в различных операционных системах и программных
111   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
112
113 Sakha (Yakut) Declaration of Rights:
114
115   Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
116   Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
117   бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
118
119 Kazakh equivalents:
120
121   Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
122   дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
123   бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
124
125   بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
126   دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
127   ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
128
129 Hebrew:
130
131   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
132   הבינלאומי העשירי, שייערך בין התאריכים 12־10 במרץ 1997, בְּמָיְינְץ שבגרמניה.
133
134 Hindi:
135
136   हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
137   हैं, पर इन में कितनी सच्चाई है यह कहना कठिन है।
138   कहा जाता है उनका जन्म सन् १४७८
139   में दिल्ली के पास एक ग़रीब ब्राह्मीण परिवार में हुआ।
140   जनश्रुति के अनुसार सूरदास जन्म से ही अंधे थे। आजकल थी
141   अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
142   रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
143
144 Thai (UCS Level 2):
145
146     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
147   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
148     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
149   โฮจิ๋นเรียกทัพทั่วหัวเมืองมา         หมายจะฆ่ามดชั่วตัวสำคัญ
150     เหมือนขับไสไล่เสือจากเคหา      รับหมาป่าเข้ามาเลยอาสัญ
151   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
152     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
153   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
154   [----------------------------|------------------------]
155    (second column should align ⬏)
156
157 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
158
159   யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
160   பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
161   நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
162   தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
163
164 Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
165
166   ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
167   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
168
169   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
170   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
171   ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
172   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
173
174 Ethiopian:
175
176   ሰማይ አይታረስ ንጉሥ አይከሰስ።
177   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
178   ጌጥ ያለቤቱ ቁምጥና ነው።
179   ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው።
180   የአፍ ወለምታ በቅቤ አይታሽም።
181   አይጥ በበላ ዳዋ ተመታ።
182   ሲተረጉሙ ይደረግሙ።
183   ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።
184   ድር ቢያብር አንበሳ ያስር።
185   ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም።
186   እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም።
187   የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ።
188   ሥራ ከመፍታት ልጄን ላፋታት።
189   ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል።
190   የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ።
191   ተንጋሎ ቢተፉ ተመልሶ ባፉ።
192   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
193   እግርህን በፍራሽህ ልክ ዘርጋ።
194
195 Ænglisc:
196
197   ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
198
199   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
200   He said that he lived in the northern land near the Western Sea.
201
202 Tibetan Declaration of Rights:
203
204   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
205   འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
206   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
207   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
208
209 Japanese Iroha いろは:
210
211   kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
212
213   色は匂へど   いろはにほへと   イロハニホヘト   イロハニホヘド   以呂波耳本部止
214   散りぬるを   ちりぬるを       チリヌルヲ       チリヌルヲ      千利奴流乎
215   我が世誰ぞ   わかよたれそ    ワカヨタレソ    ワカヨタレソ     和加餘多連曽
216   常ならん     つねならむ       ツネナラム       ツネナラム      津祢那良牟
217   有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
218   今日越えて   けふこえて       ケフコエテ       ケフコエテ      計不己衣天
219   浅き夢見じ   あさきゆめみし   アサキユメミシ   アサキユメミシ    阿佐伎喩女美之
220   酔ひもせず   ゑひもせす       ヱヒモセスン     ウェヒモセスン    恵比毛勢須
221
222 Chinese:
223
224   Most common characters:
225
226   的一是不了在人有我他这个们中来上大为和国地到以说时
227   要就出会可也你对生能而子那得于着下自之年过发后作里
228
229   Transliteration test:
230
231   女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
232
233   Extension blocks:
234
235   A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
236
237   Qiān zì wén 千字文 by Xing Si Zhou:
238
239   天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
240   閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
241   劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
242
243 Compact font selection example text:
244
245   ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
246   abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
247   –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
248   ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
249
250 Greetings in various languages:
251
252   Hello world, Καλημέρα κόσμε, コンニチハ
253
254 Box drawing alignment tests:                                          █
255                                                                       ▉
256   ╔══╦══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   ╷  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳
257   ║┌─╨─┐║  │╔═╧═╗│  │╒═╪═╕│  │╓─╁─╖│  ┃┌─╂─┐┃  ┗╃╄┙  ╶┼╴╺╋╸┠┼┨ ┝╋┥    ▋ ╲╱╲╱╳╳╳
258   ║│╲ ╱│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╿ │┃  ┍╅╆┓   ╵  ╹ ┗┷┛ └┸┘    ▌ ╱╲╱╲╳╳╳
259   ╠╡ ╳ ╞╣  ├╢   ╟┤  ├┼─┼─┼┤  ├╫─╂─╫┤  ┣┿╾┼╼┿┫  ┕┛┖┚     ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳
260   ║│╱ ╲│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╽ │┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▎
261   ║└─╥─┘║  │╚═╤═╝│  │╘═╪═╛│  │╙─╀─╜│  ┃└─╂─┘┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▏
262   ╚══╩══╝  └──┴──┘  ╰──┴──╯  ╰──┴──╯  ┗━━┻━━┛  ▗▄▖▛▀▜   └╌╌┘ ╎ ┗╍╍┛ ┋  ▁▂▃▄▅▆▇█
263                                                ▝▀▘▙▄▟