braille of english pangram instead
[unicode-sampler.git] / unicode.txt
1
2 UTF-8 encoded sample plain-text file
3 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
4
5 Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25
6
7
8 The ASCII compatible UTF-8 encoding used in this plain-text file
9 is defined in Unicode, ISO 10646-1, and RFC 2279.
10
11
12 Using Unicode/UTF-8, you can write in emails and source code things such as
13
14 Mathematics and sciences:
15
16   ∮ E⋅da = Q,  n → ∞, ∑ f(i) = ∏ g(i),      ⎧⎡⎛┌─────┐⎞⎤⎫
17                                             ⎪⎢⎜│a²+b³ ⎟⎥⎪
18   ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β),    ⎪⎢⎜│───── ⎟⎥⎪
19                                             ⎪⎢⎜⎷ c₈   ⎟⎥⎪
20   ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ,                   ⎨⎢⎜       ⎟⎥⎬
21                                             ⎪⎢⎜ ∞     ⎟⎥⎪
22   ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
23                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
24   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
25
26 English panphone (traditional, IPA, Braille):
27
28   Just as the French queen looked for it, she heard that symphony again.
29   A beige hue on the waters of the loch impressed all, including young Arthur.
30
31   ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
32   ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
33
34   ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠑⠝⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
35   ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
36
37 APL:
38
39   ((V⍳V)=⍳⍴V)/V←,V    ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
40   ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
41
42 Nicer typography in plain text files:
43
44   ╔══════════════════════════════════════════╗
45   ║                                          ║
46   ║   • ‘single’ and “double” quotes         ║
47   ║                                          ║
48   ║   • Curly apostrophes: “We’ve been here” ║
49   ║                                          ║
50   ║   • Latin-1 apostrophe and accents: '´`  ║
51   ║                                          ║
52   ║   • ‚deutsche‘ „Anführungszeichen“       ║
53   ║                                          ║
54   ║   • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …      ║
55   ║                                          ║
56   ║   • ASCII safety test: 1lI|, 0OD, 8B     ║
57   ║                      ╭─────────╮         ║
58   ║   • the euro symbol: │ 14.95 € │         ║
59   ║                      ╰─────────╯         ║
60   ╚══════════════════════════════════════════╝
61
62 Combining characters:
63
64   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
65
66 Greek (Polytonic):
67
68   Σὲ γνωρίζω ἀπὸ τὴν κόψη
69   τοῦ σπαθιοῦ τὴν τρομερή,
70   σὲ γνωρίζω ἀπὸ τὴν ὄψη
71   ποὺ μὲ βία μετράει τὴ γῆ.
72
73   ᾿Απ᾿ τὰ κόκκαλα βγαλμένη
74   τῶν ῾Ελλήνων τὰ ἱερά
75   καὶ σὰν πρῶτα ἀνδρειωμένη
76   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
77
78   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
79   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
80   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
81   τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿
82   εἰς τοῦτο προήκοντα,  ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ
83   πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν
84   οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι,
85   οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν
86   ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον
87   τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι
88   γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν
89   προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους
90   σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ
91   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
92   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
93   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
94                                   Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
95
96 Georgian:
97
98   ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
99
100   ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
101   მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
102   ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
103
104 Russian:
105
106   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
107   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
108   Конференция соберет широкий круг экспертов по  вопросам глобального
109   Интернета и Unicode, локализации и интернационализации, воплощению и
110   применению Unicode в различных операционных системах и программных
111   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
112
113 Hebrew:
114
115   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
116   הבינלאומי העשירי, שייערך בין התאריכים 12־10 במרץ 1997, בְּמָיְינְץ שבגרמניה.
117
118 Hindi:
119
120   हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
121   हैं, पर इन में कितनी सच्चाई है यह कहना कठिन है।
122   कहा जाता है उनका जन्म सन् १४७८
123   में दिल्ली के पास एक ग़रीब ब्राह्मीण परिवार में हुआ।
124   जनश्रुति के अनुसार सूरदास जन्म से ही अंधे थे। आजकल थी
125   अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
126   रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
127
128 Thai (UCS Level 2):
129
130     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
131   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
132     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
133   โฮจิ๋นเรียกทัพทั่วหัวเมืองมา         หมายจะฆ่ามดชั่วตัวสำคัญ
134     เหมือนขับไสไล่เสือจากเคหา      รับหมาป่าเข้ามาเลยอาสัญ
135   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
136     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
137   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
138   [----------------------------|------------------------]
139    (second column should align ⬏)
140
141 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
142
143   யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
144   பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
145   நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
146   தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
147
148 Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
149
150   ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
151   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
152
153   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
154   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
155   ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
156   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
157
158 Ethiopian:
159
160   ሰማይ አይታረስ ንጉሥ አይከሰስ።
161   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
162   ጌጥ ያለቤቱ ቁምጥና ነው።
163   ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው።
164   የአፍ ወለምታ በቅቤ አይታሽም።
165   አይጥ በበላ ዳዋ ተመታ።
166   ሲተረጉሙ ይደረግሙ።
167   ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።
168   ድር ቢያብር አንበሳ ያስር።
169   ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም።
170   እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም።
171   የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ።
172   ሥራ ከመፍታት ልጄን ላፋታት።
173   ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል።
174   የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ።
175   ተንጋሎ ቢተፉ ተመልሶ ባፉ።
176   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
177   እግርህን በፍራሽህ ልክ ዘርጋ።
178
179 Ænglisc:
180
181   ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
182
183   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
184   He said that he lived in the northern land near the Western Sea.
185
186 Tibetan Declaration of Rights:
187
188   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
189   འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
190   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
191   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
192
193 Japanese Iroha いろは:
194
195   kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
196
197   色は匂へど   いろはにほへと   イロハニホヘト   イロハニホヘド   以呂波耳本部止
198   散りぬるを   ちりぬるを       チリヌルヲ       チリヌルヲ      千利奴流乎
199   我が世誰ぞ   わかよたれそ    ワカヨタレソ    ワカヨタレソ     和加餘多連曽
200   常ならん     つねならむ       ツネナラム       ツネナラム      津祢那良牟
201   有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
202   今日越えて   けふこえて       ケフコエテ       ケフコエテ      計不己衣天
203   浅き夢見じ   あさきゆめみし   アサキユメミシ   アサキユメミシ    阿佐伎喩女美之
204   酔ひもせず   ゑひもせす       ヱヒモセスン     ウェヒモセスン    恵比毛勢須
205
206 Chinese:
207
208   Most common characters:
209
210   的一是不了在人有我他这个们中来上大为和国地到以说时
211   要就出会可也你对生能而子那得于着下自之年过发后作里
212
213   Transliteration test:
214
215   女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
216
217   Extension blocks:
218
219   A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
220
221   Qiān zì wén 千字文 by Xing Si Zhou:
222
223   天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
224   閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
225   劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
226
227 Compact font selection example text:
228
229   ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
230   abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
231   –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
232   ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
233
234 Greetings in various languages:
235
236   Hello world, Καλημέρα κόσμε, コンニチハ
237
238 Box drawing alignment tests:                                          █
239                                                                       ▉
240   ╔══╦══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   ╷  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳
241   ║┌─╨─┐║  │╔═╧═╗│  │╒═╪═╕│  │╓─╁─╖│  ┃┌─╂─┐┃  ┗╃╄┙  ╶┼╴╺╋╸┠┼┨ ┝╋┥    ▋ ╲╱╲╱╳╳╳
242   ║│╲ ╱│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╿ │┃  ┍╅╆┓   ╵  ╹ ┗┷┛ └┸┘    ▌ ╱╲╱╲╳╳╳
243   ╠╡ ╳ ╞╣  ├╢   ╟┤  ├┼─┼─┼┤  ├╫─╂─╫┤  ┣┿╾┼╼┿┫  ┕┛┖┚     ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳
244   ║│╱ ╲│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╽ │┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▎
245   ║└─╥─┘║  │╚═╤═╝│  │╘═╪═╛│  │╙─╀─╜│  ┃└─╂─┘┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▏
246   ╚══╩══╝  └──┴──┘  ╰──┴──╯  ╰──┴──╯  ┗━━┻━━┛  ▗▄▖▛▀▜   └╌╌┘ ╎ ┗╍╍┛ ┋  ▁▂▃▄▅▆▇█
247                                                ▝▀▘▙▄▟