2 UTF-8 encoded sample plain-text file
3 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
5 Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25
8 The ASCII compatible UTF-8 encoding used in this plain-text file
9 is defined in Unicode, ISO 10646-1, and RFC 2279.
12 Using Unicode/UTF-8, you can write in emails and source code things such as
14 Mathematics and sciences:
16 ∮ E⋅da = Q, n → ∞, ∑ f(i) = ∏ g(i), ⎧⎡⎛┌─────┐⎞⎤⎫
18 ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β), ⎪⎢⎜│───── ⎟⎥⎪
20 ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ, ⎨⎢⎜ ⎟⎥⎬
22 ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫), ⎪⎢⎜ ⎲ ⎟⎥⎪
24 2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm ⎩⎣⎝i=1 ⎠⎦⎭
26 English panphone (traditional, IPA, Braille):
28 Just as the French queen looked for it, she heard that symphony again.
29 A beige hue on the waters of the loch impressed all, including young Arthur.
31 ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
32 ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
34 ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠑⠝⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
35 ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
39 ((V⍳V)=⍳⍴V)/V←,V ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
40 ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
42 Nicer typography in plain text files:
44 ╔══════════════════════════════════════════╗
46 ║ • ‘single’ and “double” quotes ║
48 ║ • Curly apostrophes: “We’ve been here” ║
50 ║ • Latin-1 apostrophe and accents: '´` ║
52 ║ • ‚deutsche‘ „Anführungszeichen“ ║
54 ║ • †, ‡, ‰, •, 3–4, —, −5/+5, ™, … ║
56 ║ • ASCII safety test: 1lI|, 0OD, 8B ║
58 ║ • the euro symbol: │ 14.95 € │ ║
60 ╚══════════════════════════════════════════╝
64 STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
68 Σὲ γνωρίζω ἀπὸ τὴν κόψη
69 τοῦ σπαθιοῦ τὴν τρομερή,
70 σὲ γνωρίζω ἀπὸ τὴν ὄψη
71 ποὺ μὲ βία μετράει τὴ γῆ.
73 ᾿Απ᾿ τὰ κόκκαλα βγαλμένη
75 καὶ σὰν πρῶτα ἀνδρειωμένη
76 χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
78 Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
79 ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
80 λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
81 τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿
82 εἰς τοῦτο προήκοντα, ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ
83 πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν
84 οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι,
85 οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν
86 ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον
87 τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι
88 γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν
89 προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους
90 σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ
91 τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
92 τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
93 τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
94 Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
98 ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
100 ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
101 მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
102 ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
106 Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
107 Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
108 Конференция соберет широкий круг экспертов по вопросам глобального
109 Интернета и Unicode, локализации и интернационализации, воплощению и
110 применению Unicode в различных операционных системах и программных
111 приложениях, шрифтах, верстке и многоязычных компьютерных системах.
115 כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
116 הבינלאומי העשירי, שייערך בין התאריכים 12־10 במרץ 1997, בְּמָיְינְץ שבגרמניה.
120 हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
121 हैं, पर इन में कितनी सच्चाई है यह कहना कठिन है।
122 कहा जाता है उनका जन्म सन् १४७८
123 में दिल्ली के पास एक ग़रीब ब्राह्मीण परिवार में हुआ।
124 जनश्रुति के अनुसार सूरदास जन्म से ही अंधे थे। आजकल थी
125 अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
126 रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
130 ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช พระปกเกศกองบู๊กู้ขึ้นใหม่
131 สิบสองกษัตริย์ก่อนหน้าแลถัดไป สององค์ไซร้โง่เขลาเบาปัญญา
132 ทรงนับถือขันทีเป็นที่พึ่ง บ้านเมืองจึงวิปริตเป็นนักหนา
133 โฮจิ๋นเรียกทัพทั่วหัวเมืองมา หมายจะฆ่ามดชั่วตัวสำคัญ
134 เหมือนขับไสไล่เสือจากเคหา รับหมาป่าเข้ามาเลยอาสัญ
135 ฝ่ายอ้องอุ้นยุแยกให้แตกกัน ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
136 พลันลิฉุยกุยกีกลับก่อเหตุ ช่างอาเพศจริงหนาฟ้าร้องไห้
137 ต้องรบราฆ่าฟันจนบรรลัย ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
138 [----------------------------|------------------------]
139 (second column should align ⬏)
141 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
143 யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
144 பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
145 நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
146 தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
148 Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
150 ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
151 ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
153 ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
154 ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
155 ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
156 ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
163 ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው።
167 ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።
169 ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም።
170 እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም።
171 የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ።
173 ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል።
174 የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ።
176 ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
181 ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
183 Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
184 He said that he lived in the northern land near the Western Sea.
186 Tibetan Declaration of Rights:
188 ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
189 འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
190 ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
191 དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
195 kanji 漢字 hirag. ひらがな katak. カタカナ 半角 カタカナ man'yōg. 万葉仮名
197 色は匂へど いろはにほへと イロハニホヘト イロハニホヘド 以呂波耳本部止
198 散りぬるを ちりぬるを チリヌルヲ チリヌルヲ 千利奴流乎
199 我が世誰ぞ わかよたれそ ワカヨタレソ ワカヨタレソ 和加餘多連曽
200 常ならん つねならむ ツネナラム ツネナラム 津祢那良牟
201 有為の奥山 うゐのおくやま ウヰノオクヤマ ウウィノオクヤマ 有為能於久耶万
202 今日越えて けふこえて ケフコエテ ケフコエテ 計不己衣天
203 浅き夢見じ あさきゆめみし アサキユメミシ アサキユメミシ 阿佐伎喩女美之
204 酔ひもせず ゑひもせす ヱヒモセスン ウェヒモセスン 恵比毛勢須
208 Most common characters:
210 的一是不了在人有我他这个们中来上大为和国地到以说时
211 要就出会可也你对生能而子那得于着下自之年过发后作里
213 Transliteration test:
215 女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
219 A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
221 Qiān zì wén 千字文 by Xing Si Zhou:
223 天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
224 閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
225 劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
227 Compact font selection example text:
229 ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
230 abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
231 –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
232 ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
234 Greetings in various languages:
236 Hello world, Καλημέρα κόσμε, コンニチハ
238 Box drawing alignment tests: █
240 ╔══╦══╗ ┌──┬──┐ ╭──┬──╮ ╭──┬──╮ ┏━━┳━━┓ ┎┒┏┑ ╷ ╻ ┏┯┓ ┌┰┐ ▊ ╱╲╱╲╳╳╳
241 ║┌─╨─┐║ │╔═╧═╗│ │╒═╪═╕│ │╓─╁─╖│ ┃┌─╂─┐┃ ┗╃╄┙ ╶┼╴╺╋╸┠┼┨ ┝╋┥ ▋ ╲╱╲╱╳╳╳
242 ║│╲ ╱│║ │║ ║│ ││ │ ││ │║ ┃ ║│ ┃│ ╿ │┃ ┍╅╆┓ ╵ ╹ ┗┷┛ └┸┘ ▌ ╱╲╱╲╳╳╳
243 ╠╡ ╳ ╞╣ ├╢ ╟┤ ├┼─┼─┼┤ ├╫─╂─╫┤ ┣┿╾┼╼┿┫ ┕┛┖┚ ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳
244 ║│╱ ╲│║ │║ ║│ ││ │ ││ │║ ┃ ║│ ┃│ ╽ │┃ ░░▒▒▓▓██ ┊ ┆ ╎ ╏ ┇ ┋ ▎
245 ║└─╥─┘║ │╚═╤═╝│ │╘═╪═╛│ │╙─╀─╜│ ┃└─╂─┘┃ ░░▒▒▓▓██ ┊ ┆ ╎ ╏ ┇ ┋ ▏
246 ╚══╩══╝ └──┴──┘ ╰──┴──╯ ╰──┴──╯ ┗━━┻━━┛ ▗▄▖▛▀▜ └╌╌┘ ╎ ┗╍╍┛ ┋ ▁▂▃▄▅▆▇█