chinese sample text: 1st chapter of qian zi wen
[unicode-sampler.git] / unicode.txt
1
2 UTF-8 encoded sample plain-text file
3 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
4
5 Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25
6
7
8 The ASCII compatible UTF-8 encoding used in this plain-text file
9 is defined in Unicode, ISO 10646-1, and RFC 2279.
10
11
12 Using Unicode/UTF-8, you can write in emails and source code things such as
13
14 Mathematics and sciences:
15
16   ∮ E⋅da = Q,  n → ∞, ∑ f(i) = ∏ g(i),      ⎧⎡⎛┌─────┐⎞⎤⎫
17                                             ⎪⎢⎜│a²+b³ ⎟⎥⎪
18   ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β),    ⎪⎢⎜│───── ⎟⎥⎪
19                                             ⎪⎢⎜⎷ c₈   ⎟⎥⎪
20   ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ,                   ⎨⎢⎜       ⎟⎥⎬
21                                             ⎪⎢⎜ ∞     ⎟⎥⎪
22   ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
23                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
24   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
25
26 Linguistics and dictionaries:
27
28   ði ıntəˈnæʃənəl fəˈnɛtık əsoʊsiˈeıʃn
29   Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ]
30
31 APL:
32
33   ((V⍳V)=⍳⍴V)/V←,V    ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
34   ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
35
36 Nicer typography in plain text files:
37
38   ╔══════════════════════════════════════════╗
39   ║                                          ║
40   ║   • ‘single’ and “double” quotes         ║
41   ║                                          ║
42   ║   • Curly apostrophes: “We’ve been here” ║
43   ║                                          ║
44   ║   • Latin-1 apostrophe and accents: '´`  ║
45   ║                                          ║
46   ║   • ‚deutsche‘ „Anführungszeichen“       ║
47   ║                                          ║
48   ║   • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …      ║
49   ║                                          ║
50   ║   • ASCII safety test: 1lI|, 0OD, 8B     ║
51   ║                      ╭─────────╮         ║
52   ║   • the euro symbol: │ 14.95 € │         ║
53   ║                      ╰─────────╯         ║
54   ╚══════════════════════════════════════════╝
55
56 Combining characters:
57
58   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
59
60 Greek (Polytonic):
61
62   Σὲ γνωρίζω ἀπὸ τὴν κόψη
63   τοῦ σπαθιοῦ τὴν τρομερή,
64   σὲ γνωρίζω ἀπὸ τὴν ὄψη
65   ποὺ μὲ βία μετράει τὴ γῆ.
66
67   ᾿Απ᾿ τὰ κόκκαλα βγαλμένη
68   τῶν ῾Ελλήνων τὰ ἱερά
69   καὶ σὰν πρῶτα ἀνδρειωμένη
70   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
71
72   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
73   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
74   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
75   τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿
76   εἰς τοῦτο προήκοντα,  ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ
77   πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν
78   οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι,
79   οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν
80   ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον
81   τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι
82   γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν
83   προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους
84   σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ
85   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
86   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
87   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
88                                   Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
89
90 Georgian:
91
92   ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
93
94   ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
95   მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
96   ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
97
98 Russian:
99
100   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
101   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
102   Конференция соберет широкий круг экспертов по  вопросам глобального
103   Интернета и Unicode, локализации и интернационализации, воплощению и
104   применению Unicode в различных операционных системах и программных
105   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
106
107 Hebrew:
108
109   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
110   הבינלאומי העשירי, שייערך בין התאריכים 12־10 במרץ 1997, בְּמָיְינְץ שבגרמניה.
111
112 Hindi:
113
114   हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
115   हैं, पर इन में कितनी सच्चाई है यह कहना कठिन है।
116   कहा जाता है उनका जन्म सन् १४७८
117   में दिल्ली के पास एक ग़रीब ब्राह्मीण परिवार में हुआ।
118   जनश्रुति के अनुसार सूरदास जन्म से ही अंधे थे। आजकल थी
119   अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
120   रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
121
122 Thai (UCS Level 2):
123
124     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
125   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
126     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
127   โฮจิ๋นเรียกทัพทั่วหัวเมืองมา         หมายจะฆ่ามดชั่วตัวสำคัญ
128     เหมือนขับไสไล่เสือจากเคหา      รับหมาป่าเข้ามาเลยอาสัญ
129   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
130     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
131   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
132   [----------------------------|------------------------]
133    (second column should align ⬏)
134
135 Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
136
137   யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
138   பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
139   நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
140   தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
141
142 Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
143
144   ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
145   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
146
147   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
148   ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
149   ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
150   ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
151
152 Ethiopian:
153
154   ሰማይ አይታረስ ንጉሥ አይከሰስ።
155   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
156   ጌጥ ያለቤቱ ቁምጥና ነው።
157   ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው።
158   የአፍ ወለምታ በቅቤ አይታሽም።
159   አይጥ በበላ ዳዋ ተመታ።
160   ሲተረጉሙ ይደረግሙ።
161   ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።
162   ድር ቢያብር አንበሳ ያስር።
163   ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም።
164   እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም።
165   የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ።
166   ሥራ ከመፍታት ልጄን ላፋታት።
167   ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል።
168   የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ።
169   ተንጋሎ ቢተፉ ተመልሶ ባፉ።
170   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
171   እግርህን በፍራሽህ ልክ ዘርጋ።
172
173 Ænglisc:
174
175   ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
176
177   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
178   He said that he lived in the northern land near the Western Sea.
179
180 Braille:
181
182   ⡌⠁⠧⠑ ⠼⠁⠒  ⡍⠜⠇⠑⠹⠰⠎ ⡣⠕⠌
183
184   ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠙⠑⠁⠙⠒ ⠞⠕ ⠃⠑⠛⠔ ⠺⠊⠹⠲ ⡹⠻⠑ ⠊⠎ ⠝⠕ ⠙⠳⠃⠞
185   ⠱⠁⠞⠑⠧⠻ ⠁⠃⠳⠞ ⠹⠁⠞⠲ ⡹⠑ ⠗⠑⠛⠊⠌⠻ ⠕⠋ ⠙⠊⠎ ⠃⠥⠗⠊⠁⠇ ⠺⠁⠎
186   ⠎⠊⠛⠝⠫ ⠃⠹ ⠹⠑ ⠊⠇⠻⠛⠹⠍⠁⠝⠂ ⠹⠑ ⠊⠇⠻⠅⠂ ⠹⠑ ⠥⠝⠙⠻⠞⠁⠅⠻⠂
187   ⠁⠝⠙ ⠹⠑ ⠡⠊⠑⠋ ⠍⠳⠗⠝⠻⠲ ⡎⠊⠗⠕⠕⠛⠑ ⠎⠊⠛⠝⠫ ⠊⠞⠲ ⡁⠝⠙
188   ⡎⠊⠗⠕⠕⠛⠑⠰⠎ ⠝⠁⠍⠑ ⠺⠁⠎ ⠛⠕⠕⠙ ⠥⠏⠕⠝ ⠰⡡⠁⠝⠛⠑⠂ ⠋⠕⠗ ⠁⠝⠹⠹⠔⠛ ⠙⠑
189   ⠡⠕⠎⠑ ⠞⠕ ⠏⠥⠞ ⠙⠊⠎ ⠙⠁⠝⠙ ⠞⠕⠲
190
191   ⡕⠇⠙ ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
192
193   ⡍⠔⠙⠖ ⡊ ⠙⠕⠝⠰⠞ ⠍⠑⠁⠝ ⠞⠕ ⠎⠁⠹ ⠹⠁⠞ ⡊ ⠅⠝⠪⠂ ⠕⠋ ⠍⠹
194   ⠪⠝ ⠅⠝⠪⠇⠫⠛⠑⠂ ⠱⠁⠞ ⠹⠻⠑ ⠊⠎ ⠏⠜⠞⠊⠊⠥⠇⠜⠇⠹ ⠙⠑⠁⠙ ⠁⠃⠳⠞
195   ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ ⡊ ⠍⠊⠣⠞ ⠙⠁⠧⠑ ⠃⠑⠲ ⠔⠊⠇⠔⠫⠂ ⠍⠹⠎⠑⠇⠋⠂ ⠞⠕
196   ⠗⠑⠛⠜⠙ ⠁ ⠊⠕⠋⠋⠔⠤⠝⠁⠊⠇ ⠁⠎ ⠹⠑ ⠙⠑⠁⠙⠑⠌ ⠏⠊⠑⠊⠑ ⠕⠋ ⠊⠗⠕⠝⠍⠕⠝⠛⠻⠹
197   ⠔ ⠹⠑ ⠞⠗⠁⠙⠑⠲ ⡃⠥⠞ ⠹⠑ ⠺⠊⠎⠙⠕⠍ ⠕⠋ ⠳⠗ ⠁⠝⠊⠑⠌⠕⠗⠎
198   ⠊⠎ ⠔ ⠹⠑ ⠎⠊⠍⠊⠇⠑⠆ ⠁⠝⠙ ⠍⠹ ⠥⠝⠙⠁⠇⠇⠪⠫ ⠙⠁⠝⠙⠎
199   ⠩⠁⠇⠇ ⠝⠕⠞ ⠙⠊⠌⠥⠗⠃ ⠊⠞⠂ ⠕⠗ ⠹⠑ ⡊⠳⠝⠞⠗⠹⠰⠎ ⠙⠕⠝⠑ ⠋⠕⠗⠲ ⡹⠳
200   ⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞
201   ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
202
203 Tibetan Declaration of Rights:
204
205   ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
206   འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
207   ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
208   དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
209
210 Chinese:
211
212   Most common characters:
213
214   的一是不了在人有我他这个们中来上大为和国地到以说时
215   要就出会可也你对生能而子那得于着下自之年过发后作里
216
217   Transliteration test:
218
219   女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
220
221   Qiān zì wén 千字文 by Xing Si Zhou:
222
223   天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
224   閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
225   劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
226
227 Compact font selection example text:
228
229   ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
230   abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
231   –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
232   ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
233
234 Greetings in various languages:
235
236   Hello world, Καλημέρα κόσμε, コンニチハ
237
238 Box drawing alignment tests:                                          █
239                                                                       ▉
240   ╔══╦══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   ╷  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳
241   ║┌─╨─┐║  │╔═╧═╗│  │╒═╪═╕│  │╓─╁─╖│  ┃┌─╂─┐┃  ┗╃╄┙  ╶┼╴╺╋╸┠┼┨ ┝╋┥    ▋ ╲╱╲╱╳╳╳
242   ║│╲ ╱│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╿ │┃  ┍╅╆┓   ╵  ╹ ┗┷┛ └┸┘    ▌ ╱╲╱╲╳╳╳
243   ╠╡ ╳ ╞╣  ├╢   ╟┤  ├┼─┼─┼┤  ├╫─╂─╫┤  ┣┿╾┼╼┿┫  ┕┛┖┚     ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳
244   ║│╱ ╲│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╽ │┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▎
245   ║└─╥─┘║  │╚═╤═╝│  │╘═╪═╛│  │╙─╀─╜│  ┃└─╂─┘┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▏
246   ╚══╩══╝  └──┴──┘  ╰──┴──╯  ╰──┴──╯  ┗━━┻━━┛  ▗▄▖▛▀▜   └╌╌┘ ╎ ┗╍╍┛ ┋  ▁▂▃▄▅▆▇█
247                                                ▝▀▘▙▄▟