adjust english phonetic sample to cover more sounds
[unicode-sampler.git] / unicode.txt
index 0cd4986901d2b78f80c8ef7c5c86dfeb80a22ccb..77ca0b0aa4b1998d8fa9d0a221a5f4e633671aec 100644 (file)
@@ -23,14 +23,18 @@ Mathematics and sciences:
                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
 
-Linguistics and dictionaries:
+English and IPA transcription:
 
-  ði ıntəˈnæʃənəl fəˈnɛtık əsoʊsiˈeıʃn
-  Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ]
+  Just as the French queen looked for it, she heard that symphony again.
+  A beige hue on the waters of the loch impressed all, including young Arthur.
+
+  ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
+  ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
 
 APL:
 
   ((V⍳V)=⍳⍴V)/V←,V    ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
+  ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
 
 Nicer typography in plain text files:
 
@@ -56,9 +60,7 @@ Combining characters:
 
   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
 
-Greek (in Polytonic):
-
-  The Greek anthem:
+Greek (Polytonic):
 
   Σὲ γνωρίζω ἀπὸ τὴν κόψη
   τοῦ σπαθιοῦ τὴν τρομερή,
@@ -70,8 +72,6 @@ Greek (in Polytonic):
   καὶ σὰν πρῶτα ἀνδρειωμένη
   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
 
-  From a speech of Demosthenes in the 4th century BC:
-
   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
@@ -88,25 +88,18 @@ Greek (in Polytonic):
   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
-
-  Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
+                                  Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
 
 Georgian:
 
-  From a Unicode conference invitation:
+  ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
 
-  გთხოვთ ახლავე გაიაროთ რეგისტრაცია Unicode-ის მეათე საერთაშორისო
-  კონფერენციაზე დასასწრებად, რომელიც გაიმართება 10-12 მარტს,
-  ქ. მაინცში, გერმანიაში. კონფერენცია შეჰკრებს ერთად მსოფლიოს
-  ექსპერტებს ისეთ დარგებში როგორიცაა ინტერნეტი და Unicode-ი,
-  ინტერნაციონალიზაცია და ლოკალიზაცია, Unicode-ის გამოყენება
-  ოპერაციულ სისტემებსა, და გამოყენებით პროგრამებში, შრიფტებში,
-  ტექსტების დამუშავებასა და მრავალენოვან კომპიუტერულ სისტემებში.
+  ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
+  მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
+  ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
 
 Russian:
 
-  From a Unicode conference invitation:
-
   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
   Конференция соберет широкий круг экспертов по  вопросам глобального
@@ -114,12 +107,23 @@ Russian:
   применению Unicode в различных операционных системах и программных
   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
 
-Thai (UCS Level 2):
+Hebrew:
 
-  Excerpt from a poetry on The Romance of The Three Kingdoms (a Chinese
-  classic 'San Gua'):
+  כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
+  הבינלאומי העשירי, שייערך בין התאריכים 12־10 במרץ 1997, בְּמָיְינְץ שבגרמניה.
+
+Hindi:
+
+  हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
+  हैं, पर इन में कितनी सच्चाई है यह कहना कठिन है।
+  कहा जाता है उनका जन्म सन् १४७८
+  में दिल्ली के पास एक ग़रीब ब्राह्मीण परिवार में हुआ।
+  जनश्रुति के अनुसार सूरदास जन्म से ही अंधे थे। आजकल थी
+  अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
+  रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
+
+Thai (UCS Level 2):
 
-  [----------------------------|------------------------]
     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
@@ -128,14 +132,27 @@ Thai (UCS Level 2):
   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
+  [----------------------------|------------------------]
+   (second column should align ⬏)
 
-  (The above is a two-column text. If combining characters are handled
-  correctly, the lines of the second column should be aligned with the
-  | character above.)
+Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
 
-Ethiopian:
+  யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
+  பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
+  நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
+  தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
+
+Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
+
+  ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
+  ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
 
-  Proverbs in the Amharic language:
+  ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
+  ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
+  ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
+  ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
+
+Ethiopian:
 
   ሰማይ አይታረስ ንጉሥ አይከሰስ።
   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
@@ -156,11 +173,11 @@ Ethiopian:
   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
   እግርህን በፍራሽህ ልክ ዘርጋ።
 
-Old English (Ōhthere and Ƿulfstān):
+Ænglisc:
 
   ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
 
-  Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestsǣ.
+  Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
   He said that he lived in the northern land near the Western Sea.
 
 Braille:
@@ -186,7 +203,46 @@ Braille:
   ⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞
   ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
 
-  (The first couple of paragraphs of "A Christmas Carol" by Dickens)
+Tibetan Declaration of Rights:
+
+  ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
+  འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
+  ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
+  དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
+
+Japanese Iroha いろは:
+
+  kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
+
+  色は匂へど   いろはにほへと   イロハニホヘト   イロハニホヘド   以呂波耳本部止
+  散りぬるを   ちりぬるを       チリヌルヲ       チリヌルヲ      千利奴流乎
+  我が世誰ぞ   わかよたれそ    ワカヨタレソ    ワカヨタレソ     和加餘多連曽
+  常ならん     つねならむ       ツネナラム       ツネナラム      津祢那良牟
+  有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
+  今日越えて   けふこえて       ケフコエテ       ケフコエテ      計不己衣天
+  浅き夢見じ   あさきゆめみし   アサキユメミシ   アサキユメミシ    阿佐伎喩女美之
+  酔ひもせず   ゑひもせす       ヱヒモセスン     ウェヒモセスン    恵比毛勢須
+
+Chinese:
+
+  Most common characters:
+
+  的一是不了在人有我他这个们中来上大为和国地到以说时
+  要就出会可也你对生能而子那得于着下自之年过发后作里
+
+  Transliteration test:
+
+  女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
+
+  Extension blocks:
+
+  A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
+
+  Qiān zì wén 千字文 by Xing Si Zhou:
+
+  天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
+  閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
+  劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
 
 Compact font selection example text: