adjust font overview to include more ascii characters
[unicode-sampler.git] / unicode.txt
index 186a3fa6b8c1e2371c504ca2ef88306400793c28..bc6559f71e4a195a57e4a82df1a6402dd48ab648 100644 (file)
@@ -1,15 +1,19 @@
+Unicode sampler
+‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Test support of various text encoded with Unicode up to version 8.0 (2015).
 
 
-UTF-8 encoded sample plain-text file
-‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
+Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
 
 
-Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25
+Code:
 
 
+  <html><pre><span class=""><!-- H&#x54;M --></span>
 
 
-The ASCII compatible UTF-8 encoding used in this plain-text file
-is defined in Unicode, ISO 10646-1, and RFC 2279.
+  Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
 
 
+  perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
 
 
-Using Unicode/UTF-8, you can write in emails and source code things such as
+  ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
 
 Mathematics and sciences:
 
 
 Mathematics and sciences:
 
@@ -23,14 +27,22 @@ Mathematics and sciences:
                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
 
                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
 
-Linguistics and dictionaries:
+Compact font overview:
 
 
-  ði ıntəˈnæʃənəl fəˈnɛtık əsoʊsiˈeıʃn
-  Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ]
+  _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏṆÞß ΑΒΓΔΩὮ АБВГДЯ ԱႠא $€
+  @abcdefghijklmnopqrstuvwxyz åāčếəṇþſ αβγδωὦ абвгдя աაا ¥£
+  [-0123456789] !¿?#%‰&©/*•† (.:;,…) {'"|“’”} +×=≠½²∈∞ ↗┌╁╖░☺ �
 
 
-APL:
+English panphone (traditional, IPA, Braille):
 
 
-  ((V⍳V)=⍳⍴V)/V←,V    ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
+  Just as the French queen looked for it, she heard that symphony again.
+  A beige hue on the waters of the loch impressed all, including young Arthur.
+
+  ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
+  ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
+
+  ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
+  ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
 
 Nicer typography in plain text files:
 
 
 Nicer typography in plain text files:
 
@@ -56,6 +68,34 @@ Combining characters:
 
   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
 
 
   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
 
+Pangrams:
+
+  cz: Příliš žluťoučký kůň úpěl ďábelské ódy.
+  eo: Ĉeĥa ĉiuliteraĵo ŝajne kontraŭĉapeliĝis.  (ϗ eĥoŝanĝº ĉiĵaŭde)
+  fr: Le cœur déçu mais l'âme plutôt naïve, Louÿs rêva de crapaüter en
+      canoë au delà des îles, près du mälström où brûlent les novæ.
+  hu: Új, „Exvőd = fél pár” című show közügy Quitóban.
+  ig: Nne, nna, wepụ he’l’ụjọ dum n’ime ọzụzụ ụmụ, vufesi obi nye Chukwu,
+      ṅụrịanụ, gbakọọnụ kpaa, kwee ya ka o guzoshie ike; ọ ghaghị ito,
+      nwapụta ezi agwa.
+  ir: Ċuaiġ bé ṁórṡáċ le dlúṫspád fíorḟinn trí hata mo ḋea-ṗorcáin ḃig, ⁊ꞃl.
+  is: Sævör grét áðan því úlpan var ónýt.
+  lv: Glāžšķūņa rūķīši dzērumā čiepj Baha koncertflīģeļu vākus.
+  nl: Wijf lokt u cq 'r pa dmv 'n zg sexy bh. (af: én ʼn kwêvoëltjie)
+  pl: Pchnąć w tę łódź jeża lub ośm skrzyń fig. (Zażółć gęślą jaźń)
+  ro: Muzicologă în bej vând whisky și tequila, preț fix.
+  se: Vuol Ruoŧa geđggiid leat máŋga luosa ja čuovžža.
+  sk: Starý kôň na hŕbe kníh žuje tíško povädnuté ruže,
+      na stĺpe sa ďateľ učí kvákať novú ódu o živote.
+  tr: PİJAMALİ HASTA, yağız şoföre çabucak güvendi.
+  vt: Do bạch kim rất quý, sẽ để lắp vô xương.
+  yo: Ìwò̩fà ń yò̩ séji tó gbojúmó̩, ó hàn pákànpò̩ gan-an nis̩é̩ rè̩ bó dò̩la.
+
+German ligatures:
+
+  Im finſteren Jagdſchloß am offenen Felsquellwaſſer patzte der affig‐flatterhafte
+  kauzig‐höfliche Bäcker über ſeinem verſifften kniffligen C‐Xylophon.
+
 Greek (Polytonic):
 
   Σὲ γνωρίζω ἀπὸ τὴν κόψη
 Greek (Polytonic):
 
   Σὲ γνωρίζω ἀπὸ τὴν κόψη
@@ -88,13 +128,11 @@ Greek (Polytonic):
 
 Georgian:
 
 
 Georgian:
 
-  გთხოვთ ახლავე გაიაროთ რეგისტრაცია Unicode-ის მეათე საერთაშორისო
-  კონფერენციაზე დასასწრებად, რომელიც გაიმართება 10-12 მარტს,
-  ქ. მაინცში, გერმანიაში. კონფერენცია შეჰკრებს ერთად მსოფლიოს
-  ექსპერტებს ისეთ დარგებში როგორიცაა ინტერნეტი და Unicode-ი,
-  ინტერნაციონალიზაცია და ლოკალიზაცია, Unicode-ის გამოყენება
-  ოპერაციულ სისტემებსა, და გამოყენებით პროგრამებში, შრიფტებში,
-  ტექსტების დამუშავებასა და მრავალენოვან კომპიუტერულ სისტემებში.
+  ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
+
+  ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
+  მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
+  ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
 
 Russian:
 
 
 Russian:
 
@@ -105,6 +143,22 @@ Russian:
   применению Unicode в различных операционных системах и программных
   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
 
   применению Unicode в различных операционных системах и программных
   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
 
+Sakha (Yakut) Declaration of Rights:
+
+  Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
+  Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
+  бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
+
+Kazakh equivalents:
+
+  Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
+  дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
+  бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
+
+  بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
+  دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
+  ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
+
 Hebrew:
 
   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
 Hebrew:
 
   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
@@ -133,6 +187,23 @@ Thai (UCS Level 2):
   [----------------------------|------------------------]
    (second column should align ⬏)
 
   [----------------------------|------------------------]
    (second column should align ⬏)
 
+Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
+
+  யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
+  பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
+  நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
+  தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
+
+Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
+
+  ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
+  ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
+
+  ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
+  ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
+  ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
+  ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
+
 Ethiopian:
 
   ሰማይ አይታረስ ንጉሥ አይከሰስ።
 Ethiopian:
 
   ሰማይ አይታረስ ንጉሥ አይከሰስ።
@@ -161,39 +232,46 @@ Ethiopian:
   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
   He said that he lived in the northern land near the Western Sea.
 
   Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
   He said that he lived in the northern land near the Western Sea.
 
-Braille:
+Tibetan Declaration of Rights:
+
+  ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
+  འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
+  ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
+  དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
+
+Japanese Iroha いろは:
+
+  kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
+
+  色は匂へど   いろはにほへと   イロハニホヘト   イロハニホヘド   以呂波耳本部止
+  散りぬるを   ちりぬるを       チリヌルヲ       チリヌルヲ      千利奴流乎
+  我が世誰ぞ   わかよたれそ    ワカヨタレソ    ワカヨタレソ     和加餘多連曽
+  常ならん     つねならむ       ツネナラム       ツネナラム      津祢那良牟
+  有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
+  今日越えて   けふこえて       ケフコエテ       ケフコエテ      計不己衣天
+  浅き夢見じ   あさきゆめみし   アサキユメミシ   アサキユメミシ    阿佐伎喩女美之
+  酔ひもせず   ゑひもせす       ヱヒモセスン     ウェヒモセスン    恵比毛勢須
+
+Chinese:
 
 
-  ⡌⠁⠧⠑ ⠼⠁⠒  ⡍⠜⠇⠑⠹⠰⠎ ⡣⠕⠌
+  Most common characters:
 
 
-  ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠙⠑⠁⠙⠒ ⠞⠕ ⠃⠑⠛⠔ ⠺⠊⠹⠲ ⡹⠻⠑ ⠊⠎ ⠝⠕ ⠙⠳⠃⠞
-  ⠱⠁⠞⠑⠧⠻ ⠁⠃⠳⠞ ⠹⠁⠞⠲ ⡹⠑ ⠗⠑⠛⠊⠌⠻ ⠕⠋ ⠙⠊⠎ ⠃⠥⠗⠊⠁⠇ ⠺⠁⠎
-  ⠎⠊⠛⠝⠫ ⠃⠹ ⠹⠑ ⠊⠇⠻⠛⠹⠍⠁⠝⠂ ⠹⠑ ⠊⠇⠻⠅⠂ ⠹⠑ ⠥⠝⠙⠻⠞⠁⠅⠻⠂
-  ⠁⠝⠙ ⠹⠑ ⠡⠊⠑⠋ ⠍⠳⠗⠝⠻⠲ ⡎⠊⠗⠕⠕⠛⠑ ⠎⠊⠛⠝⠫ ⠊⠞⠲ ⡁⠝⠙
-  ⡎⠊⠗⠕⠕⠛⠑⠰⠎ ⠝⠁⠍⠑ ⠺⠁⠎ ⠛⠕⠕⠙ ⠥⠏⠕⠝ ⠰⡡⠁⠝⠛⠑⠂ ⠋⠕⠗ ⠁⠝⠹⠹⠔⠛ ⠙⠑
-  ⠡⠕⠎⠑ ⠞⠕ ⠏⠥⠞ ⠙⠊⠎ ⠙⠁⠝⠙ ⠞⠕⠲
+  的一是不了在人有我他这个们中来上大为和国地到以说时
+  要就出会可也你对生能而子那得于着下自之年过发后作里
 
 
-  ⡕⠇⠙ ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
+  Transliteration test:
 
 
-  ⡍⠔⠙⠖ ⡊ ⠙⠕⠝⠰⠞ ⠍⠑⠁⠝ ⠞⠕ ⠎⠁⠹ ⠹⠁⠞ ⡊ ⠅⠝⠪⠂ ⠕⠋ ⠍⠹
-  ⠪⠝ ⠅⠝⠪⠇⠫⠛⠑⠂ ⠱⠁⠞ ⠹⠻⠑ ⠊⠎ ⠏⠜⠞⠊⠊⠥⠇⠜⠇⠹ ⠙⠑⠁⠙ ⠁⠃⠳⠞
-  ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ ⡊ ⠍⠊⠣⠞ ⠙⠁⠧⠑ ⠃⠑⠲ ⠔⠊⠇⠔⠫⠂ ⠍⠹⠎⠑⠇⠋⠂ ⠞⠕
-  ⠗⠑⠛⠜⠙ ⠁ ⠊⠕⠋⠋⠔⠤⠝⠁⠊⠇ ⠁⠎ ⠹⠑ ⠙⠑⠁⠙⠑⠌ ⠏⠊⠑⠊⠑ ⠕⠋ ⠊⠗⠕⠝⠍⠕⠝⠛⠻⠹
-  ⠔ ⠹⠑ ⠞⠗⠁⠙⠑⠲ ⡃⠥⠞ ⠹⠑ ⠺⠊⠎⠙⠕⠍ ⠕⠋ ⠳⠗ ⠁⠝⠊⠑⠌⠕⠗⠎
-  ⠊⠎ ⠔ ⠹⠑ ⠎⠊⠍⠊⠇⠑⠆ ⠁⠝⠙ ⠍⠹ ⠥⠝⠙⠁⠇⠇⠪⠫ ⠙⠁⠝⠙⠎
-  ⠩⠁⠇⠇ ⠝⠕⠞ ⠙⠊⠌⠥⠗⠃ ⠊⠞⠂ ⠕⠗ ⠹⠑ ⡊⠳⠝⠞⠗⠹⠰⠎ ⠙⠕⠝⠑ ⠋⠕⠗⠲ ⡹⠳
-  ⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞
-  ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
+  女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
 
 
-Compact font selection example text:
+  Extension blocks:
 
 
-  ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
-  abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
-  –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
-  ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
+  A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
 
 
-Greetings in various languages:
+  Qiān zì wén 千字文 by Xing Si Zhou:
 
 
-  Hello world, Καλημέρα κόσμε, コンニチハ
+  天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
+  閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
+  劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
 
 Box drawing alignment tests:                                          █
                                                                       ▉
 
 Box drawing alignment tests:                                          █
                                                                       ▉