+Unicode sampler
+‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Test support of various text encoded with Unicode up to version 8.0 (2015).
-UTF-8 encoded sample plain-text file
-‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Based on text by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
+Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
-Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25
+Code:
+ <html><pre><span class=""><!-- HTM --></span>
-The ASCII compatible UTF-8 encoding used in this plain-text file
-is defined in Unicode, ISO 10646-1, and RFC 2279.
+ Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
+ perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
-Using Unicode/UTF-8, you can write in emails and source code things such as
+ ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
Mathematics and sciences:
ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
- ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑��⠝⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
+ ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑��⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
-APL:
-
- ((V⍳V)=⍳⍴V)/V←,V ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
- ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
-
Nicer typography in plain text files:
╔══════════════════════════════════════════╗
применению Unicode в различных операционных системах и программных
приложениях, шрифтах, верстке и многоязычных компьютерных системах.
+Sakha (Yakut) Declaration of Rights:
+
+ Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
+ Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
+ бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
+
+Kazakh equivalents:
+
+ Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
+ дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
+ бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
+
+ بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
+ دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
+ ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
+
Hebrew:
כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode