X-Git-Url: http://git.shiar.nl/unicode-sampler.git/blobdiff_plain/83f7059def035f82d98cbe2918515476a71143c2..75b7326c95fc94d3efe9c09d3c729a1231b23a38:/unicode.txt diff --git a/unicode.txt b/unicode.txt index 2322fe7..88dd0c1 100644 --- a/unicode.txt +++ b/unicode.txt @@ -1,15 +1,17 @@ +Unicode sampler +‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾ +Test support of various text encoded with Unicode up to version 8.0 (2015). -UTF-8 encoded sample plain-text file -‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾ +Based on text by Markus Kuhn +Updated by Mischa Poslawsky 2015-08-19 -Markus Kuhn [ˈmaʳkʊs kuːn] — 2002-07-25 +Code: +

 
-The ASCII compatible UTF-8 encoding used in this plain-text file
-is defined in Unicode, ISO 10646-1, and RFC 2279.
+  Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
 
-
-Using Unicode/UTF-8, you can write in emails and source code things such as
+  perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
 
 Mathematics and sciences:
 
@@ -110,6 +112,22 @@ Russian:
   применению Unicode в различных операционных системах и программных
   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
 
+Sakha (Yakut) Declaration of Rights:
+
+  Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
+  Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
+  бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
+
+Kazakh equivalents:
+
+  Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
+  дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
+  бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
+
+  بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
+  دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
+  ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
+
 Hebrew:
 
   כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode