X-Git-Url: http://git.shiar.nl/unicode-sampler.git/blobdiff_plain/58dfff74091487632168a4bb5c58ed657b044b73..5e7af1d468533ac0a915a0089b47e024ec857f50:/unicode.txt
diff --git a/unicode.txt b/unicode.txt
index 4d41503..08b3201 100644
--- a/unicode.txt
+++ b/unicode.txt
@@ -1,15 +1,19 @@
+Unicode sampler
+â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾
+Test support of various text encoded with Unicode up to version 8.0 (2015).
-UTF-8 encoded sample plain-text file
-â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾
+Based on text by Markus Kuhn
-The ASCII compatible UTF-8 encoding used in this plain-text file -is defined in Unicode, ISO 10646-1, and RFC 2279. + Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" } + perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge' -Using Unicode/UTF-8, you can write in emails and source code things such as + â1 âµâ¨.â§3 4=+/,¯1 0 1â.â¯1 0 1â½Â¨ââµ â game of life Mathematics and sciences: @@ -31,14 +35,9 @@ English panphone (traditional, IPA, Braille): ʤÊst æz Ã°É fɹÉnʧ kÊin lÊkt fÉɹ ɪÌt | Êi ɦÉd ðat ËsɪɱfÉni ÉËÉÉɪ̯n É beÊ Ã§Ê Én Ã°É ËwÉtÉz Év Ã°É lÉÏ ÉªmËpɹÉst ÊÉËÉ« | ɪÅËkludɨŠjÊÅ ËÉÉ¹Î¸É - â â â â µâ â ®â â â â ⠢⠡â â â ¥â â â â â â â â â «â â ¿â â â â â ©â â â â â â â â â â â ½â â â â â â ½â â â â ² + â â â â µâ â ®â â â â ⠢⠡â â â ¥â â ¢â â â â â â «â â ¿â â â â â ©â â â â â â â â â â â ½â â â â â â ½â â â â ² â â â â â â â â â â â ¥â â â â â â ®â â ºâ â â »â â â ·â â ®â â â â ¡â â â â â â â â â «â â â â â â â â â â ¥â â ¬â â â ½â â â ⠹⠥â â ² -APL: - - ((Vâ³V)=â³â´V)/Vâ,V â·ââ³ââ´ââââ¾âââ - â1 âµâ¨.â§3 4=+/,¯1 0 1â.â¯1 0 1â½Â¨ââµ â game of life - Nicer typography in plain text files: ââââââââââââââââââââââââââââââââââââââââââââ @@ -110,6 +109,22 @@ Russian: пÑÐ¸Ð¼ÐµÐ½ÐµÐ½Ð¸Ñ Unicode в ÑазлиÑнÑÑ Ð¾Ð¿ÐµÑаÑионнÑÑ ÑиÑÑÐµÐ¼Ð°Ñ Ð¸ пÑогÑаммнÑÑ Ð¿ÑиложениÑÑ , ÑÑиÑÑÐ°Ñ , веÑÑÑке и многоÑзÑÑнÑÑ ÐºÐ¾Ð¼Ð¿ÑÑÑеÑнÑÑ ÑиÑÑÐµÐ¼Ð°Ñ . +Sakha (Yakut) Declaration of Rights: + + ÐÑон баÑÑÑа бÑÐ¹Ñ ÑÑолÑаÑÑÐ³Ð°Ñ Ñонна бÑÑаабÑÐ³Ð°Ñ ÑÑÒ¥ бÑолан ÑÓ©ÑүүллÑÑ. + ÐинилÑÑ Ð±Ð°ÑÑ Ó©Ñкөн Ó©Ð¹Ð´Ó©Ó©Ñ , ÑÑобаÑÑÐ°Ð°Ñ Ð±Ñолан ÑÓ©ÑүүллÑÑ, Ñонна бÑÐ¹Ñ + бÑйÑлÑÑигÑÑ ÑÑлга кииÑинигÑÑ Ð±ÑÒ»ÑÑлаÑа доÒоÑдоһÑÑ ÑÑÑÐ½Ð½Ð°Ð°Ñ Ð±ÑолÑÐ¾Ñ ÑÐ°Ð°Ñ . + +Kazakh equivalents: + + ÐаÑлÑÒ Ð°Ð´Ð°Ð¼Ð´Ð°Ñ ÑÑмÑÑÑнан Ð°Ð·Ð°Ñ Ð¶Óне ÒадÑÑ-ÒаÑиеÑÑ Ð¼ÐµÐ½ кұÒÑÒÑаÑÑ Ñең болÑп + дүниеге келедÑ. ÐдамдаÑÒа аÒÑл-паÑаÑаÑ, аÑ-ождан беÑÑлген, ÑондÑÒÑан Ð¾Ð»Ð°Ñ + бÑÑ-бÑÑÑмен ÑÑÑÑÑÑÒ, баÑÑÑмалдÑÒ ÒаÑÑм-ÒаÑÑÐ½Ð°Ñ Ð¶Ð°ÑаÑлаÑÑ ÑиÑÑ. + + بارÙÙ٠ادا٠دار تÛÙ ÙسÙÙا٠ازات جاÙÛ ÙادÙر-ÙاسÙÛت٠٠ÛÙ ÙÛÙÙÙتار٠تÛÚ Ø¨ÙÙÙÙ¾ + دÛÙÙÛÚ¯Û ÙÛÙÛدÙ. ادا٠دارعا اÙÙÙ-پاراسات, ار-Ùجدا٠بÛرÙÙÚ¯ÛÙ, سÙÙدÙÙتا٠ÙÙار + ءبÙر-بÙرÙÙ Û٠تÛÙستÙÙ, باÛÙر٠اÙدÙÙ ÙارÙÙ -ÙاتÙÙاس جاساÛÙار٠ءتÙÙس. + Hebrew: ××שר ××¢××× ×¨××¦× ×××ר, ××× ×××ר ×Ö¾Unicode. ××רש×× ×עת ××× ×¡ Unicode