newlisp/qa-specific-tests/qa-utf8

145 lines
12 KiB
Text
Executable file

#!/usr/bin/newlisp
#
# a selection of languages from from
# http://www.columbia.edu/kermit/utf8.html
#
# see also: http://www.unicode.org/charts/
#
(println)
(println "Testing UTF-8 font display capabilities")
(context 'L)
(set 'Albanian "Un\195\171 mund t\195\171 ha qelq dhe nuk m\195\171 gjen gj\195\171.")
(set 'Arabic "\216\163\217\134\216\167 \217\130\216\167\216\175\216\177 \216\185\217\132\217\137 \216\163\217\131\217\132 \216\167\217\132\216\178\216\172\216\167\216\172 \217\136 \217\135\216\176\216\167 \217\132\216\167 \217\138\216\164\217\132\217\133\217\134\217\138. ")
(set 'Armenian "\212\191\214\128\213\182\213\161\213\180 \213\161\213\186\213\161\213\175\213\171 \213\184\214\130\213\191\213\165\213\172 \214\135 \213\171\213\182\213\174\213\171 \213\161\213\182\213\176\213\161\213\182\213\163\213\171\213\189\213\191 \213\185\213\168\213\182\213\165\214\128\214\137")
(set 'Braille " \226\160\138\226\160\128\226\160\137\226\160\129\226\160\157\226\160\128\226\160\145\226\160\129\226\160\158\226\160\128\226\160\155\226\160\135\226\160\129\226\160\142\226\160\142\226\160\128\226\160\129\226\160\157\226\160\153\226\160\128\226\160\138\226\160\158\226\160\128\226\160\153\226\160\149\226\160\145\226\160\142\226\160\157\226\160\158\226\160\128\226\160\147\226\160\165\226\160\151\226\160\158\226\160\128\226\160\141\226\160\145")
(set 'Bulgarian "\208\156\208\190\208\179\208\176 \208\180\208\176 \209\143\208\188 \209\129\209\130\209\138\208\186\208\187\208\190, \209\130\208\190 \208\189\208\181 \208\188\208\184 \208\178\209\128\208\181\208\180\208\184.")
(set 'Chamorro "Si\195\177a yo' chumocho krestat, ti ha na'lalamen yo'.")
(set 'Chinese1 "\230\136\145\232\131\189\229\144\158\228\184\139\231\142\187\231\146\131\232\128\140\228\184\141\228\188\164\232\186\171\228\189\147\227\128\130")
(set 'Chinese2 "\230\136\145\232\131\189\229\144\158\228\184\139\231\142\187\231\146\131\232\128\140\228\184\141\229\130\183\232\186\171\233\171\148\227\128\130")
(set 'Croatian "Ja mogu jesti staklo i ne boli me.")
(set 'Czech "Mohu j\195\173st sklo, neubl\195\173\197\190\195\173 mi.")
(set 'Danish "Jeg kan spise glas, det g\195\184r ikke ondt p\195\165 mig.")
(set 'Dutch "Ik kan glas eten, het doet m\196\179 geen kwaad.")
(set 'English "I can eat glass and it doesn't hurt me.")
(set 'EnglishIPA "[a\201\170 k\195\166n i\203\144t gl\201\145\203\144s \195\166nd \201\170t d\201\144z n\201\146t h\201\156\203\144t mi\203\144")
(set 'Esperanto "Mi povas man\196\157i vitron, \196\157i ne dama\196\157as min. ")
(set 'Estonian "Ma v\195\181in klaasi s\195\188\195\188a, see ei tee mulle midagi.")
(set 'Farsi " .\217\133\217\134 \217\133\219\140 \216\170\217\136\216\167\217\134\217\133 \216\168\216\175\217\136\217\134\217\144 \216\167\216\173\216\179\216\167\216\179 \216\175\216\177\216\175 \216\180\217\138\216\180\217\135 \216\168\216\174\217\136\216\177\217\133")
(set 'French "Je peux manger du verre, \195\167a ne me fait pas de mal.")
(set 'German "Ich kann Glas essen, ohne mir weh zu tun.")
(set 'Greek "\225\189\149\206\177\206\187\206\191\206\189 \207\149\206\177\206\179\206\181\225\191\150\206\189 \206\180\225\189\187\206\189\206\177\206\188\206\177\206\185\206\135 \207\132\206\191\225\191\166\207\132\206\191 \206\191\225\189\148 \206\188\206\181 \206\178\206\187\225\189\177\207\128\207\132\206\181\206\185.")
(set 'Hausa "\216\165\217\144\217\134\216\167 \216\165\217\144\217\137\217\142 \216\170\217\142\217\136\217\134\217\142\216\177 \216\186\217\144\217\132\217\142\216\167\216\180\217\144 \217\131\217\143\217\133\217\142 \216\165\217\144\217\134 \216\186\217\142\217\133\217\142\216\167 \217\132\217\142\216\167\217\129\217\144\217\137\217\142\216\167")
(set 'Hebrew "\215\144\215\160\215\153 \215\153\215\155\215\149\215\156 \215\156\215\144\215\155\215\149\215\156 \215\150\215\155\215\149\215\155\215\153\215\170 \215\149\215\150\215\148 \215\156\215\144 \215\158\215\150\215\153\215\167 \215\156\215\153.")
(set 'Hindi "\224\164\174\224\165\136\224\164\130 \224\164\149\224\164\190\224\164\129\224\164\154 \224\164\150\224\164\190 \224\164\184\224\164\149\224\164\164\224\164\190 \224\164\185\224\165\130\224\164\129, \224\164\174\224\165\129\224\164\157\224\165\135 \224\164\137\224\164\184 \224\164\184\224\165\135 \224\164\149\224\165\139\224\164\136 \224\164\170\224\165\128\224\164\161\224\164\190 \224\164\168\224\164\185\224\165\128\224\164\130 \224\164\185\224\165\139\224\164\164\224\165\128.")
(set 'Irish "Is f\195\169idir liom gloinne a ithe. N\195\173 dh\195\169anann s\195\173 dochar ar bith dom.")
(set 'Italian "Posso mangiare il vetro e non mi fa male.")
(set 'Japanese "\231\167\129\227\129\175\227\130\172\227\131\169\227\130\185\227\130\146\233\163\159\227\129\185\227\130\137\227\130\140\227\129\190\227\129\153\227\128\130\227\129\157\227\130\140\227\129\175\231\167\129\227\130\146\229\130\183\227\129\164\227\129\145\227\129\190\227\129\155\227\130\147\227\128\130")
(set 'Korean "\235\130\152\235\138\148 \236\156\160\235\166\172\235\165\188 \235\168\185\236\157\132 \236\136\152 \236\158\136\236\150\180\236\154\148. \234\183\184\235\158\152\235\143\132 \236\149\132\237\148\132\236\167\128 \236\149\138\236\149\132\236\154\148")
(set 'Latvian "Es varu \196\147st stiklu, tas man nekait\196\147.")
(set 'Lithuanian "A\197\161 galiu valgyti stikl\196\133 ir jis man\196\153s ne\197\190eid\197\190ia ")
(set 'Macedonian "\208\156\208\190\208\182\208\176\208\188 \208\180\208\176 \209\152\208\176\208\180\208\176\208\188 \209\129\209\130\208\176\208\186\208\187\208\190, \208\176 \208\189\208\181 \208\188\208\181 \209\136\209\130\208\181\209\130\208\176.")
(set 'Malay "Saya boleh makan kaca dan ia tidak mencederakan saya.")
(set 'Marathi "\224\164\174\224\165\128 \224\164\149\224\164\190\224\164\154 \224\164\150\224\164\190\224\164\138 \224\164\182\224\164\149\224\164\164\224\165\139, \224\164\174\224\164\178\224\164\190 \224\164\164\224\165\135 \224\164\166\224\165\129\224\164\150\224\164\164 \224\164\168\224\164\190\224\164\185\224\165\128.")
(set 'Mongolian1 "\208\145\208\184 \209\136\208\184\208\187 \208\184\208\180\209\141\208\185 \209\135\208\176\208\180\208\189\208\176, \208\189\208\176\208\180\208\176\208\180 \209\133\208\190\209\128\209\130\208\190\208\185 \208\177\208\184\209\136")
(set 'Mongolian2 "\225\160\170\225\160\162 \225\160\176\225\160\162\225\160\175\225\160\162 \225\160\162\225\160\179\225\160\161\225\160\182\225\160\166 \225\160\180\225\160\162\225\160\179\225\160\160\225\160\168\225\160\160 \225\160\130 \225\160\168\225\160\160\225\160\179\225\160\164\225\160\183 \225\160\172\225\160\163\225\160\164\225\160\183\225\160\160\225\160\179\225\160\160\225\160\162 \225\160\170\225\160\162\225\160\176\225\160\162 ")
(set 'Norvegian "Jeg kan spise glass uten \195\165 skade meg. ")
(set 'Pashto "\216\178\217\135 \216\180\217\138\216\180\217\135 \216\174\217\136\218\147\217\132\219\144 \216\180\217\133\216\140 \217\135\216\186\217\135 \217\133\216\167 \217\134\217\135 \216\174\217\136\218\150\217\136\217\138")
(set 'Polish "Mog\196\153 je\197\155\196\135 szk\197\130o i mi nie szkodzi.")
(set 'Portugese "Posso comer vidro, n\195\163o me faz mal.")
(set 'Russian "\208\175 \208\188\208\190\208\179\209\131 \208\181\209\129\209\130\209\140 \209\129\209\130\208\181\208\186\208\187\208\190, \208\190\208\189\208\190 \208\188\208\189\208\181 \208\189\208\181 \208\178\209\128\208\181\208\180\208\184\209\130.")
(set 'Sanskrit "\224\164\149\224\164\190\224\164\154\224\164\130 \224\164\182\224\164\149\224\165\141\224\164\168\224\165\139\224\164\174\224\165\141\224\164\175\224\164\164\224\165\141\224\164\164\224\165\129\224\164\174\224\165\141 \224\165\164 \224\164\168\224\165\139\224\164\170\224\164\185\224\164\191\224\164\168\224\164\184\224\165\141\224\164\164\224\164\191 \224\164\174\224\164\190\224\164\174\224\165\141 \224\165\165")
(set 'Serbian "\208\156\208\190\208\179\209\131 \209\152\208\181\209\129\209\130\208\184 \209\129\209\130\208\176\208\186\208\187\208\190 \208\176 \208\180\208\176 \208\188\208\184 \208\189\208\181 \209\136\208\186\208\190\208\180\208\184.")
(set 'Slovak "M\195\180\197\190em jes\197\165 sklo. Nezran\195\173 ma.")
(set 'Slovenian "Lahko jem steklo, ne da bi mi \197\161kodovalo.")
(set 'Spanish "Puedo comer vidrio, no me hace da\195\177o.")
(set 'SwahiliKI "Naweza kula bilauri na sikunyui.")
(set 'Swedish "Jag kan \195\164ta glas utan att skada mig.")
(set 'Tagalog "Kaya kong kumain nang bubog at hindi ako masaktan.")
(set 'Tamil "\224\174\168\224\174\190\224\174\169\224\175\141 \224\174\149\224\174\163\224\175\141\224\174\163\224\174\190\224\174\159\224\174\191 \224\174\154\224\174\190\224\174\170\224\175\141\224\174\170\224\174\191\224\174\159\224\175\129\224\174\181\224\175\135\224\174\169\224\175\141, \224\174\133\224\174\164\224\174\169\224\174\190\224\174\178\224\175\141 \224\174\142\224\174\169\224\174\149\224\175\141\224\174\149\224\175\129 \224\174\146\224\174\176\224\175\129 \224\174\149\224\175\135\224\174\159\224\175\129\224\174\174\224\175\141 \224\174\181\224\174\176\224\174\190\224\174\164\224\175\129.")
(set 'Thai "\224\184\137\224\184\177\224\184\153\224\184\129\224\184\180\224\184\153\224\184\129\224\184\163\224\184\176\224\184\136\224\184\129\224\185\132\224\184\148\224\185\137 \224\185\129\224\184\149\224\185\136\224\184\161\224\184\177\224\184\153\224\185\132\224\184\161\224\185\136\224\184\151\224\184\179\224\185\131\224\184\171\224\185\137\224\184\137\224\184\177\224\184\153\224\185\128\224\184\136\224\185\135\224\184\154")
(set 'Tibetan "\224\189\164\224\189\186\224\189\163\224\188\139\224\189\166\224\190\146\224\189\188\224\188\139\224\189\159\224\188\139\224\189\147\224\189\166\224\188\139\224\189\132\224\188\139\224\189\147\224\188\139\224\189\130\224\189\178\224\188\139\224\189\152\224\188\139\224\189\162\224\189\186\224\189\145\224\188\141")
(set 'Turkish "\216\172\216\167\217\133 \217\138\217\138\217\135 \216\168\217\132\217\136\216\177\217\133 \216\168\218\173\216\167 \216\182\216\177\216\177\217\137 \216\183\217\136\217\130\217\136\217\134\217\133\216\178")
(set 'Ukranian "\208\175 \208\188\208\190\208\182\209\131 \209\151\209\129\209\130\208\184 \209\136\208\186\208\187\208\190, \208\185 \208\178\208\190\208\189\208\190 \208\188\208\181\208\189\209\150 \208\189\208\181 \208\191\208\190\209\136\208\186\208\190\208\180\208\184\209\130\209\140.")
(set 'Urdu "\217\133\219\140\218\186 \218\169\216\167\217\134\218\134 \218\169\218\190\216\167 \216\179\218\169\216\170\216\167 \219\129\217\136\218\186 \216\167\217\136\216\177 \217\133\216\172\218\190\219\146 \216\170\218\169\217\132\219\140\217\129 \217\134\219\129\219\140\218\186 \219\129\217\136\216\170\219\140 \219\148")
(set 'Vietnamese "\228\186\155 \240\163\142\143 \228\184\150 \229\146\185 \230\176\180 \230\153\182 \240\166\147\161 \231\169\186 \240\163\142\143 \229\174\179 \229\146\166 ")
(set 'Yiddish "\215\144\215\153\215\154 \215\167\215\162\215\159 \215\162\215\161\215\159 \215\146\215\156\215\144\214\184\215\150 \215\144\215\149\215\159 \215\162\215\161 \215\152\215\149\215\152 \215\158\215\153\215\168 \215\160\215\153\215\169\215\152 \215\176\215\178. ")
(set 'Yoruba "Mo l\195\168 je\204\169 d\195\173g\195\173, k\195\178 n\195\173 pa m\195\173 l\195\161ra.")
(context MAIN)
(dotree (l L)
(println (term l) ":" (eval l)))
;(println "\239\163\191")
(println (char 63743))
(println ">>>>> Tested UTF-8 font and display performance")
(exit)
;; eof
; utf8 test data
; should show Chinese characters if editor or terminal is UTF-8 capable
; (set 'utf8str "我能吞下玻璃而不伤身体。")
;(set 'utf8chars '(25105 33021 21534 19979 29627 29827 32780 19981 20260 36523 20307 12290))
;(set 'utf8str (join (map char utf8chars)))
;(= (map char (explode utf8str)) utf8chars)