1Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/> - 2015-08-28 - CC BY 4.0 2UTF-8 encoded sample plain-text file 3‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾ 4Markus Kuhn [ˈmaʳkʊs kuːn] <mkuhn@acm.org> — 1999-08-20 5 6The ASCII compatible UTF-8 encoding of ISO 10646 and Unicode 7plain-text files is defined in RFC 2279 and in ISO 10646-1 Annex R. 8 9 10Using Unicode/UTF-8, you can write in emails and source code things such as 11 12Mathematics and Sciences: 13 14 ∮ E⋅da = Q, n → ∞, ∑ f(i) = ∏ g(i), ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β), 15 16 ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ, ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (A ⇔ B), 17 18 2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm 19 20Linguistics and dictionaries: 21 22 ði ıntəˈnæʃənəl fəˈnɛtık əsoʊsiˈeıʃn 23 Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ] 24 25APL: 26 27 ((V⍳V)=⍳⍴V)/V←,V ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈ 28 29Nicer typography in plain text files: 30 31 ╔══════════════════════════════════════════╗ 32 ║ ║ 33 ║ • ‘single’ and “double” quotes ║ 34 ║ ║ 35 ║ • Curly apostrophes: “We’ve been here” ║ 36 ║ ║ 37 ║ • Latin-1 apostrophe and accents: '´` ║ 38 ║ ║ 39 ║ • ‚deutsche‘ „Anführungszeichen“ ║ 40 ║ ║ 41 ║ • †, ‡, ‰, •, 3–4, —, −5/+5, ™, … ║ 42 ║ ║ 43 ║ • ASCII safety test: 1lI|, 0OD, 8B ║ 44 ║ ╭─────────╮ ║ 45 ║ • the euro symbol: │ 14.95 € │ ║ 46 ║ ╰─────────╯ ║ 47 ╚══════════════════════════════════════════╝ 48 49Greek (in Polytonic): 50 51 The Greek anthem: 52 53 Σὲ γνωρίζω ἀπὸ τὴν κόψη 54 τοῦ σπαθιοῦ τὴν τρομερή, 55 σὲ γνωρίζω ἀπὸ τὴν ὄψη 56 ποὺ μὲ βία μετράει τὴ γῆ. 57 58 ᾿Απ᾿ τὰ κόκκαλα βγαλμένη 59 τῶν ῾Ελλήνων τὰ ἱερά 60 καὶ σὰν πρῶτα ἀνδρειωμένη 61 χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά! 62 63 From a speech of Demosthenes in the 4th century BC: 64 65 Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι, 66 ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς 67 λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ 68 τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿ 69 εἰς τοῦτο προήκοντα, ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ 70 πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν 71 οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι, 72 οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν 73 ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον 74 τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι 75 γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν 76 προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους 77 σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ 78 τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ 79 τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς 80 τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον. 81 82 Δημοσθένους, Γ´ ᾿Ολυνθιακὸς 83 84Georgian: 85 86 From a Unicode conference invitation: 87 88 გთხოვთ ახლავე გაიაროთ რეგისტრაცია Unicode-ის მეათე საერთაშორისო 89 კონფერენციაზე დასასწრებად, რომელიც გაიმართება 10-12 მარტს, 90 ქ. მაინცში, გერმანიაში. კონფერენცია შეჰკრებს ერთად მსოფლიოს 91 ექსპერტებს ისეთ დარგებში როგორიცაა ინტერნეტი და Unicode-ი, 92 ინტერნაციონალიზაცია და ლოკალიზაცია, Unicode-ის გამოყენება 93 ოპერაციულ სისტემებსა, და გამოყენებით პროგრამებში, შრიფტებში, 94 ტექსტების დამუშავებასა და მრავალენოვან კომპიუტერულ სისტემებში. 95 96Russian: 97 98 From a Unicode conference invitation: 99 100 Зарегистрируйтесь сейчас на Десятую Международную Конференцию по 101 Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии. 102 Конференция соберет широкий круг экспертов по вопросам глобального 103 Интернета и Unicode, локализации и интернационализации, воплощению и 104 применению Unicode в различных операционных системах и программных 105 приложениях, шрифтах, верстке и многоязычных компьютерных системах. 106 107Thai (UCS Level 2): 108 109 Excerpt from a poetry on The Romance of The Three Kingdoms (a Chinese 110 classic 'San Gua'): 111 112 [----------------------------|------------------------] 113 ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช พระปกเกศกองบู๊กู้ขึ้นใหม่ 114 สิบสองกษัตริย์ก่อนหน้าแลถัดไป สององค์ไซร้โง่เขลาเบาปัญญา 115 ทรงนับถือขันทีเป็นที่พึ่ง บ้านเมืองจึงวิปริตเป็นนักหนา 116 โฮจิ๋นเรียกทัพทั่วหัวเมืองมา หมายจะฆ่ามดชั่วตัวสำคัญ 117 เหมือนขับไสไล่เสือจากเคหา รับหมาป่าเข้ามาเลยอาสัญ 118 ฝ่ายอ้องอุ้นยุแยกให้แตกกัน ใช้สาวนั้นเป็นชนวนชื่นชวนใจ 119 พลันลิฉุยกุยกีกลับก่อเหตุ ช่างอาเพศจริงหนาฟ้าร้องไห้ 120 ต้องรบราฆ่าฟันจนบรรลัย ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ 121 122 (The above is a two-column text. If combining characters are handled 123 correctly, the lines of the second column should be aligned with the 124 | character above.) 125 126Ethiopian: 127 128 Proverbs in the Amharic language: 129 130 ሰማይ አይታረስ ንጉሥ አይከሰስ። 131 ብላ ካለኝ እንደአባቴ በቆመጠኝ። 132 ጌጥ ያለቤቱ ቁምጥና ነው። 133 ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው። 134 የአፍ ወለምታ በቅቤ አይታሽም። 135 አይጥ በበላ ዳዋ ተመታ። 136 ሲተረጉሙ ይደረግሙ። 137 ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል። 138 ድር ቢያብር አንበሳ ያስር። 139 ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም። 140 እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም። 141 የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ። 142 ሥራ ከመፍታት ልጄን ላፋታት። 143 ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል። 144 የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ። 145 ተንጋሎ ቢተፉ ተመልሶ ባፉ። 146 ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው። 147 እግርህን በፍራሽህ ልክ ዘርጋ። 148 149Runes: 150 151 ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ 152 153 (Old English, which transcribed into Latin reads 'He cwaeth that he 154 bude thaem lande northweardum with tha Westsae.' and means 'He said 155 that he lived in the northern land near the Western Sea.') 156 157Braille: 158 159 ⡌⠁⠧⠑ ⠼⠁⠒ ⡍⠜⠇⠑⠹⠰⠎ ⡣⠕⠌ 160 161 ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠙⠑⠁⠙⠒ ⠞⠕ ⠃⠑⠛⠔ ⠺⠊⠹⠲ ⡹⠻⠑ ⠊⠎ ⠝⠕ ⠙⠳⠃⠞ 162 ⠱⠁⠞⠑⠧⠻ ⠁⠃⠳⠞ ⠹⠁⠞⠲ ⡹⠑ ⠗⠑⠛⠊⠌⠻ ⠕⠋ ⠙⠊⠎ ⠃⠥⠗⠊⠁⠇ ⠺⠁⠎ 163 ⠎⠊⠛⠝⠫ ⠃⠹ ⠹⠑ ⠊⠇⠻⠛⠹⠍⠁⠝⠂ ⠹⠑ ⠊⠇⠻⠅⠂ ⠹⠑ ⠥⠝⠙⠻⠞⠁⠅⠻⠂ 164 ⠁⠝⠙ ⠹⠑ ⠡⠊⠑⠋ ⠍⠳⠗⠝⠻⠲ ⡎⠊⠗⠕⠕⠛⠑ ⠎⠊⠛⠝⠫ ⠊⠞⠲ ⡁⠝⠙ 165 ⡎⠊⠗⠕⠕⠛⠑⠰⠎ ⠝⠁⠍⠑ ⠺⠁⠎ ⠛⠕⠕⠙ ⠥⠏⠕⠝ ⠰⡡⠁⠝⠛⠑⠂ ⠋⠕⠗ ⠁⠝⠹⠹⠔⠛ ⠙⠑ 166 ⠡⠕⠎⠑ ⠞⠕ ⠏⠥⠞ ⠙⠊⠎ ⠙⠁⠝⠙ ⠞⠕⠲ 167 168 ⡕⠇⠙ ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ 169 170 ⡍⠔⠙⠖ ⡊ ⠙⠕⠝⠰⠞ ⠍⠑⠁⠝ ⠞⠕ ⠎⠁⠹ ⠹⠁⠞ ⡊ ⠅⠝⠪⠂ ⠕⠋ ⠍⠹ 171 ⠪⠝ ⠅⠝⠪⠇⠫⠛⠑⠂ ⠱⠁⠞ ⠹⠻⠑ ⠊⠎ ⠏⠜⠞⠊⠊⠥⠇⠜⠇⠹ ⠙⠑⠁⠙ ⠁⠃⠳⠞ 172 ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ ⡊ ⠍⠊⠣⠞ ⠙⠁⠧⠑ ⠃⠑⠲ ⠔⠊⠇⠔⠫⠂ ⠍⠹⠎⠑⠇⠋⠂ ⠞⠕ 173 ⠗⠑⠛⠜⠙ ⠁ ⠊⠕⠋⠋⠔⠤⠝⠁⠊⠇ ⠁⠎ ⠹⠑ ⠙⠑⠁⠙⠑⠌ ⠏⠊⠑⠊⠑ ⠕⠋ ⠊⠗⠕⠝⠍⠕⠝⠛⠻⠹ 174 ⠔ ⠹⠑ ⠞⠗⠁⠙⠑⠲ ⡃⠥⠞ ⠹⠑ ⠺⠊⠎⠙⠕⠍ ⠕⠋ ⠳⠗ ⠁⠝⠊⠑⠌⠕⠗⠎ 175 ⠊⠎ ⠔ ⠹⠑ ⠎⠊⠍⠊⠇⠑⠆ ⠁⠝⠙ ⠍⠹ ⠥⠝⠙⠁⠇⠇⠪⠫ ⠙⠁⠝⠙⠎ 176 ⠩⠁⠇⠇ ⠝⠕⠞ ⠙⠊⠌⠥⠗⠃ ⠊⠞⠂ ⠕⠗ ⠹⠑ ⡊⠳⠝⠞⠗⠹⠰⠎ ⠙⠕⠝⠑ ⠋⠕⠗⠲ ⡹⠳ 177 ⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞ 178 ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ 179 180 (The first couple of paragraphs of "A Christmas Carol" by Dickens) 181 182Compact font selection example text: 183 184 ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789 185 abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ 186 –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд 187 ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა 188 189Greetings in various languages: 190 191 Hello world, Καλημέρα κόσμε, コンニチハ 192 193Box drawing alignment tests: █ 194 ▉ 195 ╔══╦══╗ ┌──┬──┐ ╭──┬──╮ ╭──┬──╮ ┏━━┳━━┓ ┎┒┏┑ ╷ ╻ ┏┯┓ ┌┰┐ ▊ ╱╲╱╲╳╳╳ 196 ║┌─╨─┐║ │╔═╧═╗│ │╒═╪═╕│ │╓─╁─╖│ ┃┌─╂─┐┃ ┗╃╄┙ ╶┼╴╺╋╸┠┼┨ ┝╋┥ ▋ ╲╱╲╱╳╳╳ 197 ║│╲ ╱│║ │║ ║│ ││ │ ││ │║ ┃ ║│ ┃│ ╿ │┃ ┍╅╆┓ ╵ ╹ ┗┷┛ └┸┘ ▌ ╱╲╱╲╳╳╳ 198 ╠╡ ╳ ╞╣ ├╢ ╟┤ ├┼─┼─┼┤ ├╫─╂─╫┤ ┣┿╾┼╼┿┫ ┕┛┖┚ ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳ 199 ║│╱ ╲│║ │║ ║│ ││ │ ││ │║ ┃ ║│ ┃│ ╽ │┃ ░░▒▒▓▓██ ┊ ┆ ╎ ╏ ┇ ┋ ▎ 200 ║└─╥─┘║ │╚═╤═╝│ │╘═╪═╛│ │╙─╀─╜│ ┃└─╂─┘┃ ░░▒▒▓▓██ ┊ ┆ ╎ ╏ ┇ ┋ ▏ 201 ╚══╩══╝ └──┴──┘ ╰──┴──╯ ╰──┴──╯ ┗━━┻━━┛ └╌╌┘ ╎ ┗╍╍┛ ┋ ▁▂▃▄▅▆▇█ 202