• Home
  • Line#
  • Scopes#
  • Navigate#
  • Raw
  • Download
1# ***************************************************************************
2# *
3# *  Copyright (C) 2004-2015, International Business Machines
4# *  Corporation; Unicode, Inc.; and others.  All Rights Reserved.
5# *
6# ***************************************************************************
7# File: Latin_Katakana.txt
8# Generated from CLDR
9#
10:: [[ᄀ-ᄒᄚᄡ\u1160-ᅵᆪᆬ-ᆭᆰ-ᆵ←-↓│■○\u3000-。「-」\u3099-\u309Aァ-ロワヲ-ヴヷヺ-ー!-~¢-₩][',.A-Za-z~À-ÖØ-öø-ďĒ-ĥĨ-İĴ-ķĹ-ľŃ-ňŌ-őŔ-ťŨ-žƠ-ơƯ-ưǍ-ǜǞ-ǣǦ-ǭǰǴ-ǵǸ-țȞ-ȟȦ-ȳ\u0304Ӣ-ӣӮ-ӯḀ-ẙẠ-ỹᾱᾹῑῙῡῩK-Å]] ;
11:: [:Latin:] fullwidth-halfwidth ();
12:: NFD (NFC);
13:: Lower ();    # whenever transliterating from cased to uncased script, include this
14$vowel = [aeiou] ;
15$consonant = [bcdfghjklmnpqrstvwxyz] ;
16$macron = \u0304 ;
17$kana = [ぁ-ゔ] ;
18$voice = [\u3099゛];
19$semivoice = [\u309A゜];
20$k_start = [カキクケコかきくけこ] ;
21$s_start = [サシスセソさしすせそ] ;
22$j_start = [シし] $voice ;
23$t_start = [タチツテトたちつてと] ;
24$n_start = [ナニヌネノンなにぬねの] ;
25$h_start = [ハヒヘホはひへほ] ;
26$f_start = [フふ] ;
27$m_start = [マミムメモまみむめも] ;
28$y_start = [ヤユヨやゆよ] ;
29$r_start = [ラリルレロらりるれろ] ;
30$w_start = [ワヰヱヲわゐゑを] ;
31$v_start = [ワヰヱヲ]\u3099 ;
32$voweled_basekana = [ァ-オカキクケコサシスセソタチッツテトナ-ノハヒフヘホマ-ヲヵヶ] ;
33$n_quoter  =  [ア イ ウ エ オ ナ ニ ヌ ネ ノ ヤ ユ ヨ ン] ;
34$small_y = [ャィュェョ] ;
35$iteration = ゝ ;
36'.' ↔ 。;
37',' ↔ 、;
38va ↔ ワ\u3099 ;
39vi ↔ ヰ\u3099 ;
40ve ↔ ヱ\u3099 ;
41vo ↔ ヲ\u3099 ;
42'~ka' ↔ ヵ ;
43'~ke' ↔ ヶ ;
44ya ← '~'ャ;
45yi ← '~'ィ ;
46yu ← '~'ュ;
47ye ← '~'ェ;
48yo ← '~'ョ;
49a ↔ ア ;
50b | '~' ← ヒ \u3099} $small_y ;
51by } $vowel → ヒ\u3099 | '~y' ;
52ba ↔ ハ\u3099 ;
53bi ↔ ヒ\u3099 ;
54bu ↔ フ\u3099 ;
55be ↔ ヘ\u3099 ;
56bo ↔ ホ\u3099 ;
57c } i → | s ;
58c } e → | s ;
59da ↔ タ\u3099 ;
60di ↔ テ\u3099ィ ;
61du ↔ テ\u3099ゥ ;
62de ↔ テ\u3099 ;
63do ↔ ト\u3099 ;
64dzu ↔ ツ\u3099 ;
65dja ← チ\u3099ャ ;
66dji'~i' ← チ\u3099ィ ; # liu
67dju ← チ\u3099ュ ;
68dje ← チ\u3099ェ ;
69djo ← チ\u3099ョ ;
70dji ↔ チ\u3099 ;
71dj  } $vowel → チ\u3099 | '~y' ;
72cha ← チャ ;
73chi'~i' ← チィ ; # liu
74chu ← チュ ;
75che ← チェ ;
76cho ← チョ ;
77chi ↔ チ ;
78ch } $vowel → チ | '~y' ;
79e ↔ エ ;
80g | '~' ← キ\u3099} $small_y ;
81gy  } $vowel → キ\u3099 | '~y' ;
82ga ↔ カ\u3099 ;
83gi ↔ キ\u3099 ;
84gu ↔ ク\u3099 ;
85ge ↔ ケ\u3099 ;
86go ↔ コ\u3099 ;
87i ↔ イ ;
88ja ↔ シ\u3099ャ ;
89ji'~i' ← シ\u3099ィ ; # liu
90ju ↔ シ\u3099ュ ;
91je ↔ シ\u3099ェ ;
92jo ↔ シ\u3099ョ ;
93ji ↔ シ\u3099 ;
94k | '~' ← キ} $small_y ;
95ky  } $vowel → キ | '~y' ;
96ka ↔ カ ;
97ki ↔ キ ;
98ku ↔ ク ;
99ke ↔ ケ ;
100ko ↔ コ ;
101m | '~' ← ミ} $small_y ;
102my  } $vowel → ミ | '~y' ;
103ma ↔ マ ;
104mi ↔ ミ ;
105mu ↔ ム ;
106me ↔ メ ;
107mo ↔ モ ;
108m } [pbfv] → ン ;
109n | '~' ← ニ } $small_y ;
110ny  } $vowel → ニ | '~y' ;
111na ↔ ナ ;
112ni ↔ ニ ;
113nu ↔ ヌ ;
114ne ↔ ネ ;
115no ↔ ノ ;
116o ↔ オ ;
117p | '~' ← ヒ\u309A } $small_y ;
118py  } $vowel → ヒ\u309A | '~y' ;
119pa ↔ ハ\u309A ;
120pi ↔ ヒ\u309A ;
121pu ↔ フ\u309A ;
122pe ↔ ヘ\u309A ;
123po ↔ ホ\u309A ;
124h | '~' ← ヒ } $small_y ;
125hy  } $vowel → ヒ | '~y' ;
126ha ↔ ハ ;
127hi ↔ ヒ ;
128hu ↔ ヘゥ ;
129he ↔ ヘ ;
130ho ↔ ホ ;
131fa ↔ ファ ;
132fi ↔ フィ ;
133fe ↔ フェ ;
134fo ↔ フォ ;
135fu ↔ フ ;
136r | '~' ← リ } $small_y ;
137ry  } $vowel → リ | '~y' ;
138ra ↔ ラ ;
139ri ↔ リ ;
140ru ↔ ル ;
141re ↔ レ ;
142ro ↔ ロ ;
143za ↔ サ\u3099 ;
144zi ↔ セ\u3099ィ ;
145zu ↔ ス\u3099 ;
146ze ↔ セ\u3099 ;
147zo ↔ ソ\u3099 ;
148sa ↔ サ ;
149si ↔ セィ ;
150su ↔ ス ;
151se ↔ セ ;
152so ↔ ソ ;
153sha ← シャ ;
154shi'~i' ← シィ ; # liu
155shu ← シュ ;
156she ← シェ ;
157sho ← ショ ;
158shi ↔ シ ;
159sh } $vowel → シ | '~y' ;
160ta ↔ タ ;
161ti ↔ ティ ;
162tu ↔ テゥ ;
163te ↔ テ ;
164to ↔ ト ;
165tsu ↔ ツ ;
166vu ↔ ウ\u3099 ;
167u ↔ ウ ;
168wa ↔ ワ ;
169wi ↔ ヰ ;
170wu → ウ ;
171we ↔ ヱ ;
172wo ↔ ヲ ;
173ya ↔ ヤ ;
174yi → イ ;
175yu ↔ ユ ;
176ye → エ ;
177yo ↔ ヨ ;
178s } sh → ッ ;
179t } ch → ッ ;
180j } j ↔ ッ } $j_start ;
181b } b ↔ ッ } [$h_start$f_start] $voice;
182d } d ↔ ッ } $t_start $voice;
183g } g ↔ ッ } $k_start $voice;
184p } p ↔ ッ } [$h_start$f_start] $semivoice;
185z } z ↔ ッ } $s_start $voice;
186v } v ↔ ッ } $v_start;
187k } k ↔ ッ } $k_start ;
188m } m ↔ ッ } $m_start ;
189n } n ↔ ッ } $n_start ;
190h } h ↔ ッ } $h_start ;
191f } f ↔ ッ } $f_start ;
192r } r ↔ ッ } $r_start ;
193t } t ↔ ッ } $t_start ;
194s } s ↔ ッ } $s_start ;
195w } w  ↔ ッ } $w_start;
196y } y ↔ ッ } $y_start;
197x } x → ッ ;
198c } k → ッ ;
199c } c → ッ ;
200c } q → ッ ;
201l } l → ッ ;
202q } q → ッ ;
203$macron ↔ ー ;
204'~a' ↔ ァ ;
205'~i' ↔ ィ ;
206'~u' ↔ ゥ ;
207'~e' ↔ ェ ;
208'~o' ↔ ォ ;
209'~tsu' ↔ ッ ;
210'~wa' ↔ ヮ ;
211'~ya' ↔ ャ ;
212'~yi' → ィ ;
213'~yu' ↔ ュ ;
214'~ye' → ェ ;
215'~yo' ↔ ョ ;
216j $1 ← sh (y* $vowel) {ヽ$voice ;
217dj $1 ← ch (y* $vowel) {ヽ$voice ;
218dz $1 ← ts (y* $vowel) {ヽ$voice ;
219g $1 ← k (y* $vowel) {ヽ$voice ;
220z $1 ← s (y* $vowel) {ヽ$voice ;
221d $1 ← t (y* $vowel) {ヽ$voice ;
222h $1 ← b (y* $vowel) {ヽ$voice ;
223v $1 ← w (y* $vowel) {ヽ$voice ;
224sh $1 ← sh (y* $vowel) {ヽ$voice ;
225j $1 ← j (y* $vowel) {ヽ$voice ;
226ch $1 ← ch (y* $vowel) {ヽ$voice ;
227dj $1 ← dj(y* $vowel) {ヽ$voice ;
228ts $1 ← ts (y* $vowel) {ヽ$voice ;
229dz $1 ← dz (y* $vowel) {ヽ$voice ;
230$1 ← ($consonant y* $vowel) {ヽ$voice? ;
231$1 ← (.) {ヽ $voice? ; # otherwise repeat last character
232← ヽ $voice? ; # delete if no characters found
233$voweled_basekana [\u3099 \u309A]? { h → ー ;
234cy → セィ ;
235dy → テ\u3099ィ ;
236hy → ヒ ;
237sy → セィ ;
238ty → ティ ;
239zy → セ\u3099ィ ;
240h → ヘ ;
241ch → チ;
242sh → シ ;
243dz → ツ\u3099 ;
244dj → チ\u3099;
245b → フ\u3099 ;
246d → テ\u3099 ;
247g → ク\u3099 ;
248k → ク ;
249m → ム ;
250n'' ← ン } $n_quoter ;
251n ↔ ン ;
252p → フ\u309A ;
253r → ル ;
254s → ス ;
255t → テ ;
256y → イ ;
257z → ス\u3099 ;
258v → ウ\u3099 ;
259f → フ;
260j  → シ\u3099;
261w → ウ;
262ß → | ss ;
263æ → | e ;
264ð → | d ;
265ø → | u ;
266þ → | th ;
267c → | k ;
268l → | r ;
269q → | k ;
270x → | ks ;
271'~' → ; # delete stray tildes between letters
272[:Katakana:] { '' } [:Latin:] → ; # delete stray quotes between letters
273:: NFC (NFD) ;
274:: ([[:Katakana:][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] halfwidth-fullwidth);
275:: ( [[\ -~¢-£¥-¦¬\u0304₩。-하-ᅦᅧ-ᅬᅭ-ᅲᅳ-ᅵ│-○][~、-。がぎぐげござじずぜぞだぢづでどば-ぱび-ぴぶ-ぷべ-ぺぼ-ぽゔ\u3099-゛ゞァ-ヺー-ヾ][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] ) ;
276