ソース表示: kuten_dict #30742

== 面区点コード辞書
 * 文字を面区点コードから引くための辞書です
 * 一応、JIS X 0213:2004 準拠のつもりです

=== 【内容物】
 * gkuten.ctd --- Canna 用、JIS第1第2水準相当
 * gt-tankanji_kuten-std.t --- Anthy 用、JIS 第 1 第 2 水準相当
 * gt-tankanji_kuten-34.t --- Anthy 用、JIS 第 3 第 4 水準相当

※ Canna 用のJIS 第 3 第 4 水準相当辞書はありません。

=== 【入れ方】
次回リリース時に本体のパッケージに入れますが、それまでは[http://vagus.up.seesaa.net/data/kuten-dict.tar.bz2 ここ]に置いておきますので、それを DL して下さい。

==== Anthy で使う
 * [http://sourceforge.jp/projects/alt-cannadic/wiki/%E4%BD%BF%E3%81%84%E6%96%B9_Anthy-UTF-8 このページ]の「個人辞書として使う」を参照。

※ gt-tankanji_kuten-34.t の方を使う場合は「準備」のところもよく読んで下さい。

==== Canna で使う
 * [http://sourceforge.jp/projects/alt-cannadic/wiki/%E4%BD%BF%E3%81%84%E6%96%B9_Canna このページ]を参考にして下さい。ファイル名が違うだけで、やり方としては同じです。

=== 【変換の仕方】
 * 「面区点コード辞書」なので、面の番号から入れる必要があります。また、桁を揃えてあるので区や点の番号が一桁の場合は「0」を補ってやる必要があります(従って、常に 5桁の数字になります)。
 * 頭に「?」を付けて変換する必要があります。(通常の数字とバッティングしないようにするためです)

例:[[BR]]
{{{
〒(1-2-9) → ?10209 と入力して変換
〠(1-6-70) → ?10670 と入力して変換
俱(1-14-01) → ?11401 と入力して変換
}}}

※お使いの環境によっては読みとして入力できる記号や数字が全角だったりすると思いますが、その場合は sed やエディタなどで辞書ファイルの読みの部分をお使いの環境に合わせて(他の記号や全角文字に)置換して下さい。↓の太字イタリックの部分が読みに当たります。

 …[[BR]]
 '''''?10140''''' #KJ*1 “[[BR]]
 '''''?10141''''' #KJ*1 ”[[BR]]
 '''''?10142''''' #KJ*1 ([[BR]]
 '''''?10143''''' #KJ*1 )[[BR]]
 …[[BR]]