[Anthy-dev 3541] Re: cannadic改070805 リリースのお知らせとお願い

アーカイブの一覧に戻る

Jun Oizumi vagus****@gmail*****
2007年 8月 8日 (水) 20:10:17 JST


大泉です。

白井秀行さんは書きました:
> Solaris も cygwin も Zaurus もみんな
> 動いているので大丈夫でしょう。

そうですか。わざわざご確認いただき、ありがとうございます。

> とりあえず、ぼくがソートしたものをおいておきますので比べてみてく
> ださい。また、確認していなかったのですが、anthy は 9100 でよいの
> ですよね。
> http://www.meadowy.org/~shirai/tmp/gt34-tankanji-hikanji-sort.t.gz

こちらもありがとうございます(anthy は 9100 です)。
diff 取ってみましたが、ほとんど別物ですね、これは…。
私の方はこんな感じ↓になってしまいます。
http://vagus.up.seesaa.net/data/gt34-tankanji-hikanji-suse.t.gz
openSUSE 10.2 ja_JP.UTF-8 で
$ sort gt34-tankanji-hikanji.t > gt34-tankanji-hikanji-suse.t
したものです。

suse の coreutils の src.rpm 取ってきて覗いてみたところ、
i18n 関係の結構でかいパッチが当ってるようなので、それの
影響なのかな…。
コード読めないのでさっぱり分かりませんが (^^;
http://ftp.riken.jp/Linux/opensuse/distribution/10.2/repo/src-oss/suse/src/coreutils-6.4-10.src.rpm
ついでに Fedora7 の coreutils のソースも覗いてみましたが、
こちらはこちらでまた独自のパッチを当ててるようで、
http://ftp.riken.jp/Linux/fedora/releases/7/Fedora/source/SRPMS/coreutils-6.9-2.fc7.src.rpm
何か、「こりゃもしかして linux は全滅なんじゃないのか?」という気が
してきました…。

# あとで Fedora 入れて確認してみよう…
# そうだ、内海さん、Mandriva ではどうでしょうか?

> 手元では 't' を除いた読みを打った後 C-t で出るようにしてみました。
> ある意味便利かもです。(けーけーt とかも出るけどそれはご愛嬌)

それはどういう風に登録しておくんでしょうか?
Emacs だからできる技でしょうか?

> # gtankan.ctd から単漢字を抜き出して、よみの後に全部 't' つけた
> # 個人辞書を作りたくなってきました :-)

んっと、「単漢字の漢字部分のみ」ということでしょうか?(記号も含めて
「単漢字」と呼んでいるので紛らわしいですね)。
こちら↓に単漢字のみですが、元の辞書ファイルを置いておきますので、
よろしければお使いください。
http://vagus.up.seesaa.net/data/tankanji.zip

# そのうち辞書のソースも全部公開するつもりです

> しかし、jisx0213 によく読み仮名をつけましたね。素晴らしいです。

いえ、漢字部分は JISX0213 InfoCenter
http://www.jca.apc.org/~earthian/aozora/0213.html
の「漢字音訓索引(onkun0213.txt [2000-09-11])」を使わせて頂き
ましたので、実は私は大したことはしてなかったり… (^^;
私がやったのは、バラして canna辞書のフォーマットに作り変えて、
欠けてる文字を補ったくらいです。
非漢字部分の方はベースにできるものがなかったので、泣く泣く
一から自前で作りましたが。




Anthy-dev メーリングリストの案内
アーカイブの一覧に戻る