[Anthy-dev 2485] Re: gcanna.ctd $B$NIQEY$K$D$$$F(B

アーカイブの一覧に戻る

Yuichi Yoshida oxy****@kmc*****
2005年 10月 3日 (月) 16:21:28 JST


吉田です。

>   Berkeley DBなどを使うのはどうでしょう。大抵のスクリプト言語は自身が
> 持つハッシュと同じインターフェースでBDBを扱えて、オンメモリでそのまま
> ハッシュに持たせるよりはメモリ効率がよいようです。

DBをインストールして使いかたを覚える手間を今まで惜しんできていたのですが、
そうも言ってられないかもしれないですね…。
mkanthydicのコードをライブラリの形に分離して、
それをスクリプト言語から利用することも考えたのですが、
ここまでするならDBを素直に使った方が楽かもしれません。

>   辞書の生成にかなりのメモリを必要とするようですね。Zaurus C3000でセル
> フビルドを試みてみたのですが、mkanthydicを実行するときに、構造体
> uc_dictの構築途中でメモリが尽きてしまうようです。
> 
>   辞書のバイナリに関してお聞きしたいのですが、エンディアン依存性はある
> のでしょうか。ないのであれば、てきとうなi386マシンで作った方がよさそう
> です。

一応エンディアンには依存しないように作っているつもりなのですが、
厳密なテストをしているわけではないので動かないかもしれないです。
前のバージョンから逆辞書(再変換用)も作るようにしたので、
辞書のエントリ数が二倍になり、さらに富豪的になっています;)
----
吉田 悠一
oxy****@kmc*****
http://mono.kmc.gr.jp/~oxy/



Anthy-dev メーリングリストの案内
アーカイブの一覧に戻る