[Anthy-dev 3432] Re: 田畑さんの予想を gcanna.ctd に適用してみました

アーカイブの一覧に戻る

Yusuke TABATA yusuk****@w5*****
2007年 3月 14日 (水) 00:59:12 JST


田畑です。

Jun Oizumi wrote:
> ちょっと時間がかかってしまいましたが、
力作ご苦労様です。

> その作業はこれから行いますが、一度この辞書でどんな感じになるか試してみて
> 頂けますでしょうか?
なんか一気に配布物が巨大化してますが、anthy-8713としてuploadしました。
http://osdn.dl.sourceforge.jp/anthy/24489/anthy-8713.tar.gz

いくつか性能が落ちる理由があるにも関わらず、まずまずの性能で
チューニングのベースとしては良い感じだと思います。


> 
> # 8706 で試してみたところでは、これまで誤変換を避けるために個別に頻度を
> # 調節していたものがぶっ飛んだ分、むしろちょっと悪くなったかな、という感じ
> # でした。
タテマエ論からすると、小細工をしなくて良くなるのが良いアルゴリズムなんで、
変換エンジン開発者がなんとかすべきと思います。
新たな小細工を積み込む余地を作り出すためにはどんどん良い
アルゴリズムを模索し、古い小細工を消していくというのが健全と
考えてます。

> # 「井生」「重う」「小間生」についてはこれまでのように頻度(ランク)を下げ
> # ます。
頻度情報を使うことで、いままでは
  名詞単独 > 動詞単独
となってたのが
  頻度の高い名詞単独 > 頻度の高い動詞単独 > 頻度の低い名詞単独 > 頻度の低い動詞単独
となってこの辺も例文から正しく学習できてるんではないかと思います。


-- 
--
 CHAOS AND CHANCE!
  Yusuke TABATA



Anthy-dev メーリングリストの案内
アーカイブの一覧に戻る