yusuk****@cheru*****
yusuk****@cheru*****
2004年 2月 9日 (月) 01:36:14 JST
田畑です anthy-5008をリリースしました。学習機構を少し変更してます。 いまのanthyにはコミットがあった時に隣接するn個(n>=3)の 文節の列の読みをキーに何がコミットされたのかを覚えておき、 同じ読みが出た時に以前の結果を利用してn個の文節に高いスコアを 与える通称「お茶入れ学習」というのがあります。 学習の条件をn>=2に変更して、スコアを与える文節の数をn-1に変更しました *これはぺんです -> 「これは+ペンです」 というのを学習した時に2つの文節に高いスコアを与えると *これはぺんですか -> 「*これは*+*ペンです*+下(か)」 みたいな結果を出してしまうことがあったのですが、 高いスコアを与える文節を左側の1(2-1)個にすることで、 *これはぺんですか -> 「*これは*+ペンですか」 というように正しくでてくる可能性が向上するようになったつもりです。 学習はanthy/src-ordering/commit.cのlearn_ochaire() 結果の使用はanthy/src-splitter/metaword.cのmake_ochaire_metaword() でやってますので、気が向いたら眺めてください。 #余談 変換エンジンの開発者を増やすためには変換エンジンのハックが 格好いい物に見えるように努力しないといけないと最近感じています。 皆様は「カーネルハッカー」と「変換エンジン開発者」のどっちが格好いい 言葉だと感じますか?僕には後者が3桁ぐらい負けてるように感じるので、 なんとかしたいと感じます。 #実際には運動不足気味の独身社畜がダルそうにコードを書いているとしても、、、 -- CHAOS AND CHANCE! Yusuke TABATA (yusuk****@cheru*****)