[Anthy-dev 3417] 例文を用いた変換補正についての質問

アーカイブの一覧に戻る

UTUMI Hirosi utuhi****@yahoo*****
2007年 3月 7日 (水) 02:27:45 JST


内海です。

今後 Anthy では例文を大量にあつめて変換結果を補正する
仕組みに移行する可能性があるようですが、
これに関して質問が2つあります。

1. 変換エンジンのバグを特定しにくくなる?
例文を増やすと
http://lists.sourceforge.jp/mailman/archives/anthy-dev/2007-March/003391.html
> 「〜ない + のが」な変換がうまくできなくなってしまいました.
のようなバグが見えにくくなると思います。
例えば「うたないのが」や「にげないのが」といった例文が
登録されているとその文章は適切に変換されますが、
登録されていない文章では「〜ない + のが」の変換が
うまくできません。
エンジンに問題があるのか例文で補正されているのか
判別がつきにくくなると思います。

ただし
(例文の格納方式を知らないので何とも言えないのですが、)
例文を「動詞 + ない + のが」のように抽象的に格納しているのなら
構文が合致すればすべて補正されるので
実際の変換では大きな問題はないかもしれません。

2. 表記の揺れ
「美しい人が」と「きれいなひとが」という例文があると、
「ひと」が「ひと」と変換されたり「人」と変換されたりして
表記が揺らぐ気がします。
--------------------------------------
Start Yahoo! Auction now! Check out the cool campaign
http://pr.mail.yahoo.co.jp/auction/




Anthy-dev メーリングリストの案内
アーカイブの一覧に戻る