[mecab-devel 27] Re: 辞書データ以外を参照しない方法

アーカイブの一覧に戻る

Taku Kudo taku****@chase*****
2006年 5月 25日 (木) 00:47:20 JST


工藤です

> ところで、このMecabを利用して形態素解析を実行する時、
> IPA辞書データに登録されていない単語は、
> 全ての未知語として解析して欲しいと考えています。
> そのような実装・設定をすることは可能でしょうか。

辞書に載っていないものは、下手に品詞を出力するのをやめて
「未知語」としてほしいという意味でしょうか?

それでしたら、簡単です。

辞書のディレクトリにある unk.def の品詞の部分、具体的には
4カラム目以降を以下のように「未知語」とすれば、品詞を
出力するかわりに「未知語」が出力されます

変更前
KANJI,1298,1298,10050,名詞,一般,*,*,*,*,*
KANJI,1296,1296,11783,名詞,サ変接続,*,*,*,*,*,*,*
...

変更後
KANJI,1298,1298,10050,未知語
KANJI,1296,1296,11783,未知語
...



Mecab-devel メーリングリストの案内
アーカイブの一覧に戻る