Taku Kudo
taku****@chase*****
2006年 5月 25日 (木) 00:47:20 JST
工藤です > ところで、このMecabを利用して形態素解析を実行する時、 > IPA辞書データに登録されていない単語は、 > 全ての未知語として解析して欲しいと考えています。 > そのような実装・設定をすることは可能でしょうか。 辞書に載っていないものは、下手に品詞を出力するのをやめて 「未知語」としてほしいという意味でしょうか? それでしたら、簡単です。 辞書のディレクトリにある unk.def の品詞の部分、具体的には 4カラム目以降を以下のように「未知語」とすれば、品詞を 出力するかわりに「未知語」が出力されます 変更前 KANJI,1298,1298,10050,名詞,一般,*,*,*,*,* KANJI,1296,1296,11783,名詞,サ変接続,*,*,*,*,*,*,* ... 変更後 KANJI,1298,1298,10050,未知語 KANJI,1296,1296,11783,未知語 ...