東
higas****@yourg*****
2010年 8月 11日 (水) 13:13:42 JST
はじめまして。 東と申します。 N-Bestで表示した連接コストがmatrix.defと一致しないので困っています。 AMD64 CentOS5 64bit mecab-0.97, mecab-0.98 ソースからコンパイル ipadic-2.7.0-20070801 EUC-JP /usr/local/mecab/bin/mecab -F "%m\t%phl,%phr,%c %pC %pc %H\n" -N 2 -l 1 表層文字列 左文脈ID 右文脈ID 単語生起コスト 連接コスト 累積コスト 素性 で出力しています。 さくらももいちご さくら 1285,1285,5256 -283 4973 名詞,一般,*,*,*,*,さくら,サクラ,サクラ も 262,262,4669 -4158 5484 助詞,係助詞,*,*,*,*,も,モ,モ も 262,262,4669 478 10631 助詞,係助詞,*,*,*,*,も,モ,モ いちご 1285,1285,7266 17 17914 名詞,一般,*,*,*,*,いちご,イチゴ,イチゴ EOS さくら 1285,1285,5256 -283 4973 名詞,一般,*,*,*,*,さくら,サクラ,サクラ もも 1285,1285,7219 62 12254 名詞,一般,*,*,*,*,もも,モモ,モモ いちご 1285,1285,7266 -1606 17914 名詞,一般,*,*,*,*,いちご,イチゴ,イチ ゴ EOS matrix.def 1285 1285 62 「さくら もも」の連接コストが 62 はいいのですが、 「もも いちご」の連接コストが -1606 と表示されます。 「もも いちご」の連接コストは 62 じゃないんでしょうか? それと、N-BestでEOSまで含めた累積コストを表示できると嬉しいです。 よろしくお願いします。