Taku Kudo
taku****@chase*****
2007年 3月 4日 (日) 00:10:19 JST
工藤です > その際 入力出力ファイルともにEUCであればうまく読めるのですが、どちらかを > UTF8にすると、分析上問題を生じたり出力結果が読めなかったりします。 > > 辞書をUTF8でコンパイルすることも試しましたがやはり出力ファイルが文字化けして > しまいます。Editorは、UTF8を読めるKWriteを使用しています。 どのように utf8 の辞書を作成しましたか? あと,どのバージョンの mecab をお使いですか? 0.94 でしたら,-D オプションで辞書の文字コードを確認することができます. % mecab -D filename: /usr/local/lib/mecab/dic/ipadic/sys.dic version: 102 charset: euc-jp type: 0 size: 378914 left size: 1316 right size: 131