ChaKi(茶器)は、自然言語コーパスの構築、検索、および言語要素へのタグ付けをサポートするツール群です。 手始めにニュースをご覧ください。
Build202 ====================================================
* defファイルで文字コードを指定できるようになりました。
encoding=ShiftJIS
encoding=UTF-8
いずれかの記述を.defファイルの先頭に入れてください。
* CorpusSetupの出力する.defファイルについては、新規追加されたEncoding指定欄で指定したエンコードが入ります。Cabocha2dat.exeに対しては、エンコーディングオプション(--encode)を渡すようになりました。なお、この指定はMySQLの設定と一致させる必要があります。