ChaKi(茶器)は、自然言語コーパスの構築、検索、および言語要素へのタグ付けをサポートするツール群です。 手始めにニュースをご覧ください。
--------------------------------------------------------------------------------
ChaKi.NET Release Note #023
Version 1.5, Revision 334
2011/02/27
--------------------------------------------------------------------------------
[文境界編集]
- 下記の問題点を修正しました。
・Ticket#24529 「MergeSentenceの結果文構造がおかしくなることがある
(Wordの文内文字位置が後ろにずれる)」
→MergeSentence処理後に「Sentence-Word構造」が正しくRefreshされていなかったため、
ひとつのTransactionで連続してMergeを行った場合に上記の現象が発生していました。
・Ticket#24538 「MergeSentence後にExceptionが発生する」
→Exceptionではなく独自のメッセージを出すことにより対応。
[ExportCorpusコマンド追加]
・コマンドラインからCabocha Exportを行うツールを追加しました。
ChaKi.NET.exeと同じインストールフォルダにある、ExportCorpus.exeを使います。
使用法は、"ExportCorpus.exe --help"で表示できます。
[CreateCorpus改良]
・Ticket#24537 「Cabocha Importで 係先= -1 の文節が文ごとに1個しか生成できない」対応
※文境界編集では係先が(-1)の文節(どこにもかからないので文末のダミーにかかる文節)を
複数生成していましたが、これにより、一旦ExportしたCabochaファイルを再読み込みすると
係り受けを編集できない、矢印の出ない文節が発生していました。
(Cabochaの生出力ではそのような文節は高々1個しかなかったため、今までは問題ありませんでした)
最終的に、係先が(-1)の文節が複数あっても問題ないようImporter(CreateCorpus)を改良しました。
[その他]
・Ticket #24551: 「Reload KwicListコマンドですべてのListが表示されない場合がある」対応
※文境界編集後にリストをリロードするためのコマンド"Reload KwicList"を実行した時に、
末尾の方まですべてのListが更新されないことがありました。この修正を行いました。
--------------------------------------------------------------------------------