[Anthy-dev 3405] Re: wikiのコーパス用例文収集

アーカイブの一覧に戻る

Mamoru KOMACHI usata****@usata*****
2007年 3月 6日 (火) 07:21:26 JST


小町です。

At Tue, 06 Mar 2007 05:43:24 +0900,
I wrote:

> どういうふうにこのデータを収拾しているかなのですが、一から文を入力して
> いくよりは、かな漢字交じりの文は比較的手に入りやすいので、再配布可能な
> かな漢字交じり文を見つけてきて CaboCha か KNP で解析して間違った読みを
> 手動で直す、という感じにすると楽かなと思います。

というわけで http://cl.naist.jp/~mamoru-k/imecorpus/ に作ってみました。
Wiki に貼り直すのが微妙に面倒かもしれませんが、どうぞお使いくださいませ。

ではでは。

-- 
Mamoru KOMACHI <usata****@usata*****>, <mamor****@is*****>
Nara Institute of Science and Technology



Anthy-dev メーリングリストの案内
アーカイブの一覧に戻る