Mamoru KOMACHI
usata****@usata*****
2007年 3月 6日 (火) 07:21:26 JST
小町です。 At Tue, 06 Mar 2007 05:43:24 +0900, I wrote: > どういうふうにこのデータを収拾しているかなのですが、一から文を入力して > いくよりは、かな漢字交じりの文は比較的手に入りやすいので、再配布可能な > かな漢字交じり文を見つけてきて CaboCha か KNP で解析して間違った読みを > 手動で直す、という感じにすると楽かなと思います。 というわけで http://cl.naist.jp/~mamoru-k/imecorpus/ に作ってみました。 Wiki に貼り直すのが微妙に面倒かもしれませんが、どうぞお使いくださいませ。 ではでは。 -- Mamoru KOMACHI <usata****@usata*****>, <mamor****@is*****> Nara Institute of Science and Technology