[Anthy-dev 3585] コーパス用の例文の typo

アーカイブの一覧に戻る

UTUMI Hirosi utuhi****@yahoo*****
2007年 9月 30日 (日) 00:44:00 JST


内海です。

コーパス用の例文の typo を少し見つけたのでお送りします。

anthy-9100c/calctrans/corpus.3.txt:454: |しんりょくの|うつくしい|りあす|
かいがん| |新緑の|美しい|リアス|海岸|
リアス式海岸

anthy-9100c/calctrans/corpus.3.txt:1638: |この|おやにして|このこ|あり| |
子の|親にして|この子|あり|
この親にして

anthy-9100c/calctrans/corpus.3.txt:284: |あぶらで|からっと|あげた| |油で
|カラット|揚げた|
カラッと

anthy-9100c/calctrans/corpus.3.txt:497: |こん|なつの|ぼーなす|しきゅう|
がくは|ぜんねんを|うわまわる|よそうです|。| |今|夏の|ボーナス|支給|額は|
前年を|上回る|予想です|。|
anthy-9100c/calctrans/corpus.3.txt:809: |けんぽうかいせいを|こん|なつの|
さんいん|せんの|そうてんにする| |憲法改正を|今|夏の|参院|選の|争点にする
今夏 = 「こんか」と読む

「てにをは」抜きの例文は必要でしょうか?
anthy-9100c/calctrans/corpus.1.txt:10: |100えんの|にほんしゅ|まずい|
|100円の|日本酒|不味い|
日本酒「は」まずい
anthy-9100c/calctrans/corpus.1.txt:50: |あにめ|みてられる|おんせんやどを
|さがそうか| |アニメ|見てられる|温泉宿を|探そうか|
アニメ「を」見てられる

上記に限らず風変わりな例文が散見されるので、
登録前に例文を " " でくくって google 検索をし、
ある程度ヒット数のあるものを登録するとよいかもしれません。
http://www.google.co.jp/search?hl=ja&q=%22%E3%82%A2%E3%83%8B%E3%83%A1%E8%A6%8B%E3%81%A6%E3%82%89%E3%82%8C%E3%82%8B%22&btnG=%E6%A4%9C%E7%B4%A2&lr=
「アニメ見てられる」は 985 件しかヒットがありません。
(そんなことよりも例文の数を稼ぐことの方が
現段階では重要なのかもしれませんが)

例文の充実については、
cannadic の頻度設定を素直に反映して変換してくれる方が
個人的には都合がいいです。
(これは私がかつて私家版辞書を編集していたからで、
特殊なケースだとは思います。:-))

--------------------------------------
Easy + Joy + Powerful = Yahoo! Bookmarks x Toolbar
http://pr.mail.yahoo.co.jp/toolbar/




Anthy-dev メーリングリストの案内
アーカイブの一覧に戻る