[mecab-users 374] Re: autolinkについて

アーカイブの一覧に戻る

TAKAOKA Kazuma kazum****@jeans*****
2009年 7月 17日 (金) 09:57:10 JST


高岡です。

2009/07/16 7:48 に t.kuriki<mikic****@gmail*****> さんは書きました:
> - 実行例
> mecab -d /usr/local/lib/mecab/dic/autolink
> 神奈川新聞花火大会
> <a href="省略">神奈川新聞</a><a href="省略">花火大会</a>
>
> - url.csv
> 神奈川新聞花火大会,0,0,-32768,省略
> 神奈川新聞,0,0,-23237,省略
> 花火大会,0,0,-16627,省略
>
(snip)
> - matrix.def
> 1 1
> 0 0 0

コストを計算すると、
神奈川新聞花火大会: -32768
神奈川新聞/花火大会: (-23237) + 0 + (-16627) = -46474
なので、分割する方が優先されているのではないでしょうか。

連接コストを13706以上にすれば、1単語の方を優先してくれるとおもいます。

-- 
高岡一馬




mecab-users メーリングリストの案内
アーカイブの一覧に戻る