[groonga-dev,03838] Re: stem.soが存在しません

アーカイブの一覧に戻る

Naoya Murakami visio****@gmail*****
2016年 1月 6日 (水) 22:29:28 JST


村上です。


> libstemmerがインストールされていないから、ということですが、例えば実際のところ、ステミングを有効にした場合、日本語ではどのよう
> な効果が期待されるでしょうか?
>
> Mroongaの以下のページでは、「develops」というクエリーに対して「develop」「developing」
> 「developed」がヒットするとあります。
>
>
> http://mroonga.org/ja/docs/tutorial/storage.html#how-to-specify-the-token-filters
>
> これが日本語であれば、どんな例になりますでしょうか?
> 具体例などありましたら紹介いただけると幸いです。
>

snowballのstemmerはユーロ系の言語はいくつかサポートしていますが
(現在Groongaのstem.cは現在englishのみ実装されています)、日本語に
対しては何の効果もありません。

もし日本語では効果が薄いようでしたら、このフィルターの導入を見合わせた方がいいのかな、と考えております。


英語の複数形などを同一視して全文検索したいようなケースがない場合
TokenFilterStemの導入は不要だと思います。

以上です。


> _______________________________________________
> groonga-dev mailing list
> groon****@lists*****
> http://lists.osdn.me/mailman/listinfo/groonga-dev
>
>
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
ダウンロード 



groonga-dev メーリングリストの案内
アーカイブの一覧に戻る