Naoya Murakami
visio****@gmail*****
2016年 1月 6日 (水) 22:29:28 JST
村上です。 > libstemmerがインストールされていないから、ということですが、例えば実際のところ、ステミングを有効にした場合、日本語ではどのよう > な効果が期待されるでしょうか? > > Mroongaの以下のページでは、「develops」というクエリーに対して「develop」「developing」 > 「developed」がヒットするとあります。 > > > http://mroonga.org/ja/docs/tutorial/storage.html#how-to-specify-the-token-filters > > これが日本語であれば、どんな例になりますでしょうか? > 具体例などありましたら紹介いただけると幸いです。 > snowballのstemmerはユーロ系の言語はいくつかサポートしていますが (現在Groongaのstem.cは現在englishのみ実装されています)、日本語に 対しては何の効果もありません。 もし日本語では効果が薄いようでしたら、このフィルターの導入を見合わせた方がいいのかな、と考えております。 英語の複数形などを同一視して全文検索したいようなケースがない場合 TokenFilterStemの導入は不要だと思います。 以上です。 > _______________________________________________ > groonga-dev mailing list > groon****@lists***** > http://lists.osdn.me/mailman/listinfo/groonga-dev > > -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B... ダウンロード