PGroongaの基本的な質問 (groonga-dev,03754) - Groonga - fulltext search engine.

PGroongaを使おうかと検討中です。


次のことについて教えてください
やりたいことは次のようなものです。

  * URLの検索
   - 前方一致・部分一致: url like '%/a/b/c'
   - 完全一致: url = 'http://pgroonga.github.io'
  * 日本語: なし

質問事項

1, インデックスの保存場所
  (1) groongaのデータはどこに保存されますか？
  (2) パスは変更可能でしょうか？
  ・容量が大きくなりそうなのでPGDATA以外のパスに保存したいです。

2, ASCIIだけでもpgroonga使った方がいいですよね？
  ASCIIだけでも、pg_trigm, pg_bigmよりも速いでしょうか？

  http://slide.rabbit-shocker.org/authors/kou/postgresql-conference-2015/
  17ページを見る限り、Groongaを使った方が良さそうですよね。

3, パーティションテーブル(inheritされたデーブル)

  URLのデータは日別のパーティションテーブルに格納しています。
  インデックスをかける場合は、継承したテーブル個々に
  using groongaでインデックスを作成すれば良いでしょうか？

4, 完全一致

完全一致の時もPGroongaのインデックスが使われますでしょうか？

5, URL用のトークナイザーとノーマライザー
  ノーマライザーなしの、 TokenBigramが良いでしょうか？

  Groongaの場合、NormalizeAutoにしたらASCIIは単語の境界でトークナイズされると
  学んだように記憶しています。

  URLは単純なバイグラム(あるいは大文字を小文字に変換)にするのが検索に向いている
  思います。

  と思ったのですが、NormalizerNoneという指定はないように思います。
  http://groonga.org/ja/docs/reference/normalizers.html

どのようにするのが良いでしょうか？

背中を押してください。
よろしくお願いします。
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
ダウンロード

Groonga - fulltext search engine.

[groonga-dev,03754] PGroongaの基本的な質問