[groonga-dev,03754] PGroongaの基本的な質問

アーカイブの一覧に戻る

Hiroyuki Sato hiroy****@gmail*****
2015年 12月 11日 (金) 21:35:57 JST


PGroongaを使おうかと検討中です。


次のことについて教えてください
やりたいことは次のようなものです。

  * URLの検索
   - 前方一致・部分一致: url like '%/a/b/c'
   - 完全一致: url = 'http://pgroonga.github.io'
  * 日本語: なし

質問事項

1, インデックスの保存場所
  (1) groongaのデータはどこに保存されますか?
  (2) パスは変更可能でしょうか?
  ・容量が大きくなりそうなのでPGDATA以外のパスに保存したいです。

2, ASCIIだけでもpgroonga使った方がいいですよね?
  ASCIIだけでも、pg_trigm, pg_bigmよりも速いでしょうか?

  http://slide.rabbit-shocker.org/authors/kou/postgresql-conference-2015/
  17ページを見る限り、Groongaを使った方が良さそうですよね。

3, パーティションテーブル(inheritされたデーブル)

  URLのデータは日別のパーティションテーブルに格納しています。
  インデックスをかける場合は、継承したテーブル個々に
  using groongaでインデックスを作成すれば良いでしょうか?

4, 完全一致

完全一致の時もPGroongaのインデックスが使われますでしょうか?

5, URL用のトークナイザーとノーマライザー
  ノーマライザーなしの、 TokenBigramが良いでしょうか?

  Groongaの場合、NormalizeAutoにしたらASCIIは単語の境界でトークナイズされると
  学んだように記憶しています。

  URLは単純なバイグラム(あるいは大文字を小文字に変換)にするのが検索に向いている
  思います。

  と思ったのですが、NormalizerNoneという指定はないように思います。
  http://groonga.org/ja/docs/reference/normalizers.html

どのようにするのが良いでしょうか?

背中を押してください。
よろしくお願いします。
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
ダウンロード 



groonga-dev メーリングリストの案内
アーカイブの一覧に戻る