Hiroyuki Sato
hiroy****@gmail*****
2015年 12月 11日 (金) 21:35:57 JST
PGroongaを使おうかと検討中です。 次のことについて教えてください やりたいことは次のようなものです。 * URLの検索 - 前方一致・部分一致: url like '%/a/b/c' - 完全一致: url = 'http://pgroonga.github.io' * 日本語: なし 質問事項 1, インデックスの保存場所 (1) groongaのデータはどこに保存されますか? (2) パスは変更可能でしょうか? ・容量が大きくなりそうなのでPGDATA以外のパスに保存したいです。 2, ASCIIだけでもpgroonga使った方がいいですよね? ASCIIだけでも、pg_trigm, pg_bigmよりも速いでしょうか? http://slide.rabbit-shocker.org/authors/kou/postgresql-conference-2015/ 17ページを見る限り、Groongaを使った方が良さそうですよね。 3, パーティションテーブル(inheritされたデーブル) URLのデータは日別のパーティションテーブルに格納しています。 インデックスをかける場合は、継承したテーブル個々に using groongaでインデックスを作成すれば良いでしょうか? 4, 完全一致 完全一致の時もPGroongaのインデックスが使われますでしょうか? 5, URL用のトークナイザーとノーマライザー ノーマライザーなしの、 TokenBigramが良いでしょうか? Groongaの場合、NormalizeAutoにしたらASCIIは単語の境界でトークナイズされると 学んだように記憶しています。 URLは単純なバイグラム(あるいは大文字を小文字に変換)にするのが検索に向いている 思います。 と思ったのですが、NormalizerNoneという指定はないように思います。 http://groonga.org/ja/docs/reference/normalizers.html どのようにするのが良いでしょうか? 背中を押してください。 よろしくお願いします。 -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B... ダウンロード