Ludiaは高速かつ高精度な全文検索インデックス機能をオープンソースのデータベース管理システムであるPostgreSQLに提供します。Ludiaは株式会社NTTデータにより開発され、2006年10月11日にLGPLライセンスのオープンソースソフトウェアとして公開されました。
ludiaパッケージを利用するためには、
Senna: https://sourceforge.jp/projects/senna/
MeCab: https://sourceforge.jp/projects/mecab/
を先にインストールする必要があります。
(MeCabは形態素解析を利用する場合のオプションです。)
ludia-withdepsパッケージはludiaパッケージの内容に加えて、
上記のモジュールを含んでいます。
(1) PDFファイル対応
pgs2pdftotext2という関数を使用することにより、
PDFファイルのインデックス作成が可能となりました。
(2) PostgreSQLのカスタム変数設定項目追加
postgresql.confにLudiaの変数を記述することにより、
シーケンシャルスキャンの可否・検索ヒット行数の上限・
インデックス作成時のフラグを設定可能としました。
(3) REINDEX、CLUSTER使用時のバグフィックス
Ver0.8.0ではREINDEXは使用できず、DROP・CREATEで対応
しておりましたが、Ver0.9.0ではREINDEXを使用することが
できます。
LudiaインデックスによるCLUSTERコマンドは
Ver0.8.0同様に使用不可ですが、
誤って使用しないように、エラー制御することとしました。