[fess-user 962] Shift-JISの検索

アーカイブの一覧に戻る

斎藤 直正 nsait****@msk-w*****
2015年 2月 17日 (火) 11:37:38 JST


斎藤です。

 はじめて投稿します。

 私の環境は、CentOS 6.5上にFessをインストールしています。
 OSそのものをWindowsにすれば良かったかな?とか思っているのですが、
取りあえず全文検索が可能な状況にまでは至っています。

 今回、Windows上で作成された
  ・Word
  ・Excel
  ・PowerPoint
  ・PDF
  ・テキスト
 などの文書を検索対象として考えています。

 文字コードは、テキストを見る限りShift-JISが用いられており、
ファイルのパスにもShift-JISで2Byte文字のフォルダーが顕在ます。
 (半角カタカナは無視します)

 クロールを行って、ファイルの検索を行ったのですが、やはり、UTF-8で
記述されたテキスト文書(テスト的に作った文書)は検索できたのですが、
Shift-JISで作成された文書を検索することが出来ません。

 設定方法など具体的にご教示頂けないでしょうか?

 また、Webの検索を行う際は、UTF-8が基本的な対象となる様に
思えているのですが、クロール単位でエンコードを切り替えることは可能なので
しょうか?

 ちなみに、こんなこと考えてるより、OSをWindowsにした方が良いのでしょうか?

 素人的な質問で申し訳ありませんが、よろしくお願いいたします。

以上




Fess-user メーリングリストの案内
アーカイブの一覧に戻る