斎藤 直正
nsait****@msk-w*****
2015年 2月 17日 (火) 11:37:38 JST
斎藤です。 はじめて投稿します。 私の環境は、CentOS 6.5上にFessをインストールしています。 OSそのものをWindowsにすれば良かったかな?とか思っているのですが、 取りあえず全文検索が可能な状況にまでは至っています。 今回、Windows上で作成された ・Word ・Excel ・PowerPoint ・PDF ・テキスト などの文書を検索対象として考えています。 文字コードは、テキストを見る限りShift-JISが用いられており、 ファイルのパスにもShift-JISで2Byte文字のフォルダーが顕在ます。 (半角カタカナは無視します) クロールを行って、ファイルの検索を行ったのですが、やはり、UTF-8で 記述されたテキスト文書(テスト的に作った文書)は検索できたのですが、 Shift-JISで作成された文書を検索することが出来ません。 設定方法など具体的にご教示頂けないでしょうか? また、Webの検索を行う際は、UTF-8が基本的な対象となる様に 思えているのですが、クロール単位でエンコードを切り替えることは可能なので しょうか? ちなみに、こんなこと考えてるより、OSをWindowsにした方が良いのでしょうか? 素人的な質問で申し訳ありませんが、よろしくお願いいたします。 以上