[fess-user 452] Re: CommandExtractor 仕様について提案

アーカイブの一覧に戻る

limol****@nifty***** limol****@nifty*****
2011年 3月 31日 (木) 21:12:12 JST


クニカタです。お世話になっております。
すばやい対応ありがとうございます!

Fessで試してみました。
s2-robot-0.5.0.jar
↓
s2-robot-0.5.1-20110330.192026-5.jar
に差し替えて、
以下のようなdicon設定で、うまくテキスト抽出できました。
--------------
<component name="msOfficeCmdExtractor" 
 class="org.seasar.robot.extractor.impl.CommandExtractor">
  <property name="command">
  "cmd /c xdoc2txt -s -r=0 $INPUT_FILE &gt; $OUTPUT_FILE"
  </property>
  <property name="outputEncoding">"Shift_JIS"</property>
  <property name="outputExtension">".txt"</property>
</component>
--------------
#「outputExtension」フィールド追加も、いい感じす!

ありがとうございました〜

----- Original Message -----
>Date: Thu, 31 Mar 2011 04:22:42 +0900
>From: Shinsuke Sugaya <shins****@yahoo*****>
>To: fess-****@lists*****
>Subject: [fess-user 447] Re:
>	CommandExtractor 仕様について提案
>
>
>菅谷です。
>
>情報をありがとうございます。
>Fessで差し替えて動くかは確認してませんが、
>S2Robotの方を修正しました。
>
>https://www.seasar.org/maven/maven2-snapshot/org/seasar/robot/s2-robot/0.5.1-
SNAPSHOT/s2-robot-0.5.1-20110330.192026-5.jar
>
>よろしくお願いいたします。
>
>shinsuke
>
>2011年3月30日22:30  <limol****@nifty*****>:
>> クニカタです。お世話になっております。
>>
>> http://s2robot.sandbox.seasar.org/ja/extractor-guide.html
>> ↑を参考にして、
>> CommandExtractorの使用を検討しています。
>>
>> xdoc2txt.exeを呼び出しで、以下のように設定をしたところ
>> うまくテキスト抽出できませんでした。
>> <component name="msOfficeCmdExtractor" class="org.seasar.robot.extractor.im
pl.
>> CommandExtractor">
>>  <property name="command">"cmd /c xdoc2txt -s -r=0 $INPUT_FILE > $OUTPUT_F
>> ILE"</property>
>>  <property name="outputEncoding">"Shift_JIS"</property>
>> </component>
>>
>> CommandExtractorの処理で、入力用テンポラリファイルを作成している部分で
>> 拡張子の前に「.」がつかないテンポラリファイルが作成されていることが原因でし
た
>>>> xdoc2txt.exeでは拡張子によってファイル種を判別しているため、うまく動きませ
んで
>> した。
>> (※pdftotext.exeなどでは問題ないです。)
>>
>> とりあえずクラスファイルをDIする感じでは対応できるのですが、
>> 次バージョンで、なにか対応願えませんでしょうか?
>>
>> _______________________________________________
>> Fess-user mailing list
>> Fess-****@lists*****
>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>>
>
>_______________________________________________
>Fess-user mailing list
>Fess-****@lists*****
>http://lists.sourceforge.jp/mailman/listinfo/fess-user




Fess-user メーリングリストの案内
アーカイブの一覧に戻る