[fess-user 435] Re: クロールの進捗を知る方法

アーカイブの一覧に戻る

Shinsuke Sugaya shins****@yahoo*****
2011年 3月 15日 (火) 14:14:06 JST


菅谷です.

情報をありがとうございます.

> しかし残り 1000 前後となったところで上昇が止まり、最終的
> に完了するのが、さらにそこから12時間ほど先になります。

何かのドキュメントで処理がつまっているような
気もしますが,fess_crawler.out でどこで時間が
かかるのか見ないと原因特定は難しいです.

> ・全体のうちのどこまで進んだかを知る方法はありますか?

fess_crawler.out でクロールの状況を確認できます.

Windows XP などで確認する限り,fess_crawler.out は
普通に作成されていましたが,Windows 2003 環境を
構築する余裕がないため,その環境でどうかが確認できて
いません.クリーンな Fess でも startup.bat で起動して
クロールしても生成されない感じでしょうか?

> ・その場合、そのログを区別する目印は何でしょうか?

2011-03-11 11:28:56,914 [Thread-17] INFO
jp.sf.fess.helper.SystemHelper - Crawler:
Directory=...
Options=...-Dfess.log.file=...

という感じで,fess.log.fileのファイルで指定されている
と思います.特にエラーのようなものは出ないと
思います.

> ログを見ると temp フォルダのファイルを消せなかったらしき
> ワーニングがあり、確かにファイルが大量に残っています。

Fess 4 では(行儀の悪い)依存ライブラリが生成して
放置されている一時ファイルも削除できるように
上記の Options の java.io.tmpdir で独自の一時ディレクトリを
利用して,終了時にそれを削除する形をとっています.

これも考えると,クロール実行のプロセスに渡される
オプション(Optionsの値たち)がなぜかうまく渡されていない
ような気もします.

よろしくお願いいたします.

shinsuke


2011年3月15日13:28 Masayuki Shibata <mshib****@shima*****>:
> 柴田@亀岡市です。
>
> うちの運用では、インデックスの作成されるドキュメント数が
> 約 16000 弱あります。
>
> 1000 ドキュメントごとにコミットする設定にしてありますので
> クロールを開始してから3時間ほどで、システム設定画面の追
> 加されたドキュメントの数が順調に 14000 ドキュメントまで上
> がります。
>
> しかし残り 1000 前後となったところで上昇が止まり、最終的
> に完了するのが、さらにそこから12時間ほど先になります。
>
> つまり全クロールに15時間ほどかかるのですが、システム設
> 定の画面を見る限り、いつ頃完了するのか予想がつきません。
>
> ・全体のうちのどこまで進んだかを知る方法はありますか?
>
> また、相変わらず fess_crawler.out が出力されません。
>
> 処理の前半3時間、後半12時間みたいな動きだとすると、こ
> のログが見られれば見当が付くのかなと思ったのですが、まだ
> 見られずにおります。
>
> クローラー関係のログを分離したものがこれだと言うことは、
> それを分離する設定が効いてないのであれば、fess.out には、
> ログが残っているのかも知れません。
>
> ・その場合、そのログを区別する目印は何でしょうか?
>
> たくさん質問してスミマセン。
>
> また、質問ではなくご報告 (上記調査中に判明したこと) です
> が...
>
> ログを見ると temp フォルダのファイルを消せなかったらしき
> ワーニングがあり、確かにファイルが大量に残っています。
>
> また、以下のエラーがログに相当数、残っています。
> ERROR org.apache.pdfbox.pdmodel.font.PDFont - Error: Could not parse
> predefined CMAP file for 'Adobe-Japan1-UCS2'
>
> Fess 4.0.0 + Windows Server 2003 環境です。
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>




Fess-user メーリングリストの案内
アーカイブの一覧に戻る