[fess-user 299] Re: インデックスの作成が停止します

アーカイブの一覧に戻る

Sugano ganos****@gmail*****
2010年 7月 18日 (日) 21:26:01 JST


お世話になってます。
すがのです。

本件、了解です!
連休明けにでも試してみます!

ご回答ありがとうございました!
> ----Original Message----
> Sun, 18 Jul 2010 07:48:35 +0900
> From:     Shinsuke Sugaya <shins****@yahoo*****>
> Reply-To: fess-****@lists*****
> To:       fess-****@lists*****
> Subject:  [fess-user 297] Re:インデックスの作成が停止します
> 

> 菅谷です。
> 
> >  (CPU:Core 2 Duo 2GHz、メモリ:1.5GB)
> 
> この環境ですと、Fess 的には mx を 512m くらいが
> 上限な気がしますので、1 回あたりの Solr に送る
> ドキュメント数を下げるのが良い気がします。
> webapps/fess/WEB-INF/cmd/resources/app.dicon
>> 
>     <component name="indexUpdater"
> class="jp.sf.fess.solr.IndexUpdater" instance="prototype">
>         <property name="maxDocumentCacheSize">5</property>
>     </component>
> 
> というように maxDocumentCacheSize を下げることが
> できます。デフォルトでは 1 回で 10 ドキュメントを
> Solr に送ります。
> 
> shinsuke
> 
> 2010年7月17日11:21 Sugano <ganos****@gmail*****>:
> > お世話になってます。
> > すがのです。
> >
> >> > ご質問があるのですが、クロールで集めた情報(H2DB)を、SolrDB
> >> > へ
> >> > 手動で登録する方法(機能など)はありませんでしょうか?
> >>
> >> 現状、ないです。クロールデータについては
> >> パフォーマンスに大きな影響を与えるので
> >> 消せるときに消す感じにしています。ただ
> >> 今回のように例外的にクロールを抜けるような
> >> 場合に残せるかどうかは検討してみます。
> > 了解しました。
> > 是非、お願いします。
> >
> >> > ※少なくとも、catalina.outにはエラーメッセージなどは出力さ
> >> > れ
> >> > ていませんでした。他のログはこれから調べます。
> >>
> >> 最新の環境であれば、fess_crawler.out が
> >> どうなっているかがポイントになるかと思います。
> > fess_crawler.outを調べたところ、添付ファイル(fess_crawler.
> > outのログを一部抜粋、一部ファイルパスの修正有)のように
> > OutOfMemory エラーが発生していたことがわかりました。
> >
> > 下記の設定は既にしているのですが、それでも発生するようです。
> > http://fess.sourceforge.jp/ja/3.0/config/memory-config.html
> >
> > ちなみに、当方の環境・状況は以下のとおりです。
> >
> > ●環境
> > ・WindowsXP SP3に搭載して試用・検証中
> >  (CPU:Core 2 Duo 2GHz、メモリ:1.5GB)
> > ・JDK 6 Update 21
> > ・fess-server-3.1.1 or 4.0.0SNAPSHOT
> >  (どちらでも発生するようです)
> > ・メモリ関連設定:上記リンクと同じ設定
> >
> > ●クロール設定
> > ・対象ドキュメント: ファイルサーバ上のファイル 約6万件
> > ・同時実行のクロール設定数:1
> > ・ドキュメント数毎にコミット:500
> > ・スレッド数:3
> > ・間隔:1000ミリ秒
> >
> > ●状況
> > 約1万ドキュメントを処理したあたりで、メモリエラー発生
> > ※エラー発生後は、延々とクロール処理のみが行われて、
> >  SolrDBへの登録処理が行われない状態
> > ※かなり高い確率(現時点100%)で現象が再発。
> >
> >
> > 上記、メモリ関連設定の再チューニングなどで回避は可能なのでし
> > ょうか?
> >
> > 以上、よろしくお願いします。
> >> ----Original Message----
> >> Fri, 16 Jul 2010 06:33:00 +0900
> >> From:     Shinsuke Sugaya <shins****@yahoo*****>
> >> Reply-To: fess-****@lists*****
> >> To:       fess-****@lists*****
> >> Subject:  [fess-user 290] Re:インデックスの作成が停止します
> >>
> >
> >> 菅谷です。
> >>
> >> > ご質問があるのですが、クロールで集めた情報(H2DB)を、SolrDB
> >> > へ
> >> > 手動で登録する方法(機能など)はありませんでしょうか?
> >>
> >> 現状、ないです。クロールデータについては
> >> パフォーマンスに大きな影響を与えるので
> >> 消せるときに消す感じにしています。ただ
> >> 今回のように例外的にクロールを抜けるような
> >> 場合に残せるかどうかは検討してみます。
> >>
> >> > ※少なくとも、catalina.outにはエラーメッセージなどは出力さ
> >> > れ
> >> > ていませんでした。他のログはこれから調べます。
> >>
> >> 最新の環境であれば、fess_crawler.out が
> >> どうなっているかがポイントになるかと思います。
> >>
> >> よろしくお願いいたします。
> >>
> >> shinsuke
> >>
> >>
> >> 2010年7月16日1:17 Sugano <ganos****@gmail*****>:
> >> > 初めまして、すがのと申します。
> >> >
> >> > ご質問があるのですが、クロールで集めた情報(H2DB)を、SolrDB
> >> > へ
> >> > 手動で登録する方法(機能など)はありませんでしょうか?
> >> > (クロール実行中もしくはクロール停止時に手動実行)
> >> >
> >> > というのも、私のところでも桑田さんとほぼ同様の現象が発生し
> >> > て
> >> > おり、
> >> >> クローラープロセスが実行中にも関わらず、ドキュメント数が
> >> >> 増
> >> >> 加しなくなります。
> >> >> システム設定画面で何度が停止->実行を繰り返しましたが状況
> >> >> が
> >> >> 変わりません。
> >> >
> >> > 具体的には、以下2つの現象のいずれかが発生することが多く、
> >> >
> >> > 事象1.クローラプロセスが稼働中にもかかわらず、クローラ側
> >> > DB
> >> > (\webapp\fess\WEB-INF\db)やSolrDBへの登録が行われない。
> >> >
> >> > 事象2.クローラ側DB(\webapp\fess\WEB-INF\db)への登録はさ
> >> > れ
> >> > 続けるが、SolrDBへの登録が行われなず、クローラ側DBのみが増
> >> > え
> >> > 続ける。
> >> >
> >> > 上記の現象発生後に、クローラで収集したSolrDBへの未登録情報
> >> > を
> >> > 破棄するのはもったいないので、収集した情報をSolrDBへ手動登
> >> > 録
> >> > する手段を知りたいと考えております。
> >> > (クロールを再度起動すると、前回収集した情報がすべて消えて
> >> > し
> >> > まい、事象2で数万件分の情報が溜まっていたとしても全てクリ
> >> > ア
> >> > されてしまうため、クリアされずにDB登録する方法が知りたいで
> >> > す。)
> >> >
> >> > ちなみに、本現象の原因については、下記を参考にして現在調査
> >> > 中
> >> > ですが、現時点では原因は特定できていません。
> >> >> おそらく crawler.out か catalina.out などに出力されて
> >> >> いるかと思います。以下を参照してみてください。
> >> >>
> >> >> http://fess.sourceforge.jp/ja/3.0/config/logging.html
> >> >>
> >> > ※少なくとも、catalina.outにはエラーメッセージなどは出力さ
> >> > れ
> >> > ていませんでした。他のログはこれから調べます。
> >> > ※ファイルパスの長さが260字以上(WindowsのMAX_PATH値以上)の
> >> > デ
> >> > ィレクトリ・ファイルもあるため、それが原因の一つの可能性も
> >> > 有
> >> > り?
> >> > ※上記、もう少し調べてわからないようであれば、再度詳細な情
> >> > 報
> >> > をお知らせします。
> >> >
> >> > 以上、よろしくお願い致します。
> >> >
> >> >> 菅谷です。
> >> >>
> >> >> おそらく crawler.out か catalina.out などに出力されて
> >> >> いるかと思います。以下を参照してみてください。
> >> >>
> >> >> http://fess.sourceforge.jp/ja/3.0/config/logging.html
> >> >>
> >> >> よろしくお願いいたします。
> >> >>
> >> >> shinsuke
> >> >>
> >> >>
> >> >> 2010年7月14日16:53 Tetsutomo Kuwata <fj.kuwata @ gmail.
> >> >> com>:
> >> >> 初めまして、桑田と申します。
> >> >>
> >> >> この度始めてFessを導入しインデックス作成を実行していると
> >> >> こ
> >> >> ろなのですが
> >> >> クローラープロセスが実行中にも関わらず、ドキュメント数が
> >> >> 増
> >> >> 加しなくなります。
> >> >> システム設定画面で何度が停止->実行を繰り返しましたが状況
> >> >> が
> >> >> 変わりません。
> >> >> どの辺を調べれば原因がわかりますでしょうか。
> >> >>
> >> >> 環境
> >> >> Windows Server 2003 R2
> >> >> JDK 6 Update 20
> >> >> fess-server-3.1.1(サービスとして登録)
> >> >>
> >> >> 対象ドキュメント: ファイルシステム 23万件
> >> >> 現在のドキュメント数: 4万件
> >> >>
> >> >>
> >> >> 以上、よろしくお願い致します。
> >> >>
> >> >> _______________________________________________
> >> >> Fess-user mailing list
> >> >> Fess-****@lists*****
> >> >> http://lists.sourceforge.jp/mailman/listinfo/fess-user
> >> >>
> >> >
> >> > _______________________________________________
> >> > Fess-user mailing list
> >> > Fess-****@lists*****
> >> > http://lists.sourceforge.jp/mailman/listinfo/fess-user
> >> >
> >>
> >> _______________________________________________
> >> Fess-user mailing list
> >> Fess-****@lists*****
> >> http://lists.sourceforge.jp/mailman/listinfo/fess-user
> >
> >
> > _______________________________________________
> > Fess-user mailing list
> > Fess-****@lists*****
> > http://lists.sourceforge.jp/mailman/listinfo/fess-user
> >
> >
> 
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user




Fess-user メーリングリストの案内
アーカイブの一覧に戻る