Shinsuke Sugaya
shins****@yahoo*****
2011年 3月 15日 (火) 14:14:06 JST
菅谷です. 情報をありがとうございます. > しかし残り 1000 前後となったところで上昇が止まり、最終的 > に完了するのが、さらにそこから12時間ほど先になります。 何かのドキュメントで処理がつまっているような 気もしますが,fess_crawler.out でどこで時間が かかるのか見ないと原因特定は難しいです. > ・全体のうちのどこまで進んだかを知る方法はありますか? fess_crawler.out でクロールの状況を確認できます. Windows XP などで確認する限り,fess_crawler.out は 普通に作成されていましたが,Windows 2003 環境を 構築する余裕がないため,その環境でどうかが確認できて いません.クリーンな Fess でも startup.bat で起動して クロールしても生成されない感じでしょうか? > ・その場合、そのログを区別する目印は何でしょうか? 2011-03-11 11:28:56,914 [Thread-17] INFO jp.sf.fess.helper.SystemHelper - Crawler: Directory=... Options=...-Dfess.log.file=... という感じで,fess.log.fileのファイルで指定されている と思います.特にエラーのようなものは出ないと 思います. > ログを見ると temp フォルダのファイルを消せなかったらしき > ワーニングがあり、確かにファイルが大量に残っています。 Fess 4 では(行儀の悪い)依存ライブラリが生成して 放置されている一時ファイルも削除できるように 上記の Options の java.io.tmpdir で独自の一時ディレクトリを 利用して,終了時にそれを削除する形をとっています. これも考えると,クロール実行のプロセスに渡される オプション(Optionsの値たち)がなぜかうまく渡されていない ような気もします. よろしくお願いいたします. shinsuke 2011年3月15日13:28 Masayuki Shibata <mshib****@shima*****>: > 柴田@亀岡市です。 > > うちの運用では、インデックスの作成されるドキュメント数が > 約 16000 弱あります。 > > 1000 ドキュメントごとにコミットする設定にしてありますので > クロールを開始してから3時間ほどで、システム設定画面の追 > 加されたドキュメントの数が順調に 14000 ドキュメントまで上 > がります。 > > しかし残り 1000 前後となったところで上昇が止まり、最終的 > に完了するのが、さらにそこから12時間ほど先になります。 > > つまり全クロールに15時間ほどかかるのですが、システム設 > 定の画面を見る限り、いつ頃完了するのか予想がつきません。 > > ・全体のうちのどこまで進んだかを知る方法はありますか? > > また、相変わらず fess_crawler.out が出力されません。 > > 処理の前半3時間、後半12時間みたいな動きだとすると、こ > のログが見られれば見当が付くのかなと思ったのですが、まだ > 見られずにおります。 > > クローラー関係のログを分離したものがこれだと言うことは、 > それを分離する設定が効いてないのであれば、fess.out には、 > ログが残っているのかも知れません。 > > ・その場合、そのログを区別する目印は何でしょうか? > > たくさん質問してスミマセン。 > > また、質問ではなくご報告 (上記調査中に判明したこと) です > が... > > ログを見ると temp フォルダのファイルを消せなかったらしき > ワーニングがあり、確かにファイルが大量に残っています。 > > また、以下のエラーがログに相当数、残っています。 > ERROR org.apache.pdfbox.pdmodel.font.PDFont - Error: Could not parse > predefined CMAP file for 'Adobe-Japan1-UCS2' > > Fess 4.0.0 + Windows Server 2003 環境です。 > > _______________________________________________ > Fess-user mailing list > Fess-****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/fess-user >