Shinsuke Sugaya
shins****@yahoo*****
2012年 10月 8日 (月) 14:30:07 JST
菅谷です。 インデックスを調査するのであれば http://localhost:8080/solr/core1/admin/ などでSolrの管理画面にログインして Solr 側の調査をするなどもあるかと思います。 差分クロール時に利用しているSolr内の タイムスタンプを確認するのであれば、 jp.sf.fess をデバッグレベルでログ出力すると ... DEBUG jp.sf.fess.robot.FessS2RobotThread - Found solr documents: {numFound=1,start=0,docs=[SolrDocument[{lastModified=1273784751000, segment=20121008141508, anchor=[], id=file:.../hoge.txt;type=au,docomo,pc,softbank}]]} のようなログが出るので lastModified を 確認していただければ良いかと思います。 よろしくお願いいたします。 shinsuke 2012年10月8日 14:02 Yoshikazu Tanaka <yt195****@sat*****>: > 菅谷様 > >> 差分クロールはWebであればLast Modified、ファイルシステムであれば >> タイムスタンプを確認して、更新されていればドキュメントを再取得します。 > > クロールはファイルシステムのみです。追加はあるものの更新はほとんど > ありません。インデックスのタイムスタンプを確認したいのですが、どのファイル > でどのような手段がありますでしょうか? > > よろしくお願いいたします。 > > > -------------------------------------------------- > From: <fess-****@lists*****> > Sent: Saturday, October 06, 2012 12:00 PM > To: <fess-****@lists*****> > Subject: Fess-user まとめ読み, 33 巻, 1 号 > >> Fess-user メーリングリストへの投稿は以下のアドレスに送ってください. >> fess-****@lists***** >> >> Webブラウザを使って入退会するには以下のURLにどうぞ. >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> メールを使う場合,件名(Subject:)または本文に help と書いて以下の >> アドレスに送信してください. >> fess-****@lists***** >> >> メーリングリストの管理者への連絡は,以下のアドレスにお願いします. >> fess-****@lists***** >> >> 返信する場合,件名を書き直して内容がわかるようにしてください. >> そのままだと,以下のようになってしまいます. "Re: Fess-user >> まとめ読み, XX 巻 XX 号" >> >> >> 本日の話題: >> >> 1. [fess-user 608] 差分クロールについて(fess 7.0.1) >> (Yoshikazu Tanaka) >> 2. [fess-user 609] Re: 差分クロールについて(fess 7.0.1) >> (Shinsuke Sugaya) >> >> >> ---------------------------------------------------------------------- >> >> Message: 1 >> Date: Sat, 6 Oct 2012 11:12:58 +0900 >> From: "Yoshikazu Tanaka" <yt195****@sat*****> >> Subject: [fess-user 608] 差分クロールについて(fess 7.0.1) >> To: <fess-****@lists*****> >> Message-ID: <CD6C7159F10B4946B2C73C66B6759EAE @ yoshikazuPC> >> Content-Type: text/plain; charset="iso-2022-jp" >> >> fess初心者Genです。 >> >> WINDOWS 2008 R2にfess7.0.1をインストールし、差分クロールを「有効」 >> にしていて、スケジュールで毎日同じ時間からクロールを開始するように >> していますが、処理時間に変化がありません。 >> 対象にしているデータが多く26万件が対象です。 >> 毎日24時間以上処理が動いて、インデックスが毎回26万作られる状況です。 >> >> 以前、福田様から同じような質問があったようですが、そのときはバグだった >> ようですが、差分が効いてないのではないかと思うのですが、どうなんでしょうか? >> >> >> 以上です。よろしくお願いします。 >> -------------- next part -------------- >> HTMLの添付ファイルを保管しました... >> URL: >> http://lists.sourceforge.jp/mailman/archives/fess-user/attachments/20121006/58469c51/attachment.html >> >> ------------------------------ >> >> Message: 2 >> Date: Sat, 6 Oct 2012 11:27:54 +0900 >> From: Shinsuke Sugaya <shins****@yahoo*****> >> Subject: [fess-user 609] Re: 差分クロールについて(fess 7.0.1) >> To: fess-****@lists***** >> Message-ID: >> <CA+0W****@mail*****> >> Content-Type: text/plain; charset=ISO-2022-JP >> >> 菅谷です。 >> >> 差分クロールはWebであればLast Modified、ファイルシステムであれば >> タイムスタンプを確認して、更新されていればドキュメントを再取得します。 >> 動的なウェブアプリなどでは Last Modified が毎回更新されたりするので >> 毎回取得しにいくことになります。ですので、サーバーが正しい >> Last Modified を返してくるかなどを確認してみると良いかもしれません。 >> よろしくお願いいたします。 >> >> 菅谷 >> >> 2012年10月6日 11:12 Yoshikazu Tanaka <yt195****@sat*****>: >>> fess初心者Genです。 >>> >>> WINDOWS 2008 R2にfess7.0.1をインストールし、差分クロールを「有効」 >>> にしていて、スケジュールで毎日同じ時間からクロールを開始するように >>> していますが、処理時間に変化がありません。 >>> 対象にしているデータが多く26万件が対象です。 >>> 毎日24時間以上処理が動いて、インデックスが毎回26万作られる状況です。 >>> 以前、福田様から同じような質問があったようですが、そのときはバグだった >>> ようですが、差分が効いてないのではないかと思うのですが、どうなんでしょうか? >>> >>> 以上です。よろしくお願いします。 >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-****@lists***** >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >> >> >> ------------------------------ >> >> _______________________________________________ >> Fess-user mailing list >> Fess-****@lists***** >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> >> >> 以上: Fess-user まとめ読み, 33 巻, 1 号 >> *************************************** >> > > _______________________________________________ > Fess-user mailing list > Fess-****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/fess-user