[fess-user 612] Re: Fess-user まとめ読み, 33 巻, 1 号

Back to archive index

Shinsuke Sugaya shins****@yahoo*****
2012年 10月 8日 (月) 14:30:07 JST


菅谷です。

インデックスを調査するのであれば
http://localhost:8080/solr/core1/admin/
などでSolrの管理画面にログインして
Solr 側の調査をするなどもあるかと思います。

差分クロール時に利用しているSolr内の
タイムスタンプを確認するのであれば、
jp.sf.fess をデバッグレベルでログ出力すると

... DEBUG jp.sf.fess.robot.FessS2RobotThread - Found solr documents:
{numFound=1,start=0,docs=[SolrDocument[{lastModified=1273784751000,
segment=20121008141508, anchor=[],
id=file:.../hoge.txt;type=au,docomo,pc,softbank}]]}

のようなログが出るので lastModified を
確認していただければ良いかと思います。

よろしくお願いいたします。

shinsuke


2012年10月8日 14:02 Yoshikazu Tanaka <yt195****@sat*****>:
> 菅谷様
>
>> 差分クロールはWebであればLast Modified、ファイルシステムであれば
>> タイムスタンプを確認して、更新されていればドキュメントを再取得します。
>
> クロールはファイルシステムのみです。追加はあるものの更新はほとんど
> ありません。インデックスのタイムスタンプを確認したいのですが、どのファイル
> でどのような手段がありますでしょうか?
>
> よろしくお願いいたします。
>
>
> --------------------------------------------------
> From: <fess-****@lists*****>
> Sent: Saturday, October 06, 2012 12:00 PM
> To: <fess-****@lists*****>
> Subject: Fess-user まとめ読み, 33 巻, 1 号
>
>> Fess-user メーリングリストへの投稿は以下のアドレスに送ってください.
>> fess-****@lists*****
>>
>> Webブラウザを使って入退会するには以下のURLにどうぞ.
>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>> メールを使う場合,件名(Subject:)または本文に help と書いて以下の
>> アドレスに送信してください.
>> fess-****@lists*****
>>
>> メーリングリストの管理者への連絡は,以下のアドレスにお願いします.
>> fess-****@lists*****
>>
>> 返信する場合,件名を書き直して内容がわかるようにしてください.
>> そのままだと,以下のようになってしまいます. "Re: Fess-user
>> まとめ読み, XX 巻 XX 号"
>>
>>
>> 本日の話題:
>>
>>   1. [fess-user 608] 差分クロールについて(fess 7.0.1)
>>      (Yoshikazu Tanaka)
>>   2. [fess-user 609] Re: 差分クロールについて(fess 7.0.1)
>>      (Shinsuke Sugaya)
>>
>>
>> ----------------------------------------------------------------------
>>
>> Message: 1
>> Date: Sat, 6 Oct 2012 11:12:58 +0900
>> From: "Yoshikazu Tanaka" <yt195****@sat*****>
>> Subject: [fess-user 608] 差分クロールについて(fess 7.0.1)
>> To: <fess-****@lists*****>
>> Message-ID: <CD6C7159F10B4946B2C73C66B6759EAE @ yoshikazuPC>
>> Content-Type: text/plain; charset="iso-2022-jp"
>>
>> fess初心者Genです。
>>
>> WINDOWS 2008 R2にfess7.0.1をインストールし、差分クロールを「有効」
>> にしていて、スケジュールで毎日同じ時間からクロールを開始するように
>> していますが、処理時間に変化がありません。
>> 対象にしているデータが多く26万件が対象です。
>> 毎日24時間以上処理が動いて、インデックスが毎回26万作られる状況です。
>>
>> 以前、福田様から同じような質問があったようですが、そのときはバグだった
>> ようですが、差分が効いてないのではないかと思うのですが、どうなんでしょうか?
>>
>>
>> 以上です。よろしくお願いします。
>> -------------- next part --------------
>> HTMLの添付ファイルを保管しました...
>> URL:
>> http://lists.sourceforge.jp/mailman/archives/fess-user/attachments/20121006/58469c51/attachment.html
>>
>> ------------------------------
>>
>> Message: 2
>> Date: Sat, 6 Oct 2012 11:27:54 +0900
>> From: Shinsuke Sugaya <shins****@yahoo*****>
>> Subject: [fess-user 609] Re: 差分クロールについて(fess 7.0.1)
>> To: fess-****@lists*****
>> Message-ID:
>> <CA+0W****@mail*****>
>> Content-Type: text/plain; charset=ISO-2022-JP
>>
>> 菅谷です。
>>
>> 差分クロールはWebであればLast Modified、ファイルシステムであれば
>> タイムスタンプを確認して、更新されていればドキュメントを再取得します。
>> 動的なウェブアプリなどでは Last Modified が毎回更新されたりするので
>> 毎回取得しにいくことになります。ですので、サーバーが正しい
>> Last Modified を返してくるかなどを確認してみると良いかもしれません。
>> よろしくお願いいたします。
>>
>> 菅谷
>>
>> 2012年10月6日 11:12 Yoshikazu Tanaka <yt195****@sat*****>:
>>> fess初心者Genです。
>>>
>>> WINDOWS 2008 R2にfess7.0.1をインストールし、差分クロールを「有効」
>>> にしていて、スケジュールで毎日同じ時間からクロールを開始するように
>>> していますが、処理時間に変化がありません。
>>> 対象にしているデータが多く26万件が対象です。
>>> 毎日24時間以上処理が動いて、インデックスが毎回26万作られる状況です。
>>> 以前、福田様から同じような質問があったようですが、そのときはバグだった
>>> ようですが、差分が効いてないのではないかと思うのですが、どうなんでしょうか?
>>>
>>> 以上です。よろしくお願いします。
>>>
>>> _______________________________________________
>>> Fess-user mailing list
>>> Fess-****@lists*****
>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>>>
>>
>>
>>
>> ------------------------------
>>
>> _______________________________________________
>> Fess-user mailing list
>> Fess-****@lists*****
>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>>
>>
>> 以上: Fess-user まとめ読み, 33 巻, 1 号
>> ***************************************
>>
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user




Fess-user メーリングリストの案内
Back to archive index