Forums: 【移行しました】サポート (Thread #35832)

クロールに失敗したドキュメントの数 (2014-08-07 17:09 by manabubu #74069)

何らかの要因により、クロールに失敗したドキュメントの数を取得する方法はありますか?
また、可能であればクロールに成功したドキュメントの数も取得したいと考えています。

クロールログを検索しカウントすれば取得可能に思えましたが、常に大量のログ(INFO)が出力されてしまうのと、スマートなやり方では無いと思っています。

Reply to #74069×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: クロールに失敗したドキュメントの数 (2014-08-09 07:57 by shinsuke #74083)

クロールに失敗したURLは
http://fess.codelibs.org/ja/9.1/admin/failureUrl-guide.html
にある障害URLとして記録されます。

クロールに成功したものはインデックスされたドキュメント数ではいかがでしょうか?
http://fess.codelibs.org/ja/9.1/admin/document-guide.html
Reply to #74069

Reply to #74083×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: クロールに失敗したドキュメントの数 (2014-08-12 17:44 by manabubu #74130)

回答ありがとうございます。
失敗したURLの参照で取得可能との事ですが、例えばスクリプト等で取得するような事を想定しています。
(クロール処理完了後にバッチを起動し、失敗したドキュメントの数を取得する)
h2のDBに教えて頂いたURLで取得できる情報が格納されていますか?
また、h2への接続方法は何を参考にすれば良いでしょうか。

以上、よろしくお願い致します。
Reply to #74083

Reply to #74130×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: クロールに失敗したドキュメントの数 (2014-12-09 11:20 by shatake #74997)

URLはjdbc:h2:tcp://localhost:19092/fessで、接続する際の
ユーザー名はsaになります。
格納されているのはFAILURE_URLテーブルですので
https://github.com/codelibs/fess/blob/master/src/main/config/h2/fess.ddl
のFAILURE_URLテーブルの部分を確認していただければと思います。

h2自体についてはh2 databaseのサイトをご参照ください。
http://www.h2database.com/html/main.html

よろしくお願いいたします。
Reply to #74130

Reply to #74997×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login