Forums: 【移行しました】サポート (Thread #35727)

「クロール対象とするパス」の指定方法について (2014-07-14 17:09 by hogefoobar #73835)

三度の質問すみません。

ファイル検索の検索対象数が膨大で、クロール時間の短縮を図るべく「クロール対象とするパス」に拡張子を指定することにより実現できないか、と考えました。
(今までは、「クロール対象から除外するパス」に多数登録していましたが、対象をtext,pdf,office文書に限定する方向で。)

http://fess.codelibs.org/ja/9.1/admin/fileCrawlingConfig-guide.html
の「拡張子が png のものを対象から除外したい場合」の表現を参考に
例えば、テスト的に「txt」の拡張子のものだけを対象にしたいと思い、
「クロール対象とするパス」のところに「.*\.txt$」とだけ記載し(その他のパスの表現はすべて空白)、実行してみましたが、件数が0件で返ってきました。
実行時間は1分にも満たず。当然、対象となる「txt」のファイルは当該ファイルシステムには多数存在しています。

こちら、表現が間違っているのでしょうか?ご教示頂きたく。よろしくお願いします。

Reply to #73835×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: 「クロール対象とするパス」の指定方法について (2014-07-14 18:14 by shatake #73836)

> こちら、表現が間違っているのでしょうか?

https://sourceforge.jp/projects/fess/forums/18580/34836/
の過去のやり取りにもありますように、「クロール対象とするパス」ではなく
「検索対象とするパス」に「.*\.txt$」を設定して頂ければ良いかと思います。
Reply to #73835

Reply to #73836×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: 「クロール対象とするパス」の指定方法について (2014-07-15 10:18 by hogefoobar #73850)

shatake様、返信ありがとうございます。

返信を見て分からなくなったのですが、
・クロール対象
・検索対象
の違いです。

クロール対象…クロール時に正規表現で対象を絞り込み
検索対象…クロールした結果から、検索時の絞り込みの条件に正規表現の条件を加える

と認識していましたが、違うのでしょうか?
http://fess.codelibs.org/ja/9.1/admin/fileCrawlingConfig-guide.html
の文章見ても、その違いは分かりませんでした。

私がやりたいのは、クロール時間の短縮の為、クロールの対象件数を減らす(絞り込む)事です。そう思い前者の方に入力していました。
ご紹介頂いたものは、検索対象に条件を指定するものですが、そちらでよろしいのでしょうか?

ご紹介頂いた掲示板に
>「クロール対象とするパス」等で指定するとそれ以外がクロール対象でなくなるため、
とありましたが、私がやりたいのは、まさしくこの通りなのですが。

以上、よろしくお願いします。
Reply to #73836

Reply to #73850×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: 「クロール対象とするパス」の指定方法について (2014-07-15 13:56 by hogefoobar #73854)

追記

ご紹介頂いた「検索対象」の方に条件を記入してクロールしたところ、24時間で終わらなかったクロールが4時間で終了しました。

検索もしてみましたが、望むような結果は返ってきています。

なので、正しい対処方法だと思うのですが、「検索対象」と「クロール対象」の考え方の区別が分からなくなってしまいました。
Reply to #73850

Reply to #73854×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login