Download
Magazine
Develop
Account
Download
Magazine
Develop
Login
Forgot Account/Password
Create Account
Language
Help
Language
Help
×
Login
Login Name
Password
×
Forgot Account/Password
Category:
Software
People
PersonalForge
Magazine
Wiki
Search
OSDN
>
Find Software
>
Internet
>
WWW/HTTP
>
Indexing/Search
>
Fess
>
Forums
>
【移行しました】サポート
>
「クロール対象とするパス」の指定方法について
Description
Project Summary
Developer Dashboard
Web Page
Developers
Image Gallery
List of RSS Feeds
Activity
Statistics
History
Downloads
List of Releases
Stats
Source Code
Code Repository list
Subversion
View Repository
Communication
Forums
List of Forums
【移行しました】サポート (1160)
【移行しました】機能要求 (35)
Mailing Lists
list of ML
fess-user
News
Forums:
【移行しました】サポート
(Thread #35727)
Return to Thread list
RSS
「クロール対象とするパス」の指定方法について (2014-07-14 17:09 by
hogefoobar
#73835)
Reply
三度の質問すみません。
ファイル検索の検索対象数が膨大で、クロール時間の短縮を図るべく「クロール対象とするパス」に拡張子を指定することにより実現できないか、と考えました。
(今までは、「クロール対象から除外するパス」に多数登録していましたが、対象をtext,pdf,office文書に限定する方向で。)
http://fess.codelibs.org/ja/9.1/admin/fileCrawlingConfig-guide.html
の「拡張子が png のものを対象から除外したい場合」の表現を参考に
例えば、テスト的に「txt」の拡張子のものだけを対象にしたいと思い、
「クロール対象とするパス」のところに「.*\.txt$」とだけ記載し(その他のパスの表現はすべて空白)、実行してみましたが、件数が0件で返ってきました。
実行時間は1分にも満たず。当然、対象となる「txt」のファイルは当該ファイルシステムには多数存在しています。
こちら、表現が間違っているのでしょうか?ご教示頂きたく。よろしくお願いします。
Reply to #73835
×
Subject
Body
Reply To Message #73835 > 三度の質問すみません。 > > ファイル検索の検索対象数が膨大で、クロール時間の短縮を図るべく「クロール対象とするパス」に拡張子を指定することにより実現できないか、と考えました。 > (今までは、「クロール対象から除外するパス」に多数登録していましたが、対象をtext,pdf,office文書に限定する方向で。) > > http://fess.codelibs.org/ja/9.1/admin/fileCrawlingConfig-guide.html > の「拡張子が png のものを対象から除外したい場合」の表現を参考に > 例えば、テスト的に「txt」の拡張子のものだけを対象にしたいと思い、 > 「クロール対象とするパス」のところに「.*\.txt$」とだけ記載し(その他のパスの表現はすべて空白)、実行してみましたが、件数が0件で返ってきました。 > 実行時間は1分にも満たず。当然、対象となる「txt」のファイルは当該ファイルシステムには多数存在しています。 > > こちら、表現が間違っているのでしょうか?ご教示頂きたく。よろしくお願いします。
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel
Re: 「クロール対象とするパス」の指定方法について (2014-07-14 18:14 by
shatake
#73836)
Reply
> こちら、表現が間違っているのでしょうか?
https://sourceforge.jp/projects/fess/forums/18580/34836/
の過去のやり取りにもありますように、「クロール対象とするパス」ではなく
「検索対象とするパス」に「.*\.txt$」を設定して頂ければ良いかと思います。
Reply to
#73835
Reply to #73836
×
Subject
Body
Reply To Message #73836 > > こちら、表現が間違っているのでしょうか? > > https://sourceforge.jp/projects/fess/forums/18580/34836/ > の過去のやり取りにもありますように、「クロール対象とするパス」ではなく > 「検索対象とするパス」に「.*\.txt$」を設定して頂ければ良いかと思います。
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel
Re: 「クロール対象とするパス」の指定方法について (2014-07-15 10:18 by
hogefoobar
#73850)
Reply
shatake様、返信ありがとうございます。
返信を見て分からなくなったのですが、
・クロール対象
・検索対象
の違いです。
クロール対象…クロール時に正規表現で対象を絞り込み
検索対象…クロールした結果から、検索時の絞り込みの条件に正規表現の条件を加える
と認識していましたが、違うのでしょうか?
http://fess.codelibs.org/ja/9.1/admin/fileCrawlingConfig-guide.html
の文章見ても、その違いは分かりませんでした。
私がやりたいのは、クロール時間の短縮の為、クロールの対象件数を減らす(絞り込む)事です。そう思い前者の方に入力していました。
ご紹介頂いたものは、検索対象に条件を指定するものですが、そちらでよろしいのでしょうか?
ご紹介頂いた掲示板に
>「クロール対象とするパス」等で指定するとそれ以外がクロール対象でなくなるため、
とありましたが、私がやりたいのは、まさしくこの通りなのですが。
以上、よろしくお願いします。
Reply to
#73836
Reply to #73850
×
Subject
Body
Reply To Message #73850 > shatake様、返信ありがとうございます。 > > 返信を見て分からなくなったのですが、 > ・クロール対象 > ・検索対象 > の違いです。 > > クロール対象…クロール時に正規表現で対象を絞り込み > 検索対象…クロールした結果から、検索時の絞り込みの条件に正規表現の条件を加える > > と認識していましたが、違うのでしょうか? > http://fess.codelibs.org/ja/9.1/admin/fileCrawlingConfig-guide.html > の文章見ても、その違いは分かりませんでした。 > > 私がやりたいのは、クロール時間の短縮の為、クロールの対象件数を減らす(絞り込む)事です。そう思い前者の方に入力していました。 > ご紹介頂いたものは、検索対象に条件を指定するものですが、そちらでよろしいのでしょうか? > > ご紹介頂いた掲示板に > >「クロール対象とするパス」等で指定するとそれ以外がクロール対象でなくなるため、 > とありましたが、私がやりたいのは、まさしくこの通りなのですが。 > > 以上、よろしくお願いします。
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel
Re: 「クロール対象とするパス」の指定方法について (2014-07-15 13:56 by
hogefoobar
#73854)
Reply
追記
ご紹介頂いた「検索対象」の方に条件を記入してクロールしたところ、24時間で終わらなかったクロールが4時間で終了しました。
検索もしてみましたが、望むような結果は返ってきています。
なので、正しい対処方法だと思うのですが、「検索対象」と「クロール対象」の考え方の区別が分からなくなってしまいました。
Reply to
#73850
Reply to #73854
×
Subject
Body
Reply To Message #73854 > 追記 > > ご紹介頂いた「検索対象」の方に条件を記入してクロールしたところ、24時間で終わらなかったクロールが4時間で終了しました。 > > 検索もしてみましたが、望むような結果は返ってきています。 > > なので、正しい対処方法だと思うのですが、「検索対象」と「クロール対象」の考え方の区別が分からなくなってしまいました。
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel