[fess-user 551] Re: ファイルシステムクロールでの拡張子絞り込み

Back to archive index

Shinsuke Sugaya shins****@yahoo*****
2012年 3月 2日 (金) 05:14:13 JST


菅谷です。

管理画面のセッション情報で対象のセッションIDを
クリックすると、そのクロールでインデックスされたものが
表示されるので対象ファイルがインデックスされているかを
確認するのが良いと思います。あとは、クロール時の
ログを確認して、対象ファイルがクロールされたか、
Exception が発生していないかを見るのが良いと思います。

http://fess.sourceforge.jp/ja/6.0/config/logging.html

shinsuke


2012年3月2日0:03 Yukinobu Morita <rpt.x****@gmail*****>:
> 森田です。
> 菅谷さん、回答ありがとうございました。
>
> ご教示いただいた設定を試してみました。
> パス:file:/c:/test (.docx/.xlsxなどの拡張子のファイルを格納)
> クロール対象とするパス: 単一ディレクトリの為、未指定。
> 検索対象とするパス: .*\.docx$
>
> と設定し、インデックスを全削除してからクロール実施。
> Fess検索画面から文書内の単語や拡張子で検索を
> 実行するとExcelファイルが検索結果として
> ヒットし、うまく絞り込めなかったようです。
>
> 何かお気づきの点がありましたら、
> ご教示いただけますと助かります。
>
> 以上
>
>
> 2012年2月29日5:51 Shinsuke Sugaya <shins****@yahoo*****>:
>
>> 菅谷です。
>>
>> > 「クロール対象とするパス」に「.*\.doc$」のように
>>
>> 上記のようにするとクロールしていくフォルダも
>> 除外されてしまいます。ですので、たとえば
>> /home/taro 以下にある .doc を検索対象にするので
>> あれば、
>>
>> パス:
>> /home/taro
>>
>> 検索対象とするパス       :
>> .*\.doc$
>>
>> クロール対象とするパス:
>> (クロールする先がわかっていれば絞り込む)
>> /home/taro
>> /home/taro/a
>> /home/taro/b
>>
>> になります。よろしくお願いいたします。
>>
>> shinsuke
>>
>>
>> 2012年2月29日1:35 Yukinobu Morita <rpt.x****@gmail*****>:
>> > 森田です。お世話になります。
>> > 2度目の投稿です。
>> >
>> > FessをWindowsサーバ環境で利用しています。
>> >
>> > ファイルシステムクロールでクロール対象とする
>> > ファイルを拡張子で絞り込みたいと考え、
>> > 「クロール対象とするパス」に「.*\.doc$」のように
>> > 記述してみましたが、うまく絞り込めませんでした。
>> >
>> > 「除外するパス」では上記の正規表現で問題ないようですが、
>> > 「クロール対象とするパス」の場合は、どのように記述すると
>> > 良いでしょうか?
>> >
>> > ご教示いただきたく、宜しくお願いいたします。
>> >
>> > 以上
>> >
>> > _______________________________________________
>> > Fess-user mailing list
>> > Fess-****@lists*****
>> > http://lists.sourceforge.jp/mailman/listinfo/fess-user
>> >
>>
>> _______________________________________________
>> Fess-user mailing list
>> Fess-****@lists*****
>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>
>
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>




Fess-user メーリングリストの案内
Back to archive index