Forums: 【移行しました】サポート (Thread #36630)

jpegのようなファイルをファイル名で検索したいが、ファイルの中身をインデックスに追加したくない (2015-03-24 12:04 by ogasahara #75806)

お世話になっております。fess-9.3.3を使用しております。

現在fessを使用して共有フォルダの検索サーバーを作成していますが、対象にjpegファイルが多く、jpegファイルの中身がsolrのインデックスサイズを肥大化させてしまっています。
jpegファイルを検索対象から外せば肥大化は防げると思いますが、ファイル名だけは検索したいという状況です。

jpegのような「ファイルの中身に意味がないファイル」を、ファイル名のみインデックスに追加し、ファイルの中身は追加しないように設定したいのですが、設定だけで可能でしょうか?

Reply to #75806×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: jpegのようなファイルをファイル名で検索したいが、ファイルの中身をインデックスに追加したくない (2015-03-31 10:25 by shinsuke #75855)

現状、そこを制御することはできないので、
次のバージョンで対応したいと思います。
Reply to #75806

Reply to #75855×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: jpegのようなファイルをファイル名で検索したいが、ファイルの中身をインデックスに追加したくない (2015-03-31 10:53 by shinsuke #75856)

[メッセージ #75855 への返信]
> 現状、そこを制御することはできないので、
> 次のバージョンで対応したいと思います。

現状でも対応方法がありました。

https://raw.githubusercontent.com/codelibs/s2robot/s2robot-0.8.x/s2robot/src/main/resources/s2robot_extractor.dicon
をwebapps/fess/WEB-INF/classesに置いて、
<component name="tikaExtractor" class="org.codelibs.robot.extractor.impl.TikaExtractor">
<property name="readAsTextIfFailed">false</property>
のようにreadAsTextIfFailedをfalseで置くことで、
含まれないようになると思います。
Reply to #75855

Reply to #75856×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login