Forums: 【移行しました】サポート (Thread #34465)

クロールするファイルサイズの設定について (2013-08-31 00:52 by wakimaco #70117)

お世話になります。
設定項目について質問させてください。

ドキュメントにも記載のあります、
「クロールするファイルサイズの設定」について質問です。
こちらで設定した「ファイルサイズ」は、
クロールするかしないかの判断基準としてのファイルサイズでしょうか。

つまり、デフォルトでhtmlファイルは2.5MBとなっておりますが、
これは2.5MB以上のhtmlファイルはクロールしない。となりますでしょうか。
それとも、全てのhtmlファイルはクロール・インデックスするが、
最大で2.5MB分のテキストをインデックスする。という動きになりますでしょうか。

画像ファイルなどファイル名だけをインデックスしたいファイルなどもあり、
後者の方の機能ができると、ありがたいと思っております。


どうぞ宜しくお願いします。

Reply to #70117×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: クロールするファイルサイズの設定について (2013-08-31 07:58 by shinsuke #70121)

ファイルサイズになります。
デフォルトの設定は、htmlを2.5M以下、その他は10M以下になっています。
ファイルサイズがその値を超えればクロールはしません。
つまり、ファイルの中身を見ません。

圧縮ファイルなどは展開すると大幅に増えるので、
最終的なテキストサイズで指定するのはメモリ的に難しいと思います。

HTML以外はファイルサイズが10Mを超えなければ処理されますが、
ファイルの種類で個別設定ができるので、image/jpeg等でinitMethod要素を
追加したりで回避していただく感じかと思います。
Reply to #70117

Reply to #70121×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: クロールするファイルサイズの設定について (2013-09-04 23:55 by wakimaco #70168)

お返事ありがとうございます。
御礼遅くなり申し訳ありません。
ファイルの中身は見ないという事了解しました。

インデックスのサイズが大きくなってきており、
画像ファイルなどは、ファイル名だけインデクシングされれば良いので、
ここのサイズ指定を小さくする事で対応できるかと考えたのですが、
そう簡単にはいかないですね、、、、。
Reply to #70121

Reply to #70168×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login