Forums: 【移行しました】サポート (Thread #37718)

HTMLの特定タグ配下のみをインデックス対象にすることは出来るのでしょうか? (2016-05-11 23:31 by piroshis #78049)

初めまして。よろしくお願いします。

ヘルプ、サポートフォーラム内含めていろいろ検索したのですが、解決方法が見つけられなかったので質問させていただきます。

例えばHTML5で追加された<article>の配下だけをインデックス化して検索結果にヒットさせたい、という設定は可能なのでしょうか?
XML文書からHTMLを生成したのですが階層メニュー部分が全HTMLに埋め込まれており、ドキュメント内で普遍的なキーワードを入れると全HTMLがヒットしてしまうのです。
メニューには出現しないレアなキーワードを入れると、2件とかに絞られて表示されるのですが・・・。

設定イメージ的にはフィールド検索のcontentに該当するタグをbody->articleへ変更する・・・のでしょうかね?

Reply to #78049×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: HTMLの特定タグ配下のみをインデックス対象にすることは出来るのでしょうか? (2016-05-12 06:54 by shinsuke #78050)

Fess 10.1からは設定ごとのパラメータで渡すことができるようになりますが、
Fess 10.0ではapp/WEB-INF/classes/fess_config.propertiesの
crawler.document.html.content.xpath=//BODY
でXPathで指定すれば良いと思います。
Reply to #78049

Reply to #78050×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: HTMLの特定タグ配下のみをインデックス対象にすることは出来るのでしょうか? (2016-05-12 09:48 by piroshis #78051)

すみません、当方の使用バージョンを書いておりませんでした。(9.3.1)

> Fess 10.1からは設定ごとのパラメータで渡すことができるようになりますが、
> Fess 10.0ではapp/WEB-INF/classes/fess_config.propertiesの
> crawler.document.html.content.xpath=//BODY
> でXPathで指定すれば良いと思います。
早速の回答ありがとうございます。なるほど10.xではそういった設定があるのですね。
機能的な差異にも興味あるので、隣にでも10.xを入れてみて試してみます。
Reply to #78050

Reply to #78051×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login