Download
Magazine
Develop
Account
Download
Magazine
Develop
Login
Forgot Account/Password
Create Account
Language
Help
Language
Help
×
Login
Login Name
Password
×
Forgot Account/Password
Category:
Software
People
PersonalForge
Magazine
Wiki
Search
OSDN
>
Find Software
>
Internet
>
WWW/HTTP
>
Indexing/Search
>
Fess
>
Forums
>
【移行しました】サポート
>
検索出来ないファイルについて
Description
Project Summary
Developer Dashboard
Web Page
Developers
Image Gallery
List of RSS Feeds
Activity
Statistics
History
Downloads
List of Releases
Stats
Source Code
Code Repository list
Subversion
View Repository
Communication
Forums
List of Forums
【移行しました】サポート (1160)
【移行しました】機能要求 (35)
Mailing Lists
list of ML
fess-user
News
Forums:
【移行しました】サポート
(Thread #38708)
Return to Thread list
RSS
検索出来ないファイルについて (2017-06-21 14:34 by
yasagure737
#79976)
Reply
Fess「fess-11.0.3」を使用中です。
PDFとPPTファイルについてファイルクローラを行い、検索してもヒットされません。
正しいファイル名でクローラされていない事が考えられます(ファイル名 ≠ title)
もし、可能な様でしたら、変更方法などをご教授願えますと非常に助かります。
以上です。
Reply to #79976
×
Subject
Body
Reply To Message #79976 > Fess「fess-11.0.3」を使用中です。 > PDFとPPTファイルについてファイルクローラを行い、検索してもヒットされません。 > 正しいファイル名でクローラされていない事が考えられます(ファイル名 ≠ title) > > もし、可能な様でしたら、変更方法などをご教授願えますと非常に助かります。 > 以上です。 >
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel
Re: 検索出来ないファイルについて (2017-06-21 22:13 by
shinsuke
#79980)
Reply
fess-crawler.logを確認して、クロールされたのかどうかを確認するのが良いと思います。
Reply to
#79976
Reply to #79980
×
Subject
Body
Reply To Message #79980 > fess-crawler.logを確認して、クロールされたのかどうかを確認するのが良いと思います。
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel
Re: 検索出来ないファイルについて (2017-06-22 13:44 by
yasagure737
#79984)
Reply
ご返信ありがとうございます。
=====================================
対象クロール先「D:\work」
ファイルは「test.pptx」、「test_2.pdf」の2つ
=====================================
「fess-crawler.log」を確認しましたところ、
2017-06-22 13:31:51,755 [WebFsCrawler] INFO Target Path: file:/d:/work/
...
2017-06-22 13:31:58,375 [Crawler-20170622133119-2-4] INFO Crawling URL: file:/d:/work/test_2.pdf
2017-06-22 13:31:58,378 [Crawler-20170622133119-2-5] INFO Crawling URL: file:/d:/work/test.pptx
として出力されています。
[システム情報 → 検索]より中身を見ますと・・・
・test.pptx
titleは「20170622_ppt」となっておりタイトル不正。
⇒pptxファイルの中身がtitleとなっている。
・test_2.pdf
titleは「test_2.pdf」となっておりタイトルが正しい。
★PDFファイルについては問題がなさそうですが、
PPT(PPTX)についてはタイトルがうまく取れていません。
よろしくお願い致します。
Reply to
#79980
Reply to #79984
×
Subject
Body
Reply To Message #79984 > ご返信ありがとうございます。 > ===================================== > 対象クロール先「D:\work」 > ファイルは「test.pptx」、「test_2.pdf」の2つ > ===================================== > 「fess-crawler.log」を確認しましたところ、 > 2017-06-22 13:31:51,755 [WebFsCrawler] INFO Target Path: file:/d:/work/ > ... > 2017-06-22 13:31:58,375 [Crawler-20170622133119-2-4] INFO Crawling URL: file:/d:/work/test_2.pdf > 2017-06-22 13:31:58,378 [Crawler-20170622133119-2-5] INFO Crawling URL: file:/d:/work/test.pptx > として出力されています。 > > [システム情報 → 検索]より中身を見ますと・・・ > ・test.pptx > titleは「20170622_ppt」となっておりタイトル不正。 > ⇒pptxファイルの中身がtitleとなっている。 > > ・test_2.pdf > titleは「test_2.pdf」となっておりタイトルが正しい。 > > ★PDFファイルについては問題がなさそうですが、 > PPT(PPTX)についてはタイトルがうまく取れていません。 > > よろしくお願い致します。
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel
Re: 検索出来ないファイルについて (2017-06-22 15:21 by
shinsuke
#79985)
Reply
> titleは「20170622_ppt」となっておりタイトル不正。
> ⇒pptxファイルの中身がtitleとなっている。
前提として、デフォルトの仕様としてはpptやpdfなどは
メタ情報のタイトルから取得できる場合はその値を利用して
なければファイル名が採用されます。
20170622_pptという感じでファイル名ではないので、
そのファイルのメタ情報のタイトルが20170622_pptに
なっているのではないでしょうか。
pptのメタ情報はTitleだったと思うので、fess_config.propertiesで
crawler.metadata.name.mapping=\
title=title:string\n\
Title=title:string\n\
のTitleの方を外せば取得しないようになると思います。
Best Answer
Reply to
#79984
Reply to #79985
×
Subject
Body
Reply To Message #79985 > > titleは「20170622_ppt」となっておりタイトル不正。 > > ⇒pptxファイルの中身がtitleとなっている。 > > 前提として、デフォルトの仕様としてはpptやpdfなどは > メタ情報のタイトルから取得できる場合はその値を利用して > なければファイル名が採用されます。 > 20170622_pptという感じでファイル名ではないので、 > そのファイルのメタ情報のタイトルが20170622_pptに > なっているのではないでしょうか。 > > pptのメタ情報はTitleだったと思うので、fess_config.propertiesで > crawler.metadata.name.mapping=\ > title=title:string\n\ > Title=title:string\n\ > のTitleの方を外せば取得しないようになると思います。
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel
Re: 検索出来ないファイルについて (2017-06-22 18:44 by
yasagure737
#79986)
Reply
> pptのメタ情報はTitleだったと思うので、fess_config.propertiesで
> crawler.metadata.name.mapping=\
> title=title:string\n\
> Title=title:string\n\
> のTitleの方を外せば取得しないようになると思います。
早々のご返信ありがとうございます。
確認しましたところ、titleの方を外したところ上手くいきました!
ありがとうございます!!
Reply to
#79985
Reply to #79986
×
Subject
Body
Reply To Message #79986 > > pptのメタ情報はTitleだったと思うので、fess_config.propertiesで > > crawler.metadata.name.mapping=\ > > title=title:string\n\ > > Title=title:string\n\ > > のTitleの方を外せば取得しないようになると思います。 > 早々のご返信ありがとうございます。 > > 確認しましたところ、titleの方を外したところ上手くいきました! > ありがとうございます!!
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel