Masayuki Shibata
mshib****@shima*****
2009年 12月 14日 (月) 11:50:44 JST
柴田@亀岡市です。 英文字もダメです。 ディレクトリリスティングページにはたどり着いていて、テキストファイルなど では、ファイル名、中身もヒットし、Word、Excel ファイルは中身だけでなくフ ァイル名もアウトです。 Subversion 以外の Web サーバーページからのリンク先 Word、Excel やファイ ルサーバー (file://) の Word、Excel は読めてますので、Subversion 特有の 現象です。 ブラウザでページのリンクを辿っている限りは、ごく普通に読めそうな気はしま すし、手で辿って開く分には実際に読めますので、文字列抽出には支障ないよう に思うのですが... >菅谷です。 > >> Office 2000 のものが多いと思います。 > >ありがとうございます。手元の doc では通るので >Subversion がらみなのかもしれないです。 > >何度も申し訳ありませんが、そのファイルの >ファイル名(拡張子なし部分)やそのファイルに >含まれる英数字も検索できない感じでしょうか? >検索できれば、文字化けして処理されている >可能性が高いですし、できなければ文字列抽出に >失敗していると思われます。 > >よろしくお願いいたします。 > >shinsuke > >2009年12月11日18:36 Masayuki Shibata <mshib****@shima*****>: >> 柴田@亀岡市です。 >> >>>> Word/Excel などの中身は拾っていないようです。 >>> >>>対象の Word/Excel のバージョンは何になるでしょうか? >>>一応、doc や docx などをサポートしている感じ >>>なのですが…。 >> >> Office 2000 のものが多いと思います。 >> >> ディレクトリリスティングのページまでは拾ってきていて、そこから >> リンクをたたいて表示できる Word ファイル中の文字列を再度 Fess >> に指定して検索をかけるのですが、そいつがヒットしてこないです。 >> >> ---------- >> Shibata, Masayuki >> Manager, Software Development >> Shimadzu Corporation >> Analytical Measuring Instruments Division >> Research & Development Department >> Telephone: 075-823-1441 Japan >> Facsimile: 075-823-1365 Japan >> E-mail: mshib****@shima***** >> >> _______________________________________________ >> Fess-user mailing list >> Fess-****@lists***** >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >_______________________________________________ >Fess-user mailing list >Fess-****@lists***** >http://lists.sourceforge.jp/mailman/listinfo/fess-user >