[fess-user 447] Re: CommandExtractor 仕様について提案

Back to archive index

Shinsuke Sugaya shins****@yahoo*****
2011年 3月 31日 (木) 04:22:42 JST


菅谷です。

情報をありがとうございます。
Fessで差し替えて動くかは確認してませんが、
S2Robotの方を修正しました。

https://www.seasar.org/maven/maven2-snapshot/org/seasar/robot/s2-robot/0.5.1-SNAPSHOT/s2-robot-0.5.1-20110330.192026-5.jar

よろしくお願いいたします。

shinsuke

2011年3月30日22:30  <limol****@nifty*****>:
> クニカタです。お世話になっております。
>
> http://s2robot.sandbox.seasar.org/ja/extractor-guide.html
> ↑を参考にして、
> CommandExtractorの使用を検討しています。
>
> xdoc2txt.exeを呼び出しで、以下のように設定をしたところ
> うまくテキスト抽出できませんでした。
> <component name="msOfficeCmdExtractor" class="org.seasar.robot.extractor.impl.
> CommandExtractor">
>  <property name="command">"cmd /c xdoc2txt -s -r=0 $INPUT_FILE &gt; $OUTPUT_F
> ILE"</property>
>  <property name="outputEncoding">"Shift_JIS"</property>
> </component>
>
> CommandExtractorの処理で、入力用テンポラリファイルを作成している部分で
> 拡張子の前に「.」がつかないテンポラリファイルが作成されていることが原因でした
>> xdoc2txt.exeでは拡張子によってファイル種を判別しているため、うまく動きませんで
> した。
> (※pdftotext.exeなどでは問題ないです。)
>
> とりあえずクラスファイルをDIする感じでは対応できるのですが、
> 次バージョンで、なにか対応願えませんでしょうか?
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>




Fess-user メーリングリストの案内
Back to archive index