Shinsuke Sugaya
shins****@yahoo*****
2011年 3月 31日 (木) 04:22:42 JST
菅谷です。 情報をありがとうございます。 Fessで差し替えて動くかは確認してませんが、 S2Robotの方を修正しました。 https://www.seasar.org/maven/maven2-snapshot/org/seasar/robot/s2-robot/0.5.1-SNAPSHOT/s2-robot-0.5.1-20110330.192026-5.jar よろしくお願いいたします。 shinsuke 2011年3月30日22:30 <limol****@nifty*****>: > クニカタです。お世話になっております。 > > http://s2robot.sandbox.seasar.org/ja/extractor-guide.html > ↑を参考にして、 > CommandExtractorの使用を検討しています。 > > xdoc2txt.exeを呼び出しで、以下のように設定をしたところ > うまくテキスト抽出できませんでした。 > <component name="msOfficeCmdExtractor" class="org.seasar.robot.extractor.impl. > CommandExtractor"> > <property name="command">"cmd /c xdoc2txt -s -r=0 $INPUT_FILE > $OUTPUT_F > ILE"</property> > <property name="outputEncoding">"Shift_JIS"</property> > </component> > > CommandExtractorの処理で、入力用テンポラリファイルを作成している部分で > 拡張子の前に「.」がつかないテンポラリファイルが作成されていることが原因でした > 。 > xdoc2txt.exeでは拡張子によってファイル種を判別しているため、うまく動きませんで > した。 > (※pdftotext.exeなどでは問題ないです。) > > とりあえずクラスファイルをDIする感じでは対応できるのですが、 > 次バージョンで、なにか対応願えませんでしょうか? > > _______________________________________________ > Fess-user mailing list > Fess-****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/fess-user >