wakis****@gmail*****
wakis****@gmail*****
2012年 8月 8日 (水) 15:54:19 JST
須藤様へ、 wakisukeです。 ご連絡ありがとうございます。 教えていただいた通り、Mecabで形態素解析してみましたが、 例通りに実行できました。 (すこしメールとスペース位置に相違がありますが、動作に問題はないようです) echo すもももももももものうち | mecab -Owakati すもも も もも も もも の うち echo すもももももももものうち | mecab すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ EOS mroongaの問題ではなく、Mecabの問題ということだけでも収穫です。 Mecabで調整してみます。 またどんな情報でも構いませんので、ご連絡いただければと思います。 お忙しい中お付き合いいただきありがとうございます。 -----Original Message----- From: Kouhei Sutou Sent: Wednesday, August 08, 2012 3:43 PM To: groon****@lists***** Subject: [groonga-dev,00999] Re: TokenMecabが見つからない 須藤です。 In <10EE9B064AF843938371042FDB85F842 @ yusukeDPC> "[groonga-dev,00998] Re: TokenMecabが見つからない" on Wed, 8 Aug 2012 15:04:36 +0900, <wakis****@gmail*****> wrote: > コマンドライン上もutf8設定で正常に表示できていますので、Mecabは完全にutf8で動作しています。 > 以下は教えていただいたコマンド結果です。 > mecab -D | grep charset > charset: utf8 たしかに、utf8とでていますね。 > /etc/init.d/mysqld start時のmroonga.logの中に > 14:27:27.708247|e|0af807e0|mecab_new2 failed in > check_mecab_dictionary_encoding うーん、これはMeCabが出力しているエラーでmroongaやgroongaが 出力しているエラーではないんですよね。なので、MeCabに問題が あると思います。以下のコマンドでちゃんとわかち書きできるか確 認してもらえますか? % echo すもももももももものうち | mecab -Owakati す もも も もも も もも の うち -- 須藤 功平 <kou****@clear*****> 株式会社クリアコード <http://www.clear-code.com/> (03-6231-7270) groongaサポート: http://groonga.org/ja/support/ プログラミングが好きなソフトウェア開発者を募集中: http://www.clear-code.com/recruitment/ _______________________________________________ groonga-dev mailing list groon****@lists***** http://lists.sourceforge.jp/mailman/listinfo/groonga-dev