[groonga-dev,01000] Re: TokenMecabが見つからない

Back to archive index

wakis****@gmail***** wakis****@gmail*****
2012年 8月 8日 (水) 15:54:19 JST


須藤様へ、
wakisukeです。


ご連絡ありがとうございます。

教えていただいた通り、Mecabで形態素解析してみましたが、
例通りに実行できました。
(すこしメールとスペース位置に相違がありますが、動作に問題はないようです)

echo すもももももももものうち | mecab -Owakati
すもも も もも も もも の うち

echo すもももももももものうち | mecab
すもも  名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
うち    名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS



mroongaの問題ではなく、Mecabの問題ということだけでも収穫です。
Mecabで調整してみます。


またどんな情報でも構いませんので、ご連絡いただければと思います。


お忙しい中お付き合いいただきありがとうございます。




-----Original Message----- 
From: Kouhei Sutou
Sent: Wednesday, August 08, 2012 3:43 PM
To: groon****@lists*****
Subject: [groonga-dev,00999] Re: TokenMecabが見つからない

須藤です。

In <10EE9B064AF843938371042FDB85F842 @ yusukeDPC>
  "[groonga-dev,00998] Re: TokenMecabが見つからない" on Wed, 8 Aug 2012 
15:04:36 +0900,
  <wakis****@gmail*****> wrote:

> コマンドライン上もutf8設定で正常に表示できていますので、Mecabは完全にutf8で動作しています。
> 以下は教えていただいたコマンド結果です。
> mecab -D | grep charset
> charset:        utf8

たしかに、utf8とでていますね。

> /etc/init.d/mysqld start時のmroonga.logの中に
> 14:27:27.708247|e|0af807e0|mecab_new2 failed in
> check_mecab_dictionary_encoding

うーん、これはMeCabが出力しているエラーでmroongaやgroongaが
出力しているエラーではないんですよね。なので、MeCabに問題が
あると思います。以下のコマンドでちゃんとわかち書きできるか確
認してもらえますか?

  % echo すもももももももものうち | mecab -Owakati
  す もも も もも も もも の うち


-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/> (03-6231-7270)

groongaサポート:
  http://groonga.org/ja/support/
プログラミングが好きなソフトウェア開発者を募集中:
  http://www.clear-code.com/recruitment/

_______________________________________________
groonga-dev mailing list
groon****@lists*****
http://lists.sourceforge.jp/mailman/listinfo/groonga-dev 




groonga-dev メーリングリストの案内
Back to archive index