[Senna-dev 1048] Re: 動的にメモリ割り当て関数を変更

Back to archive index

Kouhei Sutou kou****@cozmi*****
2008年 9月 29日 (月) 06:21:36 JST


須藤です。

In <48DF9****@razil*****>
  "[Senna-dev 1046] Re: 動的にメモリ割り当て関数を変更" on Sun, 28 Sep 2008 23:45:11 +0900,
  Tasuku SUENAGA <a****@razil*****> wrote:

> > setup()内でもcut_error()やcut_omit()などが使えるので、これで
> > いけます。ただ、setup()ないで発生したerrorなどをUIにつなげる
> > 部分がバグっていたのでCutter 1.0.4では表示に反映されませ
> > ん。。。1.0.5では直しておきます。。。
> 
> なるほど、cut_error()はsetup()の中でも使えるんですね。
> がっつりコミットお願いしますー。
> 表示に反映されなくとも、とりあえずテストが進めばいいかなー、と思っています。

はい、コミットしておきました!

> > どのエンコーディングのMecabの辞書があるかがわかるとどちらに
> > も対応したテストがかけると思うんですが。。。
> > テスト用の辞書をEUC-JP/UTF-8用の両方用意して、テストではそれ
> > らの辞書を使うようにした方がよいかもしれません。
> 
> mecabのライブラリに聞けばmecab -Dに相当する情報が
> 取得できるので(ex. lex.cのsen_lex_validate)、
> それを使うという方法はあると思います。
> 
> tokenizerのオプションを取得するような関数が欲しいところですね。
> sen_hashのオンメモリ版に情報を詰めてくれるようなイメージで。

なるほど。
UTF-8じゃないときは(今のところはとりあえず)エラー、とかに
することもできそうですね。そうすれば今回のようなテスト失敗の
原因もわかりやすくなりそうです。




Senna-dev メーリングリストの案内
Back to archive index