Kouhei Sutou
kou****@cozmi*****
2008年 9月 29日 (月) 06:21:36 JST
須藤です。 In <48DF9****@razil*****> "[Senna-dev 1046] Re: 動的にメモリ割り当て関数を変更" on Sun, 28 Sep 2008 23:45:11 +0900, Tasuku SUENAGA <a****@razil*****> wrote: > > setup()内でもcut_error()やcut_omit()などが使えるので、これで > > いけます。ただ、setup()ないで発生したerrorなどをUIにつなげる > > 部分がバグっていたのでCutter 1.0.4では表示に反映されませ > > ん。。。1.0.5では直しておきます。。。 > > なるほど、cut_error()はsetup()の中でも使えるんですね。 > がっつりコミットお願いしますー。 > 表示に反映されなくとも、とりあえずテストが進めばいいかなー、と思っています。 はい、コミットしておきました! > > どのエンコーディングのMecabの辞書があるかがわかるとどちらに > > も対応したテストがかけると思うんですが。。。 > > テスト用の辞書をEUC-JP/UTF-8用の両方用意して、テストではそれ > > らの辞書を使うようにした方がよいかもしれません。 > > mecabのライブラリに聞けばmecab -Dに相当する情報が > 取得できるので(ex. lex.cのsen_lex_validate)、 > それを使うという方法はあると思います。 > > tokenizerのオプションを取得するような関数が欲しいところですね。 > sen_hashのオンメモリ版に情報を詰めてくれるようなイメージで。 なるほど。 UTF-8じゃないときは(今のところはとりあえず)エラー、とかに することもできそうですね。そうすれば今回のようなテスト失敗の 原因もわかりやすくなりそうです。