Ticket #27694

隣接コストの不具合

Open Date: 2012-02-26 00:49 Last Update: 2012-02-27 12:20

Reporter:
Owner:
(None)
Type:
Status:
Closed
Component:
(None)
MileStone:
(None)
Priority:
5 - Medium
Severity:
5 - Medium
Resolution:
None

Details

Java版Igo0.4.3に自作辞書を読み込ませたところ、思うような結果が得られません。

読みにくく加工(あ行をガ行に置換するなど)した日本語の文章を、元の文章に戻すということをやっていました。 MeCabで動作確認したものをIgoを使ったものに移植したのですが、動作が大きく異なります。

  • 「ギボヂヂソギギダバ」→「命拾いしたか(MeCab)」「命拾い下か(Igo)」
  • 「ボセパクウガンデスド」→「これはクウガのベルト(MeCab)」「これ羽クウガのてると(Igo)」

文法を考慮して変換を行うために形態素解析を行なっているのですが、Igo版では文法を無視した変換をしてしまいます。 詳細は http://shogo82148.hatenablog.com/entry/2012/02/25/233542 に書きました。使用した辞書は https://github.com/shogo82148/Grongish から入手可能です。

trunkのコードを確認したところ、隣接コストの計算に間違いがあるように思います。 確認をお願いします。

Attachment File List

No attachments

Ticket History (3/3 Histories)

2012-02-26 00:49 Updated by: shogo82148
  • New Ticket "隣接コストの不具合" created
2012-02-27 12:20 Updated by: phjgt
Comment

r108で対応。

原因: ・以下の二つのクラスでの隣接コストマトリックスの添字計算方法が間違っていた
 ・net.reduls.igo.dictionary.build.Matrix
 ・net.reduls.igo.dictionary.Matrix

誤: Matrix[左品詞ID*左品詞数 + 右品詞ID]  
正: Matrix[左品詞ID*右品詞数 + 右品詞ID]  ※ => Matrix[左品詞ID][右品詞ID]
2012-02-27 12:20 Updated by: phjgt
  • Ticket Close date is changed to 2012-02-27 12:20
  • Status Update from Open to Closed

Edit

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » Login