隣接コストの不具合
Java版Igo0.4.3に自作辞書を読み込ませたところ、思うような結果が得られません。
読みにくく加工(あ行をガ行に置換するなど)した日本語の文章を、元の文章に戻すということをやっていました。 MeCabで動作確認したものをIgoを使ったものに移植したのですが、動作が大きく異なります。
文法を考慮して変換を行うために形態素解析を行なっているのですが、Igo版では文法を無視した変換をしてしまいます。 詳細は http://shogo82148.hatenablog.com/entry/2012/02/25/233542 に書きました。使用した辞書は https://github.com/shogo82148/Grongish から入手可能です。
trunkのコードを確認したところ、隣接コストの計算に間違いがあるように思います。 確認をお願いします。
r108で対応。
原因: ・以下の二つのクラスでの隣接コストマトリックスの添字計算方法が間違っていた ・net.reduls.igo.dictionary.build.Matrix ・net.reduls.igo.dictionary.Matrix
誤: Matrix[左品詞ID*左品詞数 + 右品詞ID] 正: Matrix[左品詞ID*右品詞数 + 右品詞ID] ※ => Matrix[左品詞ID][右品詞ID]
Java版Igo0.4.3に自作辞書を読み込ませたところ、思うような結果が得られません。
読みにくく加工(あ行をガ行に置換するなど)した日本語の文章を、元の文章に戻すということをやっていました。 MeCabで動作確認したものをIgoを使ったものに移植したのですが、動作が大きく異なります。
文法を考慮して変換を行うために形態素解析を行なっているのですが、Igo版では文法を無視した変換をしてしまいます。 詳細は http://shogo82148.hatenablog.com/entry/2012/02/25/233542 に書きました。使用した辞書は https://github.com/shogo82148/Grongish から入手可能です。
trunkのコードを確認したところ、隣接コストの計算に間違いがあるように思います。 確認をお願いします。