Masayuki ASAHARA
masay****@is*****
2009年 5月 13日 (水) 16:25:00 JST
奈良先端大の浅原です。 NAIST-jdic の最新版 0.5.0 をリリースいたします。 http://sourceforge.jp/projects/naist-jdic/ 表記ゆれの情報を付与したものです。 ---- 2009-05-12: masayu-a -at- is.naist.jp 0.5.0 より出力形式で第10フィールド(CSVの辞書ファイルでは第14フィールドに 表記ゆれの情報を追加しました。自動付与されたものではなく人手によるも のです。国語研の「表記統合辞書」の第5フィールドに相当する情報を追加して おります。 http://www.kokken.go.jp/lrc/index.php?%A1%D8%C9%BD%B5%AD%C5%FD%B9%E7%BC%AD%BD%F1%A1%D9%2F%CD%F8%CD%D1%A5%DE%A5%CB%A5%E5%A5%A2%A5%EB 尚、固有名詞には表記ゆれ情報を付与していません。 ---- また、複合語情報を付与したものを 2009年6月16日にリリース予定です。 ファイル形式について考慮中で pre1, pre2 の 2 パターンのデータ形式を 現在のところ準備しております。 ご意見など masayu-a -at- is.naist.jp までいただければ幸いです。 ---- 2009-06-16: masayu-a -at- is.naist.jp 0.6.0 より出力形式で第11フィールド(CSVの辞書ファイルでは第15フィールド) に複合語の情報を追加しました。自動付与されたものではなく人手によるものです。 尚、固有名詞には原則複合語情報を付与していません。 ※ pre1 と pre2 とで異なる形式を提示しております。 pre1 葉ノードの情報のみ付与 <w><w><w>くろ:クロ:名詞-一般::</w><w>み:ミ:名詞-接尾-一般::</w></w><w> がかる:ガカル:動詞-接尾:五段・ラ行:基本形</w></w> pre2 中間ノードの情報も付与 <w orth="くろみがかる" form="クロミガカル" pos="動詞-自立" ctype="五 段・ラ行" cform="基本形" ><w orth="くろみ" form="クロミ" pos="名詞-一般" ctype="" cform="" ><w orth="くろ" form="クロ" pos="名詞-一般" ctype="" cform="" >くろ</w><w orth="み" form="ミ" pos="名詞-接尾-一般" ctype="" cform="" >み</w></w><w orth="がかる" form="ガカル" pos="動詞-接尾" ctype="五段・ラ行" cform="基本形" >がかる</w></w> ---- どうぞよろしくお願いいたします