[Shinji-devel 48] 個人辞書

Back to archive index

Etsushi Kato ek.ka****@gmail*****
2006年 6月 19日 (月) 22:43:44 JST


はじめまして。
mana の個人辞書を uim の GUI 辞書ツールで扱えればと考えています。

登録のほうは、mana-add-new-word で簡単なのですが、一覧を
作ったり、削除する場合に API がなさそうなので、直接 gdbm
ファイルを開こうかなと考えています。そこで、gdbm の key に
対する content の format を教えて頂けると助かります。

例えば、「かんじ」という読みにたいして、「漢字」、「感じ」をすでに
変換していると、

2,["1,2,0,0,2514,2514,\"\\164\\171\\164\\243\\164\\184\",\"\\180\\182\\164\\184\",\"\\180\\182\\164\\184\",\"\\165\\171\\165\\243\\165\\184\",4,\"\",\"\",-1",0;"1,2,0,0,3095,3095,\"\\164\\171\\164\\243\\164\\184\",\"\\180\\193\\187\\250\",\"\\180\\193\\187\\250\",\"\\165\\171\\165\\243\\165\\184\",4,\"\",\"\",-1",0;]

といったように、~/.manadic の gdbm ファイルにおいて、「かんじ」
の key に対する content が登録されていると思います。この content
の意味はどうやって解釈すればよいでしょうか。\"....\" の中身は
euc-jp 文字列で良いと思うのですが、以下の点がわかりません。

  1. 最初の 2, は何を意味するのか?
  2. 次に続く 1,2,0,0,2514,2514 の意味は?
  3. その後の文字列の最初は、読みでいいと思うのですが、そのあとに
      続く文字列の順番はどういった意味があるのでしょう? 例えば「感じ」
      だと「かんじ」の読みのあとに「感じ」、「感じ」、「カンジ」、
      4、""、""、-1 と続き、0;、 次に 1,2,0,0,3095,3095 とあり、
      読みの 「かんじ」、「漢字」、「漢字」、「カンジ」、4、""、""、
      -1 があり、最後に 0; となります。

mana のソースをきちんと見ずに書いていますが、よろしくお願いします。
-- 
Etsushi Kato
ek.ka****@gmail*****



Shinji-devel メーリングリストの案内
Back to archive index