Etsushi Kato
ek.ka****@gmail*****
2006年 6月 19日 (月) 22:43:44 JST
はじめまして。
mana の個人辞書を uim の GUI 辞書ツールで扱えればと考えています。
登録のほうは、mana-add-new-word で簡単なのですが、一覧を
作ったり、削除する場合に API がなさそうなので、直接 gdbm
ファイルを開こうかなと考えています。そこで、gdbm の key に
対する content の format を教えて頂けると助かります。
例えば、「かんじ」という読みにたいして、「漢字」、「感じ」をすでに
変換していると、
2,["1,2,0,0,2514,2514,\"\\164\\171\\164\\243\\164\\184\",\"\\180\\182\\164\\184\",\"\\180\\182\\164\\184\",\"\\165\\171\\165\\243\\165\\184\",4,\"\",\"\",-1",0;"1,2,0,0,3095,3095,\"\\164\\171\\164\\243\\164\\184\",\"\\180\\193\\187\\250\",\"\\180\\193\\187\\250\",\"\\165\\171\\165\\243\\165\\184\",4,\"\",\"\",-1",0;]
といったように、~/.manadic の gdbm ファイルにおいて、「かんじ」
の key に対する content が登録されていると思います。この content
の意味はどうやって解釈すればよいでしょうか。\"....\" の中身は
euc-jp 文字列で良いと思うのですが、以下の点がわかりません。
1. 最初の 2, は何を意味するのか?
2. 次に続く 1,2,0,0,2514,2514 の意味は?
3. その後の文字列の最初は、読みでいいと思うのですが、そのあとに
続く文字列の順番はどういった意味があるのでしょう? 例えば「感じ」
だと「かんじ」の読みのあとに「感じ」、「感じ」、「カンジ」、
4、""、""、-1 と続き、0;、 次に 1,2,0,0,3095,3095 とあり、
読みの 「かんじ」、「漢字」、「漢字」、「カンジ」、4、""、""、
-1 があり、最後に 0; となります。
mana のソースをきちんと見ずに書いていますが、よろしくお願いします。
--
Etsushi Kato
ek.ka****@gmail*****