Etsushi Kato
ek.ka****@gmail*****
2006年 6月 19日 (月) 22:43:44 JST
はじめまして。 mana の個人辞書を uim の GUI 辞書ツールで扱えればと考えています。 登録のほうは、mana-add-new-word で簡単なのですが、一覧を 作ったり、削除する場合に API がなさそうなので、直接 gdbm ファイルを開こうかなと考えています。そこで、gdbm の key に 対する content の format を教えて頂けると助かります。 例えば、「かんじ」という読みにたいして、「漢字」、「感じ」をすでに 変換していると、 2,["1,2,0,0,2514,2514,\"\\164\\171\\164\\243\\164\\184\",\"\\180\\182\\164\\184\",\"\\180\\182\\164\\184\",\"\\165\\171\\165\\243\\165\\184\",4,\"\",\"\",-1",0;"1,2,0,0,3095,3095,\"\\164\\171\\164\\243\\164\\184\",\"\\180\\193\\187\\250\",\"\\180\\193\\187\\250\",\"\\165\\171\\165\\243\\165\\184\",4,\"\",\"\",-1",0;] といったように、~/.manadic の gdbm ファイルにおいて、「かんじ」 の key に対する content が登録されていると思います。この content の意味はどうやって解釈すればよいでしょうか。\"....\" の中身は euc-jp 文字列で良いと思うのですが、以下の点がわかりません。 1. 最初の 2, は何を意味するのか? 2. 次に続く 1,2,0,0,2514,2514 の意味は? 3. その後の文字列の最初は、読みでいいと思うのですが、そのあとに 続く文字列の順番はどういった意味があるのでしょう? 例えば「感じ」 だと「かんじ」の読みのあとに「感じ」、「感じ」、「カンジ」、 4、""、""、-1 と続き、0;、 次に 1,2,0,0,3095,3095 とあり、 読みの 「かんじ」、「漢字」、「漢字」、「カンジ」、4、""、""、 -1 があり、最後に 0; となります。 mana のソースをきちんと見ずに書いていますが、よろしくお願いします。 -- Etsushi Kato ek.ka****@gmail*****