[Anthy-dev 3451] Re: gtankan.ctd の活用形を持つ単語

Back to archive index

Hideyuki SHIRAI ( 白井秀行 ) shira****@meado*****
2007年 3月 28日 (水) 17:09:25 JST


白井です。

# もとのメール、二通行っちゃってごめんなさい。いろいろと理由はあ
# るのですが、省略 (__)

From: "Jun Oizumi" <vagus****@gmail*****> さん曰く
Subject: [Anthy-dev 3450] Re: gtankan.ctd の活用形を持つ単語
Message-ID: <e5d38****@mail*****>
Date: Wed, 28 Mar 2007 01:19:17 +0900

> ご不便をお掛けしております。

いえいえ、全然 OK ですから。

> この問題自体は以前から認識しておりましたが、
> [Anthy-dev 3061]
> http://lists.sourceforge.jp/mailman/archives/anthy-dev/2006-July/003060.html
> 最近の anthy では単漢字の候補は後ろの方に回されるので、当面はそれでよしとしていました。

単漢字が後ろに回っても、ひらがな、カタカナより前なのですよねぇ。
という問題はあります。

> もし「そもそも候補に出したくない、しかも今すぐに」ということであれば、以前使っていた逃げの手
> ですが、
> 
>  $ mv gtankan.ctd gtankan.ctd.orig
>  $ sed 's/^\([^ ]\+\) /\1: /' gtankan.ctd.orig > gtankan.ctd
> 
> 単漢字は「読み:」と読みに「:」をつけて出すようにする、という方法があります。

内海さんの公開されている辞書ファイルの方法ですね。ぼくは『`』を
つけて使っていたことがあります。

> 以上はあくまで「その場しのぎ」の方法です。

はい。

> ちなみに、
> 
> > gtankan.ctd は組み込まない
> 
> というのは、一時的にせよ、マズイのではないかと思います。
> 記号などはほとんどすべて gtankan.ctd にありますし(base.t にある分は出せますが)、
> 漢字も結構 gtankan.ctd に頼っています。
> 例えば「婚」や「懇」を単独で出したくて「こん」と入力して変換しても、gtankan.ctd がないと
> どちらも出てこないはずです(「婚姻」「懇意」と変換してから「姻」や「意」を削るという手はあり
> ますが)。

おお、この問題は指摘されるまで気づきませんでした。なので、手元で
は『`』の方法を使っておきます。

> 問題となっているのは送り仮名も含めた読みで登録されているものだと思いますので、
> 
> > gtankan.ctd から活用しない物だけ抜き出す
> 
> のが、一番現実的と思います。
> ですので、取りあえずこの方向で行こうと思います。

> のように語幹と送り仮名の間に「-」を入れていきます。
> (ここまではいずれやろうと思っていたことですが、順番が早まりました ^^)。

とても大変な作業であるということは容易に想像できるのですが、よろ
しくお願いします。気長にお待ちしています。

> ただ、理想を言えば、以前
> [Anthy-dev 3068]
> http://lists.sourceforge.jp/mailman/archives/anthy-dev/2006-July/003067.html
> で書かせていただいた通り、「通常の変換時には単漢字は含めない」「単漢字は別の変換モードで出す」
> というのができれば一番だとは思います。

この方法は、やっぱり「UI(という言い方で良いのかな)が対応しないと
いけない」という点がネックだと思います。UIM, scim, anthy.el, egg
みんな対応!という話になったら相当大変そうです ^^;;;

-- 
白井秀行 (mailto:shira****@meado*****)




Anthy-dev メーリングリストの案内
Back to archive index