[Canna-dev 319] Re: かんな用郵便番号辞書のメンテナンスについて

Back to archive index

Ikumi Keita ikumi****@rever*****
2004年 9月 28日 (火) 21:42:34 JST


  井汲です。新しい郵便番号辞書を試す時間がとれたのですが、
dic/ideo/words/Imakefile の

#ifdef USE_OBSOLETE_STYLE_FILENAME
                  CBD = d
                  CLD = fq
#else
                  CBD = cbd
                  CLD = cld
#endif

の行頭が TAB になっていたため、make しようとするとエラーになってしまいま
す(環境依存?)。
  TAB をスペースに置き換えると make が通りました。

  それから、zipcode.t、jigyosho.t ともに品詞が #CN になっているのですが、
以下に引用する[Canna-dev 166]の狩野さんの投稿を見ると、#CNS の方がいいの
ではないでしょうか。(jigyosho.t の方は #KK の方がさらによい?とは言え、
住所を含んでいるから「固有名詞」とは言い難くて、やっぱり「地名」と見なす
べきか)

> 1) 商品名だから。

> #KK はもともと会社名を意図してつけられた名前だったのでしょうが、
> 現在の分類体系では、地名・人名に分類されない固有名詞すべてを含む
> ことになっています。商品名・商標名もこの中に入ります。
> 「イーサネット」が #KK になっているのは、富士ゼロックスの
> 登録商標だからだと思います。

> 2) 地名にすると接尾語がついてうっとうしいから

> #CN は市町村名が典型的で、昔は「市」「町」などの地名用の接尾語
> (#CNSUC) が接尾語として後ろについて一文節を構成するようになって
> いました。デフォルトの付属語辞書には入っていませんので
> (use-dictionary) に "suffix" を入れないと有効になりません。

> [Canna 1148] (93/07/18) で #CNS という、接尾語付きの地名
> (「北海道」とか) を表すための品詞が作られましたが、それ以前は
> 「英国町」などが出てくるのを避けるには #KK にするしか無かったのが
> 原因かもしれません。当初の pubdic からの単語でしたら、Wnn3 の
> 品詞分類とその扱いが影響しているものと思います。

> ゆくゆくは、細目を決めて再分類をするべきだと思います。

※ 細かいことなのですが、jigyosyo という名前は、「ji」がヘボン式なのに
「syo」が訓令式で、ちょっとちぐはぐなのが気になってます…。

							井汲 景太



Canna-dev メーリングリストの案内
Back to archive index