Ikumi Keita
ikumi****@rever*****
2004年 9月 28日 (火) 21:42:34 JST
井汲です。新しい郵便番号辞書を試す時間がとれたのですが、 dic/ideo/words/Imakefile の #ifdef USE_OBSOLETE_STYLE_FILENAME CBD = d CLD = fq #else CBD = cbd CLD = cld #endif の行頭が TAB になっていたため、make しようとするとエラーになってしまいま す(環境依存?)。 TAB をスペースに置き換えると make が通りました。 それから、zipcode.t、jigyosho.t ともに品詞が #CN になっているのですが、 以下に引用する[Canna-dev 166]の狩野さんの投稿を見ると、#CNS の方がいいの ではないでしょうか。(jigyosho.t の方は #KK の方がさらによい?とは言え、 住所を含んでいるから「固有名詞」とは言い難くて、やっぱり「地名」と見なす べきか) > 1) 商品名だから。 > #KK はもともと会社名を意図してつけられた名前だったのでしょうが、 > 現在の分類体系では、地名・人名に分類されない固有名詞すべてを含む > ことになっています。商品名・商標名もこの中に入ります。 > 「イーサネット」が #KK になっているのは、富士ゼロックスの > 登録商標だからだと思います。 > 2) 地名にすると接尾語がついてうっとうしいから > #CN は市町村名が典型的で、昔は「市」「町」などの地名用の接尾語 > (#CNSUC) が接尾語として後ろについて一文節を構成するようになって > いました。デフォルトの付属語辞書には入っていませんので > (use-dictionary) に "suffix" を入れないと有効になりません。 > [Canna 1148] (93/07/18) で #CNS という、接尾語付きの地名 > (「北海道」とか) を表すための品詞が作られましたが、それ以前は > 「英国町」などが出てくるのを避けるには #KK にするしか無かったのが > 原因かもしれません。当初の pubdic からの単語でしたら、Wnn3 の > 品詞分類とその扱いが影響しているものと思います。 > ゆくゆくは、細目を決めて再分類をするべきだと思います。 ※ 細かいことなのですが、jigyosyo という名前は、「ji」がヘボン式なのに 「syo」が訓令式で、ちょっとちぐはぐなのが気になってます…。 井汲 景太