[Anthy-dev 3335] Re: anthy-8300:「したかった」が「死たかった」になる

Back to archive index

Jun Oizumi vagus****@gmail*****
2007年 1月 29日 (月) 18:48:48 JST


大泉です。

> 掲題のとおり、8300 で、「話が死たかった」等、「したかった」が「死たかった」となります。
>
> 候補を見ると他に「資たかった」「弑たかった」がありますので、サ変動詞の候補のようです。
> (cannadic改でのエントリ
> し #SX 302 死
> し #SX 301 資
> し #SX 300 し
> し #SX 300 弑
> )
>
> しかし、「サ変動詞+たかった」であれば「死"し"たかった」等となるはずで、「死たかった」は
> ありえないと思います。
> (ちなみに「死したかった」は正しく出ます)

この件ですが、直してみました。

原因:
 サ変には語幹そのものが変化する「する」と語幹の変化しないそれ以外のもの(激する、画する等)
 があるが anthy ではどちらも CC_SV という同じ品詞コードを使っているため、たまたま語幹が
 「し」であった「死する」等は「する」と区別がつけられなかった。
 (「する」と同一に扱われるため「死たかった」の他にも「死よう」「死やすい」「死つづける」
 「死まい」などが候補に挙がって来ていた)
 (カ変は実質的に「来る」しかないのでこういう問題は生じない)

対処:
 「する」を別品詞にしてそれ以外のサ変動詞を区別して扱えるようにする

 1. mkworddic/extra.t に「する」連用形の「し」を"sxi2"という新しいコードで追加
   し #sxi2*400 し
   ※他の活用型は cannadic にある。
 2. include/wtype.h に「する」用の品詞コード "CC_SRV" を追加(名前は適当です)
 3. src-worddic/ptab.h と src-worddic/wtab.h に定義
 4. depgraph/ 以下の必要なファイルを修正

こんな感じです。詳細は diff を見てください。
よく分からずに勘でやっているだけなので、おかしなところは適宜修正願います。
(一応手元では今のところちゃんと動いているように見えますが)。

※depgraph/indepword.txt の

  -動詞丁寧表現語幹 8 @動詞丁寧表現語幹

 は103行目と重複していたようだったのでついでに削りました。

※wtab.h では動詞は「オプション」の部分が「WF_INDEP」となっているのに、
 ptab.h では「WF_NONE」になっているのはいいのでしょうか?


fix_sahen.diff
---------------------------------------------------------------
diff -urN anthy-8528/depgraph/conjugate.table
anthy-8528.new/depgraph/conjugate.table
--- anthy-8528/depgraph/conjugate.table	2006-05-13 18:29:09.000000000 +0900
+++ anthy-8528.new/depgraph/conjugate.table	2007-01-29 16:00:47.000000000 +0900
@@ -294,7 +294,6 @@
 #
 #
 @サ変活用動詞語幹 "し" @動詞未然形SI
-@する未然形「し」 "" @動詞未然形SI
 @サ変活用動詞語幹 "せ" @動詞未然形SE
 @サ変活用動詞語幹 "さ" @動詞未然形SA
 @サ変活用動詞語幹 "し" @動詞連用形D
@@ -306,6 +305,13 @@
 @サ変活用動詞語幹 "しろ" @動詞命令形
 #
 #
+@する未然形「し」 "" @動詞未然形SI
+@する未然形「せ」 "" @動詞未然形SE
+@する連用形「し」 "" @動詞連用形D
+@する命令形「せよ」 "" @動詞命令形_
+@する命令形「しろ」 "" @動詞命令形
+#
+#
 @ザ変活用動詞語幹 "じ" @動詞未然形SI
 @ザ変活用動詞語幹 "ざ" @動詞未然形SE
 @ザ変活用動詞語幹 "ざ" @動詞未然形SA
diff -urN anthy-8528/depgraph/indepword.txt
anthy-8528.new/depgraph/indepword.txt
--- anthy-8528/depgraph/indepword.txt	2006-12-20 18:26:41.000000000 +0900
+++ anthy-8528.new/depgraph/indepword.txt	2007-01-29 16:04:22.000000000 +0900
@@ -77,7 +77,6 @@
 カ変活用動詞終止形 12 @カ変活用動詞終止形
 カ変活用動詞仮定形 12 @カ変活用動詞仮定形
 カ変活用動詞命令形 12 @カ変活用動詞命令形
-動詞丁寧表現語幹 8 @動詞丁寧表現語幹
 #
 カ行5段活用動詞名詞化語幹 16 @カ行5段活用動詞名詞化語幹
 カ行C5段活用動詞名詞化語幹 16 @カ行C5段活用動詞名詞化語幹
@@ -94,6 +93,10 @@
 上下一段活用動詞名詞化語幹 16 @上下一段活用動詞名詞化語幹
 #
 する未然形「し」 12 @する未然形「し」
+する未然形「せ」 12 @する未然形「せ」
+する連用形「し」 12 @する連用形「し」
+する命令形「せよ」 12 @する命令形「せよ」
+する命令形「しろ」 12 @する命令形「しろ」
 #
 形容詞語幹 12 @形容詞語幹
 形容動詞語幹 12 @形容動詞語幹
diff -urN anthy-8528/depgraph/v.depword anthy-8528.new/depgraph/v.depword
--- anthy-8528/depgraph/v.depword	2007-01-28 07:52:08.000000000 +0900
+++ anthy-8528.new/depgraph/v.depword	2007-01-29 16:00:47.000000000 +0900
@@ -19,14 +19,11 @@
 #
 #動詞「する」の未然形
 #
-@動詞未然形SI "" SyCy@ @ない @まい @たい @がち @よう(手段)
-@動詞未然形SI "" @さえ @に(動詞後) @きる @つづける @つつ
-#これ連用形らしい
+@動詞未然形SI "" SyCy@ @ない @まい @よう(手段)
 @動詞未然形SI "て" @ない @たり @いる @みる @くる @ます
 @動詞未然形SI "て" @しまう @もらう @おく @あげる @
 @動詞未然形SI "よう" Se@ Se@間投助詞 @か? @や @と(引用)
 @動詞未然形SI "よう" @とする
-@動詞未然形SI "" @た(助動詞) @たり @やすい @にくい @まくる
 @動詞未然形SE "" @ぬ
 @動詞未然形SE "ね" @ば
 @動詞未然形SA "" @せる @れる
@@ -38,7 +35,7 @@
 @動詞連用形D "" @やすい @にくい @て @きる @つづける
 @動詞連用形D "" @ながら @まくる @そびれる @すぎる @うる @がち @やがる
 @動詞連用形D "" @たい @たがる @ます @そうだ @なさる @に(動詞後) @つつ
-@動詞連用形D "" @連用形接続-接続助詞 @た(助動詞)
+@動詞連用形D "" @連用形接続-接続助詞 @た(助動詞) @たり @やすい @にくい @まくる
 #
 # 「書き たい」
 @動詞連用形5 "" .HvCySy@ @かけ @がち @よう(手段) @さえ @がてら
diff -urN anthy-8528/include/wtype.h anthy-8528.new/include/wtype.h
--- anthy-8528/include/wtype.h	2007-01-19 02:24:38.000000000 +0900
+++ anthy-8528.new/include/wtype.h	2007-01-29 16:00:47.000000000 +0900
@@ -71,6 +71,7 @@
 #define CC_A 18
 #define CC_A_U 19
 #define CC_AJV 20
+#define CC_SRV 21

 /* 副品詞 Class Of Speech */
 #define COS_NONE 0
diff -urN anthy-8528/mkworddic/extra.t anthy-8528.new/mkworddic/extra.t
--- anthy-8528/mkworddic/extra.t	2007-01-21 12:32:38.000000000 +0900
+++ anthy-8528.new/mkworddic/extra.t	2007-01-29 16:00:47.000000000 +0900
@@ -528,6 +528,7 @@
 #
 かんじが #SX 感じが
 じ #JS*2 時
+し #sxi2*400 し
 #
 ! #KJ !
 " #OPEN " #CLOSE "
diff -urN anthy-8528/src-worddic/ptab.h anthy-8528.new/src-worddic/ptab.h
--- anthy-8528/src-worddic/ptab.h	2006-12-20 18:12:01.000000000 +0900
+++ anthy-8528.new/src-worddic/ptab.h	2007-01-29 16:00:47.000000000 +0900
@@ -125,7 +125,11 @@
 {"カ変活用動詞仮定形",POS_V,COS_NONE,SCOS_NONE,CC_KV,CT_KATEI,WF_NONE},
 {"カ変活用動詞命令形",POS_V,COS_NONE,SCOS_NONE,CC_KV,CT_MEIREI,WF_NONE},
   /**/
-{"する未然形「し」",POS_V,COS_NONE,SCOS_NONE,CC_SV,CT_MIZEN,WF_NONE},
+{"する未然形「し」",POS_V,COS_NONE,SCOS_NONE,CC_SRV,CT_MIZEN,WF_NONE},
+{"する未然形「せ」",POS_V,COS_NONE,SCOS_NONE,CC_SRV,CT_MIZEN,WF_NONE},
+{"する連用形「し」",POS_V,COS_NONE,SCOS_NONE,CC_SRV,CT_RENYOU,WF_NONE},
+{"する命令形「しろ」",POS_V,COS_NONE,SCOS_NONE,CC_SRV,CT_MEIREI,WF_NONE},
+{"する命令形「せよ」",POS_V,COS_NONE,SCOS_NONE,CC_SRV,CT_MEIREI,WF_NONE},
   /**/
 {"形容詞",POS_A,COS_NONE,SCOS_A0,CC_NONE,CT_NONE,WF_NONE},
 {"形容詞化接尾語",POS_D2KY,COS_NONE,SCOS_A1,CC_NONE,CT_NONE,WF_NONE},
diff -urN anthy-8528/src-worddic/wtab.h anthy-8528.new/src-worddic/wtab.h
--- anthy-8528/src-worddic/wtab.h	2006-05-13 18:29:09.000000000 +0900
+++ anthy-8528.new/src-worddic/wtab.h	2007-01-29 16:00:47.000000000 +0900
@@ -144,8 +144,12 @@
 {"#kxure",POS_V,COS_NONE,SCOS_NONE,CC_KV,CT_KATEI,WF_INDEP /* "カ変動詞(くれ)"*/},
 {"#kxuru",POS_V,COS_NONE,SCOS_NONE,CC_KV,CT_SYUSI,WF_INDEP /* "カ変動詞(くる)"*/},
 {"#kxya",POS_V,COS_NONE,SCOS_NONE,CC_KV,CT_NONE,WF_INDEP  /* "カ変動詞(くりゃ)"*/},
-{"#sxi",POS_V,COS_NONE,SCOS_NONE,CC_SV,CT_MIZEN,WF_NONE},
-{"#sxiro",POS_V,COS_NONE,SCOS_NONE,CC_SV,CT_MEIREI,WF_NONE},
+  /* サ変「する」 */
+{"#sxi",POS_V,COS_NONE,SCOS_NONE,CC_SRV,CT_MIZEN,WF_INDEP   /* "する未然形(し)"*/},
+{"#sxe",POS_V,COS_NONE,SCOS_NONE,CC_SRV,CT_MIZEN,WF_INDEP   /* "する未然形(せ)"*/},
+{"#sxi2",POS_V,COS_NONE,SCOS_NONE,CC_SRV,CT_RENYOU,WF_INDEP   /* "する連用形(し)"*/},
+{"#sxiro",POS_V,COS_NONE,SCOS_NONE,CC_SRV,CT_MEIREI,WF_INDEP   /*
"する命令形(しろ)"*/},
+{"#sxeyo",POS_V,COS_NONE,SCOS_NONE,CC_SRV,CT_MEIREI,WF_INDEP   /*
"する命令形(せよ)"*/},
   /* 独自拡張 */
 {"#NONE",POS_INVAL,COS_NONE,SCOS_NONE,CC_NONE,CT_NONE,WF_NONE},
 {"#N04",POS_NUMBER,COS_NN,SCOS_N1,CC_NONE,CT_NONE,WF_NONE},/*いち、に、さん…*/



Anthy-dev メーリングリストの案内
Back to archive index