Develop and Download Open Source Software

Browse CVS Repository

Contents of /freewnn/FreeWnn/PubdicPlus/pod.jmn

Parent Directory Parent Directory | Revision Log Revision Log | View Revision Graph Revision Graph


Revision 1.1 - (show annotations) (download)
Sun Jan 16 07:06:08 2000 UTC (24 years, 3 months ago) by ura
Branch: MAIN
CVS Tags: freewnn-1-1-1-a009, freewnn-1-1-1-a023-1, freewnn-1-1-1-a008, freewnn-1-1-1-a012, freewnn-1-1-1-a013, freewnn-1-1-1-a010, freewnn-1-1-1-a011, freewnn-1-1-1-a016, freewnn-1-1-1-a017, freewnn-1-1-1-a014, freewnn-1-1-1-a015, freewnn-1-1-1-a023, freewnn-1-1-1-a022, freewnn-1-1-1-a021, freewnn-1-1-1-a020, freewnn-1-1-1-a022I002, freewnn-1-1-1-a018, HEAD
Branch point for: freewnn-1-1-1-a022I001
FreeWnn-1.1.1-a008 is released.

1 .\" -*-Mode: nroff-*-
2 .\" $Id: pod.jmn,v 1.5 1994/05/31 11:29:44 kon Exp $
3 .nr X 0
4 .if \nX=0 .ds X} pod 1 "日本語機能ユーティリティ" "\&"
5 .TH \*(X}
6 .SH "名前"
7 pod \- ポータブル辞書形式辞書の種々の操作を行うコマンド
8 .SH "形式"
9 .B "pod [\fIoptions\fP] \fIdic1\fP [\fIdic2\fP]"
10 .SH "説明"
11 .PP
12 .IB pod
13 はポータブル辞書形式の辞書の種々の操作を行うツールであり、辞書のソート、
14 ユニーク化、比較などを行います。
15 .PP
16 どのような処理が行われるかは指定する辞書の数と\fIoptions\fPに依存しま
17 す。
18 .PP
19 単一の辞書を指定すると指定された辞書\fIdic1\fPがソートされ、標準出力に
20 表示されます。表示される内容で、同一の行が複数現れることはありません。
21 読み、候補、品詞が同一であればたとえ頻度が異なっていても同一の行とみな
22 されます。
23 .PP
24 2つの辞書を指定するとその2つの辞書の間で項目の比較を行います。比較の
25 結果、\fIdic1\fP にのみ含まれる項目、\fIdic2\fP にのみ含まれる項目、
26 \fIdic1\fP および \fIdic2\fP に共通に含まれる項目に分類されます。分類
27 された項目は\fIoptions\fPの指定により、定められた場所に出力されます。
28 .PP
29 \fIdic1\fP あるいは \fIdic2\fP として \- を指定することができ、その場
30 合にはファイルの代わりに標準入力が参照されます。\fIdic1\fP および
31 \fIdic2\fP の両方同時に \- を指定することはできません。
32 .PP
33 コマンドアーギュメントは \fIdic1\fP\fIdic2\fP の出現順以外
34 は順番を問いません。\fIoptions\fP は辞書の指定の後に現れてもかまいませ
35 ん。
36 .SH "オプション"
37
38 .IP "\-1" 12
39 ソースとなる辞書の品詞フィールドがスラッシュ(/)で区切られているとき、
40 pod の出力としては一番左のフィールドに記述された品詞のみを選択して出力
41 するようにします。
42
43 .IP "\-2" 12
44 ソースとなる辞書の品詞フィールドがスラッシュ(/)で区切られているとき、
45 pod の出力としては真ん中のフィールドに記述された品詞のみを選択して出力
46 するようにします。
47
48 .IP "\-3" 12
49 ソースとなる辞書の品詞フィールドがスラッシュ(/)で区切られているとき、
50 pod の出力としては一番右のフィールドに記述された品詞のみを選択して出力
51 するようにします。
52
53 .IP "\-b \fIkind\fP" 12
54 出力するエントリのすべての行に \fIkind\fP で示した種類フィールドを付加
55 します。
56
57 .IP "\-c \fIfile\fP" 12
58 \fIdic1\fP および \fIdic2\fP に共通に含まれる項目がファイル \fIfile\fP
59 に出力されます。ファイル名として \- を指定すると標準出力に出力されます。
60
61 .IP "\-d \fIfile\fP" 12
62 \fIfile\fP に使われているルールを使って、各エントリを終止形に直します。
63
64 .IP "\-f" 12
65 頻度値をコピーします(どこからどこへ?)。
66
67 .IP "\-h" 12
68 上記の比較の際、品詞の違いを違いとみなしません。\fIdic1\fP
69 \fIdic2\fP において読みと候補が同一の項目は項目全体が同一であるとみな
70 されます。
71
72 .IP "\-i" 12
73 出力形式として『かんな』のテキスト辞書形式で出力を行います。
74
75 .IP "\-j" 12
76 カタカナだけからなるエントリを抽出し出力します。
77
78 .IP "\-k \fIkind\fP"
79 出力するエントリとしては、\fIkind\fP で示された種類フィールドを持った
80 ものだけを出力します。
81
82 .IP "\-l"
83 種類フィールドとしてどのようなものが存在するかのリストを出力します。辞
84 書の出力は行われません。
85
86 .IP "\-m"
87 2つの辞書の比較を行う際に、種類フィールドのみが違うエントリに関しては
88 同一のエントリとして \-c で示された出力先に対して出力します。その際に
89 2つの辞書におけるそれぞれの種類フィールドをマージして出力します。
90
91 .IP "\-n \fIfile\fP" 12
92 \fIdic2\fP にのみ含まれる項目がファイル \fIfile\fP に出力されます。ファ
93 イル名として \- を指定すると標準出力に出力されます。
94
95 .IP "\-o \fIfile\fP" 12
96 \fIdic1\fP にのみ含まれる項目がファイル \fIfile\fP に出力されます。ファ
97 イル名として \- を指定すると標準出力に出力されます。
98
99 .IP "\-p" 12
100 ソートは通常、ポータブル辞書形式をテキストファイルとみなして、sort(1)
101 コマンドに与えたときと同じ順序となるように行われますが、\-p オプション
102 を与えた場合は、同一の読みに対しては頻度の大きいものほど先に現れるよう
103 にソートします。頻度が同じ値である場合にはその他の部分の sort(1) 順に
104 したがいます。
105
106 .IP "\-r \fItranslation_table\fP" 12
107 \-s と同様に品詞名の付け替えを行いますが、\fItranslation_table\fP に記
108 述されている規則を逆に適用します。すなわち、\-s の場合と逆の変換を行い
109 ます。
110
111 .IP "\-s \fItranslation_table\fP" 12
112 品詞名付け替えファイル \fItranslation_table\fP に記述されている規則に
113 したがって品詞名の付け替えを行います。品詞名付け替えファイルは、各行が、
114 元の品詞、付け代わる品詞、の組みから構成されているファイルです。
115 \fIdic1\fP および \fIdic2\fP にて使われている品詞名の付け替え規則が
116 \fItranslation_table\fP に見つからない場合にはエラーを発生し処理が中断
117 します。
118
119 .IP "\-v" 12
120 出力形式として SJ3 のビジュアル形式辞書で出力を行います。
121
122 .IP "\-w" 12
123 出力形式として Wnn のテキスト形式辞書で出力を行います。
124
125 .IP "\-x" 12
126 SJ3 とマージします(本当か?)。
127
128 .SH "使用例"
129 .IP (1) 4
130 辞書 foo.p の内容をソートし表示します。
131 .sp
132 .ft CW
133 .nf
134 % pod foo.p
135 .fi
136 .ft
137 .sp
138 .IP (2) 4
139 辞書 foo.p および bar.p をマージし、ソートし出力します。
140 .sp
141 .ft CW
142 .nf
143 % cat foo.p bar.p | pod -
144 .fi
145 .ft
146 .sp
147 .IP (3) 4
148 辞書 foo.p について、同一の読みについては頻度の大きい順にソートして出
149 力します。
150 .sp
151 .ft CW
152 .nf
153 % pod foo.p -p
154 .fi
155 .ft
156 .sp
157 .IP (4) 4
158 辞書 foo.p から foo.p.new への変更を、削除された分についてはファイル名
159 del のファイルに、追加された分についてはファイル名 add のファイルに出
160 力することにより差分を求めます。
161 .sp
162 .ft CW
163 .nf
164 % pod foo.p foo.p.new -o del -n add
165 .fi
166 .ft
167 .sp
168 .IP (5) 4
169 辞書 foo.p からファイル del に含まれる項目を削除し、ファイル add に含
170 まれる項目を追加し、foo.p.new に出力します。
171 .sp
172 .ft CW
173 .nf
174 % (cat add ; pod foo.p del -o -) | pod - > foo.p.new
175 .fi
176 .ft
177 .sp
178 .IP (6) 4
179 辞書 bar.p に含まれている各項目に一致する項目を、たと
180 え品詞が異なっていてもよいから辞書 foo.p から抽出し標準出力に出力します。
181 .sp
182 .ft CW
183 .nf
184 % pod -h foo.p bar.p -c -
185 .fi
186 .ft
187 .sp
188 .IP (7) 4
189 辞書 foo.p の品詞名を品詞変更テーブルファイル wc.tab をベースに変更しま
190 す。
191 .sp
192 .ft CW
193 .nf
194 % pod -s wc.tab foo.p
195 .fi
196 .ft
197 .sp
198 .IP (8) 4
199 辞書 pubdic.p から、種別フィールドとして bio が記述されているエントリ
200 のみを bio.p と言うファイルに取り出します。
201 .sp
202 .ft CW
203 .nf
204 % pod -k bio pubdic.p > bio.p
205 .fi
206 .ft
207 .sp
208 .IP (9) 4
209 辞書 pubdic.p から、種別フィールドとして bio が記述されているエントリ
210 のみを取り出し、さらに品詞も Wnn のものを選択し Wnn のテキスト辞書形式
211 で取り出します。変換結果を bio.uに出力します。
212 .sp
213 .ft CW
214 .nf
215 % pod -k bio pubdic.p -w -1 > bio.u
216 .fi
217 .ft
218 .sp
219 .IP (10) 4
220 Wnn の辞書 bio.u の各エントリに種別を表す bio と言う種別フィールドを付
221 加し、出力します。
222 .sp
223 .ft CW
224 .nf
225 % pod -b bio bio.u
226 .fi
227 .ft
228 .sp
229 .IP (11) 4
230 辞書 pubdic.p と special.p をマージし、頻度でソートし、『かんな』の品
231 詞を選択し、『かんな』のテ
232 キスト辞書形式で iroha.t と言うファイルに出力します。
233 .sp
234 .ft CW
235 .nf
236 % cat pubdic.p special.p | pod - -p -i -2 > iroha.t
237 .fi
238 .ft
239 .sp
240 .IP (12) 4
241 辞書 pubdic.p と special.p をマージし、頻度でソートし、SJ3 の品詞を選
242 択し、SJ3 のビジュアル辞書形式で visual.dic と言うファイルに出力します。
243 .sp
244 .ft CW
245 .nf
246 % cat pubdic.p special.p | pod - -p -v -3 > visual.dic
247 .fi
248 .ft
249 .sp
250 .SH "バグ"
251 エラーチェックをあまりしていません。辞書をいったんメモリ上に読み込むの
252 でメモリをかなり消費します。\-s オプション、\-r オプションに関しては仕
253 様の変更を行う予定です。
254 .PP
255 頻度だけが異なる項目の削除のしかたに法則性がありません。これは法則性を
256 持たせるように仕様を変更する予定です。
257 .SH "関連情報"
258 ctop(1), ptoc(1)

Back to OSDN">Back to OSDN
ViewVC Help
Powered by ViewVC 1.1.26