Forums: POPFile 初学者専用 (Thread #15839)

マグネットの条件設定 (2007-08-18 23:33 by Anonymous #31432)

・条件設定に「ソース全体を対象に」「ヘッダを対象に」「本文を対象に」などを加える事は可能ですか?
・正規表現で条件設定を記述する事は可能ですか?
・不可能であれば、今後対応する予定はありますでしょうか?

よろしくお願いします。

Reply to #31432×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: マグネットの条件設定 (2007-08-19 10:51 by amatubu #31458)

> ・条件設定に「ソース全体を対象に」「ヘッダを対象に」「本文を対象に」などを加える事は可能ですか?

いいえ、できません。

> ・正規表現で条件設定を記述する事は可能ですか?

いいえ、できません。

> ・不可能であれば、今後対応する予定はありますでしょうか?

任意のヘッダでの振り分けについては、
http://sourceforge.net/tracker/index.php?func=detail&aid=1283430&group_id=63137&atid=502959
に要望があがっていますので、より必要性がはっきりし、それを
実現するコードを書く人があらわれれば可能となるかもしれません。

正規表現についても過去に何度か要望があったようですが、必要性が
わからないということで受け入れられていません。

・どういう場合にどのように必要な機能であること
・メールクライアントでなく POPFile で実現すべき機能であること

などが理解されないと、実現は難しいと思います。

以下は私の個人的な考えですが、

マグネットはあくまで、POPFile のベイジアンフィルタをバイパス
するための補助的な機能です。ヘッダの一部などの情報からメールを
振り分けるのはメールクライアントの役割ではないかと思います。

私はマグネットを全く使用していませんが、POPFile は 99.5% 以上
という分類精度を実現しています。
最初はホワイトリストのようなものがないと不安かなとも思いました
が、現実にはそのようなことはなく、少し学習させれば分類を
間違えることはほとんどありません。今も 0.5% くらいの確率で
分類を間違えるものがありますが、これらはほとんど、ホワイト
リストやブラックリストがあっても分類誤りを防げない
(初めて届くメールなのでヘッダなどの情報がない)ものばかりです。

参考:
http://popfile.sourceforge.net/wiki/jp:faq:whitelists
Reply to #31432

Reply to #31458×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: マグネットの条件設定 (2007-08-19 11:40 by Anonymous #31464)

「POPFileの守備範囲はここまで」と仰られると
ただなるほどと頷くばかりです。ありがとうございました。

以下余談となりますが、私としては
「この語句が現れたら確認するまでもないので
 spamとして選り分けるのでなく即削除する」
というより強い条件設定が欲しかったのです。
精度99.5%であっても、100%でありえない以上
spamの中から選り分け誤りを探す必要はありますので、
その前に明らかなspamを減らしたい、と思いまして。

もちろんメールクライアント側で対応していればと思い
すでに多少検索もしてみましたが、難しいようです。

それでは。
Reply to #31432

Reply to #31464×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

ブラックリストの有効性(RE: マグネットの条件設定) (2007-08-19 23:00 by amatubu #31482)

余談になりますが、

> 「この語句が現れたら確認するまでもないので
>  spamとして選り分けるのでなく即削除する」

という条件の語句を見つけるのは難しく、却って手間がかかる
アプローチなのではないかなと思います。
私も POPFile を使う前に同じような手法で spam を削除する
ことを試みていましたが、日々変わっていく spam に対応して
いくことは現実的ではないことに気がつきました。

結局のところ、「確実な語句」というのもありそうでない
わけで、その語句が使われなくなれば無意味になってしまう
わけです。
それを人力でなんとか追っていくよりも、メールの分析は
統計的な手法に任せてしまい、人間はメールの分類を正しく
教えてあげることだけに集中した方が全体的に見れば効率が
よいのではないか、と今は思っています。
Reply to #31464

Reply to #31482×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login