Forums: users (Thread #12303)

Subjectヘッダの ja/en 判定への影響 (2006-09-12 09:45 by Anonymous #24847)

水口です。 お世話になります。

先日から、あるメールサーバーに受信したメールにSpam判定が入る様になりました。

それ自体は良いのですが、問題は、Spam と判定したメッセージの Subjectヘッダーに日本語文字列を付加することです。 (=?iso-2022-jp?B?... の形式です)

その結果、「Subjectヘッダーに日本語文字を含み、それ以外は含まない Spamメッセージ」が少なからず発生することになります。

bsfilter は、そのメッセージを「lang ja header char_ja」 として clean と判定するケースが少なからずあります。

bsfilter の 日本語DB が英単語を学習するのを待てば良いんでしょうか? あるいは、別の解決法は無いでしょうか?

# 該当メッセージは全て learn-spam(-s -C) していますが、1~2 回では効果が無い(相変らずclean判定される)メッセージが時々あります。


連発ですみません。


Reply to #24847×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: Subjectヘッダの ja/en 判定への影響 (2006-09-13 01:35 by nabeken #24858)

簡単な解決方法が思い浮かびません。

同じ字面のtokenでも言語によってspam確率は異なるだろう、ということで、言語ごとにデータベースを持っているのですが、失敗だった気がします。
Reply to #24847

Reply to #24858×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: Subjectヘッダの ja/en 判定への影響 (2006-09-19 15:25 by Anonymous #24976)

水口です。 ありがとうございます。

日本語 Subject のせいで誤判定される英文Spamは結構多くて煩わしいです。

そこで、--export-spam の出力から C を選別して ja に置換したものを --import-spam したらどうかと考えているのですが、それで理屈は合いますでしょうか?
Reply to #24858

Reply to #24976×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: Subjectヘッダの ja/en 判定への影響 (2006-09-21 23:50 by nabeken #25029)

その方法で問題ありません。

-Hなどでヘッダを無視する設定にしても、ヘッダを見て言語の判定をしているのはバグだと思いますので、これは修正予定です。
Reply to #24976

Reply to #25029×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login