Download
Magazine
Develop
Account
Download
Magazine
Develop
Login
Forgot Account/Password
Create Account
Language
Help
Language
Help
×
Login
Login Name
Password
×
Forgot Account/Password
Category:
Software
People
PersonalForge
Magazine
Wiki
Search
OSDN
>
Find Software
>
Communications
>
Email
>
Filters
>
bsfilter
>
Forums
>
users
>
Subjectヘッダの ja/en 判定への影響
bsfilter
Description
Project Summary
Developer Dashboard
Developers
Image Gallery
List of RSS Feeds
Activity
Statistics
History
Downloads
List of Releases
Stats
Source Code
Code Repository list
CVS
View Repository
Ticket
Ticket List
Milestone List
Type List
Component List
List of frequently used tickets/RSS
Submit New Ticket
Documents
FrontPage
Title index
Recent changes
Communication
List of Forums
users (627)
Forums:
users
(Thread #12303)
Return to Thread list
RSS
Subjectヘッダの ja/en 判定への影響 (2006-09-12 09:45 by
Anonymous
#24847)
Reply
Create ticket
水口です。 お世話になります。
先日から、あるメールサーバーに受信したメールにSpam判定が入る様になりました。
それ自体は良いのですが、問題は、Spam と判定したメッセージの Subjectヘッダーに日本語文字列を付加することです。 (=?iso-2022-jp?B?... の形式です)
その結果、「Subjectヘッダーに日本語文字を含み、それ以外は含まない Spamメッセージ」が少なからず発生することになります。
bsfilter は、そのメッセージを「lang ja header char_ja」 として clean と判定するケースが少なからずあります。
bsfilter の 日本語DB が英単語を学習するのを待てば良いんでしょうか? あるいは、別の解決法は無いでしょうか?
# 該当メッセージは全て learn-spam(-s -C) していますが、1~2 回では効果が無い(相変らずclean判定される)メッセージが時々あります。
連発ですみません。
Reply to #24847
×
Subject
Body
Reply To Message #24847 > 水口です。 お世話になります。 > > 先日から、あるメールサーバーに受信したメールにSpam判定が入る様になりました。 > > それ自体は良いのですが、問題は、Spam と判定したメッセージの Subjectヘッダーに日本語文字列を付加することです。 (=?iso-2022-jp?B?... の形式です) > > その結果、「Subjectヘッダーに日本語文字を含み、それ以外は含まない Spamメッセージ」が少なからず発生することになります。 > > bsfilter は、そのメッセージを「lang ja header char_ja」 として clean と判定するケースが少なからずあります。 > > bsfilter の 日本語DB が英単語を学習するのを待てば良いんでしょうか? あるいは、別の解決法は無いでしょうか? > > # 該当メッセージは全て learn-spam(-s -C) していますが、1~2 回では効果が無い(相変らずclean判定される)メッセージが時々あります。 > > > 連発ですみません。 > >
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel
RE: Subjectヘッダの ja/en 判定への影響 (2006-09-13 01:35 by
nabeken
#24858)
Reply
Create ticket
簡単な解決方法が思い浮かびません。
同じ字面のtokenでも言語によってspam確率は異なるだろう、ということで、言語ごとにデータベースを持っているのですが、失敗だった気がします。
Reply to
#24847
Reply to #24858
×
Subject
Body
Reply To Message #24858 > 簡単な解決方法が思い浮かびません。 > > 同じ字面のtokenでも言語によってspam確率は異なるだろう、ということで、言語ごとにデータベースを持っているのですが、失敗だった気がします。
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel
RE: Subjectヘッダの ja/en 判定への影響 (2006-09-19 15:25 by
Anonymous
#24976)
Reply
Create ticket
水口です。 ありがとうございます。
日本語 Subject のせいで誤判定される英文Spamは結構多くて煩わしいです。
そこで、--export-spam の出力から C を選別して ja に置換したものを --import-spam したらどうかと考えているのですが、それで理屈は合いますでしょうか?
Reply to
#24858
Reply to #24976
×
Subject
Body
Reply To Message #24976 > 水口です。 ありがとうございます。 > > 日本語 Subject のせいで誤判定される英文Spamは結構多くて煩わしいです。 > > そこで、--export-spam の出力から C を選別して ja に置換したものを --import-spam したらどうかと考えているのですが、それで理屈は合いますでしょうか?
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel
RE: Subjectヘッダの ja/en 判定への影響 (2006-09-21 23:50 by
nabeken
#25029)
Reply
Create ticket
その方法で問題ありません。
-Hなどでヘッダを無視する設定にしても、ヘッダを見て言語の判定をしているのはバグだと思いますので、これは修正予定です。
Reply to
#24976
Reply to #25029
×
Subject
Body
Reply To Message #25029 > その方法で問題ありません。 > > -Hなどでヘッダを無視する設定にしても、ヘッダを見て言語の判定をしているのはバグだと思いますので、これは修正予定です。
You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.)
Login
Nickname
Preview
Post
Cancel