Forums: users (Thread #6563)

UTF-8がうまく処理できない? (2004-12-09 18:02 by Anonymous #12130)

charset="UTF-8"のものは、常に、
X-Spam-Probability: 0.500000
となってしまうようなのですが?
該当SPAMの本文はプレーンな英文です。

bsfilterのバージョンは、1.0.3で、
もちろん、--disable-utf-8は付けていません。

Reply to #12130×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: UTF-8がうまく処理できない? (2004-12-09 23:58 by nabeken #12134)

CVSのrevision 1.67を試して下さい。

utf-8のメールは日本語と扱う、という仕様だっため、
utf-8な英文のメールも日本語データベースでチェックされ、
認識率が下がってしまうという現象が出たのだと思います。

小細工し、utf-8かつbase64 or quoted-printableっぽい
メールだったら日本語、という論理に変更しました。

P|LLSがどうこうというspamが、utf-8/text-plainで
来ているので、上のような仕様にしてみました。
Reply to #12130

Reply to #12134×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: UTF-8がうまく処理できない? (2004-12-10 21:18 by Anonymous #12140)

1.67を頂いてきて数時間経ちましたがいい感じです。
P|LLSだけに限らず、最近、text/plain; charset="UTF-8"な
Spamが異常に多いです。
Reply to #12130

Reply to #12140×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login