実際、私は現在bsfilterを--refer-headerオプションなしで使用していますが、本文などに既知情報が殆どなくほぼ確率0.5ですり抜けてきてしまうspamの中に、無視しているヘッダには特徴が見て取れるものもあるように思います。
"Better Bayesian Filtering"にも
"There is a lesson here for filter writers: don't ignore data."
とあります。
# "authentication-results", "domainkey-signature"
headers.each do |header, content|
- if (@options["refer-all-header"] || @options["refer-header"][header])
+ if ( (@options["refer-all-header"] && (not @options["ignore-header"][header])) || @options["refer-header"][header] )
if (lang == "ja")
content.gsub!(/=\?utf\-8\?([bq])\?(\S*)\?=/i) do |s|
b_or_q = $1
@@ -2088,7 +2088,12 @@
--refer-all-header
refer all headers of mails
- --ignore-header|-H
+ --ignore-header header[,header...]
+ ignore specified headers of mails
+ (use with --refer-all-header)
+ "" by default
+
+ --ignore-all-header|-H
ignore headers of mails
same as --refer-header ""