Forums: users (Thread #9154)

文字の言語名の出力が欲しい (2005-10-26 13:43 by Anonymous #17486)

spam判定をする時に文字コードの判別も行っていますよね。--insert-charsetみたいなオプションを指定すると、そのメールに含まれている実際の文字の言語名や文字コードをX-Spam-Charset: jaのように出力できませんか?実質、twだのzhだのkoだのruだののメールを受け取る事は無いのでそれらは無条件で振り分けて--add-spamするように設定できるかなとか思っています。

spamが正しくContent-Typeヘッダを付けてくれるのならいいのですけどそうじゃないので。

Reply to #17486×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: 文字の言語名の出力が欲しい (2005-11-03 22:20 by nabeken #17640)

言語の判別は、日本語とそれ以外の区別しか行っていません。"それ以外"をさらに分類するのは、現状、メリットがないので、拡張は考えていません。

言語ごとのtokenizerを実装する場合には検討しますが、その場合も最初は、韓、中あたりからになると思います。
Reply to #17486

Reply to #17640×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login