Outlook 2003 と Eudora 6J のスパム対策機能

2003年10月29日(水) by level
B ?
Tags: スパム

有名どころメーラ Outlook 2003 と Eudora 6J のスパム対策の記事が出ていた。

Outlook 2003: ZDNN アンカーデスク「Outlook 2003のスパム対策はどうなっているのか」より、Outlook 2003 について(Outlook Express ではない)

私は1カ月以上の間、複数のマシンでOutlook 2003をデフォルトのメールクライアントとして使ってきた。このソフトが非常に気に入ってしまい、ほかのスパム対策ツールをアンインストールしてしまったほどだ。

著者の環境では 95% の確率でスパムを認識したということで、なかなか性能はよさそうだ。Outlook も Mozilla 同様統計的手法を用いているらしく、しかも、初期状態でかなり洗練された統計データが設定されているようだ。しかし、記事を読む限り、ユーザの判定を学習することは行わないように読み取れる。しかしそれでは、ユーザごとの異なるスパム判定基準が壁となって高い判定率を得ることは難しいように思う。これは著者の勘違いではないだろうか。なお、Outlook のスパム判定技術については後日詳細なレポートがあるそうなので期待しよう。

Outlook 2003 にはまた「HTMLメールをデフォルトで表示しない機能」も追加になっている。確かこの人は以前、「それは止めてくれ」とマイクロソフトに嘆願していた人だ。

ZDNN:アンカーデスク「Office 2003――6つ(あるいはそれ以上!)の版のどれを選ぶか
この機能はスパム対策の1つとされるものだが、これでは受け手が実際に受信したいコンテンツもめちゃくちゃになってしまう。この機能がOffice 2003のファイナルビルドで採用されようとされまいと、大量のジャンクメールをメールボックスに送りつける不届き者がその行為をやめることはないだろう。あまり役立ちそうにないこの機能をめぐって、私は今、Microsoftにかけあっている。

結局、

だがこの機能は、AnchorDeskのニュースレターや、私が受信を希望しているNew York Times、BBC Newsなどの画像が含まれるメールからグラフィック要素を取り除いてしまう。これらのメールの送信元をセーフリストに追加する(この操作は電子メール内またはプレビューペインでできる)と、画像を表示できるようになる。

ということで、著者の満足のいくものであったのだろう。このホワイトリスト、Mozilla にも欲しいところだ。きっとバグがあるだろうと思ったらやっぱりあった(172184)。ちなみに、なぜ HTML メールがいけないのかは、例えば、高木浩光@茨城県つくば市 の日記「HTMLメールマガジンをどうするか」をどうぞ。

Eudora 6J:自動スパム排除がなかなかの認識率――優位性を見いだした「Eudora 6J for Windows」」より、Eudra 6J も統計手法によるスパムフィルタの機能を持っているようだ。メッセージを一つ一つ「スパム認定」、「スパム解除」で指定して学習させるのも Mozilla にそっくりだ。

今回の試用では、学習なしの初期起動時の認識率は60%程度だった。

とのことで、最初の性能はあまりよくないらしい。Mozilla の場合は初期状態ではまったく認識してくれないから、それよりはましか。

別のPCでMozilla Mailを数カ月使い続けている経験から、Eudora 6Jの場合も1カ月ほど学習をさせれば落ち着くと考えていた。しかし、予想に反しかなりよい結果を示してくれた。 (中略) 使用開始から4週間後の現在、80%近くの認識率でスパム排除できている。

えっ、1ヶ月学習させてたったの 80%! それはちょっと成績が悪すぎませんか?この人のメール環境が特殊なんだろうか?

ただし強いて言えば不満もある。それは大量にフィルタ設定を行った際、昔の条件を編集したいと思っても探し出すことが困難な点だ。ぜひともフィルタ条件による検索機能が欲しいところだ。(中略)フィルタに約100条件以上を設定するユーザーは少ないのだろうか。

私もフィルタは40~50くらい使っているが、まあ、迷うことはあまり無い。フィルタ名に一貫した命名規則を適用しておき、並びをそろえておけばそれほど問題にはならないような気がする。例えば、私の場合メーリングリスト用のフィルタには先頭に ML_ をつけるようにしている。む、まてよ、100条件というのはもしかして、一つのフィルタに条件を100個付けるということだろうか?だとしたらそりゃすごい。

そして Thunderbird: ちなみに、我が家の Thunderbird の成績は以下のとおりだ。(前回トレーニングデータを作り直した 8月9日以降)

ハム 2039 誤判定 3 誤判定率 0.1%
スパム 811 見落とし 34 認識率 95.8%

HTML エディタ: 前回の日記に対して、中野さんの Weblog に回答があった。WebSiteManager で IME の未確定文字が表示されない件も最新版で直っている。

HTML エディタに関しては以下のものも見つけたり、教えてもらったりした。
ez-HTML
Web Publisher
ez-HTML は lint ツールと連携できたり、Web Publisher は変換ツールを起動できたりとなかなかよさそう。

10/30更新: 若干加筆。

コメント

コメントはありません。

トラックバック

トラックバックは検索対象外です。

この記事にリンクしているページ < >

  1. データがありません。