スパムフィルタあれこれ

2003年2月12日(水) by level
B ?
Tags: スパム

スラッシュドットのMozilla 1.3betaの記事で結構スパムフィルタのことが話題になっており、いくつか参考になるリンクもみつけたので過去のものも含めて整理してみました。
Mozillaスパムフィルタ機能 : Mozillaのスパムフィルタの説明。
A Plan for Spam : Mozillaスパムフィルタの基となったベイズ式スパムフィルタ手法を示した文章の日本語訳。必読。
Gauche:SpamFilter : 上記手法の実験結果。
スパムの選り分け手法 : いくつかのスパムフィルタの比較記事。

ところで、以前から疑問に思っていた、「Mozillaのスパムフィルタは日本語を正しく処理しているか?」に対しては、上述スラッシュドットの投稿によると、最低レベルの処理は行っているようです。
また、学習結果はプロファイルフォルダのtraining.datに格納されます。私の環境では現在7.6MBもあります。ここにどんなスパムな単語が登録されているかのぞいてみたい気もします。

コメント

コメントはありません。

トラックバック

トラックバックは検索対象外です。

この記事にリンクしているページ < >

  1. データがありません。