Mozilla Thunderbird 0.6 RC1 を使ってみる

2004年5月1日(土) by level
B ?
Tags: 開発

リリースノート

リリースノートのドラフト が公開されています。

JLP

日本語パック(JLP) はすでにまっちゃんの Mozilla 用 JLP からダウンロードできます(メニューの Mail をクリック)。早速インストールしてみましたが、とくに問題は無いようです。

Enigmail + JLP

Enigmail はダウンロードページの「Thunderbird 0.6a nightly」用(Enigmail v0.83.6.xpi と Enigmime v0.83.5-win32.xpi)をダウンロードしてインストールします。やはりまっちゃんの Mozilla 用 JLP から JLP をインストール(メニューの Extensions Top Page から入る)。こちらも問題ありません。

ジャンクメールコントロール

04/28版で紹介したとおり、ジャンクメールコントロールのアルゴリズムが新しくなっています。私も04/28版より training.dat を作り直して 0.5 に代わって本格運用をしています。このときに用いた初期学習データはハム、スパムそれぞれ229、33個。以下に示すとおり、やはり最初のうちはスパムの取りこぼしが結構出ていますが、もう少し学習させればよい結果が出ると期待しています(スパムの初期学習数がちょっと少なすぎのようです)。

Thunderbird 0.5 (2003/8/9~2004/4/27):
ham =6168, fp= 13(0.21%)
spam=4443, fn=110(2.48%)

Thunderbird 0.6 (2004/4/28~5/1)
ham = 115, fp=  0( 0.00%)
spam= 142, fn= 17(11.97%)

(注)fp:hamをspamに判定してしまうこと、
      fn:spamをhamに判定してしまうこと

ついでに、training.dat をダンプして、スパムな単語の上位10個を出して見たのが以下のリストです。末尾に * のついたものは、新アルゴリズムになってトークンになるようになったものです(従来では : でトークンが分割されていたはず)。まだ、スパムの数が少ないので最高確率の 9.90 になっているのが二つしか無いです。ちなみに、

Thunderbird 0.5 (2003/8/9~2004/4/27):
training.datのサイズ=1.4MB
nGood 1336
nBad  594
nGoodToken 38073
nBadToken  31247
    0  1376 0.990 x-nortonav-timeoutprotection
    0   702 0.990 0in
    4   672 0.990 strong
    0   504 0.990 mankind
    2   458 0.990 dir
    0   457 0.990 0cm
    1   432 0.990 rtl
    2   386 0.990 usa
    1   374 0.990 god
    0   343 0.990 miems

Thunderbird 0.6 (2004/4/28~5/1)
training.datのサイズ=388KB
nGood 229
nBad  50
nGoodToken 12050
nBadToken  6048
    0    24 0.990 x-mozilla-status:0000 *
    0     7 0.990 to:level@jn3.so-net.ne.jp *
    3    26 0.952 content-type/type:multipart/alternative *
    1     6 0.932 company
    3    16 0.924 x-mozilla-status:0005 *
    1     5 0.920 under
    1     4 0.902 x-priority:3 (normal) *
    1     4 0.902 week
    1     4 0.902 system
    1     4 0.902 product

コメント

コメントはありません。

トラックバック

トラックバックは検索対象外です。

この記事にリンクしているページ < >

  1. データがありません。