SpamAssassin

SpamAssassin
Kurzbeschreibung: Spamfilter
Offizielle Website: http://spamassassin.apache.org
Offizielle Dokumentation:
Lizenz: Apache

Inhaltsverzeichnis

[Bearbeiten] HowTo

[Bearbeiten] Tipps und Tricks

[Bearbeiten] Bewertung des Bayes Filters erhöhen

Datei: /etc/mail/spamassassin/local.cf
score BAYES_95 0 0 3.50 3.50
score BAYES_99 0 0 4.00 4.00

Anmerkung: Wenn man MailScanner gemeinsam mit SpamAssassin verwendet, muss man die Änderungen in der Datei /etc/MailScanner/spam.assassin.prefs.conf vornehmen und anschließend MailScanner neu starten ;-).

Hallo Markus

> Und noch eine Spamassassin-Frage:
> Bei der Verwendung der bayesianischen Filter liegt der Spam-Wert, den ein Mail 
> mittels bayes addiert bekommen kann, zwischen 0 und 1 (jedenfalls scheint mir 
> das so: Mails, auf die zwar die normalen SA-Filter nicht matchen, die aber 
> schon mehrfach dem Bayes-Filter als spam beigebracht wurden, haben den 
> Eintrag "bayes=1.0000" im Header). 

Ich denke das ist die vom Bayes-Filter berechnete Wahrscheinlichkeit,
dass das Mail Spam ist. 1.0000 ist der Maximalwert (100% Spam).

Dies sagt aber noch nichts über die Punkte aus, die das Mail dafür
bekommt. Spamassassin 3.0 vergibt defaultmässig folgende Scores:

score BAYES_00 0 0 -1.665 -2.599
score BAYES_05 0 0 -0.925 -0.413
score BAYES_20 0 0 -0.730 -1.951
score BAYES_40 0 0 -0.276 -1.096
score BAYES_50 0 0 1.567 0.001
score BAYES_60 0 0 3.515 0.372
score BAYES_80 0 0 3.608 2.087
score BAYES_95 0 0 3.514 2.063
score BAYES_99 0 0 4.070 1.88

describe BAYES_00       Bayesian spam probability is 0 to 1%
describe BAYES_05       Bayesian spam probability is 1 to 5%
describe BAYES_20       Bayesian spam probability is 5 to 20%
describe BAYES_40       Bayesian spam probability is 20 to 40%
describe BAYES_50       Bayesian spam probability is 40 to 60%
describe BAYES_60       Bayesian spam probability is 60 to 80%
describe BAYES_80       Bayesian spam probability is 80 to 95%
describe BAYES_95       Bayesian spam probability is 95 to 99%
describe BAYES_99       Bayesian spam probability is 99 to 100%

Die Punkte in der hintersten Spalte sind die Punkte wenn die
Netzwerk-Test auch aktiviert sind, die Punkte in der dritte Spalte
werden verwendet, falls die Netzwerk-Tests deaktiviert sind.


> Das reicht aber nicht aus, wenn das Mail sonst nicht matcht.
> Weiss jemand, wie ich den "Bayes Factor" erhöhen kann?

In deinem Fall (1.0000 = 100%) vergibt SA defaultmässig also 1.88 (bzw.
4.070) Punkte. Falls dir das zuwenig ist, kannst du die Bewertung im
Konfigurationsfile überschreiben. Dazu fügst du z.B. einfach die
folgende Zeile in /etc/mail/spamassassin/local.cf (Globale Config) bzw.
~/.spamassassin/user_prefs (Benutzer Config) ein:

score BAYES_99 0 0 7.00 7.00

Dann werden die Mails mit 99-100% Bayes-Wahrscheinlichkeit mit 7 Punkten
bewertet. (Was meiner Meinung nach allerdings zu hoch ist.)


Quelle: http://www.lugbe.ch/vpipermail/linux-support/2004-December/000581.html

[Bearbeiten] Bayesfilter überprüfen

Bevor der Baysfilter von Spamassasin aktiv wird, muss er zuerst angelert werden. Hierfür benötigt er mindesten 200 Spam und 200 Ham Mails. Mit dem folgenden Komando kann man überprüfen wieviele E-Mails Spammassassin schon gelernt hat.

 sa-learn --dbpath=/var/spool/MailScanner/spamassassin/ --dump all | more

[Bearbeiten] Bayesfilter anlernen

Um dem Bayes filter mit E-Mails im Maildir-Format lernen zu lassen.

Für Spam:

 sa-learn --dbpath=/var/spool/MailScanner/spamassassin/ --showdots --spam /home/michael/.maildir/.Junk/*            

Für Ham:

 sa-learn --dbpath=/var/spool/MailScanner/spamassassin/ --showdots --ham /home/michael/.maildir/.ham/*

[Bearbeiten] Tools