spamassassin: lernen...

Debian macht sich hervorragend als Web- und Mailserver. Schau auch in den " Tipps und Tricks"-Bereich.
Antworten
fago
Beiträge: 242
Registriert: 26.02.2003 18:19:05
Kontaktdaten:

spamassassin: lernen...

Beitrag von fago » 27.12.2003 20:27:41

ich bin nun so weit dass mein mailsystem mit spamassassin ohne probleme läuft :)

ich habe bereits für jeden vuser in meinen mailsystem eine eigene spamassassin configuration, doch wie lass ich spamassassin nun am besten trainieren?

ich hab mir gedacht, ich mach jeden user ein Spam-Verzeichnis in seinem Maildir. Da verschiebt dann spamassassin den spam hinein und der user den spam der nicht erkannt wird. ist es sinnvoll spamassassin dann mittels sa-learn nur diesen ordner zum lernen zu geben? also sa-learn bekommt dann kein ham

autolearn sollte dann wohl deaktiviert werden?
Quis custodit custodes?

HorstV
Beiträge: 419
Registriert: 11.10.2003 18:34:22
Wohnort: Grenoble / Recklinghausen

Beitrag von HorstV » 28.12.2003 10:25:53

Also, wenn ich

Code: Alles auswählen

man sa-learn
richtig verstanden habe, ist das nicht wirklich sinnvoll.
Einfach mal da nachlesen, ist glaube ich auch noch eine webseite mit tests angegeben, wenn ich mich richtig erinnere.
SID on IBM T42p kernel 2.6.14.5 ati-8.20.8

Archmage
Beiträge: 138
Registriert: 11.08.2003 03:15:01

Beitrag von Archmage » 28.12.2003 14:11:09

Ohne Ham nützt Spamassassin überhaupt nichts. Es würde ja sonst nur die Wörter negativ lernen.

So lernst du ihm z.B. das "Die geile Sau" zu Spam gehört und schon denkt es, dass alle Mails, welche die das Wort "die" enthalten Spam sind, weil er nicht durch Ham gelehrnt hast, dass dieses Wort "die" eigentlich etwas positives ist und dem Wort eigentlich ein postivier Wert gehört.

Deswegen muss man entweder auch manuel Ham lernen oder man macht das ganze automatisch per Autolearn. :wink:

Es ist ja nicht automatisch so, dass ALLE Mails automtisch als Ham gelehrnt werden, sondern nur die wirklich klaren Hammails (d.h., dass sie eine geringe Spamwahrscheinlichkeit haben) und die wirkilch klaren Spammails (dito, nur hohe Wahrscheinlichkeit). Damit ist es nahezu ausgeschlossen, dass das falsche gelehrnt wird.

Ich rate deswegen dringend zum Autolearn und Spamassassin in der neusten Version (2.6.1) raten. Und um Fehlschläge zu vermeiden würde ich zu zwei Ordner pro User raten: Spam und Ham, wo die irtümlich Mails reingeschoben werden und dann regelmässig mit sa-learn gelehrnt werden.

Spamassassin ist eigentlich schon ganz gut und es wird wohl nach einer Weile kaum Fehlschläge geben. Manchmal muss man aber dann mit Black+Whitelist arbeiten. (Wenn man z.B. einen von zehn Newsletter haben will, welche aber alle fast gleich sind.)

fago
Beiträge: 242
Registriert: 26.02.2003 18:19:05
Kontaktdaten:

Beitrag von fago » 29.12.2003 17:03:50

vielen dank für die tipps :)

ich werd das dann so organisieren:

INBOX
|
|---SPAM
|
|---HAM

Ham -> INBOX
Spam -> SPAM
falschers Spam manuell -> HAM
falscher Ham manuell -> SPAM

sa-learn futtere ich dann HAM und SPAM :)
autolearn bleibt dann also an. dann wird zwar korrekter spam 2x trainiert, aber macht hoffentlich nichts ;)
Quis custodit custodes?

Archmage
Beiträge: 138
Registriert: 11.08.2003 03:15:01

Beitrag von Archmage » 29.12.2003 18:55:20

fago hat geschrieben:sa-learn futtere ich dann HAM und SPAM :)
autolearn bleibt dann also an. dann wird zwar korrekter spam 2x trainiert, aber macht hoffentlich nichts ;)
Keine Angst. Spamassassin merkt sich welche Spammails es schon gelehrnt hat und welche nicht. Diese werden nicht doppelt gelernt. Bei mir steht dann immer so etwas wie "50 Nachrichten wurden angeschaut und 10 gelernt".

fago
Beiträge: 242
Registriert: 26.02.2003 18:19:05
Kontaktdaten:

Beitrag von fago » 29.12.2003 22:24:18

hmmmm
ich steh schon wieder vor nen neuen problem :(

ich benutze den spamassassin daemon (spamd) mit --virtual-config-dir=/home/vmail/spamassassin/%u, so bekomm i für jeden user eine eigene config inkl. bayes-db, wie sie normal untern $HOME/.spamassassin zu finden ist.

nun schaff ichs aber nicht das sa-learn darauf zugreift, das nimmt immer stur das configdir im home-verzeichnis :twisted: option hab ich nur eine für das user_prefs file gefunden :(

ich frag mich was die option bringt wenn man dann nichts trainieren kann...
Quis custodit custodes?

Antworten