ich bin nun so weit dass mein mailsystem mit spamassassin ohne probleme läuft
ich habe bereits für jeden vuser in meinen mailsystem eine eigene spamassassin configuration, doch wie lass ich spamassassin nun am besten trainieren?
ich hab mir gedacht, ich mach jeden user ein Spam-Verzeichnis in seinem Maildir. Da verschiebt dann spamassassin den spam hinein und der user den spam der nicht erkannt wird. ist es sinnvoll spamassassin dann mittels sa-learn nur diesen ordner zum lernen zu geben? also sa-learn bekommt dann kein ham
autolearn sollte dann wohl deaktiviert werden?
spamassassin: lernen...
spamassassin: lernen...
Quis custodit custodes?
Also, wenn ich richtig verstanden habe, ist das nicht wirklich sinnvoll.
Einfach mal da nachlesen, ist glaube ich auch noch eine webseite mit tests angegeben, wenn ich mich richtig erinnere.
Code: Alles auswählen
man sa-learn
Einfach mal da nachlesen, ist glaube ich auch noch eine webseite mit tests angegeben, wenn ich mich richtig erinnere.
SID on IBM T42p kernel 2.6.14.5 ati-8.20.8
Ohne Ham nützt Spamassassin überhaupt nichts. Es würde ja sonst nur die Wörter negativ lernen.
So lernst du ihm z.B. das "Die geile Sau" zu Spam gehört und schon denkt es, dass alle Mails, welche die das Wort "die" enthalten Spam sind, weil er nicht durch Ham gelehrnt hast, dass dieses Wort "die" eigentlich etwas positives ist und dem Wort eigentlich ein postivier Wert gehört.
Deswegen muss man entweder auch manuel Ham lernen oder man macht das ganze automatisch per Autolearn.
Es ist ja nicht automatisch so, dass ALLE Mails automtisch als Ham gelehrnt werden, sondern nur die wirklich klaren Hammails (d.h., dass sie eine geringe Spamwahrscheinlichkeit haben) und die wirkilch klaren Spammails (dito, nur hohe Wahrscheinlichkeit). Damit ist es nahezu ausgeschlossen, dass das falsche gelehrnt wird.
Ich rate deswegen dringend zum Autolearn und Spamassassin in der neusten Version (2.6.1) raten. Und um Fehlschläge zu vermeiden würde ich zu zwei Ordner pro User raten: Spam und Ham, wo die irtümlich Mails reingeschoben werden und dann regelmässig mit sa-learn gelehrnt werden.
Spamassassin ist eigentlich schon ganz gut und es wird wohl nach einer Weile kaum Fehlschläge geben. Manchmal muss man aber dann mit Black+Whitelist arbeiten. (Wenn man z.B. einen von zehn Newsletter haben will, welche aber alle fast gleich sind.)
So lernst du ihm z.B. das "Die geile Sau" zu Spam gehört und schon denkt es, dass alle Mails, welche die das Wort "die" enthalten Spam sind, weil er nicht durch Ham gelehrnt hast, dass dieses Wort "die" eigentlich etwas positives ist und dem Wort eigentlich ein postivier Wert gehört.
Deswegen muss man entweder auch manuel Ham lernen oder man macht das ganze automatisch per Autolearn.
Es ist ja nicht automatisch so, dass ALLE Mails automtisch als Ham gelehrnt werden, sondern nur die wirklich klaren Hammails (d.h., dass sie eine geringe Spamwahrscheinlichkeit haben) und die wirkilch klaren Spammails (dito, nur hohe Wahrscheinlichkeit). Damit ist es nahezu ausgeschlossen, dass das falsche gelehrnt wird.
Ich rate deswegen dringend zum Autolearn und Spamassassin in der neusten Version (2.6.1) raten. Und um Fehlschläge zu vermeiden würde ich zu zwei Ordner pro User raten: Spam und Ham, wo die irtümlich Mails reingeschoben werden und dann regelmässig mit sa-learn gelehrnt werden.
Spamassassin ist eigentlich schon ganz gut und es wird wohl nach einer Weile kaum Fehlschläge geben. Manchmal muss man aber dann mit Black+Whitelist arbeiten. (Wenn man z.B. einen von zehn Newsletter haben will, welche aber alle fast gleich sind.)
vielen dank für die tipps
ich werd das dann so organisieren:
INBOX
|
|---SPAM
|
|---HAM
Ham -> INBOX
Spam -> SPAM
falschers Spam manuell -> HAM
falscher Ham manuell -> SPAM
sa-learn futtere ich dann HAM und SPAM
autolearn bleibt dann also an. dann wird zwar korrekter spam 2x trainiert, aber macht hoffentlich nichts
ich werd das dann so organisieren:
INBOX
|
|---SPAM
|
|---HAM
Ham -> INBOX
Spam -> SPAM
falschers Spam manuell -> HAM
falscher Ham manuell -> SPAM
sa-learn futtere ich dann HAM und SPAM
autolearn bleibt dann also an. dann wird zwar korrekter spam 2x trainiert, aber macht hoffentlich nichts
Quis custodit custodes?
Keine Angst. Spamassassin merkt sich welche Spammails es schon gelehrnt hat und welche nicht. Diese werden nicht doppelt gelernt. Bei mir steht dann immer so etwas wie "50 Nachrichten wurden angeschaut und 10 gelernt".fago hat geschrieben:sa-learn futtere ich dann HAM und SPAM
autolearn bleibt dann also an. dann wird zwar korrekter spam 2x trainiert, aber macht hoffentlich nichts
hmmmm
ich steh schon wieder vor nen neuen problem
ich benutze den spamassassin daemon (spamd) mit --virtual-config-dir=/home/vmail/spamassassin/%u, so bekomm i für jeden user eine eigene config inkl. bayes-db, wie sie normal untern $HOME/.spamassassin zu finden ist.
nun schaff ichs aber nicht das sa-learn darauf zugreift, das nimmt immer stur das configdir im home-verzeichnis option hab ich nur eine für das user_prefs file gefunden
ich frag mich was die option bringt wenn man dann nichts trainieren kann...
ich steh schon wieder vor nen neuen problem
ich benutze den spamassassin daemon (spamd) mit --virtual-config-dir=/home/vmail/spamassassin/%u, so bekomm i für jeden user eine eigene config inkl. bayes-db, wie sie normal untern $HOME/.spamassassin zu finden ist.
nun schaff ichs aber nicht das sa-learn darauf zugreift, das nimmt immer stur das configdir im home-verzeichnis option hab ich nur eine für das user_prefs file gefunden
ich frag mich was die option bringt wenn man dann nichts trainieren kann...
Quis custodit custodes?