Spam analysieren - Keywords finden?

dersuperpro1337

Lieutenant
Registriert
Jan. 2015
Beiträge
997
Hallo zusammen!

Erhalte seit 1-2 Monaten immer mehr Spam Mails nach immer dem selben Schema:
Catchphrase, Produkt, Link, Catchphrase.

Meine händisch geführten Filter (eigene Domain, verwaltet mit Thunderbird) fangen bisher alle ".co" Mails ab, jedoch kommen auch noch genug andere an, für die ich täglich 1-2 manuelle Filter setzen muss mit dem neusten Produkt, was man mir andrehen will.

Gibt es eine Möglichkeit, alle Mails zu analysieren und zumindest die am häufigsten verwendeten Worte oder Adress-Bestandteile aufzulisten?
Dann könnte ich meine Filter nämlich vielleicht so setzen, dass sie deutlich mehr abfangen als momentan (ca. 40-60%).
 
Mailadresse stilllegen. ;)
Wenn Du diese Mails im TB als Junk markierst, kommt doch TB irgendwann selbst drauf das der Krams Junk ist.

Deine "haendischen Filter" stellst Du wo ein? TB oder als Filter in den Settings der Domain?

Ich persoehnlich fahre eine Whitelist fuer meine privaten Adressen.
Sprich nur Absender die in der Liste sind landen in der Inbox. Der Rest geht in den Papierkorb.
Fuer den einmaligen Bestellkrams nutze ich Wegwerfadressen aka trash007@meinemail.blah. Alles was an die reinkommt geht in einen extra Ordner. Wird die Adresse "verkauft" wird sie geloescht.

dersuperpro1337 schrieb:
Gibt es eine Möglichkeit, alle Mails zu analysieren und zumindest die am häufigsten verwendeten Worte oder Adress-Bestandteile aufzulisten?

Uralt und funktioniert immer noch. -> http://textalyser.net/
Nimm einfach die Inhalte der Mails in eine Text-Datei und lass Ding darauf los.
Geht sicherlich auch irgendwie anders. Musst einfach mal nach Text Analysis oder Keyword Analysis suchen.
Fuer minimalistische Zwecke reicht (unter Linux oder der Windows WSL ein Einzeiler.

Code:
awk '{for(n=1;n<=NF;n++) print tolower($n)}' DATEI|sed 's/[^a-z]//g'|egrep "[a-z]"|sort|uniq -c|sort -rn

Bringt als Ergebnis sowas.

1580686312448.png


Wenn Du nur Woerter gezaehlt haben willst die z.B. laenger als 5 Buchstaben sind brauchst Du nur ein {5} passend einfuegen.

Code:
awk '{for(n=1;n<=NF;n++) print tolower($n)}' DATEI|sed 's/[^a-z]//g'|egrep "[a-z]{5}"|sort|uniq -c|sort -rn

1580691199578.png


Musst natuerlich auch die Inhalte der Mails zusammen kopieren.

BFF
 
Zuletzt bearbeitet: (ergaenzt/typo)
BFF schrieb:
Mailadresse stilllegen. ;)

Uralt und funktioniert immer noch. -> http://textalyser.net/

Schön wärs. Ist meine geschäftliche Adresse, die nur zur Interaktion mit Kunden genutzt wird. Keine unbedachten Anmeldungen o.ä.
Aber die Adresse ist leider öffentlich einsehbar und demnach natürlich ein ideales Ziel für irgendwelche Bots.

Ich habe bisher tatsächlich nur per Hand in TB Filter gesetzt. Nach Betreff, Inhalt oder Adresse. Ich fühle mich gerade richtig dumm, weil ich nicht an den teilautomatisierten Junk Filter gedacht habe. Den nutze ich dann wohl besser mal, denn genau das wollte ich ja noch viel lieber erreichen. Dass das Mailprogramm mitlernt und nicht ich die ganze Arbeit habe-
Textanalyzer schaue ich mir aber auch mal an, zusätzlich, danke dafür!
 
Wie "scharf" ist den serverseitig der SPAM-Filter eingestellt? Sprich in den Einstellungen zur Maildomain.
Und auch da kann mann, mehr oder weniger, schon Filtern. Also dass was Du generell nicht willst schon dort in den Spam-Ordner schieben.

BFF
 
Zurück
Oben