Kommentarspam, eine üble Schweinegrippe!

spamIch mag Kommentare zu den Beiträgen sehr! Sie weisen mich auf Fehler hin, haben mir schon verpornisierte Links gemeldet und freuen mich auch ganz allgemein. Dieses Blog ist No-Nofollow, weil ich es OK finde, wenn die Kommentatoren einen Link hinterlassen. Dies hat zwar schon einiges an Google PageRank gekostet, aber ich habe aufgehört, mir darüber Sorgen zu machen. Google liebt mich nicht, aber der Schmerz darüber hat sich in Grenzen gehalten 🙂 .

Normale Kommentare werden zuverlässig von Aksimet abgefangen. Nun ist aber der anscheinend handgemachte Kommentarspam auch hier angekommen.

Fall 1: Nayoki.de

Alle Kommentare in diesem Blog werden von Hand freigegeben, und ich wurde schon sehr misstrauisch folgende Kommentare kurz nacheinander zu zwei völlig verschiedenen Artikeln zu finden:

Von: Fritz URL: nayoki.de Email: fritz@nayoki.de IP: 212.227.103.74

Danke für diese Infos. Die Beschreibung ist ja sehr ausführlich gemacht.Sehr schöne Seite.Bin schon mal gespannt.

Von: Fritz URL: nayoki.de Email: fritz@nayoki.de IP: 212.227.103.74

Das ist ja sehr gut.Danke für diese Tipps.Bin schon mal gespannt.Tolle Seite.

Hm, in den Artikeln war nichts drin, dass eine solche enorme Spannung gerechtfertigt hätte. Eine Nachfrage per per Mail bei fritz@nayoki.de ist leider wegen ungültiger Adresse nicht angekommen.

nayoki.de ist eine interessante Firma. Anscheinend haben sie schon mal mit ähnlich intelligenten Kommentaren die Blogs verseucht. Auf eine dahingehende Frage über das Kontaktformular hat sich eine sehr nette Mitarbeiterin gemeldet und bestätigt, dass fritz@nayoki.de nicht dort arbeitet. Nachdem die ganze Sache „an die Suchmaschinenabteilung“ eskaliert wurde, habe ich leider nichts mehr gehört.

Sehr spannend; arbeiten doch dort auch ein Markus, ein Peter und der aktive Fritz (unter falschem Namen?). Die IP führt zu einem Rechner, der anscheinend einen SSH-Zugang und einen SQUID-Proxy offen hat. Aufgelöst ergibt sie p15202001.pureserver.info, also ein gemieteter Server von 1&1 UND einer der bekannten Knoten eines anonymisierenden JAP-Proxies.

Wenn jemand unter den Lesern auch nayoki-Spam hat, wäre ich froh für eine Info, dann könnte man vielleicht was lustiges unternehmen…

Fall 2: Der Zahnersatz

Zum Beitrag über die Flughexe kam vor Kurzem der folgende Spam:
Von: Dini URL: zahnersatz.billig-1.de Email: alf@tanner-inf.com IP: 87.122.3.161

Gibt es den Service noch?

Ich wollte Alf fragen, wieso er nicht einfach die URL im Artikel aufgerufen hat, aber die Mail kam auch als unzustellbar zurück. tanner-inf.com gibt es nicht, aber wenn man bei Google danach sucht, findet man viiiiele Spam-Links. Die IP gehört zu einem Pool eines deutschen ISP, er arbeitet also noch nicht so anonym wie die Nayoki-Jungs.

Fazit

Nayoki missbraucht Kommentare, um Links aufzubauen. So einfach und schlecht ist das. Ich finde das eine zwielichtige Methode, die gegen den Goodwill verstösst. Gna!

Emailadressen auf Webseiten codieren

Update 01.2011: Tillate hat einen super Artikel dazu.
Spammer brauchen Emailadressen. Neue Emailadressen bekommen sie, indem sie (wie Google) mit sog. Robots von Website zu Website springen, den Inhalt herunterladen und die Emailadressen herauspfriemeln. Das heisst, man sollte seine Emailadressen im WWW verstecken, so gut dass es geht. Eine Möglichkeit ist die Benutzung von JavaScript (weil das die Addressharvester anscheinend noch nicht so beherrschen), eine Andere ist die Verwendung von Bildern (es gibt natürlich noch mehr).

Ich habe dazu ein kleines PHP Skriptchen geschrieben. Es kann eine Emailadresse alleine oder viele Emailaddressen in Text eingebettet verstecken. Im Zip hat es 3 Dateien:

  • hidemail.php: Das Hauptscript, das die Arbeit erledigt.
  • imagemke.php: Ein Script, das aus den Mailadressen Bilder erzeugt wenn das Javascript ausgeschaltet ist.
  • hmexample.php: Ein Beispiel, das die Anwendung zeigt. Es gibt auch eine online Demo.

Ich würde mich über Feedback freuen :)…. Download: hidemail PHP Skript um Mails zu hiden. Zum Gebrauch müssen einige Einstellungen (beispielsweise die URL zu imagemke.php in hidemail.php gemacht werden.

Ideen sind von:


Nachtrag Juli 2008:
Einen Interessanten Beitrag dazu gibt es beim Tillate Techblog!

Die Spamfalle für Webmaster

Der eine Weg, gegen Spammer vorzugehen, ist ihnen die Email-Adresse nicht zu geben. Der Andere Weg wäre es, ihnen gaaaaanz viele Adressen zu geben! Die Ursprüngliche Idee ist von Neil Gunton, hier etwas praktisch angepasst.

Die Grundidee ist folgende: Wir verbieten das Indizieren bestimmter Seiten. Liebe Roboter halten sich dran, böse nicht. Auf diesen Seiten Bieten wir ganz viele Emailadressen und weitere Links auf andere Seiten an mit noch mehr Adressen. Ich hoffe dann mal, dass sich die Datenbank des Spammers füllt, mit falschen Mailadressen…

Installation:

Das PHP-Skript kreiert verschiedene Seiten mit Fiesitäten… Weitergehende Links im Kreis, Links auf andere Spamtraps, defekte und korrekte Emailadressen, etcetc… Es sollte in ein eigenes Verzeichnis (bspw: /mails/) kopiert werden. Man kann auch ein laufendes Beispiel ansehen. Bitte bedenke: Die Seiten müssen nicht schön sein, sondern Maschinenlesbar :)…

Um die netten Roboter abzuhalten im Kreis zu indizieren, verbieten wir ihnen das ganz einfach in der Datei /robots.txt:

# robots.txt
User-agent:  *
Disallow: /mails/

Damit die Spammer das auch finden, sollte auf möglichst vielen Seiten ein versteckter Verweis angebracht werden. Zum Beispiel mit einem durchsichtigen gif, 1×1 Punkt gross:

<a href="/mails/"><img alt="" src="/images/transparent.gif" width="1" height="1" border="0"/></a>

Denkbar wäre es auch, das Ganze mit einem nofollow Link zu versehen.

Nun sollen sie sich zu Tode fressen… Hier die Dateien: Spamtrap: Skript, robots.txt und transparent.gif.

Ebenfalls eine nette Lösung ist die Spidertrap. Sie blockiert die IPs der unanständigen Roboter und schliesst sie so aus.