Google-Suche von massivem Spam-Angriff überwältigt

Die Suchergebnisse von Google wurden in den letzten Tagen von einem Spam-Angriff heimgesucht, der völlig außer Kontrolle geraten ist. Viele Domains ranken jeweils für Hunderttausende Schlüsselwörter, was darauf hindeutet, dass das Ausmaß dieses Angriffs leicht Millionen von Schlüsselwortphrasen erreichen könnte.

Überraschenderweise wurden viele der Domains erst innerhalb der letzten 24–48 Stunden registriert.

Darauf bin ich kürzlich durch eine Reihe von Beiträgen von Bill Hartzer (LinkedIn-Profil) aufmerksam geworden, in denen er ein vom Majestic-Backlinks-Tool erstelltes Linkdiagramm veröffentlichte, das die Linknetzwerke mehrerer Spam-Sites offenlegte.

Das von ihm veröffentlichte Linkdiagramm zeigte, dass zahlreiche Websites eng miteinander verknüpft sind, was ein ziemlich typisches Muster für Netzwerke mit Spam-Links ist.

Screenshot eines eng miteinander verbundenen Netzwerks

Bild von Bill Hartzer über MajesticGoogle-Suche von massivem Spam-Angriff überwältigt

Bill und ich haben über den Facebook-Messenger über die Spam-Seiten gesprochen und wir waren uns beide einig, dass die Spammer zwar viel Arbeit in den Aufbau eines Backlink-Netzwerks gesteckt haben, die Links aber nicht wirklich für die hohen Platzierungen verantwortlich waren.

Bill sagte:

„Das ist meiner Meinung nach teilweise die Schuld von Google, das offenbar mehr Wert auf Inhalte als auf Links legt.“

Ich stimme zu 100 % zu, dass Google mehr Wert auf Inhalte als auf Links legt. Meiner Meinung nach sind die Spam-Links jedoch dazu da, damit der Googlebot die Spam-Seiten erkennen und indizieren kann, und sei es auch nur für ein oder zwei Tage.

Nach der Indexierung nutzen die Spam-Seiten meiner Meinung nach zwei Lücken in den Google-Algorithmen aus, auf die ich als Nächstes eingehen werde.

Außer Kontrolle geratener Spam in Google SERPs

Mehrere Websites ranken nach Longtail-Phrasen, die einigermaßen einfach zu ranken sind, sowie nach Phrasen mit einer lokalen Suchkomponente, die ebenfalls leicht zu ranken sind.

Longtail-Phrasen sind Schlüsselwortphrasen, die von Menschen, aber äußerst selten verwendet werden. Longtail ist ein Konzept, das es schon seit fast zwanzig Jahren gibt und das 2006 durch ein Buch mit dem Titel „The Long Tail: Why the Future of Business is Selling Less of More“ populär gemacht wurde.

Spammer können für diese selten gesuchten Phrasen ein Ranking erstellen, da es kaum Konkurrenz für diese Phrasen gibt, was das Ranking erleichtert.

Wenn also ein Spammer Millionen von Seiten mit Longtail-Phrasen erstellt, können diese Seiten in kurzer Zeit jeden Tag für Hunderttausende Schlüsselwörter ranken.

Unternehmen wie Amazon nutzen das Prinzip des Longtails, um Hunderttausende einzelner Produkte pro Tag zu verkaufen, was sich vom Verkauf eines Produkts Hunderttausend Mal pro Tag unterscheidet.

Das ist es, was die Spammer ausnutzen: die einfache Rangfolge für Longtail-Phrasen.

Das zweite, was die Spammer ausnutzen, ist die Lücke, die der lokalen Suche innewohnt.

Der lokale Suchalgorithmus ist nicht dasselbe wie der Algorithmus zum Ranking nicht-lokaler Schlüsselwörter.

Bei den ans Licht gekommenen Beispielen handelt es sich um Variationen von Craigslist und verwandten Schlüsselwörtern.

Beispiele sind Phrasen wie Craigslist-Autoteile, Craigslist-Zimmer zu vermieten, Craigslist zum Verkauf durch den Eigentümer und Tausende anderer Schlüsselwörter, von denen die meisten nicht das Wort Craigslist verwenden.

Das Ausmaß des Spams ist enorm und geht weit über Keywords hinaus, die das Wort „Craigslist“ enthalten.

So sieht die Spam-Seite aus

Einen Blick darauf zu werfen, wie die Spam-Seite aussieht, ist durch den Besuch der Seiten mit einem Browser nicht möglich.

Ich habe versucht, den Quellcode der Websites anzuzeigen, die bei Google ranken, aber alle Spam-Websites leiten automatisch auf eine andere Domain weiter.

Als nächstes habe ich die Spam-URL in den W3C-Link-Checker eingegeben, um die Website zu besuchen, aber auch der W3C-Bot konnte die Website nicht sehen.

Also habe ich meinen Browser-User-Agent so geändert, dass er sich als Googlebot identifiziert, aber die Spam-Site hat mich trotzdem weitergeleitet.

Das deutete darauf hin, dass die Website nicht prüfte, ob der Benutzeragent ein Googlebot war.

Die Spam-Site suchte nach Googlebot-IP-Adressen. Wenn die IP-Adresse des Besuchers mit Google übereinstimmte, zeigte die Spam-Seite dem Googlebot Inhalte an.

Alle anderen Besucher wurden zu anderen Domains weitergeleitet, die fragwürdige Inhalte anzeigten.

Um den HTML-Code der Website zu sehen, musste ich sie mit einer Google-IP-Adresse besuchen. Deshalb habe ich den Rich-Suchergebnisse-Tester von Google verwendet, um die Spam-Seite zu besuchen und den HTML-Code der Seite aufzuzeichnen.

Ich habe Bill Hartzer gezeigt, wie man den HTML-Code mit dem Rich-Results-Tester extrahiert, und er ging sofort los, um darüber zu twittern, lol. Verdammt!

Der Rich Results Tester bietet die Möglichkeit, den HTML-Code einer Webseite anzuzeigen. Kopieren Sie also den HTML-Code, fügen Sie ihn in eine Textdatei ein und speichern Sie ihn dann als HTML-Datei.

Screenshot von HTML, bereitgestellt vom Rich Results Tool

Google-Suche von massivem Spam-Angriff überwältigtGoogle-Suche von massivem Spam-Angriff überwältigt

Als nächstes habe ich die HTML-Datei bearbeitet, um jegliches JavaScript zu entfernen, und dann die Datei erneut gespeichert.

Ich konnte jetzt sehen, wie die Webseite für Google aussieht:

Screenshot der Spam-Webseite

Screenshot einer Spam-Webseite, die bei Google ranktScreenshot einer Spam-Webseite, die bei Google rankt

Eine Domain rankt für mehr als 300.000 Keywords

Bill hat mir eine Tabelle mit einer Liste von Schlüsselwortphrasen geschickt, für die nur eine der Spam-Websites gerankt wurde. Eine Spam-Site, nur eine davon, wurde für über 300.000 Keyword-Phrasen gerankt.

Screenshot mit Schlüsselwörtern für eine Domain

Bild, das eine Nahaufnahme einer Tabelle mit Schlüsselwortphrasen zeigtBild, das eine Nahaufnahme einer Tabelle mit Schlüsselwortphrasen zeigt

Es gab viele Craigslist-Keyword-Phrasen, aber auch andere Longtail-Phrasen, von denen viele ein lokales Suchelement enthielten. Wie ich bereits erwähnt habe, ist es einfach, ein Ranking für Longtail-Phrasen zu erstellen, einfach ein Ranking für lokale Suchphrasen zu erstellen und die beiden Arten von Phrasen zu kombinieren, und es ist wirklich einfach, ein Ranking für diese Keyword-Phrasen zu erstellen.

Warum funktioniert diese Spam-Technik?

Die lokale Suche verwendet einen anderen Algorithmus als der nicht-lokale Algorithmus. Beispielsweise benötigt eine lokale Website im Allgemeinen nicht viele Links, um für eine Suchanfrage einen Rang zu erreichen. Die Seiten benötigen lediglich die richtigen Arten von Schlüsselwörtern, um einen lokalen Suchalgorithmus auszulösen und sie für ein geografisches Gebiet einzuordnen.

Wenn Sie also nach „Craigslist-Autoteile“ suchen, wird der lokale Suchalgorithmus ausgelöst, und da es sich um eine Longtail-Suche handelt, wird es nicht allzu viel kosten, sie zu bewerten.

Dies ist seit vielen Jahren ein anhaltendes Problem. Vor einigen Jahren konnte eine Website für „Rhinoplasty Plano, Texas“ ranken, mit einer Website, die alte römisch-lateinische Inhalte und Überschriften in Englisch enthielt. Nasenkorrektur ist eine lokale Longtail-Suche und Plano, Texas, ist eine relativ kleine Stadt. Das Ranking für diese Rhinoplastik-Keyword-Phrase war so einfach, dass die lateinische Website problemlos ein Ranking dafür erzielen konnte.

Google ist sich dieses Spam-Problems mindestens seit dem 19. Dezember bewusst, wie Danny Sullivan in einem Tweet bestätigt.

Es wird interessant sein zu sehen, ob Google nach all der Zeit endlich einen Weg findet, diese Art von Spam zu bekämpfen.

Ausgewähltes Bild von Shutterstock/Kateryna Onyshchuk


source site

Leave a Reply