Google erklärt, wie es kanonische Webseiten auswählt

In einem Google Search Central-Video erklärt Gary Illyes von Google einen Teil der Webseitenindizierung, bei dem es um die Auswahl von Canonicals geht, er erklärt, was ein Canonical für Google bedeutet, eine Miniaturansicht der Webseitensignale, er erwähnt das Herzstück einer Seite und erklärt, was es mit den Duplikaten macht impliziert eine neue Art, über sie nachzudenken.

Was ist eine kanonische Webseite?

Es gibt verschiedene Möglichkeiten, zu berücksichtigen, was kanonisch bedeutet, der Herausgeber und der SEO-Standpunkt auf unserer Seite des Suchfelds und was kanonisch auf Googles Seite bedeutet.

Publisher identifizieren, was ihrer Meinung nach die „ursprüngliche“ Webseite ist, und SEOs Konzept von Canonicals besteht darin, die „stärkste“ Version einer Webseite für Rankingzwecke auszuwählen.

Die Kanonisierung für Google ist etwas ganz anderes als das, was Verlage und SEOs denken, daher ist es gut, das von einem Googler wie Gary Illyes zu hören.

In der offiziellen Google-Dokumentation zur Kanonisierung wird das Wort „Deduplizierung“ verwendet, um auf den Prozess der Auswahl einer Kanonisierung zu verweisen, und es werden fünf typische Gründe dafür aufgeführt, warum eine Website möglicherweise doppelte Seiten aufweist.

Fünf Gründe für doppelte Seiten

  1. „Regionsvarianten: zum Beispiel ein Inhalt für die USA und das Vereinigte Königreich, auf den über unterschiedliche URLs zugegriffen werden kann, der jedoch im Wesentlichen derselbe Inhalt in derselben Sprache ist
  2. Gerätevarianten: zum Beispiel eine Seite mit sowohl einer mobilen als auch einer Desktop-Version
  3. Protokollvarianten: zum Beispiel die HTTP- und HTTPS-Versionen einer Site
  4. Site-Funktionen: zum Beispiel die Ergebnisse von Sortier- und Filterfunktionen einer Kategorieseite
  5. Versehentliche Varianten: Beispielsweise bleibt die Demoversion der Website versehentlich für Crawler zugänglich.“

Canonicals können auf drei verschiedene Arten betrachtet werden und es gibt mindestens fünf Gründe für doppelte Seiten.

Gary beschreibt eine weitere Möglichkeit, über Kanonik nachzudenken.

Signale werden zur Auswahl kanonischer Signale verwendet

Ilyes teilt eine weitere Definition eines Canonicals mit, diesmal aus Sicht der Indizierung, und spricht über die Signale, die zur Auswahl von Canonicals verwendet werden.

Gary erklärt:

„Google bestimmt, ob die Seite ein Duplikat einer anderen bereits bekannten Seite ist und welche Version im Index beibehalten werden soll, die kanonische Version.

Aber in diesem Zusammenhang ist die kanonische Version die Seite aus einer Gruppe doppelter Seiten, die die Gruppe gemäß den Signalen, die wir zu jeder Version gesammelt haben, am besten repräsentiert.“

Gary hält inne, um die doppelte Clusterbildung zu erklären, und wendet sich kurze Zeit später wieder den Signalen zu.

Er machte weiter:

„Größtenteils erscheinen nur kanonische Seiten in den Suchergebnissen. Aber woher wissen wir, welche Seite kanonisch ist?

Sobald Google also den Inhalt Ihrer Seite hat, oder genauer gesagt den Hauptinhalt oder das Herzstück einer Seite, gruppiert es ihn mit einer oder mehreren Seiten mit ähnlichem Inhalt, falls vorhanden. Das ist doppeltes Clustering.“

Ich möchte hier nur anmerken, dass Gary den Hauptinhalt als „Herzstück einer Seite“ bezeichnet, was interessant ist, weil es ein von Martin Splitt von Google eingeführtes Konzept namens „Centerpiece Annotation“ gibt. Er hat nicht wirklich erklärt, was die Centerpiece-Anmerkung ist, aber dieser Teil, den Gary geteilt hat, hilft.

Im folgenden Teil des Videos spricht Gary darüber, was Signale eigentlich sind.

Illyes erklärt, was „Signale“ sind:

„Dann vergleicht es eine Handvoll Signale, die es bereits für jede Seite berechnet hat, um eine kanonische Version auszuwählen.

Signale sind Informationen, die die Suchmaschine über Seiten und Websites sammelt und zur weiteren Verarbeitung verwendet.

Einige Signale sind sehr einfach, wie zum Beispiel Anmerkungen des Websitebesitzers in HTML wie rel=“canonical“, während andere, wie die Wichtigkeit einer einzelnen Seite im Internet, weniger eindeutig sind.“

Doppelte Cluster haben eine Kanonik

Als nächstes erklärt Gary, dass eine Seite ausgewählt wird, um die Kanonik für jede Gruppe doppelter Seiten in den Suchergebnissen darzustellen. Jeder Cluster von Duplikaten hat eine Kanonik.

Er fährt fort:

„Jeder der doppelten Cluster wird eine einzelne Version des als kanonisch ausgewählten Inhalts haben.

Diese Version repräsentiert den Inhalt in den Suchergebnissen für alle anderen Versionen.

Die anderen Versionen im Cluster werden zu alternativen Versionen, die in unterschiedlichen Kontexten bereitgestellt werden können, beispielsweise wenn der Benutzer nach einer ganz bestimmten Seite im Cluster sucht.“

Alternative Versionen von Webseiten

Der letzte Teil ist wirklich interessant und wichtig zu berücksichtigen, da er hilfreich sein kann, um für mehrere Variationen eines Keywords ein Ranking zu erstellen, insbesondere für E-Commerce-Webseiten.

Manchmal erstellt das Content-Management-System (CMS) doppelte Webseiten, um Variationen eines Produkts wie der Größe oder Farbe eines Produkts zu berücksichtigen, die sich dann auf die Beschreibung auswirken können. Diese Variationen können von Google ausgewählt werden, um in den Suchergebnissen zu ranken, wenn diese Variantenseite eher als Übereinstimmung für eine Suchanfrage dient.

Dies ist wichtig, darüber nachzudenken, da es aus Angst vor dem (nicht vorhandenen) Problem der Kannibalisierung von Schlüsselwörtern verlockend sein könnte, Webseiten mit Noindex-Varianten umzuleiten, um sie aus dem Suchindex herauszuhalten. Das Hinzufügen eines Noindex zu Seiten, die Varianten einer Seite sind, kann nach hinten losgehen, da es Szenarien gibt, in denen diese Variantenseiten am besten für eine differenziertere Suchanfrage geeignet sind, die Farben, Größen oder Versionsnummern enthält, die sich von der kanonischen Seite unterscheiden.

Die wichtigsten Erkenntnisse zu Canonicals (und mehr), die man sich merken sollte

In Garys Diskussion über kanonische Texte sind viele Informationen enthalten, darunter auch einige Nebenthemen zum Hauptinhalt.

Hier sind sieben Erkenntnisse, die Sie berücksichtigen sollten:

  1. Der Hauptinhalt wird als Herzstück bezeichnet
  2. Google berechnet für jede entdeckte Seite eine „Handvoll Signale“.
  3. Signale sind Daten, die zur „weiteren Verarbeitung“ nach der Entdeckung von Webseiten verwendet werden.
  4. Einige Signale unterliegen der Kontrolle des Herausgebers, wie etwa Hinweise (und vermutlich auch Anweisungen). Der von Illyes erwähnte Hinweis ist das Link-Attribut rel=canonical.
  5. Andere Signale liegen außerhalb der Kontrolle des Herausgebers, beispielsweise die Bedeutung der Seite im Kontext des Internets.
  6. Einige doppelte Seiten können als alternative Versionen dienen
  7. Alternative Versionen von Webseiten können weiterhin ein Ranking erzielen und sind für Google (und den Herausgeber) für Rankingzwecke nützlich.

Sehen Sie sich die Search Central-Folge zum Thema Indexierung an:

So indiziert die Google-Suche Seiten

Ausgewähltes Bild aus Google-Video/vom Autor geändert

source site

Leave a Reply