Wie Google Webseiteninhalte analysiert und gewichtet

Martin Splitt erklärte in einem Duda-Webinar ein Konzept namens Centerpiece Annotation, das erläutert, wie Google Inhalte auf einer Webseite analysiert.

Ich werde die Frage nicht reproduzieren, weil sie etwas abseits des Themas und lang ist.

Aber was Martin diskutiert, ist, wie Google den Boilerplate einer Webseite heraustrennt und dann aus der Textinhaltsstruktur zusammenfasst, worum es auf der Webseite geht.

Er erwähnt die sogenannte Centerpiece-Anmerkung.

Martin Splitt erklärte:

„Wir analysieren nur den Inhalt und ich weiß nicht, was wir öffentlich dazu gesagt haben, aber ich glaube, ich habe es in einer der Podcast-Episoden angesprochen.

Ich kann also wahrscheinlich sagen, dass wir zum Beispiel eine Sache namens Centerpiece Annotation haben, und es gibt noch ein paar andere Anmerkungen, in denen wir den semantischen Inhalt sowie möglicherweise den Layoutbaum betrachten.

Aber im Grunde können wir das schon an der Inhaltsstruktur in HTML ablesen und so „Oh! Das sieht so aus, als ob es nach all der natürlichen Sprachverarbeitung, die wir an diesem gesamten Textinhalt hier gemacht haben, in erster Linie um Thema A, Hundefutter, geht.“

Werbung

Weiter unten lesen

Screenshot von Martin Splitt, der die Herzstück-Anmerkung bespricht

Als nächstes spricht Martin darüber, wie die Seitenanalyse die Webseite in Komponenten aufteilt, von denen einige für das Centerpiece nicht relevant sind.

Die Teile der Seite seien unterschiedlich gewichtet, erklärt er. Die Gewichtung ist ein Hinweis darauf, wie wichtig ein Seitenelement ist. Wenn also ein Abschnitt eine geringe Gewichtung erhält, ist es nicht so wichtig, dass er mit einer höheren Punktzahl gewichtet wird.

Werbung

Weiter unten lesen

Martin fuhr fort:

„Und dann ist da noch diese andere Sache, die wie Links zu verwandten Produkten zu sein scheint, aber nicht wirklich Teil des Kernstücks ist. Es ist nicht wirklich Hauptinhalt hier. Das scheint zusätzliches Zeug zu sein.

Und dann gibt es eine Menge Boilerplates oder: „Hey, wir haben festgestellt, dass das Menü auf all diesen Seiten und Listen ziemlich gleich aussieht. Das sieht ziemlich ähnlich aus wie das Menü, das wir auf allen anderen Seiten dieser Domain haben“, zum Beispiel, oder wir haben das schon einmal gesehen. Wir gehen nicht einmal nach Domains oder sagen: “Oh, das sieht aus wie eine Speisekarte.”

Wir finden heraus, was wie Boilerplate aussieht und das wird dann auch anders gewichtet.“

Nicht zum Thema gehörende Inhalte werden weniger berücksichtigt

Als nächstes erwähnt Martin, dass, nachdem Google festgestellt hat, worum es auf einer Webseite geht, dass, wenn ein Abschnitt nicht zum Thema gehört, dieser nicht zum Thema gehörende Abschnitt nicht so viel berücksichtigt wird, vermutlich aus Gründen des Rankings.

Martin erklärt:

„Wenn Sie also Inhalte auf einer Seite haben, die sich nicht auf das Hauptthema des restlichen Inhalts beziehen, berücksichtigen wir dies möglicherweise nicht so sehr, wie Sie denken.

Wir verwenden diese Informationen immer noch für die Link-Erkennung und die Ermittlung Ihrer Site-Struktur und all das.

Aber wenn eine Seite 10.000 Wörter über Hundefutter und dann 3000 oder 2000 oder 1000 Wörter über Fahrräder hat, dann ist das wahrscheinlich kein guter Inhalt für Fahrräder.“

Das ist wirklich interessant, denn es scheint zu zeigen, dass, wenn Google feststellt, worum es auf einer Seite geht, der Off-Topic-Inhalt möglicherweise keine Chance auf ein Ranking hat oder, wie Martin sagt, nicht mit „aeine große Überlegung.“

Jason Barnard fragte:

„Das klingt für mich, als würden Sie das semantische HTML5 erraten. Hilft Ihnen semantisches HTML5e oder ist es Ihnen einfach egal? Es hat keinen Sinn?”

Was Jason bezog, war das HTML5-Markup, das die verschiedenen Abschnitte einer Webseite definiert, wie Kopfzeile, Navigation, Fußzeile usw.

Werbung

Weiter unten lesen

Zu Beginn von Martins Diskussion bezog er sich auf die Analyse der inhaltlichen Struktur und des eigentlichen Textes. Das Thema driftet hier also ein wenig in die semantische Struktur von HTML5 ab.

Martin antwortete:

„Es hilft uns, aber es ist nicht das Einzige, wonach wir suchen. Jawohl.”

Herzstück-Anmerkung

Eine Anmerkung ist eine Notiz, die etwas erklärt. Ein Herzstück ist etwas, das als Mittelpunkt der Aufmerksamkeit gedacht ist.

Eine zentrale Anmerkung scheint wie eine Zusammenfassung des Themas des Hauptinhalts zu sein.

Martin erklärt, wie Google die Seite in verschiedene Abschnitte aufteilt und die Teile außerhalb der Herzstück-Anmerkung unterschiedlich gewichtet.

Er erwähnt auch, dass Teile einer Seite, die sich vom Hauptthema unterscheiden, nicht viel berücksichtigt werden, was zu bedeuten scheint, dass Inhalte möglicherweise nicht ranken können.

Zitat

Duda-Webinar zu Essential Rendering

Sehen Sie, wie Martin Splitt erklärt, wie Google eine Webseite nach 28:42 Minuten analysiert:

Werbung

Weiter unten lesen


source site

Leave a Reply