Was Data Science für Site-Architekturen tun kann

Das letzte Jahrzehnt hat den Wandel von SEO von tabellenbasierten, anekdotischen Best Practices hin zu einem stärker datengesteuerten Ansatz markiert, was sich darin zeigt, dass immer mehr SEO-Profis Python lernen.

Da die Zahl der Google-Updates zunimmt (11 im Jahr 2023), erkennen SEO-Experten die Notwendigkeit eines stärker datengesteuerten SEO-Ansatzes, und interne Linkstrukturen für Website-Architekturen bilden da keine Ausnahme.

In einem früheren Artikel habe ich dargelegt, wie die interne Verlinkung stärker datengesteuert sein könnte, indem ich Python-Code zur statistischen Auswertung der Site-Architektur bereitstellte.

Über Python hinaus kann Data Science SEO-Experten dabei helfen, versteckte Muster und wichtige Erkenntnisse effektiver aufzudecken, um Suchmaschinen die Priorität von Inhalten auf einer Website zu signalisieren.

Datenwissenschaft ist die Schnittstelle zwischen Codierung, Mathematik und Domänenwissen, wobei die Domäne in unserem Fall SEO ist.

Während also Mathematik und Codierung (ausnahmslos in Python) wichtig sind, hat SEO keineswegs an Bedeutung verloren, da es unglaublich wichtig ist, die richtigen Fragen zu den Daten zu stellen und das instinktive Gefühl zu haben, ob die Zahlen „richtig aussehen“.

Richten Sie die Site-Architektur so aus, dass unterverlinkte Inhalte unterstützt werden

Viele Websites sind wie ein Weihnachtsbaum aufgebaut, wobei die Startseite ganz oben steht (sie ist die wichtigste) und die anderen Seiten in absteigender Reihenfolge ihrer Wichtigkeit auf den folgenden Ebenen geordnet sind.

Für die SEO-Wissenschaftler unter Ihnen: Sie möchten wissen, wie die Verteilung der Links aus verschiedenen Ansichten aussieht. Dies kann mithilfe des Python-Codes aus dem vorherigen Artikel auf verschiedene Arten visualisiert werden, darunter:

  • Site-Tiefe.
  • Inhaltstyp.
  • Interner PageRank.
  • Conversion-Wert/Umsatz.
Bild vom Autor, Dezember 2023Interne Links zur URL

Der Boxplot zeigt effektiv, wie viele Links für eine bestimmte Website auf verschiedenen Website-Ebenen „normal“ sind. Die blauen Kästchen stellen den Interquartilbereich dar (d. h. das 25. und 75. Quantil), in dem sich die meisten (genauer gesagt 67 %) der eingehenden internen Links befinden.

Stellen Sie sich die Glockenkurve vor, aber anstatt sie von der Seite zu betrachten (wie Sie es bei einem Berg tun würden), betrachten Sie sie wie einen über Ihnen fliegenden Vogel.

Das Diagramm zeigt beispielsweise, dass bei Seiten, die zwei Ebenen unter der Startseite liegen, das blaue Kästchen angibt, dass 67 % der URLs zwischen fünf und neun eingehende interne Links haben. Wir können auch sehen, dass dies erheblich (und vielleicht nicht überraschend) viel niedriger ist als bei Seiten, die nur einen Sprung von der Startseite entfernt sind.

Die dicke Linie, die das blaue Kästchen schneidet, ist der Median (50. Quantil) und stellt den Mittelwert dar. Wenn man sich das obige Beispiel ansieht, beträgt der mittlere eingehende interne Link 7 für Seiten der Site-Ebene 2, was etwa 5.000-mal weniger ist als bei Seiten der Site-Ebene 1!

Nebenbei bemerken Sie möglicherweise, dass die Mittellinie nicht für alle blauen Kästchen sichtbar ist. Der Grund dafür ist, dass die Daten verzerrt sind (dh nicht normalverteilt wie eine glockenförmige Kurve).

Ist das gut? Ist das schlecht? Sollten sich SEO-Profis Sorgen machen?

Ein Datenwissenschaftler ohne SEO-Kenntnisse könnte zu dem Schluss kommen, dass es besser wäre, das Gleichgewicht wieder herzustellen, indem er die Verteilung interner Links zu Seiten nach Websiteebene ermittelt.

Daraus könnte ein Datenwissenschaftler bei allen Seiten, die beispielsweise unter dem Median oder dem 20. Perzentil (Quantil in der Datenwissenschaft) für die jeweilige Website-Ebene liegen, schließen, dass diese Seiten mehr interne Links erfordern.

Daher bedeutet dies oft, dass Seiten, die die gleiche Anzahl an Hops von der Startseite haben (d. h. die gleiche Site-Tiefenebene), von gleicher Bedeutung sind.

Aus Sicht des Suchwerts ist dies jedoch unwahrscheinlich, insbesondere wenn man bedenkt, dass einige Seiten auf derselben Ebene einfach eine höhere Suchnachfrage haben als andere.

Daher sollte die Site-Architektur den Seiten mit höherem Suchbedarf Vorrang vor denen mit geringerem Suchbedarf einräumen, unabhängig von ihrem Standardplatz in der Hierarchie – unabhängig von ihrer Ebene!

Überarbeitung des True Internal Page Rank (TIPR)

Der von Kevin Indig populär gemachte True Internal Page Rank (TIPR) hat einen etwas vernünftigeren Ansatz gewählt, indem er den externen PageRank, also den durch Backlinks erzielten Wert, einbezieht. In einfachen mathematischen Worten:

TIPP = Interner Page Rank x Autorität der Backlinks auf Seitenebene

Obwohl das Obige die nicht-wissenschaftliche Version seiner Metrik ist, handelt es sich dennoch um eine viel nützlichere und empirischere Methode zur Modellierung des Normalwerts des Seitenwerts innerhalb einer Website-Architektur. Wenn Sie möchten, dass der Code dies berechnet, lesen Sie bitte hier.

Darüber hinaus ist es weitaus aufschlussreicher, diese Metrik nach Inhaltstyp anzuwenden, anstatt diese Metrik auf Websiteebene anzuwenden. Für einen E-Commerce-Kunden sehen wir unten die Verteilung von TIPR nach Inhaltstyp:

Echter interner PageRank Bild vom Autor, Dezember 2023Echter interner PageRank

Die Darstellung im Fall dieses Online-Shops ist, dass der mittlere TIPR für Kategorieninhalte oder Produktlistenseiten (PLPs) etwa zwei TIPR-Punkte beträgt.

Zugegebenermaßen ist TIPR etwas abstrakt, denn wie lässt sich das auf die Anzahl der erforderlichen internen Links übertragen? Das ist nicht der Fall – zumindest nicht direkt.

Ungeachtet der Abstraktion ist dies immer noch ein effektiveres Konstrukt zur Gestaltung der Site-Architektur.

Wenn Sie sehen möchten, welche Kategorien hinsichtlich ihres Rangpositionspotenzials unterdurchschnittlich abschneiden, sehen Sie einfach, dass PLP-URLs unter dem 25. Quantil liegen, und suchen Sie möglicherweise nach internen Links von Seiten mit einem höheren TIPR-Wert.

Wie viele Links und welcher TIPR? Mit etwas Modellierung ist das eine Antwort für einen anderen Beitrag.

Einführung des Revenue Internal Page Rank (RIPR)

Die andere wichtige Frage, die es zu beantworten gilt, lautet: Welche Inhalte verdienen höhere Platzierungen?

Kevin befürwortete außerdem einen aufgeklärteren Ansatz zur Ausrichtung interner Linkstrukturen auf Conversion-Werte, den viele von Ihnen hoffentlich bereits bei ihren Kunden anwenden; Da muss ich voll und ganz zustimmen.

Eine einfache, nicht wissenschaftliche Lösung besteht darin, das Verhältnis des E-Commerce-Umsatzes zum TIPR zu ermitteln, d. h

RIPR = Umsatz / TIPR

Anhand der obigen Kennzahl können wir erkennen, wie der normale Umsatz pro Seitenautorität aussieht, wie unten dargestellt:

Interner Seitenrang des Umsatzes Bild vom Autor, Dezember 2023Interner Seitenrang des Umsatzes

Wie wir sehen können, ändert sich das Bild etwas; Plötzlich sehen wir keine Box (dh keine Verteilung) für Blog-Inhalte, da für diese Inhalte keine Einnahmen erfasst werden.

Praktische Anwendungen? Wenn wir dies als Modell nach Inhaltstyp verwenden, sollten allen Seiten, die höher als das 75. Quantil (dh nördlich ihrer blauen Box) für ihren jeweiligen Inhaltstyp liegen, mehr interne Links hinzugefügt werden.

Warum? Weil sie einen hohen Umsatz haben, aber eine sehr niedrige Seitenautorität haben, was bedeutet, dass sie einen sehr hohen RIPR haben und daher mehr interne Links erhalten sollten, um näher an den Median heranzukommen.

Im Gegensatz dazu haben diejenigen mit geringerem Umsatz, aber zu vielen wichtigen internen Links einen niedrigeren RIPR und sollten daher von den Links entfernt werden, damit den Inhalten mit höherem Umsatz von den Suchmaschinen mehr Bedeutung beigemessen werden kann.

Eine Einschränkung

In RIPR sind einige Annahmen integriert, wie z. B. die ordnungsgemäße Einrichtung der Analyse-Umsatzverfolgung, sodass Ihr Modell die Grundlage für effektive interne Linkempfehlungen bildet.

Natürlich sollte man wie bei TIPR modellieren, was ein interner Link wert ist, indem man berücksichtigt, wie viel RIPR ein interner Link von einer bestimmten Seite wert ist.

Das ist, bevor wir überhaupt zum Ort der Platzierung des internen Links gelangen.

Mehr Ressourcen:


Ausgewähltes Bild: NicoElNino/Shutterstock

source site

Leave a Reply