Googlebot crawlt und indiziert die ersten 15 MB HTML-Inhalte

In einer Aktualisierung des Hilfedokuments des Googlebot hat Google leise angekündigt, dass es die ersten 15 MB einer Webseite crawlen wird. Alles, was nach diesem Cutoff erfolgt, wird nicht in die Ranking-Berechnungen einbezogen.

Google gibt im Hilfedokument an:

„Alle im HTML referenzierten Ressourcen wie Bilder, Videos, CSS und JavaScript werden separat abgerufen. Nach den ersten 15 MB der Datei stoppt der Googlebot das Crawling und berücksichtigt nur die ersten 15 MB der Datei für die Indizierung. Die Dateigrößenbeschränkung wird auf die unkomprimierten Daten angewendet.“

Dies blieb einige in der SEO-Community fragen sich wenn dies bedeuten würde, dass der Googlebot Text vollständig ignorieren würde, der am Cutoff in HTML-Dateien unter Bilder fällt.

„Es ist spezifisch für die HTML-Datei selbst, so wie es geschrieben steht“, stellte John Mueller, Google Search Advocate, via Twitter klar. „Eingebettete Ressourcen/Inhalte, die mit IMG-Tags abgerufen werden, sind kein Teil der HTML-Datei.“

Was das für SEO bedeutet

Um sicherzustellen, dass es vom Googlebot gewichtet wird, müssen wichtige Inhalte jetzt im oberen Bereich der Webseiten enthalten sein. Das bedeutet, dass der Code so strukturiert sein muss, dass die SEO-relevanten Informationen mit den ersten 15 MB in eine HTML- oder unterstützte textbasierte Datei gepackt werden.

Das bedeutet auch, dass Bilder und Videos nach Möglichkeit komprimiert und nicht direkt in HTML kodiert werden sollten.

SEO Best Practices empfehlen derzeit, HTML-Seiten auf 100 KB oder weniger zu beschränken, so dass viele Websites von dieser Änderung nicht betroffen sind. Die Seitengröße kann mit einer Vielzahl von Tools überprüft werden, einschließlich Google Page Speed ​​Insights.

Theoretisch mag es besorgniserregend klingen, dass Sie potenziell Inhalte auf einer Seite haben könnten, die nicht für die Indexierung verwendet werden. In der Praxis sind 15 MB jedoch eine ziemlich große HTML-Menge.

Wie Google angibt, werden Ressourcen wie Bilder und Videos separat abgerufen. Basierend auf der Formulierung von Google scheint diese 15-MB-Grenze nur für HTML zu gelten.

Es wäre schwierig, diese Grenze mit HTML zu überschreiten, es sei denn, Sie würden den Text eines ganzen Buches auf einer einzigen Seite veröffentlichen.

Sollten Sie Seiten haben, die 15 MB HTML überschreiten, liegen wahrscheinlich grundlegende Probleme vor, die ohnehin behoben werden müssen.


Quelle: Google-Suchzentrale
Beitragsbild: SNEHIT PHOTO/Shutterstock


source site

Leave a Reply