Sitemap

Eine XML-Datei, die Suchmaschinen den Aufbau einer Website mitteilt und das Crawling und die Indexierung erleichtert.

Definition

Eine Sitemap ist eine maschinenlesbare Datei, die alle relevanten URLs einer Website auflistet und Suchmaschinen-Crawlern (Googlebot, Bingbot) zur Verfügung gestellt wird. Das gebräuchlichste Format ist die XML-Sitemap, die neben den URLs auch Metadaten wie Änderungsdatum (lastmod), Aktualisierungshäufigkeit (changefreq) und Priorität (priority) enthalten kann.

Bedeutung

Sitemaps sind kein Ranking-Faktor, aber ein Indexierungs-Werkzeug. Sie stellen sicher, dass Suchmaschinen alle Seiten einer Website kennen — auch solche, die über die interne Verlinkung schwer erreichbar sind. Für große Websites mit tausenden Seiten, dynamisch generierten Inhalten oder frisch veröffentlichten Seiten ist eine aktuelle Sitemap eine Voraussetzung für vollständige Indexierung.

Funktionsweise

Die XML-Sitemap wird typischerweise unter /sitemap.xml gehostet und in der robots.txt-Datei referenziert. Suchmaschinen-Crawler lesen die Datei regelmäßig und gleichen die enthaltenen URLs mit ihrem Index ab. CMS-Systeme wie WordPress generieren Sitemaps automatisch (seit WordPress 5.5 nativ oder über Plugins wie Yoast SEO, Rank Math). Große Websites verwenden Sitemap-Index-Dateien, die auf mehrere Sub-Sitemaps verweisen. Die Sitemap kann auch über die Google Search Console oder Bing Webmaster Tools manuell eingereicht werden.

Praxisbeispiel

Ein E-Commerce-Shop mit 5.000 Produktseiten stellt fest, dass Google nur 3.200 Seiten indexiert hat. Nach Einreichung einer aktuellen XML-Sitemap über die Search Console erkennt Google die fehlenden URLs und indexiert innerhalb von zwei Wochen weitere 1.500 Seiten.

Verwandte Begriffe

  • robots.txt: Eine Textdatei im Root-Verzeichnis, die Suchmaschinen-Crawlern mitteilt, welche Bereiche gecrawlt werden dürfen und wo die Sitemap liegt.
  • Crawling: Der Prozess, bei dem Suchmaschinen-Bots Webseiten besuchen und deren Inhalte analysieren.
  • Indexierung: Die Aufnahme einer gecrawlten Seite in den Suchmaschinen-Index, sodass sie in Suchergebnissen erscheinen kann.