Die Suchmaschinenoptimierung hat nicht nur das Ziel, hochwertige Inhalte und hochwertige Links zu generieren, sie beinhaltet auch technische Aspekte. Grundsätzlich kann eine Webseite nur dann in den Suchmaschinenergebnissen auftauchen, wenn sie Google auch bekannt ist.
Dafür sorgen gewissermaßen Links, die Google auf eine Seite aufmerksam machen lassen. Der Googlebot sucht das Web laufend nach neuen und aktualisierten Inhalten ab und gibt diese weiter. Der sogenannte Webcrawler bekommt den Auftrag, eine Seite zu besuchen, das kann allerdings nur dann erfolgen, wenn diese Google bereits bekannt ist (dazu mehr unter Googlebot).
Google-Sitemap – Das Seiteninhaltsverzeichnis für den Googlebot
Die Google-Sitemap oder sitemap.xml spielt hier eine wichtige Rolle, in mehrerlei Hinsicht. Zunächst einmal muss eine normale Sitemap, die dem Seitenbesucher als Inhaltsverzeichnis und Orientierungshilfe dient, von der Google-Sitemap unterschieden werden. Die Google-Sitemap ist eine Information, die dem Googlebot hilft, alle Teilseiten einer Onlinepräsenz zu indexieren.
Die Google-Sitemap ist vor allem dann erforderlich, wenn einige Seiten Inhalte liefern, die für den Googlebot nicht auslesbar sind; etwa dynamische Inhalte, Bilder, Rich-Ajax Content. Neue Projekte sollten generell mit einer Google-Sitemap versehen sein, da der Googlebot so bei einem Erstbesuch auf alle anderen Inhalte und Unterseiten aufmerksam gemacht wird. Die angeführten Links auf die Unterseiten werden gespeichert und somit relativ zeitnahe besucht und ausgelesen. Die Indexierung aller Inhalte wird somit beschleunigt.
Hier wird auch empfohlen, auf einen logisch strukturierten Aufbau der Website zu achten, nicht in Hinblick auf die Seitenbesucher, sondern auch in Hinblick auf die Suchmaschinen und Suchmaschinenergebnisse. Zudem sollte jede Seite zumindest intern einmal verlinkt sein. Große Websites mit unzähligen Unterseiten sind daher auch im Speziellen auf eine Google-Sitemap angewiesen, da eine übersichtliche, interne Seitenverlinkung, die dem Googlebot bei seiner Arbeit hilft, kaum noch möglich ist.
Wie ist die Google-Sitemap aufgebaut?
Als Standardformat wird eine XML-Sitemap empfohlen (sitemap.xml), vorzugsweise auf Grundlage des XML-Sitemaps-Protokolls, da diese so auch für andere Suchmaschinen verwertbar ist. Generell gilt: Die Datei darf nicht mehr als 50.000 URLs enthalten und im unkomprimierten Zustand nicht größer als 50 MB sein. Sollten diese Limits überschritten werden, muss die Sitemap in mehrere, kleinere Sitemaps aufgeteilt werden. Diese können zusammengefasst und als eine Indexdatei an Google gesendet werden.
Die einfachste Form einer XML-Sitemap ist eine Textdatei, die eine Auflistung aller Seiten einer Online Präsenz in Form eindeutiger URLs Google zur Verfügung stellt. Diese muss UTF-8 codiert sein. Diese kann durch Content-Angaben ergänzt werden, beispielsweise Bilder, Videos oder Software-Quellen.
Die technischen Details würden hier den Rahmen sprengen. Hier kann man gegebenenfalls auf Drittanbieter zurückgreifen, die Vorgaben von Google können zu jedem Zeitpunkt abgerufen werden.
Die Vorteile der Google-Sitemap
Zusammenfassend kann man festhalten, dass die Google-Sitemap oder XML-Sitemap der schnelleren und einfacheren Indexierung von Webinhalten dient. Der Googlebot beziehungsweise dessen Webcrawler können eine Webseite nur dann besuchen, wenn sie über einen Link darauf aufmerksam gemacht wurden.
Das bedeutet, dass jede einzelne Unterseite einer Onlinepräsenz einzeln besucht und indexiert wird. Vereinfacht gesagt: Kein Linkhinweis, keine Aufnahme in den Google-Index.
Die Google-Sitemap liefert dem Googlebot schon beim ersten Besuch den Hinweis, die Vermerke, die Links auf das gesamte Website-Angebot. Das beschleunigt vor allem bei neuen Seiten die Indexierung aller Inhalte. Große Projekte mit tausenden Unterseiten können mittels XML-Sitemap ebenfalls Google die Arbeit erleichtern und diese beschleunigen. Darüber hinaus sollten ein logisch strukturierter Seitenaufbau und eine gute seiten-interne Verlinkung gegeben sein.