Ein Parser ist ein Programm, welches überwiegend in der Informatik zum Einsatz kommt. Der Begriff Parser leitet sich aus dem Englischen „to parse“ (analysieren) ab und wird im Deutschen oftmals mit „Zerteiler“ übersetzt. Letztendlich ist diese deutsche Übersetzung recht zutreffend, da der Parser tatsächlich vorhandene Informationen zerteilt und in eine Form bringt, mit welcher entsprechende Computerprogramme agieren können. Man könnte auch den Begriff „Umwandler“ bemühen, da Programmcode und Datensätze in eine für ein bestimmtes Programm definierte, und verständliche Form umgewandelt werden.
Wo wird ein Parser verwendet?
Parser haben verschiedene Einsatzgebiete und erfüllen dabei leicht unterschiedliche Aufgaben. Eine Vielzahl dieser Parser erfüllen dabei Web bezogene Aufgaben, andere wiederum dienen dem Auslesen einer Programmiersprache. Die daraus resultierende Datenstruktur kann nun mittels eines sogenannten Compilers (ein weiteres Computerprogramm) entsprechenden Maschinencode erzeugen, der zur Ausführung benötigt wird.
Wie bereits erwähnt, ermöglichen viele Parser Web bezogene Programme und Funktionen. So gibt es den sogenannten RSS-Parser. Dieser wandelt RSS-Feeds in ein passendes Format um, etwa in ein HTML Dokument, sodass der User den Feed auch entsprechenden lesen kann. Der URI-Parser dient der Darstellung von URLs, diese werden ihrem hierarchischen Aufbau nach aufgelöst. Auch der XML-Parser analysiert XML-Dokumente und stellt entsprechende Elemente, etwa Attribute, zur Weiterverarbeitung zur Verfügung.
Webdesign und SEO Bezug
Aus der Sicht der Suchmaschinenoptimierung, die bekannter Weise auch das Web Design beinhaltet, sind die beiden folgenden Einsatzgebiete von besonderem Interesse: Die Parser der einzelnen Webbrowser (Firefox, Internet Explorer, Chrome und Co.), sowie die Parsertätigkeiten der Suchmaschinen, wiederum allen voran jener von Google.
Für das Webdesign sind die Parser oder auch Rendering Engines der einzelnen Browser von besonderem Interesse. Diese sind letztendlich dafür verantwortlich, wie eine Website in dem jeweiligen Browser und in der jeweils entsprechenden Browserversion dargestellt wird. Hier verarbeiten die Parser das angeforderte HTML Dokument einer Webseite, sodass diese in bekannter Form am Bildschirm erscheint.
Interessant ist dabei jener Aspekt, dass die verschiedenen Browser keine einheitliche Rendering Engine verwenden und sich somit auch Darstellungsunterschiede ergeben. So muss ein Webdesigner, der ein großes Spektrum an Webbrowsern optimal abdecken möchte, auch dementsprechende Tests und Anpassungen vornehmen, um ein einheitliches Darstellungsbild einer Website garantieren zu können.
Googles Parser liefert eine Keywordliste
Ein ganz konkreter Bezug zur Suchmaschinenoptimierung ergibt sich, wenn man die Arbeiter der Parser in Googles „Information Retrieval System“ genauer unter die Lupe nimmt. Hier begeben sich die sogenannten Crawler auf Informationssuche. Jede Seite, die von einem Crawler besucht wird, landet in einer Liste in dem sogenannten Repository. Dort werden diese gelagert und später an einen Parser weiter geleitet. Der Parser bereitet nun diese Daten nun so auf, dass sie für die Dokumentenanlyse verwendet werden können. Hier wird ein einem mehrstufigen Prozess ein einheitliches Datenformat hergestellt, welches nur für die Datenanalyse relevante Daten enthält. Nebenbei wird so auch die ursprüngliche Datenmenge wesentlich reduziert.
Dieser Prozess der Datenaufbereitung enthält folgende Schritte:
- Datennormalisierung
- Wortidentifikation
- Sprachenidentifikation
- Wordstemming
- Mehrwortgruppenidentifikation
- Stoppworterkennung
- Keywordgewinnung
- URL-Verarbeitung
Abschließend wird die Datenstruktur gesichert. Diese Datenaufbereitung und Dokumentenanalyse, die Arbeit des Parsers, liefert letztendlich eine Liste an Schlüsselwörtern, welche die jeweilige Ressource exakt beschreiben.