Web-Design XML ergänzt Websprache

Wer Seiten für das Internet plant und baut, darf sich bald seine eigenen Befehle überlegen. Die XML-Ergänzungen beschreiben den Inhalt von Webseiten und machen unter anderem Suchmaschinen genauer.

Hamburg - Seit den Anfängen des World Wide Web wird die so genannte Hypertext Markup Language (HTML) als Gestaltungssprache für Webseiten überall auf der Welt verwendet. Auch wer sich eine private Homepage basteln will, nutzt in der Regel HTML, um die Seite mit Bildern und Texten zu füllen. Die Gestaltungssprache hat allerdings seit jeher Schwächen, die selbst in der aktuellen HTML-Version 4.x nicht ausgeräumt sind.

Die HTML-Befehle, auch "Tags" genannt, beschreiben den formalen Aufbau einer Webseite. So gibt es Tags, mit denen festgelegt wird, wo in einem HTML-Dokument eine Überschrift, ein Absatz oder eine Tabelle steht. Andere Tags beschreiben die Ausrichtung eines Absatzes, die Farbwahl einer Zeichenkette oder die Position eines Bildes.

Suchmaschinen werden genauer

Komplexe thematische Inhalte, wie sie viele Webseiten heute haben, lassen sich mit normalen HTML-Tags jedoch nicht kennzeichnen. Der HTML-Nachfolger, die Extended Markup Language (XML), erweitert deshalb das Konzept von HTML um die inhaltliche Beschreibung von Elementen auf einer Webseite. Während sich HTML-Nutzer auf die Beschreibung von Formaten und Definitionen beschränken müssen, vermögen XML-Autoren auch festzulegen, dass in einem Webdokument beispielsweise ein Absatz den Buchtitel und der andere die Verlagsangabe enthält.

Die beschreibenden Elemente eines XML-Dokuments können vom Webautor von Fall zu Fall erweitert werden. Auf diese Weise lassen sich unterschiedliche Informationsbereiche in XML-Dokumenten mit Hilfe von inhaltlichen Beschreibungen definieren.

Joachim Glaubrecht, Editor-in-Chief des Internet-Portals Altavista.de in Hamburg, erläutert einen entscheidenden Vorteil von XML: "Durch die inhaltliche Beschreibung bekommen XML-Dokumente eine klare Struktur. Suchmaschinen brauchen Webdokumente nicht ausschließlich im Volltext zu erfassen, sondern können sich anhand der Auszeichnungen orientieren, wie die XML-Webseite inhaltlich beschrieben ist."

Programmierer muss Layout kennen und umsetzen

Die Anforderungen an die Programmierung von XML-Seiten sind allerdings höher als bei HTML-Seiten. Der Web-Autor braucht nicht nur Erfahrung in der grafischen Gestaltung, sondern er sollte auch mit Themen und Begriffen vertraut sein, die auf der produzierten Webseite dargestellt werden. Hier wird deutlich, dass XML nicht auf HTML aufbaut, sondern mit der General Markup Language (SGML) verwandt ist. SGML wird überwiegend in der Industrie für die Produktion von großen Dokumentationen eingesetzt, wenn es darauf ankommt, Kapitel, Abschnitte und Seiten mit differenzierten Strukturen und Layouts auszustatten.

Struktur einer Webseite in extra Dokument beschreiben

Wie bei SGML werden zur strukturellen Beschreibung von XML-Dokumenten so genannte DTDs (Document Type Definitions) benutzt. Das DTD einer Webseite, das von einem Spezialisten programmiert wird, hat die Aufgabe, die inhaltliche und formale Struktur möglichst fein abzubilden.

Damit eine Webseite auch entsprechend der DTD-Vorgabe strukturiert ist, wird das DTD als Stylesheet hinzugelinkt. Seit HTML 3.2 können Stylesheets, zum Beispiel Cascading Style Sheets, bei der Anforderung durch den Webbrowser hinzugelinkt und ausgeführt werden. Sie haben den Vorteil, dass Änderungen, die sich viele Seiten auswirken sollen, nur an einer Stelle gemacht werden müssen.

Nach XML kommt ... XHTML

Viele Webdokumente werden noch Jahre auf "reinem" HTML-Code basieren, den die Webbrowser verarbeiten müssen. Dennoch rüsten viele Websites bereits um auf die XML-Intelligenz. Das World Wide Web Consortium (W3C), ein Fachzusammenschluss, der sich um einheitliche Web-Standards bemüht, will allerdings keinen raschen Schnitt und bereitet mit XHTML einen weiteren neuen Standard für die Auszeichnung von Webseiten vor.