Konzepte Content-Repräsentation & Markup-Sprachen

6.5 Die Extensible Markup Language (XML)

Noch während an den WebSGML-Erweiterungen zu SGML gearbeitet wurde, entwickelte das W3-Konsortium (W3C) unter Federführung von Tim Bray eine logische Auszeichnungssprache, die sich besser für den Einsatz im WWW eignen sollte als SGML. Die Extensible Markup Language (XML) sollte eine stark vereinfachte Version von SGML sein, die sich leichter in WWW-Clients einbinden läßt.

Es zeigte sich bald, daß XML keine echte Teilmenge von SGML sein konnte; einige wichtige Änderungen waren nicht rückwärtskompatibel zum ursprünglichen ISO-Standard. Teilweise konnten Lösungsmöglichkeiten für diese Differenzen noch vor der offiziellen Verabschiedung der XML-Empfehlung des W3C in das Technical Corrigendum 2 zu ISO 8879 eingearbeitet werden. Es gab jedoch eine Reihe konzeptioneller Einschränkungen, die sich nicht formalisieren ließen. Daher enthält ISO/IEC 8879 TC2 einen nicht-normativen Anhang — Annex K —, der informell die weitergehenden Anforderungen beschreibt, die ein SGML-Werkzeug erfüllen muß, um ein XML-Dokument verarbeiten zu können.

Im Februar 1998 wurde schließlich die XML-Empfehlung des W3C in der Version 1.0 verabschiedet. Sehr schnell folgten erste Anwendungen, die von dieser neuen Auszeichnungssprache Gebrauch machten. In kurzer Zeit etablierte sich XML als Sprachmittel zur Repräsentation strukturierter Daten für verschiedenste Zwecke, wie z.B. die rechnerübergreifende Kommunikation, Datenbankanwendungen, Speicherung von Konfigurationseinstellungen usw.

Für XML wurde die Verwendung der Zeichen “<” und “>” zur Abgrenzung von Markup und Inhaltsinformationen fest vorgeschrieben. Ein Umdefinieren dieser Zeichen, wie es beispielsweise bei SGML möglich war, wurde zu Gunsten einfacherer Parserimplementierungen nicht mehr zugelassen. Ein Starttag besteht somit immer aus dem Zeichen “<”, unmittelbar gefolgt von dem Bezeichner des Elements. Beendet wird das Tag mit dem Zeichen “>”, wobei sich zwischen dem Elementbezeichner und dem abschließenden Begrenzer weitere Informationen über das Element befinden können. Die Begrenzungszeichen selbst dürfen an dieser Stelle allerdings nicht auftreten.

Zur Unterscheidung von Starttags folgt dem Markup-Begrenzer < im Endtag ein Schrägstrich (“/”) vor dem Elementbezeichner. Außerdem dürfen in einem Endtag keine Zusatzinformationen angegeben werden. Das bedeutet, zwischen dem Bezeichner des Elements und dem abschließenden Begrenzer > dürfen lediglich Leerzeichen oder Zeilenumbrüche angegeben sein, weil diese innerhalb von Markup keine Signifikanz besitzen. (Die einzige Ausnahme besteht hier beim Beginn des Markup — um eine effiziente Erkennung durch einen XML-Parser zu ermöglichen, darf dem Begrenzer < nie ein Leerzeichen folgen.)

Ein wichtiger Grund für die vergleichsweise schnelle Akzeptanz von XML bei Software-Herstellern ist neben der Einfachheit der Sprachdefinition und der daraus resultierenden flexiblen Einsetzbarkeit der transparente und bedarfsorientierte Standardisierungsprozeß des W3-Konsortiums. In schneller Folge konnten unter Beteiligung der im W3C vertretenen Interessengruppen zahlreiche weitere XML-Anwendungen standardisiert werden, die eine breite Basis für die XML-Unterstützung in bestehenden Anwendungsprogrammen schafften. Einige der bekanntesten Standards werden in den folgenden Lerneinheiten ausführlicher betrachtet. Zu erwähnen sind hier vor allem XML Namespaces, Scalable Vector Graphics (SVG), die Synchronized Multimedia Integration Language (SMIL) und die Extensible Stylesheet Language (XSL).

Mittlerweile existieren zahlreiche Erweiterungen zu XML, die der Sprache eine zum Teil stark von ihrem Vorgänger SGML abweichende Ausdruckskraft verleihen. Da Auswirkungen auf die XML-Definition dabei nicht ausblieben, liegt die XML-Empfehlung seit Juni 2000 in einer überarbeiteten Auflage, der 2nd Edition, vor.

In den folgenden Lerneinheiten dieser Qualifikationseinheit werden die Konzepte der logischen Dokumentauszeichung vertieft. Aufgrund der großen Verbreitung dienen die Extensible Markup Language (XML) und die Standard Generalized Markup Language (SGML) in Beispielen und Übungen zur Illustration der vermittelten Inhalte.

Kommentare (0)

Ihr Kommentar

Name