Konzepte Content-Repräsentation & Markup-Sprachen

8 Informationsgehalt von Dokumenten

Zusammenfassung

Nach der Betrachtung der syntaktischen Merkmale von XML folgt in dieser Lerneinheit eine detaillierte Untersuchung der Arbeitsweise eines XML-Prozessors. Einleitend wird dazu die XML-Deklaration vorgestellt, die dem Parser nähere Informationen über die verwendete Version des XML-Standards, die verwendete Zeichenkodierung und die Verfügbarkeit einer Dokumenttyp-Definition bereitstellen. So können insbesondere die unterschiedlichen Zeichenkodierungen berücksichtigt werden, die bei der verteilten Dokumentbearbeitung typischerweise auftreten.

Ein kurzer Rückblick auf die Entwicklung von SGML zeigt die bei der Standardisierung von XML vorgenommenen Vereinfachungen auf. Anhand der Komplexität der SGML-Deklaration werden diese Entwurfsentscheidungen begründet und die Anforderungen der Rückwärtskompatibilität beispielhaft erläutert. Eine kurze Übersicht über die SGML-Deklaration für XML erklärt die wesentlichen Unterschiede der Syntax beider Auszeichnungssprachen, ohne jedoch die abweichenden Eigenschaften von SGML im Detail vorzustellen.

Die Betrachtung des Verarbeitungsprozesses strukturierter Dokumente wird mit einer Vorstellung der gebräuchlichen Schnittstellen zwischen XML-Prozessor und Anwendungslogik abgeschlossen. Vor dem Hintergrund der historischen Entwicklung werden hier insbesondere die weit verbreiteten und zum Teil standardisierten Schnittstellendefinitionen Document Object Model (DOM) und Simple API for XML (SAX) betrachtet. Parallel dazu wird verdeutlicht, welche Informationen über das jeweilige Quelldokument typischerweise von dem XML-Prozessor an die Anwendungslogik weitergegeben werden.

Kommentare (0)

Ihr Kommentar

Name