Konzepte Content-Repräsentation & Markup-Sprachen

9.1 Einleitung

Unter dem Begriff Wiederverwendung wird im Zusammenhang der Dokumentbearbeitung die Möglichkeit verstanden, einmal erstellte Dokumente oder Dokumentteile in verschiedenen Kontexten wiederverwenden zu können ohne sie manuell ändern oder kopieren zu müssen. Beispielsweise kann man sich leicht vorstellen, daß es Sinn macht, einen Artikel aus einem Journal in einem Buch zu veröffentlichen. Aus dem WWW gibt es oft die Anwendung, daß dem Benutzer verschiedene Sichten auf eine Sammlung von Dokumenten präsentiert werden – auch hier möchte man nicht, daß für jede Sicht die Dokumenteile kopiert werden. Stattdessen ist es vorzuziehen, daß es genau eine wohldefinierte maßgebliche Stelle gibt, an der eine bestimmte Information hinterlegt ist.

Die Umsetzung dieser zunächst selbstverständlich anmutenden Anforderung wirft allerdings einige Fragen auf, die in dieser Lektion vor dem Hintergrund von entsprechenden SGML/XML-Technologien genauer betrachtet werden.

Bei der Wiederverwendung von Dokumentfragmenten ist zum Beispiel zunächst interessant, wie verschiedene Fragmente mit einem Dokument verknüpft werden. In SGML und XML gibt es dafür auf dem Entity-Konzept basierende Mechanismen, die in Abschnitt 9.2 erläutert werden. Hierbei ist zum Beispiel auch die Frage zu klären, wie mit Dokumenten umgegangen werden muß, die aus Dokumentfragmenten verschiedener Dokumenttypen bestehen.

Nicht nur Dokumentfragmente können wiederverwendet werden, sondern auch Dokumenttypdefinitionen und deren General Identifier. Beispielsweise könnte eine Rechnung neben den Elementen eines Dokumenttyps für Rechnungen auch bestimmte Teile enthalten, die mit Elementen aus der HTML-DTD ausgezeichnet sind. XML bietet mit dem XML-Namespace-Mechanismus die Möglichkeit, in Dokumenten Elementtypen verschiedener Namensräume zu verwenden. Dieser Mechanismus wird in Abschnitt 9.3 erläutert.

Eine andere Form der Wiederverwendung von Bildungsregeln besteht darin, Dokumenttypdefinitionen voneinander abzuleiten. Dabei könnte ein Basisdokumenttyp grundlegende Konzepte definieren, beispielsweise daß ein Dokument von Typ “Buch” aus “Abschnitten” besteht, und ein abgeleiteter Dokumenttyp könnte dann definieren, wie die konkreten Elementtypen in einer DTD heißen und wie das ursprüngliche Buch-Konzept darauf abgebildet wird. Für SGML und XML wurde dafür der Mechanismus der Architectural Forms definiert, der in Abschnitt 9.5 erläutert wird. Für XML gibt es den Definitionsmechanismus XML Schema, der im Vergleich zu DTDs leistungsfähigere Definitionsmöglichkeiten bietet und verschiedene Möglichkeiten zur Wiederverwendung von Definitionen vorsieht. XML Schema wird in Abschnitt 9.6 erläutert.

Kommentare (0)

Ihr Kommentar

Name