Sie arbeiten mit anspruchsvollen Textdaten.
Sie wollen Ihre Daten vielfältig und sinnvoll nutzen.
Machen Sie es sich einfach: Gehen Sie einen Umweg.
Der Umweg führt Sie über die Struktur Ihrer Daten.
Mehr dazu erfahren Sie auf den nächsten Seiten.
Was heißt Struktur?
Zu einer Sprache gehören Wortschatz und Grammatik. Diese
Unterscheidung lässt sich auch auf Textdaten anwenden. Die Grammatik eines
Textes bildet das Regelwerk, das die Inhalte ordnet. Das Regelwerk von
Textdaten kann man Grammatik, Architektur oder Struktur nennen. Wir nennen es im
Folgenden 'Struktur'.
Jeder Text gehorcht einer eigenen Struktur. Betrachten wir die Beispiele
-
Kochrezept - Wörterbuch - Gebrauchsanleitung.
In einem Kochrezept finden wir zwei
inhaltliche Größen: die Zutaten und die Zubereitung der Speise. Ein Blick in ein
Wörterbuch zeigt: Die einzelnen Wörterbuchartikel
bestehen aus zwei Teilen. Jedem Eintrag ist eine Erklärung zugeordnet. Und diese
ist wiederum gegliedert je nach der Art des Wörterbuchs. Von einer
Gebrauchsanleitung erwarten wir, dass sie die einzelnen
Teile eines Gebrauchsgegenstandes in ihren Funktionen erklärt, die sachgerechte
Handhabung erläutert und u.a. auf mögliche Gefahren hinweist.
Warum die Struktur beschreiben?
Die Beispiele zeigen, wie verschieden die Struktur der einen
Textsorte von der einer anderen sein kann. Die Unterschiede liegen in der Natur
der Inhalte und der Funktion eines Textes. Die Struktur eines Textes zu erkennen
und zu beschreiben, ist aber kein Selbstzweck, sondern die Voraussetzung für
professionelle Datenverarbeitung. Nur strukturierte elektronische Daten
ermöglichen
-
Standardisierung,
-
Wiederverwendbarkeit und
-
multimediale Präsentation.
single source - multiple use
heißt die Zauberformel, die dieses Datenverständnis zusammenfasst:
Die Daten sind nur einmal vorhanden und bilden die Quelle für die vielfältigen
Möglichkeiten der Transformation und Präsentation, die Ihnen XML bietet. Ob Print,
CD-ROM oder Internet, ob in toto oder als Extrakt - je nach Kontext und Adressat
wählen Sie die Präsentation Ihrer Daten. Styling und Medium ändern sich - die Quelldaten nicht.
Wie erkenne ich die Struktur der Textdaten?
Der Weg der Strukturdefinition von Textdaten führt
über die
Daten- und Inhaltsanalyse zum
Informationsdesign. Hier werden Fragen gestellt wie
z.B.
-
Aus welchen Bausteinen setzt sich der Text zusammen?
-
Welche formale oder inhaltliche Funktion haben die Bausteine?
-
Welcher Hierarchie gehorchen die Bausteine?
-
Welche Datentypen haben die Bausteine?
-
Welche Bausteine sollen wiederverwendet werden?
Nachdem die Struktur definiert ist, werden die Daten nach ihr
erfasst oder Bestände konvertiert.
Die Struktur: DTD und XML-Schema
Informationsdesign basiert auf einer Dokumenttypdefinition. Diese bestimmt die Struktur,
der Ihre Daten gehorchen müssen. Zur Formulierung einer solchen Strukturdefinition stehen
zwei Metasprachen zur Auswahl:
DTD und
XML-Schema.
-
Eine DTD validiert SGML/XML-Daten und verwendet eine
eigene Syntax,
-
ein XML-Schema validiert nur XML-Daten und
spricht selber XML.
Struktur: individuell oder Standard?
Eine DTD oder ein XML-Schema zu designen, ist eine komplexe Arbeit.
Das Ergebnis ist ein individuelles Regelwerk, das speziell
auf Ihre Daten zugeschnitten ist.
Dem gegenüber steht die Standardlösung: Als open source verfügbare Standard-DTDs und -Schemas decken
ein breites Spektrum an Dokumenttypen ab: z.B. DocBook und
DITA für Dokumentationen und Fachbücher,
BMEcat für Kataloge, TEI
für wissenschaftliche Arbeiten.
Da eine Standardstruktur vielem gerecht werden muss, gehen die individuellen Ansprüche oft
im Meer der Möglichkeiten unter. Hier kann eine Anpassung helfen: Das was nicht notwendig ist,
wird ausgeblendet, die Standard-DTD, das Standard-Schema wird
customized.
Eine Standardlösung ist ein Labyrinth mit vielen Wegen und vielen Zielen.
Mit einer individuellen Anpassung definiert man den einen Weg, der zum eigenen Ziel führt.
Egal, für welchen Weg Sie sich entscheiden: Ich helfe Ihnen gerne dabei.
Know How
- Analyse inhaltlich strukturierter Dokumente
- formale und inhaltliche Strukturierung von Dokumenten
- Überführung der Struktur in DTD/XML-Schema-Design
- Anpassungen von Standard-DTDs und XML-Schemas (z.B. DocBook, DITA, BMEcat)
- DTD/XML-Schema-Maintenance (Pflege und Weiterentwicklung)
- Migration von DTDs und XML-Instanzen (z.B. von SGML nach XML)
- Validierung und Qualitätsprüfung von SGML/XML-Instanzen
- Weiterverarbeitung und multimediale Präsentation der XML-Instanzen
Markup Languages
- SGML, XML, XSLT, XSL-FO, HTML, XHTML, CSS, FOSI
SGML/XML-Editoren und Tools
- Near&Far, XMLSpy, Arbortext (vormals Epic) Editor, XMetal, oXygen XML-Editor
- 1982-1989 Studium der Germanistik und Philosophie, Schwerpunkt: deutsche
Sprachwissenschaft
- 1989 Magister Artium
- 1989-1992 Mitarbeit im DFG-Sonderforschungsbereich 226 'Wissensorganisierende und
wissensvermittelnde Literatur im Mittelalter'
- 1989-1993 und 1994-2001 Dozentin an der Universität Würzburg, Abt.
Sprachwissenschaft
- 1993 Promotion zum Dr. phil.
- 1993-1994 Professorin für deutsche Sprachwissenschaft in Jyväskylä/Finnland
- 1993-1994 Mitarbeit am deutsch-lateinischen Wortregister zur Edition des
'Vocabularius Ex quo'
- 1996-1998 Edition des Manuskripts 'Die hippologisch gebildeten Pflanzennamen im
Deutschen und Englischen' von Rudolf Majut, S. Hirzel 1998
- 2001-2005 Informationsdesignerin bei der empolis GmbH
- seit 2005 freiberufliche Informationsdesignerin
Für mich war der Weg vom linguistischen Interesse an Sprache und ihren
Strukturen zu Analyse und Design von Textdaten ein stringenter. Seit 1996 befasse ich mich
vorrangig mit SGML- und XML-kodierten Daten. Erfordert es ein Projekt, arbeite ich zusammen mit erfahrenen
selbständigen
Beratern. Neben meiner Tätigkeit als Entwicklerin biete
ich bei Bedarf Schulungen an.