Dr. Thomas Kahlisch: XML - Der Schlüssel zu multimedialen Informationsangeboten für blinde und sehbehinderte Menschen

Vorbemerkung



Im Mittelpunkt des Artikels stehen die Chancen und Probleme des computergestützten Informationszugangs blinder und sehbehinderter Menschen. Den Schwerpunkt bilden dabei die Problemfelder sowie die Anwendungsbereiche moderner und offener Dokumentverarbeitungskonzepte auf der Basis von XML zur verbesserten Informationsbereitstellung für diesen Personenkreis.

Zu Beginn der Ausführungen werden die existierenden Informationsbarrieren bei der Nutzung computergestützter Informationssysteme aufgezeigt.

Das zweite Kapitel beschreibt die Gründe für die Entwicklung eines intermedialen Dokumentenformates XML, seine Vorteile und die auf diesem Internetstandard basierenden multimedialen Dokumentverarbeitungskonzepte.

Kapitel drei zeigt die Anwendungsbereiche intermedialer Dokumentverarbeitung für die Produktionsbedingungen von Hörbuch- und Blindenschriftbüchereien. Dazu werden die Arbeit des DAISY Consortiums zur Entwicklung völlig neuer digitaler sprechender Bücher und deren mögliche Einsatzfelder dargestellt.

Der Vorschlag eines single Source - multiple Usage Konzeptes zur weitestgehend medienunabhängigen Dokumentverarbeitung in einer Blindenbücherei, steht im Mittelpunkt dieses Kapitels. Der Artikel endet mit einer kritischen Wertung der diskutierten Konzepte.


Einleitung



Wer Zimmers Artikelserie in "Die Zeit" über die Digitale Bibliothek [1] gelesen hat, dem dürfte endgültig klar geworden sein, [Fußnote: [1] Zimmer, D. E.: Die digitale Bibliothek. Eine Artikelserie für Freunde und Verächter von Computernetzen. Die Zeit, URL: www.zeit.de, 1998. Nachdruck in Blindenschrift: DZB- Nachrichten, 01 - 06/1999. Fußnote Ende] dass die Erfüllung des Traums vom vollständig im Internet abrufbaren Buchbestand weit entfernt ist. Ja, mit großer Wahrscheinlichkeit niemals Realität wird. Alle Bücher in elektronischer Form lesbar und recherchierbar zu machen, ist ein Ziel, welches wohl nur von Idealisten wie den fleißigen Helfern des "Projekt Gutenberg" verfolgt wird. Wie Zimmer deutlich macht, ist der Aufwand viel zu hoch und würde enorme Ressourcen verschlingen, wollte man jede bereits gedruckte Publikation über das Internet anbieten.

Viele Angebote im Netz der Netze bieten neben Speicherplatz und Ladezeit fressender Werbung mehr kurzgehaltene Informationen, die übersichtlich, durchsuchbar und ordentlich miteinander verknüpft sind. Im Vordergrund stehen dabei Informationen über das Wissen und nicht in jedem Fall das vollständig abrufbare Buch. Diese Entwicklung ist verständlich, welcher Computernutzer liest schon mehr als drei Seiten eines Dokumentes am Bildschirm- In aller Regel werden Volltexte am Bildschirm überflogen oder dazu verwandt, umfangreiche und komfortable Textrecherchen auszuführen.

Für Blinde und Sehbehinderte, die unter Nutzung von Braillezeilen, Sprachausgaben und Großschriftsystemen Zugang zu Personalcomputern haben, sind elektronisch publizierte Texte ein in besondererweise interessantes Informationsangebot. Über den PC, ausgerüstet mit einem CD-ROM-Laufwerk und/oder einem Internetanschluß, lassen sich auch von diesem Personenkreis Volltextdatenbanken abfragen, multimediale Nachschlagewerke recherchieren, elektronische Bücher lesen und eine ständig wachsende Zahl von Internetseiten durchstöbern. Wenn..., ja, wenn da nicht so einige Informationsbarrieren beim Zugriff auf diese Daten bestünden.

Auch die Leser gedruckter Blindenschrift und aufgesprochener Hörbücher, die selbst keine Computeranwender sind, könnten von der Digitalisierungswelle in der Verlags- und Druckwelt profitieren. Schließlich setzen die Blindenbüchereien zunehmend computergestützte Verfahren ein, um Punktschrifttexte und Hörbücher zu produzieren. Leider sind viele in der Verlagsindustrie zum Einsatz kommende Dokumentenformate nicht sonderlich gut geeignet, um automatisch in ein für blinde Leser geeignetes Format konvertiert zu werden.

In diesem Artikel soll aufgezeigt werden, welche Informationsbarrieren für Blinde und Sehbehinderte in der digitalen Dokumentverarbeitung bestehen und welchen Einfluß diese Barrieren auf die Arbeit der Blindenbüchereien haben.

Gleichzeitig werden moderne Konzepte der intermedialen Dokumentverarbeitung auf der Basis von XML vorgestellt, die zeigen, wie diese Barrieren abgebaut werden können.


1 Informationsbarrieren bei der digitalen Dokumentverarbeitung

1.1 OCR-Barriere



Wie bereits gesagt, der Aufwand alle Bücher, historische und aktuelle Bestände, vollständig zu digitalisieren ist zu hoch. Das Digitalisieren umfaßt hierbei nicht allein das Scannen und Abspeichern der Buchseiten als Bilddaten auf der Festplatte, sondern auch die nach diesem Vorgang durchzuführende Texterkennung (OCR), Strukturierung und Fehlerkorrektur des bearbeiteten Dokumentes. Diese Arbeitsschritte sind aufwendig und unbedingt notwendig, wenn die elektronischen Inhalte flexibel präsentiert und komfortabel zu recherchieren sein sollen. Welche Probleme bei der Texterkennung auftreten können, ist Anwendern sogenannter Lesesysteme (PC der mit einem Flachbettscanner, einer OCR-Software und einer sehgeschädigtengerecht gestalteten Benutzungsoberfläche ausgestattet ist) bestens bekannt. Diese Systeme versagen, wenn die Vorlagen schlecht gedruckt oder komplex und aufwendig gestaltet sind.

Der kritische Leser mag sich an dieser Stelle fragen: Könnten nicht Arbeitszeit und Ressourcen gespart werden, wenn auf das Scannen gedruckter Seiten verzichtet und gleich auf die elektronischen Vorlagen zugegriffen wird.


1.2 Format-Barriere



Die in der Verlagswelt häufig eingesetzten DTP-Systeme wie Pagemaker und QuarkXPress ermöglichen es bislang nicht, aufwendig und ansprechend gestaltete Satzdaten in ein text- und strukturorientiertes Format zu konvertieren. Beispielsweise läßt sich der Text eines Buches, welches im Format QuarkXPress geschrieben wurde, im ASCII-Format abspeichern, jedoch gehen dabei viele Informationen wie Spalteneinteilungen oder Seitenwechsel verloren. Aus diesen durcheinander geratenen ASCII-Daten lassen sich nur mit manuellen Nacharbeiten wieder lesbare Dateien erzeugen.


1.3 Bild-Barriere



Verschärft werden die Probleme bei der Weiterverarbeitung von Satzformaten durch die hierbei übliche Praxis, in die Dokumente eine Fülle von Bilddaten hineinzupacken. Ein Texterkennungssystem ist hierbei chancenlos. Im besten Fall kann wenigstens noch die Bildunterschrift ausgewertet werden. Die Information, die im Bild steckt, kann bei einer Konvertierung nicht weiterverarbeitet werden. Systeme zur Bilderkennung und zum Bildverstehen sind in Entwicklung und werden zukünftig hierbei Einsatz finden.

Selbstverständlich kann und soll Text nicht die Bilder in einem Buch ersetzen. Ein Bild sagt mehr als tausend Worte. Jedoch sind in den Bilddaten häufig auch Zahlen, Buchstaben und Sonderzeichen verborgen. Beispiele hierfür sind mathematische oder andere formale Darstellungen, die in Satzsystemen in aller Regel nur als Bilddaten verfügbar sind und somit bislang bei der Konvertierung in ein strukturiertes Textformat verloren gehen.

Eine Ausnahme stellt hier das in der technischen und akademischen Welt sehr geschätzte LaTeX dar. Dieses auf TeX basierende und frei verfügbare Textsatzsystem bietet eine sehr leistungsfähige Makrosprache, die es dem Anwender ermöglicht, Mathematik, Chemie und vieles andere mehr als Zeichenketten zu beschreiben, in grafischer Form am Bildschirm anzuzeigen und in hoher Qualität auszudrucken. Die Einsatzfelder und vielen Anpassungsmöglichkeiten von LaTeX, aber auch die Probleme der Umsetzung grafischer Repräsentation in für Blinde und Sehbehinderte geeignete Form, sollen hier nicht Gegenstand der Betrachtungen sein. [Fußnote: [2] Kahlisch, Th.: Software-ergonomische Aspekte der Studierumgebung blinder Menschen. Verlag Dr. Kovac, Hamburg 1998, ISBN 3-86064-797-0. Fußnote Ende]


1.4 Interaktionsbarriere



Moderne PC-gestützte Lese- und Recherchesysteme sind in aller Regel mit grafischen Benutzungsoberflächen ausgerüstet. Durch den Einsatz von Screenreader-Programmen (Software, die die grafische Benutzungsoberfläche in einer textuellen Form über Sprachausgabe und Braillezeile zugänglich macht) können von blinden Anwendern Systemund Anwendungsprogramme auf MS Windows 95/98 oder NT genutzt werden.

Diese auch als Brückensoftware bezeichneten Hilfsprogramme verwenden Informationen, die vom Betriebssystem und von Anwendungsprogrammen über entsprechende Schnittstellen bereitgestellt werden müssen.

Informationen die ohne Berücksichtigung dieser Schnittstellen von der Software auf der grafischen Benutzungsoberfläche ausgegeben werden, sind durch die Brückensysteme nicht in die für den blinden Anwender geeigneten Darstellungen übertragbar.

Zusätzliche Probleme beim Einsatz von Screenreadern bereiten die von den Anwendungsprogrammen häufig angebotenen mausorientierten Interaktionsformen. Verfügt die Anwendungssoftware nicht über tastaturorientierte Bedienmöglichkeiten, so ist der blinde Anwender in seinen Interaktionsmöglichkeiten sehr eingeschränkt. Durch die oben beschriebene Bild-Barriere sind rein auf grafischer Manipulation basierende Interaktionsformen für den Nutzer eines Screenreaders nicht nachvollziehbar.

Die Vielfalt der Interaktionsprobleme führt häufig zu Frustrationen der blinden Nutzer.

Jeder blinde Windows-Anwender kennt die Situation: Ein Bekannter hat ein neues multimediales Nachschlagewerk auf CD- ROM, welches er gern am Computer seines sehgeschädigten Freundes ausprobieren möchte. Die Freude ist meist recht kurz. Auch nach erfolgreicher Installation und dem zeitraubenden Trainieren der Icons des neuen Programmes will keine Zufriedenheit aufkommen. Die Benutzungsoberfläche ist so komplex, dass der blinde Anwender lange suchen und trainieren muss, um die gewünschten Funktionen auszuführen. Häufig ist er dabei auf die Hilfe eines erfahrenen Windows-Anwenders angewiesen, der das Anwendungsprogramm konfigurieren kann und möglichst noch die speziellen Anpassungen am Screenreader vornimmt.

Um nicht zu schwarz zu malen, sei hier die Bemerkung gestattet, dass auch viele sehende Computeranwender mit dem Überangebot an Funktionalität in neuer Software ihre Probleme haben. Ja, kaum ein Anwender die Vielfalt der Möglichkeiten, die beispielsweise eine moderne Textverarbeitung bietet, überschauen, geschweige denn noch nutzen kann.

Aus Software-ergonomischer Sicht ist die Funktionsüberfrachtung moderner Programmsystme, ohne gleichzeitig Möglichkeiten zur Individualisierbarkeit oder Vereinfachung anzubieten, wenig sinnvoll. Sie vermittelt zuweilen den Eindruck, dass die Nachfrage der Anwender nach neuen Features und Produkten künstlich erzeugt werden soll.


1.5 MS-DOS-Barriere!



Aus folgenden Gründen geben derzeit im privaten Bereich blinde Anwender dem in der Zwischenzeit in die Jahre gekommenen Betriebssystem MS-DOS den Vorzug gegenüber den modernen grafischen Alternativen:



Mit Linux steht blinden und sehbehinderten Computernutzern ein leistungsfähiges und modernes Betriebssystem zur Verfügung. [Fußnote: [3] Friemarei, F.: Den Computer Fühlen und Hören. BLINUX als Wegweiser für neue Benutzerschnittstellen. CT, 4/1999. Fußnote Ende]

Aufgrund der kommandoorientierten Bedienmöglichkeiten stellt es eine interessante Alternative dar. Jedoch erfordert die Installation, Konfiguration und Bedienung des Systems fundierte Kenntnisse. Wer mit EMACS, LaTeX und Scriptsprachen vertraut ist, hat mit diesem System eine moderne und allen Anforderungen entsprechende Plattform, die abgesehen von den Möglichkeiten der Grafikverarbeitung, barrierefrei ist.

Zweifellos ist und bleibt der PC mit MS Windows System das am häufigsten genutzte computergestützte Arbeitsmittel im Bürobereich. Deshalb ist es auch für blinde und sehbehinderte Anwender unumgänglich, mit diesem System vertraut zu sein. Gleichzeitig muss dafür Sorge getragen werden, Neuentwicklungen so zu konzipieren, dass bereits existierende Informationsbarrieren abgebaut und neue nicht entstehen können.

Der im nachfolgenden Abschnitt dargestellte Ansatz einer intermedialen Dokumentverarbeitung auf Basis von XML, stellt ein offenes und ausbaufähiges Konzept dar, Informationsbarrieren entgegenzuwirken und eine entscheidende Verbesserung des Informationszugangs zu erreichen.


Intermediale Dokumentverarbeitung


Siegeszug und Grenzen von HTML



Ein Grund für die rasche Verbreitung des Internet ist zweifellos die Einfachheit die hinter dem Konzept des WWW (World-Wide Web) und dem dazugehörigen Dokumentenformat HTML (HyperText Markup Language) steckt.

Jeder Computernutzer kann, mit verhältnismäßig geringem Aufwand, eigene Internetseiten im Format HTML erstellen und über einen WWW-Server weltweit verfügbar machen. Noch einfacher ist es, die Seiten mittels eines Web-Browsers aus dem Netz auf die Festplatte eines PC zu laden, die Inhalte anzuzeigen, auszudrucken oder in anderen Anwendungen weiter zu bearbeiten.

HTML bietet Möglichkeiten Texte zu strukturieren (z.B. Untergliederung in Überschriften, Absätze, Aufzählungslisten, Tabellen und Bilder) und zu gestalten (z.B. Festlegung von Schriftart, Schriftgröße und Farbe). Der Autor eines HTML- Dokumentes kann über die Nutzung von Hyperlinks sein Dokument mit Verweisen auf andere Informationen im Internet anreichern.

Hyperlinks sind geeignet, Informationen zu strukturieren sowie Navigationshilfen und themenrelevante Zusatzinformationen anzubieten.

Nicht zuletzt muss darauf hingewiesen werden, dass HTML und die entsprechenden Web-Browser die Integration von Grafiken und Bildern auf komfortable Weise gestatten. Auch das Einbinden von Video- oder Audiosequenzen ist kein Problem. Nur die Leitungsqualität muss die Übertragung der Daten in entsprechender Geschwindigkeit zulassen. Ansonsten wird aus WWW sehr schnell "Welt weit Warten".

Telefonieren, Radio hören, Fernsehen, Studieren, Einkaufen und fast jede Form des Geldverdienens soll zukünftig per Internet möglich sein. Dies stellt viele Anforderungen an die im WWW eingesetzten technologischen Konzepte, die von der aktuellen Version 4.0 der Formatierungssprache HTML längst nicht erfüllt werden. Die dabei existierenden Grenzen lassen sich anhand der folgenden Forderungen verdeutlichen:



Dabei immer der neuesten Mode zu entsprechen und sich von den anderen Angeboten abzuheben ist häufig ein wichtiges Ziel. Text wird dazu nicht mit standardisierten HTML-Elementen ausgezeichnet, sondern als Grafik in das Dokument integriert.

Eine verständliche Arbeitsweise, berücksichtigt man, dass bei weitem nicht alle in der Grafiker- und Designerwelt üblichen Gestaltungsformen mit dem aktuellen HTML-Sprachumfang umzusetzen sind. Was manche Web-Designer dabei außer Acht lassen ist die Tatsache, dass Text der in einem Bild oder in einer Grafik versteckt ist, nur sehr aufwendig zu extrahieren und zu durchsuchen ist. Auch der Anwender eines textorientierten Web-Browsers kann mit noch so schön gestalteten und ausschließlich als Bitmap verfügbaren Schriftzügen beim Online-surfen nichts anfangen.

Ein Problem, das alle Internetnutzer ärgert ist die mit der Fehlernummer 404 gekennzeichnete Situation: Ein Hyperlink verweist auf eine Adresse im Netz, die nicht mehr existiert. Längst wurde das referenzierte Angebot verändert, jedoch der Verweis auf diese Ressource wurde bei der Änderung vergessen. Schade eigentlich, gern hätte man diesem Hinweis nachgehen wollen, aber HTML kennt keine bidirektionalen Verweise.

Nachfolgend werden derzeit in der Diskussion befindliche Weiterentwicklungen des W3C (World-Wide Web Consortium) dargestellt, die die oben aufgeführten Anforderungen erfüllen.


XML - Erweiterbare Auszeichnungssprache für elektronische Dokumente


HTML besitzt einen fest definierten Sprachumfang. Die Erweiterungswünsche der Anwender sind vielfältig und von unterschiedlichen Interessen getragen. Die Spanne reicht dabei von Anforderungen der Verlagsindustrie, die eine größere und flexiblere Gestaltungsvielfalt bei den Formatierungsanweisungen sowie einen wirksamen Schutz des Copyrights der Dokumente wünschen, bis zu Forderungen der Betreiber von Mobilfunknetzen, die auch bei geringeren Übertragungsraten ansprechend gestaltete Web-Seiten auf den Funktelefonen ihrer Kunden zur Anzeige bringen wollen.

Um diesen Wünschen gerecht werden zu können, entwickelt das W3C die erweiterbare Auszeichnungssprache XML (Extensible Markup Language), die dem Anwender die Möglichkeit gibt, seinen Anforderungen entsprechend Strukturierungs- und Formatierungsanweisungen zu definieren.

Die Idee ist so neu nicht. Bereits in den 70er Jahren entwickelte Goldfarb mit GML eine verallgemeinerte Auszeichnungsprache. 1986 wurde SGML (Standard Generalized Markup Language) als internationaler Standard veröffentlicht und findet breite Anwendung in Bereichen der technischen Dokumentation und des Dokumentmanagements.

Das 1997 vorgestellte XML ist die vereinfachte Version von SGML. Wie die Entwickler wissen ließen, ist XML, gegenüber seinem großen Bruder, wesentlich einfacher zu implementieren und wird sich somit schnell als nützliches Werkzeug im Internet verbreiten. Was steckt hinter dem Konzept und welche Vorteile bietet es gegenüber HTML-

Trennung von Inhalt, Struktur und Layout

Wie bereits dargestellt ist der Ausgangspunkt des in XML umgesetzten Konzeptes der Wunsch des Anwenders oder einer Anwendergruppe, in seinen/ihren Dokumenten selbst bestimmen zu können, welche Informationen markiert, strukturiert, formatiert und auf welche Weise angezeigt werden.

Die Struktur der Informationen legt der Anwender in einer DTD (Document Type Definition) fest. Die DTD beschreibt die Bausteine oder Strukturelemente sowie deren Beziehungen untereinander, aus denen sich ein Dokument zusammensetzen kann. Je nach Anwendergruppe können dies verschiedene Bausteine sein. Beispielsweise enthält die DTD zur Beschreibung eines Buches Elemente wie Überschriften, Absätze und Abbildungen, aber sicher auch bibliografische Angaben wie Autor, Verlag, ISBN und das Erscheinungsjahr.

Die DTD, die bei einem Mobilfunknetzbetreiber zum Einsatz kommt, wird u.a. folgende Angaben enthalten: Telefonnummer, Name des Anrufers, E-Mailadresse, Tarifzone und Gesprächsdauer.

Hierbei definiert nicht jeder Anwender seine eigene DTD, sondern greift in aller Regel auf bekannte und bewährte Lösungen zurück. Es gibt TeachML für elektronische Lehr- und Lernmaterialien, MathML zur Darstellung von mathematischen Zusammenhängen und viele weitere Entwicklungen, die sicherstellen, dass jede Interessengruppe ihr eigenes Strukturierungsformat nachnutzen oder für Spezialfälle modifizieren kann.

Wichtig bei der Gestaltung einer DTD ist, dass in ihr nur die erforderlichen Strukturelemente vereinbart werden. Auf welche Art und Weise der Inhalt dieser Elemente formatiert wird, ist hierbei noch nicht festgelegt. Diese Trennung von Inhalt, Struktur und Layout bildet den entscheidenden Vorteil des Konzeptes. Sie ist die Grundvoraussetzung, um die Dokumentverarbeitung intermedial also medienunabhängig zu halten.


2.2.2 Layout-Gestaltung durch stylesheet


In aller Regel sind Informationen die im Internet angeboten werden nicht ausschließlich für die Online-Präsentation erfaßt und aufbereitet worden. Die Daten kommen aus unterschiedlichen Systemen, die in den jeweiligen Unternehmen verwendet werden. Ein Verlag setzt beispielsweise zur Erstellung und Druckaufbereitung seiner gedruckten Publikationen ein propriäteres Textsatz- oder DTP-System ein. Um modernen Ansprüchen gerecht zu werden, hat er gleichzeitig großes Interesse daran, diese Daten in entsprechend aufbereiteter Form auf CD-ROM oder Online anbieten zu können. Ein intermediales Dokumentenformat wie XML bietet ihm die Möglichkeit, die Daten in der für die konkreten Produktionsbedingungen geeignetsten Form vorzuhalten und je nach Medienart unterschiedlich aufzubereiten und anzubieten.

Sollen XML-Dokumente flexibel und in hoher Qualität auf Computerbildschirmen, Handy-Displays, Braillezeilen oder per synthetischer Sprachausgabe ausgegeben werden, so benötigt der eingesetzte Browser mehr als nur die in der DTD definierten Strukturinformationen. Zur flexiblen und verallgemeinerbaren Layout-Gestaltung kann ein XML-Dokument dabei mit stylesheet verknüpft werden. In ihnen ist festgelegt, in welcher Art und Weise die einzelnen Elemente eines Dokumentes präsentiert werden. Durch die Kaskadierung der Stylesheet-Informationen ist es z.B. möglich, Überschriften je nach Hierarchiestufe unterschiedlich gestaltet anzuzeigen, den Seitenwechsel entsprechend der Kapitelanordnung zu steuern oder arabischen Text entsprechend seiner Schreibweise von rechts nach links anzuzeigen.

Derzeit existieren zwei Konzepte zur Realisierung von stylesheet im WWW. Die Entwicklung der einfachen Version CSS (Cascading Style Sheets) ist bereits abgeschlossen und kann in üblichen Web-Browsern eingesetzt werden. Mit der Entwicklung von XSL (Extensible Style Sheet Language) verfolgt das W3C das Ziel, den Anwendern ein professionelles Werkzeug zur Gestaltung multimedialer Informationen anzubieten. Die Entwicklungsarbeiten hierzu sind jedoch noch nicht abgeschlossen.


2.1.3 Integration und Synchronisation multimedialer Daten


Eine der wesentlichsten Eigenschaften des WWW ist zweifellos seine Multimedialität. Die eingesetzten Technologien lassen es zu, Text mit Audio- oder Videodaten zu verbinden. Realaudio gestattet schon heute das weltweite Radio hören, in aller Regel in Mittelwellenqualität. Wer die Tagesschau verpasst hat, kein Problem, mit einem Multimedia-PC und einer leistungsfähigen ISDN-Verbindung genügt ein Klick auf www.tagesschau.de. Derzeit raufen sich die Musikverlage die Haare, kann doch jeder Internetnutzer seine Lieblingshits als MP3-Datei in komprimierter Form auf seinen Computer laden und auf CD-ROM oder einer Minidisk speichern.

[Fußnote: [4] Die juristischen Aspekte dieser völlig neuen Form des Informationsaustausches sollen hier nicht diskutiert werden. Fußnote Ende]

Sollen bewegte Bilder, akustische Informationen und geschriebene Texte gleichzeitig dem Anwender auf seinem PC zur Verfügung gestellt werden, so ist eine Synchronisation der unterschiedlichen Datenströme erforderlich. Das vom W3C dazu entwickelte Konzept heißt SMIL (Synchronisation Multimedia Interchage Language). Derzeit wird die 2. Version dieser auf XML basierenden Anwendung erarbeitet. Das Prinzip soll im nachfolgenden Beispiel kurz erläutert werden.

Eine Vorlesung soll multimedial im Internet angeboten werden. Das Vorlesungsskript wird in XML erstellt. Die Veranstaltung ist auf Video aufgezeichnet und zur Präsentation im Internet aufbereitet. Um nun dem Besucher der virtuellen Lehrveranstaltung die Möglichkeit zu geben, vom Inhaltsverzeichnis des Vorlesungsskripts einzelne Kapitel sowohl in schriftlicher als auch in gesprochener und filmischer Form abrufen zu können, werden die beiden Datenströme über eine SMIL-Datei miteinander synchronisiert.

Eine SMIL-Datei ist im einfachsten Sinne eine Tabelle, die in der ersten Spalte die Adressen aller Strukturelemente der XML- Daten beinhaltet. In der zweiten Spalte der Tabelle stehen die Verweise auf die jeweiligen Filmsequenzen. Die Tabelle kann aus mehr als zwei Spalten bestehen, so dass es möglich ist, auch aus einem abgespielten Film heraus Text anzuzeigen sowie andere Video- oder Audiosequenzen abzurufen.


2.3 Informationsquellen


Es gibt eine ganze Reihe von Büchern zum Thema XML und den darauf basierenden Konzepten. Für ein deutschsprachiges siehe [5]. Wer mehr zum

[Fußnote: [5] Beame, H.; Mintert, S.: XML in der Praxis. Edison-Wesley, ISBN 3-3827313309, 1999. B) Thema wissen will und aktuelle Informationen wünscht, der sei an dieser Stelle auf das Internet selbst verwiesen. Fußnote Ende]

Ein interessanter Einstiegspunkt könnte dabei die Adresse des W3C sein. Unter www.w3.org finden sie die Spezifikationen und viele Zusatzinformationen zu HTML, XML, CSS und SMIL. Von besonderem Interesse für blinde und sehbehinderte Computernutzer dürfte die Web-Seite der WAI (Web Accessibility Initiative) www.w3.org/wai sein. Auf ihr sind neben nützlichen Softwaretips vor allem die Richtlinien zur Gestaltung von Internetseiten, die für jedermann nutzbar sind, angegeben.


3. Anwendungsbereiche in den Blindenbüchereien


3.1 DAISY - Mehr als sprechende Bücher


3.1.1 Digitales aus der Hörbücherei



"Wann gibt es Hörbücher aus der Blindenbücherei endlich auf CD-" ist wohl eine der am häufigsten gestellten Fragen bei der Diskussion um neue Formen des Informationszugangs für Blinde und Sehbehinderte. Die einfache Antwort darauf lautet: Dann, wenn die Technologie so weit ausgereift ist, daß sich der hohe Aufwand der Umstellung lohnt und der Nutzen für die Leser diesen Aufwand rechtfertigt.

Eine heute übliche Audio-CD speichert bis zu 74 Minuten Musik oder Sprache. Hörbuchkassetten im deutschen Sprachraum haben eine Spieldauer von 90 Minuten. Ein einfaches unbearbeitetes Überspielen und ausleihen handelsüblicher CDs macht somit keinen Sinn.

In der Computerwelt eingesetzte Komprimierungsverfahren wie MPEG ermöglichen es die Spieldauer einer CD-ROM auf bis zu 50 Stunden zu erweitern.

Die Nachfolgerin der CD, die DVD bietet dazu noch eine erhebliche Erhöhung der Speicherkapazität, so daß das Speichern von Videofilmen und vollständigen Hörbüchern technisch kein Problem darstellt.

Aber wie haltbar sind selbstgebrannte CDs- Auf welchen Geräten können sie abgespielt werden- Nach wie vielen Ausleihen sind die CDs so zerkratzt, daß eine Kopie angefertigt werden muß- Sind CDs überhaupt ein sicheres Archivmedium oder müssen hier hochwertige Backup-Medien bzw. digitale Archivsysteme zum Einsatz kommen- Fragen, über die sich nicht nur die großen Hörbüchereien der Welt derzeit den Kopf zerbrechen.


3.1.2 DAISY-Bücher



Was derzeit benötigt wird, sind technische Spezifikationen, die ein weltweit einheitliches Format für sprechende Bücher (Talking Books) definieren. Das DAISY (Digital Audio Information System) Consortium hat sich die Aufgabe gestellt, solche Spezifikationen zu erarbeiten, die entsprechende Referenzsoftware zu entwickeln und die private Wirtschaft darauf zu orientieren, die anerkannten standards in ihre Produkte zu integrieren.

George Kerscher dem engagierten Projektmanager des DAISY Consortiums ist es zu verdanken, daß als Grundlage für die Erarbeitung eines international anerkannten und einheitlich anwendbaren standards die offene Auszeichnungssprache XML zum Einsatz kommt. An der Entwicklung der DTBOOK3 (Digital Talking Book V. 3) DTD sind Mitglieder des DAISY Consortiums, die Library of Congress, Hilfsmittelfirmen und die nationale standardisierungsbehörde der USA beteiligt.

Die Bezeichnung "sprechendes Buch" sollte dabei nicht mit dem Begriff Hörbuch gleichgesetzt werden. DAISY-Bücher bieten mehr als nur das gesprochene Wort.

In den USA arbeiten die meisten blinden Computeranwender mit synthetischer Sprache am PC. Eine Braillezeile gehört nicht zur standardausstattung eines sehgeschädigtengerechten Computers. Somit sprechen auch Textdokumente, wenn sie vom Screenreader vorgelesen werden.

Diese Anmerkung weist auf die entscheidende neue Qualität der DAISY-Bücher hin: Der Möglichkeit der Kombination von gesprochener und geschriebener Information. Das derzeit in Entwicklung befindliche Konzept erlaubt es, Bücher in den folgenden Formen zu produzieren:



3.1.3 Hybride Bücher


Die Möglichkeiten sind wirklich vielversprechend. Dabei wird es auch zukünftig nicht möglich oder notwendig sein jedes Buch vollständig in Sprache und Text aufzubereiten. Viele Hörbücher werden auch weiterhin nur als Audiobuch produziert werden. Jedoch ist das Angebot schon verlockend, von einem Inhaltsverzeichnis Kapitel oder Abschnitte direkt erreichen zu können.

Vor allem der Domäne, Fach- und Sachbuch, werden die aufwendig zu produzierenden Audio- und Textbücher vorbehalten bleiben. Ein solches hybrides Buch bietet dem Anwender Funktionen wie:

- gezieltes Aufsuchen von Seiten, Fußnoten, Marginalien oder Bildbeschreibungen - Suchen, Buchstabieren, Extrahieren und Weiterverarbeiten von Text

- Integration zusätzlicher Audiosequenzen

Hybride Bücher sind, aufgrund ihrer Gestaltungsvielfalt geeignet, als computergestütztes Lehr- und Lernmittel in Schule, Studium, Ausbildung und Beruf zu fungieren. Sie bilden eine nützliche Ergänzung zu Braillebüchern, Großdrucken, taktilen Abbildungen und tastbaren Modellen. Doch auch der private Anwender kann mittels hybrider Bücher in Nachschlagewerken blättern, Kataloge durchstöbern oder aus einem Kochbuch schnell das gewünschte Rezept heraussuchen.


3.1.4 Wiedergabe von DAISY-Büchern


Um die vielen nützlichen Zusatzfunktionen nutzen zu können, benötigt der Anwender entweder einen PC mit entsprechender Software oder eines der transportablen Abspielgeräte für DAISY- Bücher. Die Chancen stehen derzeit nicht schlecht, daß DAISY- Bücher auf zukünftigen Versionen von standard-Web-Browsern, wie dem Internet Explorer von Microsoft, abspielbar sind. Im Rahmen des SIGTUNA-Projektes entwickelte die JSRPD (Japanese Society for Rehabilation of Persons with Disabilities) einen DAISY- Player, der unter der Internetadresse www.dinf.org kostenlos heruntergeladen werden kann.

Als transportable Abspielgeräte stehen derzeit das japanische Modell PLEXTALK und der kanadische Konkurrent VICTOR zur Verfügung. Beide Systeme dürften in der nächsten Zeit auch auf dem deutschen Markt erhältlich sein.

Gegen Ende 1999 ist mit der Fertigstellung der vom DAISY Consortium in Auftrag gegebenen Aufnahmesoftware zu rechnen. Derzeit läuft der Beta-Test an dem auch deutsche Hörbüchereien teilnehmen. Es liegt auf der Hand, daß zukünftig in den Hörbüchereien das reine Audiobuch gegenüber dem hybriden Buch Vorrang haben wird. Auch werden wohl noch einige Jahre vergehen, bis die Kassette aus dem Ausleihprogramm der Bibliotheken verschwindet. Viele der mittelfristig digital produzierten Bücher werden wohl noch auf die analoge Kassette kopiert und somit ganz traditionell zur Ausleihe kommen.

Im letzten Abschnitt dieses Artikels sollen noch einmal die Vorteile, die in der Nutzung des intermedialen Dokumentenformates XML liegen, aufgegriffen und für die zukünftige Arbeit der Blindenbüchereien diskutiert werden.


3.2 Informationsverarbeitung aus einer Hand


Ausgangspunkt der Überlegungen ist die in XML realisierte Trennung von Inhalt, Struktur und Layout der in einem Dokument gespeicherten Informationen. Auf diese Art wird es möglich, ein Ausgangsdokument bereitzustellen, welches als Quelle für viele von Blinde und Sehbehinderte nutzbaren Medienarten dienen kann.

Wenn die technologischen, materiellen und personellen Voraussetzungen für einen solchen (Single Source - multiple usage) Produktionsablauf geschaffen werden, sind in einer Blindenbücherei aus einem Quelldokument die folgenden Medienarten zu erzeugen:

- Braillebuch (wahlweise in Voll- oder Kurzschrift)

- elektronisches Buch auf CD-ROM oder über Internet (sowohl in Kurzschrift für die Braillezeile aber auch in Computerbraille für die Sprachausgabe) - hybrides Buch (mit gesprochenen und geschriebenen Textanteilen und zusätzlichen Navigationshilfen) - Großdruck (in verschiedenen Formaten)

Nachfolgend werden die generellen technologischen Schritte diskutiert, die das hier charakterisierte Prinzip, Informationsangebote aus einer Hand, beschreiben.


3.2.1 Akquirirung der Daten


Die Daten für ein zu produzierendes Buch können entweder direkt vom Verlag in elektronischer Form beschafft, per Scanner und OCR-Software erzeugt oder auch - keine Seltenheit - von Hand eingegeben werden.

Die Verlagsindustrie zeigt großes Interesse an XML und den verwandten Technologien. Die nächsten Jahre werden zeigen, in wie weit dieses Interesse auch unmittelbar für die verbesserte Bereitstellung von sehgeschädigtengerechten Informationsangeboten genutzt werden kann.

Bis dahin wird das Einscannen der Vorlagen sowie die manuelle Korrektur der Daten notwendiger und aufwendiger Arbeitsschritt in diesem Produktionsprozess bleiben.


3.2.2 Strukturierung der Daten



Die Strukturierung der Daten kann gemäß einer XML DTD erfolgen. Mit der vom DAISY Consortium entwickelten DTBOOK3 DTD wird nach ihrer Fertigstellung ein leistungsfähiges, anpaßbares und erweiterbares XML-Format zur Verfügung stehen.

Mittels geeigneter Software-Werkzeuge können eingescannte Vorlagen in das Format der DTD gebracht werden. Dieser Prozeß ist, wie im vorangegangenen Abschnitt bereits angemerkt, mit verhältnismäßig hohem manuellen Aufwand verbunden (z.B. Korrektur der gescannten Vorlagen und Strukturierung des Dokumentes durch das Einbringen der entsprechenden Markup- Anweisungen). Er unterscheidet sich dabei in keiner Form von den Editierarbeiten, die bereits beim Einsatz traditioneller Verfahren der Blindenschriftproduktion zur Anwendung kommen. Bei der Anpassung oder Entwicklung geeigneter Werkzeuge kann somit auf umfangreiche Erfahrungen der mit diesem Prozeß bereits vertrauten Mitarbeiterinnen und Mitarbeiter zurückgegriffen werden.

Werden die Daten für das zu übertragende Buch in elektronischer Form bereitgestellt, so kann der manuelle Aufwand der Textvorbereitung entschieden gesenkt werden. Der Idealfall wäre, wenn das Buch bereits in einem strukturierten Format verfügbar ist. Eine Konvertierung könnte dann nahezu automatisch erfolgen.

Wie bereits im Abschnitt 1.2 dargestellt wurde, setzen die Verlage derzeit häufig Formatierungs- und Textsatzsysteme ein, die diesen Strukturierungsansatz nicht unterstützen. Dies dürfte sich, wenn auch langsam, ändern.

Bis dahin bleibt den umsetzenden Einrichtungen die Möglichkeit, eigene Werkzeuge zur Verminderung des manuellen Aufwands bei Korrektur und Strukturierung der Texte zu entwickeln. Geeignete Ansatzpunkte bieten hier die über das Internet angebotenen Transponierungssdienste wie PDF2HTML(http://access.adobe.com) oder viele andere Konvertierungswerkzeuge, die bereits verfügbar oder in Entwicklung sind.


3.2.3 Medienspezifische Formatierung


Sind die in den ersten beiden Schritten auszuführenden Arbeiten weitestgehend medienunabhängig, so wird im letzten Schritt, abhängig von den jeweils zu produzierenden Medienarten, eine entsprechende Formatierung erzeugt.

Liegen die Daten, strukturiert nach einer DTD vor, so kann das Ausgangsdokument separat für jedes Ausgabemedium weiterverarbeitet werden.

An erster Stelle stehen dabei die Werkzeuge zur Produktion von Braillebüchern. Vorstellbar sind hier weitestgehend automatisierbare Konvertierungsprogramme die das Buch wahlweise in Basis-, Voll- oder Kurzschrift umwandeln. Fragen des Seitenlayouts, der Einbeziehung von Fremdsprachen oder Übersetzungsmöglichkeiten für mathematische Darstellungen sind nützliche Features der zu schaffenden Programme.

Die Übertragungsprogramme der SBS Zürich sowie das Hagener Braille System bieten die geeignete Grundlage, aus ihnen ein flexibel handhabbares und modifizierbares Konvertierungsprogramm für intermediale Dokumentenformate zu entwickeln.

Zur Produktion eines hybriden Buches ist der Textanteil des Buches auf gleiche Art wie in der Blindenschriftproduktion in das Format der DTD zu bringen.

Das Quelldokument kann danach in die vom DAISY Consortium entwickelte Aufnahmesoftware geladen und der Audioanteil des Buches aufgesprochen werden.

Sollen Bücher oder andere Publikationen direkt in elektronischer Form an die Leser weitergegeben werden, so lassen sich die Quelldaten für eine Internetpräsentation in komfortabler Art nach HTML konvertieren. Es ist hierbei ebenfalls möglich, die Quelldaten in Voll- oder Kurzschrift zu übersetzen und sie per Diskette oder CD-ROM den Lesern anzubieten.

Schließlich lassen sich die einmal erstellten Quelldokumente auch unter Nutzung geeigneter Schriftarten, Schriftgrößen und Gestaltungsvorschriften in Großdruck anbieten.

Weitere Anwendungsfelder ließen sich für die Quelldokumente finden. Hier soll abschließend nur die Möglichkeit der Integration in eine Volltextdatenbank angeführt werden.

Die damit aufgezeigte Vielfalt verdeutlicht die technischen Möglichkeiten und nimmt keine Wertung oder Rangfolge einzelner Medienarten vor.

Das Prinzip: Informationsangebote aus einer Hand bietet vor allem dem Nutzer, also Leser, die Möglichkeit, sich selbst zu entscheiden, welches Medium und Format er wann und wo einsetzt. Entscheidungen die für jeden sehenden Leser selbstverständlich sind.


Kritische Wertung


Das oben beschriebene Prinzip stellt einen sehr vereinfachten und wohl auch etwas idealisierten Ansatz dar. Es weist zumindest die folgenden Schwachstellen auf:

- Die Verlagsindustrie stellt bislang kaum elektronische Quelldokumente in geeignet strukturierter Form zur Verfügung.

- Derzeit ist der Anteil manuell auszuführender Arbeiten (Erfassung, Strukturierung und Korrektur) sehr hoch.

- Geeignete Werkzeuge sind zwar in Entwicklung, jedoch sind sie kostenintensiv und nicht in ausreichendem Maße verfügbar.

- Betriebliche Voraussetzungen wie technische Ausstattung, IT- Qualifikation der Mitarbeiter und moderne netzwerkorientierte Produktionsabläufe müssen erst geschaffen werden.

Die Technologie der Informationsgesellschaft entwickelt sich in einem rasanten Tempo. Im Gegensatz zu aufstrebenden Firmen der IT-Branche, ist es einer Blindenbücherei nicht möglich, fehlendes Kapital an der Börse zu akquirieren und ausschließlich gewinnorientiert am Markt zu agieren. Wissensdurstige Blinde und Sehbehinderte Menschen stellen kein ausreichendes Käuferpotential dar, das mittel- oder langfristig einen angestrebten Return of Investment sichert. Blindenbüchereien sind auch in der digitalen Informationsgesellschaft notwendige und unverzichtbare Einrichtungen, die verläßliche und bewährte Informationsangebote für blinde und sehbehinderte Menschen jeden Alters unterbreiten. Dabei kommt es vor allem darauf an, traditionelle Darstellungsformen wie die Blindenkurzschrift auch in moderne Informationssysteme zu integrieren und moderne Kommunikations-, Bildungs- und Unterhaltungsangebote barrierefrei zu gestalten.


Informationen zum Autor



Thomas Kahlisch ist seit Februar 1999 Direktor der Deutschen Zentralbücherei für Blinde zu Leipzig (DZB). Er studierte in Görlitz, Dresden und Karlsruhe Informatik und promovierte 1998 am Lehrstuhl Mensch Maschine Kommunikation der TU Dresden. Als blinder Computerbenutzer ist er für den Deutschen Blinden- und Sehbehindertenverband im internationalen Projekt DAISY engagiert.

Zurück zum Inhalt von 4/1999|Publikationen| Zurück zum Suchergebnis | Zurück zur Liste