eBooks

Hypermedia für Lexikon und Grammatik

0303
1998
978-3-8233-3016-5
978-3-8233-5142-9
Gunter Narr Verlag 
Angelika Storrer
Bettina Harriehausen

Die Beiträge des inderdisziplinär ausgerichteten Sammelbandes behandeln aus theoretischer und aus anwendungsbezogener Perspektive die neuartigen Gestaltungsmöglichkeiten, die Hypermedia in den Bereichen der Lexikographie, Terminographie und Grammatikschreibung eröffnet. Textlinguistische, informationswissenschaftliche und mediendidaktische Fragestellungen werden am Beispiel konkreter Anwendungen diskutiert.

<?page no="0"?> Studien zur deutschen Sprache FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE Angelika Storrer/ Bettina Harriehausen (Hrsg.) Hypermedia für Lexikon und Grammatik gn Gunter Narr Verlag Tübingen <?page no="1"?> STUDIEN ZUR DEUTSCHEN SPRACHE 12 <?page no="2"?> Studien zur deutschen Sprache FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE Herausgegeben von Bruno Strecker, Reinhard Fiehler und Hartmut Günther Band 12 • 1998 <?page no="3"?> Angelika Storrer/ Bettina Harriehausen (Hrsg.) Hypermedia für Lexikon und Grammatik gnw Gunter Narr Verlag Tübingen <?page no="4"?> Die Deutsche Bibliothek - CIP-Einheitsaufnahme Hypermedia für Lexikon und Grammatik / Angelika Storrer/ Bettina Harriehausen (Hrsg.). - Tübingen: Narr, 1998 (Studien zur deutschen Sprache; Bd. 12) ISBN 3-8233-5142-7 © 1998 ■ Gunter Narr Verlag Tübingen Dischingerweg 5 • D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtbch geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Gedruckt auf säurefreiem und alterungsbeständigem Werkdruckpapier. Gesamtherstellung: Hubert&Co., Göttingen Printed in Germany ISSN 0949-409X ISBN 3-8233-5142-7 <?page no="5"?> Nachruf Helmut Feldweg ist am 24. November 1997 im Alter von 41 Jahren plötzlich und unerwartet an einem zuvor nicht erkannten Herzkrebs gestorben. Fassungslos und traurig spüren wir die Lücke, die durch seinen Tod entstanden ist. Nach seinem Sinologiestudium in Göttingen wechselte Helmut an das Max-Planck- Institut für Psycholinguistik in Nijmegen, wo er an der Entwicklung der Datenbanken CELEX und CHILDES beteiligt war. Seit 1992 arbeitete er am Seminar für Sprachwissenschaft der Universität Tübingen in verschiedenen Projekten und hat maßgeblich dazu beigetragen, den dort neu entstandenen Bereich Korpus- und Lexikontechnologie aufzubauen und zu profilieren. Er betreute den Aufbau umfangreicher Korpora und lexikalischer Datenbanken, entwickelte Werkzeuge zur Korpusanalyse und war an verschiedenen nationalen und europäischen Projekten beteiligt, u.a. an dem in diesem Band vorgestellten intelligenten Wörterbuchsystem COMPASS. In der Zeit vor seinem Tod arbeitete er an GermaNet, einem deutschen Gegenstück zum Lexikonsystem WordNet (Princeton), und bereitete die Integration von GermaNet in das multilinguale EuroWordNet-System vor. Neben seiner Tätigkeit in der Abteilung Computerlinguistik war er ab 1996 zusätzlich als Projektleiter am Steinbeis Transferzentrum „Multimediale Kommunikation und Maschinelle Sprachverarbeitung“ verantwortlich für die maschinelle Aufbereitung und SGML-Auszeichnung von Wörterbüchern namhafter Verlagshäuser. Die Korpus- und Lexikonforschung verliert mit Helmut Feldweg einen klarsichtigen, kreativen und kompetenten Mitstreiter. Für uns war Helmut jedoch noch weitaus mehr als ein fachkompetenter Forscherkollege: Er war ein Freund, ein Partner, ein Hort der Verlässlichkeit, der Besonnenheit und des kooperativen Miteinanders im Getümmel des Wissenschaftsbetriebs. Er wusste Rat und half, wenn es Probleme gab; dabei fehlte ihm jeglicher Hang, sich in den Vordergrund zu stellen. Ohne je viel Aufhebens darum zu machen, hat er viele der Nachwuchswissenschaftler und -wissenschaftlerinnen ausgebildet, unterstützt und gefördert, die inzwischen von der Universität Tübingen aus in Industrie- und Forschungspositionen vorgedrungen sind. Mit Helmut war man gerne zusammen, sei es auf Projektsitzungen, beim Mittagessen, beim Wandern oder Stocherkahnfahren. Wir werden alle Züge seiner Persönlichkeit vermissen, am schmerzlichsten aber seinen Humor und den trockenen Witz, den er dem Leben im Allgemeinen und der Linguistik im Besonderen entgegen brachte. Miriam Butt, Elisabeth Breidt, Anke Feldhaus, Birgit Hamp, Ralf Hauser, Erhard W. Hinrichs, Michael Hipp, Wolfgang Klein, Karin Krüger-Thielmann, Detmar Meurers, Uwe Mönnich, Sabine Reinhard, Susanne Schüle, Stephanie Schwarz, Rosmary Stegmann, Angelika Storrer, Christine Thielen. <?page no="7"?> Inhalt Bettina Harriehausen-Mühlbauer/ Angelika Starrer Hinführung 9 A. Hypermedia und Grammatik Bruno Strecker Hypertext: Chance und Herausforderung für die Grammatikschreibung 21 Angelika Starrer Hypermedia und Grammatikographie 29 Roman Schneider Zur Lexikon-Grammatik-Schnittstelle in einem hypermedialen Informationssystem 57 Eva Breindl Konzeption und Konversion: zur simultanen Produktion von Printtext und Hypertext am Beispiel Grammatik 75 Anya Elis! Heinz-Josef Weber Dependenzgrammatik. Ein interaktives Arbeitsbuch. Zur Konversion eines Lehrbuchs in ein Hypertextsystem 99 B. Hypermedia und Fremdsprachenunterricht Bettina Harriehausen-Mühlbauer Nal.a - Hypertextgrammatik in CASTLE 113 Klaus Vorderwülbecke Einblicke in „Einblicke“ - Ein Fernsehsprachkurs mit einer Multimedia- Komponente 131 <?page no="8"?> 8 C. Hypermedia und Lexikographie Matthias Kämmerer Hypertextualisierung gedruckter Wörterbuchtexte: Verweisstrukturen und Hyperlinks 145 Christine Thielen! Elisabeth BreidtlHelmut Feldweg COMPASS: Ein intelligentes Wörterbuchsystem für das Lesen fremdsprachiger Texte 173 Heinz-Josef Weber Das „Homographen-Wörterbuch der deutschen Sprache“ als Hypertext 195 D. Hypermedia und elektronisches Publizieren Elisabeth Frisch Ausgewählte Aspekte des Publizierens im WWW am Beispiel elektronischer Fachzeitschriften 217 Bernhard Schröder/ Jens Ostermann-Heimig Kants Werke als Hypertext 233 Melina Alexa Text Type Analysis with TATOE 247 Rolf Todesco Effiziente Informationseinheiten im Hypertext 265 <?page no="9"?> Bettina Harriehausen-Mühlbauer/ Angelika Storrer Einführung Lexikon und Grammatik sind zwei komplementäre Aspekte bei der Darstellung sprachlichen Wissens: Das Lexikon beschreibt die sprachlichen Bauteile und ihre Eigenschaften, während die Grammatik die Regeln und Vorschriften verzeichnet, wie diese Bauteile syntaktisch und semantisch zu größeren Einheiten kombiniert und zum Kommunizieren verwendet werden. Bislang korrespondierten die beiden Aspekte mit zwei Typen von Nachschlagewerken: Im Wörterbuch finden sich Angaben zu lexikalischen Einheiten, das Grammatikbuch erfasst das grammatische Wissen. Dass diese Trennung künstlich ist, zeigt nicht nur das Vorhandensein von Kurzgrammatiken in vielen Wörterbüchern einerseits und von kommentierten Wortlisten in manchen Grammatiken andererseits. Auch bei der Formalisierung sprachlicher Strukturen und Prozesse in Computerlinguistik und künstlicher Intelligenz haben sich lexikonbasierte Grammatikformalismen bewährt, in denen Lexikon und Grammatik eng verzahnt sind. Die elektronische Publikationsform Hypermedia gibt nun auch der „traditionellen“, am menschlichen Rezipienten orientierten Lexikographie und Grammatikographie Mittel an die Hand die Wissensgebiete Lexikon und Grammatik in integrierter Weise zu beschreiben. Eigenschaften, die Hypermedia fur die Vermittlung sprachlichen Wissens attraktiv machen, sind: Die nicht-lineare Strukturierung des Wissens als Netzwerk von Teiltexten (Hypertext), die als Multimedia bezeichnete Integration von Text, Ton, (animierter) Graphik und Video und die vielfältigen Formen der Beeinflussung des Systemverhaltens durch den Benutzer, die unter dem Schlagwort Interaktivität abgehandelt werden. Die Beiträge in diesem Sammelband setzen sich aus theoretischer und anwendungsbezogener Perspektive mit den neuartigen Gestaltungsmöglichkeiten auseinander, die Hypermedia fur die Beschreibung und Vermittlung sprachlichen Wissens eröffnet. Hierbei sind neben grammatikographischen, lexikographischen und sprachlernbezogenen auch textlinguistische, informationswissenschaftliche und mediendidaktische Gesichtspunkte zu berücksichtigen; der Sammelband ist insofern interdisziplinär ausgerichtet. Im Vordergrund steht aber der mit Hypermedia neu zu beschreibende Gegenstand ‘sprachliches Wissen’; hierin unterscheidet er sich von anwendungsunabhängigen Sammelbänden und Monographien zur Nutzung von Hypermedia. <?page no="10"?> 10 Bettina Harriehausen-Mühlbauer/ Angelika Starrer Obwohl nicht nur rein akademische Projekte behandelt werden, geht es weniger um bereits kommerziell verfügbare Produkte. Der vorliegende Band möchte vielmehr zur Entwicklung von Qualitätskriterien und Perspektiven für benutzerfreundliche Anwendungen beitragen, die unabhängig von den rasch sich verändernden technischen und marktstrategischen Randbedingungen gehalten sind. Die Artikel sind nach den jeweiligen Gebieten - Grammatikographie, Lexikographie und Fremdsprachenunterricht geordnet; im abschließenden Teil werden allgemeine Probleme des elektronischen Publizierens erörtert. Im Folgenden geben wir einen kurzen Überblick über die einzelnen Beiträge. Kommerziell vertriebene Hypermedia-Wörterbücher gibt es bereits seit geraumer Zeit; für die Grammatikographie hingegen wird das neue Medium noch kaum genutzt: Hypermedia-Grammatiken existieren allenfalls als Teilkomponenten von Systemen zum computergestützten Fremdsprachenunterricht oder von Lemprogrammen für den muttersprachlichen Unterricht. Eine als Hypermedia-Anwendung publizierte, umfangreiche Referenzgrammatik des Deutschen gibt es bislang nicht. Um diesen Mangel zu beheben werden am Institut für deutsche Sprache im Projekt GRAMMES (Grundlagen eines grammatischen Informationssystems) ausgewählte Teile einer wissenschaftlichen Buchgrammatik in eine Hypermedia-Anwendung umgestaltet. In der 1996 abgeschlossenen Pilotphase des Projekts wurden erste Erfahrungen mit den Gestaltungsmöglichkeiten des neuen Mediums für die Grammatikographie gesammelt. Die Beiträge von Strecker, Storrer, Schneider und Breindl behandeln verschiedene Aspekte dieses Projekts und beziehen sich auf unterschiedliche Phasen der Systementwicklung. Bruno Strecker, Initiator und Leiter des GRAMMIS-Projekts, kennt als Mitautor und -redakteur der zugrundeliegenden Buchgrammatik beide Publikationsformen. Vor diesem Erfahrungshintergrund diskutiert er aus der Autorenperspektive die Chancen und Herausforderungen, die das neue Medium für die Grammatikschreibung eröffnet. Angelika Storrer behandelt zunächst aus der Sicht der Rezipienten die Probleme, die beim Umgang mit Buchgrammatiken auftreten können. Sie skizziert die konzeptuellen Ideen, die der bisherigen Systementwicklung in GRAMMIS zugrundeliegen und zeigt dann an konkreten Beispielen, wie diese Benutzungsprobleme durch die nichtlinearen, multimedialen und interaktiven Eigenschaften von Hypermedia gelöst bzw. abgemildert werden können und wie sich grammatisches Wissen mit Hypermedia einfacher, anschaulicher und unterhaltsamer vermitteln lässt. Auf der Grundlage der in GRAMMIS gesammelten Erfahrungen und der Rückmeldungen durch die Testnutzer diskutiert sie abschließend die Perspektiven für ein umfassendes grammatisches Informationssystem. <?page no="11"?> Einführung 11 Im Beitrag von Roman Schneider geht es um den bereits angesprochenen Vorteil des neuen Mediums die künstliche Trennung von Wörterbuch und Grammatikbuch zu überwinden, indem lexikalische und grammatische Informationen in dieselbe Anwendung integriert und miteinander verknüpft werden. Schneider beschreibt am Beispiel der GRAMMIS-Komponenten zu den Themen „Wortarten“ und „Verbvalenz“, wie Schnittstellen zwischen grammatischen Hyperdokumenten und lexikographischen Datenbanken konzeptionell und technisch realisiert wurden und welche Mehrwerte gegenüber der Buchgrammatik durch diese Integration erzeugt werden konnten. Das von Eva Breindl entwickelte elektronische Konnektorenhandbuch ist die Jüngste“ GRAMMIS-Komponente. Im Gegensatz zu den in Storrer und Schneider beschriebenen Komponenten beruht sie nicht auf einer für das gedruckte Medium konzipierten Textvorlage; statt dessen soll im Rahmen eines laufendenden Projekts simultan und kollaborativ ein „Handbuch der deutschen Konnektoren“ als Druckwerk und als Hypermedia-Anwendung erarbeitet werden. Breindl beschreibt in ihrem Beitrag die Konzeption des elektronischen Handbuchs und das Vorgehen beim simultanen und kollaborativen Erstellen der beiden Publikationsformen. Aus den dabei gemachten Erfahrungen stellt sie abschließend allgemeine Überlegungen zum kollaborativen Schreiben in der Wissenschaft an. Obwohl auch im GRAMMIS-Projekt von der Möglichkeit des elektronischen Mediums Gebrauch gemacht wird den Benutzern über interaktive Tests und Spiele eine Rückmeldung über ihr grammatisches Wissen zu geben, ist GRAMMIS vornehmlich als Informationssystem zum problembezogenen, punktuellen Nachschlagen konzipiert. Die von Anya Elis und Heinz-Josef Weber beschriebene Hypermedia-Anwendung dagegen, die ebenfalls mit dem Autorensystem Toolbook entwickelt wurde, ist vornehmlich ein Lern- und Übungssystem, mit dem sich Studierende und andere an Grammatik Interessierte die Grundlagen der Dependenzgrammatik aneignen können. Die Autoren beschreiben, nach welchen Prinzipien sie das gedruckte Lehrbuch in eine interaktive Hypermedia-Anwendung überfuhrt haben und diskutieren die Vorteile der elektronischen gegenüber der gedruckten Fassung. Da es sich um ein Lern- und Übungssystem handelt, liegen die Mehrwerte vor allem auf der Ebene der interaktiven Unterstützung und automatischen Kontrolle der Übungsaufgaben und der Visualisierung und Animation grammatischer Strukturen und Prozesse. Der PC hat neue Wege für das Lehren von (Fremd-)Sprachen eröffnet: sowohl beim autodidaktischen Lernen als auch im traditionellen Klassenunterricht können sich Lernende unabhängig von einer direkten Lehrerkontrolle durch automatisierte Lektionen und Übungen durcharbeiten. <?page no="12"?> 12 Bettina Harriehausen-Mühlbauer/ Angelika Starrer Als sich der Bereich des computergestützten (Fremd-)Sprachenunterrichts vor einigen Jahren manifestierte, betrachteten Lehrer, Lernende und auch die Herausgeber von Lehrmaterial die Anwendung des elektronischen Mediums im Sprachunterricht mit einer verständlichen „Portion“ an Skepsis. Diese Skepsis war durchaus begründet, da erste CALL 1 Anwendungen die Stärke des elektronischen Mediums nicht mit dem „Know-How“ der Lehrer und Wissenschaftler im Sprachlehrbereich verknüpften. Sprachlernsoftware, die zum größten Teil von Softwareunternehmen produziert wurde, litt unter mangelndem didaktischen Aufbau, während Programme, die von erfahrenen Lehrern entwickelt wurden, sich kaum dessen bedienten, was die Technologie zu dem Zeitpunkt schon anbot bzw. schon zu leisten vermochte. Die erste Sprachlernsoftware enthielt fast ausschließlich multiple-choice, slot-filling oder Ersetzungsübungen, d.h. nur ein Teilbereich traditioneller Techniken der herkömmlichen Arbeitsblätter wurde 1: 1 ins elektronische Medium transferiert und der Computer wurde lediglich zur Überprüfung der Antworten auf der Basis eines rigiden pattern-matching eingesetzt. Auch im Bereich der Vokabelübungen wurde der Einsatz des Computers auf einfache Formen von Drill- Übungen reduziert. Die allgemeine Kritik richtete sich gegen unintelligente, demotivierende und teilweise sogar didaktisch zweifelhafte Übungen. Neuere Entwicklungen im Bereich der Sprachlernsoftware haben aus dieser Kritik gelernt und basieren auf gemeinsamen, integrierten Systementwicklungen von Softwareentwicklern, Didaktikern und Herausgebern von Sprachlernmaterial. Während bei früheren CALL-Systemen die treibende Kraft eher bei den Entwicklern lag, die die Vision hatten, dass Computer eine wichtige Rolle im Sprachlehrprozess spielten, so orientieren sich heutige Entwicklungen am Markt, an den Erwartungen und Bedürfnissen der Endnutzer. Diese Erwartungen sind wiederum gesteuert von den Entwicklungen in der Hard- und Software-Technologie: So werden beispielsweise zunehmend zeichenbasierte Programme, die vom Benutzer durch Zeicheneingaben mit der Tastatur gesteuert werden, durch Programme mit graphischen Benutzeroberflächen ersetzt, bei denen die Mensch-Computer-Interaktion über das Anklicken oder das Bewegen graphischer Objekte auf einem virtuellen Arbeitsplatz realisiert wird. Diese intuitive Art der Interaktion mit elektronischen Lernprogrammen führte zu einer größeren Akzeptanz und Produktivität. CALL-Programme folgten diesen Entwicklungen, indem beispielsweise drag-and-drop Möglichkeiten sowie die Möglichkeit des Anklickens und Bewegens von Objekten in Übungen eingebunden wurden. Zu Beginn der 90er Jahre war die Integration von Text, Ton und Video in sogenannten Multimedia-Anwendungen das Ziel. Multimedia-Anwendungen können Informationen durch das gleichzeitige Stimulieren verschiedener Sinneswahrnehmungen vermitteln und bieten sich dadurch für den gesamten call = Computer Aided Language Learning <?page no="13"?> Einführung 13 Lehr-/ Lernbereich an. Der sogenannte „kommunikative Ansatz“ (communicative approach) beim Sprachlehren formte als neue didaktische Strategie zusammen mit der Multimediatechnologie die Basis für eine neue Generation hochqualifizierter CALL Software. Trotz eklatanter Verbesserungen überlebte ein wesentlicher Kritikpunkt: der der unzureichenden Rückmeldung. Die meisten Systeme beschränken sich nach erfolgter Analyse der Eingabe auf eine Form der binären Rückmeldung, d.h. ein Signal, ob die Eingabe korrekt oder falsch ist. Diese Form der Rückmeldung ist nicht nur frustrierend, sondern wenig aussagekräftig. Ehrgeizigere Systemkonzeptionen basieren heute auf antizipierten Fehlersituationen mit individuellen, spezifischen Rückmeldungen. Dies kann beispielsweise durch Aufzeichnungen der Benutzereingaben und der Extraktion wiederholter Eingabemuster geschehen. Für jedes dieser Eingabe- (oder auch Fehler-)Muster kann der Kursautor eine spezielle Rückmeldung formulieren, die die Schwierigkeiten konkret beschreibt und somit zu einem informativen Lernsystem wird. Relevante Strategien für die Verarbeitung antizipierter Eingabemuster sind zwei Lösungen aus dem Gebiet der künstlichen Intelligenz: (a) das Modellieren des Lernenden und (b) die natürlichsprachliche Datenverarbeitung. Ein intelligentes CALL System kann den Lehrer beispielsweise darin unterstützen die Eingabe des Lernenden zu analysieren und bestimmte Übungen vorzuschlagen, um ein bestimmtes Fehlermuster zu korrigieren. Die elektronische Sprachverarbeitung ermöglicht ferner das automatische Erkennen lexikalischer oder struktureller Fehler in der Zielsprache. Die Ergebnisse einer solchen Analyse können in einem „Benutzerprofil“ aufgezeichnet werden, welches wiederum die Eingaben über einen längeren Zeitraum vergleicht und somit dem Lehrer und dem Lernenden Hinweise auf bestehende Schwächen gibt. In der Beschreibung des von IBM entwickelten CASTLE Systems stellt Bettina Harriehausen-Mühlbauer ein System vor, in dem diese Strategien, Prinzipien und Technologien realisiert sind. Der Beitrag fokussiert auf die elektronische Grammatik NaLA 2 , die die Eingabe des Benutzers nicht nur analysiert sondern auch korrigiert. An die Analysegrammatik ist ein Grammatiktutorial in Hypertextform gekoppelt, aus dem sich der Sprachlemende optionale Information zu gezielten Grammatikstrukturen anzeigen lassen kann. CASTLE ist eine Mischung aus interaktivem Lehrbuch, Nachschlagewerk und intelligentem text critiquing System. Die Aufgabe, Sprachlehrmaterial von der Buchin die elektronische Form zu konvertieren und dabei sowohl den Anforderungen eines anspruchvollen Benutzers gerecht zu werden als auch die Möglichkeiten moderner Multi-Media-Anwendungen auszureizen, wurde u.a. 2 NaLA = Natural Language Analyser <?page no="14"?> 14 Bettina Harriehausen-Mühlbauer/ Angelika Starrer dadurch gelöst, dass eine elektronische Grammatik integriert wurde, die nicht nur die Benutzereingaben analysiert, sondern auch mittels Fehlerantizipation in den Regeln korrigiert. Diese Korrekturkomponente, die auf Satzebene operiert, ist direkt mit einem Hypermediatutorial verbunden, welches gezielt Informationen über diverse Grammatikkonstruktionen bereithält. Klaus Vorderwülbecke stellt in seinem Beitrag einen Femsehsprachkurs mit Multimedia-Komponente vor, der vom auswärtigen Amt in Auftrag gegeben und von der Organisation „Inter Nationes“ und dem Goethe-Institut koordiniert wird. Der Autor vergleicht zunächst die Vorteile eines Medienverbundes ohne Multimedia mit den Vorteilen eines guten Multimedia-Programms und diskutiert Risiken und Chancen des Multimedia-Einsatzes für das Sprachenlernen beim gegenwärtigen Stand der Kunst. Vor diesem Hintergrund beschreibt er die Komponenten der zum Medienverbund gehörigen Multimedia- Anwendung, die aus einer seriellen und einer modularen Komponente besteht. In der modularen Komponente werden die Themen, Informationen und Aufgaben aus allen 18 Folgen so vernetzt, dass z.B. gezielt auf Informationen zur Landeskunde, zum Wortschatz oder zur Grammatik zugegriffen werden kann. Die serielle Komponente orientientiert sich in Inhalt und Gliederung eng am Film bzw. am gedruckten Begleitmaterial des Fernsehsprachkurses; zu verschiedenen Themenbausteinen werden Übungen auf unterschiedlichen Niveaustufen angeboten, die sich auf Videosequenzen aus den jeweiligen Fernsehfilmen beziehen. Diese Sequenzen können nach Bedarf abgespielt werden, wodurch die Multimedia-Anwendung auch unabhängig von den anderen Komponenten des Medienverbundes als Stand-alone-Version benutzt werden kann, sei es im gesteuerten Unterricht, sei es im Selbststudium. Während die Einsatzmöglichkeiten von Hypermedia für die Grammatikschreibung erst ansatzweise erforscht sind, gibt es bereits eine beträchtliche Anzahl elektronischer Wörterbücher auf CD-ROM, in denen die Mehrwerteigenschaften von Hypermedia genutzt werden. 3 Darüber hinaus findet sich eine Fülle wissenschaftlicher oder kommerziell aufgebauter lexikographischer Datensammlungen im World Wide Web. 4 Allerdings werden in den bisherigen Anwendungen die Chancen des neuen Mediums noch nicht voll ausgereizt: - Die meisten der kommerziell verfügbaren Produkte erleichtern zwar durch mehr oder weniger flexible Suchfünktionen das Auffmden der Lemmata, 3 Eine hervorragende Rezension zu aktuell verfügbaren Englischwörterbüchem geben Neth, Hansjörg/ Müller, Thomas (1997): Angloviel. 25 Englischwörterbücher für Windows und Mac. In: c't 1, S. 116-138. 4 Eine auf den Stand August 1996 bezogene Übersicht geben Angelika Storrer & Katrin Freese (1996): Wörterbücher im Internet. In: Deutsche Sprache, 2, S. 97-153. Als Einstieg zu eigenen Erkundungen sei die sehr gut gepflegte und umfangreiche Sammlung von Robert Beard empfohlen: http: / / www.bucknell. edu/ ~rbeard/ diction.html. <?page no="15"?> Einführung 15 zeigen dann aber meist die zugehörigen Wörterbuchartikel in der Form an, in der sie auch im gedruckten Wörterbuch zu finden sind, d.h. mit Abkürzungen, Platzhaltern und Auslassungen, die in gedruckten Wörterbüchern notwendig waren um Druckraum zu sparen, im elektronischen Wörterbuch aber überflüssigerweise die Verständlichkeit der lexikographischen Angaben erschweren. - Meist werden die Wörterbuchartikel als Ganzes dargeboten, was das Auffinden bestimmter Informationen vor allem bei stark polysemen Lemmata zu einem zeitraubenden Unterfangen machen kann. Dabei bestünde eine der Chancen des nicht-linearen Mediums für diesen Bereich darin, den Benutzern zunächst einen Überblick über die Grundbedeutungen eines Lemmas zu geben und ihnen dann eine Auswahl zwischen verschiedenen Angabentypen z.B. Grammatik, Bedeutungserläuterung, Phraseologie zu ermöglichen. Dass die Chancen der elektronischen Publikationsform erst ansatzweise genutzt werden, liegt vermutlich am Aufwand, der betrieben werden muss um einen maschinenlesbar vorliegenden Wörterbuchtext in ein strukturiertes Format zu überfuhren, in dem auf die einzelnen lexikographischen Angaben gezielt zugegriffen werden kann. Dieser als Wörterbuchparsing bezeichnete Prozess der maschinellen Segmentation und Strukturerkennung ist eine Grundvoraussetzung für eine qualitativ hochwertige Hypertextualisierung von Wörterbuchtexten, wird aber aufgrund des hohen Arbeitsaufwands häufig durch ein sehr grobkörniges Verfahren ersetzt, bei dem lediglich das Lemma vom Rest des Wörterbuchartikels separiert wird. Dass sich der Aufwand eines feinkörnigeren Wörterbuchparsings lohnt, zeigt der Beitrag von Christine Thielen, Elisabeth Breidt und Helmut Feldweg. In dem dort beschriebenen Projekt compass wurde in Zusammenarbeit mit dem Rank Xerox Research Center Grenoble und anderen Partnern ein „intelligentes“ Wörterbuchsystem entwickelt, in dem feinkörnig geparste Wörterbücher mit computerlinguistischen Werkzeugen zur morphologischen Analyse und zum Wortartentagging kombiniert sind. Das System selektiert in Abhängigkeit von einer gegebenen Benutzungssituation relevante Teile des Wörterbuchartikels durch ein kontextsensitives Nachschlageverfahren und präsentiert die Ergebnisse auf einer graphischen Benutzeroberfläche. Nach einer Skizze von Architektur und Funktionalität des coMPASs-Systems beschreiben die Autoren, wie der unstrukturierte Wörterbuchtext für diesen Zweck mit semiautomatischen Verfahren aufbereitet wurde und diskutieren abschließend die Ergebnisse der Systemevaluierung. Während Aufwand und Methode des Wörterbuchparsings relativ gut erforscht sind, fehlt es an Grundsätzen und Methoden, nach denen die lexikographischen Textsegmente durch Hyperlinks neu relationiert werden sollen. In der <?page no="16"?> 16 Bettina Harriehausen-Mühlbauer/ Angelika Starrer bislang vorherrschenden Praxis der automatischen Relationierung wird jede Buchstabenkette zwischen zwei Leerzeichen als Hyperlink behandelt. Eine Aktivierung eines solchen „Hyperlinks“ startet eine Suche nach dieser Buchstabenkette in der Lemmaliste des Wörterbuchs und präsentiert dem Benutzer die jeweiligen Fundstellen. Da jedoch im Allgemeinen keine Rückführung flektierter Formen auf die Grundform (Lemmatisierung) stattfindet, werden potentielle Fundstellen nicht gefunden; dies ist vor allem für flektierende Sprachen wie das Deutsche von erheblichem Nachteil. Ein weiteres Problem bildet das reichhaltige Inventar komplexer sprachlicher Ausdrücke (Mehrwortlexeme), die bei diesem Verfahren nicht mehr als Ganzheit behandelt werden. Eine Verbesserung gegenüber dem bisherigen Vorgehen wäre ein Verfahren, das die Neurelationierung auf der Basis der im gedruckten Text realisierten Verweisstruktur vornimmt. Mit den theoretischen Grundlagen für ein solches Verfahren beschäftigt sich Matthias Kämmerer in seinem Beitrag auf dem Hintergrund der Theorie lexikographischer Texte von Herbert Ernst Wiegand. Auf dieser Grundlage entwickelt er eine Typologie von Verweisangaben in gedruckten Wörterbuchtexten und zeigt dann am Beispiel eines Wörterbuchartikels des „Frühneuhochdeutschen Wörterbuches“, welche Grenzen einer automatischen Relationierung gesetzt sind, wenn neben den explizit gekennzeichneten auch die zahlreichen potentiellen Verweisangaben durch semantisch und fünktional adäquate Hyperlinks berücksichtigt werden sollen. Ebenfalls durch Konvertierung eines gedruckten Wörterbuchs ist das im Beitrag von Heim-Josef Weber beschriebene „Homographen-Wörterbuch der deutschen Sprache“ entstanden. Ziel des Wörterbuchs sowohl in Buchals auch in elektronischer Form ist es, eine vermittelnde Rolle zwischen den in Texten vorkommenden Wortformen und den Stichwörtern herkömmlicher Wörterbücher zu spielen. Es soll einerseits das Auffinden von Lemmata in konventionellen Wörterbüchern erleichtern, andererseits ist es als Datensammlung für computerlinguistische Anwendungen konzipiert. Für die elektronische Darstellung bot sich ein Hypertextsystem an, welches die Homographen über Hyperlinks miteinander verknüpft. Diese Möglichkeit wurde bei der Konzeption des Wörterbuchs bereits mitbedacht. Durch die Aufteilung der Informationen in mehrere aufeinander bezogene Index-, Klassen- und Spezialverzeichnisse lagen bereits im gedruckten Medium verschiedene Zugriffsstrukturen vor, die 1: 1 in das nicht-lineare Medium abgebildet werden konnten. Die Segmentation und Relationierung der lexikographischen Textsegmente erfolgte nach einem halbautomatischen Verfahren, in dem sowohl formale Texteigenschaften als auch Kohärenzkriterien berücksichtigt wurden. Lange Zeit wurde Hypermedia zwar als Publikationsform der Zukunft gepriesen, Zugang zu Hypermedia-Dokumenten hatten jedoch nur wenige Interessierte. Mit dem Aufkommen des World Wide Web (WWW), dem hypermedialen Informationsdienst im Internet, hat sich dies geändert: Ein Internet-Zugang <?page no="17"?> Einfiihrung 17 und die entsprechende Client-Software ermöglichen auf einfache Weise den Zugriff auf große Mengen von miteinander vernetzten Hypermedia- Dokumenten. Allerdings wirft die Offenheit und die spezifische Organisationsform des WWW Probleme auf, die sich bei geschlossenen Hypermedia-Anwendungen in dieser Form nicht stellen. Ausgewählte Probleme des Publizierens im WWW diskutiert Elisabeth Frisch in Ihrem Beitrag am Beispiel der „Review of Information Science“ (RIS), einer elektronisch im WWW publizierten Fachzeitschrift, die vom Hochschulverband für Informationswissenschaft getragen und von einer Projektgruppe um Rainer Kuhlen an der Universität Konstanz entwickelt wurde. Die Autorin zeigt zunächst, wie das traditionelle System wissenschaftlicher Periodika durch die zunehmende Spezialisierung in der Wissenschaft und die wachsende Zahl von Fachpublikationen zu teuer und zu schwerfällig geworden ist, um gerade in innovativen Disziplinen die rasche und aktuelle Kommunikation zwischen den Fachwissenschaftlerinnen und -Wissenschaftlern zu garantieren. Elektronische Fachzeitschriften können deshalb als „Selbsthilfe der Wissenschaft“ angesehen werden, die das Internet nutzen, um unter Umgehung bisheriger Distributionswege wissenschaftliche Ergebnisse schnell und kostengünstig zu publizieren, ohne auf die Qualitätskontrolle durch ein kompetentes Herausgebergremium zu verzichten. Darüber hinaus erlauben die im Internet angebotenen Kommunikationsdienste eine rasche und unkomplizierte Diskussion über diese Publikationen mit Fachkolleginnen und -kollegen aus aller Welt. Neben diesen Vorteilen zeigt die Autorin, die selbst maßgeblich an der Konzeption der RIS beteiligt war, wie die Defizite der im WWW verwendeten Dokumentenauszeichnungsssprache HTML den Gestaltungsspielraum bei der elektronischen Publikation einengen. Abschließend diskutiert sie Fragen der Archivierung, der Referenzierbarkeit und der Identität von Text und Autor, die generell mit der Publikation von Fachzeitschriften in einem globalen offenen Hypertextsystem wie dem WWW verbunden sind und erörtert, warum die pragmatischen Rahmenbedingungen der Textrezeption in einem offenen, dynamischen Hypertextsystem zu einer qualitativen Neubestimmung des Textbegriffs fuhren. Im Beitrag von Bernhard Schröder und Jens Ostermann-Heimig werden die Mehrwerte der nicht-linearen Publikationsform aufgezeigt am Beispiel der Hypertextualisierung der Akademie-Textausgabe von Kants gesammelten Schriften. Die Autoren beschreiben, wie die Rezeption der elektronischen Textedition durch die Vernetzung verschiedener Textebenen und durch vielfältige Suchoptionen erleichtert und erweitert wird. Die CD-ROM-Version wird mit dem Texterschließungssystem WordCruncher für Windows verwaltet, das vielfältige Suchoptionen unterstützt und neuerdings auch um Hypertextfünktionen ergänzt wurde, die zur Nachbildung der Verweisstrukturen der gedruckten Ausgabe in der elektronischen Version verwendet werden. Parallel zur CD-ROM-Ausgabe sollen auch Textrecherchemöglichkeiten im World Wide Web angeboten werden, wobei diese aus Lizenzgründen nur mit gewis- <?page no="18"?> 18 Bettina Harriehausen-Mühlbauer/ Angelika Starrer sen Einschränkungen verfug- und recherchierbar gemacht werden können. Die Autoren beschreiben abschließend die Benutzeroberfläche und die Funktionalität des im WWW verfügbaren Kant-Such-Service. Melina Alexa beschreibt in ihrem Beitrag das Textanalyseprogramm TATOE (Text Analysis Tool with Object Encoding). TATOE wurde am Institut für Integrierte Publikations- und Informationssysteme IPSI der GMD zur empirisch fündierten, semiautomatischen Klassifizierung von Textmustern entwickelt und an einem Korpus mit Künstlerbiographien und einem Korpus mit Beschreibungen archäologischer Stätten getestet. Die Autorin erörtert zunächst die Bedeutung der Textmustererkennung für die maschinelle Sprachgenerierung, skizziert dann die theoretischen und methodologischen Überlegungen, die zum korpusbasierten Mehrebenenansatz von TATOE geführt haben und stellt schließlich die generellen Anforderungen an ein Textmusteranalyseprogramm heraus. Die Beschreibung der Funktionalität und der bisher erzielten Analyseergebnisse zeigt, dass mit TATOE ein flexibles Werkzeug zur Textmusteranalyse vorliegt, das maschinelle Analysewerkzeuge und Funktionen zur intellektuell gestützten Markierung und Relationierung von Textsegmenten auf verschiedenen linguistischen Beschreibungsebenen in derselben Analyseumgebung integriert. Hypertext ist nicht nur ein neues Medium mit praktischem Nutzen für Anwendungsgebiete wie Lexikographie und Grammatikographie. Die Geschichte von Hypertext ist vielmehr geprägt von Informationsutopien und Visionen, die mit der steigenden Popularität des WWW nun auch breiteres Interesse finden. Mit generellen Überlegungen zur Begriffsgeschichte von Hypertext und Hypermedia, zum Verhältnis von Text und Hypertext und zu den Besonderheiten bei der Rezeption und Produktion von Hypertexten rundet der Beitrag von Rolf Todesco den Sammelband ab. Die meisten Beiträge in diesem Band wurden im Workshop „Hypermedia für Lexikon und Grammatik“ diskutiert, der vom Arbeitskreis Hypermedia der Gesellschaft für linguistische Datenverarbeitung GLDV organisiert wurde und im März 1996 am Institut für deutsche Sprache (IDS) in Mannheim stattfand. Wir bedanken uns in diesem Zusammenhang bei Wiebke Möhr und Matthias Kämmerer, die an der Organisation des Workshops mit beteiligt waren sowie bei der Institutsleitung des IDS und dem Vorstand der GLDV, die das Vorhaben unterstützt haben. Die Mehrheit der Autorinnen und Autoren plädierten für eine Publikation der Artikel im gedruckten Medium mit all den Beschränkungen, die dies für die Diskussion über Hypermedia mit sich bringt. Einige der vorgestellten Anwendungen (ElysAVeber; Vorderwülbecke) werden kommerziell vertrieben; zu anderen Projekten ist Anschauungs- und Informationsmaterial im World Wide Web verfügbar; dies gilt insbesondere für die Beiträge von Frisch, von Schrö- <?page no="19"?> Einführung 19 der/ Ostermann-Heimig, von Thielen/ Breidt/ Feldweg und für die vier Beiträge zum GRAMMis-Projekt. Die URLs zu den betreffenden WWW-Seiten sind in den Beiträgen und auf dem elektronischen Inhaltsverzeichnis zu diesem Band angegeben, das unter der URL http: / / www.ids-mannheim.de/ grammis/ work. html abgerufen werden kann. Auf diese Weise möchten wir eine Schnittstelle schaffen zwischen dem gedruckten Sammelband und den elektronischen Publikationsformen, die in ihm diskutiert werden. <?page no="21"?> Bruno Strecker Hypertext: Chance und Herausforderung für die Grammatikschreibung 1. Traditionelle Probleme der Grammatikschreibung Wer je damit befasst war, eine Grammatik oder auch nur einen größeren Ausschnitt einer solchen zu schreiben, kennt, jenseits aller Sachfragen, diese Schwierigkeiten 1 : - Unter welchen Aspekten sollen die Informationen zusammengestellt werden? - Wie soll man den Text aufbauen? - Für wen schreibt man überhaupt? Was formal gleicher Art ist, kann aus funktionaler Sicht verschieden sein. Besonders deutlich wird dies bei der formal bestimmten Kategorie der Adverbiale, deren Elemente verschiedenste kommunikative Funktionen erfüllen können: 1) Aus langjähriger Erfahrung wissen wir, was von solchen Angeboten zu halten ist. (Kausalbestimmung) 2) Schmalzriedfährt beijedem Wetter \ mit dem Fahrrad \ zur Arbeit. (Umstandsbestimmung | Instrumentalbestimmung | Richtungsbestimmung) 3) Die Sektsteuer wird vermutlich nie abgeschafft. (Modalisierung) Was von seiner kommunikativen Funktion her zusammengehört, ist oft genug formal so heterogen, dass die Tradition geradezu verbietet, den Aufbau einer Grammatik daran zu orientieren. So dienen etwa die markierten Ausdruckseinheiten in diesen Beispielen durchweg der Modalisierung des Gesagten: 4) Du hast wohl wieder mal verpennt. 5) Sie wird den Zug verpasst haben. 6) Karl May möglicherweise doch mal in Amerika gewesen. 7) Die nächste Station ist Osterfeld, wenn ich mich nicht irre. 1 Eine gute Darstellung dessen, was auf Grammatikographen zukommt, gibt Hoffmann (1992). <?page no="22"?> 22 Bruno Strecker Den klassischen Grammatikschreiber fuhren die verschiedenen Klassifikationsmöglichkeiten in eine echte Doppelbindung. Wie immer er sich entscheidet, er muss wichtige Gesichtspunkte außer Acht lassen oder zumindest in einer Weise unterordnen, die nicht ihrem sachlichen Gewicht entsprechen. Versucht er, sich mit ständigen Querverweisen zu behelfen, wird dadurch die ohnehin schwierige Nutzung seines Textes in unzumutbarer Weise erschwert. Die beste Lösung ist noch, in einem Buch beide Betrachtungsweisen nebeneinander zu stellen, 2 die schlechteste Lösung wäre eine undurchschaubare Vermischung beider Aspekte. Um erwartbare Missverständnisse zu vermeiden, eine grundsätzliche Bemerkung zum Status der formalen und der funktionalen Betrachtungsweise in der Grammatik: Es handelt sich dabei keineswegs um eine modernistische Marotte, die mit dem Aufkommen formaler und funktionaler Grammatiken zu tun hat, sondern um das theorieunabhängig gegebene Faktum, dass wir zum einen als Sprecher bzw. Schreiber, zum andern als Hörer bzw. Leser mit sprachlichen Einheiten zu tun haben. Zwar haben wir üblicherweise in kurzer Folge beide Rollen inne, doch bringt jede Perspektive Probleme eigener Art mit sich, die nicht einfach dadurch zu bewältigen sind, dass man Strukturbäume umstülpt oder Regelsysteme in umgekehrter Richtung durchläuft. Solange wir keine Schwierigkeiten beim Abfassen und Verstehen von Gesprächsbeiträgen haben, werden uns rollenspezifische Fragestellungen nicht in den Blick kommen, doch sobald die Routine unterbrochen wird, treten Unterschiede zu Tage. Als Sprecher haben wir primär nicht das Problem, grammatisch korrekte Zeichenfolgen zu bilden, sondern eine Reihe kommunikativer Aufgaben abzuarbeiten. Als Hörer hingegen müssen wir erst einmal ein formales Gebilde erschließen. Grammatiken sind wie immer man sie gestaltet und wie immer sie theoretisch orientiert sein mögen in jedem Fall ausgesprochen komplex. So komplex, dass ihr Textaufbau selbst zu einem der größten Probleme für ihre Benutzer wird, weil benötigte Information oft nur von Kennern mit vertretbarem Aufwand aufzuspüren ist. Sach- und Wortverzeichnisse helfen nur beschränkt. Hier zeigt sich ein echter Konflikt zwischen elementaren Kommunikationsprinzipien: 3 Als kooperativer Kommunikationsteilnehmer ist man gehalten, hinreichend informativ zu sein, andererseits sollte man sich verständlich ausdrücken. Bei der sachlich gebotenen Fülle an Information lässt sich beides nicht immer vereinbaren. Mehr Transparenz und damit Verständlichkeit ist oft nur durch Reduktion der angebotenen Information zu erreichen, doch sind im 2 In der Grammatik der deutschen Sprache (vgl. Zifonun/ Hoffmann/ Strecker 1997) haben wir faul de mieux diese Lösung gewählt, doch den wenigsten Grammatikographen steht soviel Raum zur Verfügung. 3 In der sprachanalytischen Literatur werden diese Prinzipien im Anschluss an Grice (1975) auch als Kommunikationsmaximen bezeichnet. Siehe hierzu auch Strecker (1977). <?page no="23"?> Hypertext: Chance und Herausforderungfür die Grammatikschreibung 23 Fall der Grammatik meist gerade Informationen besonders gefragt, die eher ausgefallene Erscheinungen betreffen. 4 Nicht weniger schwierig ist die adressatengemäße Darstellung. Das fängt damit an, wer überhaupt als Leser oder Benutzer in Frage kommen soll. Das Spektrum möglicher Adressaten reicht vom ungeübten, gelegentlichen Schreiber bis zum Fachkollegen, der sich punktuell für eine bestimmte grammatische Erscheinung interessiert oder gar nur sehen will, wie andere behandeln, was er selbst untersucht. Da es so gut wie ausgeschlossen ist, so unterschiedlichen Interessen und Wissensvoraussetzungen mit einem Werk zu genügen, hat sich der Markt für Grammatiken in Segmente aufgespalten, die bestimmte Benutzergruppen klarer zu bedienen suchen. Das ist grundsätzlich nicht schlecht, doch ist es selten gelungen. Das ist vor allem auf ungeklärte Wissensvoraussetzungen und Erkenntnisinteressen zurückzuführen. In der Regel muss man als Grammatikbenutzer erst einen Grammatikkursus absolviert haben, um mit dem Buch zurechtzukommen und insbesondere zu erkennen, welcher Art Information es zu bieten hat. Soviel zu den Problemen, die mit klassischen Publikationsformen so gut wie nicht zu bewältigen sind. Das Aufkommen von Hypertextsystemen hat hier eine völlig neue Lage geschaffen. Zwar wird man auch damit nicht alles zur letzten Zufriedenheit lösen können, 5 doch wird es möglich, im Rahmen eines kohärenten Systems Informationen unterzubringen, die gleichermaßen verschiedene Perspektiven, verschiedene Interessen und verschiedene Wissensvoraussetzungen in Rechnung stellen können. Hypertextsysteme sind allein schon deshalb ideale Werkzeuge für die Grammatikschreibung. 6 2. Eine Grammatik für alle Lebenslagen? Die neuen Medien machen sie möglich, die umfassende Mehrzweckgrammatik, die auf alle erdenkliche Anfragen eingerichtet ist, doch wird sie ernstlich gebraucht? Der Aufwand, der mit der Entwicklung einer solchen Grammatik oder besser eines solchen grammatischen Informationssystems verbunden ist, 4 Natürlich könnte man auf den Gedanken kommen, dann all die Informationen einzusparen, die weniger notwendig scheinen, doch hätte dies zur Folge, dass die spezielleren gleichsam in der Luft hängen und deshalb noch schwerer zugänglich werden. 5 Lernprozesse bleiben auch nach Vernetzung aller Informationen Prozeduren, bei denen ein Schritt auf den anderen folgen muss. 6 Tatsächlich ist mein Wunsch, über ein solches Arbeitsmittel zu verfügen, um einiges älter als meine Kenntnis von entsprechenden Systemen, und die Idee, ein Projekt wie GRAMMis das in Storrer (1995), Storrer (in diesem Band) und Schneider (ebd.) vorgestellt wird zu realisieren, entstand sofort, als ich die ersten, noch sehr simplen Hypertextprogramme kennengelemt hatte. <?page no="24"?> 24 Bruno Strecker hängt natürlich wesentlich davon ab, wieviel Benutzerebenen und Erkenntnisinteressen man unterscheiden will, doch wird er in jedem Fall gewaltig sein. Eine Reihe guter Gründe spricht jedoch dafür, sich als Grammatiker grundsätzlich der Herausforderung zu stellen: - Das neue Medium erlaubt, Informationen einzubinden, die in Buchform gar nicht (Tondokumente, Videosequenzen) verfügbar sind oder nur mit großem Beschreibungsaufwand illustriert werden können (Animationen, z.B. um Stellungsphänomene oder Prozeduren anschaulich zu machen). Hinzu kommen Hilfen, die zwar nichts grundsätzlich Neues bringen, jedoch die Arbeit mit und an dem Text erleichtern: schneller Zugriff auf ein Glossar, Suchhilfen, bei Internetzugang sogar direkte Verknüpfung mit weiterführenden oder alternativen Informationen rund um die Welt. - Schriften der Art von Grammatiken werden in jedem Fall in Zukunft die Form von Hypertexten haben, denn sie gehören eindeutig zu der Art von Texten, für die diese Gestaltung fast nur Vorteile bringt: Niemand abgesehen vielleicht von Rezensenten liest in einer Grammatik große fortlaufende Textstücke; man sucht eher knappe Informationen und bewegt sich in mehr oder weniger großen Sprüngen durch den Text. Wird dennoch einmal die Lektüre einer längeren Textpassage erforderlich, hat man immer noch die Option, das Kapitel oder den Abschnitt auszudrucken. Das Einzige, was gegen eine solche Entwicklung sprechen könnte, ist die Tatsache, dass man für die Arbeit mit Hypertexten wesentlich mehr Aufwand treiben muss, als bei der Arbeit an Buchtexten: Man braucht relativ teure Apparate, muss den Umgang damit erlernen und sie bei der Lektüre aktiviert haben. Heute - Januar 1997 mag mancher dies noch für ein entscheidendes Manko halten, doch verliert es als Gegenargument mehr und mehr an Gewicht, weil immer mehr potentielle Grammatikbenutzer über Computer verfügen, den Umgang damit sowieso beherrschen und in aller Regel, wenn sie eine grammatische Information nachsuchen wollen, das Gerät ohnedies in Betrieb genommen haben, weil es ihr tägliches Arbeitsgerät ist. Traditionalisten werden diese Entwicklung bedauern, aber in Anbetracht der eindeutig größeren Benutzerffeundlichkeit und Informationsfülle solcher Texte 7 ist diese Entwicklung nicht aufzuhalten. Bei Lexika ist dies bereits abzusehen, und jedes weitere Zögern der professionellen Sprachwissenschaft, sich darauf einzustellen, wird sie weiter ins Abseits manövrieren und der Markt soweit ein solcher für Grammatiken vorhanden ist wird von laienhaften Produkten beherrscht werden, wie sie jetzt schon allenthalben angeboten werden. 7 Im Grund handelt es sich längst nicht mehr um reine Texte. Den eigentlichen Text können Tondokumente und Videosequenzen unterstützen. <?page no="25"?> Hypertext: Chance und Herausforderungfür die Grammatikschreibung 25 Benutzer von Grammatiken wissen oft genug nicht genau, an welcher Art Information sie interessiert sind oder sein sollten. Schreiber von Grammatiken wiederum wissen oft genug ebensowenig, welche Informationen die erwarteten Benutzer nachfragen werden, nicht einmal, welche Benutzer sich tatsächlich finden werden. Hier können die erweiterten Informationsmöglichkeiten und die angesprochene höhere Transparenz von Hypertexten bei entsprechender Benutzerfiihrung nur hilfreich sein. Es gibt nichts Gutes, es sei denn, man tut es. Niemand wird diese Arbeit mit der nötigen Sorgfalt erledigen, wenn nicht die Grammatiker selbst, denn es ist nicht zu erwarten, dass für elektronische Informationssysteme zur Grammatik ein wesentlich größerer Markt entstehen wird als für bekannte Buchgrammatiken. Da zugleich die Kosten für die Erarbeitung eines solchen Systems wesentlich über den Kosten für die Herstellung eines Buchmanuskripts liegen, wird sich kaum jemand finden, der uns die zugegeben nicht immer geistvolle Arbeit abnimmt, zumal es keinesfalls genügt, einer fähigen Programmiererin oder einem fähigen Programmierer eine fertige Grammatik in die Hand zu drücken, wenn man die Möglichkeiten eines Hypertextsystems optimal nutzen will. Wie sollte sie bzw. er ohne Fachkenntnisse wissen, welche Querverbindungen sinnvoll sind? Natürlich macht es einige Mühe, das Arbeiten mit Hypertextsystemen zu erlernen, doch als überflüssige Belastung und Ablenkung von der eigentlichen Forschungstätigkeit wird man das nur empfinden, solange man darin ein bloßes Umsetzen von Druckerzeugnissen sieht. Sobald man dazu übergeht, genuin als Hypertexte konzipierte Texte zu verfassen, wird man darin keine Behinderung mehr erkennen, sondern eine echte Erweiterung der Ausdrucksmöglichkeiten. Die durch das neue Medium ausgelöste Reflexion kann für die gesamte Grammatikschreibung positive Folgen haben, weil sie elementare Fragen neu aufwirft, die in der gängigen Praxis nicht oder nicht mehr hinreichend ernst genommen werden. So kann man etwa der Frage, wer welche grammatische Information wofür braucht, nicht einfach dadurch ausweichen, dass man sich an tradierte Formen hält. Auch Fragen der Progression beim Erwerb grammatischen Wissens gewinnen neues Gewicht: Die weitgehende Aufhebung der Linearität des Textes schafft Raum für differenzierte Formen der Benutzerführung, und die Entwicklung solcher Formen ist wiederum verbunden mit intensiver Reflexion auf Zusammenhänge im grammatischen System der betrachteten Sprache. <?page no="26"?> 26 Bruno Strecker 3. Und wo bleibt das Negative? Wenn in Zukunft elektronische Informationssysteme an die Stelle von Buchgrammatiken treten, sind flächendeckend ausreichende apparative Ausstattung vorausgesetzt keinerlei fachspezifische Nachteile zu erwarten. Eine allgemeine Befürchtung ist jedoch nicht von der Hand zu weisen: Hypertexte sind als stets bearbeitbare Dateien nie wirklich fertiggestellt. Man kann sie jederzeit ausbauen, umbauen, auch kürzen. Positiv daran ist, dass sich erkannte Mängel problemlos beseitigen lassen und dass man mit der Einarbeitung neuer Erkenntnisse nicht Jahre warten muss oder gar immer darauf verzichten muss, weil eine Neuauflage nicht zustande kommt. Negativ - und das sollte man nicht unterschätzen ist daran, dass man sich, weil man um den prinzipiell provisorischen Charakter des Produktes weiß, nie gezwungen sehen muss, seinen Text als ausgereiftes Produkt zu präsentieren. 8 Qualitätsverluste sind damit zwar nicht unausweichlich, doch weiß jeder, der die heilsame Wirkung von Abgabeterminen kennt, wie groß die Versuchung ist, sich dem Zwang zur Vollendung zu entziehen. Für einen Augenblick mochte es so scheinen, dass wenigstens die Präsentation als CD-ROM eine gewisse Reife erwarten lässt. Mit der rasanten Ausbreitung von CD-ROM-Brennern ist auch dies nahezu hinfällig geworden. Diese negative Begleiterscheinung elektronischer Publikation wird noch verstärkt durch das Aufkommen des „World Wide Web“ als Medium, das über automatische Suchmaschinen wie „Yahoo“ und „Alta Vista“ gleichsam unfiltriert Informationen unterschiedlichster Qualität nebeneinander verfügbar macht. Manche Kenner des Mediums sprechen bereits von einer zunehmenden Verblödung durch das Internet. 9 Bevor diese Bedenken in allgemeinen Kulturpessimismus Umschlägen eine Überlegung zu Möglichkeiten, die Segnungen zu nutzen ohne Qualitätsverlust: Was uns bisher davor bewahrt hat, bei jeder Recherche mit Informationen verschiedenster Qualität restlos zugemüllt zu werden, war vor allem der Aufwand, den Herstellung und Beschaftung von Druckwerken bedeuten. Vieles schaffte schon die erste Hürde nicht, übrigens nicht immer und unbedingt das Schlechteste. Vieles wurde einem gar nicht erst bekannt, und manches war einfach nicht herbeizuschaffen. In diesen Punkten werden künftig wohl viele Schranken fallen. Man sollte das grundsätzlich begrüßen, denn es bricht die 8 Dass die Entwicklung in diese Richtung geht, zeigen m.E. die Erfahrungen mit Seminararbeiten an den Universitäten: Auf den ersten Blick sind solche Texte dank professioneller Textverarbeitung heute oft besser gestaltet als vor wenigen Jahren noch ganze Habilitationsschriften. Schon der zweite Blick zeigt aber nicht selten die gewohnten formalen wie sachlichen Schwächen. 9 So etwa Clifford Stoll in einem Gespräch mit Hansjörg Neth. In: c’t (1996), Heft 12, S. 88-93. <?page no="27"?> Hypertext: Chance und Herausforderungfur die Grammatikschreibung 27 Macht von Einrichtungen wie Verlagen, deren Politik manche interessante Publikation ganz unterdrückt oder über horrende Preise für viele nahezu unzugänglich macht. Der Gefahr völliger Beliebigkeit kann man entgehen, indem man Editorial-Boards für CD-ROM-Reihen und Internetpräsentationen einrichtet, um Orte zu schaffen, an denen man Informationen antreffen kann, die von Fachgremien für publikationswürdig erachtet werden. Da niemand daran gehindert wird, solche Boards einzurichten, führt das nicht zu Zensur, nur zu einer Art Vorsortierung, die man für sich nutzen kann oder auch nicht Wenn dann, wie nicht anders zu erwarten, Zulassung zur Publikation in einer bestimmten Reihe oder einem bestimmten Forum zum Kriterium für wissenschaftliches Prestige wird, ist alles getan, um einer „Verschluderung“ wissenschaftlichen Publizierens durch die neuen Medien entgegenzuwirken. Eine letzte kritische Anmerkung das Medium betreffend: Was vor 200 Jahren als Buch veröffentlicht wurde, kann auch heute noch gelesen werden. Schon in zwanzig Jahren wird man jedoch ohne ständiges technisches Updating keines der aktuellen Programme mehr sinnvoll nutzen können, wenn die Entwicklung neuer Hard- und Software ihr gegenwärtiges Tempo beibehält. Keine frohe Perspektive, wenn man bedenkt, dass der Aufbau elektronischer Informationssysteme eine wissenschaftliche Arbeitsgruppe leicht ein Jahrzehnt beschäftigen kann. Ein Ausweg freilich ist hier nicht abzusehen. Man wird damit leben müssen, und vielleicht findet man Trost in dem Gedanken, dass alte Bücher zwar noch zu lesen sind, doch selten genug gelesen werden. 4. Literatur Grice, Herbert Paul (1975): Logic and Conversation. In: Cole, Peter/ Morgan, Jerry L. (Hg ): Speech acts. (= Syntax and Semantics III). New York. S. 41-58. Hoffmann, Ludger (1992): Grammatik falsche Erwartungen, neue Perspektiven. In: Janota, Johannes (1992) (Hg ): Kultureller Wandel und die Germanistik in der Bundesrepublik. Tübingen. S. 220-232. Schneider, Roman (in diesem Band): Zur Lexikon-Grammatik-Schnittstelle in einem hypermedialen Informationssystem. Storrer, Angelika (1995): Die Grammatik mit der Maus. Konzeption eines multimedialen Informationssystems zur deutschen Grammatik. In: Hitzenberger, Ludwig (1995) (Hg ): Angewandte Computerlinguistik. Hildesheim/ Zürich/ New York. S. 291-303. Storrer, Angelika (in diesem Band): Hypermedia und Grammatikographie. Strecker, Bruno (1977): Kommunikationsprinzipien und der Aufbau von Kommunikation. In: Heringer, Hans-Jürgen/ Öhlschläger, GüntherAVimmer, Rainer/ Strecker, Bruno: Einführung in die Praktische Semantik. Heidelberg. S. 167-181. Zifonun, Gisela/ Hoffmarm, Ludger/ Strecker, Bruno (1997): Grammatik der deutschen Sprache. Berlin/ New York. <?page no="29"?> Angelika Storrer Hypermedia und Grammatikographie 1. Einleitung Es sind meist Wörterbücher, Enzyklopädien, Handbücher und Lernprogramme, die als Beispiele herangezogen werden, wenn es darum geht, die Mehrwerte von Hypermedia gegenüber dem gedruckten Medium herauszustellen Ein umfangreiches Referenzwerk zur deutschen Grammatik, das die Vorzüge des neuen Mediums nutzt, steht hingegen noch aus. Grammatisches Wissen in hypertextualisierter Form findet sich bislang hauptsächlich in dezidierten Lernprogrammen für den Schulunterricht oder als Komponenten von Programmen zum computergestützten Fremdsprachenlernen. In der Abteilung Grammatik des Instituts für deutsche Sprache (IDS) wurde eine umfangreiche wissenschaftliche Grammatik des Deutschen erarbeitet, die Grammatik der deutschen Sprache (im weiteren GDS, vgl. Zifonun/ Hoffmann/ Strecker 1997), die in gedruckter Form als Dreibänder publiziert werden wird. In dem in derselben Abteilung angesiedelten Projekt GRAMMIS 1 wird nun seit 1993 erforscht, wie die Inhalte dieser Grammatik in elektronischer Form als hypermediales grammatisches Informationssystem publiziert werden können, welche Gestaltungsspielräume sich durch das neue Medium für die Autoren eröffnen und welche Vor- und Nachteile die neue Publikationsform für die Rezipienten mit sich bringt. Der vorliegende Artikel möchte anhand der im GRAMMIS-Projekt gesammelten Erfahrungen zeigen, warum, wie und mit welchen Einschränkungen die neue Publikationsform zur Lösung von Problemen beiträgt, die beim Schreiben und Lesen von Buchgrammatiken auftreten können. Diese Probleme werden im folgenden Abschnitt kurz erläutert. Abschnitt 3 skizziert die Zielsetzung des GRAMMIS-Projekts und beschreibt die Phasen der bisherigen Systementwicklung. In Abschnitt 4 zeige ich dann an Beispielen aus dem bisher entwickelten Pilotsystem, wie die charakteristischen Eigenschaften von Hypermedia - Nichtlinearität, Multimedia und Interaktivität für die Grammatikographie eingesetzt werden können. In Abschnitt 5 ziehe ich schließlich eine vorsichtige Bilanz, gestützt auf die subjektiven Eindrücke der GRAMMIS- Autoren und die Rückmeldungen, die wir bislang von den Testnutzern des Pilotsystems erhalten haben. 1 Das Akronym grammis steht für „Grundlagen eines GRAMmatischen Informationssystems“. Verschiedene Aspekte des Projekts werden in den anderen Aufsätzen des Sammelbands (Breindl (in diesem Band), Schneider (ebd.), Strecker (ebd.)) sowie in Storrer (1995), Storrer (1997) und Schneider (1997) behandelt. <?page no="30"?> 30 Angelika Stoner 2. Probleme im Umgang mit Buchgrammatiken Obwohl Grammatiken 2 auf eine traditionsreiche, bis in die Antike zurückreichende Geschichte zurückblicken können, 3 gehören sie nicht zu den vielgelesenen Büchern. Am ehesten werden wohl noch didaktische und pädagogische Grammatiken benutzt, Grammatiken für den Unterricht in Deutsch-als-Fremdsprache oder den muttersprachlichen Unterricht in der Schule. Wissenschaftliche Grammatiken 4 wie die GDS oder die Akademie-Grammatik (Grundzüge 1980), die vor einem theoretischen Hintergrund Struktur und Funktionsweise des „Kenntnissystems Grammatik“ beschreiben, können aufgrund ihrer Komplexität nur noch einen wesentlich eingeschränkteren Rezipientenkreis erreichen. Daß Buchgrammatiken im Vergleich zu anderen sprachlichen Nachschlagewerken wenig gekauft und selten benutzt werden, ist sicherlich auch ein Reflex einer mangelhaften und normativ geprägten Grammatikvermittlung im Schulunterricht. Aber auch grammatisch interessierte und vorgebildete Benutzer haben häufig Schwierigkeiten, umfangreiche Grammatiken erfolgreich zu verwenden. In Gesprächen mit Lehrenden im Schul- und Hochschulbereich werden folgende Probleme genannt: - Auffindungsprobleme: Grammatiken werden im allgemeinen nicht ganz gelesen sondern zum punktuellen Nachschlagen benutzt. Wie aber die gesuchte Information auffinden? Im Gegensatz zu Wörterbüchern wird der Gebrauch von Grammatiken im Schulunterricht meist nicht eingeübt. Die wenigsten Schulabsolventen verfugen deshalb über geeignete Strategien der Informationserschließung. Doch selbst kundige Grammatikbenutzer, die souverän mit Wort- und Sachregister umzugehen gelernt haben, können eine potentiell erschließbare Information nicht oder nur mir großer Mühe finden, wenn diese quer zu der in der Grammatik gewählten Anordnung des grammatischen Wissens (s.u. Vemetzungsproblem) liegt. Dies ist zum Beispiel dann der Fall, wenn in einer Grammatik, die sich am sprachlichen Formaufbau orientiert, alle sprachlichen Mittel zu Modalisierung oder Kausativierung gesucht werden, oder wenn eine homonyme Wortform wie nur oder aber in einem bestimmten Verwendungskontext einer Wortart zugeordnet werden muß. - Verstehensprobleme. Die Benutzer können die in Grammatiken gemachten Angaben oft nicht verstehen, da die von den Autoren antizipierten Wis- 2 Mit dem Ausdruck Grammatik wird in diesem Aufsatz die wissenschaftlich-linguistische Beschreibung des Kenntnissystems Grammatik bezeichnet; im Sinne einer Grammatik B der in Helbig (1992, S. 135) vorgenommenen Bedeutungsdifferenzierang. 3 Zu Begiff und Geschichte der Grammatikographie vgl. Cherubim (1980, S. 587ff), 4 Zur Unterscheidung von didaktischen, pädagogischen und wissenschaftlichen Grammatiken vgl. Helbig (1992). <?page no="31"?> Hypermedia und Grammatikographie 31 sensvoraussetzungen zu hoch angesetzt wurden. Die in Sitta (1989) beschriebenen Erfahrungen mit der Nutzung didaktischer Grammatiken durch Lehrer zeigen, daß häufig zuviel vorausgesetzt wird: „Alle Daten, die wir haben, stützen die Vermutung, daß es mit Grammatikkenntnissen nirgends weit her ist.“ (Sitta 1989, S. 37) Dieses Problem stellt sich bei wissenschaftlichen Grammatiken in verschärftem Maße: Das Mehr an Präzision und theoretischer Fundiertheit, das von einer solchen Grammatik erwartet wird, stellt sehr hohe Anforderungen an die Rezipienten und überfordert dadurch vor allem grammatisch weniger versierte Benutzer. - Terminologieprobleme. Grammatiken benötigen ein umfangreiches Inventar von Termini, mit dem grammatische Kategorien, Operationen und Regeln beschrieben werden. Daß viele Benutzer die Bedeutung dieser Termini nicht kennen, ist eine Facette des Verstehensproblems. Es kommt jedoch erschwerend hinzu, daß derselbe Terminus in verschiedenen Grammatiken in unterschiedlicher Weise definiert wird oder daß dieselben oder ähnliche Kategorien in verschiedenen Grammatiken unterschiedlich benannt sind. 5 Im besten Fall sind sich die Benutzer dessen bewußt, daß die Bedeutung der Termini an die in der Grammatik eingenommene theoretische Perspektive gebunden ist. Fehlt ein Glossar, kann es auch in diesem Fall mühevoll sein, sich aus den häufig im ganzen Buch verstreuten Definitionen und Erläuterungen die terminologischen Voraussetzungen zu erarbeiten, die zum Verständnis eines grammatischen Teilthemas benötigt werden. Im schlechteren, vermutlich aber häufigeren Fall sind sich die Benutzer über die theoretische Rückgebundenheit grammatischer Termini gar nicht bewußt (vgl. Sitta 1989, S. 37), und verstehen vermeintlich vertraute Termini falsch. - Vernetzungsprobleme: Beim punktuellen Nachschlagen muß sich ein Leser aus einem Teiltext, zu dem ihn die Zugriffsstruktur geleitet hat, die gesuchte Information erschließen. In diesem Teiltext finden sich üblicherweise Termini, die an anderer Stelle definiert sind, sowie häufig Querverweise zu anderen Textteilen, die auf verschiedene Weise ebenfalls relevante Information zum Thema und möglicherweise weitere unbekannte Termini und Querverweise enthalten. Je umfangreicher eine Grammatik, desto häufiger muß der Benutzer viele Male zwischen verschiedenen Textteilen hin- und herblättern, bis er sich die gesuchte Information erschließen kann sofern ihm dies überhaupt gelingt. Das Vernetzungsproblem stellt sich in verschärfter Form dann, wenn die gesuchte Information quer zu der in der Grammatik gewählten primären Zugriffsstruktur in den meisten Fällen zu 5 Die Termini Aktanten, Ergänzungen, Komplemente, Handlungsrollen bezeichnen beispielsweise in verschiedenen Grammatiken (Engel 1988, Helbig-Buscha 1986, Weinrich 1993, Zifonun/ Hoffmann/ Strecker 1997) die von der Valenz eines Verbs gebundenen Satzteile, allerdings unter unterschiedlicher theoretischer Perspektive und mit unterschiedlichen Extensionalisierungsbedingungen in Bezug auf die Beschreibung der Einzelverben. <?page no="32"?> 32 Angelika Stoner dem Inhaltsverzeichnis liegt (s o. Auffindungsprobleme) und deshalb aus mehreren Kapiteln zusammengetragen werden muß. Auch wenn bislang bedauerlicherweise noch keine empirischen Untersuchungen zu Nutzungserfolg bzw. -mißerfolg von Buchgrammatiken vorliegen, sind diese Probleme den Autoren von Grammatiken bekannt. 6 Allerdings gibt es aus folgenden Gründen keine einfachen Mittel, um sie zu beheben: Grammatisches Wissen kann man mit unterschiedlichen Zielsetzungen und unter unterschiedlichen Perspektiven beschreiben: unter der Perspektive der Sprachrezeption oder der Sprachproduktion, unter typologischer Perspektive oder in Kontrast zur Grammatik einer anderen Sprache, um nur einige zu nennen. Die Beschreibung grammatischen Wissens umfaßt meist verschiedene Beschreibungsebenen z.B. Morphologie, Wortbildung, Syntax, Semantik, kommunikative Funktion deren Einheiten in vielfältigen Beziehungen zu Einheiten derselben oder anderer Beschreibungsebenen stehen. Auch bei der Beschreibung grammatischer Prozesse spielt die Interaktion zwischen Einheiten auf mehreren Beschreibungsebenen eine große Rolle. Aus dieser komplexen Struktur des grammatischen Gegenstandsbereichs resultiert unvermeidbar das oben besprochene Vernetzungsproblem. Natürlich läßt sich ein hochvernetzter Gegenstandsbereich auch in verschiedenster Weise untergliedern und anordnen. Der Vergleich der Inhaltsverzeichnisse verschiedener Grammatiken zeigt, daß sich für Buchgrammatiken noch keineswegs standardisierte Anordnungsformen herausgebildet haben, wie dies für Wörterbücher der Fall ist. 7 Vielmehr orientiert sich der Aufbau der verschiedenen Grammatiken am anvisierten Adressatenkreis und der zugrundeliegenden Grammatiktheorie. Denn was alle Grammatikforscher wissen, vielen Grammatikbenutzem und auch vielen Studierenden nicht klar ist: Art und Anzahl der gewählten Ebenen und Grundeinheiten, ihr Stellenwert im Gesamtmodell sowie die Beschreibung und Erklärung grammatischer Prozesse variieren innerhalb verschiedener theoretischer Ansätze erheblich. Zwar ist die vorhandene Theorienpluralität wünschenswerte Triebfeder für die weitere Erforschung des Kenntnissystems Grammatik; sie ist aber auch der Grund dafür, daß dem Terminologie- und damit dem Verstehensproblem durch Normierung und einheitliche Verwendung grammatischer Termini nicht so einfach beizukommen ist, wie sich „naive“ Grammatikbenutzer dies wünschen. Das in der Einleitung der GDS formulierte Präzisierungsdilemma „Ein Mehr an Präzision bedingt auch ein gewisses Mehr an Unverständlichkeit“, bedeutet, daß die oben diskutierten Verstehensprobleme beim Schreiben von wissenschaftlichen Grammatiken teilweise in Kauf genommen werden müssen, um 6 Vgl. Hoffmann (1989) Strecker (in diesem Band) und die Einleitung der gds. 7 Zu Anordnungsformen in Wörterbüchern vgl. Wiegand (1989). <?page no="33"?> Hypermedia und Grammatikographie 33 den Erwartungen an Präzision und theoretischer Fundiertheit gerecht zu werden, die von Fachkollegen und grammatisch versierten Benutzern an eine wissenschaftliche Grammatik herangetragen werden. Dies enthebt die Autoren aber nicht der Verpflichtung, sich soweit wie möglich auf die hypothetisch antizipierten - Wissensvoraussetzungen ihrer Adressaten einzustellen Genau hier liegt aber das Problem vieler, auch nicht-wissenschaftlicher Grammatiken: Sie richten sich an einen breitgefächerten Adressatenkreis, bei dem sehr heterogene Wissensvoraussetzungen zu erwarten sind (vgl. Hoffmann 1989). Die GDS macht hierin keine Ausnahme, wenn sie ihre Zielgruppe als „Sprachinteressierte mit Vorkenntnissen“ umreißt und durch folgende Aufzählung präzisiert: „Kolleginnen und Kollegen aus der Linguistik und den Nachbardisziplinen (Informatik/ Künstliche-Intelligenz-Forschung, Psychologie, Sozialwissenschaften usw ). Lehrende und Studierende, denen sprachwissenschaftliche Probleme nicht fremd sind und die einfach viel über das Deutsche wissen wollen.“ (gds, Einleitung). Die Wissensvoraussetzungen dieser heterogenen Gruppe zu antizipieren und beim Schreiben die richtige Balance zwischen Präzision und Einfachheit zu finden, ist sicherlich eines der schwierigsten Probleme, mit denen Autoren von Grammatiken zu kämpfen haben. 3. GRAMMIS: Grundlagen eines grammatischen Informationssystems Die im vorigen Abschnitt angesprochenen Probleme können sicherlich nicht allein durch einen Wechsel des Mediums beseitigt werden. Der Übergang vom Grammatikbuch zur grammatischen Hypermedia-Anwendung bietet jedoch vielfältige Möglichkeiten, die Auffmdungs-, Vemetzungs- und Terminologieprobleme abzumildern und das Problem der Adressatenvielfalt neu anzugehen. Dies war die Motivation für das Projekt GRAMMIS, in dem auf der inhaltlichen Grundlage der GDS der Gestaltungsspielraum der neuen Publikationsform ausgelotet werden soll. In der Pilotphase des Projekts werden zu ausgewählten grammatischen Themenbereichen Prototypen entwickelt, die mit verschiedenen Aspekten von Hypermedia experimentieren. Zur Systementwicklung in der Pilotphase wird das Autorensystem Toolbook (Asymetrix, Version 4.0) 8 und das relationale Datenbanksystem Paradox (Borland, Version 4.5) ver- 8 Zu den Eigenschaften von Autorensystemen im allgemeinen und Toolbook im besonderen vgl. Freibichler (1995). <?page no="34"?> 34 Angelika Starrer wendet. Es lassen sich verschiedene Phasen in der Entwicklung des Pilotsystems unterscheiden 9 : In der ersten Projektphase wurde die „Architektur“ des geplanten Gesamtsystems festgelegt, d.h. die Komponenten, ihr Zusammenspiel und die Ausgestaltung der Benutzeroberfläche. Der in dieser Phase entwickelte Prototyp GRAMMIS-l behandelt die Wortarten des Deutschen auf der textuellen Grundlage des von Ludger Hoffmann verfaßten Kapitels „Wortarten und interaktive Einheiten“. Das Kapitel bot sich in vielerlei Hinsicht als Einstieg an: - Es fuhrt terminologisches Grundwissen ein, auf dem spätere Kapitel aufbauen. - Das Thema ist für den Schul- und Fremdsprachenunterricht relevant und spricht deshalb einen breiten Kreis von Interessenten an. - Es enthält viele Querverweise zu anderen Kapiteln der Grammatik, in denen das zunächst überblicksartig dargebotene Wissen vertieft werden kann. - Es enthält im Vergleich zu anderen GDS-Kapiteln wenig argumentative und diskursive Textpassagen. An diesem relativ einfach strukturierten Kapitel wurde eine Methode zur Text-Hypertext-Konversion entwickelt und erprobt (vgl. Storrer 1997), die den Ausgangstext hypertextgerecht umstrukturiert, reorganisiert und um Beispiele, multimediale Zusätze und Zusatzkomponenten anreichert. In GRAM- MIS-1 sind solche Zusatzkomponenten: eine zu der Wortarteneinteilung der GDS passende Datenbank der deutschen Funktionswörter, ein Glossar grammatischer Termini, - Übungen und Spiele zur Überprüfung des neu erworbenen Wissens. GRAMMIS-l wurde im Frühjahr 1996 zur Testnutzung an Lehrende an der gymnasialen Oberstufe, an Hochschulen und im Bereich Deutsch als Fremdsprache weitergegeben. In der zweiten Projektphase ging es inhaltlich um die Bereiche „Verbvalenz“ und „funktionale Grammatik“. Konzeptionell standen der Ausbau und die Verbesserung der Navigationsmittel und Interaktionsangebote im Vorder- 9 Die Numerierung der Prototypen orientiert sich zwar an der chronologischen Abfolge bei der Systementwicklung; es handelt sich jedoch nicht um drei getrennte Systeme. Vielmehr wurde der in der ersten Phase entwickelte und zur Testnutzung freigegebene Prototyp in Teamarbeit kontinuierlich erweitert, umgestaltet und verbessert, grammis-i, grammis-2 und grammis-3 sind also Bezeichnungen für die verschiedenen Phasen in der Entwicklung des Pilotsystems. <?page no="35"?> Hypermedia und Grammatikographie 35 grund. Durch die wichtigste technische Neuerung in dieser Phase, die Realisierung von Schnittstellen zwischen dem Autorensystem Toolbook und dem relationalen Datenbanksystem Paradox, konnte im zweiten Prototyp (GRAMMIS- 2) die Verbindung von Grammatik und Lexikon wesentlich flexibler ausgestaltet werden (vgl. Schneider in diesem Band). In der dritten Projektphase wurden die bisher entwickelten Komponenten in das Pilotsystem GRAMMIS-3 integriert und durch Hyperlinks miteinander vernetzt. Zusätzlich wurden Schritte hin zu einem „offenen“ grammatischen Informationssystems unternommen, und zwar in zweierlei Hinsicht: - Mit der Integration des elektronischen Konnektorenhandbuchs (vgl. Breindl in diesem Band) und des amtlichen Regelwerks zur neuen Rechtschreibung wurde das System für Komponenten geöffnet, die nicht oder nur zum Teil auf den theoretischen Grundlagen der GDS basieren. - Zusätzlich zur Hypertextualisierung des Regelwerks zur Rechtschreibung in Toolbook wurde eine HTML-Version 10 desselben erstellt und in die Internet-Präsentation des Instituts für deutsche Sprache integriert. Dadurch wurden erste Erfahrungen mit einer Publikation in einem offenen Hypertextsystem, dem World Wide Web, gesammelt. Im folgenden Abschnitt werde ich am Beispiel der Prototypen GRAMMIS-1 und GRAMMIS-2 zeigen, wie die in Abschnitt 2 skizzierten Probleme durch Hypermedia gelöst oder doch zumindest entschärft werden können. 4. Lösungsansätze durch Hypermedia Es sind im wesentlichen drei Eigenschaften, in denen sich Hypermedia-Anwendungen von herkömmlichen Medien (z.B. Buch, Tonkassette, Video) und anderen Softwaresystemen (z.B. Datenbanken oder rein textbasierten Informationssystemen) unterscheiden: - Nichtlinearität (Hypertext) - MultimodalitätZ-kodierung (Multimedia) - Interaktivität. 10 html steht für Hypertext Markup Language und bezeichnet eine Untermenge der generellen Dokumentenauszeichnungssprache SGML (Standardized Generalized Markup Language), html enthält ein Sprachelement für Hyperlinks und liegt den im www angebotenen Dokumenten zugrunde. Die html-Version des Regelwerks ist abrufbar unter: http: / / www.ids-mannheim.de/ GRAMMis/ reform/ inhalt.html. <?page no="36"?> 36 Angelika Starrer Im folgenden werde ich jeweils kurz die Grundidee dieser Eigenschaften skizzieren und dann an Beispielen erläutern, wie diese sinnvoll für die Grammatikographie eingesetzt werden können, und welche Mehrwerte sich dadurch gegenüber dem gedruckten Pendant erzeugen lassen. 4 1 Nichtlinearität Nicht-Linearität ist eines der grundlegenden Merkmale der Hypertext-Idee, wobei sich zwei Aspekte von Nichtlinearität unterscheiden lassen: - Der strukturelle Aspekt von Nicht-Linearität bezieht sich darauf, daß Hypertexte eine Netzwerk-Struktur aufweisen, deren Knoten (Hypertext-Einheiten) textuelle, graphische oder andere Arten von Objekten beinhalten, die über (meist) gerichtete Kanten, Hyperlinks genannt, miteinander verbunden sind. Dies unterscheidet Hypertexte einerseits von zeitlich-linearen Audio- und Videodokumenten, andererseits von gedruckten Dokumenten mit hierarchischer Struktur, die durch Teil-Ganzes- und Vorgänger-Nachfolge-Beziehungen zwischen den Dokumententeilen bestimmt ist. - Der operationale Aspekt von Nicht-Linearität bezieht sich auf die Art der Informationsaufnahme und -Verarbeitung in Hypertexten: Im Gegensatz zu dem im Information Retrieval dominierenden Pattern-Matching-Paradigma, bei dem eine Datenbasis nach einem Suchmuster (Pattem) durchsucht wird und alle Treffer angezeigt werden, dominiert bei der Informationssuche in Hypertext-Netzwerken das explorative Paradigma, das als Hemmstöbern (engl, browsing) oder Navigieren bezeichnet wird. 11 Während lineare Medien eine bestimmte Abfolge bei der Informationsaufnahme nahelegen oder sogar erzwingen, können Hypertext-Anwender ihren individuellen, ihrem aktuellen Informationsbedarf und ihren Interessen entsprechenden Weg durch das nicht-lineare Informationsangebot wählen. Zwar weisen auch gedruckte Dokumente nicht-lineare Strukturen auf (z.B. Verweisstruktur, Zugriffstruktur (vgl. Storrer 1997)), und es können auch in Hypertexten lineare Strukturen (z.B. Pfade, guided tours s.u.) realisiert werden Dennoch bleibt, wie Kuhlen (1991) bei der Diskussion des Verhältnisses von Text und Hypertext herausstellt, „das Grundprinzip von Text Linearität und das von Hypertext Nicht-Linearität“ (Kuhlen 1991, S. 28). Zu Formen des Browsing vgl. McAleese (1989), Kuhlen (1991, S. 128ff.). 11 <?page no="37"?> Hypermedia und Grammatikographie 37 looiflook nilAMMIS.IMK _ fg|g| Datei Hilfe Grammatisches Informationssystem •. ■ . ■ .•.•.V.V.V.V.V.V.V.V.V.V.V.V.V.V/ GRAMM1S Anmeldung : Bitte gehen Sic Ihren Bcnntretnamen nn «der wählen Sie nee« Namen auz der aktuellen Qemilf«llste aus. : s#i tart KUcken Sie bitte auf Start! Abb. 1: Die Einstiegsseite zum GRAMMis-System Die Nicht-Linearität von Hypermedia-Anwendungen ist sowohl für Autoren als auch für Benutzer von Grammatiken mit erheblichen Vorteilen gegenüber der traditionellen Publikationsform Buch verbunden: - Die Autoren von Grammatiken müssen sich bei der Präsentation des hochgradig vernetzten Gegenstandsbereichs nicht mehr auf eine bestimmte Abfolge der Themen und eine präferierte Form des Zugriffs festlegen. Insofern wird das Vernetzungsproblem zumindest aus Autorensicht entschärft. Dies gilt insbesondere für die GDS, die „dem keineswegs „homogenen“ Stand der Theorieentwicklung und entsprechend der Gegenstandskonstitution durch eine mehrperspektivische Anlage der Grammatik“ (GDS, Einleitung) Rechnung tragen möchte. Die in der GDS angelegte Doppelperspektivik der Zugang über die kommunikative Funktion (von der Funktion zur Form) und der Zugang über den sprachlichen Formaufbau (von der Form zur Funktion) wurde in der GRAMMIS-Komponente „Grammatik aus fünktionaler Sicht“ 12 so umgesetzt, daß zwischen den beiden Perspektiven hin- und hergesprungen werden kann. Die mehrperspektivische Anlage der GDS kann somit in einem nicht-linearen Medium einfacher als im gedruckten Medium realisiert werden. 12 Vgl. Strecker (in diesem Band). <?page no="38"?> 38 Angelika Starrer - Die Benutzer von Grammatiken können mit einem einfachen Mausklick zwischen verwandten Themengebieten wechseln und selbst entscheiden, wie tief und detailliert sie sich mit einem bestimmten Themenkomplex auseinandersetzen wollen. Während der Zugriff auf die gedruckte Grammatik primär über das hierarchisch gegliederte Inhaltsverzeichnis erfolgt, das um sekundäre Zugriffsangebote wie Wort- und Sachregister ergänzt ist, erlaubt das nicht-lineare Medium mehrere gleichberechtigte Zugriffsarten auf das grammatische Wissen. In GRAMMIS wurden diese Vorteile in mehrfacher Hinsicht genutzt: Die graphische Benutzeroberfläche benutzt die Metapher eines Grammatikinstituts und ermöglicht verschiedene Arten des Zugriffs auf die Systemkomponenten, die den grundlegenden Situationen entsprechen, in denen Grammatiken benutzt werden. Abb. 1 zeigt die Einstiegsseite des Systems, bei dem nach einem Mausklick auf die Klingel neben dem abgebildeten Portal die Aufforderung zur namentlichen Anmeldung erscheint. Die eingegebenen Benutzemamen werden für die Verwaltung von persönlichen Annotationen, Lesezeichen und Ergebnissen in der Testkomponente verwendet. Nach der Anmeldung öffnet sich das Portal und der Benutzer gelangt in die in Abb. 2 gezeigte Eingangshalle, von der aus die zentralen Komponenten des Systems erreicht werden können: - Die grammatische Bibliothek, die Grammatikexpertin und das Grammatiklabor. Diese Komponenten sind für unterschiedliche Arten von Benutzungssituationen gedacht: Der Einstieg über die in der Bibliothek eingestellten grammatischen Bücher eignet sich besonders für Situationen, in denen, z.B. im Rahmen eines linguistischen Proseminars, ein Themenbereich als Ganzes durchgearbeitet werden soll. Die interne Struktur der Bücher orientiert sich an der hierarchischen Dokumentenstruktur der gedruckten Grammatik, legt aber keine bestimmte Leseabfolge bei den Teilthemen nahe. So kann im sog. Wortartenbuch von der in Abb. 3 gezeigten graphischen Übersicht über die Wortarteneinteilung der GDS zum Anfang beliebiger Unterkapitel gesprungen werden, in denen die Eigenschaften der Wortarten und ihrer Subklassen näher erläutert werden. <?page no="39"?> Hypermedia und Grammatikographie 39 Abb. 2: Die GRAMMis-Eingangshalle - Der Einstieg über die ebenfalls in der Bibliothek befindlichen lexikalischen Datenbanken ist zugeschnitten auf Benutzungssituationen, in denen gezielt nach den grammatischen Eigenschaften eines Wortes gesucht wird. Es ähnelt dem Einstieg über das Wortregister einer Grammatik, geht aber durch die Bereitstellung verschiedenster Suchmöglichkeiten und verschiedener Sortieroptionen weit darüber hinaus und kann deshalb im gedruckten Medium nicht mehr reproduziert werden (vgl. Schneider in diesem Band). - Der Einstieg über die Grammatikexpertin (vgl. Abb. 4) ist gedacht für Benutzungssituationen, in denen, z.B. im Rahmen einer vergleichenden Untersuchung, gezielt nach der Bedeutung eines grammatischen Terminus gesucht wird. Die Grammatikexpertin kann verschiedene Terminologien parallel verwalten: Der Benutzer kann sich entweder alle Termini anzeigen lassen, wobei die Zugehörigkeit zu einer bestimmten Terminologie farblich gekennzeichnet ist, oder eine bestimmte Terminologie z.B. die GDS- Terminologie auswählen. Die mit Pfeil gekennzeichneten Termini sind mit Hyperlinks verbunden, die zu den Stellen in der Grammatik fuhren, in denen der entsprechende Terminus ausführlich erläutert wird. Bei der Formulierung der Definitionen wurde darauf geachtet, daß GDS-spezifische Termini, z.B. der Terminus „Junktor“, mit den in anderen Grammatiken verwendeten Termini in Verbindung gesetzt werden. <?page no="40"?> 40 Angelika Starrer - Das Grammatiklabor bietet die Möglichkeit, vorhandene Grammatikkenntnisse zu überprüfen und neu erworbenes Wissen einzuüben. In der Spiele-Ecke wird ein einfaches drill&practice-Computerspiel angeboten, mit dem auf den Schwierigkeitsstufen Einsteiger, Fortgeschrittene und Profis die Bestimmung von Wortarten in Sätzen eingeübt werden kann. Im Übungsteil gibt es Übungsblätter, deren Auswertung teilweise von einem elektronischen Tutor betreut wird. Abb. 3: Graphische Übersicht über die Wortarteneinteilung Die einzelnen Komponenten sind wiederum auf verschiedene Weisen miteinander vernetzt, so daß unabhängig von der Art des Einstiegs verschiedene Wege durch den „grammatischen Informationsraum“ gewählt werden können: - Die Vernetzung von Lexikon und Grammatik ist im Artikel von Schneider (in diesem Band) ausführlich beschrieben. Eine Richtung geht dabei von der Beschreibung einer grammatischen Kategorie (z.B. der Kategorie der Gradpartikeln) zur Auflistung aller Kategorienmitglieder, die aus einer der Datenbankkomponenten (z.B. der Datenbank der Funktionswörter) generiert werden. Die andere Richtung geht von der Beschreibung eines Einzelwortes aus zur grammatischen Kategorie, der das Einzelwort angehört: So fuhrt beispielsweise der Sprungknopf „zur zugehörigen Wortart springen“ in Abb. 5 zu der Stelle im Wortartenbuch, in dem die Abtönungspartikeln näher beschrieben sind. Auf diese Weise kann der engen Verzah- <?page no="41"?> Hypermedia und Grammatikographie 41 nung von Lexikon und Grammatik, die für den in der GDS verfolgten kategorialgrammtischen Ansatz charakteristisch ist, optimal Rechnung getragen werden. Die Grammatikexperlin Datei Navigation tjÜte ___ bid >' liiSfljwwnslit <* VoU5»ni)ij|e! . üt»ss»r c KomieVtorfri-f IS QowcmnTtrmm ...... afiiiftn/ Junctors« s&id Aüstfrtkke mit oj>«r»8ver ajansitatipartkoj Funktion, die geeignet sind, Einheiten an ateraküve Eieheites -> Bezugsausdrücke anzusehiieäen, sie ihnen untere stenekiion +•»: oder nebtnzuordnen. : : i Es werden drei SiAklassen unterschieden; ; Konjunktoren Subjunktoren Adjunktoren und, ober oiwoW. weil .ommuaikative Mintmaieiftbeit iompa'oSv ibaiunkiiimaledv'esiii ämjimklm > : : ionjunktor Andere Benennungen: Konjunktionen, Konnektoren, Bindewörter; ; >.unff»klirrtwgn«rt ionnakihipartikel Abb. 4: Die Grammatikexpertin erläutert den Terminus „Junktor“ - Die von der Grammatikexpertin verwalteten Kurzerläuterungen fungieren als elektronisches Glossar, das in den grammatischen Büchern, den Datenbanken und dem Grammatiklabor genutzt wird. So wird in Abb. 5 in der Datenbank der Funktionswörter eine kurze Erläuterung für die Wortart der Abtönungspartikeln angezeigt. Sollten die Glossareinträge selbst wieder unbekannte Termini enthalten, kann zwischen den verschiedenen Definitionen hin- und hergesprungen werden. Auf diese Weise können terminologische Lücken bei Bedarf auf einfache Weise geschlossen werden, wodurch sich das in Abschnitt 2 angesprochene Terminologieproblem zumindest abmildern läßt. - Thematisch verwandte Hypertext-Einheiten innerhalb desselben Buches sind durch Hyperlinks miteinander verbunden, beispielsweise die Beschreibung der Subklassen der „Proterme“ (z.B. Indefinitum, wie in: Jrgendeiner liest das “) und den korrespondierenden Subklassen der „Determinative“ (z.B. quantifizierendes Determinativ: „Ich finde irgendeinen Leser“). <?page no="42"?> 42 Angelika Starrer - Schließlich gibt es Hyperlinks zwischen verschiedenen grammatischen Büchern, z.B. zwischen der Beschreibung der Gradpartikeln im Wortartenbuch und dem Kapitel „Diktumsgradierung“ im Buch „Grammatik aus funktionaler Sicht“, in dem das allgemein zu den Gradpartikeln Gesagte um eine detaillierte Funktionsbeschreibung ergänzt und vertieft wird. - Ab GRAMMIS-2 sind die grammatischen Bücher zudem mit einer Literaturdatenbank verbunden, in der die bibliographischen Angaben der GDS abgespeichert sind und bei Bedarf aufgerufen werden können. Datenbank der Funktionswörter Datei Optionen Navigation £|Ufe fbioß bl.? .: Wot; Definition Aufforderungsmodus Der Atifforcferuhjjsmpdus ist ein für sog. | : Abtönungspartikei . Prototypischerwelse wird ar durch die s: Verwencluhg des imperativs ausgedrtickt: i (1), Weitefe AusdrudrsmSgiichkeiten sind I i <öe Distenzfomi der Aufforderung (2) und Spezifische Eigenschaften : die Adhortativform (3). fÄufforderungsmodus (1); EfgSnzung«fregen C)l I : (3), Wunschmddüs (4) < (1) Cfb dem Afeihon das F/ äscficheflf I In älieTi Modfbetont oder unbetont ~ i | ? - : : (3) Gehen wir. f i (1) Vergiß bloß nicht, zu speichern! s (2) Was ist heute bloßTos mit unserem Hasso? > (3) Was unser Hassö heute bloß wieder hatl ! (4TWenn Hasso bloß nicht wieder krank wirdl Sikliuthet 1 HiHc 1 Heue Aefiaue i Emkosaliale ■ 9 fl v: Hufnonyme uueften j Ogeerclteften 4er | 03 älle ElflkSge dieser Wertert | werten «ktuto. Abb. 5: Eintrag für die Abtönungspartikel bloß in der Datenbank der Funktionswörter. Während im ersten Prototyp GRAMMIS-1 mit semantisch nicht explizierten referentiellen Hyperlinks gearbeitet wurde, verwenden die Komponenten zur Valenz und zur neuen Rechtschreibung typisierte Hyperlinks, die die Art der Verknüpfung auf der Basis eines Inventars von Verknüpfungstypen spezifizieren. 13 Der Vorteil der Verwendung typisierter Hyperlinks liegt für den Autor darin, daß mit demselben Aktionswort 14 mehrere Aktionen verbunden werden können. Abb. 6 zeigt eine Hypertext-Einheit aus dem Valenzbuch, in der ein Mausklick auf das Aktionswort „Verbativkomplement“ eine Auswahlliste von 13 Zur Unterscheidung von referentiellen und typisierten Hyperlinks siehe Kuhlen (1991, S. 105ff ); zur technischen Realisierung in grammis-2 siehe Schneider (1997). 14 Aktionswörter sind autorendefinierte Textobjekte, die über ein Skript mit bestimmten Aktionen, z.B. der Verfolgung eines Hyperlinks, verbunden sind. <?page no="43"?> Hypermedia und Grammatikographie 43 Hyperlinks anbietet: eine Datenbankabfrage in der Valenzdatenbank, eine selbst eingefugte Anmerkung (vgl. Annotationen in 3.3), eine Definition aus der Grammatikexpertin sowie ein Beispiel. Der Benutzer kann nun eine der Optionen wählen oder aber beim Lesen des Textes fortfahren. Der Vorteil der Typisierung von Hyperlinks für den Benutzer besteht darin, daß die mit Hyperlinks verbundenen Sprungziele transparent gemacht werden und er insgesamt einen besseren Überblick über die Struktur der Hypertextbasis erhält. Um diesen Überblick zu sichern und die vielbeschworene Gefahr des Orientierungsverlusts im Informationsraum zu vermeiden, sind die GRAMMIS-Komponenten mit weiteren Navigationshilfen versehen 13 Hl Ausgang Hü Bibliothek HÜ Eirtertung fÜÜ KomplementJstesstökation Die Ksmptementkiassen §H Termkomplemente fH Ädvefbialkomplemente HH Er^foatKfcomplement ÜÜ Ast-Komplement Die beiden Grabklassen ' errr-kcmplernen-e und A ; iverl-; : 3l}'X<V! plemert: e werden mit Hilfe der Leitformen in je mehrere disjunkte Komplsmeritkiasseri gegliedert. Hinzu kommt die Klasse der Pf ädikativtemsrfetrtemg sowie die besondere Klasse der Aci-Komplemente und die periphere Klasse der Verbativkomoierr.eo^. 1 wmm iiaadie als Aus praktischen Gründen wei Komplementklassen mit Beze Merkhilfen genutzt werden kön erschöpfende Definitionen mißverstanden werden dürfen. So weist die Bezeichnung Akkusctivkofspiernerä zwar darauf hin. daß es sich um ein Komplement handelt, das prototypisch als NP oder PROF im Akkusativ erscheint, andere Ausdrucksformen wie Subjunktorsätze oder Infinitivkonstruktionen sind aber ebenfalls zulässig. w ■ p-^-r-rr • ■ v.v. --V y? —” Abb. 6: Hypertexteinheit mit etikettiertem Aktionswort aus dem „Valenzbuch“ - Der im Wortartenbuch verwendete Browser erlaubt es, von jeder Seite aus auf den Anfang eines beliebigen Unterkapitels zu springen. - Die umfangreichere Komponente zur Verbvalenz enthält zudem eine partielle Übersichtsgraphik, die die aktuell besuchte Hypertext-Einheit durch einen Wegweiser kennzeichnet. Nach dem Prinzip der Fischaugensicht (engl.: fisheye view) werden die mit der aktuellen Einheit verbundenen Knoten detailliert anzeigt, während von den übrigen Knoten nur noch die zentralen Verknüpfungspunkte aufgeflihrt sind. - Der Benutzer hat außerdem die Möglichkeit, Hypertexteinheiten mit etikettierten Lesezeichen zu versehen, die beim Verlassen des Systems unter <?page no="44"?> 44 Angelika Stoner dem beim Systemaufruf eingegebenen Benutzernamen gespeichert werden. Über die Liste der Lesezeichen können diesen Einheiten wieder aufgefunden werden. - Die sog. Chronik (engl, history-list) bietet die Möglichkeit, alle in der Sitzung bereits besuchten Knoten direkt wieder anzuspringen. - Mit der ebenfalls von überall her verfügbaren Rücksprung-Funktion (engl.: backtracking) kann der im Hypertext verfolgte Weg „Sprung für Spnmg“ zurückverfolgt werden. - Die Volltextsuche bietet die Möglichkeit, die Hypertextbasis oder Teile davon nach textuellen Suchmustern zu durchsuchen. Neben diesen Werkzeugen zur freien Navigation führen zusätzlich verzweigende und sequentielle Pfade durch die grammatischen Bücher, die sich an der hierarchischen Kapitelstruktur des gedruckten Buches orientieren. Auf diese Weise wurde versucht, gerade ungeübten Hypertext-Nutzern einen Einstieg auf vorgebahnten linearen Pfaden zu ermöglichen, die sie bei weiterer Vertrautheit mit dem System wieder verlassen können. 4.2 Multimedialität Mit „Multimedia“ wird die integrierte Verwendung statischer Medien wie Text, Graphik, und dynamischer Medien wie Animation, gesprochene Sprache, Musik und Video in einer Softwareanwendung bezeichnet. 15 Für die Grammatikographie hat Multimedia folgende Vorteile gegenüber dem textdominierten Grammatikbuch: - Die Möglichkeit, grammatisches Wissen über verschiedene Sinneskanäle z.B. geschriebener und gesprochener Text zu vermitteln (Multimodalität). - Die Möglicheit, verschiedene Symbolsysteme z.B. Sprache und Bilder zur Vermittlung grammatischen Wissens einzusetzen (Multikodierung). - Die Möglichkeit abstrakte Sachverhalte und grammatische Strukturen zu visualisieren. - Die Möglichkeit, grammatische Prozesse durch Bewegtbilder bzw. Animation dynamisch darzustellen. 15 Einen aktuellen Überblick über die verschiedenen Definitionen für Multimedia gibt Schulmeister (1996, S. 15-20); Weidenmann (1995, S. 65ff.) differenziert Multimedia weiter in den Dimensionen Medium, Kodierung und Sinnesmodalität. <?page no="45"?> Hypermedia und Grammatikographie 45 Diese Vorteile so einzusetzen, daß dadurch der Erwerb von und das Verständnis für grammatische Strukturen erleichtert werden, ist eine Herausforderung an künftige Autoren von Hypermedia-Grammatiken. Die bisherige GRAMMIS-Entwicklung orientiert sich noch stark an der textbasierten Vorlage der GDS, die nur punktuell um multimediale Zusätze erweitert wurde: ToolBook - WORTART.TBK Datei Optionen Navigation Hilfe Intensitätspartikeln (2) Syntaktische Eigenschaften: Intensitätspartikeln können nicht allein das Vorfeld besetzen (vgl. Experiment Umstellprobe). Sie stehen stets vor ihrem Bezugsabtniruek. Anders als Gradpartikeln kö'”? keine Nominaiphrase o Bezugsausdruck haben. . I rdk* j** e+älr.*In. fSiblmthfilc Hilfe 15 ..Mil Experiment Umsteltprobe: liefet! # fahrt Hsns. schnell. attsjühreo } Dt» Um&teHptoba funktioräMt recht» i Intensitätspartikeln können Antwort auf Fragen funglerti Intensitätspartikeln haben Entsprechung. In Beispiel 1b fungiert einigermaßen nicht als Intensitätspartikel, sondern als Adverb. Intensitätspartikeln können einen (>ew1chtungs»k? enf erhalten (vgl. Hörbeispiel 2). 11a: hit er schreip’ ' ; ■ ianz. Beispiel 1b: F: Fährt er scfiheiP A Snigerrnaßcn Hörbeisplel 2: Hr,nr, wirkto ungemein oihett Uste der Inlcnsitatspartikclo: 1 *&srpck Abb. 7: Hypertexteinheit mit Tonbeispiel aus dem „Wortartenbuch“ - Audiodateien mit gesprochenen Beispielsätzen sind an den Stellen ins System eingebunden, an denen Betonung und Intonation für ein grammatisches Phänomen relevant sind. Dies wird bislang vornehmlich bei der Beschreibung der Partikeln genutzt: In Abb. 7 ist eine Hypertext-Einheit zum Thema „Intensitätspartikeln“ abgebildet, bei der die auf der linken Seite textuell erläuterten Betonungseigenschaften auf der rechten Seite mit einem sog. Hörbeispiel belegt werden. Die Akzentuierung, die in der geschriebenen Form des Beispielsatzes durch Unterstreichung gekennzeichnet ist, kann durch gesprochene Sprache wesentlich einfacher dargestellt werden. - „Animierte“ Textobjekte werden eingesetzt, um grammatische Umstrukturierungsprozesse zu verdeutlichen und grammatisch weniger geschulten Nutzern einen Einblick in die Methoden grammatischer Analyse zu geben. In der in Abb. 7 gezeigten Hypertext-Einheit wird die Stellungseigenschaft der Intensitätspartikeln, die links textuell beschrieben ist, durch das Experiment auf der rechten Seite belegt: Die Intensitätspartikel ziemlich tauscht bei dieser Verschiebeprobe die Position mit dem Subjekt Hans. Der dabei <?page no="46"?> 46 Angelika Starrer entstehende Satz Ziemlich fährt Hans schnell ist grammatisch nicht akzeptabel, wodurch die im Text gemachte Aussage: „Intensitätspartikeln können nicht allein das Vorfeld besetzen“ bestätigt wird. Graphik und Ton spielen auch bei der Ausgestaltung der graphischen Benutzeroberfläche von GRAMMIS eine Rolle, z.B. bei der Visualisierung der Benutzermetapher und den zugehörigen Navigationsmöglichkeiten durch Bilder und Graphiken. Kleine Gags, wie das Klingelzeichen auf der Einstiegsseite oder das zwinkernde Auge beim Aktivieren des Überblick-Sprungknopfes sollen der Auflockerung dienen, wurden aber sparsam verwendet, da bei häufiger Nutzung die anfängliche Amüsiertheit schnell in Überdruß Umschlagen kann (vgl. Gloor 1990, S. 48). Multikodierung von Wissenseinheiten kann für die Darstellung anderer grammatischer Wissensgebiete entscheidende Vorteile bringen: Phonologisches und phonetisches Wissen läßt sich einfacher und anschaulicher darstellen. Die Inhalte der umfangreichen Kapitel zu topologischen Strukturen (Wortstellung) und grammatischen Diathesen (z.B. die verschiedenen Formen der Passivierung im Deutschen) könnten durch Graphik und Animation visualisiert werden. Für grammatische Beschreibungen gesprochener Sprache und zwischenmenschlicher sprachlicher Interaktion, sowie für die Darstellung komplexer Strukturzusammenhänge bietet Multimedia unbestreitbare Vorteile, ja fuhrt eventuell dazu, daß Wissen in diesem Bereich überhaupt für größere Gruppen von Interessenten in verständlicher Weise dargestellt werden kann. 4.3 Interaktivität Der aus den Sozialwissenschaften stammende Begriff „Interaktion“ wurde in den 80er Jahren auch auf die Beziehung zwischen Mensch und Computer übertragen. Als „interaktiv“ bezeichnet man in diesem Zusammenhang Software, die auf Eingaben eines Anwenders in vorprogrammierter Weise reagiert. Die Formen dieser „Interaktion“ reichen von einfachen Operationen wie dem Betätigen eines Sprungknopfes oder dem Treffen einer Auswahl aus einer Liste über die Adaption und Individualisierung der Anwendung durch das Hinzufügen von Anmerkungen oder das Anlegen eigener Hyperlinks bis hin zu sog. intelligentem tutoriellen Feedback. 16 Interaktivität bezeichnet, wie Schulmeister (1996, S. 40) herausstellt, „den wesentlichen Unterschied zwischen einem computerunterstützten Lernprogramm und einem Film“: Im Gegensatz zu ihren nicht-interaktiven Vorgängern ermöglichen sog. „interaktive Medien“ ihrem Rezipienten aktive Teilnahme und Engagement. Als Vorteile werden genannt: 16 Zu verschiedenen Formen von Interaktivität siehe Haak (1995), Schulmeister (1996, S. 39-46). <?page no="47"?> Hypermedia und Grammatikographie 47 - Selbststeuerung; Individualisierung, Adaptierbarkeit: Der Anwender kann das System seinen Interessen bei Lernsystemen seinem Lemtempo und -Stil sowie seinen Wissensvoraussetzungen anpassen. - Motivationssteigerung: durch die Möglichkeiten, Einfluß auf die Gestaltung des Systems zu nehmen, werden Motivation und Aufmerksamkeit bei der Informationsaufnahme erhöht. - Lernkontrolle: Interaktive Lemprogramme geben dem Benutzer Feedback über die Lernfortschritte. Dae Grammatiklabor Qatei Optionen Navigation Hille beterminati {Konjunktor {Partikel proposition proterm ^Substantiv Level: Einsteiger Abb. 8: Das „Wortartenspiel“ Sanktionsfreiheit: Da Fehler und Fehlschläge bei der individuellen, unbeobachteten Systemnutzung keine sozialen Bewertungen nach sich ziehen, erhöht sich Experimentierfreude und Lernbereitschaft vor allem bei jugendlichen, vom schulischen Lernen geprägten Nutzem (vgl. Schulmeister 1996, S. 45f). Die Interaktionsmöglichkeiten, die GRAMMIS auf der Ebene der Navigation anbietet, wurden bereits in 3.1 beschrieben. Darüber hinaus verfugt das System über Optionen zur Adaption und Individualisierung, für die der auf der Einstiegsseite abgefragte Benutzemame verwendet wird: <?page no="48"?> 48 Angelika Starrer - In allen GRAMMIS-Büchem können zu beliebigen Textteilen Anmerkungen (Annotationen) eingegeben werden. Die entsprechenden Textteile werden als Aktionswörter markiert, durch deren Aktivierung die Anmerkungen wieder abgerufen werden können; z.B. führte die Auswahl des Etiketts „Annotation“ in Abb. 6 zur Anzeige einer vom Benutzer eingegebenen Anmerkung zum Textteil „Verbativkomplement“ - In alle Bücher und Datenbanken können die Benutzer Lesezeichen einlegen, die mit selbstdefinierten Namen gekennzeichnet sind und die auch beim Verlassen des Systems gespeichert werden. - Im GRAMMIS-Buch zur Valenz können Benutzer selbst Hyperlinks zwischen Hypertext-Einheiten anlegen und ähnlich wie bei den Annotationen über die Aktivierung des entsprechenden Aktionsworts wieder abrufen. Bei der Konzeption der grammatischen Bücher und Datenbanken stand die Flexibilisierung des Abrufs von grammatischem Wissen im Vordergrund. Aktive Beteiligung des Nutzers und Feedback zu seinem grammatischen Wissen ermöglichen die Spiele und Übungen im Grammatiklabor: - Beim Wortartenspiel müssen Wörter, die an graphische Objekte gebunden sind, den Wortarten der GDS zugeordnet werden. Während auf der Niveaustufe Einsteiger nur die Grobeinteilung der Wortarten beherrscht werden muß, wird bei den Niveaustufen Fortgeschrittene und Profis auch nach der Subklasse (z.B. der Partikeln oder der Determinative) gefragt. Das System reagiert auf falsche Eingaben, z.B. mit dem Absturz von Wortartenballons (vgl. Abb. 8), korrigiert sie und vergibt Punktzahlen, auf deren Basis nach Beendigung des Spiels eine Gesamtauswertung erstellt wird, aus der die Schwächen und Stärken des Nutzers ersichtlich sind. - Bei den Übungsblättern sind die zu klassifizierenden Wörter oder Wortkombinationen als Aktionswörter markiert und in einen größeren, sprachlichen Kontext eingebunden: Das Vorhandenseins eines größeren Kontexts ist von Vorteil, z.B. für die Wortartenbestimmung, speziell die Bestimmung mancher Partikelsubklassen. Weitere Übungsblätter auch für andere Klassifikationssysteme, etwa zu Phrasen-, Komplement- und Supplementklassen können auf relativ einfache Weise erstellt werden. 17 - Zu spezifischen Klassifikationsproblemen, z.B. der Unterscheidung der Adverbien, Partikeln und Junktoren, wird ein Spezialtraining angeboten, das teilweise von einem sog. Tutor unterstützt wird: Während sich die bei den Spielen und Übungen gegebene Rückmeldung auf die Korrektur falscher 17 Allerding bislang nur auf der Autorenebene, eine wirklich interaktive Schnittstelle zur Erstellung neuer Übungen durch den Lehrer ist noch nicht realisiert. <?page no="49"?> Hypermedia und Grammatikographie 49 Eingaben beschränkt, liefert der Tutor bei einer falschen Eingabe eine auf den Satzkontext bezogene Wortartenbestimmung und Funktionsbeschreibung und gibt weitere Hinweise, durch welche Kennzeichen und Testverfahren die richtige Wortart hätte erkannt werden können (vgl. das in Abb. 9 gegebene Beispiel). Ein Benutzer kann sich von diesen Erläuterungen ausgehend entweder Kurzerläuterungen der Termini aus dem elektronischen Glossar (Grammatikexpertin vgl. oben) abrufen oder an die Stelle des Wortartenkapitels springen, wo die in Frage stehende Wortart detaillierter erläutert wird. Das Grammatiklabor : Datei Optionen Navigation (Hüte .1ÜÜ Bestimmung: Windows mag ja bequem sein, aber es bringt auch Probleme mit [sich. Beispielsweise bietet Windows oft mehr als drei verschiedene «ShodsRaaodisssfi .,... Warum Ist das tatsch? Nein, dies ist ein Konjunktor. Abgrenzungsmerkmale: aber leitet keinen Nebensatz ein (•> kein Subjunktor); aber steht vor dem zweiten Konjunkt ist aber nicht in dieses integriert (-> kein Adverb, keine Konnektivpartikd oder Abtönungspartikel). Funktion: Mit aber werden die beiden Sätze Windows ist bequem und Windows bringt auch Probleme mit sich miteinander kontrastiert. Dabei werden die mit der Aussage des Vordersatzes aufgebauten Erwartungen durch die Aussage des Hintersatzes eingeschränkt Abb. 9: Spezialtraining zur Wortartenbestimmung mit „Tutor“ Das Grammatiklabor ist in seiner momentanen Konzeption vornehmlich dazu gedacht, dem Benutzer eine Rückmeldung darüber zu geben, ob er das in den grammatischen Büchern vermittelte Wissen, z.B die Wortarteneinteilung der GDS, richtig verstanden hat. Es handelt sich um reine „drill&practice“-Übungen, nicht um eine grammatische Lernumgebung. Die ersten Erfahrungen aus der Testnutzung haben aber deutlich gezeigt, daß gerade das Grammatiklabor gerne zum Einstieg genutzt wird, und erst das Scheitern bei Spielen und Übungen die Anwender dazu motiviert, sich mit dem doch recht schwierigen grammatischen Wissensstoff intensiver auseinanderzusetzen. Auch die bislang in den grammatischen Büchern angebotenen Interaktionsmöglichkeiten wurden sehr positiv bewertet. In künftigen GRAMMIS-Komponenten sollten diese Möglichkeiten, Grammatik zu betreiben, statt nur darüber zu lesen, stärker berücksichtigt werden. <?page no="50"?> 50 Angelika Starrer 5. Erfahrungen und Ausblick Aus Autorenperspektive sind die Erfahrungen, die mit dem neuen Medium gemacht wurden, sehr positiv. Man kann sich rasch und gut daran gewöhnen, bei der Vermittlung grammatischen Wissens zwischen Text, Bild und Ton zu wählen, die Benutzer zu eigenen grammatischen Experimenten anzuregen und ihnen dabei Rückmeldung zu geben. Auch steht mehr Raum zur Verfügung als bei gedruckten Grammatiken, bei denen jede Druckseite die Kosten des Endprodukts erhöht. Deshalb können weitreichendere Erläuterungen und mehr Beispiele gegeben werden, um die in der Grammatik gemachten Aussagen an vorhandenes Wissen anzubinden und mithilfe von authentischem Sprachmaterial zu belegen. Der mehrperspektivischen Anlage der GDS, die ja auch in ihrer Buchform zwischen mehreren Sichten und Forschungsansätzen vermitteln möchte, kommt die nicht-lineare Organisationsform von Hypertext enorm entgegen. Es können mehrere Zugriffswege zum grammatischen Wissen angeboten und die einzelnen Hypertexteinheiten so miteinander vernetzt werden, daß grammatische Einheiten und Prozesse unter mehreren Perspektiven betrachtet und in verschiedenen Benutzungssituationen und Problemlösungskontexten flexibel verwendet werden können. Allerdings müssen sich die Autoren von Hypermedia-Grammatiken Fertigkeiten und Kompetenzen in Bereichen aneignen, mit denen Autoren von Buchgrammatiken bislang nicht konfrontiert waren. Dazu gehören: - Grundlagen der sog. „Hypertextrhetorik“, d.h. Überlegungen dazu, wie Hypertexteinheiten geschrieben und die verschiedenen Textsegmente über Hyperlinks, Pfade etc. miteinander vernetzt werden. Insbesondere Fragen der Sequenzierung, der Textdeixis und der Themenentfaltung müssen im nicht-linearen Medium neu angedacht und anders gelöst werden. Obwohl hierzu schon vielfältige Überlegungen angestellt wurden, 18 ist die Entwicklung verständlicher, qualitativ hochwertiger Hypertexte bis heute immer noch mehr Kunst als Handwerk geblieben. Dennoch sollten Gestaltungsempfehlungen und Entwurfsmethoden zur Kenntnis genommen werden. Lohnenswert sind auch empirische Untersuchungen dazu, wie und mit welchem Erfolg Hypertexte rezipiert werden, 19 obwohl diese bislang widersprüchlich sind, 20 und der kompetente Umgang mit nicht-linearen Texten sowohl von den Autoren als auch von den Lesern erst erlernt werden muß. 18 Z.B. Horn (1989), Kuhlen (1991), Rada (1991), Bolter (1991), Nielsen (1995), Landow (1992). 19 Siehe die Beiträge in McKnight et al. (1994) und den aktuellen Überblick in Schulmeister (1996). 20 Vgl. die Zusammenstellung in Schulmeister (1996, Kap. 12). <?page no="51"?> Hypermedia und Grammatikographie 51 - Die Erstellung von Graphikdateien, Animationen und Audiodateien muß nicht nur von der technischen Seite her beherrscht werden. Wichtig ist es auch, (Bewegt-)Bild, Ton und Text in der richtigen Weise zu integrieren Dabei ist über die Rolle von Einzelmedien beim Wissenserwerb mehr bekannt als über die Art und Weise, wie sie in einer integrierten Softwareumgebung zusammenspielen. Sicher ist lediglich, daß schlecht koordinierte oder synchronisierte multimediale Informationsangebote die Informationsaufnahme verschlechtern anstatt sie zu verbessern (vgl. Weidenmann 1995). - Auch Grundwissen über Bildschirmdesign und Richtlinien für ergonomische und intuitiv verständliche Benutzerschnittstellen muß erworben werden. Die Autoren des Hypermedia-Systems, die die inhaltlichen Zusammenhänge am besten kennen, sollten die Gestaltung der Benutzerschnittstelle und die Anlage der Navigationsmittel nicht einem Designer oder einem Programmierer allein überlassen. - Die vom Buch her bekannte Trennung von Layout und Text verwischt sich in Hypermedia-Anwendungen. Zudem gelten für die Wahl von Schriftart, Schriftgröße und Schriftschnitt sowie die Farbgestaltung im elektronischen Medium andere Voraussetzungen als im gedruckten. Softwareergonomische Studien zur Lesbarkeit von Bildschirmschriften und dem Zusammenhang von Farbgestaltung und Ermüdung der Augen sollten herangezogen werden, um gute Informationsangebote auch lesbar zu gestalten. Nicht zuletzt muß die technische Seite gemeistert werden und zwar nicht nur einmal, sondern bedingt durch die Entwicklungsgeschwindigkeit im Hard- und Softwarebereich stets aufs neue. Gloor (1990) weist zurecht daraufhin, daß bei aller Begeisterung für die Ideen und Möglichkeiten von Hypermedia nicht vergessen werden darf, „daß auch die Entwicklung einer Hypermedia- Applikation den Grundregeln und Gesetzen der Software-Entwicklung zu gehorchen hat.“ (ebd., S. 50). Dies hat Auswirkungen auf die Zusammensetzung des Projektteams, die Arbeitsteilung und die Arbeitsabläufe, die bei der Entwicklung eines grammatischen Informationssystems anders aussehen als beim gemeinsamen Schreiben einer Buchgrammatik. Die Erfahrungen, die in der Pilotphase von GRAMMIS gemacht wurden, zeigten jedoch deutlich, daß zwar beim Aufbau eines grammatischen Informationssystems die grammatische Kompetenz immer noch die tragende Rolle spielt, daß aber ein Team zur Entwicklung einer Hypermedia-Grammatik daneben noch mindestens Programmier- und Systemverwaltungskompetenz benötigt. Außerdem erfordert die gemeinsame Entwicklung einer Hypermedia-Anwendung ein hohes Maß an Teamarbeit und gute Absprachen: Um sinnvolle Hyperlinks zwischen den Komponenten anlegen zu können, muß die Struktur des Systems und der inhaltliche Aufbau der Komponenten allen Beteiligten gut vertraut sein. Ein positiver Nebeneffekt zeichnet sich im terminologischen Bereich ab: Die Tat- <?page no="52"?> 52 Angelika Starrer Sache, daß die Definitionen für Termini potentiell von jeder Hypertexteinheit aus abgerufen und parallel dazu angezeigt werden können, gibt den Definitionen ein anderes Gewicht und erzwingt die konsistente Verwendung der Termini über den gesamten Hypertext hinweg. Die Liste der neu zu erwerbenden Kompetenzen mag zunächst abschrecken, denn schließlich fehlt die Zeit, die für den Erwerb der neuen Schreibqualifikation benötigt wird, für die eigentliche grammatische Forschung. Allerdings deutet vieles darauf hin, daß nicht-lineare Schreib- und Lesekompetenz in Wissenschaft und Forschung an Bedeutung gewinnt, so daß die Zeit, die in den Erwerb solcher Kompetenz investiert wird, langfristig gut angelegt ist. Und wenn die neuen Darstellungsmittel wie die Reaktionen auf die bisherige Projektentwicklung nahelegen dazu führen, daß sich mehr Menschen für das oft als trocken und langweilig beurteilte Wissensgebiet Grammatik interessieren, hat sich der Aufwand aus der Sicht der Grammatikschreiber allemal gelohnt. Einen ersten Aufschluß darüber, wie das neue Medium aus Rezipientensicht beurteilt wird, erhoffen wir uns aus der Fragebogenaktion, über die die Testnutzer von GRAMMIS-1 zur Rückmeldung aufgefordert wurden. Zum Zeitpunkt der Abfertigung dieses Artikels war der Rücklauf noch nicht abgeschlossen; trotzdem sollen abschließend die wichtigsten Eindrücke wiedergegeben werden: Die bisherigen Rückmeldungen dokumentieren das Vorhandensein der Probleme, die in Abschnitt 2 im Zusammenhang mit der Adressatenvielfalt gestellt wurden. Die Unterschiede in den Wissensvoraussetzungen sind sowohl was das grammatische Vorwissen als auch was die Vorerfahrung im Umgang mit Hypermediasystemen anbelangt so groß, daß es für die weitere Systementwicklung angebracht erscheint, den Adressatenkreis und auch die Nutzungsmöglichkeit stärker einzuschränken. Ob Auffindungs- und Verstehensprobleme im Vergleich zur Buchgrammatik tatsächlich abgemildert werden können, kann im Grunde nur eine Vergleichsstudie zeigen, die durchgeführt werden sollte, sobald das gedruckte Buch vorliegt. Die durchweg positive Beurteilung des elektronischen Glossars (wenngleich nicht unbedingt der Verständlichkeit seiner Einträge) und der verschiedenen Navigationsangebote zeigen jedoch, daß die nicht-lineare Darstellungsform genutzt wird und geben Hoffnung, daß zumindest das Terminologie- und das Vernetzungsproblem im neuen Medium abgemildert werden können. Es wird insgesamt deutlich, daß es gerade die im Buch nicht nachbildbaren Eigenschaften sind, die an der Hypermedia-Grammatik am meisten geschätzt werden: Mehr Multimedia, mehr Interaktionsmöglichkeiten anzubieten und die bislang geschlossene Anwendung zu einem offenen grammatischen Informati- <?page no="53"?> Hypermedia und Grammatikographie 53 onssystem auszubauen, dies scheinen die Perspektiven fur ein künftiges grammatisches Informationssystem zu sein. Mehr Multimedia bedeutet beispielsweise den verstärkten Einsatz gesprochener Sprache vom gesprochenen Beispielsatz bis hin zum gesprochenen und evtl, auch gefilmten Beispieldialog - und die Verwendung von Animationen zur Darstellung und Erläuterung grammatischer Operationen. Auch die bislang vorhandenen Möglichkeiten, selbst aktiv zu werden, sollten ausgebaut werden. Schritte in diese Richtung sind ein in GRAMMIS-2 entwickeltes interaktives Valenztestverfahren (vgl. Schneider 1997) und ein im elektronischen Konnektorenhandbuch (vgl. Breindl in diesem Band) angebotenes Verschiebeprobenspiel. Diese Art von Interaktionsangeboten hat vornehmlich die Funktion, das Verständnis des dargestellten Wissens durch praktische Anwendung zu vertiefen. Daneben sollten auch Interaktionsangebote vorgesehen werden, die dem Benutzer eigene Recherchen zu einem grammatischen Thema ermöglichen: Dazu gehören Recherchemöglichkeiten in lexikalischen Datenbanken und entsprechend aufbereiteten Textkorpora. Im Gegensatz zu einem grammatischen Lernsystem geht es bei einem grammatischen Informationssystem nicht nur um effektive Wissensvermittlung, sondern um ein möglichst reichhaltiges Informationsangebot, aus dem sich Benutzer die für sie interessanten Informationen heraussuchen und sich ihr eigenes Urteil bilden können. Um das Informationsangebot zu erweitern, sollte auch der in GRAMMIS-3 bereits eingeschlagene Weg hin zu einem offenen grammatischen Informationssystem weiterverfolgt werden. Dies zeigt sich nicht nur an der positiven Resonanz auf die HTML-Version des Regelwerks zur neuen Rechtschreibung, sondern es werden diesbezüglich auch immer wieder Nachfragen gestellt. Offenes Informationssystem bedeutet in diesem Zusammenhang dreierlei: - In das Informationssystem sollten heterogene grammatische Hypertexte integriert werden, die auf unterschiedlichen theoretischen Voraussetzungen beruhen. - Vom grammatischen Informationssystem aus sollten Hyperlinks zu anderen Ressourcen, die über das Internet verfügbar sind, geknüpft werden, beispielsweise zu linguistischen On-line-Zeitschriften, zu Terminologie- und Literatursammlungen und sofern vorhanden und qualitativ akzeptabel zu anderen Grammatiken. - Das grammatische Informationssystem selbst sollte über das Internet zugänglich sein. Damit kann einerseits ein wachsender Kreis an grammatisch Interessierten erreicht werden, andererseits fordert die für das Internet typische Verbindung von Informations- und Kommunikationsdiensten den Dialog zwischen Autoren und Benutzern. <?page no="54"?> 54 Angelika Starrer Und dieser Dialog sollte verstärkt gesucht werden. Man muß noch weiter erforschen, mit welchen Fragen und zu welchen Zwecken grammatisches Wissen benötigt wird und mit welchem Erfolg es aus dem Buch und aus der Hypermedia-Anwendung entnommen wird. Auf dieser Basis können Schnittstellen zwischen gedrucktem und elektronischem Medium angelegt werden, indem beispielsweise in der Hypermedia-Anwendung auf das Buch verwiesen wird oder indem zusammenhängende Passagen zum Ausdrucken angeboten werden. Längere, argumentative und diskursive Textpassagen können in gedruckter und linearisierter Form besser rezipiert werden; hierfür spricht die Beobachtung, daß viele elektronisch publizierte Dokumente nicht am Bildschirm gelesen sondern ausgedruckt werden. Gestützt auf solche Benutzungsforschung kann ein Zusammenspiel von grammatischem Buch und Hypermedia-Grammatik entworfen werden, das nicht von Substitution, sondern von Komplementierung geprägt ist und die Stärken der beiden Medien für die Vermittlung grammatischen Wissens optimal ausnutzt. 6. Literatur Bolter, Jay David (1991): Writing Space. The Computer, Hypertext, and the History of Writing. University of Northern California. Hillsdale, New Jersey. Breindl, Eva (in diesem Band): Konversion und Konzeption: Zur simultanen Produktion von Printtext und Hypertext am Beispiel Grammatik. Chembim, Dieter (1980): Grammatikographie. In: Althaus, Hans P./ Henne, Helmut/ Wiegand Herbert E. (Hg ): Lexikon der Germanistischen Linguistik. Tübingen. S. 768-778. Engel, Ulrich (1988): Deutsche Grammatik. Heidelberg. Freibichler, Hans (1995): Werkzeuge zur Entwicklung von Multimedia. In: Issing, Ludwig J./ Klimsa, Paul (Hg.): Information und Lernen mit Multimedia. Weinheim. S. 221-240. Gloor, Peter A. (1990): Hypermedia-Anwendungsentwicklung. Eine Einführung mit HyperCard-Beispielen. Stuttgart. Haak, Johannes (1995): Interaktivität als Kennzeichen von Multimedia und Hypermedia. In: Issing, Ludwig/ Klimsa, Paul (Hg.): Information und Lernen mit Multimedia. Weinheim. S. 151-163. Heidolph, Karl Erich/ Fläming, Wolfgang/ Motsch, Wolfgang et al. (1980): Grundzüge einer deutschen Grammatik. Berlin. Helbig, Gerhard (1992): Grammatiken und ihre Benutzer. In: Agel, Vilmos/ Hessky, Regina (Hg ): Offene Fragen offene Antworten in der Sprachgermanistik. (= Reihe germanistische Linguistik 128). Tübingen. S. 135-150. Helbig, Gerhard/ Buscha, Joachim (1986): Deutsche Grammatik. Ein Handbuch für den Ausländenmterricht. Leipzig. <?page no="55"?> Hypermedia und Grammatikographie 55 Hofimann, Ludger (1989): Textoptimierung am Beispiel „Grammatik“: ein Blick aus der Werkstatt. In: Antos, Gerd/ Augst, Gerhard (Hg ): Textoptimierung. (= Theorie und Vermittlung der Sprache 11). Frankfurt a.M. S. 52-70. Horn, Robert E. (1989): Mapping hypertext. The analysis, organization and display of knowledge for the text generation of on-line-text and graphics. Waltham, MA. Kuhlen, Rainer (1991): Hypertext: ein nichtlineares Medium zwischen Buch und Wissensbank. Heidelberg. Landow, George P. (1992): Hypertext. The Convergence of Comtemporary Critical Theory and Technology. Baltimore/ London. McAleese, Ray (1989): Navigation and Browsing in Hypertext. In: Ders. (Hg ): Hypertext: Theory into practice. Norwood, New Jersey. S. 6-44. McKnight, Cliff/ Dillon, Andrew/ Richardson, John (Hg.) (1994): Hypertext. A Psychological Perspective. New York u.a. Nielsen, Jakob (1995): Multimedia and Hypertext. The Internet and Beyond. Boston u.a. Rada, Roy (1991). Hypertext: From Text to Expertext. London u.a. Schneider, Roman (1997): Datenbankintegration und Navigationsangebote in einem hypermedialen Informationssystem zur deutschen Verbvalenz. Magisterarbeit Univ. Trier. Schneider, Roman (in diesem Band): Zur Lexikon-Grammatik-Schnittstelle in einem hypermedialen Informationssystem. Schulmeister, Rolf (1996): Grundlagen hypermedialer Lernsysteme. Theorie - Didaktik - Design. Bonn/ Paris u.a. Sitta, Horst (1989): Anforderungen an Grammatiken unter pädagogischer und linguistischer Perspektive. In: Buscha, Joachim/ Schröder, Jochen (Hg ): Linguistische und didaktische Grammatik: Beiträge zu Deutsch als Fremdsprache. Leipzig. S. 29-39. Storrer, Angelika (1995): Die Grammatik mit der Maus. Konzeption eines multimedialen Informationssystems zur deutschen Grammatik. In: Hitzenberger, Ludwig (Hg.): Angewandte Computerlinguistik. Hildesheim/ Zürich/ New York. S. 291-303. Storrer, Angelika (1997): Vom Text zum Hypertext: Die Produktion von Hypertexten auf der Basis traditioneller wissenschaftlicher Texte. In: Knorr, Dagmar/ Jakobs, Eva-Maria (Hg ): Textproduktion in elektronischen Umgebungen. Frankfurt a.M. S. 121-139. Strecker, Bruno (in diesem Band): Hypertext: Chance oder Herausforderung für die Grammatikschreibung. Weidenmann, Bernd (1995): Multikodierung und Multimodalität im Lernprozeß. In: Issing, Ludwig/ Klimsa, Paul (Hg ): Information und Lernen mit Multimedia. Weinheim. S. 65- 84. Weinrich, Harald (1993): Textgrammatik der deutschen Sprache. Mannheim/ LeipzigAVien/ Zürich. Wiegand, Herbert Ernst (1989): Aspekte der Makrostruktur im allgemeinen einsprachigen Wörterbuch. In: Hausmann Franz Josef/ Reichmann, OskarAViegand, Herbert Ernst/ Zgusta, Ladislaw (Hg.): Wörterbücher. Ein internationales Handbuch zur Lexikographie. Erster Teilbd. Berlin/ New York. S. 371-409. Zifonun, Gisela/ Hoffmann, Ludger/ Strecker, Bruno (1997): Grammatik der deutschen Sprache. Berlin/ New York (i. Dr.). <?page no="57"?> Roman Schneider Zur Lexikon-Grammatik-Schnittstelle in einem hypermedialen Informationssystem 1. Hypermedia und Datenbanken: Aufgaben der Lexikon-Grammatik-Schnittsteile Dieser Beitrag beschreibt Konzeption und Umsetzung der Anbindung von lexikalischen Datenbanken an das grammatische Informationssystem gram- MIS, das seit Mitte 1993 am Institut für deutsche Sprache (IDS) entwickelt wird. Im Rahmen dieses Projekts wird erforscht, wie grammatisches Wissen mit moderner Computertechnik anschaulich dargestellt und verständlich vermittelt werden kann 1 . Eine besondere Herausforderung an Hypermediasysteme 2 ist die Nutzung der in externen Datenbanken gespeicherten Informationen. Die Verfügbarkeit solcher Datenbestände innerhalb eines Hypermediasystems erbringt in der Regel einen informationeilen Mehrwert. Dieser besteht nicht nur darin, daß sich die absolute Menge des abfragbaren Wissens erhöht. Vielmehr kann der informationelle Mehrwert durch Ausführung folgender drei Schritte erzeugt werden: Wissensrekonstruktion, Informationserarbeitung und Informationsaufbereitung. Der Vorgang der Wissensrekonstruktion läßt sich dadurch charakterisieren, daß Wissensobjekte in von Rechnern verarbeitbare Formen überführt werden. Die Datenbestände werden maschinenlesbar gemacht und derart abgespeichert, daß über ein benutzerfreundliches Datenbankfrontend eine gezielte Suche möglich ist. Die Informationserarbeitung umfaßt den methodischen Zugriff auf die entstandenen Ressourcen über verschiedene Arten von Schnittstellen. Mittels formaler Sprachen, komfortabler Selektionsmasken oder sogar natürlicher Sprache werden die gespeicherten Informationen abgefragt, wobei neue Mehrwerte insbesondere durch die hohe Selektionsleistung maschineller Informationssysteme entstehen. Schließlich müssen die abgefragten Informationen aufbereitet, also an die spezifischen Wünsche des Benutzers angepaßt werden. In diesem Zusammenhang wäre etwa eine graphische oder akustische Präsentation der Informationen in vielen Fällen wünschenswert (Kuhlen 1995, S. 80-90). 1 Zum GRAMMis-Projekt vgl. auch Storrer und Strecker (in diesem Band). 2 Im folgenden verwende ich den Terminus „Hypermedia“ parallel zur traditionellen Bezeichnung „Hypertext“. Mit beiden Begriffen soll die nicht-lineare Darstellung (multimedial realisierter) Einheiten beschrieben werden; vgl. Kuhlen (1991, S. 12-14). Den Terminus „Hypertext“ benutze ich eher im Zusammenhang mit der Diskussion um Probleme bei der entlinearisierten Wissensdarstellung, den Terminus „Hypermedia“ zur Betonung der multimedialen Aspekte des beschriebenen Systems, vgl. Nielsen (1995, S. 5). <?page no="58"?> 58 Roman Schneider Inhaltliche Grundlage des grammatischen Informationsystems grammis ist die Grammatik der deutschen Sprache (Zifonun/ Hoffmann/ Strecker 1997). Der engen Verbindung zwischen Grammatik und Lexik, die in deren kategorialgrammatischem Ansatz angelegt ist, wird durch die Modellierung von Schnittstellen zwischen externen Datenbanken und Hypertextbasis Rechnung getragen. Solche Schnittstellen ermöglichen die Verknüpfung textueller Einheiten mit lexikalischen Daten, also beispielsweise von den Stellen im Hypertext aus, in denen verschiedene Typen von Verbkomplementen behandelt werden, mit Verben in der Valenzdatenbank, die über ein Komplement dieses Typs verfugen. Der Vorteil und die besondere Attraktivität dieser Schnittstellen für die verschiedenen Benutzergruppen liegen einerseits in der Erweiterung der verfügbaren Informationen um spezielles Wissen (grammatische Eigenschaften, Beispielsätze u.a ). Andererseits besteht mit ihrer Hilfe die Möglichkeit zur Überprüfung etwa der Vollständigkeit oder der Widerspruchsffeiheit von im Hypertext formulierten grammatischen Regeln und Klassifizierungen. Die Modellierung der an das Informationssystem grammis angeschlossenen Datenbanken der deutschen Funktionswörter und der Verbvalenz erfolgte auf der Basis des Entity-Relationship (ER)-Ansatzes, der die Abbildung des in der Datenbank zu modellierenden Wirklichkeitsausschnitts auf ein Datenbankmanagementsystem unterstützt. Dieser Ansatz beruht auf der Unterscheidung zwischen Objekten (Entities) und Beziehungen (Relationships) zwischen Objekten (Chen/ Knöll 1991). Entitäten können in verschiedene Entitätstypen klassifiziert werden (z.B. Funktionswort, Verb-Monosem, Passivtyp) und werden in einem Entity-Relationship-Diagramm durch rechteckige Kästen dargestellt. Sie haben Eigenschaften (Attribute), deren Werte (z.B. Passivlabel wie sem-Passiv, werafe/ ? -Passiv, bekommen-? zssw) in einem Kreis notiert werden. Beziehungen zwischen Entitäten (z.B. Passivierbarkeit eines Verb- Monosems durch einen oder mehrere Passivtypen) werden durch eine Raute dargestellt, die durch Linien mit den entsprechenden Entitätstypen verbunden ist. Es gibt 1: 1, Ln und n: m (viele-zu-viele)-Beziehungen. In einer ersten Phase wurden alle Objekttypen und Beziehungstypen, die für die zu entwerfenden Datenbanken eine Rolle spielen, identifiziert. Zur datenbankunabhängigen Darstellung in sogenannten konzeptuellen Schemata wurden ER-Diagramme verwendet. Aufbauend auf diesen Diagrammen erfolgte dann in der zweiten Phase die Übersetzung in Datenbankschemata für die benutzten Datenbanksysteme. Im Falle der Datenbank der Funktionswörter fand die praktische Umsetzung mit Hilfe des Autorensystems Toolbook statt, im Falle der Valenzdatenbank wurde das relationale Datenbankmanagementsystem Paradox verwendet. Im folgenden sollen zunächst die Inhalte sowie die Struktur der beiden genannten Datenbanken beschrieben und anschließend ihre Anbindung an das Hypertextsystem erläutert werden. <?page no="59"?> Zur Lexikon-Grammatik-Schnittstelle in einem hypermedialen Informationssystem 59 2. Informationen in den GRAMMIS-Datenbanken 2.1 Die Datenbank der Funktionswörter Zu den Funktionswörtern zählen die sprachlichen Elemente, die primär grammatische Bedeutung tragen und im Gegensatz zu den sogenannten Inhaltswörtem nicht Dinge oder Eigenschaften bezeichnen. Sie erfüllen vielmehr spezielle syntaktisch-strukturelle Funktionen. Zu den Funktionswörtern zählen in GRAMMis die folgenden Wortarten, die jeweils relativ abgeschlossene Inventare haben und mithin vollständig in der Datenbank der Funktionswörter erfaßt werden konnten: Partikeln, Junktoren, Responsive, Präpositionen, Adverbien und Adkopula. Das zugrundeliegende Datenmodell (vgl. Abb. 1) besteht aus dem einen Objekttyp Funktionswort. Dieser wird durch folgende Attribute charakterisiert: - Wortform (offener Wertebereich) zugehörige Wortart (geschlossener Wertebereich) spezifische Eigenschaften der Wortform, z.B. bezüglich Rektion oder Stellung im Satz (offener Wertebereich) - Verwendungsbeispiele bzw. verdeutlichende Beispielsätze (offener Wertebereich) Im Zuge der praktischen Umsetzung wurden die genannten Attribute mit Hilfe der von Toolbook angebotenen Datensatzfelder (RecordFields) abgespeichert, wobei die in den Datensatzfeldem spezifische Eigenschaften und Verwendungsbeispiele gespeicherten Inhalte nach wie vor komplex sind. Dies steht im Widerspruch zu Regeln, die etwa beim Entwurf relationaler Datenbanken dabei helfen, eine Optimierung des Datenmodells zu erreichen. Das relationale Modell ermöglicht den Prozeß der Normalisierung, der u.a. das Ziel hat, durch die Zerlegung komplexer Attribute in atomare Attribute eine unnötige Redundanz relevanter Informationen zu verhindern. Das Attribut spezifische Eigenschaften der Wortform ist nicht atomar, da hier mehrere Inhalte Vorkommen können (z.B. die semantische Subklasse, Hinweise zur Betonung und zur Funktion, vgl. Abb. 3). Für die geplanten Datenbankabfragen, die ausschließlich über die (atomaren) Attribute Wortform und Wortart ablaufen, wurde diese Verfahrensweise mit Nichtschlüsselattributen (vgl. Date 1986) allerdings als ausreichend betrachtet. Um Suchvorgänge in der Datenbank zu beschleunigen, wurden zwei alphabetische Indizes erstellt. Indiziert wurden die Datensatzfelder Wortform und Wortart. Der Zugriff auf die einzelnen Datensätze ist über diese Indizes möglich und gegenüber einer sequentiellen Suche ohne Index wesentlich schneller und effizienter. <?page no="60"?> 60 Roman Schneider Abb. 1: ER-Diagramm der Datenbank der Funktionswörter 2.2 Die Valenzdatenbank Im folgenden soll nun das Datenmodell der GRAMMis-Valenzdatenbank detailliert beschrieben werden, wobei zunächst die Gesamtstruktur und danach die einzelnen Relationen vorzustellen sind. Als Inhalte der Datenbank sollen zunächst die Beschreibungsergebnisse der am Institut für deutsche Sprache in Mannheim angesiedelten Valenzforschungsgruppe also die Einträge des Valenzwörterbuchs Verben in Feldern (Schumacher 1986) verwendet werden. Das ER-Diagramm der Valenzdatenbank ist in den Abbildungen 2a und 2b dargestellt. Es gibt die folgenden acht grundlegenden Entitätstypen: Verb- Homonym, Verb-Monosem, verbspezifische Rolle, Konstituententyp, semantisches Merkmal, Passivtyp, Beispielsatz, Verbfeld. Die Beziehung zwischen Verb-Homonym und Verb-Monosem ist eine l: n-Relation, eine Wortform hat also unter Umständen mehrere Bedeutungen. Umgekehrt ist jedes Monosem genau einem Homonym zugeordnet. Der Entitätstyp Verb-Homonym besteht aus einer Folge von Buchstaben, nämlich der orthographischen Repräsentation des Verbs. Der Entitätstyp Verb-Monosem umfaßt folgende Attribute: - Wortbildung (offener Wertebereich) - Phraseologie (offener Wertebereich) - Bedeutungsparaphrase (offener Wertebereich) - Flexion (offener Wertebereich) - Hilfsverb im Perfekt (fester Wertebereich: haben oder sein) <?page no="61"?> Zur Lexikon-Grammatik-Schnittsteile in einem hypermedialen Informationssystem 61 - Anmerkungen (offener Wertebereich) - Quelle (im Moment fester Wertebereich: Verben in Feldern) Ebenfalls eine l: n-Beziehung besteht zwischen den Entitätstypen Verb-Monosem und verbspezifische Rolle. Ein Monosem regiert einen oder mehrere Komplementtypen bzw. Ergänzungsklassen; ein Valenzpartner ist an genau ein Monosem gebunden. Die terminologische Unterscheidung zwischen Komplementtyp {Grammatik der deutschen Sprache) bzw. Ergänzungsklasse {Verben in Feldern) verdeutlicht ein generelles Problem der Verwaltung von Valenzbeschreibungen unterschiedlicher Herkunft, das in den differierenden Klassifikationen der einzelnen Untersuchungen begründet liegt. Die Einteilung der Verbkomplemente in verschiedene Klassen differiert zwischen der dem Hypertextsystem zugrundeliegenden Grammatik der deutschen Sprache und Verben in Feldern. Es gibt also keine l: l-Übereinstimmung in allen Fällen, sondern durchaus Verben, deren Valenzrahmen in den verschiedenen Regelwerken unterschiedlich ist. Um trotzdem die Inhalte sowohl von Verben in Feldern als auch anderer Valenzlexika parallel verwalten und nutzen zu können, besitzt der Entitätstyp verbspezifische Rolle entsprechend unterschiedliche Attribute. Im einzelnen sind das: - Komplementtyp in der Grammatik der deutschen Sprache (fester Wertebereich) - Komplementtyp im Herkunftslexikon (im Moment nur aus Verben in Feldern) - Rollenbezeichner (im Moment: fester Wertebereich entsprechend der Verben in FeWer«-Variablenbedeutung) - Argumentstatus (fester Wertebereich: true oderfalse) - Optionalität (fester Wertebereich: obligatorisch oderfakultativ) Eine n: m-Relation besteht zwischen den Entitätstypen verbspezifische Rolle und Konstituententyp. Valenzpartner können also durch mehrere unterschiedliche Konstituententypen realisiert werden und Konstituententypen können der Realisierung verschiedener Valenzpartner dienen. Der Entitätstyp Konstituententyp wird durch die Attribute Konstituententyp-Label und Termklasse beschrieben, es werden also Informationen über die syntaktische Belegung des Valenzpartners gespeichert. Eine zweite n: m-Relation findet sich zwischen den Entitätstypen verbspezifische Rolle und semantisches Merkmal. Valenzpartner können durch verschiedenartige semantische Merkmale belegt werden; semantische Merkmale können der Belegung unterschiedlicher Valenzpartner dienen. Der Entitätstyp semantisches Merkmal umfaßt Informationen über die semantische Belegung entsprechend des Verben in FeWern-Bescheibungsvokabulars. <?page no="62"?> 62 Roman Schneider Weiterhin angeschlossen an den zentralen Entitätstyp Verb-Monosem sind die Entitätstypen Passivtyp, Beispielsatz und Verbfeld. Das ER-Diagramm (Abb. 2a) macht nicht nur die l: n-Beziehung zwischen einem Verbfeld und einem oder mehreren Verb-Monosemen deutlich, sondern zeigt zusätzlich die in Verben in Feldern benutzte hierarchische Struktur von der Art „Feld A ist Subfeld von Feld B“. Auch die Verhältnisse zwischen den Entitätstypen Passivtyp mit dem Attribut Passivlabel (fester Wertebereich: werden-, sein- oder bekommen-? &ss\v) und Beispielsatz mit den Attributen Phänomen und Text zum Entitätstyp Verb-Monosem sind definiert über l: n-Beziehungen. Ein Monosemeintrag ist passivierbar durch einen oder mehrere Passivtypen und belegt durch einen oder mehrere Beispielsätze zu einem bestimmten Phänomen. Abb. 2a: ER-Diagramm der Valenzdatenbank <?page no="63"?> Zur Lexikon-Grammatik-Schnittstelle in einem hypermedialen Informationssystem 63 Abb. 2b: Detaillierte Beschreibung der Entitätstypen Verb-Monosem und verbspezifische Rolle Zur Verwaltung der im Vergleich mit der Datenbank der Funktionswörter komplexeren Inhalte der Valenzdatenbank bietet sich ein Datenbankmanagementsystem an. Darunter versteht man „den Teil eines (computergestützten) Informationssystems [...], der sich mit der Beschreibung der vorhandenen Daten, ihrer Verwaltung sowie dem Umgang mit und dem Zugriff zu ihnen befaßt“ (Schlageter/ Stucky 1983, S. 22). Die Vorteile eines Datenbankmanagementsystems liegen in den durch das System automatisch durchführbaren Konsistenz- und Integritätsprüfungen, hoher Datensicherheit und Redundanzfreiheit, einer integrierten Abfragesprache und der Möglichkeit des Mehrbenutzerzugriffs. Im Falle der grammis-Valenzdatenbank wird das relationale Datenbanksystem Paradox benutzt. 3. Anbindung der GRAMMIS-Datenbanken an den Hypertext 3.1 Anbindung der Datenbank der Funktionswörter Die Inhalte aus der Datenbank der Funktionswörter können im Informationssystem grammis von verschiedenen Punkten aus abgerufen werden. Für Benutzer, die sich grammatisches Wissen ausgehend von einer bestimmten Wortform erarbeiten möchten also die Wortart eines Funktionswortes bestimmen wollen gibt es die Möglichkeit einer direkten Datenbankabfrage. Nachdem die gesuchte Wortform in ein Suchfeld eingegeben bzw. aus einer Liste der <?page no="64"?> 64 Roman Schneider verfügbaren Einträge ausgewählt wurde, können die ersten Abfrageergebnisse angeschaut werden (Abb. 3). Ist eine Wortform homonym, d.h. gehört sie zu mehreren Wortarten, so bietet eine Schaltfläche Homonyme suchen die Möglichkeit, die entsprechenden Datensätze aufzurufen. Die einzelnen Wortarten sowie viele Ausdrücke innerhalb des Eigenschaftsfeldes sind darüberhinaus direkt mit Kurzdefinitionen aus der oRAMMis-Grammatikexpertin verbunden, die bei Bedarf in einem eigenen Fenster (Viewer) angezeigt werden können. Die ebenfalls für jeden Datensatz vorhandene Schaltfläche Eigenschaften dieser Wortart verbindet den Benutzer mit den korrespondierenden Einheiten der Hypertextkomponente. Nachdem die Wortart eines Funktionswortes erfragt wurde, kann direkt an die Stelle im Hyperdokument gesprungen werden, an der die charakteristischen Eigenschaften dieser Wortart erläutert sind. Der umgekehrte Weg ist auch möglich und stellt die optimale Navigationsstrategie für Benutzer dar, die ausgehend von einem bestimmten thematischen Abschnitt im Hypertext die Datenbank der Funktionswörter nach entsprechenden Einträgen abfragen wollen. Auf jeder Hypertextseite, auf der eine Funktionswortart behandelt wird, befindet sich eine Schaltfläche, die eine vorformulierte Abfrage in der Datenbank durchführt und deren Ergebnisse darstellt. Auf diese Weise lassen sich etwa aus dem Kapitel über die Wortart der Abtönungspartikeln alle in der Datenbank gespeicherten Abtönungspartikeln auflisten und durch automatische Generierung entsprechender Sprungverbindungen - Verweise in die Datenbankkomponente realisieren. Da das GRAM- MIS-Wortartenbuch die Eigenschaften beschreibt, die nach den Definitionen der inhaltlich zugrundeliegenden Grammatik der deutschen Sprache für alle Wörter einer Funktionswortart gelten, und in der Datenbank dazu noch Eigenschaften gespeichert sind, die innerhalb der Elemente dieser Wortart variieren, bietet diese Art der Abfrage und Navigation die Möglichkeit, spezifische Zusatzinformationen aus der Lexikonkomponente dem allgemein gehaltenen Regelwerk der Hypertextkomponente anzuschließen. <?page no="65"?> Zur Lexikon-Grammatik-Schnittsteile in einem hypermedialen Informationssystem 65 Abb. 3: Benutzeroberfläche der Datenbank der Funktionswörter 3.2 Anbindung der Valenzdatenbank Die Realisierung einer Verbindung der in der Valenzdatenbank gespeicherten lexikalischen Daten mit dem eigentlichen Hypertext-Informationssystem läßt sich in mehrere zunächst voneinander unabhängige Problemfelder aufteilen. Die zu beantwortenden Fragen sind: 1. Welche Lexikondaten sind für verschiedene Benutzergruppen oder in verschiedenen Benutzungssituationen interessant? 2. Welche Suchtechniken können angewendet werden? 3. An welchen Stellen im Hypertext sollen fest kodierte, vom Autor vordefinierte Abfragen vorgesehen werden bzw. wann eignen sich dynamische, benutzerdefinierte Verbindungen? 4. Wie können die lexikalischen Daten angemessen auf dem Bildschirm dargestellt werden? 5. Welche Teile eines Suchergebnisses lassen sich als Ausgangspunkt für Verweise zurück in den Hypertext nutzen? <?page no="66"?> 66 Roman Schneider 3.2.1 Verschiedene Benutzergruppen und Benutzungssituationen Da die Spanne der potentiellen Nutzer des Informationssystems grammis relativ weit reicht (interessierte Laien, Lernende und Lehrende in den Bereichen Germanistik oder Deutsch als Fremdsprache, Lehrbuchautoren, akademisches Fachpublikum, . . .) und eine entsprechende Evaluierung des bisherigen Prototyps noch aussteht, lassen sich derzeitig keine detaillierten Angaben zu den Wünschen einzelner Benutzergruppen machen. Es kann allerdings von im Vergleich mit herkömmlichen Wörterbüchern vielfältigeren Einsatzmöglichkeiten eines hypermedialen Informationssystems ausgegangen werden. Weiterhin erscheint plausibel, daß für einen Nutzer, der sich beispielsweise über die Eigenschaften von Dativkomplementen informieren will und sich gerade in dem diesbezüglichen Abschnitt des Hypertextsystems befindet, das Angebot einer Abfrage der Valenzdatenbank nach Verben mit entsprechendem Valenzpartner einen informativen Mehrwert darstellt. Für einen Nutzer, den eine quantitative Auswertung der Valenzdaten interessiert, könnte eine quantitative Analyse bestimmter Lexikondaten wünschenswert scheinen. Dabei bestünde die Möglichkeit der Abfrage sowohl von explizit in der Datenbank vorhandenen Informationen (z.B. Anzahl der Verben mit dem Hilfsverb haben) als auch von implizit gespeicherten Informationen (z.B. Anzahl der Verben, deren Valenzrahmen zwischen der Grammatik der deutschen Sprache und Verben in Feldern differiert). Gerade das letztgenannte Beispiel zeigt, daß fortgeschrittene Abfragemöglichkeiten den Wert der Lexikon-Hypertext- Schnittstelle erheblich erhöhen können. 3.2.2 Verwendung unterschiedlicher Suchtechniken Es gibt verschiedene Suchtechniken in Hypertext- und Datenbanksystemen. Generell lassen sich die Techniken in Inhaltssuche (content search), Struktursuche (structure search) und räumliche Suche (spatial search) unterteilen. Die Inhaltssuche berücksichtigt nicht die Struktur der gespeicherten Informationen, sondern nur deren Inhalt. Die Struktursuche benutzt die Struktur des Informationsnetzwerks, um bestimmte Einträge zu finden. Ein Beispiel dafür wäre die Suche nach Einträgen mit mehr als vier Links. Bei der räumlichen Suche wird die graphische Repräsentation der Einträge untersucht. Als Suchparameter kommt dann die Existenz spezieller Konstituenten und deren Position auf dem Bildschirm zum Einsatz: „Finde alle Einträge mit einem Bild in der linken oberen Fensterecke“ (Kacmar/ Leggett/ Schnase/ Boyle 1988). Daneben existiert die gerade für Hypertextsysteme typische Technik des freien Navigierens und Suchens, die im Gegensatz steht zur üblichen gezielten (rationalen) Recherche (Kuhlen 1991). Interessant für die Suche in der Valenzdatenbank ist in erster Linie die Inhaltssuche, also die Suche nach bestimmten Inhalten von Attributen („Suche alle Einträge, die den Komplement- <?page no="67"?> Zur Lexikon-Grammatik-Schnittsteile in einem hypermedialen Informationssystem 67 typ Akkusativkomplement besitzen“). Im Gegensatz zu reinen Hypertextsystemen, die gewöhnlich nur die Volltextsuche nach einem bestimmten Schlüsselwort erlauben, bietet der Einsatz eines echten, relationalen Datenbankmanagementsystems die Möglichkeit der Nutzung mächtiger Abfragesprachen wie z.B. SQL {Standard Query Language). Dies hilft, den ZugrifFsprozeß auf die gespeicherten Informationen erheblich zu flexibilisieren, da der Benutzer exakt beschreiben kann, welche Daten er ansehen möchte, und nicht nur auf eine wortformenbasierte Suche nach bestimmten Einträgen angewiesen ist. 3.2.3 Vordefinierte vs. benutzerdefinierte Datenbankabffagen Prinzipiell zu unterscheiden ist zwischen direkten, an den entsprechenden Stellen im Hyperdokument fest plazierten Verbindungen zwischen der aktuellen Textseite und der Valenzdatenbank und zwischen dynamischen Schnittstellen, über die der Benutzer durch die Eingabe selbstzusammengestellter Abfragen aktiv werden kann. Abhängig von Themengebiet und Benutzungssituation kann die eine oder die andere Verbindungsart sinnvoll erscheinen, so daß der Autor in jedem Fall abwägen muß. Die Schnittstelle zwischen der grammis- Hypertextkomponente und der Valenzdatenbank umfaßt die folgenden drei Verbindungstypen: 3.2.3.1 Verbindung zwischen Themengebiet und Valenzdaten Von den Stellen des Hyperdokuments aus, an denen verschiedene Typen von Verbkomplementen behandelt werden, können Verben aus der Valenzdatenbank abgerufen werden, die über ein Komplement dieses Typs verfugen. Umgekehrt kann auch von einem in der Datenbank gespeicherten Verb ausgehend zu den Stellen des Hyperdokuments gesprungen werden, an denen die Eigenschaften der Komplemente dieses Verbs näher erläutert sind. Abb. 4: Verbindung zwischen Themengebiet und Valenzdatenbank w- Dativkomplement: Semantische Rollen Dativkomplemente bezeichnen im allgemeinen einen "indirekt" von einem Ereignis betroffenen Gegenstand, in den meisten Fällen eine Person. Es gibt nur wenige Verben, die auch nichtpersonale Belegung des Dativkomplernents erlauben. Bei ihnen konnte theoretisch auch satzförmige Real Däießfeanfcäbirage lein, belegt sind solche Konstruktionen jedocn'S1JOTT§f'IllT§fT K T^ <?page no="68"?> 68 Roman Schneider Eine Verbindung des genannten Typs sieht z.B. folgendermaßen aus: An der Stelle im Hypertext, an der die semantischen Rollen des Dativkomplements behandelt werden, wird beschrieben, daß es nur wenige Verben gibt, die eine nicht-personale Belegung des Dativkomplements erlauben. Über einen typisierten Hyperlink (Abb. 4) ist es dann möglich, alle in der Datenbank gespeicherten Einträge solcher Verben abzurufen. Der Aufruf der Einträge geschieht in diesem Fall für den Benutzer unsichtbar über eine vorformulierte Abfrage in SQL, einer nichtprozeduralen Sprache zum Verwalten relationaler Datenbanken. Diese Abfrage wird dem entsprechenden Aktionswort zugeordnet und präsentiert dem Benutzer bei Aktivierung die Abfrageergebnisse auf einer separaten Seite (vgl. Abb. 6). 3.2 3.2 Verbindung zwischen einzelnen Verben und der Datenbank Oft werden innerhalb eines Hypertextknotens nur ausgewählte Valenzeigenschaften von in Beispielsätzen benutzen Verben erläutert. Eine Anbindung dieser Stellen an die Valenzdatenbank ermöglicht es dem Leser, sämtliche gespeicherten Informationen über das entsprechende Verb abzufragen (Abb. 5) und bei Bedarf durch Verfolgung der im vorigen Punkt erwähnten Navigationspfade an die Stellen im Hyperdokument zu springen, an denen die Eigenschaften weiterer Komplemente des Verbs behandelt werden. • “Kamm, mach mir mal die Knöpfe im Rücken auf (...)." ■ Ich kaufe mir einen bunten Luftballon ♦ "Ja, Sch Datenhankabfrage jpls früher, so wie einen Menschen, der gestoroen ist, den ich aber nicht vergessen kann". Abb. 5: Verbindung zwischen Beispielverb und Valenzdatenbank Praktisch ist weiterhin folgende Verbindung: Die Hypertextkomponente bietet dem Benutzer die Möglichkeit, die zur Unterscheidung zwischen Komplementen und Supplementen verwendeten Tests praktisch anzuwenden. In diesem Zusammenhang wird dem Benutzer die Möglichkeit geboten, zu Demonstrationszwecken selbstgewählte Verben einzugeben. Falls diese Verben schon in der Datenbankkomponente eingetragen sind, kann das Informationssystem automatisch eine entsprechende Suchanfrage generieren. 3 .2.3.3 Benutzerdefinierte Rechercheoptionen in der Datenbank Die Valenzdatenbank ist wie auch die Datenbank der Funktionswörter aus der GRAMMIS-Bibliothek (zur verwendeten Benutzermetapher vgl. Storrer 1995, S. 297) heraus aufrufbar. Zusätzlich existiert ein Menüeintrag Abfrage der Va- <?page no="69"?> Zur Lexikon-Grammatik-Schnittstelle in einem hypermedialen Informationssystem 69 lenzdatenbank, der von jeder Stelle im Hypertext aus aufrufbar ist. Der Anwender gelangt auf diesem Wege auf eine als Frontend für die dahinterliegende Datenbank konzipierte Präsentationsseite (Abb. 6). Über die Schaltfläche Abfragegenerator ist es nun möglich, gezielt nach Belegen für Verben mit bestimmten Eigenschaften zu suchen. Um einerseits vielfältige Retrievaloperationen zu erreichen und andererseits den Benutzer nicht zum Erlernen einer komplexen Abfragesprache zu nötigen, wurde eine möglichst intuitiv verständliche und anwendbare Abfragemaske entworfen (Abb. 7), auf der die gesuchten Attribute einfach per Mausklick ausgewählt und beliebig über undbzw. otfer-Relationen verknüpft werden können. Ein SQL- Generator übersetzt die ausgefüllte Maske automatisch in die Datenbanksprache SQL, führt die Abfrage durch und läßt den Benutzer anschließend auf der Einstiegsseite durch die gefündenen Einträge blättern. Auf diese Weise können relativ einfach Abfragen durchgeführt werden wie zum Beispiel: - „Suche alle Verben mit mehr als drei Komplementen.“ - „Suche alle Verben des Besitzens und Besitzwechsels, bei denen das Akkusativkomplement fakultativ ist.“ - „Suche alle Verben, die eine nicht-personale Belegung des Dativkomplements erlauben.“ 4* Das Valenzbuch Navlmtion ] Ausgang Bibliothek Einleitung der Valenzdatenbank } Abfragegenerator | Liste aller Einträge j Datenexport m Textdatet ) Datenmodell anzeigen 'L,„ T' : Ü! Abfcata« <j«rv»l»n»tfat»n>»nK Hillsverb: haben Verwendungsbeispiele zu: [AdvE U Da viele Eltern nicht möchten, daß ihre Kinder abends allein nach Hause gehen, holen sie sie selbst von dem Fest ab. Bedeutung: irgendwohin gehen, um eine Person oder eine Sache in Empfang zu nehmen und wegzubringen Flexion: holt ab holte ab hat abgeholt Wortbildung: der Abholer/ die Abholerin. die Abholung [Vorgang/ Handlung] Quelle: VALBU Verbfeld: unbestimmt Paseivtyptn: S-Passiv - W-Passiv Valenzpartner: AkkE Norrd: : obl. obl. derjenige, der etwas in Empfang nimmt jj; das, was in Empfang genommen wird Ort, an dem etwas bereitsteht Abb. 6: Ergebnispräsentation einer Abfrage der Valenzdatenbank <?page no="70"?> 70 Roman Schneider Mit Hilfe dieser Abfragemaske ist es auch möglich, in der Datenbank nach bestimmten Wortformen zu suchen. Dabei ist es dem Benutzer freigestellt, ob er nach Einträgen für eine einzige Wortform wie z.B. abholen suchen will oder durch die Benutzung von Platzhaltern {wildcards) die Recherche auf Gruppen von Einträgen erweitern will: Die Suche nach ab% findet alle Verben, die mit dem Präfix ab beginnen, ab sucht nach Einträgen, die mit ab beginnen und insgesamt sieben Buchstaben besitzen. Abb. 7: Abfragemaske der Valenzdatenbank 3.2.4 Darstellung der Ergebnisse auf dem Bildschirm Bei der Darstellung der durch eine Datenbankabfrage gefundenen Informationen sind zwei Problemstellungen zu lösen: die Auswahl der auf einer Seite darzustellenden Informationen sowie die Anordnung der Informationen. Es werden jeweils die Eintragungen zu einem Verb-Monosem dargestellt. Hat eine Abfrage mehrere Verben als Ergebnis, kann der Benutzer mit Hilfe entsprechender Schaltflächen sukzessive alle gefundenen Einträge durchblättern. Die Anordung der Einträge ist alphabetisch. Generell bestünde aufgrund der zugrundeliegenden Struktur der Valenzdatenbank auch die Möglichkeit je- <?page no="71"?> Zur Lexikon-Grammatik-Schnittsteile in einem hypermedialen Informationssystem 71 denfalls für entsprechend klassifizierte Verben die Abfolge nach dem onomasiologischen Gesichtspunkt der Wortfeldzugehörigkeit festzulegen, wie es etwa in Verben in Feldern gemacht wurde. Da der zur Verfügung stehende Bildschirmplatz durch die Größe des Programmfensters und die zur Navigation benötigten Schaltflächen begrenzt ist und zuviele Angaben auf einen Blick auch der Übersichtlichkeit abträglich sein können, ist die Darstellung nur ausgewählter Angaben zu einem Verb-Monosem sinnvoll. Zu jedem gefundenen Eintrag werden folgende Informationen aufgefuhrt: zunächst die Verbform mitsamt dem Hilfsverb, dann die verfügbaren Verwendungsbeispiele und eine Bedeutungsparaphrase, Angaben zu Flexion und Wortbildung sowie Informationen über die Quelle (im Falle von Einträgen aus Verben in Feldern komplettiert durch das entsprechende Verbfeld), die Flexion, die möglichen Passivierungstypen und die einzelnen Valenzpartner (siehe auch Abb. 6). Diese innere Anordnung wurde gewählt, um dem Benutzer durch das frühe Aufzeigen der Verwendungsbeispiele eine erste Orientierung zu geben und der Tatsache Rechnung zu tragen, daß gerade der lernende Leser meist induktiv vorgeht (Heringer 1986). Da die in der Datenbank gesammelten Verwendungsbeispiele immer an ein bestimmtes Phänomen (z.B. einzelne Valenzpartner oder Passivierungstypen) gebunden sind und nicht unbedingt für jedes Verb-Monosem zur Verfügung stehen, steht die Bedeutungsparaphrase aus Verständnisgründen ebenfalls vor den übrigen lexikalischen Angaben. Die Liste der Valenzpartner findet sich zwar erst am Schluß eines jeden Eintrags, ist aber durch ihre äußere Form sowie die farblich markierten Aktionswörter hervorgehoben und somit auch direkt identifizierbar in Benutzungsituationen, in denen es dem Anwender um Informationen über die einzelnen Valenzpartner geht. Zu jedem Valenzpartner eines Verbs werden neben dem Komplementtyp entsprechend dem Quellwörterbuch auch evtl, differierende Klassifikationen nach der der Hypertextkomponente zugrundeliegenden Grammatik der deutschen Sprache dargestellt. Weiterhin stehen dort Angaben über die Optionalität, den Argumentstatus und den Rollenbezeichner. 3.2.5 Automatisierte Verweise Die Komplementbezeichner werden bei der Präsentation der Abfrageergebnisse automatisch als Aktionswörter angelegt und gekennzeichnet. Die Abfrage der semantischen und syntaktischen Belegung ist anschließend durch die Aktivierung der entsprechenden typisierten Verknüpfüngen möglich. Typisierte Verknüpfüngen werden im gesamten GRAMMIS-Informationssystem zur Verbvalenz eingesetzt und bieten die Möglichkeit, von einem Aktionswort aus Verbindungen zu mehreren Hypertexteinheiten zu realisieren. Der Benutzer ist nicht in der unbefriedigenden Situation, vor dem Aktivieren eines Aktionswortes nicht zu wissen, was ihn erwartet (Sprung zu einer anderen Hypertexteinheit, Einblenden eines Beispiels in einem untergeordneten Fenster, Aufruf ei- <?page no="72"?> 72 Roman Schneider ner Animation, ...), sondern kann nach dem Anklicken des Aktionswortes aus einer dann erscheinenden Liste von Verbindungstypen auswählen (siehe dazu auch Abb. 4 und 5). Diese typisierten Verknüpfungen dienen auch zur Realisierung von Verbindungen zwischen der Frontendseite der Datenbank und anderen Hypertexteinheiten. Dabei gibt es zwei Verbindungstypen: einerseits die Verknüpfung der Komplementtypen mit den Stellen im Hypertext, an denen sie eingehend beschrieben werden, andererseits die Anbindung an die im elektronischen Glossar gespeicherten Kurzdefinitionen, die in einem separaten Fenster eingeblendet werden können. 4. Schlußbemerkungen In diesem Beitrag wurden Modellierung und Anbindung zweier Datenbankkomponenten an das hypermediale Informationssystem grammis beschrieben: die relativ einfach strukturierte und mit Toolbook implementierte Datenbank der Funktionswörter sowie die komplexere, mit Hilfe des Datenbankmanagementsystems Paradox umgesetzte Valenzdatenbank. Die beschriebenen Datenstrukturen sind erweiterbar und können bei einer Veränderung der Anforderungen an die Datenbanken z.B. Bereitstellung neuer Abfragemöglichkeiten angepaßt werden. Insbesondere die Anbindung der Valenzdatenbank an den Hypertext über die Verbvalenz hat gezeigt, daß entsprechend den verschiedenen möglichen Benutzersituationen die Realisierung unterschiedlicher Verbindungstypen von Vorteil ist. Nach der im Zuge der Anbindung geleisteten Arbeit entsteht dadurch, daß Grammatik und Lexikon nun einen einheitlichen Informationsraum bilden, ein informationeller Mehrwert. 5. Literatur Chen, Peter P.-S./ Knöll, Heinz-Dieter (1991): Der Entity-Relationship-Ansatz zum logischen Systementwurf: Datenbank- und Programmentwurf. MannheimAVien/ Zürich. Date, Christopher J. (1986): An Introduction to Database Systems. I. Reading (Mass ). Heringer, Hans Jürgen (1987): Was lange währt. Gedanken zum Mannheimer Valenzwörterbuch. Rezension über das Valenzwörterbuch Verben in Feldern. In: Zeitschrift für Germanistische Linguistik (ZGL), 15, S. 311-317. Kacmar, Charles/ Leggett, John/ Schnase, John/ Boyle, Craig (1988): Data Management Facilities of Existing Hypertext Systems. Technical Report. TAMU 88-018. Hypertext Research Lab. Texas A&M University. <?page no="73"?> Zur Lexikon-Grammatik-Schnittstelle in einem hypermedialen Informationssystem 73 Kuhlen, Rainer (1991): Hypertext: Ein nichtlineares Medium zwischen Buch und Wissensbank. Heidelberg. Kuhlen, Rainer (1995): Informationsmarkt: Chancen und Risiken der Kommerzialisierung von Wissen. Konstanz. Nielsen, Jakob (1995): Multimedia and Hypertext. The Internet and beyond. Cambridge. Schlageter, Gunter/ Stucky, Wolffried (1983): Datenbanksysteme: Konzepte und Modelle (2., neubearb. u. erw. Aufl ). Stuttgart. Schneider, Roman (1997): Navigationsangebote und Datenbankintegration in einem hypermedialen Informationssystem zur deutschen Verbvalenz. Magisterarbeit. Univ. Trier. Schumacher, Helmut (Hg.) (1986): Verben in Feldern. Valenzwörterbuch zur Syntax und Semantik deutscher Verben. Schriften des Instituts für deutsche Sprache 1. Berlin/ New York. Storrer, Angelika (1995): Die Grammatik mit der Maus - Konzeption eines multimedialen Informationssystems zur deutschen Grammatik. In: Hitzenberger, Ludwig (Hg ): Angewandte Computerlinguistik. Hildesheim/ Zürich/ New York. S. 291-305. Zifonun, Gisela/ Hofftnann, Ludger/ Strecker, Bruno (1997): Grammatik der deutschen Sprache. Berlin/ New York. <?page no="75"?> Eva Breindl Konzeption und Konversion: zur simultanen Produktion von Printtext und Hypertext am Beispiel Grammatik 1. Gegenstand und Zielsetzung Dieser Beitrag beschreibt am Beispiel eines grammatischen Handbuchs, welche Probleme sich ergeben und welche Lösungsstrategien sich als sinnvoll erweisen, wenn Print- und Hypertext-Versionen kollaborativ und simultan erstellt werden. Es werden konzeptionelle Unterschiede zwischen den beiden Versionen dargestellt und es wird gezeigt, wie der hypertextspezifische Mehrwert für den Leser in einer konkreten Anwendung zu realisieren versucht wurde. Ein möglicher Mehrwert wird auch aus der Perspektive des Autors diskutiert, und die Hypertext-Produktion wird als Textkonversion und direkte Produktion von Text als Hypertext beschrieben. Aus den Ergebnissen lassen sich Schlussfolgerungen ziehen hinsichtlich der Effektivierung und Optimierung kollaborativen Schreibens in der Wissenschaft. 2. Das Handbuch der deutschen Konnektoren als Buch Seit 1992 wird am Institut für deutsche Sprache Mannheim in der Abteilung Grammatik am Projekt „Handbuch der deutschen Konnektoren“ (im folgenden HdK) 1 gearbeitet. Gegenstand dieses Handbuchs ist ein Bereich des deutschen Wortschatzes, der in Grammatiken und Wörterbüchern bisher allenfalls in Form von „lexikographischen Verlegenheitslösungen“ (Lang 1988) beschrieben ist, und der vor allem für nicht-muttersprachliche Benutzer nirgendwo in befriedigender Weise aufgearbeitet ist (vgl. Brauße 1997 und Kempcke/ Pasch 1997): Wortschatzeinheiten, die Sätze miteinander verknüpfen können. Diese fünktional definierte „Klasse“ der Konnektoren gehört zu den Funktionswörtern; sie stellt keine Wortart im herkömmlichen Sinn dar, sondern ist eine Mischklasse, die sich aus Teilmengen anderer traditionell definierter Wortarten wie koordinierende und subordinierende Konjunktionen {und, oder, weil, obwohl, so dass), Adverbien {deswegen, folglich, schließlich, allerdings, freilich) und Partikeln {auch, eben) zusammensetzt. Ziel des Handbuchs ist es, die Gebrauchsbedingungen dieses Gegenstandsbereichs auf den verschiedenen Beschreibungsebenen der Grammatik systematisch zu erfassen, d.h. auf der syntaktischen Ebene (Stellungsgesetzmäßigkeiten, intonatorische Eigenschaften, syntaktische Beschränkungen, Kombinationen mit anderen Konnektoren), 1 Autoren: Renate Pasch, Ursula Brauße, Eva Breindl (seit 1996). <?page no="76"?> 76 Eva Breindl der semantischen (semantische Klasseneigenschaften und idiosynkratische lexikalische Eigenschaften) und der pragmatischen Ebene (Kontexteinbettung, Rolle im Diskurs). Als grammatisches Handbuch weist auch das HdK die für Grammatiken typische „Mehrfachadressiertheit“ auf: 2 Zielgruppe sind neben dem immer auch angesprochenen engeren Kreis der Experten im Gegenstandsbereich - Dozenten und Studenten theoretischer wie angewandter germanistischer und linguistischer Fächer (insbesondere Deutsch als Fremdsprache, Computerlinguistik, kontrastive Linguistik, Lexikographie) sowie Sprachlehrer und fortgeschrittene Deutschlerner, Lehrwerkautoren, Computerlinguisten, Lexikographen. Das HdK weist damit von vornherein eine Reihe von Eigenschaften auf, die es für eine Umsetzung als Hypertext geradezu prädestiniert erscheinen lassen: 1. Es realisiert eine Schnittstelle zwischen Grammatik und Lexikon. Damit ist es in Bezug auf den Gegenstand nach zwei Seiten hin „offen“: a) gegenüber der Ausprägung und idiosynkratischen Ausdifferenzierung von syntaktischen und semantischen Klasseneigenschaften im Lexikon der Konnektoren (paradigmatische Ebene) und b) gegenüber allgemeinen grammatischen Prinzipien, die unter anderem, aber eben nicht nur, im Gegenstandsbereich eine Rolle spielen, wie z.B. Topologie, Skopus, Satzmodus, Koordination, Valenz (syntagmatische Ebene). 2. Mit der Mehrfachadressiertheit korrespondiert im Idealfall eine Flexibilität des Informationsangebots (Umfang, Perspektivierung, Detailliertheit) sowie des Informationszugriffs für den Benutzer, die auf seine individuellen Vorkenntnisse, Bedürfnisse und Benutzungssituationen abgestimmt ist. Für das traditionelle lineare Buchmedium gilt dabei, dass mehrfachadressierte Texte umso schwieriger für den einzelnen Benutzer zu „optimieren“ sind, je größer und inhomogener der Adressatenkreis ist (Hoffmann 1992). 3. Als grammatisches Handbuch, das keinem linguistischen Theorieansatz stringent verpflichtet ist, sondern eher der pluralistischen Linie der Grammatik der deutschen Sprache (Zifonun/ Hoffmann/ Strecker 1997) folgt, enthält das HdK auch inhaltlich digressive, nicht-lineare Elemente. Unterschiedliche Teilbereiche des Gegenstands werden auf unterschiedlichen Ebenen der Grammatik und mit unterschiedlichen Erklärungsansätzen behandelt, konkurrierende Theorien werden gegeneinander abgewogen und 2 Terminus nach Hoffmann (1992). Dass unterschiedliche Benutzer in unterschiedlichen Benutzungssituationen unterschiedliche und unterschiedlich detaillierte grammatische Informationen suchen, ist bekannt und eines der zentralen Dilemmata der Grammatikographie. Zur Frage: Wieviel und welche Grammatik braucht wer in welcher Situation zu welchem Zweck vgl. Helbig (1993) und für die Perspektive des Deutschlemers - Weydt (1993). <?page no="77"?> Konversion und Konzeption: zur simultanen Produktion von Buch und Hypertext 77 bewertet. Abgesehen von dieser inhaltlichen Mehrdimensionalität haben Handbücher auch im formalen Bereich diskontinuierliche Anteile: eine Gliederung in distinkte, abgeschlossene Kapitel und Unterkapitel, Fußnoten, gekennzeichnete Exkurse, Inhaltsverzeichnisse, Zwischenüberschriften, Anhänge, Literaturverzeichnisse, intra- und intertextuelle Verweise, Beispiele. 4. Handbücher haben didaktischen Charakter, sie wollen nicht nur Informationen, sondern anwendbares Wissen vermitteln. Eine Überprüfung des erworbenen Wissens mit Kontrolle und Rückkoppelung ist daher wünschenswert. 3. Das Handbuch der deutschen Konnektoren als Hypertext im Rahmen von GRAMMIS Konsequenterweise wird nun seit 1996 das HdK parallel und simultan zur Buch-Version als Hypertext realisiert und in den Rahmen des in der gleichen Abteilung entwickelten grammatische Informationssystem GRAMMIS 3 eingefugt. Im Projekt GRAMMIS wird ein multimediales Informationssystem zur deutschen Grammatik entwickelt, das die Zielsetzung hat, grammatisches Wissen auf anschauliche Weise zu vermitteln und den Gestaltungsspielraum auszuloten, den Hypermedia im Vergleich zum herkömmlichen Buch-Medium dafür bieten. Inhaltliche Grundlage von GRAMMIS sind die am IDS von Mitarbeitern verfassten Arbeiten zur Grammatik, vor allem die Grammatik der deutschen Sprache (Zifonun/ Hoffmann/ Strecker 1997). Multimediale Hyperdokumente zu verschiedenen Themenbereichen der Grammatik sind in GRAMMIS integriert und miteinander vernetzt, jedes Dokument ist mit einer lexikalischen Datenbank gekoppelt und um ein Glossar grammatischer Termini, zum Teil auch um eine Übungskomponente, angereichert. Derzeit weitgehend abgeschlossen sind die Komponenten Wortarten des Deutschen mit einem Lexikon der Funktionswörter, Verbvalenz mit Datenbank zu kombinatorischen Eigenschaften deutscher Verben, Neue deutsche Rechtschreibung mit Wörterverzeichnis der Neuschreibungen und Grammatik aus funktionaler Sicht mit Datenbank der Prädikate und Prädikatsausdrücke. Als Entwicklungswerkzeug dienen das Hypertext-System Toolbook 4.0 (Asymetrix) und das Datenbanksystem Paradox für Windows (Borland). Das System ist offen für Schnittstellen nach außen, etwa zu einer Literaturdatenbank oder anderen Dokumenten des IDS, und es könnte bei einer künftigen online-Version natürlich auch den 3 Zu grammis s. Storrer (1995) und Storrer (1997), ferner die Beiträge von Schneider, Strecker und Storrer in diesem Band. <?page no="78"?> 78 Eva Breindl Zugang zu weiteren linguistischen und germanistischen Angeboten im Internet offenhalten. Komponente: NEUE RECHT- SCHREUi UNU 'S Komponente: GRAMMATIK AUS FUNKTIONALER SICHT Abb. 1: Die Architektur von grammis <?page no="79"?> Konversion und Konzeption: zur simultanen Produktion von Buch und Hypertext 79 Jüngstes GRAMMIS-Kind ist nun die Hypertext-Version des HdK. Die Arbeitsteilung bei der Entwicklung ist dabei so geregelt, dass die für die Erstellung der Hypertext-Version zuständige Autorin gleichzeitig auch als Autorin für Teile des Inhalts von HdK verantwortlich zeichnet. Diese Verflechtung zeitigt verschiedene Phasenabläufe bei der Produktion: Es werden weitgehend abgeschlossene, aber noch nicht endrevidierte Fremdtexte konvertiert, eigene Texte werden direkt als Hypertext konzipiert und erstellt und anschließend für die Buchfassung linearisiert und schließlich werden Ergebnisse der Hypertext- Konversion sowohl „zur Korrektur“ als auch „als Korrektiv“ gegenüber Dubletten, Unstimmigkeiten oder Unklarheiten in der Argumentation etc. wieder besprochen und haben so Rückwirkungen auf die Gestalt der Linearversion. 4. Das Handbuch der deutschen Konnektoren als Hypertext: Mehrwert für den Leser? Um die personal- und kostenintensive Dublette Printtext - Hypertext 4 (über den Prototypenzweck der Erfahrungsgewinnung hinaus) zu rechtfertigen, muss die Hypertextversion einen Mehrwert enthalten, den die Buchversion aufgrund der spezifischen Beschränkungen des Mediums nicht zu leisten imstande ist. Bei der Konzeption der Hypertextversion war also vordringlich darauf zu achten, wie unter Vorgabe des konzeptuellen und programmtechnischen Rahmens von GRAMMIS ebenso wie unter der Adressatenzielvorgabe des HdK ein solcher Mehrwert erzielt werden konnte, der sich für den Nutzer in einer Effektivierung und Beschleunigung der Wissensaneignung und einer Erhöhung der Behaltensleistung niederschlägt. Da ein Text - und das gilt für Hypertexte nicht minder umso verständlicher ist, je mehr er auf die Erwartungen und das Vorwissen des Lesers eingeht (Hoffmann 1992), wurde vorab versucht, Ausgangshypothesen über die Informationsbedürfhisse der anvisierten Zielgruppen durch Umfragen zu verifizieren bzw. zu spezifizieren. In die Umfrage wurde vor allem die für uns weniger bekannte Zielgruppe Lehrende des Fachs Deutsch als Fremdsprache und Sprachlehrer (Hochschulen, Studienkollegs, Goethe- Institute) einbezogen, die als Multiplikatoren auch über die Bedürfnisse ihrer Lerner Auskunft geben können sollten. In Bezug auf die Einsatzmöglichkeiten zeigte sich, dass neben linguistischen Forschungsinteressen sprachdidaktische Interessen einen Schwerpunkt bilden. Als mögliche Benutzungssituationen wurden von DaF-Dozenten bzw. Sprachlehrern genannt: Unterstützung der Unterrichtsvorbereitung, Lehrer-Aus- und Fortbildung, Herstellung von Lehrmaterialien, eigener grammatischer „Nachhilfe“-Bedarf. Ein möglicher Ein- 4 Für die Entwicklung von Lernsoftware kann man als Erfahrungswert 30-200 Entwicklungsstunden für eine Stunde Lernzeit beim Benutzer veranschlagen, je nach der medialen Ausstattung und der Gestaltung der Benutzeroberfläche des Programms, gegenüber geschätzten 6-12 Entwicklungsstunden für eine Stunde traditionellen Seminarbetrieb. (Thome 1991, S. 211; Glowalla/ Schoop 1992, S. 24). Vergleichende Auswertungen zu den Produktionszeiten und -kosten von Buch und Hypertext stehen noch aus. <?page no="80"?> 80 Eva Breindl satz von grammis im Unterricht wurde ganz überwiegend abgelehnt, außerunterrichtliches Selbststudium für Lerner aber durchaus in Betracht gezogen. Im einzelnen zeigte sich, dass a) die Informationsbedürfnisse von Muttersprachlern und Nicht-Muttersprachlern sich nur teilweise decken: Letztere sind z.B. im Unterschied zu ersteren stärker an Bedeutungsbeschreibungen und detaillierten Beschreibungen der syntaktischen Umgebung einzelner Konnektoren interessiert, dass b) (erwartungsgemäß) die Interessen von Linguisten und Sprachlehrern divergieren: Letztere gaben bei der Befragung überwiegend an, an Forschungsüberblicken, Literaturdiskussionen, Ausleuchtung theoretischer Hintergründe und modelltheoretischen Einordnungen nicht interessiert zu sein, wofür bei Linguisten ein hohes Interesse vorhanden war, und dass c) für Sprachlehrer und DaF-Dozenten eine Komponente der Evaluation, Anwendung und Überprüfüng des erworbenen Wissens mindestens ebenso hohen Stellenwert hat wie die reine Informationskomponente. 5 Datei Optionen M»vig.ation HiHe ^JlgemelneJMerkmaiTvönKÖ^ektoren^Jl j Als Kcrwektörsn bezeichnen wir Wortschatzeinheiten, die Sätze verknüpfen. Das bedeutet, dass ihre kombinatorischen Eigenschaften der Endpunkt grammatischer Phänomene der Verknüpfung von Ausdrücken zu Texten sind, und dass darüber hinaus nur Das morphologische Kriterium ‘nlcht-fiektierbar' grenzt Konnektoren von den Wortarten Verb, Adjektiv und Nomen ab, nicht aber von Präpositioneri, Partikeln und Adverbien. I Sie sind nicht Hekberbar. noch inhaltliclr^! ^ Konnektoren * iü ^ iäfc Sie vergeben Keine Kasusmerkmale an Ihre syntaktische Umgebung. ® WßSM Sie drücken eine spezifische zweistellige semantische Relation aus. ^ süillSi Die Argumente Ihrer relationalen Bedeutung sind proposltlonale Strukturen. F-' Die Ausdrücke für die proposttionalen Strukturen sind Satzstrukturen. Diese Satzstrukturen nennen wir Konnekte. Die meisten Konnektoren haben zwei Konnekte in ihrer unmittelbaren Umgebung. Abb. 2: Hauptlesestrang. Ausgliederung und Bestimmung des Gegenstands. Die generellen Konnektoren-Merkmale M1-M5 werden durch Anklicken in den Zusammenhang ihrer Funktion für die Abgrenzung von anderen Wortarten gestellt. Für die hier schwach markierten Termini (Wortarten) kann durch Anklicken eine Kurzdefinition eingeblendet werden. Der Streubreite von Benutzerinteressen und Benutzungssituationen durch die Einrichtung flexibler Zugriflfswege zu Information und durch flexible Aufteilung von Information Rechnung tragen zu können ist ein spezifisches Charakteristikum des Mediums Hypertext. Im Fall des HdK soll diese Flexibilität erreicht werden: 5 Zum Einsatz von Multimedia in der Fremdsprachendidaktik vgl. die Bestandsaufnahme von Hahn/ Künzel/ Wazel (1996), Fendt (1993) und Thome (1992). <?page no="81"?> Konversion und Konzeption: zur simultanen Produktion von Buch und Hypertext 81 A) Durch die durchgehende Zuordnung der grammatischen Information zu zwei verschiedenen „Lesesträngen“: einem eher ergebnis- und faktenorientierten „Hauptlesestrang“, an dem entlang Informationseinheiten (in Hypertext- Terminologie: „Knoten“ oder „Seiten“) miteinander verknüpft sind, die die wesentlichen Ergebnisse in knapper Form präsentieren. An einschlägigen Stellen gehen von Seiten des Hauptlesestrangs inhaltlich spezifizierte Verzweigungen (in Hypertext-Terminologie: „Links“) zu einem vertiefenden und eher prozessbzw. problemorientierten Lesestrang aus, in dem Interessierte etwa die Erörterung eines sprachtheoretisch interessanten oder für die Klassifikation problematischen Phänomens nachlesen können, einen Forschungsüberblick erhalten oder die argumentative Hinfuhrung zu einer von den Autoren getroffenen unüblichen Festlegung nachvollziehen können. Seiten mit vertiefender Lektüre können „überblättert“ oder gezielt angesprungen werden; von ihnen kann jederzeit zum Hauptlesestrang zurückgekehrt werden. Qatei Optionen Navigation tjilfe , Vertiefung koordinative Verknüpfung X 1. Koordmat Koordinator 2. Koordiriat X Jat > Die Koordinate wirken gleichberechtigt an der Determination syntaktischen Kategorie der koordinativen Verknüpfung mit. Wenn die syntaktische Kategorie der Koordinate eine Konstituenten* stmkturkategorie sein soll, kenn diese Annahme nur für solche koordinativen Verknüpfungen gelten, bei denen Koordinate gleicher Kategorien beteiligt sind, wie z.S. in für WrtscbaP. und das Ctfnwteewu&stw {Nominalgruppen- Koordination), fi&uen und siecher, (Verb-Koordination), dr-jnicr u>td dfQhef' (Adverb- Koordination). Koordinativen Verknüpfungen mit kategoriell verschiedenen Koordinaten wie in (1) kann die Annehme nicht Rechnung tragen. (}) ich komme v/ egen des Artikels und weil ich m<ch mal nach ihrer Gesundheti erkundigen woiHe Abb. 3: Vertiefende Lektüre. Hier eine Seite des Forschungsüberblicks zur syntaktischen Kategorisierung koordinativer Verknüpfungen. Der argumentative Text wurde hier segmentiert und hinsichtlich seines Stellenwerts im Argumentationszusammenhang (These, Spezifizierung, Gegenargument) klassifiziert. Sämtliche Seiten des Forschungsüberblicks zeigen einheitlich diesen Aufbau. <?page no="82"?> 82 Eva Breindl Auch im Hauptlesestrang selbst wird vielfach auf die Technik der Informationsstaffelung und sukzessiven Detaillierung durch benutzergesteuerte Einblendung von Fenstern u.ä. zurückgegriffen, die Beispiele, Erläuterungen, Zusammenhänge oder eine andere Perspektivierung bieten. Datei Optionen Navigation Hilfe toolHotik-KQNNÖO.reK | allerdings Sytwaktlscl Konjunktionaladvert) l aber, jedoch, doch 1 adversativ i Bezugskonnekt < Wirtskonnekt mit Konnektor mtegnert Vc-rteld. Nachrrst. Min-j-tf ld. Nar hfeic nicht mtegnert Nuüstelie FMwat <l«f Ksnmkt«* : Kommunikative Minimaieinheiten allerdings/ allerdings. vorfelo: Das Nashorn tst unoemv so zahm wie ein« Hauskuh, Ammnas ist der Buke ein wenig ananffslustioer. nacherst: Oos Nashorn Ist ungefähr so zahm wie eine Hauskuh, Der Bulle aHerdinos ist ein wenig angriffslustiger. nullstelle: Das Nashorn ist ungefähr so zahm wie eine Hauskuh. Allerdings der BuHe Ist ein wenig angriffstustiger I Nichtsatz-Konnekte Das Buch ist / elzl veröffentlicht, allerdings in einer setr keinen Auflage Kombinationen mit adversativen, konzessiven und restnkbven trotzdem, dennoch, aber Nicht selten haben in Schlachten wenig Entschlossene den Übrigen ihre Tapferket mtgeteilt wie eine magische Macht Aber irgendwo ist allerdings die Grenze I ir eingebettete Satze integrierbar Das habe ich gelesen. Ob es allerdings auch stimmt, ist eine andere Frage Bibliothek Eondgttibe | Semantische Eigenschaften j; Nene Anfrage J Syntaktische Ciyenschaften f 'iurilck J «eitet 1 Abb. 4: Lcxikonemtrag für allerdings. Angegeben sind neben der Subklassenzugehörigkeit des Konnektors jeweils seine topologischen Eigenschaften bzw. die der durch ihn verbundenen Konnekte, syntaktische Beschränkungen, Akzentuierung, semantisch benachbarte Konnektoren, Kombinationsmöglichkeiten sowie andere Verwendungsweisen der Einheit. Die Eigenschaften werden durch Beispiele verdeutlicht. Verknüpfungen gibt es zu Belegstellen in der Komponente Fundgrube, zu den Übersichtsseiten semantische Klasseneigenschaften und syntaktische Klasseneigenschaften, die die Folie abgeben für die idiosynkratischen Eigenschaften eines Konnektors, zum „eigentlichen“ Handbuch und über die Bibliothek zu anderen GRAMMis-Komponenten. B) Durch Anreicherung und „Veredelung“ des Kern-Hyperdokuments, des „eigentlichen“ Konnektorenbuchs, um Zusatzangebote: ein Lexikon der Konnektoren mit Einzeleinträgen zu ca. 150 Lemmata. Die Lexikonkomponente greift auf, was im Buch aus Platzgründen allenfalls in Form von merkmalsindizierten Anhängen erscheinen kann, nämlich Angaben zu semantischen und syntaktischen Klasseneigenschaften. Sie fuhrt diese in einer benutzerfreundlicheren Redundanz für jeden einzelnen <?page no="83"?> Konversion und Konzeption: zur simultanen Produktion von Buch und Hypertext 83 Konnektor gesondert auf und ergänzt die Angaben um die je idiosynkratischen lexikalischen Eigenschaften des jeweiligen Konnektors. ein Glossar grammatischer Termini mit Kurzdefinitionen, das sowohl als online-Hilfe aus dem Text heraus abrufbar ist, indem markierte Termini angeklickt werden und die Kurzdefmition in einem Fenster eingeblendet wird, als auch als Informationseinstieg und Stichwortregister fungieren kann, von dem aus der Benutzer den Einstieg in solche Passagen des Handbuchs wählt, in denen der gesuchte Terminus eingefuhrt wird. Dieses Glossar „teilt“ sich das Konnektorenhandbuch mit den übrigen Komponenten von GRAMMS, was den Vorteil hat, dass auch die Erklärungen für Phänomene, die nicht ausschließlich spezifisch für den Gegenstandsbereich Konnektoren sind (z.B. Wortarten, Phrasen, allgemeine syntaktische und semantische Prinzipien) von den anderen Komponenten her „zugefüttert“ werden können. die Fundgrube, die für jeden im Lexikon aufgeführten Konnektor eine Seite mit ca. 20 unkommentierten aber sortierten Belegen aus den Mannheimer Korpora geschriebener und gesprochener Sprache enthält. Die Belege sind mit Quellenangaben versehen, durchnummeriert und geordnet nach dem Kriterium „von der unauffälligen Verwendung zur auffälligen“. Die Ergänzung der Belege um Ton-Beispiele für die Verwendung der einzelnen Konnektoren in gesprochener Sprache ist geplant. ein Übungsmodul, das Übungen zu den für Nichtmuttersprachler fehlerträchtigen Bereichen Stellungseigenschaften und semantisch-paradigmatische Eigenschaften der Konnektoren anbieten soll, sowie Klassifikationsaufgaben zu den im HdK getroffenen Subklassenbildungen. <?page no="84"?> 84 Eva Breindl Qatei Optionen Navigation Hilfe .mm (1) Sicherlich keine aufregenden Zahlen, die deutsche Großchemie jedoch zeigt in dem kleinen Land erstaunlich stark Flagge. Produziert wird in Finnland allerdings nur von Hoechst, und zwar vor allem Arzneimittel, aber auch Lichtpauspapier aus finnischem Rohpapier H85/ BM2 12636. Mannheimer Morgen (1985, Wirtschaft). 10 09 85, S 06 (2) Eine Erhöhung hat den Effekt, daß die laufenden Beiträge bei konstanter Versicherungssumme niedriger werden; allerdings sinkt im ErlebensfaU auch die Oberschußbeteüigung, also der Betrag, der über die Versicherungssumme hinaus ausgezahlt wird. H85/ BM2 13077, Mannheimer Morgen (1985, Wirtschaft), 25 10 85. S 06 (3) Aus der Sicht von Michael Helffrich ist sein früheres Unternehmen keineswegs tot. Ganz anders allerdings der Tenor des 20seitigen Berichts des Konkursverwalters. Nach der vorläufigen Rechnung von Wellensiek ergibt sich für die Rückforth AG bei Aktiva von etwa 133 Mill. DM und Passiva in Höhe von 145 Miß. DM eine Überschuldung zwischen 12 und 13 Miß. DM . H85/ BM1 11294, Mannheimer Morgen (1985, Wirtschaft). 25 04 85, S 07 fexikute Abb. 5: Fundgmbeneintrag fiir allerdings. Diese Seiten sind als Scroll-Seiten angelegt und können als reiner Text ausgedruckt werden. Sie sind verknüpft mit dem jeweiligen Lexikoneintrag, mit den organisierenden Seiten Inhaltsverzeichnis und Auflau des Konnektorenbuchs, und über die GRAMMIS-Bibliothek mit den anderen Komponenten. Zwischen diesen Moduln bestehen vielfache inhaltlich spezifizierte Verknüpfungen. Flexibel reagiert das System auch auf Benutzungssituationen und damit korrelierende typische Zugriffswege: Die Wortform - und damit das Lexikon wird vor allem für Nicht-Experten und in Situationen, die eine adhoc-Lösung eines Kommunikationskonflikts oder Detailinformation fordern, wohl den häufigsten Einstieg bieten. Über organisierende Seiten des Kerndokuments wie Inhaltsverzeichnisse, Übersichten und eine die Gesamtarchitektur erläuternde Aufbauseite wird man den Einstieg wählen, wenn die zusammenhängende Erarbeitung eines Gegenstands oder eines Teilbereichs davon geplant ist. Der Einstieg über Originalbeispiele kann sowohl Forscherinteressen bedienen als auch in sprachdidaktischem Zusammenhang zur Verdeutlichung dienen. <?page no="85"?> Konversion und Konzeption: zur simultanen Produktion von Buch und Hypertext 85 Abb. 6: Interaktive Übung zu den Stellungseigenschaften integrierbarer Konnektoren. Der Benutzer bringt die einzelnen Bestandteile eines Satzes durch sukzessives Anklicken in eine gewünschte Reihenfolge, das System gibt daraufhin eine Bestätigung oder Zurückweisung und fordert zum Ausprobieren weiterer Stellungsvarianten auf. C) Durch die Hinzufügung von sog. „organisierenden Seiten“, d.h. Informationseinheiten, deren Zweck die Transparentmachung von Aufbau, Struktur und Art der Verknüptungen zwischen den einzelnen „Inhalts-Seiten“ ist, soll dem Benutzer die Orientierung im Hypertext-Dokument und die Navigation darin erleichtert werden. Damit soll ebenso wie durch Menü- und Navigationsleiste, durch Volltextsuche und backtracking-Option sowie eine einheitliche graphische Gestaltung von gleichgewichteter Information die vielfach beschworene Gefahr des „getting lost in Hyperspace“ so gering wie möglich gehalten werden. D) Der interaktiv dialogische Charakter des Hypertexts schlägt sich nicht nur in der Vielzahl der möglichen Pfade, auf denen der Benutzer individuell durch das Dokument steuern kann, nieder, sondern auch durch die Möglichkeit, über einen Annotationseditor selbst Anmerkungen zu beliebigen Textstellen einzufugen und damit das Hypertext-Dokument zu erweitern. <?page no="86"?> 86 Eva Breindl Konnektoren Datei Optionen Navigation Hilfe Übungsfeld Lexikon Aufbau HANDBUCH DER DEUTSCHEN KONNEKTOREN die Komponenten _ , ^ Me "Fundgrube .... enfiiäJt Öiig-tNalbeispipje üsit 4; iuelleiu«i»ij.'5»efi zu dein ca. 168 Konnektoren des Koimektoren l.e.vikoiis. Loxikonemtrag und fiindgiubeneiiitiag sind jeweils direkt initeinanfier verlumden i X.exlköis der M ^ K#mKkäöE «*8} fruihniöglirlikeiteii nach der Woitfonn, nach syntakiiseher, und semailfischen Klassen Das eigentliche"Handbuch Uhungo* zii tRTioioglschftr. und senutntisr.hen F.igenschatten von Konnektoren F-i.itidgnibe: ^ Konnektoren im Kontext Belege aus den Marmheurtor fCotpej-a, Texte, dialog« Hi« Beispiele Abb. 7: Seite Aufbau. Die Abbildung der modularen Gesamtarchitektur von HdK als zentrale organisierende Seite: Von allen Seiten des Dokuments kann man diese Seite anspringen, die wiederum mit allen Moduln des HdK und über die Bibliothek mit allen anderen grammis-Komponenten verbunden ist. Schließlich ist bisher in mehreren Fallstudien 6 versucht worden, die Hypothese zu überprüfen, Hypertexte seien als Lern- und Informationssysteme dem traditionellen Medium allein schon aufgrund ihrer „kognitiven Plausibiliät“ überlegen. Diese These beruft sich auf die nicht unumstrittene - Annahme einer Analogie zwischen der netzartigen Organisationsform des Mediums und der Funktionsweise des menschlichen Denkapparats 7 : Lernen ist nach diesem konstruktivistischen Ansatz nicht das allmähliche Füllen eines leeren Eimers, Erwerb, Speicherung und Verarbeitung von Wissen erfolgt nicht in linearen Strukturen, sondern Lernen ist ein aktiver Prozess, bei dem der Lernende verschiedene Perspektiven einnimmt, Informationseinheiten in Beziehung und Konkurrenz zu anderen setzt und den Lernprozess reflektiert. Kriterium für den Lernerfolg ist demnach das Ausmaß, in dem es gelingt, neue Informatio- 6 Zur Evaluation von Hypertext-Anwendungen: Glowalla/ Schoop (Hg.) (1992); Thome (1991), Kuhlen (1991, S. 203-212), Hammwöhner (1993), Hasebrook (1995), Fricke (1995), Glowalla/ Häfele (1995). 7 Kritisch beleuchtet wird die These der kognitiven Plausibilität etwa bei Hammwöhner (1993) und Kuhlen (1991, S. 182). <?page no="87"?> Konversion und Konzeption: zur simultanen Produktion von Buch und Hypertext 87 nen in Form von Wissensknoten sukzessive in die schon bestehende netzartige Wissensstruktur im Gehirn einzubinden. 8 Auch im Zusammenhang mit dem Aspekt der Multimedialität wird unter Berufung auf Paivios Modell der „doppelten Enkodierung“ (Paivio 1986) in der Regel eine lernfördernde Wirkung von Hypermedia postuliert. Demnach spreche die doppelte Kodierung einer Information durch Text und Bild zwei verschiedene Gedächtnisbereiche an und führe deshalb auch zu einer besseren Behaltensleistung. Empirische Erhebungen ergeben allerdings keine generelle eindeutige Überlegenheit von nicht-linearer multimedialer Informationsvermittlung gegenüber traditionellen Formen des Lernens. Paivios Theorie blieb nicht unwidersprochen und naive Pro-Multimedia-Argumente wurden mittlerweise in mehreren Studien korrigiert. Weidenmann (1995) etwa weist in Untersuchungen zum Bildverstehen nach, dass didaktisch „gute“ Bilder keineswegs die z.B. in digitalem Video beliebten realistischen Bilder sind, sondern gezielt aufbereitete Stilisierungen von Realität. Multicodierung ist nach Weidenmann nicht per se lernfördemd, aber bei gezieltem Einsatz kann sie die Auseinandersetzung des Lernenden mit dem Lerngegenstand optimieren. Auch Hasebrook (1995) zeigt, dass die Annahme, allein aufgrund der äußeren Form könne auf die Wirksamkeit eines Mediums geschlossen werden, naiv und zu kurz gegriffen ist, vielmehr müssten eine Vielzahl von Umgebungs- und Lerner-Einflüssen wie Lernmotivation und -ziele, Vorwissen 9 und Lernstrategien sowie Informationseinbettung berücksichtigt werden. Auch Art und Inhalt der verwendeten Medien sowie deren spezifische Kombination sind als Faktoren anzusetzen. Für Hypertexte ist schließlich die Gestaltung des Hypertextdokuments selbst relevant: Umfang, 10 Organisationsgrad, Grad der Hierarchisierung, Art der Vernetzungen 11 (assoziativ oder typisiert), Art und 8 Netzwerkmodelle finden sich in vielfältigen Repräsentationen in den verschiedensten Disziplinen. In der KI sind sie in der Form der „semantischen Netze“ bekannt. Es gibt sie als topologisch gegliederte und strukturierte Räume in der antiken Mnemotechnik und in der neueren Fremdsprachendidaktik in der Form der „mind maps“, „Assoziogramme“ etc. Netzwerkmodelle unterscheiden sich vor allem darin, ob die Verbindungslinien zwischen den einzelnen Knoten kategorisiert sind oder ob es sich um rein assoziative und sequentielle Verbindungen handelt. 9 Schnotz (1987) kommt in einer empirischen Fallstudie zu dem Ergebnis, dass Lerner mit geringeren Voraussetzungen durch starre Vorgaben und lineare Präsentation von Information aus den präsentierten Details ein ausreichendes mentales Modell aufbauen können, was ihnen bei diskontinuierlichen Texten nicht mehr gelingt. Lerner mit höheren Voraussetzungen dagegen können aus kontinuierlicher Präsentation von Detailwissen ein starkes mentales Modell, aus diskontinuierlicher Präsentation nurmehr ein schwaches mentales Modell aufbauen. 10 Offensichtlich fuhren Hypertextversionen von sehr kurzen Texten (bis zu 100 Wörtern) zu schlechteren Behaltensleistungen als die Printtextversionen (vgl. Kuhlen 1991, S. 195). 11 Ein häufiger Kritikpunkt von Probanden in Vergleichstests ist die fehlende Einsicht in die semantische Natur einer rein assoziativen oder sequentiellen, nicht typisierten Verknüpfung, „what was behind the door“ (Kuhlen 1991, S. 205). <?page no="88"?> 88 Eva Breindl Umfang der Strukturhilfen, Navigationsangebote, Gestaltung der Benutzeroberfläche. Darüber hinaus legen Erfahrungsberichte und Fallstudien die Vermutung nahe, dass in der Auswertung zwischen Behaltensleistung und Problemlösung, zwischen der Vermittlung von Strukturwissen und Faktenwissen, zwischen Überblick und Detailwissen erhebliche Unterschiede bestehen, 12 und Multimedia-Lernsysteme nicht für alle Aufgaben und jede Art von Wissen traditionellen Lehrmethoden überlegen sind. Den Bedingungen individueller Lernprozesse scheinen Hypertexte mit ihrer Flexibilität aber aufjeden Fall entgegenzukommen. Lernen ist ein hochgradig individueller Prozess, der durch Faktoren wie individueller Lerntyp, bevorzugte Lemstrategien, Lernmotivation und -ziel, Vorwissen, Einbettung des Lernens in situative Zusammenhänge wie Curricula oder Prüfungsordnungen bis hin zur Tagesverfassung des Lernenden determiniert wird. Entsprechend positiv wird in Fallstudien zu Hypertext-Lernsystemen denn auch von Probanden immer angegeben, dass sich mit dem System das eigene Lerntempo, die Portionierung des Lempensums, die Reihenfolge der Einheiten und die Zahl der Wiederholungen sowie die Detaillierungstiefe anders als im Unterricht (insbesondere in der starren Form des Frontalunterrichts) individuell bestimmen lassen. Lernsysteme auf Hypertextbasis unterstützen damit wesentliche, in den neueren handlungsorientierten Lerntheorien 13 als lernfördernd herausgestellte Strategien wie „learning by doing“, explorierendes Lernen, und da sie durch ihre Lernerzentrierung generell die Eigenverantwortlichkeit für den eigenen Lernerfolg stärken, sind sie auch motivationsfördemd. 5. Das Handbuch der deutschen Konnektoren als Hypertext: Mehrwert für den Autor? Aus der Sicht des Lesers bietet der flexible Hypertext sicherlich Vorzüge. Wie aber steht es für den Autor? Aus seiner Sicht ist eine Hypertext-Anwendung dann von Vorteil, wenn bei optimaler Qualität des Produkts die Exteriorisierung seines Wissens schneller und effektiver erfolgen kann. 12 Glowalla/ Schoop (1992) kommen auf der Basis einer vergleichenden Untersuchung an Studenten zu dem Ergebnis, dass die Vermittlung von Faktenwissen und elaborierende Aufgaben durch Lemsysteme eher unterstützt werden als die Vermittlung von Strukturwissen und Problemlösungsaufgaben. 13 Hypertext-Lernsysteme fugen sich damit wunderbar in den Paradigmenwechsel im pädagogischen Diskurs weg vom Instruktionsmodell zu einer „Wiederentdeckung des Lernens“. <?page no="89"?> Konversion und Konzeption: zur simultanen Produktion von Buch und Hypertext 89 Nun ist in aller Regel und ungeachtet individuell verschiedener Schreibstile 14 das Schreiben in der Wissenschaft alles andere als ein linearer Prozessablauf. Die „klassischen“ Phasen der inventio, dispositio und elocutio darf man sich nicht als getrennte, hintereinandergeschaltete abgeschlossene Blöcke im Produktionsprozess vorstellen. Schreiben geschieht in Produktionsschleifen, es ist ein rekursiver Prozess, gekennzeichnet durch „stetiges Ineinandergreifen von Planungs- Produktons- Lese- und Evaluationsprozessen“ (Molitor-Lübbert 1984, S.l), durch „konstantes Monitoring“ (van Berkel 1995), durch Aufbau, Umstrukturierung, Neuanordnung, durch wiederholten Rückgriff auf externe Wissensspeicher, deren Reproduktion, Reformulierung und Integration (vgl. Jakobs 1995). Eine Rolle spielen dabei natürlich auch disziplinspezifische Faktoren. Grammatikographie lebt vom Ineinandergreifen der Detailarbeit am Datenmaterial (Daten sammeln, bewerten, sortieren, einordnen in Begründungs- und Argumentationszusammenhänge), der Präsentation der Daten und dem Aufbau von Argumentationsketten, der Berücksichtigung von grammatischen und lexikographischen Arbeiten und deren Auswertung und Einarbeitung, der Ausgliederung und Untergliederung von Gegenständen, der Inbeziehungsetzung verschiedener Phänomene und verschiedener Perspektiven auf einen Gegenstand. Hypertexte reagieren auf einen solchen stetigen Wechsel von Produktionsphasen sehr viel flexibler als das zur reinen Linearität zwingende Medium der mittlerweile fast durchgängig eingesetzten - Textverarbeitung oder der Schreibmaschine. Eher noch wird der Produktionsprozess unterstützt durch individuelle Mixturen bewährter traditioneller „Medien“ und Hilfsmittel wie Papier und Bleistift, Zettelkasten, Mehrfarbigkeit, Strukturgraphiken, Verbindungslinien und -pfeile, oder Erstellung großzügiger Makrostrukturen, die z.B. durch Anheften von Zetteln um Detailinformation bereichert werden. Setzt man Hypertexte als Produktions- und Planungsinstrumente ein, 15 können sie die Individualität des Schreibers beim Produktionsprozess unterstützen. Das von uns verwendete Hypertextsystem erlaubt es z.B., Strukturskelette zu erstellen aus rubrizierten aber leeren Knoten d.h. zuerst die textuelle Makrostruktur aufzubauen -, Verknüpfungen zwischen Begriffen und Konzepten 14 Zu schreiberspezifischen Faktoren und zu individuellen Schreibstilen vgl. Jakobs (1995, S. 100). Man unterscheidet etwa bottom-up-Typen - Schreiber, die im Verlauf des Schreibens Problemlösungen entwickeln von top-down-Typen - Schreiber, die Problemlösung und Textplanung bereits vor dem Formulierungsprozess weitgehend mental abschließen, - oder auch broadth-first- und depth-first-Strategien. 15 Zum Nutzen von Hypertexten aus der Sicht des Autors vgl. Hannemann/ Thüring (1993) und van Berkel (1995) für Texte mit weitgehend standardisiertem Aufbau. „Hypertext, even in a simple form, can be used as an (sic! ) useful tool in the writing process. It enables explicit monitoring of planning strategies without being too rigid, but it can also be used to enforce writers to use a standardized framework for editorial reasons that facilitates the production of scientific or educational texts.“ (van Berkel 1995, S. 177) <?page no="90"?> 90 Eva Breindl herzustellen, einzelne Knoten auszuarbeiten und sukzessive zu detaillieren und alles ganz nach Gusto in jeder beliebigen Phase des Produktionsprozesses. Aber nicht nur der Produktionsprozess, sondern auch die Struktur des Produkts selbst ist nicht-linear und mehrdimensional. Eine hierarchische logische Struktur mit vielfach vernetzten Digressionen, Einschüben, Exkursen zu Sonderfällen, Querverweisen, Literaturverweisen, Anhängen, Illustrationen, Literaturangaben, mit alternativen Angängen, die gegeneinander abgewogen werden, wird durch die lineare Norm der Schriftkultur in ein Korsett der Eindimensionalität und sequentiellen Anordnung gepresst, das nicht mehr für den Benutzer transparent ist. Die konventionalisierte Gestalt wissenschaftlicher Texte lässt für die strukturelle Mehrdimensionalität des Inhalts wenig gestalterischen Spielraum: allenfalls Fußnoten oder Zwischenüberschriften sowie verschiedene Schriftgrößen oder -typen verdeutlichen an der Textoberfläche die inhaltliche Strukturierung. Verweisen und Fußnoten hin-und-her-blätternd zu folgen, ohne den Verlauf des Haupttexts aus den Augen zu verlieren, kann für den Leser eine Rezeptionserschwemis darstellen. Andere Textsorten sind von vornherein auch in der Gestalt stärker an der inhaltlichen Mehrdimensionalität orientiert. 16 Schließlich erfolgt auch die Rezeption eines grammatischen Handbuchs kaum je linear „total“ von vorn nach hinten (allenfalls durch Rezensenten): Solche Texte werden selegierend, kreuz und quer, kursorisch gelesen oder durchstöbert, je nach den in Abschnitt zwei beschriebenen individuellen Benutzerbedürfnissen und den Benutzungssituationen. Die Architektur eines Hypertext-Systems stellt folglich für die Produktion eines grammatischen Handbuchs ein geradezu ideales Autorenwerkzeug dar. Nun fehlen allerdings genauso wie rezeptionsseitig auch für die Textproduktion vergleichende empirische Untersuchungen zu den Vor- und Nachtei- 16 Darauf, dass Hypertexte an durchaus Bekanntes anknüpfen, wurde vielfach hingewiesen. Vielzitiertes Beispiel für eine hypertextartige Struktur ist im Bereich der Literatur „Zettels Traum“ von Arno Schmidt. Comenius nutzt in seinem lateinisch-deutschen Bildwörterbuch „Orbis sensualium pictus“ die Korrespondenz von Bild und Text zur Darstellung der „Beziehung der Sachen untereinander und zu den Menschen“ (nach Fendt 1993, S. 45). Zu Vorläufern von graphischen Benutzeroberflächen in mittelalterlichen Bilderwelten s. Clausberg (1994). Ehlen (1992) beschreibt die Bibel als Hypertext- Struktur mit Verknüpfungen von Altem und Neuem Testament, vielfältigen internen und externen Textbezügen und einem Nebeneinander verschiedener Textfassungen. Die Studienbibel für PC benutzt die Hypertexttechnik, um die netzartige Struktur des ursprünglichen Texts wieder sichtbar zu machen, Bezüge zu explizieren und in Kontexte einzubinden, so dass auch verderbte Stellen gereinigt und auf das ursprünglich Geglaubte zurückgeführt werden können. Viele „referentielle“ Gebrauchstextsorten weisen von vornherein weniger lineare Strukturen auf und sind auch nicht für lineare Rezeption ausgerichtet (Kochbücher, Lexika, Handbücher). <?page no="91"?> Konversion und Konzeption: zur simultanen Produktion von Buch und Hypertext 91 len von linearem und nicht-linearem Schreiben. Letztendlich ist die direkte Textproduktion in Hypertext-Strukturen auch eine von jedem Autor experimentierend neu zu erlernende Technik, bei der sich die Gewohnheiten des als Kulturtechnik beherrschten und individuell verfeinerten linearen Schreibens bisweilen als eher hinderlich erweisen. Bei der konkreten Erprobung der direkten Hypertext-Produktion im Fall des HdK erwies sich schließlich die von Schmitz (1995) vorgeschlagene Verknüpfung von verschiedenen Arbeitsphasen, Schreibinstrumenten und linearen wie nicht-linearen Denk- und Darstellungsweisen als der geeignetste Weg. Ein fast größeres Augenmerk noch als im Falle des linearen Schreibens mit Computer oder Schreibmaschine lag bei einem Text des Umfangs vom HdK darauf, die Fragmentierung von Wissenseinheiten zu verhindern und relevante Kontexte über der auch technisch aufwendigen Ausarbeitung der einzelnen Informationsknoten nicht aus den Augen zu verlieren. Den organisierenden Seiten mit der Abbildung der textuellen Makrostruktur kommt dabei auch für den Autor ein besonderes Gewicht zu. Die Reduktion des Formats auf einheitliche Bildschirmgröße für alle Seiten erwies sich aus Autorensicht als zu unflexibel und musste, gerade für argumentative Passagen, zugunsten rollender Seiten erweitert werden. Als sehr viel problematischer erwies sich demgegenüber die Konversion eines vorliegenden linearen Texts in die Struktur eines Hypertext-Dokuments. Einerseits darf das Ziel der Konversion nicht die Imitation des Ausgangstexts sein, sondern eine „mehrwerterzeugende Konversion“ (Kuhlen 1991), die sich die spezifischen Gegebenheiten des Mediums zu Nutze macht, andererseits darf natürlich der Inhalt des Ausgangstexts durch die Konversion nicht verfälscht werden. Nun sind die zu konvertierenden Texte im Falle des HdK wie oben beschrieben nicht-linear geplante, mehrdimensionale Strukturen, die vom Autor aufgrund der medialen Zwänge ins Prokrustesbett der Linearität gezwängt worden sind. Der konvertierende Autor muss sie nun daraus wieder befreien und auf eine dem Thema, der Zielsetzung und den anvisierten Zielgruppen gerecht werdende Mehrdimensionalität hinführen. Das muss nicht unbedingt die vom Autor des Ausgangstexts in einem Planungsstadium zugrunde gelegte mehrdimensionale Struktur sein, sondern der Text wird in der Regel bei der Konversion restrukturiert. Leitendes Prinzip ist dabei die konsequente Berücksichtigung der Mehrfächadressierung. Im Falle des HdK orientierten wir uns für diesen Zweck an den vorweg analysierten und in der Umfrage überprüften unterschiedlichen Benutzungssituationen. Folgende Stufen und Verfahren von Hypertext-Konversion wurden angewendet: 1. Die Mehrdimensionaliät des linearen Texts musste vom Hypertext-Autor „herauspräpariert“ werden wie ein Skelett vom Pathologen. Digredierende Passagen mussten erkannt und klassifiziert werden, so dass sie für die hypertextspezifische technische Umsetzung zur Verfügung standen. Hypertext-Konversion ist aber natürlich keine Leichenfledderei, sondern der Autor muss zuallererst einmal in einem hermeneutischen Prozess zu einem <?page no="92"?> 92 Eva Breindl Verständnis des Texts gelangen, das in unserem Fall im Zweifel durch Rücksprache mit den Autoren des Ausgangstexts überprüft und gesichert werden konnte. 2. Textorganisierende Teile („Strukturteile“) wie Inhaltsverzeichnisse, Register, Indizes mussten von inhaltlichen Einheiten getrennt und die Eignung dieser Strukturteile für das Medium Hypertext überprüft werden. Erwiesen sich diese als nicht geeignet oder nicht ausreichend, wurden andere oder weitere hinzugefugt. In unserem Fall wurde z.B. das Inhaltsverzeichnis enthierarchisiert, da die sehr feine Differenzierung des Ausgangstexts (bis zur 6. Dezimalstelle) in der Hypertextstruktur die Orientierung erschweren würde. Andererseits wurden auch Überblicks-Seiten hinzugefugt, die ein im Ausgangstext rein sequentiell organisiertes umfangreicheres Unterkapitel, das im Hypertext in mehrere kohäsiv geschlossene Knoten in Bildschirmformat aufgespalten wurde, inhaltlich aufgliedem. Als strukturierende Teile wurden kurze Inhaltszusammenfassungen in Fenstertechnik zu den „Kapitelüberschriften“ eingeblendet, die auch die Funktion der Anbindung an konkurrierende Klassifikationen und Terminologien haben. Was im Ausgangstext als Anhang konzipiert war, musste in andere Komponenten überfuhrt werden: die geplante merkmalindizierte Liste der Konnektoren wird im Hypertext als Lexikon angelegt, die Funktion des Stichwortregisters übernimmt die „Grammatikexpertin“ mit ihrem Glossar. Der Inhalt von Fußnoten wurde entweder dem vertiefenden Lesestrang zugeordnet oder nach dem Prinizip der gestaffelten Detaillierung in ein vom Benutzer optional einblendbares Fenster eingefugt. 3. Um die charakteristische Multimedialität des Hypertexts sinnvoll zu nutzen, musste entschieden werden, welche Informationen über welches Medium am effektivsten zu vermitteln waren, und der richtige „Medienmix“ musste bestimmt werden. Die durch Segmentierung des Ausgangstexts gewonnenen Informationseinheiten mussten hinsichtlich ihres informationeilen Stellenwerts bewertet und je einem in dieser Hinsicht graphisch einheitlich gestalteten Hintergrund zugewiesen werden. Gestaffelte Detaillierungen des zu konvertierenden Texts mussten aufgefunden werden und die informationeile Hierarchie wurde durch unterschiedliche Hintergründe und einblendbare Fenster graphisch kodiert. An vielen Stellen wurde der laufende Text des Ursprungstexts in graphische Darstellungen 17 übersetzt: Strukturbäume 17 Erschwerend kommt hinzu, dass die Ausgangs-Typoskripte für die Konversion mit einem verhältnismäßig unkomfortablen Textverarbeitungsprogramm erstellt sind, das beispielsweise nicht die Einbindung von Graphiken erlaubt, das für die Darstellung von Strukturbäumen höchst unhandlich ist, das Diagramme und Tabellen für den Autor nur unter erheblichem Zeitaufwand erstellen lässt, das Abwechslung in der Formatierung oder die Fußnotenverwaltung eher behindert als fördert, und last but not least all diese layouterischen Zusätze bei der vor der Drucklegung nötigen Konversion in ein anderes <?page no="93"?> Konversion und Konzeption: zur simultanen Produktion von Buch und Hypertext 93 zur Beschreibung der syntaktischen Strukturen der verschiedenen Typen von Konnexionen, Beispiel-Schemata zur Einführung neuer Terminologie, Merkmalsmatrizen oder Tabellen zur Untergliederung des Gegenstandsbereichs und zur Veranschaulichung von Übergangsklassen. Geplant ist auch eine Einbindung des Mediums Ton: Angaben zu intonatorischen Eigenschaften von Konnektoren und Konnexionen sollen durch authentische Beispiele gesprochener Sprache unterstützt werden, die von den einzelnen Lexikon- und Fundgrubeneinträgen abrufbar sind. 4. Es musste entschieden werden, welche Information in welchem Modul der Hypertext-Version des HdK am geeignetsten zu präsentieren war, und ob und wie gegebenenfalls Informationen an mehreren Stellen angeboten werden sollten. So wurden manche Detailinformationen zu einzelnen Konnektoren aus dem „eigentlichen“ Handbuch in das Lexikonmodul ausgeklammert, authentische Belege mit Quellenangabe gingen großteils in die „Fundgrube“ ein und wurden im Handbuch bzw. im Lexikon aus (fremdsprachen-)didaktischen Gründen durch lexikalisch verschlankte und nicht notwendig belegte einfache Beispiele ersetzt. Schließlich musste grundsätzlich der gesamte Ausgangstext dahingehend geprüft werden, ob er Informationen enthielt, die besser aus dem Hauptlesestrang ausgeklammert und in den vertiefenden Lesestrang eingebaut würden. Im positiven Fall musste im Hauptlesestrang der Verzweigungsort bestimmt werden und eine inhaltlich spezifizierte Verknüpfüng zum vertiefenden Lesestrang hergestellt werden. 5. Ganz generell aber musste der vorliegende Text segmentiert, die einzelnen Segmente mussten rubriziert, neu miteinander verknüpft und die Art der Verknüpfüngen musste spezifiziert werden. Das bedeutet auch, dass die spezifischen Kohäsionsmittel des linearen Texts wie Pronomina, Anaphern und Kataphern im Hypertext nicht über einen Informationsknoten hinaus verweisen können und sie entweder ganz wegfallen müssen oder an ihre Stelle hypertextspezifische „links“ treten müssen, so dass jeder Knoten „kohäsiv geschlossen“ ist. Für diese Segmentierung und Restrukturierung bietet natürlich die formale Einteilung des Ausgangstexts in Kapitel, Unterkapitel, Abschnitte und Absätze eine Orientierung; der Hypertext kann sich aber keineswegs in einer Ll-Abbildung daran anlehnen, schon allein aufgrund des unterschiedlichen Umfangs von Text-Abschnitten gegenüber dem einheitlichen Bildschirmformat in den Seiten des Hauptlesestrangs. Eine Neustrukturierung erfordert aber in jedem Fall eine gründliche Inhaltsanalyse des gesamten Texts, damit inhaltlich zusammengehörige Passagen, die im Ausgangstext oft aus formalen Gründen nicht sequentiell angeordnet sind, im Hypertext durch Verknüpfüngen wieder zusammenge- Dateiformat wieder miniert, so dass in der Praxis von den Autoren textuell ausformuliert wird, was sich graphisch anschaulicher darstellen ließe. <?page no="94"?> 94 Eva Breindl fuhrt werden können. Das machte an vielen Stellen ein Umschreiben des Texts erforderlich. Da die zugrundeliegenden Ausgangstexte aus der Feder mehrerer Autoren stammen, die getrennte Teilbereiche eines gemeinsamen Gegenstands bearbeiten, so dass also immer wieder auf ein gemeinsames inhaltliches Konzept zurückgegriffen werden muss, wurden die Texte vor der Konversion auch auf Konsistenz geprüft. Die Hypertext-Konversion erwies sich hier ganz nebenbei auch als brauchbares Korrektiv beim Aufspüren von Überschneidungen, Redundanzen, konzeptuellen oder terminologischen Inkonsistenzen, wie sie bei kollaborativer Textproduktion von umfangreichen Texten fast zwangsläufig auftreten. Auf der anderen Seite kann eben diese Situation sich auch auf die Entwicklungsdauer des Hypertexts nachteilig auswirken, indem nachträgliche Korrekturen des zugrundeliegenden Texts wiederum Änderungen im Hypertext-Dokument nach sich ziehen, die unter Umständen sehr einschneidend sein können. Um eine Inflation von Korrekturzyklen zu verhindern, erwiesen sich Phasenabläufe als zweckmäßig, die a) durch ein Hintereinander von Konvertieren und (Re-)konzeptionieren bei der Umsetzung des Ausgangstexts und b) durch ein Ineinandergreifen von top-down- und bottom-up-Prozessen bei der Hypertextproduktion gekennzeichnet sind. 1. Die Konzeption der modularen Struktur des Hypertext-Dokuments sollte gegenüber der Linearversion so weit zeitversetzt sein, dass Gegenstand, Zielsetzung, Adressierung, theoretisches Konzept und zumindest eine Grobstruktur des Inhaltsverzeichnisses vorliegen. (Das war im Falle des HdK sowohl durch die Vorgaben des GRAMMIS-Projekts, als auch durch die zweijährige Vorlaufzeit des HdK-Projekts gegeben.) 2. Nach der Festlegung der Module und ihrer Vernetzung wurden zweckdienliche graphische Benutzeroberflächen entworfen und zugewiesen. Die hierarchische Grobstruktur des Kerndokuments wurde auf organisierenden Seiten des Hypertexts festgehalten. 3. Bevor einzelne Kapitel des Ausgangstexts für den Hypertext erarbeitet werden, sollten sie nach Möglichkeit in der Projektgruppe und in den vorgesehenen Korrekturgremien inhaltlich verabschiedet sein. Hierarchieniedrige Unterkapitel können dann kategorisiert, segmentiert und gegebenenfalls umformuliert, die einzelnen Segmente kategorisiert und miteinander verknüpft werden. Das Hypertext-Dokument wird auf diese Weise „von unten“ aufgebaut. Die Festlegung einer „mittleren“ Hierarchieebene, in der Unterkapitel miteinander und mit anderen Moduln verknüpft werden, bleibt damit für eine spätere Produktionsphase reserviert, in der größere Einheiten des Ausgangstexts weitgehend abgeschlossen und überblickbar sind. <?page no="95"?> Konversion und Konzeption: zur simultanen Produktion von Buch und Hypertext 95 Gerade auf dieser Ebene bieten sich dann oft Verknüpfungen an, die die Linearversion allenfalls andeuten, aber nicht realisieren kann. (Im konkreten Fall etwa eine konsequente Verknüpfung zwischen syntaktischen bzw. semantischen Konnektorenklassen mit den an der Herausbildung dieser Klassen beteiligten syntaktischen und semantischen Verfahren.) Korrekturen auf dieser Ebene in der Linearversion etwa aufwendige Auflösungen, Neuzuordnungen oder Umstellungen größerer Blöcke -, sind dann im Hypertext auch ohne großen Aufwand möglich. 6. Schlussfolgerungen Es sollte deutlich geworden sein, dass die Hypertext-Konversion eines grammatischen Handbuchs von ständigen individuellen Entscheidungsprozessen begleitet ist, die eine automatische oder auch nur halbautomatische Text-Konversion völlig unmöglich machen. Vermutlich gilt dies für den größten Teil deijenigen Textsorten, die eine nicht gänzlich standardisierte textuelle Makrostruktur aufweisen. Für Texte von der Komplexität des HdK kommt eine textbewahrende reine Konversion, bei der lediglich der Ausgangstext in Form einer HTML-Datei abgespeichert und mit ein paar zusätzlichen Links versehen wird, nicht in Frage, da auf diese Weise der notwendig eintretende Orientierungsverlust beim Leser jede potentielle Überlegenheit des Hypertext- Mediums über das Buchmedium zunichte macht und ins Gegenteil verkehrt; auch reine Segmentierung mit Kategorisierung der segmentierten Einheiten ohne Eingriffe in die Textgestalt erbringt keinen entscheidenden Mehrwert; auch in diesem Fall wäre für den Leser Kohärenz nur schwer herstellbar. Ohne Reanalyse und Reformulierung des Ausgangstexts war es beim HdK nicht möglich, den Gestaltungsspielraum des Mediums in einer für den Leser gewinnbringenden Weise auszuschöpfen. Der Nutzen für den Leser verhält sich damit aber natürlich umgekehrt proportional zum Aufwand für den konvertierenden Autor. Aus der Sicht des Lesers ist ein grammatisches Handbuch in der Form des Hypertexts sicher wünschenswert, aus der Sicht des Autors ist das Medium in Form eines schreibunterstützenden Planungs- und Konzeptionsinstruments arbeitserleichternd und arbeitseffektivierend, als Ziel einer Textkonversion ein höchst aufwendiges und im Grunde „umwegiges“ Verfahren. Da aber derzeit nach wie vor das traditionelle Medium auch im Falle eines grammatischen Handbuchs seine Berechtigung hat, 18 sollte die Blickrichtung 18 An dieser Stelle könnte die umgekehrte Frage auftreten; was rechtfertigt dann das traditionelle Medium, wenn die Hypertext-Version angeblich so viele Vorzüge hat? Darauf gibt es natürlich viele Antworten auf vielen Ebenen, von der mangelnden sinnlichen Qualität des Computers über die zeitraubenden Tücken und die hohen Kosten der Tech- <?page no="96"?> 96 Eva Breindl der Hypertext-Forschung im Kontext des wissenschaftlichen Schreibens gerade auch die umgekehrte sein: Texte könnten in diesem Kontext direkt als Hypertexte konzipiert und möglichst weit ausgearbeitet werden, - und zwar in einer Form, die neben der Ausarbeitung als „reicher“ Hypertext auch eine unaufwendige Weiterverarbeitung zur Linearform erlaubt, d.h. nicht nur Verfahren der Konversion von linearem Text in Hypertext sollten Gegenstand des Interesses sein, sondern auch Verfahren der Konversion von Hypertext in linearen Text, wo das traditionelle Medium angebrachter ist. Ein paralleles Desiderat sind empirische Studien zum Rezeptionsverhalten bei Benutzern umfangreicher wissenschaftlicher Hypertext-Dokumente, die eine Antwort auf die Frage ermöglichen, wer was unter welchen Bedingungen in welcher Form „liest“. Nur so wird der aufwendige Einsatz multimedialer Informations- und Lern-Systeme in der Wissenschaft für Autoren und Leser auch wirklich einen Fortschritt darstellen. 7. Literatur Berkel, Arrie van (1995): Hypertext as a tool for planning in the writing process. In: Jakobs/ Knorr/ Molitor-Lübbert (Hg.), S. 169-177. Brauße, Ursula (1997): Konnektoren im Wörterbuch: Konjunktionen, Adverbien, Partikeln. In: Konerding, Klaus-Peter/ Lehr, Andrea (Hg ): Linguistische Theorie und lexikographische Praxis (= Lexikographica. Series Maior). Tübingen. Clausberg, Karl (1994): Gummiband und Gummilinse: Mittelalterliche Vorbilder für graphische Benutzungsoberflächen. In: Zeitschrift für Semiotik, 16/ 1-2, S. 5-9. Ehlen, Hanns-Johannes (1992): Die Bibel als Hypertext. In: Glowalla/ Schoop (Hg.), S. 268- 275. Fendt, Günther (1993): Hypertext und Medienintegration - Ansätze zum Gebrauch moderner Medien beim Lernen fremder Sprachen. In: Ickler, Theodor (Hg ): Deutsch als Fremdsprache (= Germanistische Linguistik). Hildesheim. S. 45-72. Fricke, Reiner (1995): Evaluation von Multimedia. In: Issing/ Klimsa (Hg ), S. 401-413. Glowalla, Ulrich/ Häfele, Gudrun (1995): Einsatz elektronischer Medien: Befunde, Probleme und Perspektiven. In: Issing/ Klimsa (Hg ), S. 415-434. Glowalla, Ulrich/ Schoop, Eric (Hg.) (1992): Hypertext und Multimedia. Neue Wege in der computergestützten Aus- und Weiterbildung. Berlin u.a. nik bis hin zu den geringen „Halbwertszeiten“ von Hardware- und Software-Systemen, die bei der langen Entwicklungszeit von wissenschaftlichen Texten tatsächlich ein ernster Störfaktor sind. De facto wird heute über die lineare Buchversion nach wie vor eine zahlreichere Leserschaft erreicht als über Hypertext-Systeme. Erfahrungsgemäß werden die meisten Leser auch bestimmte Passagen (z.B. diskursive, argumentative, aufeinander aufbauende) lieber in der gewohnten schriftlichen Form überblicken wollen, - und das Papier eignet sich hierfür besser als Bildschirm-Scrollen. <?page no="97"?> Konversion und Konzeption: zur simultanen Produktion von Buch und Hypertext 97 Glowalla, Ulrich/ Schoop, Eric (1992): Entwicklung und Evaluation computerunterstützter Lehrsysteme. In: Dies. (Hg.), S. 21-36. Hahn, Martin/ Künzel, Sebastian/ Wazel, Gerhard (1996): Multimedia eine neue Herausforderung für den Fremdsprachenunterricht. Frankfurt a.M. Hammwöhner, Rainer (1993): Kognitive Plausibilität: Vom Netz im (Hyper-)Text zum Netz im Kopf. In: Nachrichten für Dokumentation, 44, S. 23-28 Hannemann, Jörg/ Thüring, Manfred (1993): Schreiben als Designproblem: kognitive Grundlagen einer Hypertext-Autorenumgebung. In: Kognitionswissenschaft, 3, S. 139- 160. Harden, Theo/ Marsh, Cliona (Hg.) (1993): Wieviel Grammatik braucht der Mensch? München. Hasebrook, Joachim P. (1995): Lernen mit Multimedia In: Zeitschrift für Pädagogische Psychologie, 9/ 2, S. 95-103. Helbig, Gerhard (1993): Wieviel Grammatik braucht der Mensch? In: Harden/ Marsh (Hg ), S. 19-29. Hoffmann, Ludger (1992): Textoptimierung am Beispiel „Grammatik“: Ein Blick aus der Werkstatt. In: Antos, Gerd/ Augst, Gerhard (Hg ): Textoptimierung. Das Verständlichermachen von Texten als linguistisches, psychologisches und praktisches Problem. Frankfurt a.M. u.a. S. 52-69. Issing, Ludwig J./ Klimsa, Paul (Hg.) (1995): Information und Lernen mit Multimedia. Weinheim. Jakobs, Eva-Maria (1995): Text und Quelle. Wissenschaftliche Textproduktion unter dem Aspekt der Nutzung externer Wissensspeicher. In: Jakobs/ Knorr/ Molitor-Lübbert (Hg ), S. 91-112. Jakobs, Eva-Maria/ Knorr, Dagmar/ Molitor-Lübbert, Sylvie (Hg.) (1995): Wissenschaftliche Textproduktion mit und ohne Computer. Frankfurt a.M. u.a. Kempcke, Günter/ Pasch, Renate (ersch. demn ): Die Konjunktionen in Langenscheidts Großwörterbuch Deutsch als Fremdsprache. In: Wiegand, Herbert Ernst (Hg ): Perspektiven der pädagogischen Lexikographie des Deutschen. Untersuchungen anhand von Langenscheidts Großwörterbuch Deutsch als Fremdsprache (= Lexikographica. Series Maior). Tübingen. Kuhlen, Rainer (1991): Hypertext. Ein nicht-lineares Medium zwischen Buch und Wissensbank. Berlin u.a. Lang, Ewald (1988): Syntax und Semantik der Adversativkonnektive. MS. Molitor-Lübbert, Sylvie (1984): Kognitive Prozesse beim Schreiben. Tübingen. Paivio, Allan (1986): Mental representations. A dual-coding approach. New York/ Oxford. Schmitz, Ulrich (1995): Geistiges Sammelsurium in technischer Perfektion. In: Jakobs/ Knorr/ Molitor-Lübbert (Hg.), S 149-168. Schnotz, Wolfgang (1987): Mentale Kohärenzbildung beim Textverstehen: Einflüsse der Textsequenzierung auf die Verstehensstrategien und die subjektiven Verstehenskriterien. Univ. Tübingen, Deutsches Institut für Fernstudien. Forschungsber. 42. Schoop, Eric/ Glowalla, Ulrich (1992): Computer in der Aus- und Weiterbildung: Potentiale, Probleme und Perspektiven. In: Glowalla/ Schoop (Hg), S. 4-20. <?page no="98"?> 98 Eva Breindl Storrer, Angelika (1995): Die Grammatik mit der Maus. Konzeption eines multimedialen Informationssystems zur deutschen Grammatik. In: Hitzenberger, Ludwig (Hg ): Angewandte Computerlinguistik. Vorträge im Rahmen der Jahrestagung 1995 der Gesellschaft für Linguistische Datenverarbeitung (gldv) e.V. Regensburg, 30.-31.3.1995. Hildesheim u.a. S. 291-303. Storrer, Angelika (1997): Grammatikographie mit Neuen Medien: Erfahrungen beim Aufbau eines Informationssystems zur deutschen Grammatik. Ersch. in: LiLi Thome, Dorothea (1992): Lernsoftware für den Deutschunterricht. Welche Problembereiche gilt es zu beachten? In: Diskussion Deutsch, 23/ 128, S. 551-561. Thome, Rainer (1991): Hypermedia - Lehrer Lämpels Nachfolger? In: Wirtschaftsinformatik, 33/ 3, S. 207-212. Weidenmann, Bernd (1995): Multicodierung und Multimodalität im Lernprozeß. In: Issing/ Klimsa (Hg ), S. 65-84. Weydt, Harald (1993): Was soll der Lerner von der Grammatik wissen? In: Harden/ Marsh (Hg ), S. 119-137. Zifonun, Gisela/ Hoffmann, Ludger/ Strecker, Bruno (1997): Grammatik der deutschen Sprache. Berlin/ New York. <?page no="99"?> Anya Elis / Heinz Josef Weber Dependenzgrammatik. Ein Interaktives Arbeitsbuch: Zur Konversion eines Lehrbuchs in ein Hypertext-System 1. Einleitung Der Beitrag verfolgt den Weg von einem sprachwissenschaftlichen Lehrbuch (Weber 1992) zu einem Hypertext-System, das in der Neuauflage des Lehrbuchs zusätzlich als Parallel-Version angeboten werden soll. Einige Aspekte der Konversion Buch - Hypertext werden angesprochen. Dazu gehören die Übertragung von Teiltexten der Buchvorlage in die Hypertext-Version, die Umsetzung vorhandener und die Einfügung neuer Verweise, die Anlage von Orientierungs- und Merkhilfen. Als Verbesserungen gegenüber der Buchvorlage werden vorgestellt: die Organisation der Inhalts- und Stichwort-Verzeichnisse, die farbliche Seitengestaltung zur Darstellung unterschiedlicher Textebenen, dynamische Anmerkungen und Lesezeichen. Als Optimierung der didaktischen Konzeption der gedruckten Vorlage kann die Behandlung der Aufgaben zu den einzelnen Kapiteln angesehen werden. Die Lösungen können direkt ins Hypertext-System geschrieben bzw. gezeichnet und den Musterlösungen auf derselben Bildschirmseite gegenübergestellt werden. Die Hypertext-Version des Arbeitsbuchs wurde mit Hilfe des Präsentationssystems ToolBook und in der Sprache OpenScript implementiert. 2. Zu Hypertext-Systemen in der Lehre Hypertext-Systeme, seit einiger Zeit in der populärwissenschaftlichen Wissensvermittlung verbreitet, finden zunehmend auch in der Ausbildung an Hochschulen Verbreitung. Gründe hierfür lassen sich mehrfach finden: Einmal sind diese Systeme ohne Übergang bei der üblichen Bildschirm-Arbeit (z.B. mit Datenbanken, Textverarbeitung) abrufbar, ersparen also den Gang zur Bibliothek mit längeren Wartezeiten oder anderen Engpässen, zum anderen sind Bildschirmsysteme schneller und ohne größeren Aufwand aktualisierbar und können dem neuesten Stand angepaßt werden. Darüberhinaus ergeben sich aus der Anwendung derartiger Systeme didaktisch effektivere Einsatzmöglichkeiten z.B. durch die vielfältigen Kombinationen von Schrift, Bild, Ton und Animation, die in vielen empirischen Wissenschaften den Lehrgegenständen angemessener sind. Als weiterer Gesichtspunkt kommt hinzu, daß Hypertext-Systeme eine direkte Einbeziehung der Benutzer ermöglichen und durch Anpassung an den jeweiligen Lernstil, Unterstützung von Eigeninitiative und Interaktivität zu verbesserten Lerneffekten führen (sollen). <?page no="100"?> 100 Anya Elis/ Heinz Josef Weber In der Diskussion um den Einsatz multimedialer Lernsysteme besteht zum letzten Punkt allerdings keine Übereinstimmung. Es wird dagegengehalten, daß die Delinearisierung des Stoffs und seine Fragmentierung in viele kleine Einheiten zusammen mit der Flexibilität und Komplexität der neuen Medien die Benutzer überfordern, und der Überblick über den behandelten Stoff verlorengeht (in Abwandlung einer bekannten Beurteilung könnte man sagen: ...zu viele (K)Noten! ). Die Benutzung dieser Lernsysteme schaffe damit ein neues Problem, das wiederum nur durch Erlernen komplizierter Navigationstechniken zu bewältigen sei (dazu Freisler 1994, S. 46). Die eigene Position läßt sich dahingehend charakterisieren, daß eine Steigerung der Lerneffekte gegenüber einem gedruckten Lehrwerk nicht der entscheidende Antrieb zur Entwicklung des vorliegenden Hypertext-Systems gewesen ist. Das liegt nicht nur daran, daß eine Evaluation von Lerneflfekten nicht einfach zu konzipieren, eine verbesserte Lernleistung schwierig zu beweisen sein dürfte. Ausschlaggebend war, Studierende der Sprachwissenschaft(en) an ein Werkzeug heranzufuhren, das hinsichtlich seiner Einbindungsmöglichkeit in andere (maschinelle) Werkzeug-Zusammenhänge ein anderes Potential besitzt als ein Buch. Wir werden darauf noch zurückkommen, sprechen aber um dies zu unterstreichen bereits jetzt in Zusammenhang mit den Rezipienten des gedruckten Lehrbuchs von Lesern, in Verbindung mit dem Hypertext-System von Benutzern. Nicht zuletzt soll das Nebeneinander von Buch und Bildschirm-Version Studierenden die Möglichkeit zur Abwechslung bieten: variatio delectat. Von dieser Hoffnung gehen wir im folgenden aus. 3. Zur Wahl der Buchvorlage Das Hypertext-System Dependenzgrammatik: Ein Interaktives Arbeitsbuch wurde nach der Buchvorlage Dependenzgrammatik. Ein Arbeitsbuch (Weber 1992) implementiert. Für die Wahl dieser Vorlage sprach, daß sie als Lehrbuch in mehreren Veranstaltungen des Grundstudiums benutzt wurde, daß sie eine ausgeprägte Gliederung aufweist mit unterschiedlich markierten Textebenen, die eine Fragmentierung in Hypertext-Einheiten erleichtert, daß sie in jedem Kapitel einen Aufgabenteil mit Lösungsvorschlägen bietet, der sich in der Bildschirm-Version als interaktive Komponente umsetzen läßt, daß die gedruckte Fassung maschinenzugänglich vorliegt - und der Verlag mit der Konversion einverstanden war. <?page no="101"?> Dependenzgrammatik 101 Wie die Buchvorlage ist das Interaktive Arbeitsbuch als Lernmittel für Studierende der Sprachwissenschaft im universitären Grundstudium gedacht. Es hat PC-kundige Durchschnittsbenutzer im Auge. Die Handhabung ist unkompliziert gehalten, Vertrautheit mit graphischen Bedienungsoberflächen ist von Nutzen, aber keine Vorbedingung. Benötigt werden ein l^z'/ K/ ows-kompatibler PC mit mindestens 486-er Prozessor (50 MHz), mit 3,5-Zoll-Diskettenlaufwerk (1,44 MB), einer Festplatte mit mindestens 18 MB verfügbarem Plattenspeicher und mindestens 4 MB Direktzugriffsspeicher (RAM), eine Graphikadapterkarte (VGA, SVGA o.a., Windows-kompatibel) und einem 14-Zoll-Bildschirm (oder größer) - Microsoft Windows (mindestens Version 3.1) Das Interaktive Arbeitsbuch wurde in der Programmierumgebung ToolBook erstellt. Dieses Autorensystem unterstützt die Anlage eines Hypertexts nach der .SttcA-Metapher, d.h. es werden Seiten angelegt. Jede Seite besitzt eine eigene Identifikationsnummer, auf die direkt referiert werden kann. So erlaubt das Hypertext-System den Einstieg über jede definierte Buch-Seite. 4. Zur Übertragung von Lehrbüchern in Hypertext-Systeme Hypertext-Systeme werden nicht immer direkt als solche angelegt. Parallel- Entwicklungen sind nicht selten, d.h., Lehrwerke werden in gedruckter und digitalisierter Version publiziert. Als weitere Möglichkeit gilt die Übertragung von Büchern in Hypertext-Systeme. Diese Übertragung wird häufig auch als Text-Konversion bezeichnet. Bei der Konversion eines Buchs in eine delinearisierte, vernetzte Form genügt es in der Regel nicht, die Vorlage in vollem Umfang und Seite für Seite in Bildschirm-Format darzubieten; mehrere Stufen der Bearbeitung sind zu unterscheiden, die der eigentlichen Text-Konversion vorausgehen können: So erforderte z.B. die Übertragung eines in Englisch verfaßten Lehrbuchs in ein Hypertext-System, das in deutscher Sprache in einer vorlesungsbegleitenden Übung eingesetzt werden soll, die Reduktion der Buch-Vorlage auf das Vorlesungsskript mit evtl. Umstellung von Textteilen und die Übersetzung des Vorlagetexts ins Deutsche; weitere beachtenswerte Punkte sind der Einsatz von Farben und unterschiedlichen Schrifttypen. Auch das Ausmaß einer Konversion ist zu beachten: Soll das Konversionsergebnis als Hypertext-System für sich allein stehen, oder ist eine Version geplant, bei der die gedruckte Vorlage jederzeit erkennbar sein soll? Beim vorliegenden Unternehmen sollte der Bezug zur gedruckten Fassung weitgehend erhalten bleiben (vgl. dazu 5.1). Maßgebend für die Bildung von Hypertext-Einheiten und -Verbindungen sollten formale Eigenschaften des <?page no="102"?> 102 Anya Elis / Heinz Josef Weber Vorlagetextes sein. Im Hinblick auf die vier Konversionsstrategien, die Kuhlen (1991, S. 163 f.) unterscheidet: 1. einfache Konversion (Übertragung der Vorlage im Verhältnis 1: 1); 2 Segmentierung und Relationierung nach formalen Texteigenschaften oder 3. nach Kohärenzkriterien; 4. intertextuelle Konversion, handelt es sich hier um eine Kombination der beiden erstgenannten Strategien. So konnten die maschinenlesbaren Dateien der Buch-Vorlage als Rohlinge direkt in das Hypertext-System übernommen werden. Wie im folgenden ausgefuhrt, entsprechen sich auch der Aufbau von Buch- und Hypertext-Fassung weitgehend. Die bestehenden Text-Einheiten sind erhalten geblieben, die Verbindungen zwischen ihnen sind übernommen und teilweise erweitert worden. 5. Vom Arbeitsbuch zum Interaktiven Arbeitsbuch 5.1 Darstellung der Textstruktur als Graph Die Globalstruktur der Buch-Fassung ist als Graph dargestellt, der die einzelnen Textteile zueinander in Beziehung setzt. Der Vorlagetext, in Einzelkapitel und Unterkapitel mit Dezimalindexierung gegliedert, ist aszendent-linear zu lesen: In jedem Textabschnitt des Lehrbuchs wird die Kenntnis der vorhergehenden Abschnitte vorausgesetzt. Zunächst werden Grundannahmen zur Dependenz behandelt, darauf folgt die Einführung der Konnexion, auf der wiederum die Junktion aufbaut. Die Translation setzt Konnexion und Junktion voraus; alle drei werden zum Abschluß beim integralen Stemma und der Beschreibung satzübergreifender Relationen einbezogen. Den Abschnitten zu Konnexion, Junktion und Translation sind jeweils Aufgaben und Lösungsvorschläge angeschlossen (Abb. 1). <?page no="103"?> Dependenzgrammatik 103 Abb. 1: Struktur der Buchvorlage Über diese Darstellung können Buch und Hypertext-System aufeinander bezogen werden. Dabei entsprechen die Knoten des Text-Graphs Bildschirm- Seiten und die Kanten den Hypertext-Links (Abb. 2). Wie der zweite Graph zeigt, wurden bei der Konversion Textteile und deren Verbindungen von der Buchvorlage weitgehend übernommen. Von der Vorlage abgewichen wurde beim Inhalts- und Stichwortverzeichnis. Beide sind aus ihren festgelegten Positionen als erste bzw. letzte Textteile herausgelöst worden, um von hier aus alle Textteile erreichen zu können. Die drei Aufgabenteile und die zugehörigen Lösungsvorschläge sind ausgelagert und zu einem Komplex zusammengefaßt, der von jedem Punkt des Textes aus angesprochen werden kann. <?page no="104"?> 104 Anya Elis / Heinz Josef Weber Abb, 2: Struktur des Hypertext-Systems Die direkte Vernetzung von Textteilen, Stichwortverzeichnis, Inhaltsverzeichnis, Aufgaben und Lösungen stellt einen beachtlichen Vorteil gegenüber der Buch-Fassung dar. Textpassagen, Aufgaben, Lösungen etc, können einfach auf dem Bildschirm gezeigt oder weggeklickt werden. Davis (1993) nennt als einen Vorteil eines Hypertext-Systems, daß der Benutzer die Möglichkeit hat, unmittelbar zwischen allgemeiner und detaillierter Information hin- und herzuschalten. Diese Möglichkeit ist im Interaktiven Arbeitsbuch auch bedacht worden: Neben Inhalts- und Stichwortverzeichnis ist ein dritter Typ von Überblickstext eingerichtet worden, das sogenannte Abstract, das stets abrufbar ist. Hier werden wichtige Passagen zur Dependenz nochmals zusammengefaßt im Text des Interaktiven Arbeitsbuchs sind sie in Grün gehalten (siehe dazu: Text-Ebenen 5.5.2), in der gedruckten Version sind die entsprechenden Textstellen eingerahmt. Vom Abstract aus bestehen wiederum Verweise zu den entsprechenden Textpassagen, so daß eine Spezifizierung möglich wird. <?page no="105"?> Dependenzgrammatik 105 5.2 Verweise im Text Text-interne Verweise in der Buch-Fassung betreffen - Literaturangaben, die am Ende verzeichnet sind, - Rückverweise auf bereits gegebene Erläuterungen oder Abbildungen (vgl. dazu Fig. 20), - Vorverweise auf (Wieder-)Behandlung einer Thematik, - Rückverweise in den Lösungsvorschlägen zu den einzelnen Aufgaben, die auf entsprechende Textpassagen Bezug nehmen. In der Buchvorlage werden als Verweis-Adressen ausgenommen davon sind die Literaturverweise meist die Dezimalindexierung und/ oder Abschnittstitel angegeben (Beispiel: vgl. 6.5.4 Erstarrte Translation). Ihnen zu folgen, ist auf jeden Fall mit Hin- und Herblättem verbunden. In der Bildschirm-Fassung sind diese Verweise mit einem Pfeil gekennzeichnet. Der Mauszeiger verwandelt sich in eine Hand, wenn er den Pfeil oder den zugehörigen Verweis berührt. Per Mausklick kann man auf die entsprechende Stelle im Buch springen (und auch wieder zurück: siehe dazu Schaltfläche Zurück in 5.4.3). Literaturangaben und Begriffserläuterungen sind in der Bildschirm-Fassung als Einblendungen realisiert, die über Hotwords ansprechbar sind. 5.3 Eingeblendete Informationen: Erläuterungen und Literaturhinweise Zu den charakteristischen Eigenschaften eines Hypertext-Systems gehört die Möglichkeit, Hotwords zu erstellen; das sind graphisch hervorgehobene Wörter oder Wortfolgen im Text, denen (in ToolBook) eine OpmS’cnpt-Anweisungsfolge zugeordnet ist. Diese gibt dem Hypertext-Autor die Möglichkeit, in eine Seite verdeckt weitere Textteile einzubetten. Dazu eignen sich Definitionen, Hinweise oder Literaturangaben etc. Im Interaktiven Arbeitsbuch verwandelt sich beim Berühren eines rotgedruckten Hotwords der Mauszeiger in ein Hand-Symbol. Der Benutzer kann dann wählen, ob er den zugeordneten Text durch Anklicken auf den Bildschirm bringen will. Begriffserläuterungen erscheinen dann in Schwarz-auf-Weiß-Druck, Literaturangaben sind in Grün unterlegt. Sie entsprechen den einzelnen Eintragungen des Literaturverzeichnisses (vgl. 5.1), in das man über das Inhaltsverzeichnis oder durch Anklicken der Schaltfläche Literatur in der Navigationsleiste der Bildschirm-Seite gelangen kann. Auf die den Hotwords zugeordneten Text-Einblendungen kann der Benutzer nicht verändernd zugreifen. <?page no="106"?> 106 Anya Elis / Heinz Josef Weber 5 4 Orientierungshilfen und Übersichten Die vielfachen Möglichkeiten, die Seite zu wechseln, z.B. über das Inhaltsverzeichnis oder über text-interne Verweise, können dazu fuhren, daß ein Benutzer die Orientierung verliert. Um dies zu vermeiden, wurden folgende Funktionen implementiert: 5.4.1 Navigationsleiste In der Leiste unten links finden sich verschiedenfarbige Navigations-Schaltflächen zum Inhaltsverzeichnis (in Blau), zum Stichwortverzeichnis (in Gelb), zum Literaturverzeichnis (in Grün) und zum Abstract (in Hellblau). Die Färbung der Schaltflächen wird im Hintergrund der entsprechenden Buchpartien wiederaufgenommen. Die Fortlaufleiste in der Mitte des Bildrandes gibt Aufschluß darüber, wie weit der Benutzer abhängig von der aktuellen Seite auf dem Bildschirm im jeweiligen Kapitel vorangekommen ist. Das Bildschirm-Buch läßt sich natürlich auch sequentiell (Seite für Seite) durchblättern: Die roten Schaltflächen rechts unten bringen zur Seite vorher (<-) oder auf die folgende (—>). Zwischen den Schaltflächen ist die Seitenzahl angegeben, auf der man sich gerade befindet. 5.4.2 Die Chronik Die Chronik ist über die Menüleiste (oben) von allen Seiten des Bildschirm- Buchs aus erreichbar. Sie stellt alle angesteuerten Seiten in der entsprechenden Reihenfolge dar. Jede Seite hat einen bezeichnenden Namen, der sich auf das Kapitel mit Unterthemen bezieht. Ein vorangestelltes K: , J: oder T: beim Seitennamen verweist auf die Kapitel Konnexion, Junktion bzw. Translation. Somit wird der verfolgte Weg dem Benutzer als Liste zugänglich gemacht, und mit einem Mausklick gelangt er an jede beliebige Stelle des bisher verfolgten Pfades. 5.4.3 Die Schaltfläche Zurück Diese auf allen Bildschirm-Buch-Seiten vorkommende Schaltfläche bietet eine eingeschränkte Navigationshilfe. Man gelangt damit auf die jeweils zuletzt aufgeschlagene Seite. So läßt sich der Weg durch das Buch zurückverfolgen. <?page no="107"?> Dependenzgrammatik 107 5.5 Der Aufbau der Bildschirm-Seite Auch die Aufteilung einer Seite im Interaktiven Arbeitsbuch orientiert sich weitgehend an der gedruckten Vorlage: den größten Raum nimmt das Text-Feld ein; es enthält den Buchtext und die integrierten Graphiken mit der jeweiligen Nummer; - Kapitelüberschriften sind in einer Titelleiste am oberen Bildschirmrand untergebracht (vgl. 5.5.1); alle Navigations-Schaltflächen liegen in einer Leiste am unteren Bildschirmrand, ebenso die Fortlaufleiste (vgl. 5.4.1); 5.5 1 Die Titelleiste Jede Bildschirm-Seite beginnt mit einer Titelleiste (in Gelb); eine blaue Zahl in einer Raute zeigt die Kapitelnummer, gefolgt vom Titel des Kapitels in roter Schrift (z.B. KONNEXION: DER EINFACHE SATZ: FRAGE - NEGATION 1/ 3), Untertitel folgen in Blau bzw. Grün. Für jedes Unterkapitel geben zwei Zahlen die Seite an, auf der man sich gerade befindet, und die Gesamt-Seitenzahl des Unterkapitels. Die einzelnen Unterkapitel sind zusätzlich farbig voneinander abgesetzt, und zwar durchgängig durchs ganze Buch. 5.5.2 Anzeige der Text-Ebenen durch Farbe Das gedruckte Arbeitsbuch (durchgängig in Schwarz-Weiß) unterscheidet drei textliche Ebenen, die typographisch voneinander abgesetzt sind: referierende Textpassagen sind in den üblichen Drucktypen gehalten, kommentierende Passagen sind durch Kursivdruck und eine Abbildung (Hand-Symbol) hervorgehoben, resümierende Teiltexte in üblichen Drucktypen sind zusätzlich eingerahmt. In der Bildschirm-Fassung sind diese Text-Ebenen durch unterschiedliche Farben für den Seitenhintergrund voneinander abgesetzt. - Referierender Text steht in schwarzer Schrift vor hellgelbem Seitenhintergrund, - Kommentare, eigene Überlegungen und Vorschläge sind durch blaue Schrift gekennzeichnet und <?page no="108"?> 108 Anya Elis / Heinz Josef Weber grüne Schrift deutet auf resümierende Textpassagen hin. - Rote Schrift verweist auf einblendbare Informationen (Hotwords). DEPENDENZCRAMMATIK Buch Fenster Seite Lesezeichen jjilfe KQNWEXtON: Weltefg AbhanglgkettsretaSoften: Upitheten 1/ 1 : Osrvom Si-tstvV-tv •JlrsM Nucieuä wird >ls Epit^cror. Zu den Ecitheti (Abkü'zu'-.g A)ai rc-chnen sind die (attiibu-r/ en) Ar.jökyvft. dt« foese^sivpfvnnnrir: «. sie .«/ tiket Vyn tiyfthyts £ts; fJ mit nych Advsrtüßn (Advert); . D-a Zsbi der Epifhefe vfi&t Sibstadl-v ist rrfcbt be<jförr/ J Auf sine Besonderheit der Tesni&esehen Einteilung ist Wnzuweisen; Sie berücksichttflt nicht daß im Falle mehrerer Epitheta die Relation der Nebenordnung oder Unterordnung zwischen Ihnen bestehen kann Fig. 33: Pascal sammelt altes, gebrauchtes Geschirr Pascal sammelt alte englische Kupferstiche sammelt ekes (A) ^gäraücftti Kupferstiche englische (A) (Achtung: unzulässige Notation! ) alte (A) In der Orthographie wird die Relation zwischen Attributen durch Interpunktionszeichen markiert: Komma bezeichnet Nebenordnung und entspricht oem ’und' Unterordnung wird durch Weglassen von Komma angezeigt (w* Vollständige Junktion und *i*Zur Junktiun von Epitheta). Zu den Artikehwortern ist anzumerkec Bei dar Einordnung derArtikeiwörter sind Diskrepanzen feststellbar Artkeiwörter werden häufiger zu den Epitheta einer Voi: Wort-Klassegerechnet Durchgängig ist dies der Fall bei den Possessivpronomina, die auch gleichzeitig als Andyhemwyrfer fungieren können Artikelwörter treten auch Im Rahmen von 1 .-arisiaFynen auf entweder als VblPA-oner (Translation A » 0) oder als Translatoren (»* i > 0) Andererseits werden bei Tesniöre bestimmte und unbestimmte Artikel als Indizes aufgefaßt und in die entsprechenden Substantivknoten integriert Wir behandeln hier die Artikelwörter In der Regel als Epitheta oder als l'isfislstoren Angemessener wäre, dafür eine eigene Wortklasse anzusetzea Abb. 3: Eine Bildschirm-Seite 5.6 Benutzereingriffe: Merkhilfen und Kommentare Hypertext-Systeme erlauben die aktive Einbeziehung der Benutzer einmal dadurch, daß sie individuelle Spuren im Text hinterlassen können, und zwar analog zu gedruckten Lehrwerken durch das Einfugen von Merkhilfen oder das Anbringen von Eigen-Text. 5.6.1 Lesezeichen Eine wichtige Merkhilfe wird im Interaktiven Arbeitsbuch durch die Lesezeichen-Fuvkiion geboten. Der Benutzer kann für jede beliebige Seite ein Lesezeichen setzen und gelangt von jeder Seite aus wieder dorthin zurück. Dieses Lesezeichen kann jederzeit entfernt werden oder bleibt über mehrere Sitzungen hinweg erhalten vorausgesetzt, man läßt es zusammen mit allen Änderungen beim Verlassen des Hypertext-Systems speichern (siehe dazu <?page no="109"?> Dependenzgrammatik 109 5.8). Beim erneuten Aufruf des Systems kann man dann gleich zu Anfang die markierte Stelle im Interaktiven Arbeitsbuch aufschlagen. 5.6.2 Anmerkungen Handschriftliche Anmerkungen in Druckwerken gehören zu den Textbestandteilen, die bei geliehenen Büchern nicht von allen Lesern geschätzt werden und bei eigenen Büchern oft nur eine gewisse Zeit hilfreich sind. Ärgerlicherweise sind sie meist direkt auf die Buchseiten geschrieben und nicht auf angeheftete Zettel, so daß sie nur mit Aufwand entfernt werden können. Im Interaktiven Arbeitsbuch kann aufjeder Seite Eigen-Text angebracht werden, sei es ein Kommentar, eine Erläuterung oder ein spontaner Einfall, der für Nichtinteressierte verborgen bleibt. Die sogenannte Anmerkungs-Fuvktxon läßt sich über das Kopfleisten-Menü oder über eine Schaltfläche in der rechten oberen Ecke der Buchseite auffufen. Existiert zu einer Seite bereits eine Anmerkung, wird in dieser Schaltfläche darauf hingewiesen. Erst durch Anklicken wird der Inhalt auf dem Bildschirm eingeblendet. Im Umfang gibt es kaum Beschränkungen, Änderungen oder Löschungen sind unproblematisch. 5.7 Interaktivität: Aufgaben und Lösungsvorschläge Die gedruckte Fassung des Arbeitsbuchs enthält zu jedem der Kapitel Konnexion, Junktion, Translation einen Aufgabenteil, in dem die Leser das angeeignete Wissen auf Beispiele anwenden können. Zu jeder Aufgabe werden auch Lösungsvorschläge gegeben, Rückverweise auf die betreffenden Kapitel oder Abschnitte sollen eine gezielte Wiederaufnahme der Lektüre gestatten. In der Umsetzung dieser didaktischen Konzeption kommt die Interaktivität der Bildschirm-Version deutlich zum Tragen. Die Aufgaben lassen sich mit Tastatur und Maus direkt ins Buch schreiben bzw. zeichnen. Auch hier sind jederzeit Änderungen oder Löschungen möglich. Jede eigene Lösung kann auf derselben Bildschirmseite mit der jeweiligen Musterlösung verglichen werden. Die Inhaltsverzeichnisse der Aufgaben und Lösungsvorschläge entsprechen im Aufbau dem Gesamt-Inhaltsverzeichnis. Die einzelnen Aufgaben sind mit roten Häkchen markiert, wenn sie bereits behandelt worden sind. 5.7.1 Erstellen der Aufgaben - Präsentation der Lösungen Jede Aufgabenseite enthält die Aufgabenstellung, ein Feld, in dem der Benutzer die Aufgabe bearbeiten kann, einen Bereich, in dem der Lösungsvorschlag angezeigt werden kann, und ein Referenzfeld, in das die Verbindungen zu den entsprechenden Textpassagen gelegt wurden. <?page no="110"?> 110 Anya Elis / Heinz Josef Weber Mithilfe der von Windows bereitgestellten OLE-Funktion (OLE = Object Linking and Embedding, zu deutsch: Verknüpfen und Einbetten von Objekten) läßt sich innerhalb einer aktuellen Anwendung ein anderes Programm aufrufen So wird zur Aufgabenbearbeitung durch den Benutzer aus dem Interaktiven Arbeitsbuch heraus das (F/ wdows-Zeichenprogramm Paintbrush aktiviert. Damit können Linien und Graphiken gezeichnet sowie Text eingefugt werden ausreichend, um ein virtuelles oder aktuelles Stemma zu erstellen. Die Lösung einer Aufgabe wird anschließend auf der Aufgabenseite gezeigt. DEPENDENZGRAMMATIK fluch Fenster Seite Lesezeichen Hilfe mn [-EL««"] Uo) Frsfefoh Siezurrt frrtgsnden Sötspfsl das D80enddn? -Stemma Gäbet J-ÖSUnflSVÖrSChtafl: -i sind die bereits bekannten Dependenjjelatlonen zu beachten im Falle von Mehrdeutigkeit notieren Sie jede Lesart tri einem eigenen Stemma DoppBtklicksrt Sie <n* da« leid,um Ihren Losungsvofschta B zu zeictoen: Pascal traf den Mann dort traf (I) L 2 \ c entfernen j Mani| Pascal |0| (E) den (A) ? te-.art Zu Aufgabe l{gj sollten Sic nachschlagen: Die Oependenz-Reiationen ; Adverb Abb. 4: Aufgabe - Lösung des Benutzers Zum Vergleich kann nun der Lösungsvorschlag aufgerufen werden. Dieser wird schrittweise aufgebaut, d.h. nicht nach der Wortfolge (der linearen Ordnung) im Aufgabensatz, sondern in der durch das Dependenzgrammatik-Modell vorgeschriebenen strukturalen Ordnung. Die bereits in der Buchvorlage gegebenen Hinweise zur Vertiefung des Stoffs {Zu Aufgabe X sollten Sie nachschlagen in... ) werden im Interaktiven Arbeitsbuch als direkte Verbindungen zu den entsprechenden Textpassagen angeboten. <?page no="111"?> Dependenzgrammatik 111 Abb. 5: Aufgabe - Lösungsvorschlag des Systems 5.8 Drucken, Speichern, das Buch schließen Von jeder Bildschirm-Seite kann ein Ausdruck gemacht werden, ebenso von den Lösungsvorschlägen. Wird das Hypertext-System geschlossen, kann sein jeweiliger Zustand (gesetzte Lesezeichen, eingefugte Anmerkungen, gelöste Aufgaben) gespeichert werden. 6. Zur Erweiterung der Arbeitsmöglichkeiten Daß es sich beim Interaktiven Arbeitsbuch um mehr als eine Bildschirm- Doublette der Buch-Fassung mit etwas mehr Komfort handelt, zeigt sich deutlich an den erweiterten Arbeitsmöglichkeiten: Durch Integration unterschiedlicher Optionen, wie Lesen, Schreiben, Zeichnen, Ändern, Drucken, wird die Trennung in Leser und Autor bzw. Student und Dozent relativiert. Damit nicht genug: Die im Hypertext-System hinzugewonnenen Möglichkeiten zur dependentiellen Beschreibung von Sätzen können noch weiter ausgebaut werden, wenn sich Verbindungen zu anderen informationstragenden und -verarbeitenden Systemen (Valenzwörterbücher, Datenbanken, Dependenz-Parser) hersteilen lassen. <?page no="112"?> 112 Anya Elis / Heinz Josef Weber 7. Literatur Davis, Stephens. (1993): Hypertext and Multimedia. In: English Today, 9-1, S. 17-26. Freisler, Stefan (1994): Hypertext - Eine Begriffsbestimmung. In: Deutsche Sprache, 22-1, S. 19-50. Kuhlen, Rainer (1991): Hypertext. Ein nicht-lineares Medium zwischen Buch und Wissensbank. Berlin. Weber, Heinz J. (1992, 2 1997): Dependenzgrammatik. Ein Arbeitsbuch. Tübingen. <?page no="113"?> Bettina Hamehausen-Mühlbauer NaLA - Hypertextgrammatik in CASTLE 1. Einführung CASTLE 1 wurde als Bedieneroberfläche fiir CALL 2 -Systeme entwickelt. Seine modulare Struktur erlaubt jedoch, es auch für sprachlernunabhängige Anwendungen zu verwenden. Eine konfigurierbare multi-media Schnittstelle, separate Module zur Benutzermodellierung, sowie Komponenten der natürlichsprachlichen Datenverarbeitung sind in CASTLE integriert. Da die Komplexität des Gesamtsystems eine detaillierte Beschreibung aller Komponenten an dieser Stelle nicht ermöglicht 3 , wird dieser Beitrag auf die Verarbeitung natürlicher Sprache mittels der elektronischen Grammatik NaLA 4 sowie deren Hypertextmodul fokussieren. Diese Komponente dient dem grammar checking und dem hypertext-tutoring in CALL-Anwendungen. CASTLE läuft auf einem PC (386+) mit VGA-Graphik unter Windows 3.1, Win-OS/ 2 oder Windows 95 5 . Heutigen CALL-Systemen mangelt es häufig an Benutzerakzeptanz, da diese oft lediglich traditionelle Techniken, wie z.B. multiple choice Fragen, auf den Bildschirm kopieren, wobei die Aufgaben des Computers auf ein einfaches pattem matching der Eingabe und der vom Benutzer erwarteten Antwort beschränkt bleiben. Derartige Techniken sind nicht nur langweilig und veraltet, sondern auch weder flexibel noch kreativ. Als wir vor der Aufgabe standen, ein geschriebenes Medium, d.h. ein Sprachlehrbuch, in das elektronische Medium zu konvertieren, konnten wir uns nicht für einen 1: 1 Transfer entscheiden, sondern mussten unsere Erfahrungen im Gebiet der künstlichen Intelligenz miteinbringen, um den gerechtfertigten Erwartungen eines modernen Benutzers gerecht zu werden. Die Komponenten aus dem Gebiet der künstlichen Intelligenz umfassen zum einen die individuelle Modellierung des Systems, durch die ein Benutzer das System je nach seinen individuellen Wünschen konfigurieren kann und so ganz individuelle Antworten vom System erhält, zum anderen die Verarbeitung natürlicher Sprache mittels eines wissensbasierten Systems mit Regeln über die natürliche Sprache. Ein derartiges System unterscheidet sich von den herkömmlichen faktenbasier- 1 castle = Computer ASsisted Tutoring and Learning Environment 2 call = Computer Assisted Language Learning 3 Gerstl/ Grieszl (1995) geben eine Übersicht des Gesamtsystems. 4 NaLA = Natural Language Analyser 5 Details zur CASTLE-Konzeption in Gerstl/ Grieszl (1995). <?page no="114"?> 114 Bettina Harriehausen-Mühlbauer ten Systemen, die nur Einzelfälle behandeln können; z.B. eine Übung wurde so konzipiert, dass nur eine Lösung, oder vielleicht noch vordefinierte alternative Lösungen, akzeptiert wurden, d.h. korrekte, aber unvorhergesehene, Antworten werden in derartigen Systemen als inkorrekt interpretiert. Diese Methode kann keine akzeptable Variante in einer Lehr-/ Lernumgebung sein. 2. Verarbeitung natürlicher Sprache in CASTLE: NaLA Die drei Komponenten eines jeden NLP 6 Systems - Parser, Lexikon und Grammatik sind in CASTLE folgendermaßen realisiert: 2.1 Der Parser Der derzeit in CASTLE implementierte Parser arbeitet bottom-up und left-right und ist in der Programmiersprache C implementiert. In Kombination mit den Grammatikregeln erlaubt die Konzeption des Parsers, dass auch inkorrekter Input geparst wird und dass in diesen Fällen dem Benutzer gezielte Hilfe mittels des Hypertexttutorials angeboten wird (siehe Kap. 3). 2.2 Das Lexikon Die derzeitige prototypische Version des Lexikons ist ein Vollformenlexikon, welches Merkmale zur Wortklasse, Morphologie und Syntax sowie z.T. zur Semantik und zum Stil einer Wortform enthält. Die aktuelle Version wird als C-Datei verwaltet, wird jedoch zukünftig durch eine relationale Datenbank ersetzt werden. 2.3 Die Grammatik Die elektronische Grammatik NaLA operiert auf Satzebene oder darunter, d.h. Fragmente bis zur Größe einzelner Zeichen können auch analysiert werden. In NaLA ist das know-how eingeflossen, welches in vorhergegangenen textcritiquing Projekten erarbeitet wurde (siehe Heidorn 1975 und Jensen 1986). Aus diesem Grund wurden die Grammatikregeln auch in einer eigens für die Sprachverarbeitung entwickelten Hochsprache der PLNLP 7 implementiert, werden aber direkt in C übersetzt und in analoge C-Regeln kompiliert. 6 Natural Language Processing 7 PLNLP = Programming Language of Natural Language Processing <?page no="115"?> NaLA - Hypertextgrammatik in CASTLE 115 2.3.1 Die Grammatikregeln Die Grammatikregeln haben die Form erweiterter Phrasenstrukturregeln des binären Typs, d.h. zwei Knoten werden einem höheren Knoten subsumiert. Dieses grundlegende Prinzip der Regeln spiegelt sich auch in der Bildschirmdarstellung der Analyse (in Abb. 1 in der Entwicklerumgebung) wieder: NaLa C; \BC\KLETT\BG.TXT File Edit Options MLP Debug JJelp Sind ale ins Schloss gegangen? Warm wurde das Fass ferliggeste»? Für wen wurde das Fass gebaut? Wieviele Eichenslämme wurden verarbeib Wer bewachte das Fass? Ich habe de Gruppe verloren. Ich habe Gruppe verloren. Wissen Sie, wo ae hingegangen hat? Sind ale ins Schloß gegangen? Sind ale ins Schloß gehen? Warm wurde das Faß gebaut? Warm wurde das Fass bauen? Wieviele Eichenstamm wurden vetarbeiter £ Wer bewacNe Faß? Warm das Fass wurde lertiggestet? parse selection Tree: UPS GRUSS4 (0005)- (1050) FUNC2 Result: 'SUCCESS' "" Success (next sentence) Tree: (0050) NPB- -(0070)-PRONl- 1 ICH' DECL19-VP18 VP17 VP16 VP9 (0020) -VERB2-' HABE' (0100) DET10-(0075)-PROH3-'MEINE' (0040) HP 15 NP11—(0010)-NOUN4-'GRUPPE' (0065) VP12 (0020 )-VERBS- ' VERIOREN ' (1000) PUNC6 ' . ' Result: SUCCESS' ■■ Success — (next sentence) Tree: VP30 VP24— (0040) -VP10 NP23 NP11 (0090) PUNC3 (0085) WH-PRON12 (0050) NP13- -(0020)-VERBl-'WISSEN' -(0070)-PRON2-'SIE' -(0080)-PRON4-'WO' -(0070)-PRON5-'SIE' (0147) QUEST29-VP27 VP26- (1000) PUNC8- Result: 'SUCCESS' ■■ Success (next sentence) (0066) VP14-(0020)-VERB6-'HINGEGANG 5 -VP25 VP15-(0020)-VERB7-'1ST' Abb. 1: Phrasenstrukturbäume einer NaLA Analyse Die aus der Literatur vertraute Baumstruktur ist in der in Abb. 1 dargestellten Form von links nach rechts wiederzufinden. Die korrekte Analyse (markiert durch die Nachricht „Success“ am Ende des Parses unter der Baumstruktur) der Sätze gibt von rechts nach links Informationen über die geparsten Lexeme, deren Wortklasse, die für die Analyse benutzen Regeln und die Knotenbezeichnungen auf höheren Ebenen, jeweils mit den dazugehörigen Regeln, über die diese Knoten aus jeweils zwei Knoten generiert worden sind. Z.B. wurde in der Analyse des Satzes „Ich habe meine Gruppe verloren.“ die Regel (0100) zur Generierung des Nominalphrasen-Knotens NP 15 aus den Knoten DetlO („meine“) und NP11 („Gruppe“) angewendet. Die Grammatik wurde speziell für die Erkennung und Korrektur lexikalischen, morphosyntaktischen und z.T. lexikalischen Inputs entwickelt. <?page no="116"?> 116 Bettina Harriehausen-Mühlbauer 2.3.2 Verarbeitung inkorrekter Eingaben in NaLA Dass die Grenzen zwischen falschem, syntaktisch inakzeptablem und/ oder akzeptablem Input häufig schwer zu ziehen sind, ist bekannt. Besonders bei der Betrachtung von Eingaben gesprochener Sprache beobachten wir, dass wir uns bei der Entscheidung „korrekt inkorrekt“ eher auf einem Kontinuum bewegen. Die Gründe hierfür sind vielseitig, u.a. da bestimmte grammatische Strukturen, wie z.B. der fehlende Konjunktiv in abhängigen Nebensätzen insbesondere in der gesprochenen Sprache -, heute schon zu unauffälligen, akzeptierten Konstruktionen gehören, womit nicht gesagt werden soll, dass diese hiermit auch gleichzeitig „korrekt“ sind. Aber was bedeutet „korrekt“? Wer definiert, was „korrekt“ und was „inkorrekt“ ist? Diese Frage hat man sich in der Sprachverarbeitung schon vor einigen Jahren gestellt, so z.B. Winograd (in Harriehausen 1989), „Should the parsing grammar attempt a full or just a partial parse of each input string? Should it be able to describe all or just a subset of the input? How should ill-formed input be handled? “ denn in der wahren Sprachverarbeitung sind die von Nagao (1988, S. 448) angesprochenen much more dirty, exceptional expressions keine Seltenheit und es wäre inakzeptabel, eine Analyse dieser Eingaben mit einem simplen ,parsefailed 1 abzuschließen. Ein moderenes NLP-System muss mächtig genug sein, „to accept varieties of exceptional linguistic phenomena which the theory is difficult to treat“ (Nagao, ebd.). In NaLA wird das gesamte Eingabespektrum analysiert. Basierend auf Fehlerstatistiken wurden „typische Fehler“ in die Grammatikregeln integriert. Hierüber können zur Laufzeit Fehler antizipiert, erkannt und auch korrigiert werden, da sowohl direkt über die Grammatikregeln ein error feedback in Form einer Kurzanalyse des Fehlers und/ oder gegebenenfalls eines Korrekturvorschlags (z.B. bei Fehlern morphologischer Natur insbes. Flexionsfehlern) zurückgegeben wird, als auch über spezielle Fehlerindizes ein beliebig ausführliches Hypertexttutorial fehlerspezifisch angeboten wird. In Abb. 2 sind die Analysen inkorrekter Sätze abgebildet: <?page no="117"?> NaLA - Hypertextgrammatik in CASTLE 117 NaLa - C: \BC\KLEn\BG.TXT File Edit Options NLP Debug Help Hato. Ich habe meine Gruppe verloren. Wissen Sie, wo sie hingegangen ist? Sind aBe ins Schloss gegangen? Wann wurde das Fass fertiggestellt? Für wen wurde das Fass gebaut? Wieviele Eichenstämme wurden verarbeit Wer bewachte das Fass? Ich habe de Gruppe verloren Ich habe Gruppe verloren. Wissen Sie, wo sie hingegangen hat? Sind alle ins Schloß gegangen? Sind alle ins Schloß gehen? Wann wurde das Faß gebaut? Wann wurde das Fass bauen? Wieviele Eichenstamm wurden verarbeitel Wer bewachte Faß? Wann difc Fass wurde fettiggestellt? Mil mm parse selection Tree (0050) HP7 (0070)-PRONl— 'ICH' DECL15-VP14 VP13 VP12 VP8—(0020 )-VERB2— ' HABE (0040) HP9—(0010)-HOUN3 —'GRUPPE' (0065) VP10 (0020)-VERB4— 'VERLOREN' (1000) PÜNC5 1 • Selected Record Result 'ARTIKEL1' ‘ Gruppe" "Das Objekt benötigt einen Artikel” (next sentence) parse selection Tree (0120) VH-PRON8 (C080)-PRON1-' UANN ' QUEST21 VP20 VP19 VP9 (C020 ) -VERB2- ' UURDE' (0100) DET10-(C030)-ADJ3—‘DAS 1 (0049) NP17 HP11—(0010)-HOUH4- ■ FAß' (0055) VP18 VP12 (0020 )-VERB5-'GEBAUT' (1000) PUHC6 '? Selected Record: Result: ‘ORTHOGRAPHIE’ " Faß“ "Beachten Sie die Rechtschreibreform" (next sentence) parse selection Tree: (0050) WH-PRON6- QUEST12 VP11 VP10- -(0080)-PROHl-‘WER' -VP 7-(0 0 2 0)-VERB 2-'BEWACHTE' NP8-(0010)-NOUH3-'FAß' (0040) (1000) PUNC4 Selected Record: Result: 'ARTIKEL! ' " Faß" "Das Objekt benötigt einen Artikel" 'ORTHOGRAPHIE' " Faß“ "Beachten Sie die Rechtschreibreform" (next sentence) Abb. 2: Analysen inkorrekter Sätze Im Unterschied zur Analyse des korrekten Eingabesatzes, zeigt die Analyse einer fehlerhaften Eingabe unter dem Analysebaum als Resultat jeweils (a) den Fehlerindex, z.B. „ARTIKEL1“, (b) den string des fehlerhaften Knotens „Gruppe“ und (c) eine Kurzanalyse des Fehlers: „das Objekt benötigt einen Artikel“. Über den Fehlerindex wird die Verbindung zum Hypertexttutorial aufgebaut, über welches sich der Benutzer beliebig detaillierte bzw. breite Information zu dem spezifischen Fehler anzeigen lassen kann. 2.3.3 Das Hypertexttutorial Das NaLA Hypertexttutorial kombiniert diverse Medien in einem System. Derzeit sind folgende Quelltexte im Tutorial integriert: ein Übungsbuch mit Kapiteln zu verschiedenen Grammatikkonstruktionen ein separates Übungsbuch (des Lehrers) mit zusätzlichen Übungsbeispielen eine deskriptive Grammatik ein Lehrerhandbuch ein einsprachiges Wörterbuch ein zweisprachiges Wörterbuch (in der Planung) <?page no="118"?> 118 Bettina Harriehausen-Mühlbauer Die Vorteile des an die Grammatik angeschlossenen Hypertexttutorials liegen auf der Hand: - Für den Lernenden wird die aufwendige Suche nach (grammatischer) Information, die nach herkömmlicher Art in diversen Büchern stattfindet, auf eine Informationsquelle reduziert und somit nicht nur erleichtert sondern auch beschleunigt. - Der über die Analyse generierte Fehlerindex stellt eine direkte Verbindung ins Tutorial her, d.h., die fehlerspezifische Information wird direkt angezeigt, ohne dass der Lernende sich durch Inhaltsverzeichnisse „hindurchwühlen“ müsste. - Der Lernende hat die Möglichkeit, Informationen zum gemachten Fehler in gewünschter Breite und Tiefe durchzuarbeiten, bzw. auch zusätzliche Übungen gezielt zu dem Fehlerkomplex durchzuarbeiten. - Natürlich kann das Hypertexttutorial auch unabhängig von einer fehlerhaften Eingabe jederzeit vom Benutzer aufgerufen werden. In diesem Fall wird dem Benutzer ein Inhaltsverzeichnis zur Auswahl angezeigt. Beispiele zur Funktionalität des Hypertexttutorials mit direktem Anschluss an die Grammatikanalyse werden in Kap. 3 gezeigt. 2.3.4 Die Entwicklerumgebung Der größte Teil der Grammatikentwicklung findet in einem zweigeteilten Editor statt, bei dem auf der linken Bildschirmseite der zu analysierende Eingabetext steht und auf der rechten Seite alternativ der Parsebaum eines Satzes oder mehrerer Sätze gleichzeitig (Abb. 1/ Abb. 2). Neben den bisher gezeigten Darstellungen hat der Entwickler zu jedem Zeitpunkt seiner Arbeit die Möglichkeit, weitere Funktionen anzuwählen (Abb. 5), wie z.B. sich bestimmte traces oder records ausgewählter Knoten anzeigen zu lassen. Diese Funktionen sind für die Grammatikentwicklung von tragender Bedeutung. Ferner kann der Entwickler zu jedem Zeitpunkt aus dem Editor heraus das Lexikon und auch die Grammatikregeln editieren und diese Module verändern. Die Veränderungen werden mit Eingabe kompiliert und stehen somit sofort dem Gesamtsystem zur Verfügung. Dieser direkte Zugriff auf Lexikon und Grammatik vereinfacht und beschleunigt die Gesamtentwicklung des Systems erheblich. <?page no="119"?> NaLA - Hypertextgrammatik in CASTLE 119 File Options Hallo. Ich habe meine Gruppe verloren. Wissen Sie, wo sie hingegangen ist? Sind alle ins Schloss gegangen? Wann wurde das Fass fertiggestellt? Für wen wurde das Fass gebaut? sizeof(NODE) Deleted Attributes Edit NLP Rules Edit Dictionary Wieviele Eichenstämme wurden verartrerarr Wer bewachte das Fass? Ich habe die Gruppe verloren. Ich habe Gruppe verloren. Wissen Sie, wo sie hingegangen hat? Sind alle ins Schloß gegangen? Sind alle ins Schloß gehen? Wann wurde das Faß gebaut? Wann wurde das Fass bauen? Wieviele Eichenstamm wurden verarbeitet? Wer bewachte Faß? Wann das Fass wurde fertiggestellt? Abb. 3 Entwicklerumgebung: direkter Zugriff auf Lexikon und Grammatik ist zu jeder Zeit möglich £ile nsn NaLa - C: \BC\KLErT\BG.TXT naflG. Ich habe H05B9B3E verloren Wissen Sie, wo sie hingegangen ist? Sind alle im Schloss gegangen? Wann wurde das Fass fertiggestellt? Flit wen wurde das Fass gebaut? Wieviele Eichenstämme wuiden veu Wer bewachte das Fass? parse selection Tree: (0050) NP8— DECL19-VP18 VP17 VP16. (0065) VP12- (1000) PUNC6 Selected Record: (0070)-PRONl-'ICH' -VP9 ( 0020 )-VERB2-' HABE ' (0100) DET10-(0075)-PRON3-’MEINE' (0040) NP15 NP11— ( 0010 ) -NOUN4- ' GRUPPE ' (0020)-VERBS-‘VERLOREN' Ich habe die Gruppe verloren. Ich habe Gruppe verloren. Wissen Sie, wo sie hingegangen hat Sind alle im Schloß gegangen? Sind alle im Schloß gehen? Wann wurde das Faß gebaut? Wann wurde das Fass bauen? Wieviele Eichenstamm wurden verar Wer bewachte Faß? Warn das Fass wurde fertiggestellt? i* NODENAME ÜÜ LENGTH I DICT £ SGFEM | SG £ P3 £ FEH £ BASE % URULE £ HEAD £ SEGTYP2 £ PRMODS £ RULE NP15 " meine Gruppe" 12 * GRUPPE' 'GRUPPE' (0010) NP11 " Gruppe" 'NP' ADJP10 " meine" (0100) Result: 'SUCCESS' “" Success M (next sentence) Abb. 4 Entwicklerumgebung: Parse eines Textfragments mit zusätzlich gewählter Information zu einem Record <?page no="120"?> 120 Bettina Harriehausen-Mühlbauer N*)La C: \BC\KLE^BG.TXT File Edit Options Hallo I Parse AH Ich habe meine G ruppe verlor Wissen Sie, wo sie hingegen^ Sind alle im Schloss gegang« Warn wurde das Fass ferligg Für wen wurde das Fass gebw Wieviele Eichenstämme wurd Wer bewachte das Fass? Ich habe die Gruppe verloren. Wissen Sie, wo sie hngeganj Sind die ins Schloß geganger Sind aie ns Schloß gehen? Warn wurde das Faß gebaut Wann wurde das Fass bauen Wieviele Eichenstamm wurde Wer bewachte Faß? Wann das Fass wurde fertiggE Parse Selection Store Qecord Sei. Text Normal. Text Words ■ / Tree V Selected Record Trace Single Step Progress Attributes Reason Apply Rule 1 parse selection Tree: (0050) NP7 (0070)-PRONl—'ICH 1 DECL15-VP14 VP13 VP12 VP8—( 0020) -VERB 2—' HABE' (0040) NP9—(0010)-NOUN3— , GRUPPE (0085) VP10 ( 002 0)-VERB 4—'VERLOR! (1000) PUNC5 ' . 1 Selected Record: Result: 'ARTIKELl' “ Gruppe* “Das Objekt benötigt einen Artiki (next sentence) Abb. 5: Funktionalität der Entwicklerumgebung 3. Eine Beispielsession in CASTLE Im Folgenden erhalten Sie einen Überblick darüber, wie sich eine Session mit CASTLE vollziehen könnte. Ausgewählte Bildschirmseiten, die nachfolgend beschrieben werden, werden Ihnen unter 3.8 vorgestellt. 3.1 Eingangsbildschirme Wenn Sie sich in das Programm einloggen, werden Sie von dem Bildschirm (vgl. Abb. 6) begrüßt und Sie erhalten die Wahlmöglichkeiten „Textcomprehension“, „Grammar section“ und „Language Awareness“. Für unser Beispiel wurde „Textcomprehension“ gewählt (vgl. Abb. 7). 3.2 Spezielle Bildschirme (nach Wahl) Es wurde dann eine Übung zur Wortwahl (vgl. Abb. 8) gewählt, in der das 2. Feld nicht korrekt ausgefullt wurde; eine Fehlerstatistik wird direkt mitgeliefert. <?page no="121"?> NaLA - Hypertextgrammatik in CASTLE 121 3.3 (Optionale) Fehlerstatistik Zusätzlich zu der „direkt angeschlossenen Fehlerstatistik“ kann noch eine speziellere gewählt werden (vgl. Abb. 9). Diese Fehlerstatistik kann sich der Benutzer optional anzeigen lassen. Die Statistik wird je nach Fehlertyp erstellt und inkrementiell während einer Arbeitssession aktualisiert. Auch über die Fehlerstatistik wird vom System direkt Information aus dem Hypertexttutorial angeboten, z.B. wenn ein Benutzer in einem Bereich eine relativ hohe Fehlerhäufigkeit aufweist, schlägt CASTLE spezifische Hilfstexte aus dem Tutorial vor. 3.4 Informationen bei Wahl der „Grammar section“ Hat der Benutzer statt der Übung zur Wortwahl in dem bereitgestellten Bereich eine Übung zur Grammatik gewählt, so erhält er einen Bildschirm (vgl. Abb. 10) mit Aufgaben und Vorgaben. Er kann dann optional einen Zugriff auf die mit dieser Übung verbundene Information im Hypertexttutorial wählen, indem er das „Grammar lookup“ Fenster anklickt. Will der Benutzer weitere Informationen zu dem Komplex „Making Questions“, so kann er tiefer in die Problematik einsteigen, z.B. bzgl. der Verwendung von Hilfsverben im Kontext mit der Fragestellung bei Ja-Nein-Fragen (vgl. Abb. 11). 3.5 Übungen zur Satzbildung Eine dieser Übungen (ebenfalls in der Section Grammatik) ist eine Übung zur Satzbildung und hier besonders zur Satzstellung (vgl. Abb. 12). Hier werden Wortformen und Phrasen in beliebiger Abfolge angeboten, die dann in eine der Situation und der englischen Satzbildung entsprechende Reihenfolge gebracht werden sollen. Auch hier erhält der Benutzer eine statistische Kurzinformation zu der Einzelübung, die zwar an der Benutzeroberfläche keine Information zu den Fehlertypen enthält; intern werden jedoch die Zähler für die diversen Fehlertypen über die Fehlerindizes inkrementiell verändert, u.a. um am Ende der Übung über die Fehlerindizes gezielte Hilfsinformation aus dem Tutorial anbieten zu können. Wurde die Übung zur Satzbildung nicht fehlerfrei beendet (vgl. Abb. 13), so erhält der Benutzer in Kurzform eine Fehlerbeschreibung, mit der Option, sich Zusatzinformation anzeigen zu lassen. Zusätzlich erhält er eine statistische <?page no="122"?> 122 Bettina Harriehausen-Mühlbauer Angabe darüber, wie viele seiner Antworten korrekt und wie viele falsch waren. Außerdem wird genau an dieser Stelle die Verbindung zwischen Fehlerindex (hier: eines Wortstellungsfehlers in „Ccm I help you how? “) und dem Tutorial aufgebaut (vgl. Abb. 14). Nach dem Anklicken des Wunsches nach zusätzlicher Hilfe und Information, das die Verbindung zum Tutorial aufbaut, werden weitere Übungen zu dem Problem- und Themenkreis angeboten (vgl. Abb. 15). Über hot spots (am Bildschirm grün markiert) kann der Benutzer in beliebiger Breite und Tiefe Zusatzinformation anwählen. Hier wählt er die Option, mehr Informationen über „the form of questions“ zu erhalten (vgl. Abb. 16). Er erhält dann Informationen zusätzlich zu den in Abb. 11 erläuterten zur Möglichkeit anderer Arten der Fragestellung. 3.6 Status der Übungen In jedem Stadium der Benutzung des Systems kann der Benutzer wählen, wie er in der aktuellen Arbeitssession Weiterarbeiten möchte: Ob er mit der aktuellen Übung weitermachen möchte (continue with this exercise? ), dieselbe Übung nochmal durchlaufen möchte (Clear & the same exercise again? ) oder diese Übung und die damit verbundenen Informationen verlassen möchte (Leave this exercise? ) (vgl. Abb. 17). 3.7 Beenden der Übungen / Session Am Ende der Übung bzw. am Ende der Arbeitssession erhält der Benutzer statistische Information zu der bearbeiteten Übung (vgl. Abb. 18). <?page no="123"?> NaLA - Hypertextgrammatik in CASTLE 123 Datei Navigation Profil Optionen Hilfe i L: CASTLE: A Siiitoct Tutsrftv* ä L wirolni? EtivtronmiBit Datei Navigation Profil Optionen Uilfe WKtA'nMb sem |»i «räfef t» . Castle 1 Abb. 7: Die Wahlmöglichkeiten im (englischen) System (es wird „Textcomprehension“ gewählt) 3.8 Abbildungen zur Beispielsession Abb. 6: „Willkommen im System castle“ <?page no="124"?> 124 Bettina Harriehausen-Mühlbauer Abb. 8: Übung zur Wortwahl, mit direkt angeschlossener Fehlcrstatistik für diese Übung Abb. 9: Statistische Fehlerinformation zur gesamten Arbeitssession <?page no="125"?> NaLA - Hypertextgrammatik in CASTLE 125 Abb. 10: Übung in der „Grammar section“ Abb. 11: Information aus dem Hypertext-Tutorial zu einer bestimmten Übung <?page no="126"?> 126 Bettina Harriehausen-Mühlbauer Abb. 12: Übung zur Satzbildung: fehlerfrei Abb. 13: Übung zur Satzbildung: mit Fehlern <?page no="127"?> NaLA - Hypertextgrammatik in CASTLE 127 Abb. 14: Die Verbindung zum Hypertext-Tutorial wird hergestellt Datei Navigation Profil Optionen Hilfe iMi'nu»H-uin»ii-n- | iHii*ii'i»imniii»Miiin'M mi'i — ■■■■ MB in I ■ P»< tlu Question phrases with what and haw: What time are the visitors arrMng? What colour is your toothbrush? What kind of! What sort ofdub is it? How old is your sister? How often eh you go out? Howfaris the beach? How long will the meeting last? How many televisions have you got? How much money didyou spend? - Halfpast eight. yellow. - A ni$tt club * She's twenty. ■ About once a week. - Onlyfive minutes' walk. - An hour orso, letpect. - Three. - Over-fiftypounds. Do you wish to see more on the form of rjussttons" Abb. 15: Das Hypertext-Tutorial zu dem spezifischen Fehler in Abb. 14 <?page no="128"?> 128 Bettina Harriehausen-Mühlbauer Datei Navigation Profil Optionen UiHe — ■■■ ■■■■ . iS«i Wk Theform of questions There are two kmds of questions. Compare: YES/ NO QUESTION A yes/ no question can have the answer yes or no Are you ready? - Yes, just about. Have you got a pen? -No, sorry. Is it raining? ~ I don ‘I think so WH-QUESTION A wh-question begins with a question word, e g what, where: What have you done ? - Broken a glass. Where do you work? -At a supermarket When didyou arrive? ~ Just nan. In a question, an auxiliary verb comes before the subject. An auxiliary verb is a form of be or have or a modal ervb (e.g. can, should). For example: STATEMENT It is raining Paula was dancing. Bob has got a car. hamhaw.erme,cfltt,. QUESTION Atariltar/ Is What was Has „jkaxe... Subject it Paula Bob : #> raining? doing? got a car? Abb. 16: Breiteninformation aus dem Tutorial zum Fehler in Abb. 14 Abb. 17: Steuerung der Arbeitssession <?page no="129"?> NaLA - Hypertextgrammatik in CASTLE 129 Abb. 18: Statistische Information zu den bearbeiteten Übungen 4. Literatur Gerstl, Peter/ Grieszl, Andrea (1995): The castle System: Computer Assisted Tutoring and Learning Environment. Unveröffentl. Dokument. IBM Wissenschaftliches Zentrum. Heidelberg. Harriehausen, Bettina (1989): Don't give up on me or - Why grammars need to expand their scope of parsable input. In: Proceedings of the Second Conference on Arabic Computational Linguistics. Kuwait. 27-29. November 1989. Heidorn, George E. (1975): Augmented phrase structure grammars. In: Schank/ Nash- Webber (Hg.): Theoretical Issues in Natural Language Processing. Association for Computational Linguistics. Jensen, Karen (1986): peg 1986: A Broad-coverage Computational Syntax of English. Unveröffentl. Dokument, ibm T.J.Watson Research Center. Yorktown Heights, N Y. Nagao, M. (1988): Panel: Language Engineering: The Real Bottle Neck of Natural Language Processing. In: Proceedings of coling , 88, S. 448-449. <?page no="131"?> Klaus Vorderwülbecke Einblicke in „Einblicke“ - Ein Fernsehsprachkurs mit einer Multimedia-Komponente 1. Fakten über „Einblicke“ „Einblicke“ ist ein Fernsehsprachkurs im Medienverbund, der vom Auswärtigen Amt in Auftrag gegeben worden ist. Die Mittlerorganisationen Inter Nationes und Goethe-Institut koordinieren und leiten die Entwicklung der Medienverbundmaterialien. Die Projektlaufzeit begann 1993 und endet 1997. Der Medienverbund besteht aus folgenden Teilen: - Fernsehfilm - Videoversion des Films - Begleit- und Arbeitsbuch für den Selbstlerner (BAB) - Kursbuch für den gelenkten Unterricht (KB) - Mehrere Audiokassetten - Multimedia-Komponente (MM). Die Filme werden von einer Produktionsfirma in Frankfürt hergestellt. Die Manuskripte für das BAB, das KB und die Audiokassetten werden vom Goethe-Institut erarbeitet und von Inter Nationes produziert und zusammen mit den anderen Materialien weltweit vertrieben. Die MM-Entwicklung wird ebenfalls vom Goethe-Institut betreut. Zur Zeit werden zwei CD-ROMs von zwei kommerziellen Herstellern entwickelt. Die Kernzielgruppe sind junge Leute zwischen 17 und 30 Jahren in aller Welt, die schon fortgeschrittene Grundkenntnisse des Deutschen besitzen. Die Zielgruppe ist aufgeteilt in Selbstlerner, die mit dem Fernsehfilm, dem BAB, dem KB, den Audiokassetten und, falls die Ausstattung vorhanden ist, mit dem MM-Material arbeiten, sowie in Lernende, die im gesteuerten Unterricht, mit der Videoversion, dem KB und den Kassetten arbeiten. Die Struktur des Fernsehfilms sieht wie folgt aus: Es gibt insgesamt 20 Folgen ä 30 Minuten. Das sind 18 thematische Folgen, eine Einführungsfolge und eine Abschlußfolge. Die 18 inhaltlichen Folgen bestehen aus mehreren Elementen bzw. „Bausteinen“: <?page no="132"?> 132 Klaus Vordenvülbecke - Trailer und Collage (Visuell-akustische Hinfuhrung zum Thema) - Historischer Baustein (Rückblicke auf die Geschichte des Themas, meist auf das 20. Jahrhundert begrenzt) - Ein oder zwei dokumentarische Bausteine (Darstellung aktueller gesellschaftlicher, kultureller oder wirtschaftlicher Gegebenheiten in Deutschland) - Spielbaustein in zwei Teilen (fiktionale Geschichten im thematischen Rahmen des Themas) - Mehrere dazwischengeschaltete kurze Moderationsteile. Die Bausteine haben ein Länge von vier oder fünf Minuten, der Spielbaustein von acht oder zehn Minuten. Die in den 18 inhaltlichen Bausteinen behandelten Themen sind solche, die auch in entsprechenden Deutsch als Fremdsprache-Lehrbüchern gängig sind, wie zum Beispiel Familie, Wohnen, Urlaub, Jugend, Wirtschaft und Arbeit, Universität, Umwelt. Im Rahmen dieser Oberthemen behandeln die einzelnen Bausteine jeweils spezifische Aspekte. In der Folge Urlaub sind das zum Beispiel die Themen Auf Reisen (Geschichte der Urlaubsreisen), Abenteuer Urlaub (Extremsport Canyoning), Traumziel Mallorca und im Spielteil eine kleine Liebesgeschichte bei einem Urlaubsaufenthalt auf Rügen. Eine gute filmische Qualität und ein hoher Grad an Authentizität ohne Verzerrungen durch (verdeckte) sprachlich-grammatische Ziele war für alle Beteiligten sehr wichtig. Deshalb ist auch eine kommerzielle Filmproduktionsfirma mit der Realisierung beauftragt worden. Solche Maßstäbe sind leider nicht der Standard, weil man wohl oft zu unrecht meint, aufgrund der didaktischen Ziele eine mindere filmische Qualität in Kauf nehmen zu können. „Die Filmwirklichkeit unseres Untersuchungsgegenstandes leugnet hartnäckig die denkbare Leistungsfähigkeit des Mediums, indem sie beharrlich ignoriert, daß in den Köpfen ihrer Zielgruppe längst ein hochdifferenziertes System filmischer Zeichen entwickelt ist. Lernende schlucken diese filmische Dosenraviolikost, weil sie sich daran gewöhnt haben, daß Sprachlehrfilme nicht halten, was Film verspricht.“ (Hecht 1992, S. 90) Die Schwerpunktlernziele des Kurses sind Hörsehverstehen, Strategien zum Einordnen der landeskundlichen Informationen und eine begrenzte sprachliche Handlungsfähigkeit in Alltagssituationen, die mit dem Thema Zusammenhängen. In der Arbeit mit BAB, KB und Audiokassette werden auch die traditionellen Fertigkeiten Hörverstehen, Lesen und Schreiben ausgebildet. Die mündliche Kompetenz kann für den Selbstlerner natürlich nicht in der direkten Interaktion oder in Rollenspielen geübt werden. Hier bleibt das Programm im Bereich der kommunikationsvorbereitenden Aufgaben. <?page no="133"?> Einblicke in ,JLinblicke‘ 133 2. Medienverbund und Medienintegration Ich will nur summarisch die Vorteile eines traditionellen Medienverbundes ohne MM-Komponente den zusätzlich erwarteten Vorteilen eines guten Multimedia-Programms gegenüberstellen. Vorteile eines traditionellen Medienverbundes sind: - Eigenwert der einzelnen Medien bei Integration der Aufgaben und Arbeitsergebnisse - Schwerpunkt Setzung bei Medienauswahl je nach Lernertyp oder Lernbedürfnissen - Weltweite Verfügbarkeit von Fernsehen, Buch, Video- und Kassettengerät - Variable Einsatzorte: Buch und Kassette sind transportabel. Und was man nicht vergessen sollte: Der Medienverbund beläßt den einzelnen Medien ihre sinnliche Qualität, den Geruch von Papier, das Handhaben der Seiten, die Orientierung auf der Buchseite, die Möglichkeit hineinzuschreiben usw. Vorteile von (guten) Multimedia-Programmen sind: - Nicht-Linearität und damit extrem schneller Zugriff auf die Daten - Große Realitätsnähe des Materials besonders durch Videoeinbindung - Leichte Austauschbarkeit und damit Aktualisierbarkeit des Materials - Interaktivität - Lernerzentrierung und Selbstbestimmung (Lernziel, Lernweg, Verarbeitungstiefe) - Neue Zugangsweisen zu Material durch entdeckendes und handlungsorientiertes Lernen - Sofortige Ergebniskontrolle sowie große Zahl und Verschiedenartigkeit von Rückmeldungen für den Lerner - MM-spezifische Übungsformen, die zielgerichtet verschiedene Kombinationen der Medien anbieten können. (Für eine umfassende Liste aufgeteilt nach technisch/ technologischen bzw. didaktisch/ gestalterischen Merkmalen multimedialer Programme vgl. Bauer 1995, S. 380f.) Der Vorteil der o.a. Videoeinbindung besteht auch darin, dass das sprachliche und landeskundliche Material (wenn es nicht didaktisch manipuliert wurde) immer in authentischen Kontexten erscheint. Wir haben deshalb bewußt den <?page no="134"?> 134 Klaus Vorderwülbecke Drehbuchautoren keine sprachlichen, vor allem keine grammatischen Vorgaben gemacht. Die Lempsychologie hat schon lange erkannt, dass eine Information umso besser gespeichert wird, je stärker sie in sinnvollen Kontexten erscheint und je besser der Lerner sie in vorhandene Wissensschemata einordnen kann. „Eine Information ist ‘falsch gelernt’, wenn sie entweder ohne jeden Zusammenhang gelernt oder in einem unklaren, ja sogar falschen Bezugssystem untergebracht ist.“ (Rohrer 1984, S. 18) Die Einbeziehung des Mediums Film verbreitert die Inputbasis eines Lehrbuchs um ein Vielfaches. Grundelemente der direkten Kommunikation, die auch in Lehrwerken des kommunikativen Ansatzes vernachlässigt worden sind, wie Gestik, Mimik, Körpersprache, Geräusche und Bewegungen im Raum „bieten die Möglichkeit, die Lücken des Sprachverständnisses des bisherigen Lehrmaterials zu schließen“. (Schwerdtfeger 1989, S. 26) Ein so konzipierter Medienverbund ermöglicht auch einen vernünftigen und handhabbaren Grad an Autonomie, ohne die für den normalen Selbstlemer nötigen inhaltlichen und didaktischen Vorgaben zu vernachlässigen. Die Kombination von Medienverbund mit einem MM-Programm garantiert m.E. nach heutigem Standard die beste Möglichkeit zu reichhaltigem, vielfältigem sprachlich-situativem Input („rieh linguistic environment“). 3. Die Multimedia-Komponente 3.1 Risiken und Chancen Die Erwartungen sind riesengroß, das fachliche und didaktische Wissen steht in den Anfängen und die Erfahrungen sind minimal: Ich spreche vom Fremdsprachenlemen mit einem Multimedia-Programm. Solche Programme heute zu erstellen ist in mehrfacher Hinsicht ein Risiko: zum einen in finanzieller Hinsicht (die Entwicklung eines einstündigen MM-Lemprogramms kostet ca. 60 000 Mark). Deshalb haben sich vielleicht auch einige Verlage, die sich vor Jahren bei Lernsoftware engagiert haben, wieder aus diesem Bereich zurückgezogen, oder sie schließen sich für neue verlegerische Aktivitäten zusammen. Viele Produkte sind darüber hinaus oft nur Adaptionen von amerikanischen Programmen. Zum anderen ist es auch ein Risiko in didaktischer Hinsicht. Dass die Aufnahme von Information über mehrere Wahmehmungskanäle zu besseren Behaltensleistungen führt, ist zwar plausibel, aber noch nicht eindeutig empirisch bewiesen. (Weidenmann 1995, S. 68) Genau besehen gibt es keine ernsthafte didaktische Grundlage und schon gar keinen Zwang für die Verwendung von Computern im Sprachunterricht. Sie werden sozusagen auf Verdacht eingesetzt, „denn seine Legitimation als <?page no="135"?> Einblicke in Einblicke' 135 Lernmedizin bezieht der Computer bislang noch aus der Tatsache, dass es ihn gibt.“ (Göttmann 1996, S. 69f.) Die Fragestellung für Lehrende, Lernende und Lehrmaterialautoren sollte deshalb nicht lauten: „Wie kann ich Computer bzw. Multimedia-Programme beim Sprachlernen einsetzen“, sondern eher: „Wie kann ich meine Aufgaben und Ziele mit Hilfe von Computern bzw. Multimedia-Programmen besser erreichen? “ Vieles, was in der Werbung als interaktiv angepriesen wird, ist in Wahrheit oft ein bescheidenes und begrenztes Reagieren der Maschine auf mechanische Bewegungen des Lemers an Maus oder Tastatur. Dennoch: Man kann annehmen, dass die höhere Motivation, die die Arbeit mit einem guten Multimedia-Programm mit sich bringen kann, auch zu einer höheren Behaltensquote und damit zu besseren Lernergebnissen fuhrt. Obwohl die Entwicklung über relativ stupide Vokabeltrainer und sogenannte Drill-and-Practice-Vrogra.mme zu intelligenteren tutoriellen Systemen fortgeschritten ist, steht m.E. immer noch eine umfassende medienspezifische Aufgaben- und Übungstypologie aus. Der erste Versuch einer Übungstypologie im Bereich Deutsch als Fremdsprache ist gerade erschienen (Bayerlein 1996). Zu vieles von dem wenigen, was es im Fremdsprachenbereich gibt, sind Übertragungen von erprobten Arbeitsformen aus Lehrbüchern. Der Vorteil der Computerprogramme besteht oft nur im höheren Komfort und der Fähigkeit, statistische Angaben über die Leistung des Lerners zu machen. Der höhere Komfort darf aber m.E. nicht der einzige spezifische Mehrwert des Mediums sein. Die Einbindung von qualitativ guten Video Sequenzen in ein Lernprogramm kann vielleicht am ehesten auf der Programmseite die Forderung nach einem medienspezifischen Mehrwert von Lernsoftware erfüllen. Das verbessert die didaktisch-methodischen Möglichkeiten und die Breite des Einsatzes. Das Arbeiten mit realitätsnahen Videosequenzen fördert auch die Verfügbarkeit sprachlicher Elemente in spezifischen Situationen. Sie hilft damit, ein Defizit unseres Gedächtnisses zu überwinden, nämlich dass es „Informationen erheblich schneller und besser wiedererkennen als abrufen“ (Rohrer 1984, S. 31) kann. Damit wird auch die Forderung, in einem einzigen Medium die heute verfügbaren Wahrnehmungs- und Arbeitsmöglichkeiten zu integrieren, eingelöst. Die Lebensnähe solcher authentischer Videoausschnitte mit der entsprechenden didaktischen Aufbereitung ist das Nächstbeste zu einem Aufenthalt im Land der Zielsprache. Die Tatsache, dass Videosequenzen angeboten werden, garantiert allerdings allein noch keine bessere Lemausbeute. Videosequenzen können auch vom Lernziel ablenken und auf falsche Fährten führen. Wichtig ist also, in welches Umfeld von Aufgaben und Übungen, von Tonsequenzen, Textelementen und Standbildern diese filmischen Teile gestellt werden. <?page no="136"?> 136 Klaus Vordenvülbecke Trotz der erwähnten Bedenken ist es deshalb sinnvoll, das Risiko von moderner Lernsoftware-Entwicklung einzugehen, um auf die didaktische Entwicklung mit diesem Medium Einfluß nehmen zu können. Und für das Goethe-Institut war und ist es eine Chance für einen Modernitätsschub. Eine weitere Chance von MM-Lernprogrammen besteht darin, dass sie Lernersegmente mobilisieren können, die nie mehr eine Schulbank drücken würden, um eine Fremdsprache zu lernen. Als Hauptaufgabe der MM-Komponente im .K«W/ cfe-Medienverbund sehe ich die Möglichkeit der größeren Verarbeitungstiefe, die zu höherer Behaltbarkeit und Verfügbarkeit des Lernstoffes fuhrt. Erreicht wird dies u.a. durch: - Mehrkanaligkeit der Informationsaufhahme - Möglichkeit der (sinnvollen) Mehrfachbearbeitung von Aufgaben - Eigene Bestimmung des Lernwegs auf mehreren Niveaus - Handlungsorientierung z.B. durch Rollenübernahme, Planspiele und Simulationen. 3.2 Das CD-ROM-Programm zu „Einblicke“ Das CD-ROM-Programm gliedert sich in einen seriellen und in einen modularen Teil. Der serielle Teil enthält Aufgaben und Übungen, die sich auf die einzelnen der 18 inhaltlichen Folgen beziehen. Sie lehnen sich eng an den Film bzw. an das Lemprogramm im BAB an. 3.2.1 Der modulare Teil Die modulare Komponente besteht aus folgenden sieben Moduln: 1. Textbearbeitung 2. Wortschatz 3. landeskundliche Informationen 4. Grammatik 5. Phonetik 6. Sprechhandlungen 7. Spiel In den Moduln wird auf Themen, Informationen und Aufgaben aus allen 18 Folgen zurückgegriffen. Diese werden unter dem jeweiligen Thema des Moduls neu strukturiert und miteinander vernetzt. So kann man sich z.B. im Modul Sprechhandlung alle Begrüßungsszenen, die es im gesamten Filmmaterial <?page no="137"?> Einblicke in ,JEinblicke‘ 137 gibt, ansehen und als Übungsmaterial verwenden. Auf diese Weise erhält man nicht nur sprachliche und gestische Varianten, sondern z.T. auch alters- oder schichtenspezifische Ausprägungen derselben Sprechhandlung. Das oben erwähnte Informationsmodul vernetzt die landeskundlichen Informationen aus allen Filmen. Möglicherweise wird es durch Zusatzmaterial erweitert. Dieses Modul stellt also eine kleine landeskundliche Datenbank dar. Sie kann sowohl vom Selbstlemer als auch beim Einsatz im gesteuerten Unterricht für Projektarbeit genutzt werden, wie das schon häufiger beschrieben worden ist. 1 Diese Module können allerdings erst erstellt werden, wenn die seriellen Module entwickelt sind, weil sie sich zum größten Teil aus dem seriellen Material speisen. Insofern kann hier nur die Konzeption erläutert werden. Das soll am Beispiel des Wortschatzmoduls gezeigt werden. 2 Das Wortschatzmodul soll folgende drei Funktionen haben: 1. Referenzinstanz bei der Bearbeitung der anderen Module 2. Selbständiger Programmteil als Vokabeltrainer 3. Möglichkeit zur Integration von Lerner-Material. Die Referenzfünktion beinhaltet: - Wortartangabe - Bedeutungserklärung in der Zielsprache - Suchwort im Kontext - Synonyme und Antonyme - Einordnung in Kategorie (nach Kontaktschwelle DaF und Zertifikat DaF) - Zugriff auf Audiodateien - Evtl. Zugriff auf Videodateien - Eigene Sprachaufnahme. Der Vokabeltrainer beinhaltet: - Schablone für Unter- und Oberbegriffsgefüge - Schablone für Assoziationsnetz - Verschiedene Sortierkriterien (zufällig, nach Erfassungsdatum, nach dem letzten Lerndatum, nach Wortart, nach Kategorie, nach Erfolgsquote). 1 Vgl. Fechner (1992, S. 119ff.). 2 Die folgenden Angaben basieren auf den Entwürfen von Oliver Bayerlein. <?page no="138"?> 138 Klaus Vorderwülbecke Der Lerner kann also praktisch jedes Wort in einem Text anklicken und kommt damit über einen Hyperlink zu dem Worteintrag in der Wortliste mit Bedeutungserklärung und Beispielsatz. Er kann sich das Wort aus der Tondatei verspielen lassen und es aufhehmen. Gerade in der Situation des Lerners im weit entfernten Ausland mit wenig direkten oder medial vermittelten Kontakten zu Deutsch und Deutschsprachigen, ist dieses sprechende Wörterbuch eine sehr nützliche Hilfe. 3.2.2 Der serielle Teil Die serielle Komponente will ich etwas genauer vorstellen, da hierzu auch schon eine weitgehend fertiggestellte CD-ROM vorhanden ist. 3 Dieses Programm bezieht sich auf die Folge 2 des Fernsehsprachkurses mit dem Thema Miteinander und basiert auf der entsprechenden Lektion des BAB, die ich erarbeitet habe. Es geht in dieser Folge um die Entwicklung der Familie in Deutschland, um verschiedene Formen des Zusammenlebens, um eine Gruppe von jungen Leuten in Leipzig, die miteinander Theater spielen und im Spielteil um die Familie Koslowski, die in schwierigen Zeiten der Vater ist arbeitslos - Zusammenhalten muß. Entsprechend diesen vier Bausteinen ist auch das Programm in vier Aufgabengruppen arrangiert. Zu jedem Baustein gibt es vier bis sieben Aufgaben auf drei Niveaustufen. Insgesamt enthält das Programm 60 Aufgaben. Niveau 1 ist das niedrigste und Niveau 3 das höchste. Das mittlere Niveau 2 ist sozusagen das Standardniveau. D.h., es wird erwartet, dass ein Lerner mit den spezifizierten Vorkenntnissen die Aufgaben dieses Niveaus gut bearbeiten kann, dass ihn diese weder übernoch unterfordern. Wenn der Lerner das Niveau für unangemessen hält, kann er eine andere Niveaustufe wählen. Soweit es möglich war, sind unter der gleichen Aufgabennummer in den drei Niveaustufen inhaltlich gleiche oder ähnliche Aufgaben versammelt, deren Lösung aber zunehmend schwieriger wird. Dies wird z.B. erreicht durch Reduzierung oder Wegfall der Vorgaben oder durch die Forderung einer höheren Eigenleistung. So kann z.B. auf dem Niveau 1 die Zuordnung von Text zu einem Bild oder einer Videosequenz durch Anklicken und Herüberziehen des Textes unter das Bild erfolgen. Auf dem nächsthöheren Niveau muss der Text zunächst aus Vorgaben ergänzt werden, oder der Lerner muss inhaltliche 3 Die Projeküeitung für die geplanten beiden cd-roms liegt auf Seiten des Goethe-Instituts bei Timm Hassert. Die Produktion stammt von der Firma dkf Multimedia Münch & Partner in Hochheim bei Mainz. Für die Entwicklung der Konzeption und Übungsformen und der Erstellung des Drehbuchs ist Oliver Bayerlein verantwortlich in Zusammenarbeit mit Ulrich Hofmann von der Firma DKF. Die zweite vom Goethe-Institut in Auftrag gegebene CD-ROM wird von der Firma Siemens-Nixdorf entwickelt und soll im Frühjahr 1997 vorliegen. <?page no="139"?> Einblicke in „Einblicke' 139 Fehler finden und korrigieren. Noch eine Stufe höher kann eine Dialogrolle übernommen werden. Der entsprechende Text kann mit dem des anderen Originalsprechers aufgenommen und abgehört werden. Insgesamt gibt es eine relativ große Bandbreite von Aufgaben, die aufjeden Fall verschiedenen Lernertypen entgegenkommen sollten. Mit Hilfe des Einleitungsbildschirms kann sich der Lerner fiir eine der vier Aufgabengruppen zu den vier Bausteinen des Films entscheiden. Er kann dann auf der gewählten Niveaustufe von Aufgabe zu Aufgabe voranschreiten oder er kann sich bei jeder Aufgabe durch alle drei Niveaustufen bewegen. Der Abbruch ist jederzeit möglich, wie auch die Rückkehr zum Eingangssbildschirm. Im Rahmen jeder Aufgabe gibt es die Möglichkeit, sich Hilfen auf den Bildschirm zu holen. Auch die Rückmeldungen zu fehlerhaften Lösungen sind differenzierter als das übliche falsch. D.h., die Rückmeldung ist ein integraler Teil des Lernvorgangs. Auch bei Rechtschreibfehlern erfolgt nicht nur die pauschale Angabe falsch, sondern es wird differenziert, ob es sich um einen Buchstabendreher handelt, ob ein Buchstabe falsch oder zu viel geschrieben bzw. ausgelassen wurde. Die Art des Fehlers und die Fehlerstelle wird deutlich gemacht und bei der Rückmeldung genau markiert. Die Aufgaben sind so gestaltet, dass sie eindeutige Lösungen ermöglichen. Die Distraktoren sind nicht nur verbaler Art, sondern können auch aus den Ton- oder Videodateien stammen. In die Aufgaben ist eine relativ große Zahl von Videosequenzen integriert. Diese zusammen mit den Tondateien haben dazu geführt, dass für die 60 Aufgaben fast der ganze Speicherplatz einer CD- ROM benötigt wurde. Der Vorteil für den Lerner besteht darin, dass er sich praktisch alle wichtigen Sequenzen der vier Filme auf seinen Bildschirm holen kann. Damit ist auch eine Entkoppelung des Lernprogramms vom Film möglich und füngiert als sogenannte Stand-Alone-Version. Es ist also nicht erforderlich, dass der Lerner den Fernsehfilm verfolgt oder eine Videokopie davon zur Verfügung hat. Ich will zum Abschluß einige Aufgabetypen aus dem MM-Lemprogramm beschreiben und zur Illustration jeweils einen Bildschirmausdruck beifügen. A) Eine Aufgabensequenz in drei Niveauschritten aus dem Spielteil: Niveau 1: Vier verwürfelte Standbilder müssen in die Reihenfolge, wie sie im Film erscheinen, gebracht werden. Man kann es aus der Eirmerung an den Ablauf der Handlung direkt versuchen, man kann sich auch die Videosequenzen Vorspielen lassen. Nach einer falschen Lösung bietet das Programm das Ansehen der Videosequenz automatisch an. <?page no="140"?> 140 Klaus Vordenvillbecke Ctcdw-littm Ordnen Sie die Fllmsusscfanlne in die rictitige Reihenfolge. Sie können den Ton beliebig oft anhören. flUfikn. jfewia««rliel»{ Aufgabe 4 Abb. 1: Spielteil Niveau 1 Niveau 2: Ein großes Standbild, daneben ein Text mit sieben inhaltlichen Fehlern. Diese müssen gefunden und die richtigen Inhalte eingefugt werden. Kontrolle mit der entsprechenden Videosequenz. Die Lösung kann zu jeder Zeit eingeblendet werden. Niveau 3. Es wird ein kurzer Dialog aus dem Film mit dem Foto der beiden Dialogpartner angeboten. Der Lerner übernimmt eine der beiden Dialogrollen. Er kann seine Rolle im Wechsel mit dem Ton des Originalpartners aufnehmen und abhören. Zur Kontrolle kann er den Originaldialog hören. Diesen kann er natürlich auch am Anfang anhören, um sich die Klangbilder einzuprägen. <?page no="141"?> Einblicke in Einblicke' 141 Ste die l&tecbett Teyttcüe. Es gibt irtsgesamt sechs inhsitliche Fehler. t OC iiMt füEqsn Hl H •«•(»>••* l iwU t'j Aulgalic 4 Heule habe leb i Fußball yeujilelL Wir hahtj) wem«-r< m; <J Mijm-r hat &lfh geärgert; weil Ich <jo ^chmul^ig war, Mariou i: ,l wieUti xuj gekommrri, 'ile wer «ul ihfem Fieuful niidbjef am j. Vater hat muaef unch keine Zigaretten. Ale Mutter er-rlihtt hat dä$ Schuberts weg? kh»: n. hat sie eiue Idee gehabl. Sie bat sthueli das Radin gebul) und Matiou euic Slellenan? «5<je gezeigt. VieHnieht / »eh: : « wit jelyt auch wty. Abb. 2: Spielteil Niveau 2 Abb. 3: Spielteil Niveau 3 <?page no="142"?> 142 Klaus Vordenvülbecke B) Memory-Spiel: Auf dem Bildschirm sieht man die Rückseiten von zwölf Memory-Karten. Durch Anklicken erscheint entweder eine Videosequenz oder eine Tondatei. Der Lerner/ Spieler muß nun versuchen, zwei zusammenpassende Ton- und Bilddateien hintereinander anzuklicken. Dann wandern die Karten auf sein Konto. Der Spieler hat fünf Minuten Zeit. Das Spiel ist auch für zwei Mitspieler ausgelegt. Durch die Spielanlage werden die verschiedenen Bild- und Tondateien automatisch mehrfach abgespielt und prägen sich ein. Dabei hat der Lerner wahrscheinlich kaum das Gefühl, eine Wiederholungs- oder Einschleifübung gemacht zu haben. C) Fragen bestimmen: Neben einem Standbild sind fünf Fragen in Kästen angeordnet. Man lässt per Video zwei Antworten einspielen und muss die richtige Frage anklicken. Dann folgen vier weitere Videosequenzen mit derselben Aufgabenstellung. Memory; Finden Sie die richtigen Bäd/ Text - Paare. Heute gibt es viele Lebensformen in Deutschland Dennoch Die Familie lebt st«**«* Sie fötmen die Kdartchen «^de^cen. indem mit der Wae« attt&fcett« Sie aehaa dann entweder ab» : ^^osetpen? : »def: Sse; ihatew: Wen» Sie zwei {»aasende Kinchen twchete ander aaftifcfce». gehären sfeSme«, Bfc haben mt Mfmrttm Zeit* j Aufgabe? ^ FH; .< Abb. 4: Memory-Spiel <?page no="143"?> Einblicke in Einblicke* 143 Hören Sie die Antworten von Sabine und Peter, und klicken Sie auf die passenden Fragen. Nehmen Sie dann die Fragen selbst auf. ^*.****«< irtitiSfi WXMSi ■ , ' •; • • ^ Level3 iHfl ^ Aufgabe? "Warum habt Ihr geheiratet? " "Welche Erwartungen habt Ihr an Euren Ehepartner? " "Gab es noch andere Grunde für Eure Heirat? " ’Welche Bedeutung hat die Ehe für Euch? ” F«Iäv 2: ‘'MJftmamkr...” Abb. 5: Fragen bestimmen Sehen Sie den Film und ziehen Sie die Bilder in die passenden LUcken. NeoerVensudi BB<MSrtert>ac*i In so einem kleinen icht auch Spaß, aiies \M gemeinsam zu machen. Und man freut sich dann auch, daß dann | ein gemeinsames Produkt entsteht eben ein Theaterstück. Tanja'. Ich spiele die Flexe "Garnichtwild". Das ist meine erste in diesem StUck. also an sich Überhaupt meine erste Es ist eine sehr liebe Hexe, denke ich mal daß sie eine sehr liebe Hexe ist und die Kinder empfinden mich auch als sehr lieb und zuständig. Die Jugendlichen machen alles gemeinsam: den Text die Bühnenbild" " ^ Levall Aufgabe? Ill tY-ly* 2; Abb. 6: Wortschatz Theater <?page no="144"?> 144 Klaus Vordenvülbecke D) Thematischen Wortschatz einfuhren: Zu dem Film über die Leipziger Theatergruppe werden zunächst einige relevante Wörter eingefuhrt. Auf dem Bildschirm sind sieben Fotos angeordnet, beim Anklicken erscheint das passende Wort unter dem Foto. Im folgenden Bildschirm müssen diese Bilder ohne das Wort in die Lücken eines Dialogs gezogen werden. Dort verwandeln sie sich wieder in die entsprechenden Wörter. Die Hoffnung ist, dass der Kurs durch medienspezifische Übungen wie die oben beschriebenen auch einen praktischen Beitrag zur Herausarbeitung einer medienspezifischen Aufgaben- und Übungstypologie liefert. Dieser um die MM-Komponente angereicherte Medienverbund ist möglicherweise der ideale Mix, den man heute für das Lernen ohne Lehrer anbieten kann. Er bringt u.a. viel Authentisches aus Deutschland und eine gute Portion authentischer deutscher Sprache in die fernsten Weltwinkel. Er macht Vorgaben, bietet gestuftes Lemmaterial an und lässt dem Lemer doch viel Freiheit, seinen Lernweg zu planen und zu gehen. Vielleicht hat ein solcher Medienverbund eine gute Chance, die Forderung zu erfüllen, die Horst-Eberhard Piepho den Lehrenden auf der Tagung des Internationalen Deutschlehrerverbandes 1989 in Wien emphatisch zugerufen hat: „Hört auf zu lehren, laßt endlich lernen! “ 4. Literatur Bauer, Wolfgang (1995): Multimedia in der Schule? In: Issing, Ludwig J./ Klimsa, Paul (Hg ): Information und Lernen mit Multimedia. Weinheim. S. 377-399. Bayerlein, Oliver (1996): Versuch einer Übungstypologie für computergestützte Multimedia-Sprachkurse. In: Informationen Deutsch als Fremdsprache, 6, S. 726-736. Fechner, Jürgen (1992): Datenbanken im Unterricht. In: Bildungsarbeit in der Zweitsprache Deutsch, 3, S. 117-122. Göttmann, Hans (1996): Schreiben und üben mit dem PC. In: Informationen Deutsch als Fremdsprache, 2, S. 69-80. Hecht, Susanne (1992): Wamm eine didaktisch angepaßte Videoserie für den Anfängerunterricht. Deutsch als Fremdsprache mit erwachsenen Lemem von 16-100? In: Zielsprache Deutsch, 2, S. 90-94. Issing, Ludwig J./ Klimsa, Paul (Hg.) (1995): Information und Lernen mit Multimedia. Weinheim. Schwerdtfeger, Inge C. (1989): Sehen und Verstehen. Berlin etc. Rohrer, Josef (1984): Zur Rolle des Gedächtnisses beim Sprachenlemen. Bochum. Weidenmann, Bernd (1995): Multicodierung und Multimodalität im Lernprozeß. In: Issing, Ludwig J./ Klimsa, Paul (Hg.): Information und Lernen mit Multimedia. Weinheim. S. 65-84. <?page no="145"?> Matthias Kämmerer Hypertextualisierung gedruckter Wörterbuchtexte: Verweisstrukturen und Hyperlinks Eine Analyse anhand des FRÜHNEUHOCHDEUTSCHEN WÖRTERBUCHES 1. Einführendes Bevor auf Verweisstrukturen und Hyperlinks näher eingegangen werden kann, soll überblickartig dargelegt werden, was unter Verweisangaben und Hyperlinks verstanden werden soll. 1.1 Verweisangaben in der wörterbuchinternen Mediostruktur Die Mediostruktur (oder auch: Verweisstruktur) beschreibt die Verweisungsbeziehungen in einem Wörterbuch. Sie ist eine Struktur neben vielen anderen, beispielsweise der Mikrostruktur (vgl. z.B. Wiegand 1989 u. 1989a), der Positionsstruktur (vgl. z.B. Pan ZaipingAViegand 1995; Kämmerer 1995) oder der Makrostruktur (vgl. z.B. Wiegand 1989b). Innerhalb der Mediostrukturen werden die wörterbuchinternen Mediostrukturen von den intertextuellen Mediostrukturen geschieden, wobei bei den letzteren wiederum die wörterbuchvemetzenden Mediostrukturen von der quellenbezogenen und der literaturbezogenen unterschieden werden können (vgl. Wiegand 1994a). Hier soll es nur um die wörterbuchinternen Mediostrukturen gehen. Verweise sind kognitive Entitäten, die erst von einem Benutzer-in-actu aus den lexikographischen Daten, i.e. den (expliziten und impliziten und, wie unten noch gezeigt werden wird, den potentiellen) Verweisangaben und -kennzeichnungen, erschlossen (resp.: konstituiert) werden; Verweise sind damit Teil der lexikographischen Informationen. Im Wörterbuch selbst sind ausschließlich 'Verweisangaben zu finden, welche zu den lexikographischen Daten gehören. Die (wörterbuchinterne) Mediostruktur beschreibt schließlich die Struktur der Verweisungsbeziehungen im Wörterbuch. Eine Verweisangabe besteht gewöhnlich aus einer (elementaren) Verweisbeziehungsangabe und einer (elementaren) Verweisadressenangabe (oder auch: Verweiszielangabe). In Abb. 1 wird zur Verdeutlichung ein Beispiel gegeben. <?page no="146"?> 146 Matthias Kämmerer Verweisangabe A km / h [ka: em'ha: ] Kurzw t Stundenkilometer Verweisbeziehungsangabe Y Verweisadressenangabe Abb. 1: Wörterbuchartikel mkm/ h aus dem lgwdaf, S. 551, mit kommentierendem Metatext Nicht immer kann eine Verweisangabe fimktional-positional segmentiert werden (vgl. zur funktional-positionalen Segmentation z.B. Wiegand 1988 oder 1989). Ein Beispiel hierfür ist der Eintrag ei. [Ci: DUDEN-GFWB, S. 136] arisch (zu tArier): l.a) die Sprachen der tArier (1) betreffend; [...] In der Bedeutungsparaphrasenangabe „Die Sprachen ... betreffend“, das ein Textsegment und, da es funktional-positional elementar ist, auch ein Textelement ist, kann weder die Verweisbeziehungsangabe (= der Aufwärtspfeil) noch die Verweisadressenangabe (= „Arier (1)“) funktional-positional segmentiert werden, weshalb hier eigentlich gar keine Angaben vorliegen. Dennoch kann man „Die Sprachen ... betreffend“ bifunktional segmentieren, nämlich einerseits in die Bedeutungsparaphrasenangabe (= „Die Sprachen der tArier (1) betreffend“) und andererseits in eine Verweiskennzeichnung, die aus einer Verweisbeziehungskennzeichnung (= der Aufwärtspfeil) und einer Verweisadressenkennzeichnung (= „Arier (1)“) besteht. Es handelt sich damit um eine um eine Verweisbeziehungskennzeichnung binnenerweiterte Bedeutungsparaphrasenangabe (= BP(VerwBK)A). Manchmal findet sich bei der Verweisangabe keine Verweisbeziehungsangabe, so daß es sich (korrekt formuliert) um eine verdichtete (implizite) Verweisangabe handelt, die aus einer nichtverdichteten Verweisangabe durch Tilgung der Verweisbeziehungsangabe hervorgegangen ist. Beispielsweise könnte man sich in e 2 [e 2 : BROCKHAUS-BWB 1976, S. 379] Krake [norweg. krakje] der, -nl-n, 1) ein Kopffüßer, Abb. P 19. [...] vorstellen, daß die Verweisadressenangabe „ABB. P 19“ aus der Verweisangabe „s. ABB. P 19“ durch Tilgung der Verweisbeziehungsangabe „s.“ (für siehe) hervorgegangen ist. Charakteristisch für verdichtete (oder auch: implizite) Verweisangaben ist, daß sie vom Lexikographen intendiert und deshalb (meistens) im Vorwort zum Wörterbuch eingeführt sind. So auch hier, wo es in den „Bemerkungen für den Benutzer“ heißt: <?page no="147"?> Hypertextualisierung gedruckter Wörterbuchtexte 147 [Zj: BROCKHAUS-BWB 1976, S. 831] Worterklärende Bildgruppen und Übersichten ergänzen die Stichwörter des Textes. Die Abbildungen und die Übersichten sind innerhalb der Buchstaben fortlaufend numeriert. Die Kennziffer zum Aufsuchen eines Bildes besteht aus Buchstaben und Zahl, z. B. [...] Raumanzug, Abb. R 9. Die neunte Abbildung beim Buchstaben R >Raumfahrt< zeigt einen Raumanzug. Wenn die verdichtete Verweisangabe nicht funktional-positional segmentierbar ist, handelt es sich wiederum um eine verdichtete Verwexslcennzeichming. Die bisher betrachteten Verweisungen haben miteinander gemeinsam, daß sie vom Lexikographen intendiert sind. Sie sind entweder explizit genau dann, wenn eine Verweisbeziehungsangabe vorhanden ist, oder sie sind implizit genau dann, wenn die „Angabeform keine mediostrukturanzeigende Eigenschaft aufweist“ (Wiegand 1994a, S. 13) und dennoch eine Verweisung vom Lexikographen intendiert und im Wörterbuch selbst eingefuhrt ist, oder kurz: wenn die Verweisbeziehungsangabe (resp.: -kennzeichnung) in einem Textverdichtungsprozeß getilgt wurde. Daneben gibt es aber auch Textsegmente, aus denen ein Benutzer-in-actu einen Verweis erschließen kann, ohne daß eine verdichtete oder nichtverdichtete Verweisangabe (bzw. -kennzeichnung) vorliegt. Diese Art von (vom Benutzer konstituierten) Verweisen sollen potentielle Verweise genannt werden (vgl. Kammerer/ Lehr 1996). Ein Beispiel hierzu wäre folgender Wörterbuchartikel aus dem DUDEN-GFWB: [wai! DUDEN-GFWB, S. 668] lso|rhyth|misch: a) unabhängig von Tonhöhe u. Text rhythmisch sich wiederholend (in Kompositionen des ausgehenden Mittelalters); b) in allen Stimmen eines Satzes rhythmisch gleichbleibend (in kontrapunktischen Sätzen) In wai kann ein Benutzer-in-actu bei kontrapunktisch einen potentiellen Verweis erschließen. Es handelt sich hier um eine potentielle und nicht um eine implizite (verdichtete) Verweisangabe, da die Verweisungsfunktion von kontrapunktisch nirgends im DUDEN-GFWB eingefuhrt ist. Selbstverständlich geht mit der Einführung von potentiellen Verweisungen eine Inflation von Verweisen einher, denn schließlich kann jedes Wort, beispielsweise in der Bedeutungsparaphrasenangabe eines einsprachigen Wörterbuches, verweisinitiierend auf einen Benutzer-in-actu wirken. Deshalb wurde in Kammerer/ Lehr (1996) zwischen häufig und selten bzw. nie konstituierten potentiellen Verweisen unterschieden, die mittels eines quasi-algorithmischen Verfahrens ermittelt werden können (vgl. Kammerer/ Lehr 1996, S. 340). Damit intuitiv klarer wird, welche Textteile Anwärter auf potentielle Verweisangaben sind, wird an dieser Stelle eine Indizienliste aufgefiihrt: <?page no="148"?> 148 Matthias Kämmerer - Abkürzungen, insbesondere dann, wenn sie wörterbuchspezifisch sind, müssen als potentielle Verweisangaben interpretiert werden; jedes nicht-alpha-numerische Zeichen (wie z.B. oder in „ka: em'ha: “), dessen Funktion und Bedeutung in den Außentexten des Wörterbuches erläutert ist bzw. sein sollte, ist eine potentielle Verweisangabe; jedes Wort eines Wörterbuchartikels, das selbst zum Gegenstandsbereich desjenigen Wörterbuches gehört, in dem es steht, ist eine potentielle Verweisangabe. So kann z.B. in einem Fremdwörterbuch ein Wort, das weder Fremdnoch Lehnwort ist, keine potentielle Verweisangabe sein, wiewohl es dennoch auf einen Benutzer-in-actu verweisinitiierend wirken kann. Oder ein anderes Beispiel aus dem FWB: im weiter unten wiedergegebenen Wörterbuchartikel waa findet sich in Zeile 3f. das Wort „Titulatur“. Dieses Wort könnte dann verweisinitiierend wirken, wenn dessen Bedeutung von einem Wörterbuchbenutzer nicht gekannt wird, er aber dessen Bedeutung wissen will. Dennoch handelt es sich hier nicht um eine potentielle Verweisangabe, da Titulatur nicht zum Gegenstandsbereich des FWB gehört. Soviel zu Verweisen und Verweisangaben. 1.2 Hyperlinks Kuhlen (1991) stellt bezüglich Links (spezieller: Hyperlinks, die zwischen zwei informationeilen Einheiten [= IE; i.S.v. Kuhlen 1991, S. 79ff. 1 ] bestehen) fest: [z 2 : Kuhlen 1991, S. 102] Verknüpfungen („links“) sind nichts anderes als Relationen, die einzelne Objekte, in Hypertext: informationelle Einheiten, zueinander in Beziehung setzen. Unabhängig davon, ob diese Aussage als Definition gemeint ist oder nicht, soll sie im Folgenden diskutiert werden. - Zuerst einmal muß Zitat z 2 insofern korrigiert werden, als hier sicherlich nicht gemeint sein kann, daß Hyperlinks Relationen 2 sind, denn dann wären Hyperlinks Mengen und ein Hyperlink eine 1 Der Begriff der informationellen Einheit ist, wie Kuhlen (1991, S. 79) selbst ausdrücklich bemerkt, höchst schwierig und problemaüsch: weder läßt er sich extensional noch intensional exakt definieren. Seiner Ansicht nach ist eine funktionale Charakterisierung am geeignetsten. - Daß informationelle Einheiten keine Informationen darstellen, da Informationen intraindividuelle Entitäten sind und erst durch einen Benutzer-in-actu aus bestimmten Daten erarbeitet werden, darauf weist Kuhlen (1991, S. 80f.) explizit hin; deshalb müßte man eigentlich von potentiellen informationellen Einheiten sprechen. 2 Der Begriff der Relation muß extensional als eine Menge von n-Tupeln (mit n > 1) verstanden werden. <?page no="149"?> Hypertextualisierung gedruckter Wörterbuchtexte 149 Menge! Daß eine solche Hyperlink-Konzeption wenig sinnvoll ist, dürfte sofort einsichtig sein. Vielmehr muß das Zitat z 2 so verstanden werden, daß Hyperlinks nicht Relationen, sondern daß Hyperlinks eine Relation sind, nämlich eine Menge von n-Tupeln. Welche Kardinalität n besitzt, läßt Kuhlen (1991, S. 102) offen; denkbar wäre beispielsweise, daß n = 3 ist. Dies wäre bei folgender Relation der Fall: Hyperlinks = D e/ i {(x, y, z) | x, y, z e MEE und es trifft der folgende Relationsterm zu: x steht zwischen y und z}. wobei „MCE“ eine Abkürzung für Menge der informationellen Einheiten ist. Aber dies ist sicherlich auch nicht gemeint, sondern wohl am ehesten folgendes: Hyperlinks sind eine Menge von geordneten Paaren (x, y), welche die folgenden Bedingungen erfüllen: Hyperlinks = De p {(x, y) | x, y e ME und es gilt: x steht in einer bestimmten Beziehung B zu y}. Demgemäß müßte man auch von folgenden beiden Beispielen sagen können, daß es sich um Hyperlinks handelt: Abb. 2: Zwei Beispiele ((1) und (2)) mit jeweils einem Hyperlink nach Kuhlen (1991, S. 102); Abkürzungen: IE = informationelle Einheit; B = Beziehung; Vj = Verknüpfungsanzeiger ; Im ersten Fall gehören sowohl IE_1 = Teilnehmer als auch IE_2 = Teilnehmerin der Menge der informationellen Einheiten an; und es besteht sowohl von IE_1 zu IE_2 als auch von IE_2 zu IE_1 eine Beziehung, nämlich in diesem Fall eine semantische. Man könnte diese Beziehungen etwa durch folgende Relationsterme (RT) wiedergeben: RT] = x ist das grammatische feminine Korrelat zu y; und: RT 2 = x ist das grammatische maskuline Korrelat zu y. <?page no="150"?> 150 Matthias Kämmerer Damit müßte nach der Festsetzung von Kuhlen zwischen IE_1 und IE_2 ein Hyperlink bestehen, was allein auf Grund des Nachweises, daß sich Relationsterme (nämlich: RTi und RT 2 ) formulieren lassen, sicher nicht der Fall ist. M.a.W.: die im Zitat z 2 genannte Relation müßte durch das Nennen eines konkreten Relationsterms spezifiziert werden, um sie von solchen Relationen, wie sie in diesem Absatz genannt wurden, zu unterscheiden. Im Beispiel 2 sind wiederum zwei informationeile Einheiten gegeben, nämlich IE_1 und IE_2. Diesmal bestehen von IE_1 nach IE_2 zwei virtuelle Verbindungen, angedeutet durch die beiden Pfeile. Da die Pfeile mit demselben Relationsterm B gekennzeichnet sind, wird durch sie dieselbe Beziehung von IE_1 nach IE_2 symbolisiert. Nimmt man nun die Ausführung von Kuhlen ernst, so existiert im zweiten Beispiel nach Kuhlen nur ein einziger Hyperlink, nämlich derjenige, der durch das Tupel (IE_1, IE_2) beschrieben wird, denn die Beziehung zwischen den beiden informationeilen Einheiten ist dieselbe. Es ist jedoch offensichtlich, daß hier zwei Hyperlinks von IE_1 nach IE 2 bestehen. Aber selbst angenommen, die Beziehungen (also: RT) von IE_1 nach IE_2 im zweiten Beispiel wären verschieden, so wäre in der Menge der Hyperlinks schließlich doch nur das geordnete Paar (IE_1, IE_2)! Man könnte nun einwenden, daß im Zitat z 2 unter einem Hyperlink kein 2- Tupel von informationeilen Einheiten, sondern ein 2-Tupel verstanden wird, das aus einem Relationsterm RT und einer Menge von geordneten Paaren (IE_1, IE_2) besteht, auf die der Relationsterm RT zutrifft. Aber auch dies würde nichts ändern: Im Beispiel 1 bestünden weiterhin zwei Hyperlinks, nämlich: (RT = x ist grammatisches feminines Genuskorrelat von y, {(IE_2, IE_1)}) sowie (RT = x ist grammatisches maskulines Genuskorrelat von y, {(IE_1, IE_2)}); und im zweiten Beispiel wäre nur folgender Hyperlink vorhanden: (RT, {(IE_1, IE_2) > <IE_1, IE_2)}>, was dasselbe ist wie: (RT, {<IE_1, IE_2)}>. <?page no="151"?> Hypertextualisierung gedruckter Wörterbuchtexte 151 Auf Grund dieser Überlegungen sollen Hyperlinks hier verstanden werden als ein Tupel, bestehend aus einem Verknüpfungsanzeiger und einer Adressenangabe 3 , also: Hyperlinks = De p «x, y) | x ist ein Verknüpfungsanzeiger, y ist eine Adressenangabe und es gilt: RT = y ist die zum Verknüpfungsanzeiger x zugehörige Adressenangabe} Zu dieser Festlegung sind sechs Bemerkungen notwendig: 1. Das Wort Verknüpfungsanzeiger mag suggerieren, daß dieser als ein solcher sofort erkennbar sein muß, beispielsweise als Button dies ist aber nicht der Fall. So kann auch ein Hintergrund, der weder vom Hypertext als Verknüpfungsanzeiger noch auf irgendeine andere Weise in dieser Funktion eingefuhrt ist, ein Verknüpfungsanzeiger sein, selbst dann, wenn, wie gesagt, davon auf den ersten Blick vom Benutzer gar nichts zu ‘sehen’ ist. 2. Bezüglich des Verknüpfungsanzeigers soll außerdem nichts darüber ausgesagt sein, wie dieser aktiviert werden kann: ob durch Mausklick, durch Spracheingabe, oder ob die Aktivierung gar vom Benutzerstatus abhängig ist. Es wäre sogar denkbar, daß ein Hyperlink i.S.d. obigen Definition besteht, ohne daß über den Verknüpfungsanzeiger der Hyperlink aktiviert werden könnte. 3. Bei der Adressenangabe handelt es sich um die Angabe einer Adresse und nicht um die Adresse selbst! Die Adresse selbst ist unlösbar mit demjenigen Objekt verbunden, dessen Lokalität sie angibt. Das bedeutet auch, daß, wenn zwei Objekte Oi und 0 2 verschieden sind, die dazugehörigen Adressen Ai und A 2 verschieden sein müssen. 4. Die hier vorgeschlagene Definition besagt nicht, daß ein Hyperlink nicht von einem bestimmten Typ sein kann und u.U. einen bestimmten Namen hat etc. aber diese Eigenschaften gehören nicht genuin zu einem Hyperlink, sondern sind fakultativ. Sie können, je nach dem, ob man z.B. einen Hyperlinktyp oder Hyperlinknamen definieren will, das obige 2-Tupel zu einem 3- Tupel oder 4-Tupel (etc.) erweitern. 5. Hyperlinks sind nach Definition 3 Funktionen: Die Menge aller x; ist der Definitionsbereich und die Menge allere der Wertebereich (mit i,j elN*). Der Relationsterm stellt die Abbildungsvorschrift dar. Die Relation selbst ist linkstotal und rechtseindeutig, und dies hat zur Folge, daß es sich bei der obigen Relation um eine Funktion handelt. Während die Aussage, daß die in Definition 3 wiedergegebene Relation rechtseindeutig ist, m.E unproble- 3 Es ist selbstverständlich, daß die Adressenangabe der Syntax des Hypertextsystems entsprechen muß. Vorausgesetzt wird jedoch nicht, daß eine IE unter der entsprechenden Adresse existiert! So ist es auch möglich, daß ein Hyperlink auf eine nicht definierte IE zeigt dennoch handelt es sich i.S.d. Definition 3 um einen Hyperlink. <?page no="152"?> 152 Matthias Kämmerer matisch sein dürfte, könnte die Linkstotalität in Frage gestellt werden. Hierzu sei Folgendes bemerkt: Die Eigenschaft, daß ein Objekt ein Verknüpfungsanzeiger ist, impliziert, daß mit diesem Verknüpfungsanzeiger eine Adressenangabe korreliert ist sonst könnte es sich gar nicht um einen Verknüpfungsanzeiger handeln. Aus diesem Grund ist die obige Relation linkstotal. 6. Auch Definition 3 ist sicherlich noch ergänzungs- und verbesserungswürdig dennoch genügt sie m.E. für die hiesigen Belange. Gemäß Definition 3 von Hyperlinks bestehen im obigen ersten Beispiel keine Hyperlinks zwischen IE_1 und IE_2, denn es ist weder ein Verknüpfungsanzeiger noch eine Adressenangabe vorhanden, und im zweiten Beispiel bestehen selbstverständlich zwei Hyperlinks, nämlich (Verknüpfungsanzeiger_l, Adressenangabe_von_IE_2) und (Verknüpfungsanzeiger_2, Adressenangabe_von_IE_2). Links (i.allg.) und insbesondere Hyperlinks haben nach Kuhlen (1991) verschiedene Eigenschaften. Einige davon sollen abschließend überblickartig genannt werden: 1. Anzeigeart der adressierten IE: a) die Quell-IE ersetzend b) in die Quell-IE eingebettet c) parallel bzgl. der Quell-IE. 2. Position des Verknüpfungsanzeigers: a) im Text b) außerhalb des Textes: a) innerhalb der IE ß) außerhalb der IE (beispielsweise im Menü). 3. Verknüpfungsart mit der adressierten IE (vgl. Kuhlen 1991, S. 107f): a) intrahypertextuell (i.e.: von einer IE_1 besteht in dieselbe IE_1 eine unmittelbare Verknüpfung; dies ist natürlich nur sinnvoll, wenn die IE größer als der Bildschirm ist): d) unidirektional ß) bidirektional b) interhypertextuell (i.e.: es besteht eine Verknüpfung von einer IE_1 zu einer EE_2): d) unidirektional ß) bidirektional <?page no="153"?> Hypertextualisierung gedruckter Wörterbuchtexte 153 c) extrahypertextuell (i.e.: es besteht eine Verknüpfung von einer IE_1 die zur Hypertextbasis 1 gehört, zu einer IE_2, die nicht zur Hypertextbasis 1 gehört): a) unidirektional ß) bidirektional. Man könnte dieser Auflistung sicherlich noch weitere Punkte hinzufugen, wovon hier jedoch nur noch einer genannt werden soll: 4. Status der adressierten IE: a) episodisch, d.h.: nach der Aktivierung der adressierten IE wird nach einer weiteren Aktion seitens des Benutzers (meist mit der Maus) zur Quell-IE zurückgesprungen, derlei IE sind meist als (eingebettete oder parallele) Popups organisiert. Das bedeutet, daß von der adressierten IE nur zurückgesprungen und nicht weiter verzweigt werden kann. b) weiterführend, d.h.: in der adressierten IE gibt es die Möglichkeit, weiter zu verzweigen. 2. Allgemeine Überlegungen zu einer Hypertextualisierung Wörterbücher liegen bis dato größtenteils immer noch als Print-Wörterbücher und nicht in elektronischer Form, beispielsweise als Hypertext, vor. Dies hat einen seiner Gründe sicherlich darin, daß die elektronische Datenverarbeitung ein relativ junges Phänomen gegenüber dem überkommenen Kulturgut Buch ist. Wenn man nun dafür plädiert, bestehende Print-Wörterbücher in das elektronische Medium zu übertragen, ist es notwendig, ein paar (gute) Gründe dafür angeben zu können. Dies soll hier einleitend geschehen. Nach Conklin (1989, S. 38), der teilweise von einem idealisierten Hypertextsystem ausgeht, kann man folgende Argumente anführen: - Verweisen kann sofort und mühelos nachgegangen werden; dies ist insbesondere in Wörterbüchern mit komplexen Medio Strukturen von Vorteil. - Der Benutzer kann zusätzliche Verbindungen zwischen den IE erzeugen - Die Daten sind strukturiert (z.B. hierarchisch). 4 - Mittels eines Browsers erhält man Einblick in die Organisation der Daten, dies kann aber bei zu komplizierten Datenstrukturen in sein Gegenteil Umschlagen. 4 Selbstverständlich sind die lexikographischen Daten in einem Print-Wörterbuch ebenfalls strukturiert; einige Strukturen sind z.B. die eingangs erwähnte Mikrostruktur oder Makrostruktur. <?page no="154"?> 154 Matthias Kämmerer - IE können beliebig oft und in beliebiger Weise kombiniert werden. - Die Modularität des Aufbaus ermöglicht es, eine Information nur einmal formulieren zu müssen. - Die Konsistenz wird (idealerweise) gewährleistet: falls eine IE innerhalb der Struktur der Hypertextbasis verschoben wird, werden die entsprechenden Referentialisierungen aktualisiert. - Die Ergebnisse verschiedener Suchanfragen können auf dem Bildschirm parallel angezeigt werden. - Mehrere Autoren können gleichzeitig an einem Text arbeiten. Schließlich soll dieser Auflistung noch hinzugefugt werden, daß Hypertext das ideale Medium für das postmodeme Wissen darstellt; nach Lyotard (1986, S. 151f.) gilt nämlich für das postmoderne Wissen: „[. . .] in den Spielen mit vollständiger Information kann die höchste Performativität per hypothesin nicht im Erwerb einer [...] Ergänzung [der Information; M.K.] bestehen. Sie ergibt sich aus einer neuen Anordnung von Daten, die eben einen , Spielzug“ darstellen. Diese neue Anordnung wird meist durch die Verknüpfung von Datenreihen erreicht, die bis dahin für unabhängig gehalten wurden. Man kann diese Fähigkeit, zusammen zu artikulieren, was nicht zusammen war, als Phantasie {imagination) bezeichnen.“ Dennoch kann man daraus nicht den Schluß ziehen, daß ein Hypertextsystem mit seiner nonlinearen Organisationsform dem Buch, das seine Daten linear präsentiert, grundsätzlich überlegen ist. McKnight präzisiert vielmehr auf Grund von diversen Experimenten: [z 3 : McKnight et al. 1991, S. 60f] „[...] each medium has its own inherent advantages and shortcomings, e g., hypertext is better than paper when locating specific information that is contained within the body of text but seems to offer no clear advantage when readers have only an approximate idea of what they are looking for. When readers access a text for the first time on a subject for which they have no specialist knowledge and cannot formulate a precise search parameter, the familiarity of paper seems to confer advantages.“ Vergegenwärtigt man sich nach dem Gesagten die Spezifika von Hypertexten, dann liegt es auf der Hand zu sagen, daß Wörterbücher zu den idealen Textsortenträgern gehören, die in einem Hypertextsystem modelliert werden können. Gerade ihre genuine Mediostruktur legt eine Übertragung in eine Hyperlinkstruktur nahe, denn das Buch als lineares Medium kann diese Struktur nicht befriedigend wiedergeben. Hypertexte mit ihren nonlinearen Hyperlinkstrukturen scheinen dafür weitaus besser geeignet. So kann man zuerst einmal die Behauptung aufstellen, daß jede verdichtete und nichtverdichtete Verweis- <?page no="155"?> Hypertextualisierung gedruckter Wörterbuchtexte 155 angabe und -kennzeichnung als auch ggf. alle potentiellen Verweise durch einen Hyperlink simuliert und redefiniert werden müssen. Das heißt: derjenige Text-ausschnitt, 5 dem eine verdichtete bzw. nichtverdichtete Verweisangabe oder -kennzeichnung entspricht, wird zum Verknüpfungsanzeiger, und die Adresse derjenigen lEj, die das betreffende Datensegment enthält, auf welches verwiesen wird, wird in der dazugehörenden Adressenangabe genannt. Dies scheint auf den ersten Blick recht einfach. Deshalb soll jetzt im einzelnen geprüft werden, inwiefern eine Übersetzung der Mediostruktur in eine Hyperlinkstruktur möglich und sinnvoll ist und wann andere Techniken zu bevorzugen sind. Ein Wörterbuch besteht aus einem Vorspann, dem zentralen Wörterverzeichnis und einem Nachspann. Demnach gibt es 3 2 = 9 verschiedene Möglichkeiten, um von einem der Wörterbuchteile auf einen anderen (auch auf sich selbst) zu verweisen. Die Abb. 3 verdeutlicht diesen Zusammenhang. Abb. 3: Verweisungsmöglichkeiten zwischen Vorspann, zentralem Wörterverzeichnis und Nachspann Ist der Hypertext modular organisiert, so bietet es sich an, für den Vorspann, das zentrale Wörterverzeichnis und den Nachspann je eine eigene Hypertextbasis zu erstellen, die über Hyperlinks miteinander verbunden sind. Demnach sind alle Hyperlinks, die zwei verschiedene Wörterbuchteile miteinander verbinden, extrahypertextuelle Verknüpfungen. Alle anderen Hyperlinks können entweder intrahypertextuelle oder interhypertextuelle Verknüpfungen sein. Analysiert man ein spezifisches Wörterbuch hinsichtlich seiner Mediostruktur genauer, z.B. das LGWDAF (vgl. Kämmerer 1998), dann kann sich eine etwas komplexere Struktur ergeben (vgl. Abb. 4), wobei in diesem Fall nicht einmal annähernd sämtliche Möglichkeiten ausgeschöpft wurden. Beispielsweise gibt es keine Verweisungen aus dem Nachspann oder aus dem zentralen Wörterverzeichnis in den Vorspann hinein. 5 Mit Textausschnitt wird hier kein fimktional-positional segmentierbares Textsegment bezeichnet, sondern jede beliebige (zusammenhängende) Kette K von Elementen a eines Alphabets A, die Teil einer (aus Zeichen zusammengesetzten) Textinstanz ist. <?page no="156"?> 156 Matthias Kämmerer VORSPANN ZENTRALES WÖRTERVERZEICHNIS NACHSPANN Abkützungsvejzachnis Langenscheidts Großwbr* terb. DaF auf einen Hick Daumenregister Titel Titelrückseite Inhaltsverzeichnis Vorwort Lexikographische Vortsemerkungen Hrwvei nutzer Hrweise für den Be- Abb. 4: Die Mediostruktur des lgwdaf Abkürzungen: bt = Binnentext; wa = Wörterbuchartikel; BiTa = Bildtafel; BTR = Bildtafelregister; „ > “ als Pfeilspitze bedeutet soviel wie die Verweisangabe bezieht sich auf alle Elemente der Klasse (hier: der Binnentexte sowie der Wörterbuchartikel)', als Pfeilspitze bedeutet soviel wie die Verweisangabe bezieht sich auf, „ “ als Pfeilschaft bedeutet soviel wie implizite Verweisangabe', „ “ als Pfeilschaft bedeutet soviel wie explizite Verweisangabe', bedeutet soviel wie vom Benutzer kann ein Verweis auf etwas erschlossen werden', „-g]“ bedeutet soviel wie vom Benutzer kann ein Verweis in etwas erschlossen werden Anmerkung: Wie die Schatten bei den Binnentexten, den Bildtafeln und den Bildtafelregistem bereits suggerieren, gehören diese nicht zum zentralen Wörterverzeichnis, sondern befinden sich außerhalb. Natürlich genügt es nicht, sich darüber Gedanken zu machen, ob man den Vor- und den Nachspann jeweils in einer gesonderten Hypertextbasis modellieren soll oder nicht; es stellt sich auch sofort die Frage, wie groß die IE maximal sein sollen, d.h.: kann man immer davon ausgehen, daß ein Wörterbuchartikel genau einer IE entspricht? Zwar mag bei einer großen Anzahl von Wörterbuchartikeln dieses Verhältnis optimal sein, spätestens dann aber muß diese Frage erneut gestellt werden, wenn die IE größer als eine Bildschirmseite ist, wenn also der Wörterbuchartikel nicht mehr vollständig auf einer Seite präsentiert werden kann. <?page no="157"?> Hypertextualisierung gedruckter Wörterbuchtexte 157 Nach Kuhlen (1991, S. 78) sind klassischerweise fünf Schritte notwendig, um eine Hypertextbasis zu modellieren, wobei hier nichts weiter über die Problematik der einzelnen Modellierungsschritte gesagt werden soll: 1.1 Identifikation der IE; 1.2 Eingrenzung der IE; 1.3 Benennung der IE; 1.4 Strukturierung (Attribuierung) der IE; 2. Verknüpfung der IE. Ein weiterer Problempunkt ist, wie die Konvertierung durchgefuhrt werden soll. Nach Kuhlen (vgl. im folgenden: Kuhlen 1991, S. 163-174) gibt es vier Möglichkeiten, einen (linearen) Text in eine Hypertextbasis zu überführen: 1. Die 1: 1-Übertragung: Ergebnis dieses Verfahrens ist lediglich eine On-line- Version des geschriebenen Textes, also kein Hypertext im eigentlichen Sinne, da das gesamte Dokument eine einzige IE darstellt; der Vorteil ist jedoch, daß selbstverständlich keine Segmentierungsprobleme auftreten. 2. Konvertierung auf der Grundlage einer vorgängigen makrostrukturellen Analyse: Hier werden formale Texteigenschaften (wie z.B. Absätze) benutzt, um IE daraus zu gewinnen. Die Prämisse für eine erfolgreiche Durchführung dieser Konvertierungsform ist, daß die einzelnen Absätze kohäsiv 6 sind! Da man aber in den meisten Fällen nicht davon ausgehen kann, müssen i.allg. die IE redaktionell nochmals überarbeitet werden. Die Verknüpfungen müssen, falls nicht formale Eigenschaften genügen, in einem weiteren Arbeitsgang erstellt werden. 3. Neumodellierung der Informationen unter Beachtung der Kohäsionsforderung für die IE. In diesem Fall wird die Hypertextbasis auf der Grundlage eines Textes, dessen Absätze z.B. nicht kohäsiv sind, völlig neu erstellt werden, und zwar derart, daß die gewonnenen IE kohäsiv sind. 4. Konvertierung mehrerer Texte in eine Hypertextbasis'. Was diese Konvertierungsform betrifft, treten hier dieselben Probleme auf wie bereits unter 2. und 3. genannt; zusätzlich sind aber noch Duplizitäts- und Ähnlichkeitskontrollen erforderlich. 6 Vgl. hierzu: Wiegand (1993[94], S. 248): „Ein [...] Text ist kohäsiv, wenn er auf der syntaktischen, propositionalen und referentiellen Ebene einen Zusammenhang herstellt [...]“ - Kuhlen (1991, S. 87) spricht in diesem Zusammenhang von kohäsiver Geschlossenheit: „Mit .kohäsiver Geschlossenheit 1 meinen wir, daß in informationeilen Einheiten nicht auf die in Texten üblichen kohäsiven Gestaltungsmittel über die Grenzen von Einheiten hinweg zurückgegriffen werden kann [...]“. Da bei diesem Verfahren der Konvertierung aus einer größeren Textinstanz (beispielsweise einem konkreten, in maschinenlesbarer Form und extraindividuell vorliegenden Roman) kleinere Textinstanzen (beispielsweise Absätze) quasi herausgeschnitten werden, die dann als IE fungieren sollen, muß (in der Terminologie von Wiegand 1993[94], S. 248) gefordert werden, daß die durch die Konvertierang gewonnenen Textinstanzen als Texte kohäsiv gesättigt sind; ein Text ist kohäsiv gesättigt, wenn er „[...] keine oder keine ungesättigten Proformen [...]“ enthält (ebd.). <?page no="158"?> 158 Matthias Kämmerer Generell müssen neue (geeignete) Zugriffsstrukturen (wie Inhaltsverzeichnis, Glossar, Register etc.) angelegt werden. Als besonders zur Konvertierung geeignete Texte nennt Kuhlen (1991, S. 175) Wörterbücher, Lexika, Handbücher, Enzyklopädien sowie didaktische Texte. Betrachten wir nun die einzelnen Verweisungsmöglichkeiten und die Möglichkeiten von deren Modellierung in einem Hypertextsystem in einem konkreten Beispiel. Es handelt sich hier zuerst einmal um „naive“ Überlegungen, die nachfolgend problematisiert werden. ,JVaive“ Konvertierungshypothesen: (Hl) Findet sich in einem Wörterbuchartikel eine nichtverdichtete Verweisangabe oder -kennzeichnung, so muß lediglich die Verweisbeziehungsangabe getilgt und aus der Verweisadressenangabe ein Hyperlink auf die entsprechende IE erstellt werden. Da die Verweisbeziehungsangaben meist von einer bestimmten semiotischen Form sind (beispielsweise ein Aufwärtspfeil), können diese bei einem maschinenlesbaren Satzband schnell maschinell gesucht und der Hyperlink u.U. sogar maschinell erzeugt werden. (H2) Bei verdichteten Verweisangaben und -kennzeichnungen gestaltet sich das systematische maschinelle Aufsuchen schwieriger, obwohl es auch hier Anhaltspunkte geben mag, beispielsweise dann, wenn man weiß, daß verdichtete Verweisangaben und -kennzeichnungen nur in bestimmten Textsegmenten auftreten; dies setzt allerdings ein bereits geparstes Satzband voraus (vgl. hierzu z B.: Bläsi et al. 1994[95]; Hauser/ Storrer 1993[94] u. Storrer 1996). Hier sind dann ebenfalls die Verweisadressen durch Hyperlinks, d.h. durch Verknüpfungsanzeiger plus einer Adressenangabe, zu ersetzen. (H3) In jeder Hinsicht problematisch wird es spätestens dann, wenn es um potentielle Verweisangaben geht. In diesem Fall muß der ganze Text genauestens untersucht werden, und es muß von Mal zu Mal aufs neue entschieden werden, ob ein Hyperlink definiert werden soll oder nicht vorausgesetzt, es wurde vorher erkannt, daß ein Benutzer anhand eines bestimmten Textteils einen potentiellen Verweis erschließen könnte! 3. Problematisierung der „naiven“ Konvertierungshypothesen anhand des Wörterbuchartikels zu arbeitsam aus dem FWB Zur Verifizierung (bzw. Falsifizierung) des im vorangegangenen Kapitel Gesagten soll der Wörterbuchartikel zu arbeitsam aus dem FWB untersucht werden. Dazu wird zunächst einmal der Wörterbuchartikel zu arbeitsam wiedergegeben, wobei sämtliche verdichteten und nichtverdichteten Verweisadressenangaben und -kennzeichnungen unterstrichen sind; alle potentiellen Verweisangaben und -kennzeichnungen sind unterpunktet. <?page no="159"?> Hypertextualisierung gedruckter Wörterbuchtexte 159 [wa 2 : FWB, 1, S. 49f.] arbeitsam, auch arbeitsamlich, Adj, 1. beschwerlich, mühevoll, mühselige teilweise mit der Nuance >asketisch, enthaltsam< (vgl, arbeit 3: arbeiten 3); offen zu 2; zu arbeit 1. arbeiten 1. — Gesamtfrnhd. —• Bdy,: arbeitig, arbeitselig 1. mühselig (häufig), schwer, unglükhaft. — Synt,: etw, a, leiden, a, aufden berg klimmen, alter / gebürt sein a,\ a, elend / handel / werk. Ziesemer. Proph. Crane. Jer. 6, 11 (preu" M ; 14.Jh ; ): so byn ich yol des giymmis des Herren und ist mir arbeitsam dis zu lidene. Quint. Eckharts Trakt. 249. 6 (E : 13./ A, 14.Jh ): Den Hüten mac yprhte und krankheit da von körnen, daz unsers herren Jesü Kristi leben und der heiligen also strenge und arbeitsam was. Jungbi.uth. J. v. Saaz. Ackermann 20, 20 (Hs, omd„ 1465 ): es [alter] ist süchtig arbeitsam, ungestalt, kalt und allen leuten übel gefallen, Kurrf.i.mf.yer. Dt. Bibel 8, 172, 16 (Straßb, 1466): Wann auch der haffner der druckt zesamen die waichen erde arbeit sqmlich macht er ein ieglich yqße zu vnserm nutz, F.bd. 8. 22: Nichten haß die arbeitsamlichen werck. Kf.hrf.in. Kath. Gesangb. 3. 95. 5 (p.O, 1517): Darum er [mensch] schwqrlich ward verflucht \ Vnd von got auch zerteilt behend \ Getruckt in arbeitsam eilend \ Ist worden aller gschojfain knecht | Der yormal ober sy halt recht. Rieder. St. Georgener Fred. 63. 3 (Hs, pönalem" 1387^): als wir all geboren werden! usser unser muter lip; du gehurt ist arbeitsam. — Vetter. Fred. Taulers 83, 8; Bihlmeyer- Seuse 425. 22: V, ANSHELM. Bsmef r.hron 6 83 3- Maai.fr 29r Vot.kmar 305: 431: Hf.ntscih 94: Pietz. Wb. Luther 112. 2. >arbeitsam, fleißig, unverdrossen, emsig, rührigi, z.T, mit der Nuance: lausdauernd, hartnäckig! ; falls vom Vieh gesagt: >zur Arbeit verwendet, Arbeitsvieh)! ; laut Rwb 1. 809 auch als Adj. in einer Titulatur verwendet (Beleg: schles" 1609); zu arbeit 6. arbeiten 6. arbeiter 2. — Bdy,: unverdrossen (mehrmals), fleissig. emsig, geschäftig, hurtig, tätig, unablässig, wacker, vgl, arbeitig. Ggs,: faul. — Synt,: a, sein-, q, leute, a. fieh / tier. Dtf.nf.s. F.. Gros. Witwenb. 225. 4 (ntirnb" 1446): wer sie [Rachel] wil haben, der muß seyn arbsam vnd in der arbeit ynuerdrqssen. Maat.f.r 29r (Zürich 1561): Arbeitsam / ynuerdrossen / Der von der arbeit nit mud wirt [...] Arbeitsam yych / das man zu wercken vnd zu arbeit braucht. Lauater. (respanste 7.4r 9 (Zürich 1578): Als er dises ein gute zyt mit der arbeitsäligen lüten eeren wyberen getriben, F.bd. 35v. 10: hat ein arbeitsamer pur / oder ein fuler mussiggqnger der bösen dingen noch zetrachten zyt. — Schöpfer 29a: Ulner 175: Heimisch 94: Pietz. Wb. Luther 112. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 Wörterbuchartikel wa2 soll nun diskutiert werden. <?page no="160"?> 160 Matthias Kämmerer 3.1 Explizite und implizite Verweisangaben und -kennzeichnungen im Wörterbuchartikel zu arbeitsam Die Verweisadressenangabe „arbeit 3“ in Zeile 3, die aus der Verweishauptadressenangabe „arbeit 1 und der davon abhängigen Verweisunteradressenangabe „3“ besteht, wird durch die standardisierte Verweisbeziehungsangabe „vgl.“ (für: vergleiche) eingeleitet. Es handelt sich hier um eine artikelinkurrente Verweisung, da mit „arbeit 3“ eine Verweisangabe auf den dritten semantischen Subkommentar im Wörterbuchartikel zu arbeit gemacht wird. In Zeile 4 findet sich die verdichtete Verweisangabe „2“, die zusammen mit „offen zu“ die kommentierende Angabe zur Relativierung der Bedeutungsunterscheidung konstituiert. Mit der „2“ wird eine Verweisung auf den zweiten semantischen Subkommentar desselben Wörterbuchartikels vorgenommen. Es handelt sich also um eine artikelinterne Verweisangabe. Artikelinterne Verweisangaben unterscheiden sich von artikelinkurrenten dadurch, daß die Verweishauptadressenangabe fehlt, da diese mit dem aktuellen Wörterbuchartikel identisch ist. Man kann sich vorstellen, daß „offen zu 2“ durch zwei Textverdichtungsmaßnahmen aus einer nichtverdichteten Verweisangabe gewonnen wurde, wobei die Reihenfolge der Durchführung der Textverdichtungsmaßnahmen auch umgedreht werden kann: erstens wurde in dem Textsegment „offen zu '[arbeitsam 2“ die Verweisbeziehungsangabe getilgt, so daß danach nur noch vorlag „offen zu arbeitsam 2“; in einem weiteren Schritt wurde die Verweishauptadressenangabe getilgt, so daß man das jetzt vorliegende Textsegment erhielt. Fragt man sich hier, wie diese beiden eben kurz besprochenen Verweisangaben in einem Hypertext zu modellieren wären, so müßte man, ausgehend von den obigen „naiven“ Konvertierungshypothesen, bei „vgl. arbeit 3“ die Verweisbeziehungsangabe tilgen und aus der Verweisadressenangabe „arbeit 3“ einen interhypertextuellen Hyperlink erstellen (wobei „arbeit 3“ selbst in geeigneter Weise, z.B. mittels einer anderen Farbdarstellung, zum Verknüpfüngsanzeiger wird). Doch wird diese Modellierung dem hier vorliegenden Phänomen gerecht? Ausgehend davon, daß in der Hypertextbasis jeder Wörterbuchartikel eine eigene IE bildet, kann nur auf diejenige IE ein Hyperlink gesetzt werden, die den Wörterbuchartikel zu arbeit enthält. Der dritte semantische Subkommentar kann deshalb unter dieser Voraussetzung nicht gezielt mit einem Hyperlink angesteuert werden! (Es ist etwas anderes, daß es durchaus möglich ist, eine Routine zu programmieren, die dafür sorgt, daß die entsprechende Textpassage der IE z.B. vertikal zentriert auf dem Bildschirm ausgegeben oder farbig unterlegt wird; es handelt sich dann nämlich nicht mehr um einen Hyperlink i.S.d. obigen Definition.) Will man diesem Problem begegnen, kann man sich entscheiden, alle Wörterbuchartikel mit als n-fach (mit n > 2) polysem interpretierten Lemmata in n IE zu konvertieren (wobei hier nicht diskutiert werden soll, wie der Formkommentar dabei zu handhaben ist). Dies hat auf den ersten Blick den Vorteil, daß umfangreiche Wörter- <?page no="161"?> Hypertextualisierung gedruckter Wörterbuchtexte 161 buchartikel besser handhabbar werden, wie beispielsweise der zu arbeit, der sich im FWB über sieben Spalten erstreckt. Andererseits werden aber auch kurze Wörterbuchartikel zu als polysem interpretierten Lemmata, beispielsweise der nur 12 Zeilen lange Wörterbuchartikel zu dem zweifach polysemen Lemma arl, „zerhackt“, was sicherlich nicht wünschenswert ist. Also: egal, was man als IE ansetzt, ob nun den vollständigen Wörterbuchartikel oder die semantischen Subkommentare (ggf. immer zusammen mit dem Formkommentar): entweder kann die Verweisunteradressenangabe nicht adäquat modelliert werden oder der Wörterbuchartikel ist nicht mehr kohäsiv. Schließlich sei noch angemerkt, daß sich dieses Problem genau dann nicht mehr stellt, wenn als Adressenangabe nicht nur die Angabe der Adressen von IE, sondern auch von Teilbereichen einer IE möglich ist, wie dies beispielsweise im WWW bereits praktiziert wird. - Weiter ist zu fragen, ob tatsächlich die Verweisbeziehungsangabe „vgl.“ ohne weiteres getilgt werden kann. Die Antwort lautet: selbstverständlich nicht, denn „vgl.“ ist ein bifunktionales Textelement, das einerseits eine Verweisbeziehungsangabe ist kraft seiner usuellen Bedeutung - und andererseits die Erkennungsmarke für die Angabe der semantischen Merkmalsteilkongruenz. Bei einer Tilgung von „vgl.“ würde die zweite Funktion ebenfalls getilgt werden (die erste würde vom Verknüpfungsanzeiger übernommen werden), weshalb die verbleibende Verweisadressenangabe „arbeit 3“ von einem Benutzer nicht mehr korrekt (i.S.v. vollständig 7 ) interpretiert werden könnte. Ein Ausweg wäre denkbar, indem der Verknüpftmgsanzeiger gleichzeitig anzeigt, zu welcher Art von lexikographischen Verweisangaben der Hyperlink gehört, indem er beispielsweise beim Überfahren mit der Maus ein Popup-Fenster präsentiert, in dem steht, daß es sich um eine Angabe der semantischen Merkmalsteilkongruenz handelt. Bei den mit „zu“ eingeleiteten Verweisadressenangaben in Zeile 4 handelt es sich um Angaben der semantischen Merkmalskongruenz. Für sie wie für die Homoionymangaben (die man in den Zeilen 5 und 6 findet) gilt dasselbe, wie bereits ausgeführt wurde. In der Angabe zur Belegdokumentation, die sich von Zeile 9 bis 29 erstreckt, findet sich beispielsweise im Belegteil (i.S.v. Reichmann 1986, S. 144) die Belegstellenangabe „ZlESEMER, Proph. Crane. Jer. 6, 11“. Die Belegstellenangabe ist Teil der (hier jedoch nicht zur Diskussion stehenden) literaturbezogenen Mediostruktur. Ebenso gehören die Belegstellenangaben im Belegstellenteil (i.S.v. Reichmann 1986, S. 144), z.B. „MAALER 29r“, nicht zur wörterbuchintemen Mediostruktur, sondern in diesem Fall zur wörterbuchvernetzenden Mediostruktur. Diejenigen Textsegmente jedoch, die nur aus der Autor- 7 Mit vollständig meine ich hier, daß das Wort vergleiche semantisch als dreiwertig zu interpretieren ist: etwas mit etwas auf etwas hin vergleichen. Würde man die (im fwb bezüglich ihrer semantischen Funktion explizit eingeflihrte) Beziehungsangabe „vgl.“ tilgen, so könnte nur noch etwas mit etwas verglichen werden aber es wäre nicht klar, auf was hin. <?page no="162"?> 162 Matthias Kämmerer bzw. Herausgeberbzw. Bearbeiterangabe plus der Quellenangabe bestehen, also beispielsweise „ZlESEMER, Proph. Cranc.“ oder „Maaler“, sind Elemente der wörterbuchinternen Mediostruktur. Mit ihnen wird eine Verweisangabe auf den Vorspann gemacht, genauer auf das Verzeichnis der Quellen, wo die einzelnen Literatursiglen aufgelöst werden. „ZlESEMER, Proph. Cranc.“ wird dort in die bibliographische Angabe „Die Prophetenübersetzung des Claus Cranc. Hrsg. v. Walther Ziesemer. Mit 13 Tafeln. Halle (Saale) 1930. (Schriften der Königsberger Gelehrten Gesellschaft. Sonderreihe.)“ aufgelöst. Außerdem erfährt der Benutzer dort, auf welche Art und Weise die Textstelle angegeben wird (hier: gemäß der Kapitel- und Verszählung in der Bibel), auf welchen Seiten sich das Glossar befindet, welchem dialektalen Areal der Text zuzuordnen ist, wann er zu datieren ist und welcher Textsorte (hinsichtlich der im FWB angesetzten Textsorten) er angehört. In einem Hypertextsystem, in dem der Vorspann, das zentrale Wörterverzeichnis und der Nachspann in jeweils separaten Hypertextbasen modelliert werden, müßten solche Verweisadressenangaben durch extrahypertextuelle Hyperlinks wiedergegeben werden. Dies ist an sich kein Problem. Problematisch ist vielmehr, daß sowohl Textsegmente, wie beispielsweise „ZlESEMER, Proph. Cranc. Jer. 6, 11“ als auch „ZlESEMER, Proph. Cranc “, mit einer jeweils verschiedenen IE gelinkt werden müssen. Dieser Sachverhalt drückt sich in der obigen Wiedergabe des Wörterbuchartikels zu arbeitsam darin aus, daß sowohl „ZlESEMER, Proph. Cranc. Jer. 6, 11“ als auch nochmals „ZlESEMER, Proph. Cranc.“ unterstrichen ist. Mit anderen Worten, es muß ein Weg gefunden werden, daß zwei Textsegmente Ti und T 2 , wobei gilt, daß T 2 ein Textteil von Ti ist, mit verschiedenen IE gelinkt werden. Dies ist möglich, wenn man z.B. zwischen rechtem und linkem Mausklick unterscheidet: ein rechter Mausklick könnte so festgelegt werden, daß er immer (falls dies möglich ist) zur entsprechenden ausführlichen Quellenangabe im Vorspann verzweigt und damit die Verweisfunktion von T 2 (= „ZlESEMER, Proph. Cranc.“ ) realisiert; der linke Mausklick würde dann die entsprechende Quelle an der entsprechenden Textstelle aktivieren, nämlich Die Prophetenübersetzung des Claus Cranc an der Stelle Jeremia Kapitel 6, Vers ll . 8 Natürlich ist auch „Ebd.“ in Zeile 19 und 45 eine Verweisangabe. Mit ihr verweist ein Lexikograph zuerst einmal auf diejenige Autorangabe (bzw. Herausgeber- oder Bearbeiterangabe) plus Quellenangabe, die innerhalb des Wörterbuchartikels dem „Ebd.“ unmittelbar vorausgeht. Ein Benutzer-in-actu, der die durch „Ebd.“ initiierte Verweisbefolgungshandlung ausgefuhrt und die dort Vorgefundenen lexikographischen Daten interpretiert hat, verfugt anschließend über die lexikographische Information des Herausgebers (bzw. des Autors oder Bearbeiters) plus der Quelle. Aus dieser Information kann er einen weiteren Verweis erschließen, nämlich den, der im vorigen Absatz schon 8 N.B.: Selbst dann, wenn Ti und T 2 identisch wären, bestehen gemäß der obigen Definition von Hyperlink immer noch zwei verschiedene Links, nämlich: (Verknüpfungsanzeiger_l, Adressenangabe_l), (Verknüpfimgsanzeiger_l, Adressenangabe_2). <?page no="163"?> Hypertextualisierung gedruckter Wörterbuchtexte 163 diskutiert wurde: einen Verweis auf das Verzeichnis der Quellen. Nimmt der Benutzer-in-actu noch die Textstellenangabe hinzu, so kann er zusätzlich einen Verweis auf die betreffende Stelle in der Quelle erschließen. Die letzte Verweisung gehört wieder der intertextuellen, genauer gesagt: der literaturbezogenen Mediostruktur an. Auf Grund dieser Analyse muß man unterscheiden: mit der Verweisangabe „Ebd.“ verweist ein Lexikograph einen Benutzer auf die unmittelbar vorangegangene Textangabe. Hat ein Benutzer-in-actu diesen Verweis erschlossen, und hat er die daran geknüpfte Verweisbefolgungshandlung ausgefiihrt, kann er, wie bei den übrigen Belegstellenangaben auch, zwei weitere Verweise erschließen, je nach dem, ob er die dem „Ebd.“ folgende Textstellenangabe hinzunimmt oder nicht. Das Schreiben der Verweisangabe „EBD.“ kann als Ergebnis eines Textverdichtungsprozesses gedeutet werden: Immer dann, wenn die Autorangabe (bzw. die Herausgeber- oder Bearbeiterangabe) und die Quellenangabe identisch sind mit den entsprechenden Angaben in der vorangegangenen Belegstellenangabe desselben semantischen Subkommentars, so muß die Autorangabe (bzw. die Herausgeber- oder Bearbeiterangabe) sowie die Quellenangabe durch ein „EBD.“ ersetzt werden. In einem Hypertextsystem wäre es unsinnig, die (ich möchte sie hier vorerst einmal so nennen: ) primäre Verweisfunktion von „Ebd.“ zu realisieren, indem ein intrahypertextueller Hyperlink von „Ebd.“ zur unmittelbar vorangegangenen Autorangabe (bzw. Herausgeber- oder Bearbeiterangabe) samt Quellenangabe hergestellt werden würde. Vielmehr müssen die daraus zu erschließenden Verweise realisiert werden, also: von „Ebd.“ muß ein extrahypertextueller Hyperlink auf diejenige IE gesetzt werden, welche die entsprechenden ausführlichen bibliographischen Angaben enthält, und von „Ebd.“ plus Textstellenangabe müßte ein extrahypertextueller Hyperlink auf die entsprechende Quelle an der entsprechenden Textstelle erstellt werden. 9 Ebenfalls problematisch gestaltet sich die Verweisadressenangabe „431“ in Zeile 28, die eigentlich eine Verweisunteradressenangabe ist. Die dazugehörige Verweishauptadressenangabe ist „Volkmar“. Zusammen mit der Verweishauptadressenangabe wird eine Verweisung auf eine bestimmte Textstelle gemacht; es handelt sich also wiederum um eine intertextuelle Verweisangabe. Die Verweisadressenangabe „431“ kann als das Ergebnis eines Textverdichtungsprozesses gedeutet werden: bei zwei Verweisangaben der Form „Verweishauptadressenangabe_l Verweisunteradressenangabe_l, Verweishauptadressenangabe_l Verweisunteradressenangabe_2“ kann die zweite bis 9 Diese dreifache Verweisungsfunktion von „Ebd.“, nämlich (1) auf die vorausgehende Textangabe, (2) auf die bibliographische Angabe im Verzeichnis der Quellen sowie (3) zusammen mit der Textstellenangabe auf die betreffende Stelle in der Quelle, müßte in der obigen Wiedergabe des Wörterbuchartikels wa 2 durch drei Unterstreichungen markiert werden dies ist jedoch aus technischen Gründen nicht möglich! <?page no="164"?> 164 Matthias Kämmerer n-te (n > 2) Verweishauptadressenangabe getilgt werden, wenn sie mit der ersten identisch ist. So wird daraus: „Verweishauptadressenangabe_l Verweisunteradressenangabe_l; Verweisunteradressenangabe_2“. Diese Textverdichtungsmaßnahme muß ein Benutzer-in-actu rückgängig machen, wenn er die Verweisfunktion der Verweisunteradressenangabe korrekt interpretieren will. Und genau dies muß auch von einem Programm geleistet werden, das auf Grund von Textanalysen automatisch korrekte Hyperlinks setzen soll. 3.2 Potentielle Verweisangaben und -kennzeichnungen im Wörterbuchartikel zu arbeitsam Die erste potentielle Verweisangabe in dem Wörterbuchartikel zu arbeitsam ist „Adj.“ in der ersten Zeile. Es handelt sich hier deshalb um eine potentielle Verweisangabe, da „Adj.“ weder eine mediostrukturanzeigende Eigenschaft besitzt noch vom Lexikographen als Verweisangabe intendiert ist noch diese als implizite Verweisangabe im Wörterbuch eingefiihrt ist. Dennoch weiß ein Benutzer-in-actu, daß er Abkürzungen gewöhnlich im Abkürzungsverzeichnis erklärt findet, falls er nicht selbst weiß (oder sich nicht sicher ist), wofür diese stehen. Bei einer Abkürzung kann also ein Benutzer-in-actu auf Grund seiner Vertrautheit mit dem Kulturgut Buch (und speziell dem Wörterbuch) einen Verweis konstituieren. Die Abkürzung „Adj.“ wird im FWB im Verzeichnis textlicher Abkürzungen (Reichmann 1986, S. 7-9) aufgelöst. Ein Benutzer-in-actu kann, wie gesagt, dort nachschlagen, falls er wissen will, für was das Kürzel „Adj.“ steht. Dasselbe gilt für die Komponente „frnhd“ in „Gesamtffnhd.“ in Zeile 5. Beide potentiellen Verweisangaben wären eigentlich durch Hyperlinks zu realisieren, nämlich von der Abkürzung zur aufgelösten Abkürzung. Es ist jedoch sehr die Frage, ob dies sinnvoll ist, selbst wenn die Ziel-IE die Quell-IE nicht ersetzt sondern z.B. in einem Popup-Fenster erscheint. Eine bessere Lösung ist es m.E., da Speicherplatz zudem immer billiger wird, Abkürzungen aufzulösen, und in diesem Falle statt „Adj.“ „Adjektiv“ und statt „Gesamtfmhd“ „Gesamtfrühneuhochdeutsch“ anzugeben. (Abkürzungen, die ohnehin usuell sind, können/ sollten bestehen bleiben.) Die Abkürzungen „Bdv.“ und „Synt.“ in den Zeilen 5 und 6 werden nicht im Verzeichnis textlicher Abkürzungen aufgelöst, sondern in der Lexikographischen Einleitung (Reichmann 1986, S. 10-164; genauer: „Synt.“ wird ebd. auf S. 133 eingeführt, „Bdv.“ auf S. 125). Dort wird dann ihr Gebrauch und ihre Funktion näher erläutert. Obwohl in einem konkreten Fall ein Benutzer-inactu einen Verweis auf das Abkürzungsverzeichnis bei „Bdv.“ und „Synt.“ konstituieren könnte, ohne daß er dabei ein korrektes Verweisziel erschließen würde und damit eine auf Grund der Konstituierung eines potentiellen Verweises durchgeführte Verweisbefolgungshandlung erfolglos bliebe, handelt es <?page no="165"?> Hyperlextualisierung gedruckter Wörterbuchtexte 165 sich hier dennoch um potentielle Verweise; das bedeutet: das Verweisziel muß bei einer potentiellen Verweisangabe gar nicht korrekt erschlossen werden, ja es ist sogar möglich, daß das Verweisziel (in der Form, wie es erschlossen wurde) gar nicht existiert, und es handelt sich dennoch um eine potentielle Verweisangabe. Es wäre auch möglich, daß ein Benutzer-in-actu beispielsweise bei „Bdv “ einen Verweis auf den Musterartikel abgot (Reichmann 1986, S. 2f.) in den Hinweisen zur Benutzung des Wörterbuches (Reichmann 1986, S. 1-6) erschließen könnte; in diesem Falle hätte er sein Verweisziel korrekt erschlossen, und eine Verweisbefolgungshandlung wäre von Erfolg gekrönt, da er auf S. 2 oben zu dem Kürzel „Bdv.“ die Erläuterung fände: „Angabe zur onomasiologischen Vernetzung, d.h. Angabe bedeutungsverwandter Wörter (mit Häufigkeitsangabe). “ Nach dem bisher Ausgefuhrten dürfte klar sein, weshalb auch „z.T.“ in Zeile 31 oder „vgl.“ in Zeile 37 potentielle Verweisangaben sein können, obgleich sie weder im Abkürzungsverzeichnis noch in den Hinweisen zur Benutzung des Wörterbuches erklärt und aufgelöst werden. Dasselbe gilt z.B. auch für die Raumangabe „preuß.“ in Zeile 9 oder für „Jh.“ in derselben Zeile. In dem Wörterbuchartikel zu arbeitsam finden sich (interessantere) potentielle Verweise insbesondere in den Belegangaben. Unter bestimmten Bedingungen kann dort jedes Wort (und auch Einheiten über die Wortgrenze hinaus, beispielsweise bei Phraseologismen) eine potentiell verweiskonstituierende Angabe sein, 10 ausgenommen jedoch jener lexikalischen Einheit, die als Lemma in dem betreffenden Wörterbuchartikel behandelt wird. So finden sich in der ersten Belegangabe: „so byn ich vol des grymmis des herren und ist mir arbeitsam dis zu lidene“ 14 potentiell verweiskonstituierende Angaben, nämlich 15 verschiedene Formative, von denen arbeitsam identisch mit dem Gegenstand des Wörterbuchartikels ist. Dabei werden jedoch nicht alle potentiell verweiskonstituierenden Angaben im gleichen Maße von einem Benutzer-inactu konstituiert. Zu den selten bzw. nie konstituierten potentiellen Verweisangaben gehören sicherlich solche Lexeme, die mit den entsprechenden neuhochdeutschen Lexemen sowohl in ihrem morphosyntaktischen Verhalten als auch offensichtlich semantisch äquivalent sind, wie z.B. ich, und oder mir. u Deshalb wurde bei der Wiedergabe des Wörterbuchartikels zu arbeitsam nicht jedes Wort (ausschließlich arbeitsam) in einer Belegangabe unterpunktet, sondern nur solche, die m.E. zu den häufiger konstituierten potentiellen Verweisangaben gehören, wobei im einzelnen durchaus Modifikationen meiner 10 Eine potentiell verweiskonstituierende Angabe ist eine „Angabe, die in ihrer Gesamtheit oder in einzelnen ihrer Teile zur Konstituierung eines lexikographisch nichtintendierten Verweises genutzt wird.“ (Kammerer/ Lehr 1996, S. 354). 11 Wie gefährlich eine solche Behauptung sein kann, ist mir bewußt man denke nur an mhd. ere und nhd. Ehre! <?page no="166"?> 166 Matthias Kämmerer Entscheidung möglich sind. In dem bereits genannten Beleg sind dies: vol, grymmis, Herren und lidene. Von diesen müßte nun ein Hyperlink auf den entsprechenden Wörterbuchartikel gesetzt werden. Dazu müssen jedoch, zusammengefaßt, mindestens drei Voraussetzungen erfüllt sein: (VI) ein Formativ in einer Belegausgabe muß als potentiell verweiskonstituierende Angabe erkannt werden; da diese Aufgabe von einer Maschine wohl kaum zu lösen ist (eine Möglichkeit wäre ein entsprechend aufbereitetes Lexikon), müßte eine menschliche Hilfskraft diese Arbeit durchfuhren, (V2) das Formativ muß einem Lexem zugeordnet werden können; auch hier wird eine Maschine überfordert sein, da der Gegenstandsbereich des FWBs, das Frühneuhochdeutsche, keine Sprache mit einer anerkannten Leitvarietät ist, sondern aus einem Konglomerat verschiedenster Varietäten besteht; (V3) der Wörterbuchartikel zu diesem Lexem muß existieren, wobei auf folgende Fälle geachtet werden muß: wurde das Lemma, auf dessen zugehörigen Wörterbuchartikel der Hyperlink definiert werden soll, als homonym zu einem anderen interpretiert, muß das korrekte homonyme Lemmazeichen für den Hyperlink ausgewählt werden; wurde das Lemma, auf dessen zugehörigen Wörterbuchartikel der Hyperlink definiert werden soll, als polysem interpretiert, sollte gleich ein Hyperlink auf den betreffenden semantischen Subkommentar gesetzt werden und nicht auf den vollständigen Wörterbuchartikel (und damit steht man wieder vor dem Problem, was als IE füngieren soll). Gerade was den letzten Punkt betrifft, kann dies nur von einem Menschen durchgeführt werden, da nur der Mensch über semantisches Wissen verfügt. Aber auch hier wird es sicherlich Fälle geben, bei denen es z.B. nicht völlig eindeutig ist, auf welchen semantischen Subkommentar eines Wörterbuchartikels der Hyperlink gesetzt werden soll. Die Erfüllung der Voraussetzungen (VI) bis (V3) kann zu keinem einzigen Zeitpunkt, dies sei hier nochmals betont, von einer Maschine durch Analyse des Satzbandes geleistet werden. Jedes Mal ist der Mensch gefordert, der (i.Ggs. zur Maschine) in der Lage ist, Bedeutung zu verstehen. Ein letzter Punkt, der hier angesprochen werden soll, ist nochmals das „Ebd.“ in Zeile 19. Dieser Textteil ist, da es sich um eine Abkürzung handelt, auch eine potentielle Verweisangabe. Das bedeutet, daß „Ebd.“ insgesamt vier Verweisfünktionen besitzt, die jedoch nicht alle durch einen Hyperlink repräsentiert werden sollten: <?page no="167"?> Hypertextualisienmg gedruckter Wörterbuchtexte 167 1. „Ebd.“ ist eine Verweisangabe auf die direkt vorangehende Autor- (bzw Herausgeber- oder Bearbeiterangabe) zusammen mit der Quellenangabe; diese Funktion sollte von einem Hyperlink nicht simuliert werden. 2. „Ebd.“ ist außerdem (kraft Punkt 1) eine Verweisangabe auf das Verzeichnis der Quellen, wo die vollständigen bibliographischen Angaben genannt werden. 3. Zusammen mit der Textstellenangabe kann ein Benutzer-in-actu zusätzlich einen Verweis auf die betreffende Textstelle in der Quelle erschließen. 4. Und schließlich liegt mit „Ebd.“ auf Grund der Tatsache, daß es sich um eine Abkürzung handelt, ein potentieller Verweis vor, der ggf. von einem Benutzer-in-actu konstituiert werden kann. Während die Verweisfunktionen von „EBD.“, wie sie in den Punkten 2 und 3 dargestellt wurden, durch einen Hyperlink simuliert werden könnten, sollte diese Verweisfunktion dadurch aufgehoben werden, daß die Abkürzung an Ort und Stelle aufgelöst wird. 4. Zusammenfassung Abschließend sollen die Ergebnisse nochmals überblickartig zusammengefaßt werden: - Die eingangs formulierte These, daß Verweisangaben „einfach“ durch Hyperlinks zu ersetzen seien, indem die Verweisbeziehungsangabe getilgt und die Verweisadressenangabe als Verknüpfungsanzeiger gewählt wird, ist so nicht korrekt. - Verweisbeziehungsangaben können z.B. nicht grundsätzlich getilgt werden, nämlich genau dann nicht, wenn sich ihre Funktion nicht allein auf die Angabe der Verweisbeziehung beschränkt, die schließlich vom Verknüpfungsanzeiger übernommen wird. Beim FWB ist dies z.B. bei der Verweisbeziehungsangabe „vgl.“ innerhalb der Bedeutungsposition der Fall, die gleichzeitig eine Erkennungsmarke für die Angabe der semantischen Merkmalsteilkongruenz ist. - Verweisadressenangaben, die aus einer Verweishauptadressenangabe und einer Verweisunteradressenangabe bestehen (beispielsweise „arbeit 3“), sind im FWB artikelinkurrente Verweisungen. Diese können dann nicht adäquat durch einen Hyperlink simuliert werden, wenn man sich entschlossen hat, jeden Wörterbuchartikel als ganzen in eine IE zu überfuhren und wenn als Adressenangaben nur die von IE genannt werden können. - Artikelinterne Verweisangaben sind dann sehr schwer durch Hyperlinks zu modellieren, wenn Wörterbuchartikel als ganzes in eine IE überführt werden; wird jedoch jeder semantische Subkommentar in eine IE überführt. <?page no="168"?> 168 Matthias Kämmerer dann läßt sich dieses Problem leichter in den Griff bekommen. Etwas anderes ist es, wenn als Adressenangabe auch bestimmte Punkte innerhalb einer IE definiert werden können. Dann gibt es weder mit artikelintemen noch mit artikelinkurrenten Verweisangaben Probleme. - Textverdichtungsmaßnahmen bei Verweisadressenangaben erschweren die maschinelle Erstellung von Hyperlinks, da die Verweisadressenangabe nur schwer gefunden werden kann, weil die Verweisbeziehungsangabe getilgt wurde; die im Textverdichtungsprozeß getilgte Verweishauptadressenangabe vorher ergänzt werden muß. - Will man auch intertextuelle Mediostrukturen berücksichtigen, so tritt im FWB das Problem auf, daß sowohl ein Textsegment Ti (= a) als auch ein Textsegment T 2 (= ab) wobei gilt, daß Tj ein Textteil von T 2 ist verdichtete Verweisangaben auf verschiedene IE sind. Dieses Phänomen bringt bei dem hiesigen Hyperlink-Verständnis Probleme mit sich. - Es gibt Verweisangaben (wie z.B. „EBD.“ im FWB), deren primäre Verweisfunktion in einem Hypertextsystem nicht zu realisieren ist, sondern nur deren sekundäre, die jedoch erst erschlossen werden kann, wenn zuerst einmal die primäre befolgt wird. - Insbesondere bei Abkürzungen, die allesamt potentielle Verweisangaben darstellen, ist es wenig sinnvoll, diese mittels Hyperlinks zu modellieren, wie es notwendig wäre, wenn man die Eingangsthese strikt befolgen wollte. Besser ist es hier, die Abkürzungen an Ort und Stelle aufzulösen. - Bei den übrigen potentiellen Verweisangaben und -kennzeichnungen konnten die Vermutungen, die in der Hypothese (H3) formuliert wurden, bestätigt werden, d.h.: potentielle Verweisangaben und -kennzeichnungen können weder maschinell gesucht noch erstellt werden. 5. Literatur 5.1 Wörterbücher brockhaus-bwb (1976): Brockhaus Enzyklopädie in zwanzig Bänden. Siebzehnte völlig neubearb. Aufl. des Großen Brockhaus. Bildwörterbuch der deutschen Sprache. Vierundzwanzigster Band. Wiesbaden. DUDEN-GFWB (1994): Duden. Das Große Fremdwörterbuch. Herkunft und Bedeutung der Fremdwörter. Hrsg. u. bearb. vom Wissenschaftlichen Rat der Dudenredaktion. Mannheim/ Leipzig/ Wien/ Zürich. FWB: Frühneuhochdeutsches Wörterbuch. Bd. 1. Einführung, a äpfelkern. Hrsg. v. Robert R. Anderson/ Ulrich Goebel/ Oskar Reichmann. Berlin/ New York 1989. Bd. 2. apfelkö- <?page no="169"?> Hypertextualisierung gedruckter Wörterbuchtexte 169 nig-barmherzig. Hrsg. v. Ulrich Goebel/ Oskar Reichmann. Begründet v. Robert R. Anderson, Ulrich Goebel, Oskar Reichmann. Bearb. v. Oskar Reichman. Berlin/ New York 1994. LGWDAF (1994): Langenscheidts Großwörterbuch Deutsch als Fremdsprache. Das neue einsprachige Wörterbuch für Deutschlemende. Hrsg. v. Dieter Götz/ Günther Haensch/ Hans Wellmann. In Zusammenarbeit mit der Langenscheidt-Redaktion. Leitende Redakteure Vincent J. Docherty, Günter Jehle. 3. Aufl. Berlin [usw.]. 5.2 Sonstige Literatur Bläsi, Christoph/ Koch, Heinz-Detlev/ Lehr, AndreaAViegand, Herbert Ernst (1994[95]): Lexicographic Standards and Reusability - From Metalexicographic Description to a Parsing Procedure. In: Lexicographica 10 [ersch. 1995], S. 221-248. Blumenthal, Andreas/ Lemnitzer, Lothar/ Storrer, Angelika (1988): Was ist eigentlich ein Verweis? Konzeptionelle Datenmodellierung als Voraussetzung computergestützter Verweisbehandlung. In: Harras, Gisela (Hg.): Das Wörterbuch. Artikel und Verweisstrukturen. Jahrbuch 1987 des Instituts für deutsche Sprache. Düsseldorf/ Bielefeld S. 351-373. Conklin, Jeff (1987): Hypertext: An Introduction and Survey. In: ieee Computer 20 7 9 S. 17-41. Goebel, Ulrich/ Holland, James/ Reichmann, Oskar (1990): Das Register des Erläuterungswortschatzes im historischen Bedeutungswörterbuch. In: Goebel, Ulrich/ Reichmann, Oskar (Hg.): Historical Lexicography of the German Language II. S. 279-308. (= Studies in Russian and German 2; Studies in German Language and Literature 1). Queenston/ Lampeter. Hauser, Ralf/ Storrer, Angelika (1993[94]): Dictionary Entry Parsing Using the LexParse System. In: Lexicographica 9 [ersch. 1994], S. 174-219. hsk 5.1: Hausmann, Franz Josef/ Reichmann, OskarAViegand, Herbert Ernst/ Zgusta, Ladislav (Hg.) (1989): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie. An International Encyclopedia of Lexicography. Encyclopedic internationale de Lexicographie. 1. Teilbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft 5.1) Berlin/ New York. Kämmerer, Matthias (1995): Bildschirmorientiertes Abfassen von Wörterbuchartikeln. Dargestellt am Beispiel des Frühneuhochdeutschen Wörterbuches. (= Lexicographica. Series Maior 68). Tübingen. Kämmerer, Matthias/ Lehr, Andrea (1996): Potentielle Verweise und die Wahrscheinlichkeit ihrer Konstituierung. In: Wiegand, Herbert Ernst (Hg ): Wörterbücher in der Diskussion II. Vorträge aus dem Heidelberger Lexikographischen Kolloquium. (= Lexicographica. Series Maior 70). Tübingen. S. 311-354. Kämmerer, Matthias (1998): Die Mediostruktur in Langenscheidts Großwörterbuch Deutsch als Fremdsprache. In: Wiegand, Herbert Emst (Hg.): Perspektiven der pädagogischen Lexikographie des Deutschen. Untersuchungen anhand von Langenscheidts Großwörterbuch Deutsch als Fremdsprache. (= Lexicographica. Series Maior). Tübingen. Kuhlen, Rainer (1991): Hypertext. Ein nicht-lineares Medium zwischen Buch und Wissensbank. Berlin [usw.]. <?page no="170"?> 170 Matthias Kämmerer Lyotard, Jean-Franfois (1986): Das postmodeme Wissen. Ein Bericht. Hrsg. v. Peter Engelmann (= Edition Passagen 7). GrazAVien. McKnight, CliflTDillon, Andrew/ Richardson, John (1991): Hypertext in Context. (= The Cambridge Series on Electronic Publishing). Cambridge [usw.]. Pan ZaipingAViegand, Herbert Emst (1995): Über die Musterartikel für das Große Deutsch- Chinesische Wörterbuch. Zugleich ein Beitrag zu einer Theorie zweisprachiger lexikographischer Texte. In: Wiegand, Herbert Emst (Hg.): Studien zur zweisprachigen Lexikographie mit Deutsch II. (= Germanistische Linguistik, 127-128). Hildesheim/ New York. S. 63-190. Raymond, Darrel R/ Tompat, Frank Wm. (1987): Hypertext and the New Oxford English Dictionary. In: ACM-Hypertext (1987/ 89), S. 143-153. Reichmann, Oskar (1979): Probleme des Frühneuhochdeutschen Handwörterbuchs auf dem Hintergrund der auf der Tagung diskutierten Themen. In: Henne, Helmut (Hg ): Praxis der Lexikographie. Berichte aus der Werkstatt. Tübingen. S. 125-130. Reichmann, Oskar (1986): Einleitung, Quellenverzeichnis, Literaturverzeichnis; a-abfal. In: Reichmann, Oskar (Bearb.): 1. Lieferung des Frühneuhochdeutschen Wörterbuchs (= FWB). Berlin/ New York. Reichmann, Oskar (1987): Das Frühneuhochdeutsche Wörterbuch. In: Wiegand, Herbert Emst (Hg.): Theorie und Praxis des lexikographischen Prozesses bei historischen Wörterbüchern. Akten der Internationalen Fachkonferenz Heidelberg, 3.6.-5.6.1986. Im Auftrag des Forschungsschwerpunktes Lexikographie an der Neuphilologischen Fakultät der Universität Heidelberg. (= Lexicographica. Series Maior 23). Tübingen. S. 245- 250. Reichmann, Oskar (1990): Philologische Entscheidungen bei der Formulierung von Artikeln historischer Sprachstadienwörterbücher. In: Goebel, Ulrich/ Reichmann, Ulrich (Hg ): Historical Lexicography of the German Language I. (= Studies in Russian and German 2; Studies in German Language and Literature 1). Lewiston/ Queenston/ Lampeter. S. 231-278. Schmidt, Rudolf (1988): Wörterbuchartikel und Ergebnisdatenbank. In: Harras, Gisela (Hg ): Das Wörterbuch. Artikel und Verweisstrukturen. Jahrbuch 1987 des Instituts für deutsche Sprache. Düsseldorf/ Bielefeld. S. 330-350. Storrer, Angelika (1995): Wörterbücher zum Anklicken ein kleiner Rundgang durch die PC-Bibliothek. In: Sprachreport 2, S. 9ff. Storrer, Angelika (1996): Metalexikographische Methoden in der Computerlexikographie. In: Wiegand, Herbert Emst (Hg.): Wörterbücher in der Diskussion II. Vorträge aus dem Heidelberger Lexikographischen Kolloquium. (= Lexikographica. Series Maior 70). Tübingen. S. 239-255. Wiegand, Herbert Emst (1986): Metalexicography. A Data Bank for Contemporary German. In: Interdisciplinary Science Reviews 11/ 2, S. 122-131. Wiegand, Herbert Emst (1988): Wörterbuchartikel als Text. In: Harras, Gisela (Hg.): Das Wörterbuch. Artikel und Verweisstrukturen. Jahrbuch 1987 des Instituts für deutsche Sprache. Düsseldorf/ Biclefcld. S. 30-120. Wiegand, Herbert Ernst (1989): Der Begriff der Mikrostruktur: Geschichte, Probleme, Perspektiven. In: HSK 5.1, S. 409-462. <?page no="171"?> Hypertextualisierung gedruckter Wörterbuchtexte 171 Wiegand, Herbert Ernst (1989a): Arten von Mikrostrukturen im allgemeinen einsprachigen Wörterbuch. In: hsk 5.1, S. 462-501. Wiegand, Herbert Emst (1989b): Aspekte der Makrostrukturen im allgemeinen einsprachigen Wörterbuch: alphabetische Anordnungsformen und ihre Probleme. In: hsk 5.1, S. 371-409. Wiegand, Herbert Emst (1991): Über die Strukturen der Artikeltexte im Frühneuhochdeutschen Wörterbuch. Zugleich ein Versuch zur Weiterentwicklung einer Theorie lexikographischer Texte. In: Goebel, Ulrich/ Reichmann, Oskar (Hg ): Historical Lexicography of the German Language II. (= Studies in Russian and German 3; Studies in German Language and Press. Literature 4). Lewiston/ Queenston/ Lampeter. S. 341-673. Wiegand, Herbert Emst (1993[94]): Kritische Lanze für Fackel-Redensartenwörterbuch. Bericht und Diskussion zu einem Workshop in der Österreichischen Akademie der Wissenschaften am 14.2.1994. In: Lexicographica 9 [ersch. 1994], S. 230-271. Wiegand, Herbert Emst (1996): Über die Mediostrukturen bei gedruckten Wörterbüchern. In: Zettersten, Arne/ Pedersen, Viggo Hjornagcr (Hg.): Symposium on Lexicography VII. Proceedings of the Seventh Symposium on Lexicography. May 5-6, 1994 at the University of Copenhagen. (= Lexicographica. Series Maior 76). Tübingen. S. 11-43. <?page no="173"?> Christine Thielen / Elisabeth Breidt / Helmut Feldweg COMPASS: Ein intelligentes Wörterbuchsystem für das Lesen fremdsprachiger Texte” 1. Einleitung In den letzten Jahren hat die Verfügbarkeit von Texten in elektronischer Form stark zugenommen. Gründe dafür liegen z.B. in der immer stärker werdenden Nutzung von Textverarbeitungssystemen für die Produktion von Texten, in der Möglichkeit der effizienten Speicherung von Daten, die so für die unterschiedlichsten Anwendungen bearbeitet werden können, oder aber einfach in der Notwendigkeit, die immense Anzahl von Dokumenten in platzsparender Form aufzubewahren. Hinzu kommt, daß durch die weltweite Vernetzung über das Internet heute elektronische Dokumente innerhalb kürzester Zeit auf der ganzen Welt verbreitet werden können. Gerade im Internet hat es der Leser häufig mit fremdsprachigen Texten zu tun, für deren Verständnis ein zweisprachiges Wörterbuch nützlich ist. Auch in Hypermediasystemen, wie sie zur Zeit z.B. für computergestütztes Fremdsprachenlemen (CALL) entwickelt werden, ist der Einsatz von on-line- Wörterbüchern denkbar. Diesem Bedürfnis kommen seit einiger Zeit Wörterbuchherausgeber nach, indem sie elektronische Wörterbücher anbieten, 1 in denen Wörter „per Tastendruck“ nachgeschlagen werden können. Darüberhinaus bieten sich Wörterbuchartikel sehr gut für eine Realisierung als Hyperdokument an, sofern die Teile des Wörterbuchartikels explizit im Zugriff sind. In Hypertext-Wörterbüchern können z.B. die reinen Übersetzungen über „Hyperlinks“ mit zusätzlichen Verwendungsangaben in den entsprechenden Artikelteilen verbunden werden. Der Benutzer kann so auf Wunsch über die Übersetzungen hinaus weitere Informationen bis hin zum vollständigen Wörterbuchartikel erhalten. 2 Elektronische Wörterbücher und die dabei verwendete Nachschlagetechnik werden jedoch den Möglichkeiten des elektronischen Mediums derzeit nicht gerecht. Sie sind lediglich eine elektronische Abbildung der als Druckmedium für den menschlichen Gebrauch konzipierten Nachschlagewerke. Die Nachschlagetechnik beschränkt sich im allgemeinen darauf, eine Zeichenkette im Informationen zum COMPASS-Projekt finden Sie auch auf unserer www-Seite: http: / / www.s f s.nphil.uni-tuebingen.de/ Compass/ Compass.html. 1 So bietet z.B. Duden einige seiner Wörterbücher (Universalwörterbuch, Duden-Oxford) als „PC-Bibliothek“ an. Siehe dazu Storrer (1995). 2 Einen ersten Vorschlag zur Realisierung von Wörterbüchern als Hypertexte machte Atkins (1994). <?page no="174"?> 174 Christine Thielen/ Elisabeth Breidt/ Hetmut Feldweg Text mit den Zeichenketten der Wörterbuchschlagworte 2x1 vergleichen und bei einer Übereinstimmung den zugehörigen Eintrag auszugeben. Die intellektuellen Leistungen eines menschlichen Wörterbuchbenutzers werden von diesen Systemen nicht übernommen: Die Zurückfiihrung von flektierten Formen auf ihre Grundform, Wortarten- und Bedeutungsdisambiguierung müssen weiterhin vom Benutzer geleistet werden. Ein Teil dieser intellektuellen Leistungen wird von dem hier vorgestellten System übernommen, das innerhalb des Projekts COMPASS (Adapting bilingual dictionaries for on-line COMPrehension Assistance) 3 entwickelt wurde. Hierfür werden folgende Techniken der maschinellen Sprachverarbeitung eingesetzt: - Morphologische Analyse (inkl. Kompositazerlegung) - Wortartendisambiguierung - Wörterbuchparsing - Erkennung von Mehrwortlexemen, getrennten Präfixverben und anderen komplexen Ausdrücken Es wurde ein Prototyp eines Computerprogramms entwickelt, das qualitativ hochwertige, strukturell aufbereitete Wörterbücher durch ein intelligentes, kontextsensitives Nachschlageverfahren erschließt und die Informationen dem Benutzer über eine ansprechende graphische Schnittstelle präsentiert. Gleichzeitig wurden zwei zweisprachige Wörterbücher in Auszügen für das System aufbereitet. Das bestehende COMPASS-System ist kein echtes Hypertextsystem, bietet aber die Wörterbuchinformationen in unterschiedlich detaillierter Form auf verschiedenen Ebenen an, wie dies auch mit Hyperlinks realisiert werden kann. Im Hinblick auf eine eventuelle Einbettung in ein Hypermediasystem wurden die Testtexte bereits im HTML-Format erstellt. Die Leistung des Systems wurde in zwei Serien von Benutzertests als ausgesprochen positiv bewertet, eine Bestätigung unserer Annahme, daß ein System wie COMPASS das Lesen fremdsprachiger Texte erheblich vereinfacht und dadurch ein besseres Textverständnis erreicht werden kann. Im folgenden werden die Komponenten des COMPASS-Systems und die im Laufe des Projektes durchgefuhrten Arbeiten näher beschrieben. 3 compass wurde im Rahmen des Programms Linguistic Research and Engineering unter der Nummer 62-080 vom Generaldirektorat XIII der Kommission der Europäischen Union von April 1994 bis März 1996 gefördert. Neben den Autoren, die am Seminar für Sprachwissenschaft der Universität (SfS) Tübingen an der Entwicklung der Deutsch-Englisch-Komponente des Systems arbeiteten, waren das Rank Xerox Research Center Grenoble, das Fraunhofer Institut (iao) Stuttgart und die Universitäten Lumiere und Bournemouth an diesem Projekt beteiligt. <?page no="175"?> COMPASS: Ein intelligentes Wörterbuchsystem 175 2. Das COMPASS-System im Überblick COMPASS soll den Benutzer beim Lesen von elektronisch vorliegenden, fremdsprachigen Texten unterstützen, indem es per Mausklick Wörter aus dem Text heraus kontextsensitiv in einem On-line-Wörterbuch nachschlägt. Der Benutzer sollte dazu ein Basiswissen der Fremdsprache haben, insbesondere grammatische Grundkenntnisse. Für die Entwicklung des Prototyps wurden zwei konventionelle zweisprachige Wörterbücher angepaßt, das Collim-Klett-Großwörterbuch Deutsch-Englisch (CDE) (Collins 1991) und das Oxford-Hachette-Wörterbuch Englisch-Französisch (OHEF) (Oxford-Hachette 1994). Die elektronischen Versionen dieser Wörterbücher wurden strukturell analysiert (Wörterbuchparsing) und in Wörterbuchdatenbanken überfuhrt, die dann lexikographisch erweitert und formalisiert wurden, um eine automatische Auswertung der Einträge zu ermöglichen. Während wir Analyse und Parsen für die kompletten Wörterbücher durchführten, beschränkten sich die lexikographischen Anpassungen auf einen Ausschnitt, der das Vokabular von jeweils 5 Testtexten pro Sprache umfaßte. Den Kern von COMPASS bildet das Nachschlagesystem LOCOLEX 4 (siehe auch Bauer et al. 1995). LOCOLEX verbindet die verschiedenen Komponenten des Systems und führt die Kontextauswertung und den Wörterbuchzugriff durch Als Wissensbasis werden dazu für jede Quellsprache ein Sprachmodell und das zugehörige aufbereitete Wörterbuch benötigt. Der Benutzer interagiert über eine graphische Schnittstelle mit dem Nachschlagesystem. Abb. 1 zeigt die Komponenten des COMPASS-Systems im Überblick. COMPASS-System Abb. 1: Das COMPASS-System 4 LOCOLEX wurde von Rank Xerox (Grenoble) entwickelt und patentiert. <?page no="176"?> 176 Christine Thielen/ Elisabeth Breidt/ Helmut Feldweg 3. Der LOCOLEX-Kern LOCOLEX kontrolliert den Zugriff auf die Sprachmodelle und die COMPASS- Wörterbücher. Jedes Sprachmodell wurde unabhängig vom System mit den fmite-state-Werkzeugen von Xerox (Karttunen/ Yampol 1993, Tapanainen 1994) entwickelt. Ein Sprachmodell enthält ein morphologisches Lexikon, ein statistisches Modell zur Wortarten-Disambiguierung, einen Index auf die Wörterbucheinträge, eine Abbildung der Wörterbuch-Wortartangaben auf die Wortarten des Morphologie-Systems und die Variablen-Defmitionen, die für die Formalisierung von Kontextmustern (vgl. 5.2.4) benutzt werden. Die SGML-geparsten und vorkompilierten Wörterbücher werden für den Zugriff von LOCOLEX separat abgelegt. Durch die Auswahl eines Wortes im Text per Mausklick wird ein Nachschlageprozeß gestartet. Als erstes wird der Satz, in dem das ausgewählte Wort enthalten ist, segmentiert und ein endlicher Automat dazu erzeugt. Jedes Wort wird danach mit dem Morphologiesystem GERTWOL (GERTWOL 1994) analysiert. Schreibvarianten, die von der Morphologie nicht abgedeckt sind, werden mittels eines Finite-State-Transducers normalisiert und dann erneut morphologisch analysiert. Die aus der morphologischen Analyse resultierenden, möglichen Wortarten werden basierend auf einem Hidden-Markov-Modell 1. Stufe disambiguiert (Feldweg 1995). Als Ergebnis dieser Verarbeitungsschritte liegt die vollständige morphologische Analyse und die Wortart für jedes Wort des Satzes vor. Die Grundform des ausgewählten Wortes wird nun im Index, der auch Schreibvarianten enthält, nachgeschlagen und so der zugehörige Wörterbucheintrag und mit Hilfe der Wortartinformation auch der für den Kontext relevante Teil-Eintrag lokalisiert. Dazu wird vorher die Wortart, die von der Morphologie geliefert und vom Hidden-Markov-Modell disambiguiert wurde, auf die Wortart, die im Wörterbuch verwendet wird, abgebildet. Die in dem relevanten Teil-Eintrag kodierten Kontextmuster für komplexe Ausdrücke werden nun mit dem endlichen Automaten des Satzes abgeglichen. Wird ein Kontextmuster im Satz erkannt, wird die entsprechende Übersetzung dem Benutzer über die graphische Schnittstelle präsentiert. Ansonsten wird der passende Teileintrag in einer auf die Rezeptionsfünktion abgestimmten, stark reduzierten Form als Antwort geliefert. <?page no="177"?> COMPASS: Ein intelligentes Wörterbuchsystem 177 4. Die graphische Schnittstelle Für die Darstellung der Texte und Wörterbucheinträge wurde eine spezielle graphische Benutzerschnittstelle für Apple-Macintosh-Rechner entwickelt (Wetzel 1996). Über diese Schnittstelle können Texte ohne COMPASS-Unterstützung gelesen (read mode), editiert (edit mode) oder mit dem COMPASS- System verbunden werden (assist mode). Im assist mode wird durch das Anklicken eines Wortes der Nachschlageprozeß aktiviert, und in einem kleinen Hilfefenster werden die Übersetzungen gezeigt, die aufgrund der Kontextanalyse aus dem Wörterbuch extrahiert wurden (vgl. Abb. 1). Falls keine einzelne Übersetzung automatisch ausgewählt werden konnte, werden zuerst nur die Hauptübersetzungen angegeben, ohne zusätzliche Verwendungsangaben. Diese, sowie weitere Übersetzungsvarianten oder auch der gesamte Eintrag, können über verschiedene Symbole angefordert werden, wodurch eine hypertextähnliche Funktionalität angeboten wird. File Edit COMPHSS Lufthansa: Fesseln abstreifen Konzernchef Weber will zurüclctreten, wenn die Privatisierung nicbt bald kommt Jürgen Weber atmet erst mal durch: 'Anfang 1992, als wir unser erstes Sparpaket verabschiedet haben, befanden wir uns noch auf der Intensivstation", sagt der Vorstandsvorsitzende der Beutschen Lufthansa. "Aber jetzt ist das Schlimmste überstanden. SotirS the worst chairmen Der Patient Lufthansa liegt mittlerweile im normalen Krankenzimmer." Doch an eine Entlassung ist vorerst nicht zu denken. Auch 1 993SbE|5sJ Lufthansa rote Zahlen, wenn auch nicht mehr so hohe Mit seinem Erste-Hilfg^fogrSülm hat Weber dem flügellahmen Kranich wieder frischen Wind unters zerza>^? Gefieder gepustet: Knapp 7000 ie Produktivität ist gestiegen, die \ : , ■ . werden. Weil Weber zudem die von 6000 geplanten Stellen jahrelang steigenden Stückk Abschreibungszeiten der FU Jahr auf 500 Millionen Marl lo bo (0«pl<j) in th« rod er Vorjahresverlust in diesem Abb. 2: Benutzerschnittstelle: Mehrwortlexem Konnte ein Wort nicht morphologisch analysiert oder nicht im Wörterbuch gefunden werden, erscheint eine entsprechende Meldung im Hilfefenster zusammen mit einer Editierzeile, in der der Benutzer das Wort für ein erneutes Nachschlagen abändern oder ein anderes Wort angeben kann. Dieses Nachschlagefenster läßt sich auch jederzeit über eine Menü-Funktion auffufen. Für die Ausgangssprache Deutsch wird dasselbe Fenster benutzt, um die Bestandteile von nicht im Wörterbuch angegebenen Komposita einzeln nachzuschlagen. Hierfür werden dem Benutzer in einem zusätzlichen Pull-Down-Fenster <?page no="178"?> 178 Christine Thielen/ Elisabeth Breidt/ Helmut Feldweg die verschiedenen möglichen Kompositabestandteile angeboten. Die Kompositasegmentierung wird von der Morphologiekomponente des Systems durchgeflihrt. « File feist COMPRSS Konzernchef Weber wi Jürgen Weber atmet erst verabschiedet haben, beta Vorstandsversitzende der board chairman Der Patient Lufthansa ln Doch an eine =QI»iana»Bfl is Zahlen, wenn auch nicht n flügellahmen Kranich wie( (in Ruhestond) reti reine nt pensioning eff von SSO© geplanten Stellen im Unternehmen sind gekappt, die Produktivität ist gestiegen, die ! i jahrelang steigenden Stückkosten konnten erstmals gesenkt werden. Weil Weber zudem die Abschreibungszeiten der Flugzeugflotte streckte, wird sich der Vorjahresverlust in diesem Jahr auf 500 Millionen Mark halbieren Die Anfangserfolge haben Weber ermutigt 1994 will der Chefpilot erstmals wieder ein Abb. 3: Benutzerschnittstelle: Vollständiger Wörterbucheintrag Das Hilfefenster bietet dem Benutzer verschiedene Optionen an: Durch Anwählen einer Übersetzung kann das Wort im Text mit dieser Übersetzung annotiert werden. Je nach vorheriger Einstellung wird diese Annotierung interlinear, am Textrand oder in einem separaten Fenster plaziert. Wünscht der Benutzer über die Übersetzung hinaus noch weitere Informationen, so kann er über eine Schaltfläche im Hilfefenster zusätzliche Angaben zu den einzelnen Bedeutungen erhalten (Lupensymbol) bis hin zur Ausgabe des gesamten Wörterbucheintrags (Buchsymbol, vgl. Abb. 3). Führt der Benutzer keine weiteren Aktionen im Hilfefenster aus, so verschwindet das Fenster nach einer voreingestellten Zeit. Auf Wunsch können von einer COMPASS-Sitzung Protokolldateien {session storage files) unterschiedlichen Formats erstellt werden. Sie können z.B. bei einer späteren Wiederholung der nachgeschlagenen Vokabeln hilfreich sein. <?page no="179"?> COMPASS: Ein intelligentes Wörterbuchsystem 179 5. Die COMPASS-Wörterbücher Die COMPASS-Wörterbücher basieren auf bereits bestehenden, konventionellen zweisprachigen Wörterbüchern, die uns in maschinenlesbarer Form von den Verlagen zur Verfügung gestellt wurden. Diese Wörterbücher sind multifunktional. Hausmann (1977) unterscheidet auf der einen Seite die Funktion als Schreibwörterbuch (dictionnaire d’encodage), das zur Produktion fremdsprachlicher Texte dient und auf der anderen Seite die Funktion als Lesewörterbuch (dictionnaire de decodage), das zur Rezeption fremdsprachlicher Texte dient. Bei der Rezeption kann man weiter unterscheiden, ob es dabei um eine stilistisch adäquate Textwiedergabe (Herübersetzung) oder um ein bloßes Verstehen eines fremdsprachigen Textes geht. Abb. 4 zeigt die verschiedenen Funktionen eines zweisprachigen Wörterbuchs (Deutsch-Englisch). Nun soll COMPASS dem Benutzer nur die Teile eines Wörterbucheintrags zeigen, die für das Verstehen des ausgewählten Wortes im Kontext relevant sind. Dafür wird von den möglichen Funktionen des zweisprachigen Wörterbuchs lediglich eine einzige Funktion benötigt, wie in der Tabelle in Abb. 4 hervorgehoben wird. Darüberhinaus hat der Benutzer aber auch die Möglichkeit, den kompletten (multi-funktionalen) Eintrag einzusehen. Abb. 4: Funktionen eines zweisprachigen Wörterbuchs (Deutsch-Englisch) und die spezielle compAss-Funktion Um dem Benutzer eine bestimmte Sicht eine COMPASS-Sicht auf das Wörterbuch geben zu können und genau die Elemente zu zeigen, die für die Rezeption relevant sind, müssen die lexikographischen Elemente des Wörterbuchs zuerst einmal explizit gemacht werden. Dabei wird in zwei Schritten <?page no="180"?> 180 Christine Thielen/ Elisabeth Breidt/ Helmut Feldweg vorgegangen: Im ersten Schritt wird das maschinenlesbare Material strukturell analysiert und als Datenstruktur für die weitere Verarbeitung abgespeichert. Diese Datenstruktur nennen wir Wörterbuchdatenbank. Im zweiten Schritt wird die Wörterbuchdatenbank für die spezielle COMPASS-Funktion mit zusätzlichen Angaben angereichert. Die einzelnen Schritte werden im folgenden näher erläutert. 5.1 Vom Satzband zur Wörterbuchdatenbank Ausgangspunkt der maschinellen Verarbeitung der Wörterbücher waren sog. Satzbanddateien. Diese waren bereits teilweise inhaltlich annotiert, d.h. die lexikographischen Textelemente waren im CDE zeilenweise markiert (vgl Abb 5) und im OHEF mit SGML-Markierungen geklammert und größtenteils zu Angabegruppen zusammengefaßt (z.B. <sl> = syntactic group, <s2> = semantic group) (vgl. Abb. 6). Um die Wörterbücher für weitere Anwendungen, d.h. auch über COMPASS hinaus, verfügbar zu machen, wurden die Wörterbuchartikel vollständig strukturell analysiert. Dabei wurde nach META, einer Methode zur Artikelstrukturanalyse für das Wörterbuchparsing (Storrer 1996), vorgegangen. Die methodischen Schritte von META werden im folgenden anhand des CDE-Beispiels (vgl. Abb. 5) näher erläutert. anfangen sep irreg 1 vt (a) {beginnen) Arbeit, Brief, Gespräch, (inf: anbrauchen) neue Tube etc to start, to begin; Streit, Verhältnis, Fabrik to start. (b) {anstellen, machen) to do. das mußt du anders ~ you'll have to go about it differently; was soll ich damit ~? what am I supposed to do with that? ; {was nützt mir das? ) what's the use of that? ; damit kann ich nichts ~ (nützt mir nichts) that's no good to me; {verstehe ich nicht) it doesn't mean a thing to me; nichts mit sich/ jdm anzufangen wissen not to know what to do with oneself/ sb; mit dir ist heute (aber) gar nichts anzufangen! you're no fün at all today! . 2 vi to begin, to start, wer fangt an? who's going to start or begin? ; fang (du) an! (you) begin or start! ; ich habe schon angefangen I've already started; du hast angefangen! you started! ; (bei Streif) you started it! ; ... (CDE, S. 32) <HWME> a>.<nfangen <HWGR> sep irreg <CT1P> 1 <POSP> vt <CT2M> a <?page no="181"?> COMPASS: Ein intelligentes Wörterbuchsystem 181 <LBIN> beginnen <COLL> Arbeit, Brief, Gespräch <LBRR> inf <LBRR> YYY <LBIN> anbrauchen <COLL> neue Tube etc <TRAN> to start <TRAN> to begin <COLL> Streit, Verhältnis, Fabrik <TRAN> to start <CT2M> b <LBIN> anstellen, machen <TRAN> to do <PHRS> das mußt du anders a>.<nfangen <TRAN> you'll have to go about it differently <PHRS> was soll ich damit a>.<nfangen? <TRAN> what am I supposed to do with that? <LBIN> was nützt mir das? <TRAN> what's the use of that? Abb. 5: CDE-Wörterbuchartikel (Druckbild und elektronisches Format) 5.1.1 Entwicklung einer Mikrostrukturgrammatik Im ersten Schritt von META werden anhand des gedruckten Wörterbuchtextes die hierarchischen Mikro Strukturen von Artikeln untersucht und mittels einer Mikro Strukturgrammatik spezifiziert. Dazu werden exemplarisch für jeden Lemmazeichentyp die Artikel zuerst in elementare lexikographische Angaben zerlegt und funktionalen Kategorien (den terminalen Symbolen der Mikrostrukturgrammatik) zugeordnet und dann zu komplexen Angabeklassen zusammengefaßt. Die so analysierten Strukturen können dann als kontextfreie Mikrostrukturgrammatik formuliert werden, z.B. für den CDE-Artikel zu anfangen 5 5 Die Grammatik ist in Extended-Backus-Naur-Form notiert: |: alternative Regel [...]: optionale(s) Element(e) {...}: null oder beliebig viele Elemente. <?page no="182"?> 182 Christine Thielen/ Elisabeth Breidt/ Helmut Feldweg SE 6 FG HG GrG SG Sense UsgS UsgCombS LdiaS Sub Tr MWG Mwe FG [ Hno ] HG { HNo HG }. LF [ Fron ] [ FGGrU ]. GrG SG { SG }. Pos | Gend. [ SNo ] Sense { SNo Sense }. { UsgS } Sub { { UsgS } Sub } { MWG }. SUS [ Coli ] UsgCombS [ Coli ] Coli. LdiaS SUS. Lstyl | Ldom | Lgeo | Lchron [ Lfreq | Lfig | Leval Tr { Tr }. Eq | Gloss | Cult. Mwe { UsgS } Sub { { UsgS } Sub }. Mweform | Uniq | Lex. Mit dieser Grammatik wird dem Artikel anfangen die in Abb. 6 gezeigte Struktur zugewiesen. 5.1,2 Entwicklung einer Artikelstrukturgrammatik Im zweiten Schritt wird die Mikrostrukturgrammatik zur Artikelstrukturgrammatik erweitert, indem jetzt auch nicht-typographische Strukturanzeiger (Satzzeichen, Klammern, vorhandene Tags) und typographische Strukturanzeiger (Schriftarten, Schriftschnitte) berücksichtigt werden. Strukturanzeiger dienen dem Leser als optische Orientierungshilfe im Wörterbuchartikel, da sie lexikographische Textsegmente umschließen, voneinander abtrennen oder besonders hervorheben. Typographische Strukturanzeiger sind direkt an ein Textsegment gebunden, stellen also keine separaten Segmente dar und werden in der Artikelstrukturgrammatik durch Indizes (s = standard/ normal, b = bold/ fett, i = italics/ kursiv) dargestellt: SE FG HG GrG SG II II j Sense = UsgS }} Sub } FG [ Hnof ] HG { HNo f HG }. LF f [ Pron ] [ FGGrUi ]. GrG SG{ SG}. Pos; | Gendi. ["(" SNof")" ] Sense { "(" SNo f ")" Sense { UsgS { UsgS }} Sub { { UsgS { { MWG}. 6 Zur Erklärung der (englischsprachigen) Symbolnamen, siehe Anhang am Ende des Beitrags. Wir unterscheiden 6 Artikeltypen: Standardartikel (standard entry), Nischenartikel (niche entry), Verweisartikel (cross reference entry), Abkürzungsartikel (abbreviation entry), Homographenartikel (homograph entry) und Nestartikel (nest entry). <?page no="183"?> COMPASS: Ein intelligentes Wörterbuchsystem 183 UsgS = "(" SUSi")"[ Coli; ] | "(" UsgCombS ")" [ Colli ] | Colli. UsgCombS = LdiaSSUSi. LdiaS = Lstyi | Ldom; | Lgeoi | Lchroni | Lfreqi | Lfigi | Leval; . Sub = Tr { ", " Tr }. Tr = Eq s | Glossi | Cult s . MWG = Mwe { UsgS { UsgS }} Sub { { UsgS { UsgS}} Sub}. Mwe = Mweformf | Uniqf | Lexf. 5.1.3 Entwicklung einer parserspezifischen Grammatik Im nächsten Schritt von META wird zur Analyse des Satzbandes übergegangen. Der Satzbandtext einschließlich aller Steuerzeichen wird auf die Kategorien und Strukturanzeiger der Artikelstrukturgrammatik abgebildet und als Grammatik entsprechend dem vom Wörterbuchparser geforderten Grammatikformalismus spezifiziert. Im Projekt wurde der Wörterbuchparser LEX- PARSE (Hauser/ Storrer 1993) verwendet. Da uns bereits aufbereitete Satzbänder zur Verfügung standen, reduzierte sich die Abbildung mehr oder weniger auf die Zuordnung der vorhandenen Markierungen {tags) zu den Kategorien der Artikelstrukturgrammatik. Strukturanzeiger sind im Collins-Satzband bis auf einige wenige Ausnahmen nicht mehr enthalten, vielmehr sollen diese tags beim Druck des Wörterbuchs die Ausgabe von Strukturanzeigern steuern. Im elektronischen Format des OHEF dagegen sind nicht-typographische Strukturanzeiger noch komplett vorhanden und mußten beim Parsen teilweise berücksichtigt werden. So sind z.B. als ‘<lc>’ markierte Elemente innerhalb eckiger Klammern [,] Kollokatoren (z B. <lc>autorities</ lc>), ansonsten Komposita (z.B. <lc>&hw. of call</ lc>). Der Grammatikformalismus von LEXPARSE basiert auf Phrasenstrukturregeln und zusätzlichen Konstrukten, die es erlauben, Anweisungen an den Parser, z.B. zur Fehlerbehandlung, direkt in die Grammatik einzubauen. Darüberhinaus können auch kontext-sensitive Regeln formuliert werden, um damit den Parsingprozeß deterministisch und effizienter zu gestalten. Eine Beschreibung der parserspezifischen Grammatiken, die im Projekt entwickelt wurden, geben Thielen/ Breidt (1996, S. 30-38). Die genaue Beschreibung des LEXPARSE- Systems findet sich im User's Manual (Hauser 1993). <?page no="184"?> 184 Christine Thielen/ Elisabeth Breidt/ Helmut Feldweg port / p' ): t/ 1 n 1 (harbour) port m; in ~ au port, to come into ~ entrer dans le port; to put into ~ relächer; to leave ~ appareiller, the ship left ~ le bateau a appareille; container ~ port a conteneurs; Channel ~ Port de la Manche; fishing ~ port de peche; ~ of despatch/ embarkation/ entry port m d’expddition/ d'embarquement/ de debarquement; ~ of call Naut escale/ ; fig (stop) arret m\ home ~ port m d'attache; 2 Wine porto m; 3 Aviat, Naut (window) = port hole; 4 Mil Naut (gunport) sabord m; 5 Aviat, Naut (left) bäbord m; to ~/ on the ~ side ä bäbord; 6 Tech (in engine) orifice m; 7 Comput port m. II modif 1 (harbour) [area, authorities, facilities, security] portuaire; [dues] de port, du port; 2 Aviat, Naut (left) [entrance, engine, bow] de bäbord. HI vtr Comput transporter [qch] (d'un Systeme ä l'autre). idioms any ~ in a storm ndcessite fait loi. (OHEF, S.1573) <se> <hw>port</ hw> <pr> <ph>pO: t</ ph> </ pr> <sl num=I nl=n> <ps>n</ ps> <s2num = l> <ann> <la> Naut </ la> </ ann> (<ic>harbour</ ic>) port <gr>m</ gr> ; <le>in&hw.</ le> auport; < le > to come into &hw. < / le > entrer dans le port; [...] <le>&hw. of despatch/ embarkation/ entry </ le > port <gr>m</ gr> d'expedition/ d' embarquement/ de debarquement; <lc>&hw. ofcall</ lc> <la>Naut</ la> escale <gr>f</ gr>; <la>fig</ la> (<ic>stop</ ic>) arret <gr>m</ gr> ; [...] <s2 num=2> <la> Wine</ la> porto <gr>m</ gr> </ s2> ; <s2 num=3> <la>Aviat</ la>, <la>Naut</ la> (<ic>window</ ic>) = <xr> <x>porthole</ x> </ xr> </ s2>; <s2 num=4> <la>Mil Naut</ la> (<ic>gunport</ ic>) sabord <gr>m</ gr> </ s2>; <s2 num=5> <la>Aviat</ la>, <la>Naut</ la> (<ic>left</ ic>) bäbord <gr>m</ gr>; <le> to &hw./ on the &hw. side</ le> ä babord</ s2>; [...] <sl num=II> <ps>modif</ ps> <s2 num=l>(<ic>harbour</ ic>) [ < Ic > area < / Ic >, < Ic > authorities < / Ic >, < Ic > facilities < / Ic >, < Ic > security < / Ic > ] portuaire; [ < Ic > dues < / Ic > ] de port, du port < / s2 > ; [...] <sl num=IIl> <ps>vtr</ ps> <la>Comput</ la> transporter [qch] (d'unSysteme ä l'autre) </ si > . < id > < li > any &hw. in a storm < / li > necessite fait loi < / id > . < / se > Abb. 6: Gedruckter Wörterbuchartikel zu port im ohef und die aufbereitete Satzbandentsprechung 5.1.4 Testen und Verbessern der parserspezifischen Grammatik Nachdem eine erste parserspezifische Grammatik entwickelt wurde, werden Testdurchläufe mit dem gesamten Wörterbuchtext durchgefuhrt und die Grammatik sukzessive erweitert und verbessert. Dank der guten Möglichkeiten zur Fehlerbehandlung in LEXPARSE können fehlerhafte Artikel, d.h. Artikel, denen der aktuellen Grammatik folgend keine wohlgeformte Struktur zugeordnet werden konnte, und die Fehler selbst schnell lokalisiert werden 7 . Ne- LEXPARSE unterstützt verschiedene Ausgabeformate, so bieten sich zum Testen Attribut- Wert-Bäume wie in Abb. 8 an. Beim abschließenden Parsen des gesamten Wörterbuchs <?page no="185"?> COMPASS: Ein intelligentes Wörterbuchsystem 185 ben den Fehlern, die auf die Grammatik zurückzufuhren sind, stellen auch Fehler, die durch fehlende oder inkonsistente Verwendung von Strukturanzeigern, z.B. falschen Tags, hervorgerufen werden, eine Fehlerquelle dar. In diesen Fällen mußte das Satzband korrigiert werden. Abschließend können wir feststellen, daß es von großem Vorteil war, bereits aufbereitete Satzbänder zur Verfügung zu haben, in denen die lexikographischen Elemente, wenn auch nicht immer bis hin zur kleinstmöglichen Segmentierungsstufe, markiert waren. Verschiedene Schwierigkeiten, die bei ungetaggten Satzbändern auftreten, wie die Entfernung von uninformativen Drucksteuerzeichen, die Umwandlung von Sonderzeichen in ein besser lesbares Format oder die korrekte Interpretation ambiger Strukturanzeiger entfielen hierdurch. Das Wörterbuchparsing ist trotzdem notwendig, um auch die Teil- Ganzes-Relationen der funktionalen Textsegmente aufzudecken und damit die Voraussetzung für die Erzeugung der ganz speziellen COMPASS-Sicht zu schaffen. 5.2 Von der Wörterbuchdatenbank zum COMPASS-Wörterbuch Nachdem die Wörterbücher geparst sind, werden verschiedene lexikographische Anpassungen durchgeführt, um aus den Wörterbuchdatenbanken für COMPASS geeignete Wörterbücher zu machen. Einige dieser Anpassungen können automatisiert werden, aber viele erfordern wohlüberlegte Entscheidungen einer erfahrenen Lexikographin/ eines erfahrenen Lexikographen. Trotzdem ist es eines der wesentlichen Einsichten des COMPASS-Projekts, daß der Aufwand, ein bereits bestehendes elektronisches Wörterbuch für diesen speziellen Zweck anzupassen, wesentlich geringer ist, als von Grund auf ein neues, computergerechtes Wörterbuch zu entwickeln. In den nächsten Abschnitten beschreiben wir die Anpassungen, die für die Konvertierung der Wörterbuchdatenbanken in die für COMPASS geeignete Form nötig waren. wurde das SGML-Format verwendet, um das so geparste Wörterbuch in einem sgml- Editor weiter aufzubereiten (vgl. Abschnitt 5.1). <?page no="186"?> 186 Christine Thielen/ Elisabeth Breidt/ Helmut Feldweg DE +-> SE +-» FG +-^ LF: "anfangen” +-> FGGrU: "sep irreg'' +->FDMo: "1" +-> HG »GrG +-> Pos: "vT > SG +-» SNo: "a" +—> Sense +-> UsgS +—> SUS: "beginnen" +-> Coli: "Arbeit, Brief, Gespräch" +-> UsgS +-> UsgCombS +-> LdiaS | +-> Lstyl: "inf' +-» SUS: "anbrauchen" +-> Coli: "neue Tube etc" +-> Sub +-» Tr | +--> Eq: "to start" +-> Tr +-4 Eq: "to begin" +-> UsgS +-> Coli: "Streit, Verhältnis, Fabrik" +-> Sub +->Tr +-> Eq: "to start” +-> SNo: "b" +-> Sense +-» UsgS +-> SUS: "anstellen, machen" +-» Sub +-» Tr +-> Eq: "to do" +->MWG • Mwe +-> MweForm: "das mußt du anders anfangen" ■ Sub +-> Tr +-» Eq: "you 'll have to go about it differently" +->MWG ... • HNo: "2"... Abb. 7: CDE-Mikrostruktur <?page no="187"?> COMPASS: Ein intelligentes Wörterbuchsystem 187 5.2.1 Dekompaktierungen Gedruckte zweisprachige Wörterbücher sind für den menschlichen Benutzer konzipiert und können somit dessen Interpretationsfähigkeit zur Auflösung von Kompaktierungen voraussetzen. Aus Platzgründen werden deshalb die unterschiedlichsten Formen der Textverdichtung (Wolski 1991) ausgiebig verwendet. Für die Verarbeitung durch LOCOLEX müssen diese Kompaktierungen jedoch aufgelöst werden. Hierzu gehören: - Komplexe Angaben in separate Angaben aufteilen, z.B.: - Variante Lemmaformen (Neugier(de), Bade(hand)tuch, Lehrerin)) - Übersetzungsvarianten {herunterreißen to pull or tear down) - Variante Mehrwortlexeme {abseits bleiben, sich abseits halten to hold oneself) - Implizite Informationen explizit machen, z.B. - Wortartenangabe bei Nomina erfolgt implizit durch die Angabe des Genus - Übersetzungen, die implizit in Beispielangaben gegeben werden, wie in: „aufhalsen vf sep (inf) jmd/ sich etw ~ to saddle or land sb/ oneself with sth {inf)...“ - Expansion von Nischen-/ Nest-Artikeln zu separaten Artikeln - Ersetzung von Platzhaltern, z.B. das Zeichen ~ (Tilde) als Platzhalter für die Lemmaform. 5.2.2 Ausfiltem von Beispielangaben Herkömmliche zweisprachige Wörterbücher enthalten viele Verwendungsbeispiele, die in erster Linie für die Sprachproduktion hilfreich sind. Sie sollen im COMPASS-Wörterbuch ausgeblendet werden und nur auf ausdrücklichen Wunsch dem Benutzer gezeigt werden. Zweisprachige Wörterbücher enthalten aber auch Mehrwortlexeme (MWL, z.B. sein Teil abbekommen, in Erfahrung bringen), feste Ausdrücke (z.B. Eile mit Weile) und grammatische Kollokationen (z.B sich in etw or zu etw verwandeln), die für die Rezeption durchaus relevant sind und deshalb auch in ein maschinell verarbeitbares Format überführt werden müssen. Wenn, wie im CDE, Beispielangaben und Mehrwortlexeme im gedruckten Wörterbuch formal nicht unterschieden werden und somit auch beim Parsen nicht unterschieden werden können, müssen sie manuell markiert werden. Im OHEF wurden zwar bereits unterschiedliche tags hierfür benutzt, das Tagging aber nicht systematisch genug durchgeführt, so daß auch hier eine Überarbeitung und Re-Klassifizierung notwendig waren. <?page no="188"?> 188 Christine Thielen/ Elisabeth Breidt/ Helmut Feldweg 5.2.3 Korpusbasierte Ergänzungen der Daten Um die Abdeckung der Wörterbücher hinsichtlich der Mehrwortausdrücke zu verbessern, werden fehlende MWLs, grammatische Kollokationen und Variantenformen zu MWLs aufgrund von Korpusabffagen und -berechnungen ergänzt. Zur Erstellung von Konkordanzen verwendeten wir für das CDE cqp (Schulze/ Christ 1994) zusammen mit xkwic (Christ 1993). Außerdem wurden Listen potentieller MWLs basierend auf den Berechnungen von Bigrammen und ihren Frequenz- und MI-Werten 8 mit NGRAM (Feldweg/ Hipp 1993) erstellt (vgl. auch Breidt 1993). Für das OHEF standen Konkordanzen aus dem OUP- Korpus zur Verfügung, in denen bestimmte syntaktische Relationen gekennzeichnet wurden (mit Sextant, vgl. Grefenstette 1994). Diese Konkordanzen und MWL-Listen wurden dann manuell ausgewertet und die Wörterbucheinträge mit fehlenden MWLs erweitert. 5.2.4 Formalisierung von Kontextmustern Als letzter und wichtigster Schritt der Konvertierung zum COMPASS-Wörterbuch werden nun Kontexte in Form von lokalen Grammatiken in den Wörterbucheinträgen so definiert, daß sie von LOCOLEX ausgewertet werden können, und es möglich ist, Mehrwortausdrücke zu erkennen und dem Benutzer die Übersetzung des gesamten Ausdrucks, nicht nur die des ausgewählten Wortes, zu zeigen. Zur Formalisierung von Mehrwortlexemen, festen Ausdrücken und grammatischen Kollokationen werden diese zuerst in ihre kanonische Form umgeformt, wofür wir die in herkömmlichen Wörterbüchern gebrauchte Notation etwas erweitert haben. Die kanonische Form eines Mehrwortausdrucks enthält alle lexikalisch fixierten Komponenten in der Form, in der sie Vorkommen müssen, bzw. bei morphologisch flexiblen Bestandteilen in einer ‘neutralen’ Form (Verb im Infinitiv Präsens, Nomen im Singular etc.). Verbargumente werden mit Metavariablen {etw, jdm, NPakk) ausgedrückt. Außerdem wird mit ‘°’ markiert, ob ein Wort morphologisch variiert werden kann. Lexikalische Varianten, die im Wörterbuchtext durch 7’ getrennt sind, werden mit ‘ A ’ geklammert, wenn sie mehr als ein Wort enthalten, um den Skopus deutlich zu machen. Die folgenden Beispiele zeigen die Form, in der die Phrasen im CDE angegeben sind und die kanonische Form, in die sie umgeformt wurden: (1) du schottest dich gegen jeden Besuch ab ® sich gegen etw abschotten 0 (2) das ist ihm eigen ® jdm/ etw (ADVP) eigen sein 0 8 Mi = Mutual Information, vgl. Church/ Hanks (1990). <?page no="189"?> COMPASS: Ein intelligentes Wörterbuchsystem 189 (3) das geht über meine Kräfte ® über jds Kräfte gehen 0 (4) er hält die Fäden (fest) in der Hand ® alle/ die Fäden (NPgen) (fest) in A der Hand/ Händen A halten 0 / haben 0 / behalten° Aus der kanonischen Form wird ein regulärer Ausdruck entsprechend des Finite-State-Formalismus IDAREX (Segond/ Tapanainen 1995) generiert, der auf der Zwei-Ebenen-Morphologie des Sprachmodells aufsetzt. Eine Basisform des regulären Ausdrucks wird automatisch erzeugt: für morphologisch flexible Bestandteile wird die Grundform und eine morphologische Variable erzeugt. Flektierte Wortformen werden als Oberflächenformen behandelt und mit vorhergehendem Doppelpunkt markiert. Lexikalische Varianten werden als Disjunktionen dargestellt und optionale Elemente bleiben geklammert. Metavariablen werden in entsprechende IDAREX-Variablen umgewandelt (z.B. sich ® REEL, jds ® NPgen), die Variable ANY dient als Platzhalter für beliebige Wortformen. Darüberhinaus werden fürs Deutsche auch Wortstellungsvariationen (V-Erst, V-Zweit und V-Endstellung) abgedeckt, wobei gegebenenfalls abtrennbare Verbpräfixe berücksichtigt werden. Eine ausführlichere Diskussion der Formalisierung von MWLs als reguläre Ausdrücke geben Breidt et al. (1996). Für die obigen Beispiele werden folgende reguläre Ausdrücke generiert: (1) [ schotten Vfm: ANY* REFL ANY* : gegen NP ADV* ab Pref: | REFL ANY* : gegen NP abschotten V: ] (2) [ sein Vfin: ANY* NPdat (ADVP) : eigen | NPdat (ADVP) : eigen (ZU) seinV: ] (3) [ gehen Vfin: ANY* : über NPgen : Kräfte | : über NPgen Kräfte (ZU) gehen V: ] (4) [ [ halten Vfm: | haben Vfin: | behalten Vfin: ] ANY* [ : alle | : die ] : Fäden (NPgen) (: fest) : in [ : der : Hand (Händen j | [ : alle | : die ] : Fäden (NPgen) (: fest) : in [ : der : Hand | : Händen ] (ZU) [ halten V: | haben V: | behalten V: ] ] Die automatisch generierten regulären Ausdrücke können anschließend manuell nachbearbeitet werden, um noch fehlende Variationsmöglichkeiten abzudecken. Die so aufbereiteten Wörterbücher werden für einen schnelleren Zugriff mit LOCOLEX in eine Datenstruktur vorkompiliert, die für alle COMPASS-Wörter- <?page no="190"?> 190 Christine Thielen/ Elisabeth Breidt/ Helmut Feldweg buchdatenbanken gleich ist. Außerdem werden alle kodierten regulären Ausdrücke in endliche Automaten kompiliert und zusammen mit dem Wörterbuch gespeichert. Durch die Erweiterung der Wörterbuchdatenbanken mit regulären Ausdrücke werden so aus den ursprünglich statischen Wörterbüchern dynamische COMPASS-Wörterbücher, die durch die Automaten kleine Programme zur Kontextauswertung enthalten. 6. Evaluierung Das COMPASS-System wurde in zwei Testphasen von Benutzern an den Universitäten Bournemouth (Deutsch-Englisch) und Lyon2 (Englisch-Französisch) getestet. Dabei wurde zum einen das Leseverständnis aufgrund anschließender Verständnisfragen zum Text überprüft, zum anderen bewerteten die Benutzer anhand eines Fragebogens die Funktionalität von COMPASS. Die Ergebnisse fielen ausgesprochen positiv aus, wie einige Kommentare der Benutzer zeigen: „compass is more effective than printed dictionaries to help the reader find the appropriate translations“ „Very easy to use, even for somebody who is not accustomed to using dictionaries, which is the case of many non-advanced learners. You do not have to know how to use a dictionary to get a lot of useful information from Compass.“ „The concept is fantastic and should be very successful when finalised.“ Um die allgemeine Akzeptanz des COMPASS-Systems zu ermitteln, wurden die Benutzer u.a. befragt, wie nützlich sie dieses System finden. Von 93 Befragten bewerteten 14 (15%) das COMPASS-System als nützlich, 35 (38%) als ziemlich nützlich und 42 (45%) als sehr nützlich, nur 2 (2%) Testteilnehmer bewerteten das System negativ. Besonders die morphologische Analyse, d.h. die Rückführung auf die Grundform und die Kompositasegmentierung, wurde als sehr hilfreich bewertet. Darüberhinaus konnte die von COMPASS gelieferte Erkennung von MWLs ausgehend von einzelnen Textwörtem, die Bestandteil des MWL sind, die Unterstützung beim Leseverständnis verbessern. Die Wortartendisambiguierung spielte fürs Deutsche eine wesentlich kleinere Rolle als fürs Englische, wo größere Ambiguitäten unter den Hauptwortarten bestehen. Die Ergebnisse der Benutzerbeffagung ist in folgender Tabelle zusammengefaßt: <?page no="191"?> COMPASS: Ein intelligentes Wörterbuchsystem 191 English-French % German-English # % Total % very useful 21 38 21 55 42 45 quite useful 24 44 11 29 35 38 useful 14 16 14 15 not useful not at all useful Tabelle: Akzeptanz des COMPASS-Systems Die Verwendung von regulären Ausdrücken für die Beschreibung der Variabilität von Mehrwortlexemen erwies sich als sehr praktikabel, auch wenn die Auswertung durch finite-state-Technologien sehr rechenintensiv ist. Durch die Vorkompilierung der Wörterbücher konnte die Laufzeit in einem akzeptablen Rahmen gehalten werden. 7. Zusammenfassung Ein großes Anliegen bei der Wörterbuchaufbereitung war, die Ausgangswörterbücher so in eine Datenbank zu überfuhren, daß auf alle lexikographischen Angaben direkt zugegriffen werden kann und die Datenbank später für unterschiedliche Anwendungen ausgewertet werden kann. Dadurch wurde neben dem neu hinzugekommenen, aber virtuellen mono-fünktionalen COMPASS- Wörterbuch das ursprüngliche, multi-fünktionale Wörterbuch beibehalten, so daß für COMPASS ein Rezeptionswörterbuch mit einem kompletten zweisprachigen Wörterbuch im Hintergrund zur Verfügung steht. COMPASS hat gezeigt, daß die Kombination verfügbarer Technologien der maschinellen Sprachverarbeitung mit sorgfältig aufbereiteten maschinenlesbaren Wörterbüchern erheblich zum Fremdsprachenverständnis beitragen kann. Um diese Unterstützung weiter zu verbessern, sind einige Erweiterungen denkbar, die vor allem die Bedeutungsdisambiguierung betreffen. So könnten z.B. Kollokatoren und Sachgebietsangaben, die in den Wörterbüchern enthalten sind, berücksichtigt werden. Statistische Methoden, die auf umfangreichen semantischen Netzen basieren oder grobe syntaktische Strukturen erkennen (shallow parsing), könnten eingesetzt werden. Trotz der Verbesserungen, die sich durch solche Weiterentwicklungen der linguistischen Fähigkeiten von COMPASS ergeben würden, ist die Verfügbarkeit umfangreicher, maschinenlesbarer und linguistisch hochwertiger lexikalischer Ressourcen ausschlaggebend für ein leistungsstarkes System wie COMPASS. <?page no="192"?> 192 Christine Thielen/ Elisabeth Breidt/ Helmut Feldweg 8. Literatur Atkins, Beryl T. S. (1994): Taking advantage of the Situation: The Hypertext Dictionary. Vortrag auf dem ACQUILEX-Il-Workshop „The future of the Dictionary“, Uriage-les- Bains, Frankreich, 17.-19. Oktober 1994. Bauer, Daniel/ Segond, Frederique/ Zaenen, Annie (1995): locolex the translation rolls off your tongue. In: Proceedings of the ach-allc conference, Santa Barbara, CA. S. 6-8. Breidt, Elisabeth (1993): Extraction of V-N-Collocations from Text Corpora: A Feasibility Study for German. Proceedings of the 1st ACL-Workshop on Very Large Corpora. Columbus, Ohio, June 1993. cmp-lg-Archiv 9603006. Breidt, Elisabeth/ Segond, Frederique/ Valctto, Giuseppe (1996): Local Grammars for the Description of Multi-Word Lexemes and their Recognition in Texts. In: Proceedings of complex '96, 4th Conference on Computational Lexicography and Text Research, Budapest, September 1996. Christ, Oliver (1993): The IMS Corpus Workbench: The XKWic User's Manual. Institut fur maschinelle Sprachverarbeitung, Univ. Stuttgart. Interner Bericht. Church, K. W./ Hanks, P. (1990): Word association norms, mutual information and lexicography. In: Proceedings of the 28th Annual Meeting of the Association for Computational Linguistics (acl '90), Pittsburgh, 1990. S. 76-83. Collins (1991): Collins Deutsch-Englisch Englisch-Deutsch Großwörterbuch. Hrsg. v. Terrell, P./ Schnorr, V./ Morris, W.V. A./ Breitsprecher, R. 2. Aufl., London. Feldweg, Helmut (1995): Implementation and Evaluation of a German hmm for pos disambiguation. In: Proceedings of the acl sigdat Workshop: From Text to Tags. Dublin. S. 41-46. Feldweg, Helmut/ Hipp, Michael (1993): NGRAM - Ein Werkzeug zur statistischen Analyse von Wortfolgen. Seminar für Sprachwissenschaft, Univ. Tübingen. Interner Bericht. GERTWOL (1994): Entwickelt von Lingsoft Oy, Helsinki. In: GLDV-Forum, 11/ 1, Juni 1994, S. 17-29. Grefenstette, Gregory (1994): Explorations in Automatic Thesaurus Discovery. Boston/ Dordrecht. Hauser, Ralf (1993): LexParse User's Manual. SfS-Report 10-93, Seminar für Sprachwissenschaft, Univ. Tübingen. Hauser, Ralf/ Storrer, Angelika (1993): Dictionary Entry Parsing Using the LEXPARSE System. In: Lexicographica, 9, S. 174-219. Hausmann, Franz Josef (1977): Einführung in die Benutzung der neufranzösischen Wörterbücher. Tübingen. S. 144ff. Karttunen, Lauri/ Yampol, Todd (1993): Interactive Finite State Calculus. Technical Report ISTL-NLTT-1993-04-01, Xerox Palo Alto Research Center. Oxford-Hachette (1994): Oxford-Hachette English-French Dictionary. Hrsg. v. Correard, M.H./ Grundy, V. Oxford. Schulze, Bruno M./ Christ, Oliver (1994): The IMS Corpus Workbench: The cqp User's Manual. Institut für maschinelle Sprachverarbeitung, Univ. Stuttgart. Interner Bericht. <?page no="193"?> COMPASS: Ein intelligentes Wörterbuchsystem 193 Segond, Frederique/ Tapanainen, Pasi (1995): Using a finite state based formalism to identify and generate multiword expressions. Technical Report mltt-019, Rank Xerox Research Center. Grenoble. Storrer, Angelika (1995): Wörterbücher zum Anklicken - Ein kleiner Rundgang durch die PC-Bibliothek. In: Sprachreport, 2, S. 9-10. Storrer, Angelika (1996): Metalexikographische Methoden in der Computerlinguistik. In: Wiegand, Herbert Ernst (Hg.). Wörterbücher in der Diskussion II. Tübingen. Tapanainen, Pasi (1994): rxrc Finite State Rule Compiler. Technical Report mltt-020, Rank Xerox Research Center. Grenoble. Thielen, Christine/ Breidt, Elisabeth (1996): Conversion of Bilingual Dictionaries: From Typesetting Tape to Dictionary Database. Public compass Deliverable, 23, März 1996. Wetzel, Peter Romeo (1996): Human-Computer-Interface of the compAss-System, compass Deliverable, 22, März 1996. Wiegand, Herbert Ernst (1991): Printed Dictionaries and their Parts as Text. An Overview of More Recent Research as an Introduction. In: Lexicographica, 6, S. 1-124. Wolski, Werner (1991): Formen der Textverdichtung im zweisprachigen Wörterbuch. In: Hausmann, FJ./ Reichman, O./ Wiegand, H.E./ Zgusta, L. (Hg ): Wörterbücher. Ein internationales Handbuch zur Lexikographie. 3. Teilbd. hsk 5.3. Berlin. S. 2837-2853. 9. Anhang: Lexikographische Angaben im CDE (Ausschnitt) AbbrE = "abbreviation entry" Coll = "collocator" (object collocator) Cult = "cultural equivalent" DE = "dictionary entry" Eq = "translation equivalent" FG = "form group" FGGrU = "form group grammatical usage item" (indication sep/ irreg for prefix verbs valid for all HGs) Gend = "gender" Gloss = "gloss" GrG = "grammatical group" HG = "grammatical homograph group" HNo = "homograph counter" HomE = "homograph entry" LF = "lemma form" Lchron = "currency label" LdiaS = "diasystematic label (source language)" Ldom = "domain label" Leval = "evaluative label" Lex = "lexicalised plural" Lftg = "figuration label" Lffeq = "frequency label" <?page no="194"?> 194 Christine Thielen/ Elisabeth Breidt/ Helmut Feldweg Lgeo = "geographic label" Lstyl = "style label" MWG = "multi-word expression group" Mwe = "multi-word expression" MweForm = "multi-word expression form" NestE = "nest entry" = "part of speech" = "standard entry" = "sense group" = "sense counter" = "semantic usage items (source language)" (sense indicator, or subject collocator; not formally distinguishable) Pos SE SG SNo SUS Sense Sub Tr Uniq = "subsense" = "translation" = "unique element" (word that only occurs within MWLs, not in free use) UsgCombS = "combined usage items" UsgS = "usage items (source language)" (contains GrUS, SUS, LdiaS, Coll, XRrel2, AbbrS) XE = "cross reference entry" <?page no="195"?> Heinz J. Weber Das ‘Homographen-Wörterbuch der deutschen Sprache’ als Hypertext 0. Vorbemerkungen Das Homographen-Wörterbuch der deutschen Sprache (1996 bei de Gruyter Berlin, New York erschienen, im folgenden: HWB) wird kurz eingefuhrt. Die Darstellung rückt die Komponenten in den Vordergrund, die bei einer Konversion des HWB in ein Hypertext-System von Wichtigkeit sind. Insbesondere werden die aufeinander bezogenen Einzelverzeichnisse des HWB (Wortformen-, Grundformen-Index, Homographen-Klassen, Hilfsverzeichnisse für Doppelformen, Flexions-Muster oder Heterophone) sowie die Anlage der Einzel-Einträge und die dabei verwendeten Informationstypen behandelt. Einige Benutzungssituationen werden durchgespielt und die in der Buchversion vorgesehenen Lösungswege aufgezeigt. Daran anschließend werden Fragen der Konversion des HWB in ein Hypertext-System und Aussichten auf Verbesserungen gegenüber der Buchvorlage diskutiert. 1. Warum ein Homographen-Wörterbuch? Das ‘Homographen-Wörterbuch der deutschen Sprache’ hat zwei Zielsetzungen: Es ist einmal gedacht als Zusatzwörterbuch in Verbindung mit konventionellen Wörterbüchern zur Erleichterung der Wörterbuch-Suche für Deutschlernende oder unsichere Durchschnittsbenutzer, zum andern ist es angelegt als Daten-Kollektion und Werkzeug für verschiedene computerlinguistische Anwendungsmöglichkeiten. Zu 1: Homographen in konventionellen Wörterbüchern häufig Fehlanzeige! Bei Homographen z.B. gelockte als Form zu <gelockt> und <locken> gestaltet sich die Konsultation eines Allgemein-Wörterbuchs oft schwierig oder zumindest umständlich: Damit bei einer Wortform die Suche nach dem zutreffenden Eintrag nicht bereits nach dem ersten Erfolg abgebrochen wird (z.B. Wir gelockte bei <gelockt, Adjektiv>), muß man erst einmal wissen, daß es sich um einen Fall von Mehrfachinterpretation handelt, und hier geben die gängigen deutschen Wörterbücher nur wenig Unterstützung. Sie setzen meist voraus, daß die aufzusuchenden Stichwörter bereits bekannt sind oder überlassen es dem Spürsinn der Benutzer, die Suche fortzusetzen. Erschwerend kommt dabei die ausgeprägte Flexionsmorphologie des Deutschen hinzu. <?page no="196"?> 196 Heinz J. Weber Das HWB soll eine vermittelnde Rolle zwischen den in Texten vorkommenden Wortformen und den Stichwörtern herkömmlicher Wörterbücher spielen. Konsultiert eine Person das Homographen-Wörterbuch, wird sie auf mögliche Mehrfach-Interpretation einer Wortform hingewiesen, erhält Aufschluß über mögliche Stichwörter zusammen mit einer Minimalbeschreibung und kann dementsprechend die Suche in einem Allgemein-Wörterbuch fortsetzen, falls noch weitere Informationen gewünscht werden. Weitere Benutzungssituationen sind in Abschnitt 6 besprochen. Zu 2 (das HWB als computerlinguistisches Werkzeug): Für die Daten des Homographen-Wörterbuchs bestehen mehrfache computerlinguistische Anwendungsmöglichkeiten, und zwar überall da, wo die Mehrdeutigkeit lexikalischer Ausdrücke die maschinelle Verarbeitung des Deutschen erschwert, insbesondere bei der Entwicklung von Trennhilfen, Synonymendiensten, beim ‘tagging’ und in Lemmatisierungsverfahren; ebenso bei Spracherkennung und maschineller Übersetzung. 2. Das Homographen-Wörterbuch 2.1 Homonymie - Homographie - Homophonie - Heterophonie Zur Beschreibung lexikalischer Mehrdeutigkeit existieren unterschiedliche Begriffe und Betrachtungsweisen: Von Homonymie spricht man in der Regel dann, wenn die betreffende Vokabel sowohl in gesprochener als auch in geschriebener Form mehrdeutig ist. Häufig müssen lautliche und schriftliche Ausdrucksform jedoch getrennt betrachtet werden, denn es gibt Mehrdeutigkeiten auf der Laut-Ebene, die in der Schreibung keine Entsprechung finden (mo: r für <Mohr> - <Moor>) und umgekehrt (<modern> für 'mo: dem mo'dern). Man spricht daher bei Mehrdeutigkeiten auf der Laut-Ebene einschränkend von Homophonie („Gleichheit der Lautung“), bei Mehrdeutigkeiten auf der Ebene der Schreibung von Homographie („Gleichheit der Schreibung“). Das HWB behandelt ausschließlich homographe Wortformen. Den Fall, daß Homographe lautlich verschieden sein können (Beispiel <modern>), bezeichnen wir als Heterophonie („Verschiedenheit der Lautung“). 2.2 Worin unterscheidet sich das Homographen-Wörterbuch von anderen Homonymen-Verzeichnissen? Versuche, lexikalische Mehrdeutigkeiten des Deutschen zu erfassen, sind schon sehr früh unternommen worden (dazu Zaunmüller 1958 und Hausmann 1990). Diese Homonymen-Verzeichnisse entsprechen in Aufbau und Struktur der Einträge weitgehend den Allgemein-Wörterbüchern. Die Stichwörter (in <?page no="197"?> Das ‘Homographen-Wörterbuch der deutschen Sprache' als Hypertext 197 der Regel Grundformen) sind alphabetisch angeordnet, Informationsteile soweit vorhanden enthalten grammatische Angaben mit Definitionen und/ oder Beispielsätzen. Da das HWB in erster Linie eine vermittelnde Rolle zwischen den in Texten vorkommenden Wortformen und den Stichwörtern der Allgemein-Wörterbücher spielen soll, brauchen die grammatischen Informationen im HWB nicht so umfassend zu sein wie die der Allgemein-Wörterbücher. In der Hauptsache gehören dazu Wortklassen- und Flexionsangaben, verschiedentlich Bedeutungs- oder Aussprachehilfen, die auch nur soweit entfaltet werden, wie zur Unterscheidung von Lesarten notwendig. Ein weiteres wichtiges Unterscheidungsmerkmal: Das HWB verzeichnet die Homographe als Wortformen in sogenannten Homographen-Reihen. Das sind Mengen von Wortformen, die in gleicher Weise homograph sind. So stimmen z.B. die Einträge <Herd> und <Herde> in den Formen Herde und Herden überein. Auch im Aufbau gibt es Unterschiede zu anderen Homonymen-Verzeichnissen. Das HWB setzt sich aus mehreren aufeinander bezogenen Einzelverzeichnissen zusammen. Dazu später mehr. Das HWB berücksichtigt keine Polysemien. Auch die Problematik der theoretischen und praktischen Abgrenzung von Homonymie und Polysemie wird nicht angegangen. Diese wird als Domäne der Allgemein-Wörterbücher angesehen. Zur Abgrenzung Homonymie-Polysemie siehe die Diskussion in Wichter (1988) und Zöfgen (1989). Das Homographen-Wörterbuch konzentriert sich auf Mehrdeutigkeiten, bei denen inhaltliche Unterschiede mit Unterschieden auf anderen Beschreibungsebenen einhergehen. Bevorzugt werden dabei relativ unstrittige formalgrammatische Angaben, deren Kenntnis bei den meisten Wörterbuch-Benutzern vorausgesetzt werden kann. Dazu gehören Homographien A) mit Unterschieden im Wortlaut der Grundformen, lauter: <laut> (Adjektiv) / <lauter> (Adjektiv) B) mit Unterschieden in der Wortklasse billige. Adjektiv / Verb C) mit Unterschieden in der Flexion. Band. Substantiv maskulinum / Substantiv neutrum D) mit Unterschieden in der Wortstruktur Gründung, grün (A) - Dung (S) / gründ (V) ung, <?page no="198"?> 198 Heinz J. Weber E) mit Unterschieden in der Lautstruktur (Heterophone): durchfahren. 'durchfahren / durchfahren 3. Zum Aufbau des Homographen-Wörterbuchs Das HWB setzt sich aus mehreren aufeinander bezogenen Verzeichnissen zusammen (siehe Abb. 1): einem Wortformen-Index, einem Grundformen-Index, einem Verzeichnis der Homographen-Klassen - und mehreren Hilfsverzeichnissen. Die Bestimmung einer Homographie kann auf diese Weise abgestimmt auf den Informationsbedarf schrittweise vorgenommen werden. Außerdem ergeben sich je nach Fragestellung unterschiedliche Möglichkeiten des Einstiegs in das Wörterbuch (siehe Abschnitt 6). Wortformen- und Grundformen- Index dienen zur ersten Orientierung; über Adressen wird auf das Verzeichnis der Homographen-Klassen verwiesen. Hier findet sich eine Spezifikation der betreffenden Homographie, die durch weiteres Nachschlagen in den Hilfsverzeichnissen präzisiert werden kann. Die Hilfsverzeichnisse umfassen u.a. die Konjugations- und Deklinationsmuster für flektierte Formen, Auflistungen lexikalischer Doubletten und der Heterophone (siehe Abschnitt 5). Abb. 1: Verbund der hwb-Verzeichnisse <?page no="199"?> Das ‘Homographen-Wörterbuch der deutschen Sprache' als Hypertext 199 4. Die Einzelwörterbücher des HWB 4.1 Der Wortformen-Index Dieses Verzeichnis umfaßt die mehr als vierzehntausend Wortformen des Homographen-Wörterbuchs (von aal bis Zypressen) in alphabetischer Sortierung. Es gibt in der linken, kursiv gedruckten Spalte Aufschluß darüber, ob eine bestimmte Wortform als Homograph beschrieben ist und welchen Grundformen sie zugeordnet werden kann (mittlere Spalte). In der rechten Spalte ist eine Adresse angegeben, unter der sich im Verzeichnis der Homographen- Klassen eine detaillierte Beschreibung findet. Zur Schreibung im HWB: Homographe und Grundformen werden durchgängig klein geschrieben, ‘ß’ wird als ‘ss’, Umlaut wird als -e- (ae, oe, ue) dargestellt ungeachtet der möglichen Schreibung im Text. Grundformen erhalten als Zusatz eine Wortklassen-Angabe in runden Klammern: biss (Sm); biss (V); bissen (Sm). Für den Wortformen-Index gelten u.a. folgende Sonderzeichen: <H> zeigt Heterophonie an, Ziffern in spitzen Klammem geben die Zahl der Lesarten einer Wortform an (Abb. 2). ... <Yi>anstelle anstell (V)/ anstelle (PRP) II, 4.15 al) NS hacke, <3> hacken: hacken: hacken, hackens: Abb. 2: Wortformen-Index hack (Vyhacke (Sf) hacke (Sf)/ hacken (Sm) hack (Vyhacken (Sm) (Ausschnitt) n, 4.11.1 al) II, 10.1.1 al) H, 12.10.1 al) 4.2 Der Grundformen-Index Dieser Index in alphabetischer Sortierung zeigt, an welchen Homographien eine Grundform beteiligt ist. Zu jeder Grundform ist die Wortklasse angegeben, gelegentlich in Verbindung mit einer Bedeutungsumschreibung (Beispiel: abfall (Sm) «Häresie»), Die Adresse in der jeweils rechten Spalte verweist auf das Verzeichnis der Homographen-Klassen. ... hack (V) II, 4.11.1 al) II, 12.10.1 al) hacke (Sf) II, 4.11.1 al) II, 10.1.1 al) hacken (Sm) II, 10.1.1 al) II, 12.10.1 al)... Abb. 3: Grundformen-Index (Ausschnitt) <?page no="200"?> 200 Heinz J. Weber 4.3 Die Homographen-Klassen Die Markierung im Verzeichnis der Homographen-Klassen setzt sich aus mehreren Komponenten zusammen: An erster Stelle steht die Unterscheidung von Konstituenten-Homographie (Typ I: Schriftlich übereinstimmende Grundformen und Flexive) und Konstruktions-Homographie (Typen II und III: Schriftlich differierende Grundformen und Flexive). An nächster Stelle kommt die Angabe der GD-Klasse. Die einzelnen GD-Klassen werden entsprechend der Wortklassen und Flexionsbereiche der gegenübergestellten Grundformen in Subklassen untergliedert. Die entsprechenden Subklassen werden weiter unterteilt nach den Flexiven, die für die einzelnen Wortformen einer Homographen-Reihe zutreffen. Die Subklassen-Einteilung wird durch Kleinbuchstaben angezeigt, die durch Ziffern ergänzt sind (in al, a2, ... bl, b2, ...etc ), je nachdem, welche Flexions-Muster den Wortformen der betreffenden Homographen-Reihe zugewiesen sind. Als Beispiel in Abb. 4 dient die Klassen- Angabe II, 6.2.1 al) für die Homographen-Reihe {wuerde, wuerden). Im Wortformen- und Grundformen-Index werden die Klassen-Angaben als Adressen benutzt, über die eine Verbindung zum Klassen-Verzeichnis hergestellt werden kann; dazu mehr in Abschnitt 6 und Abb. 7. {wuerde, wuerden}: wurd (V) / wuerde (Sf) II, Homographie-Typ: Konstruktions-Homographie—^ GD-Klasse: 6. GDI = -e-e Wortklassen der Grundformen: Verb/ Substantiv- Grundform-Varianten: Verb (c) Flexive: -e-e, -e-en / #, n Flexions-Muster: V: 43, 46 / S: 2, 5 6.2.1 al) Abb. 4: Homographen-Klassen (Gruppen-Spezifizierung) Da die Homographen-Klassifikation stets für Grundformen-Paare gilt, ist die Klassen-Einteilung unbegrenzt erweiterbar: So ergibt bzw. ergeben sich für eine mehrdeutige Wortform bei zwei Lesarten ein Vergleichspaar, bei drei Lesarten drei (1+2) Vergleichspaare, bei vier Lesarten sechs (1+2 + 3) Vergleichspaare etc. Für eine paarweise Gegenüberstellung von Grundformen spricht zudem, daß erst dadurch eine genaue Feststellung von Heterophonie möglich wird. <?page no="201"?> Das 'Homographen-Wörterbuch der deutschen Sprache ’ als Hypertext 201 4.3.1 Der Aufbau der Einträge im Homographen-Klassen-Verzeichnis Es ist zu unterscheiden zwischen einer Gruppen- und einer Einzel-Spezifizierung. Dabei bezieht sich die Gruppen-Spezifizierung auf alle Grundform- Kombinationen der betreffenden Gruppierung; die Einzel-Spezifizierung betrifft jeweils eine Grundform oder die ihr zugeordneten Flexionsformen. Die Gruppen-Spezifizierung umfaßt die Klassen-Angaben (z.B. II, 6.2.1 al), die Menge der Flexive für die betreffende Homographen-Reihe, eine exemplarische Homographen-Reihe, die aus einem Grundformenpaar dieser Subklasse und den zugehörigen Flexiven gebildet ist; das betreffende Grundformen-Paar, die Flexions-Muster für die betreffende Homographen-Reihe in der festgelegten Kodierung (siehe Abschnitt 5.2). Abb. 5 läßt erkennen, daß Flexive und Flexions-Muster aus der Gruppen-Spezifizierung für eine algorithmische Flexionsformen-Erzeugung auch der übrigen Grundformen-Paare benutzt werden können; dazu auch Abb. 14. Die Einzel-Spezifizierung setzt sich zusammen aus einem obligatorischen und einem fakultativen Teil. Der obligatorische Teil besteht aus Grundform und Grundform-Wortklasse in runden Klammem: wuerde (Sf). Fakultativ sind: morphosyntaktische und lexikalische Zusatzinformationen; lexikalische Zitierform: <'Rose'>, <'Rose'>; - Bedeutungsumschreibungen: «Wein», «Blume»; - Hinweise in spitzen Klammern, z.B. auf Heterophonie: <H>: - Aussprachehilfen in eckigen Klammern bei Heterophonie. Diese Behelfsnotierung dient nur zur Verdeutlichung von Ausspracheunterschieden: [ro'se: ] vs. ['ro: se]. 6.2.1 Verb (c) / Substantiv a) -e-e, -e-en / #, n al) {wuerde, wuerden) wurd (V) / wuerde (Sf) 43, 46 / 2, 5 gor (V) / goere (Sf, DF) <‘gären’> / <‘Göre’> «sich zersetzen» / Klassermummer Flexive der Homographen-Reihe exemplarische Homographen-Reihe deren Grundformen mit Wortklassen Kodes für die Flexions-Muster Einzelspezifizierungen in alphabetischer Abfolge: weiteres Grundformen-Paar Zitierformen Bedeutungsumschreibung Abb. 5: Gmppen-und Einzelspezifizierung <?page no="202"?> 202 Heinz J. Weber Das HWB umfaßt 55 Klassen mit 305 Subklassen, die zur besseren Orientierung in einer Überblicksdarstellung zusammengefaßt und dem Verzeichnis vorangestellt sind. 5. Die Hilfsverzeichnisse Die Hilfsverzeichnisse bieten einmal die Zusammenfiihrung lexikalischer Doppelformen und die Aufschlüsselung des im Klassen-Verzeichnis verwendeten Flexions-Kodes an, zum anderen eröffnen sie über Spezialverzeichnisse einen gezielten Einstieg in das HWB (siehe dazu Abschnitt 6). 5.1 Doppelformen Doppelformen, die vereinzelt an Homographien beteiligt sind, werden hier zusammengestellt. Auf Unterschiede in Wort- und Flexionsklasse, Schreibung und Aussprache wird hingewiesen: barock (Sn) bogen (Sm) karo (Sn) makrozephal (A) ... barock (Sm) bogen (Sm) caro (Sn) makrokephal (A) 5.2 Flexions-Muster Die Aufstellung umfaßt 122 Flexions-Muster: 51 Muster für Flexionsformen der Klassen Substantiv (ggf. auch für Vornamen), 20 für Adjektiv, 51 für Verb (Abb. 6): Nr.: Substantive: Merkmale: 1 Nr. 1 Nr. illustrierte Adjektive: schöne, gesuchte Verben: I sg Pl Merkmale: att pos nom nom f m n Merkmale: akk sg Pl sg Pl Sg pl bin fin prs ind ich nom akk nom akk nom nom akk nom akk nom akk Abb. 6: Flexions-Muster <?page no="203"?> Das ‘Homographen-Wörterbuch der deutschen Sprache' als Hypertext 203 5.3 Heterophone im HWB Diese Aufstellung fuhrt die heterophonen Homographen-Reihen des HWB gesondert auf dargestellt als Grundformen-Paarungen in Verbindung mit der Adresse im Verzeichnis der Homographen-Klassen: ... anstell(V)/ anstelle(PRP) II,4.15al)NS arsen (Sn)/ arsen (Sf) I, 1.1.2 a4)... 5.4 Homographien mit mehr als zwei Lesarten Homographe Wortformen weisen meist zwei Lesarten auf. Fälle mit mehr als zwei Lesarten sind in dieser Aufstellung aufgefiihrt: 3 Lesarten: ... breit, breiten, brettern, buchen... 4 Lesarten: ... breite, dicke, duenne, eichen... 5 Lesarten: ... alben, backen, bar, fest ... 6 Lesarten: los, recht, schoss, wehe 6. Wie wird das Homographen-Wörterbuch benutzt? Statt des in Allgemein-Wörterbüchem privilegierten Zugriffs über eine alphabetisch-linearisierte Anordnung der Einträge, d h. ihrer Stichwörter, bietet das HWB mehrere Zugriffsoptionen auf unterschiedliche Informationstypen an. Wortform, Grundform, Homographen-Klasse, Heterophonie, Lesarten-Zahl etc. Hier einige Probleme, bei deren Lösung das HWB helfen soll. Für jeden Lösungsweg sind die einzelnen Stationen angegeben. Dabei ist die jeweils erste Station ausreichend zur Orientierung. Zur weiteren Spezifizierung können die nachfolgenden Stationen angesteuert werden: - Ist eine bestimmte Wortform homograph und in welcher Weise? Suchpfad: Wortformen-Index -» Homographen-Klassen-Verzeichnis —» Flexions-Muster (-» Allgemein-Wörterbuch); vgl. Abb. 7. <?page no="204"?> 204 Heinz J. Weber Such-Wortform Abb. 7: Stationen zur Identifikation einer Wortform als Homograph Weitere Probleme, zu deren Lösung das HWB beitragen kann: - An welchen Homographien ist eine bestimmte Grundform beteiligt? Suchpfad: Grundformen-Index -» Homographen-Klassen-Verzeichnis -» Flexions-Muster (—» Allgemein-Wörterbuch) - Welche homographen Wortformen werden je nach Lesart unterschiedlich ausgesprochen! Suchpfad: Hilfsverzeichnis Heterophone —> Homographen-Klassen-Verzeichnis (-» Aussprache-Wörterbuch) - Welche Homographien weisen mehr als zwei Lesarten auf? Suchpfad: Hilfsverzeichnis Lesarten —> Wortformen-Index -» Homographen-Klassen-Verzeichnis (-» Allgemein-Wörterbuch) Das Angebot mehrfacher systematischer Einstiegsmöglichkeiten in das Wörterbuch hat allerdings auch seinen Preis: Das HWB weist einige Redundanzen <?page no="205"?> Das ‘Homographen-Wörterbuch der deutschen Sprache' als Hypertext 205 auf. So kommen z.B. alle an Homographien beteiligten Grundformen außer im Grundformen-Index noch im Wortformen-Index und im Klassen-Verzeichnis vor. Die Verteilung von Informationen auf mehrere Verzeichnisse ist bei einigen Lösungswegen zudem mit einigem manuellen Aufwand verbunden. Kompromisse dieser Art bei einem gedruckten Wörterbuch vertretbar sind nicht erforderlich, wenn Wörterverzeichnisse als Hypertext-Systeme angelegt werden, die eine nichtlineare Organisationsform und mehrfache Verbindungen zwischen den Einzelelementen zulassen. Bei einer Bildschirm-Fassung des HWB ließe sich allein mit Mausklicks ein Weg durch die einzelnen Verzeichnisse bahnen ohne umständliches Blättern und ohne sich eine kryptische Adressierung (z.B. II, 1.1.1 al) sowie den Ausgangspunkt der Suche merken zu müssen. Im folgenden sollen einige Aspekte einer Konversion des Homographen-Wörterbuchs in eine Bildschirm-Fassung behandelt werden. 7. Wörterbücher als Hypertexte Die Frage, an welchem Ort z.B. ‘Akazie’, ‘Alant’, ‘Amaryllis’ und ‘Ananas’ nahe beieinander stehen, ließe sich einigermaßen zutreffend mit: „... im Botanischen Garten“ beantworten; kommen aber noch ‘Akademiker’, ‘Alabaster’, ‘Amateursportler’ und ‘Analogrechner’ hinzu, bietet sich eine plausiblere Schlußfolgerung an: Der fragliche Ort könnte „ein alphabetisch sortiertes Wörterbuch“ sein. Nur hier gibt es Nachbarschaften, die im normalen Leben und in üblichen Texten nicht bestehen. Daß Wörterbücher keine Texte im üblichen Sinne sind, zeigt sich in mehrfacher Hinsicht. Sie sind entlinearisiert in der Weise, daß sie von unterschiedlichen Stellen her ‘betreten’ und punktuell gelesen werden können. Es gibt in diesen Gebilden keine Stelle, die prominenter oder wichtiger fürs Verständnis wäre als andere, was dagegen bei vielen Texten der Fall ist. Wörterbücher sind Ansammlungen von weitgehend gleichartigen Elementen, den Wort-Einträgen, die ihr Vorkommen in einem Wörterbuch allein der Tatsache verdanken, daß sie als Elemente einer bestimmten Menge (z.B. dem ‘Wortschatz der deutschen Sprache’) beschrieben wurden. Nachbarschaft zu anderen Einträgen wird durch ein konventionalisiertes Ordnungsprinzip bewirkt, das zwar jedem, der das (lateinische) Alphabet kennt und mit dem spezifischen Zeicheninventar der betreffenden Sprache/ Schrift vertraut ist, eine systematische Suche ermöglicht, von dem jedoch kein kohärenzstiftender Sinn ausgeht, wie wir ihn in üblichen Texten erwarten. Um dieses starre und lexikologisch inadäquate Anordnungsprinzip (siehe Wiegand 1989) zu umgehen oder zumindest abzumildem, hat die Lexikographie verschiedene Verweissysteme entwickelt: <?page no="206"?> 206 Heinz J. Weber - Verweise auf externe Regelwerke (z.B. Wortbildung, Flexion oder Orthographie), - Verweise auf lexikalische Doubletten, - Verweise auf synonyme Ausdrücke - oder Hinweise auf gleichgeschriebene Stichwörter: Homonyme sind durchnumeriert ... Den Verweisen zu folgen, erfordert in vielen Fällen jedoch manuelles Geschick und ein gutes Gedächtnis. Zwar wäre dann ein schmales Wörterbuch günstig, das handlich ist und dessen Verweise nicht zu weitgespannt sind. Diesem Wunsch nach Bedienungskomfort steht jedoch der Anspruch auf ein umfangreiches Vokabular und eine gehaltvolle Beschreibung entgegen. Als Kompromiß zwischen Effizienz, Bedienungskomfort und Vokabularumfang kann die Spezialisierung und Verteilung der lexikalischen Beschreibung auf unterschiedliche Wörterbuch-Typen angesehen werden. Diese Spezial-Wörterbücher für Rechtschreibung, Aussprache, Etymologie, Synonyme, Wortfamilien, Morpheme oder Neologismen (auch das Homographen-Wörterbuch ist hierzu zu rechnen) sind in der Regel inhaltlich homogener, weniger umfangreich und leichter zu handhaben. Die Re-Integration dieser Spezial- Wörterbücher mit ihren unterschiedlichen Wortschätzen und eigenen Organisationsformen in ein zusammenhängendes Universal-Wörterbuch ist erst mit der Verwendung des Computers als Werkzeug der Lexikographie und als Präsentationsplattform für das Wörterbuch realisierbar geworden. Ein solches Groß-Projekt ist das Oxford English Dictionary (vgl. Freisler 1994, S. 19-20), ein etabliertes Allgemein-Wörterbuch, das schon seit einiger Zeit auch als elektronische Publikation angeboten wird. Diese Entwicklung wurde durch mehrere Faktoren begünstigt. Maschinenzugängliche Wörterbücher werden schon seit längerem als Komponenten sprachverarbeitender Systeme eingesetzt in Form von Dateien oder als Datenbanken. Sie sind computergerecht durchstrukturiert, jeder Eintrag ist standardisiert aufgebaut und setzt sich aus wohlunterschiedenen Komponenten zusammen, die wiederum zu Komponenten anderer Einträge in Beziehung stehen können gute Voraussetzungen für die Bearbeitung vor allem im Rahmen von Datenbank-Technologie. Lexikalische Datenbanken sind effizienter als gedruckte Wörterbücher, da sie gerade deren charakteristische Nachteile den manuellen und mnemotechnischen Bedienungsaufwand nicht aufweisen. Auch die einmal getroffene Festlegung des Vokabularumfangs gilt für Datenbanken nicht: Neuaufnahme von Wörterbuch-Einträgen ist unproblematisch. Bedingt durch die Automatisierung in der Satz- und Druckindustrie steht dazu reichhaltiges lexikalisches Material in maschinenzugänglicher Formatierung <?page no="207"?> Das ‘Homographen-Wörterbuch der deutschen Sprache ’ als Hypertext 207 bereit. Die Datenbank-Technologie, eine Grundlage der elektronischen Wörterbücher, blieb aber weitgehend wissenschaftlichen Anwendungen Vorbehalten. Datenbanken sind zu gedruckten Allgemein-Wörterbüchern kaum in Konkurrenz getreten. Schon allein das Erlernen einer formalen Abfragesprache ist für Durchschnittsbenutzer eine beachtliche Hürde. Zum Durchbruch in der Benutzung elektronischer Allgemein-Wörterbücher haben jedoch graphische Bedienungsoberflächen und die Hypertext-Technologie verhelfen. Heute werden elektronische Wörterbücher bevorzugt als Hypertext-Systeme angelegt und oft als Parallel-Versionen zu ihren gedruckten Pendants angeboten. Für Hypertexte stellt Freisler (1994, S. 24-34) folgende Kriterien zusammen, die sie von Texten unterscheiden: Entlinearisierung, Synästhesierung, Operationalisierung, Interaktivität - Kriterien, die auch auf einige Bildschirm-Wörterbücher zutreffen. - Entlinearisierung: Das Wörterbuch ist organisiert als Netzwerk statt als Ansammlung von Listen; - Synästhesierung (Multimedialität): Schrift, Bild, Ton und Bilder-Animation sind kombinierbar; - Operationalisierung: Integration sprachverarbeitender Systeme zur Analyse oder Generierung; - Interaktivität ist z.B. durch Einbeziehung des Benutzers bei Revision und Wörterbuch-Erweiterung möglich: dadurch Rollentausch vom Wörterbuch- Benutzer zum -Autor. Hypertext-Systeme sollen größeren Bedienungs-Komfort, erweiterte Arbeitsmöglichkeiten und ‘infomationelle Mehrwerte’ (Kuhlen 1991, Vorwort) bieten. Demonstriert wird dies bereits in einigen CD-ROM-Wörterbüchern (dazu Neth/ Müller 1997), die sich aus gängigen Textverarbeitungssystemen heraus ansprechen lassen, um z.B. eine Text-Wortform zu paraphrasieren oder in eine andere Sprache zu übersetzen. Auch die Wörterbuch-Suche kann feiner abgestimmt werden, wenn z.B. über wild cards ähnlich geschriebene Stichwörter (Paronyme) ermittelt werden nicht nur für Liebhaber von Reimen oder Kreuzworträtseln interessant. Angeboten wird auch der Anschluß an Sound- Komponenten, über die sich Einträge und Wortformen ‘vertonen’ lassen. Vor einem solchen Hintergrund erscheint auch eine Homographie-Prüfüng in Verbindung mit Rechtschreibprüfung, Trennhilfe, Synonymendienst oder Übersetzung sinnvoll. Die nachfolgenden Abschnitte werden sich mit der Anlage des Homographen- Wörterbuchs als Hypertext-System bzw. als Bestandteil von umfassenderen Sprachverarbeitungssystemen befassen. Da sich die Arbeit noch im Konzeptionsstadium befindet, lassen sich zu vielen Punkten keine Festlegungen treffen. <?page no="208"?> 208 Heinz J. Weber Es werden mögliche Benutzungssituationen umrissen, ein Entwicklungswerkzeug wird vorgestellt, Konvertierungsprobleme, insbesondere die Aufteilung in informationeile Einheiten und mögliche hypertextuelle Verbindungen werden besprochen. 8. Das HWB als Hypertext-System: Benutzungsmöglichkeiten In Abschnitt 1 wurden zwei Möglichkeiten ins Auge gefaßt, das Homographen-Wörterbuch als computerlinguistisches Werkzeug und als Wörterbuchhilfe für Durchschnittsbenutzer. In beiden Fällen läßt sich keine scharfe Trennung der Benutzungsmöglichkeiten durchfuhren. Homographie kann als Begleiterscheinung auftreten, deren Lösung verdeckt vorgenommen wird; Homographie kann im Hinblick auf andere Fragen eine tragende Rolle spielen; sie kann auch im Mittelpunkt einer Anwendung stehen. 8.1 Verdeckte Behandlung von Homographie Im Rahmen eines umfassenden Wortformen-Identifikationssystems diese Feststellung gilt sowohl für computerlinguistische als auch für alltägliche Anwendungszusammenhänge ließe sich eine Lösung des Problems der Wortformen-Mehrdeutigkeiten ohne expliziten Aufruf eines Homographie-Spezialverzeichnisses erreichen. Homographie-Diagnose und ggf. Disambiguierung könnten in den Gesamtprozeß der Identifikation integriert werden und verdeckt ablaufen. Bei Homographen würde es sich um einen impliziten Bestandteil des Vokabulars eines Allgemein-Wörterbuchs handeln, der sich mit geeigneten Operationen und den entsprechenden morphosyntaktischen Hilfssystemen wie Flexions- und Wortbildungsgrammatiken - und in Abhängigkeit von der Beschreibungssprache des Wörterbuchsystems und von dessen aktuellem Umfang aufbauen ließe (dazu Weber 1974, S. 237). Die Anlage vorfabrizierter Homographen-Ferze/ c/ ww.sse erübrigte sich damit. Verfügte das betreffende Wörterbuchsystem über eine lexikalische Aquisitionskomponente, könnte ein Algorithmus zur Generierung von Homographen zum Einsatz kommen (dazu Weber 1974, S. 125-138 und 1996, S. 26-28). 8.2 HWB-Verzeichnisse als integrierte Daten-Kollektionen Als Daten-Kollektion wäre das HWB relevant in Sprachverarbeitungszusammenhängen, die keine aufwendigen Verfahren zur Identifikation von Wortformen anwenden, da entweder die Werkzeuge nicht zur Verfügung stehen oder das Schwergewicht der Verarbeitung auf anderen Aspekten liegt. Auch diese Feststellung gilt für computerlinguistische Anwendungen und für alltägliche <?page no="209"?> Das ‘Homographen-Wörterbuch der deutschen Sprache' als Hypertext 209 Benutzung. Eine solche Situation wurde in Abschnitt 6, Abb. 7 durchgespielt: die Identifikation und Auflösung einer Homographie mithilfe der HWB- Verzeichnisse und in Verbindung mit einem Allgemein-Wörterbuch aber ohne entsprechende Grammatik und Parser im Hintergrund. Auch bei einer Grob-Lemmatisierung im Rahmen von automatischer Spracherkennung oder Information Retrieval, die mit einfachen Stemming- oder Trunkierungsverfahren bewerkstelligt oder aufgrund stochastischer Verfahren vorgenommen wird, wäre der Bestand der Homographen-Verzeichnisse von Interesse, in erster Linie zur Verwechslungsprophylaxe. Die Verzeichnisse hätten hier einen Status wie Stoppwort- oder Ausnahmelisten. Außer der Tatsache, daß es sich um Homographen handelt, wären keine weiteren Informationen von Belang. In anderen computerlinguistischen Anwendungszusammenhängen wären u.U. weitergehende Informationen wichtig, so z.B. in quantitativen Untersuchungen, in denen auch Informationen zur Wortlänge, zur phonologischen und morphologischen Struktur oder zur Wortklasse eine Rolle spielen können. Auch dazu liefert das HWB viele Fakten (vgl. Weber 1996, Kapitel 5). In all diesen Fällen hängt die Gestaltung der Homographen-Verzeichnisse von ihrer Einbindung in den Hypertext-Zusammenhang des jeweiligen Gesamt-Systems ab, so daß sich von hier aus nur wenig über die Aufteilung in informationeile Einheiten und die Verbindungen zwischen ihnen sagen läßt. Wenden wir uns deshalb der dritten Spielart zu, in der das Homographen-Wörterbuch als ein eigenständiges System angelegt ist. 8.3 Das Homographen-Wörterbuch als selbständiges System Mit dieser vagen Bezeichnung lassen sich keine scharf konturierten Benutzungssituationen umreißen. Ausschlaggebend soll sein, daß das HWB als eigenständiges Hypertext-System angelegt ist, wobei das ‘Interesse an Homographie’ im Mittelpunkt stehen soll. Es dürfte sich dabei eher um sprachwissenschaftliche Untersuchungen als um alltägliche Anwendungen handeln. <?page no="210"?> 210 Heinz J. Weber 9. Das Entwicklungs-Werkzeug: Multimedia-ToolBook Multimedia-ToolBook (Asymetrix) ist ein Autorensystem (unter MS-Windows), das auf der ‘Buch’-Metapher aufgebaut ist und sich auch in dieser Hinsicht zur Konversion eines Buchs in ein ‘Hyperbuch’ anbietet. Eine Tool- Book-DalSi, als ‘Buch’ aufgefaßt, ist in ‘Seiten’ aufgeteilt, die in ‘Fenstern’ angezeigt werden. Dabei kann eine ‘Seite’ verschiedene ‘Objekte’ enthalten (wie Textfelder, Schaltflächen, Graphiken). Jedes Objekt hat eine Menge von Eigenschaften, die Erscheinungsbild und Verhalten festlegen. In ToolBook steht die prozedurale (ereigniszentrierte) Programmiersprache OpenScript zur Verfügung, die es ermöglicht, über ‘Scripts’ Tbo/ ßooyt-Objekten ein bestimmtes Verhalten zuzuschreiben. Über Verbindungen zu ‘Scripts’ lassen sich Botschaften an Objekte weitergeben. Dabei spielt die Objekt-Hierarchie eine wichtige Rolle; sie ist in ToolBook festgelegt: Objekt -> Gruppe Seite -> Hintergrund ^ Buch. Sehr wichtig ist die Möglichkeit der Anbindung einer Datenbank (z.B. Paradoxfür Windows). 10. Zur Konvertierung des HWB 10.1 Voraussetzungen Bei der Anlage des Homographen-Wörterbuchs wurde die Konversion in eine Bildschirm-Fassung mitbedacht. Die Aufteilung der Informationen in mehrere aufeinander bezogene Index-, Klassen- und Spezialverzeichnisse, die unterschiedliche Einstiegsmöglichkeiten und variierende Suchpfade offeriert (vgl. Abschnitt 6), kann in ein Hypertext-System übertragen werden. Gleiches gilt für die orientierenden Überblicksdarstellungen (z.B. für die Homographen- Klassen) und verschiedene Paratexte (Inhalts- und Abkürzungsverzeichnis, Erläuterungen). In Teilen kann eine Konvertierung automatisch vorgenommen werden, da die lexikalischen Daten maschinenzugänglich kodiert sind. Für den HWB-Textteil kommt nur eine manuell-intellektuell durchgeführte Übertragung in Frage, die sich einesteils an die vorliegende Einteilung halten kann, in anderen Partien verschiedene Überarbeitungen verlangt. So ließen sich einige Themen, die mehrfach angesprochen werden, in einer Informationseinheit zusammenfassend darstellen, wie die Klassifizierung der Homographen, die im Buch im 1. Teil und im Verzeichnis der Homographen-Klassen behandelt wird. Kuhlen (1991, S. 163-164) unterscheidet in diesem Zusammenhang zwischen einer Segmentierung und Relationierung nach formalen Texteigenschaften und einer nach Kohärenzkriterien. Für das HWB dürfte sich in dieser Hinsicht eine Kombinationen beider Vorgehensweisen empfehlen. Im derzeitigen Stand der Überlegungen stehen folgende Fragen im Vordergrund: <?page no="211"?> Das ‘Homographen-Wörterbuch der deutschen Sprache ' als Hypertext 211 - Welche Informations-Einheiten der gedruckten Fassung können in die Bildschirm-Fassung übertragen werden? - Welche Verbindungen zwischen im Buch getrennt stehenden Einheiten bringen in der Simultan-Präsentation eine Verbesserung in der Arbeit mit dem HWB? - Welche Operationen müssen für eine Hypertext-Version erstellt werden? 10.2 Informationseinheiten und Hypertext-Verbindungen, Zusammenwirken der Einzelverzeichnisse, Prozeduren Einige Verbindungen zwischen informationeilen Einheiten werden exemplarisch vorgefuhrt. Die Herkunft der verbundenen Einheiten aus den Verzeichnissen des Homographen-Wörterbuchs wird jeweils am Rand der Abbildungen angezeigt (Wortformen-Index, Klassen-Verzeichnis etc.). Außer acht gelassen obwohl nicht unwichtig sind Fragen der Farbgebung, der Schriftgrößen, der Fensterumrandung und -anordnung. Einige Prozeduren, die für eine Bildschirm-Fassung erstellt werden müßten, werden angeführt: die alphabetische Suche in den verschiedenen Verzeichnissen (Abb. 8 und 13), die Ermittlung von Lesarten aus Grundformen-Paaren (Abb. 8), die maschinelle Sprachausgabe bei Heterophonen (Abb. 9), die Generierung von Flexionsformen aus den Informationen des Klassen- Verzeichnisses (Abb. 14). Dabei wird auf Experimente in einer Arbeit von Feyen/ Lörcks (1996) zurückgegrifien. 10.2.1 Verbindungen zum Wortformen-Index Die alphabetische Suche im Wortformen-Index führt zum entsprechenden Stichwort; Anklicken der Lesarten-Nummer ergibt eine Einblendung der einzelnen Lesarten (maximal sechs) für die betreffende Wortform. Die Lesarten werden aus den Grundformen-Paaren ermittelt. <?page no="212"?> 212 Heinz J. Weber Abb. 8: Suche im Wortformen-Index und Lesarten-Ermittlung Anklicken der Heterophonie-Marke im Wortformen-Index ergibt eine Einblendung der Aussprachehilfe aus dem Klassen-Verzeichnis oder eine Sprachausgabe für beide Lesarten über Lautsprecher (Abb. 9). Wortformen-Index - <H> buchs: buch (Sn)/ buchs (Sm) buchse: buchs (Sm)/ buchse (Sf) Einblendung: Aussprache buchs: 1. buch (Sn): [bu: chs] 2. buchs (Sm): [buks] und/ oder: Sprachausgabe Klassen-Verzeichnis Sound-Komponente Abb. 9: Heterophon-Bestimmung im Wortformen-Index Anklicken eines Grundformen-Paares im Wortformen-Index erzeugt eine Einblendung des entsprechenden Ausschnitts aus dem Klassen-Verzeichnis (Abb. 10). Möglich ist auch ein Sprung auf die betreffende Seite des Klassen-Verzeichnisses. Die Verbindung wird über die Klassen-Adresse des HWB hergestellt, die in der Bildschirm-Fassung natürlich nicht sichtbar sein muß. <?page no="213"?> Das ‘Homographen-Wörterbuch der deutschen Sprache ' als Hypertext 213 Worte.-Index Klassen-Verz. Abb. 10: Klassen-Einblendung in Wortformen-Index <H> buchs: buchse: rbuch (Sn)/ buchs (Sm) buchs (Sm)/ buchse (Sf) 31. GDI - -s 31.1 Substantiv a) s a7) (knies) knie (Sn) 33 / Substantiv / # / knies (Sm) / 12 <H> buch (Sn) / buchs (Sm) 10.2.2 Verbindungen zum Grundformen-Index Abb. 11 zeigt die Einblendung von Doppelformen aus dem Hilfsverzeichnis (vgl. Abschnitt 5.1) nach Anklicken der DF-Marke im Grundformen-Index. Grundform: caro (Sn, DF) Lexikalische Doppelformen caro (Sn) karo (Sn) <Schreibvarianten> Grundformen-Index Doppeltormen-Verz. Abb. 11: Doppelformen-Einblendung in Grundformen-Index Anklicken einer Grundform im Grundformen-Index ergibt eine Einblendung der entsprechenden Stelle im Klassen-Verzeichnis für alle Lesarten der betreffenden Grundform (Abb. 12). Ebenfalls über die Klassen-Adresse kann eine Verbindung zur entsprechenden Passage des Klassen-Verzeichnisses hergestellt werden. <?page no="214"?> 214 Heinz J. Weber Grundf.-Index Klaasen-Verz. Klassen-Verz. Klassen-Verz. Abb. 12: Lesarten-Einblendung in Grundformen-Index 10.2.3 Verbindungen zum Klassen-Verzeichnis Die Suche im Klassen-Verzeichnis ließe sich wahlweise über die direkte Angabe von GD (Grundformen-Differenz) oder mithilfe der Klassen-Übersicht anstoßen (Abb. 13). Abb. 14 zeigt eine Einblendung von Flexionsinformationen in eine Bildschirm- Seite des Klassen-Verzeichnisses. Sie beruht auf der algorithmischen Flexionsformen-Bildung durch Verkettung von Grundformen und Flexiven aus dem Klassen-Verzeichnis und Zuordnung der Merkmale aus den Flexions-Mustern (vgl. Abb. 5 und Abschnitt 5.2). ToolBook offeriert weiterhin: <?page no="215"?> Das ‘Homographen-Wörterbuch der deutschen Sprache' als Hypertext 215 - Merk- und Orientierungshilfen: eine Chronik der bisher gewählten Pfade durchs System, die Zurücktaste (Sprung zur letzten benutzten Bildschirm- Seite), Lesefortschrittsbalken, Lesezeichen; durch Einblendungen können einer Bildschirm-Seite weitere Informationseinheiten direkt zugeordnet werden. - Benutzer können Anmerkungen an Seiten heften. Abb. 13: Suche im Klassen-Verzeichnis über Grundformen-Differenz oder Klassenübersicht II, 4. GDI = -e 4.1 Substantiv/ Substantiv b5) {rinde} rind (Sn) / rinde (Sf) 36 ■ buch (Sn) / 2 / buche (Sf) buche: buch (Sn) -36: neutr sg dat buche: buche (Sf) -2: fern sg nom gen dat ak Klassen-Verz. Flexions-Muster Abb. 14: Flexionsformen-Erzeugung im Klassen-Verzeichnis <?page no="216"?> 216 Heinz J. Weber Auch die Möglichkeit, sich ein Wörterbuch in ausgewählten Teilen in Dateien anzulegen und ggf. ausdrucken zu lassen, erweitert die Arbeitsmöglichkeiten mit diesem Werkzeug. 11. Literatur Asymetrix (1994): Multimedia-ToolBook. Benutzerhandbuch. München Feyen, Christine/ Lörcks, Bernd (1996): Das Elektronische Homographen-Wörterbuch ein Hypertext-System unter Multimedia-ToolBook. Unveröffentlichte Projekt-Arbeit, SS 96. Fachrichtung ldv/ cl Univ. Trier. Freisler, Stefan (1994): Hypertext - Eine Begriffsbestimmung. In: Deutsche Sprache, 22/ 1, S. 19-50. Hausmann, Franz Josef (1990): Das Wörterbuch der Homonyme, Homophone und Paronyme. In: Hausmann, Franz Josef et al. (Hg ), S. 1120-1125. Hausmann, Franz Josef/ Reichmann, Oskar/ Wiegand, Herbert Ernst/ Zgusta, Ladislav (Hg ): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie. 1. Teilbd. Berlin/ New York. Neth, Hansjörg/ Müller, Thomas (1997): Angloviel. 25 Englischwörterbücher für Windows und Mac. In: c't 1997/ 1, S. 116-138. Kuhlen, Rainer (1991): Hypertext. Ein nicht-lineares Medium zwischen Buch und Wissensbank. Berlin. Weber, Heinz Josef (1974): Mehrdeutige Wortformen im heutigen Deutsch. Studien zu ihrer grammatischen Beschreibung und lexikographischen Erfassung. Tübingen. Weber, Heinz Josef (1996): Homographen-Wörterbuch der deutschen Sprache. Berlin/ New York. Wichter, Sigurd (1988): Signifikantgleiche Zeichen. Tübingen. Wiegand, Herbert Ernst (1989): Aspekte der Makrostruktur im allgemeinen einsprachigen Wörterbuch: alphabetische Anordnungsformen und ihre Probleme. In: Hausmann, Franz Josef et al. (Hg ), S. 371-409. Zaunmüller, Wolfram (1958): Bibliographisches Handbuch der Sprachwörterbücher. Stuttgart. Zöfgen, Ekkehard (1989): Homonymie und Polysemie im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef et al. (Hg.), S. 779-787. <?page no="217"?> Elisabeth Frisch Ausgewählte Aspekte des Publizierens im WWW am Beispiel elektronischer Fachzeitschriften 0. Zusammenfassung Der vorliegende Beitrag skizziert einige der Gründe für das Entstehen elektronischer Fachzeitschriften im Internet/ WWW und stellt das Konstanzer Projekt des informationswissenschaftlichen Ejoumals „Review of Information Science“ kurz vor. Aus den Erfahrungen dieses Projektes werden einige der Probleme des Publizierens im WWW angesprochen. 1. Elektronische Fachzeitschriften als Paradigmenwechsel im etablierten System der Wissenschaftskommunikation 1 1 Motivation des Entstehens elektronischer Zeitschriften im Internet Die Etablierung elektronischer Fachzeitschriften als einer neuen Form der wissenschaftlichen Fachkommunikation markiert einen Paradigmenwechsel des bisherigen Systems wissenschaftlichen Publizierens (vgl. dazu Frisch 1996). Mit dem Erscheinen der beiden ersten als wissenschaftliche Periodika zu bezeichnenden Zeitschriften im Jahre 1665 dem „Journal des Scavants“ in Frankreich und den „Philosophical Transactions of the Royal Society“ in England bildete sich eine Form der Distribution von Forschungsergebnissen heraus, die den Charakter des Wissenschaftsbetriebs bis heute prägt: An die Stelle eines primär privat organisierten wissenschaftlichen Austauschs im Rahmen der Korrespondenz der Forscher und Gelehrten untereinander tritt nun die institutionalisierte, periodische Veröffentlichung der Ergebnisse eines Fachgebietes in einem eigens dafür geschaffenen Publikationsmedium (vgl. Bartz 1995, S. 3). Als die wichtigsten Funktionen dieser neuen Fachkommunikation nennt Schaffner den Aufbau kollektiver Wissensbasen und die Vermittlung von Informationen, aber auch die Qualitätsbewertung von Forschungsergebnissen, den Aufbau eines Systems der gegenseitigen Anerkennung wissenschaftlicher Leistungen sowie die Etablierung wissenschaftlicher Gemeinschaften (Schaffner 1994, S. 241). Die dafür entwickelten Mechanismen der Produktion, Evaluation und Distribution wissenschaftlicher Publikationen haben sich über einen langen Zeitraum als effizient und zweckmäßig erwiesen. Mit der exponentiellen Zunahme wis- <?page no="218"?> 218 Elisabeth Frisch senschaftlicher Publikationen im 20. Jahrhundert und der AusdifFerenzierung des urspünglich relativ homogenen Fachpublikums als Leserschaft einer Fachzeitschrift in immer kleinere Gruppen von Fachspezialisten scheint dieses System jedoch mittlerweile an seine Grenzen gelangt zu sein. Die Problematik des traditionellen Systems wissenschaftlichen Publizierens ist seit Beginn der 80er Jahre besonders akut spürbar und wurde unter dem Schlagwort der „Zeitschriftenkrise“ (Bennion 1994) diskutiert: Durch die hochgradige wissenschaftliche Spezialisierung entstehen immer mehr Fachzeitschriften für immer kleinere Spezialistengruppen. Diese nur in kleiner Auflage erscheinenden Fachzeitschriften verursachen hohe Kosten. Aufgrund der überproportionalen Preissteigerungen der Zeitschriftenabonnements 1 in den 80er Jahren sahen sich die Universitätsbibliotheken angesichts sinkender Etats zur Stornierung zahlreicher Subskiptionen gezwungen sinkende Abonnentenzahlen und noch geringere Auflagen führten jedoch ihrerseits zu Preissteigerungen für das einzelne Exemplar, wodurch dieses letzlich nur mehr für die Schwerpunktbibliotheken finanzierbar wird, die es auf dem Weg des gegenseitigen Leihverkehrs dann den anderen Bibliotheken zur Verfügung stellen. Diese Situation ist für den Wissenschaftsbetrieb insgesamt höchst unbefriedigend, können doch die wissenschaftlichen Bibliotheken ihrer Aufgabe der Literaturversorgung nur mehr eingeschränkt gerecht werden. Besonders prekär erscheint, daß die Wissenschaftler selbst, die im allgemeinen in einem Non-Profit-Umfeld tätig sind, und als Autoren keine finanziellen Interessen verfolgen, durch die kommerzielle Ausrichtung der intermediären Instanzen wie dem wissenschaftlichen Verlagswesen ökonomischen Zwängen unterworfen sind: „Die wissenschaftlichen Institutionen müssen ihre eigenen Forschungsergebnisse in Form von Zeitschriftenabonnements zu immer höheren Preisen zurückkaufen, zudem sind die Autoren gezwungen, durch die Übertragung des Copyrights die Kontrolle über ihr geistiges Eigentum an die Verleger abzugeben.“ (Bartz 1995, S. 6; vgl. Wilson 1996) Das heutige System der Wissenschaftskommunikation wird jedoch nicht nur durch die unter dem finanziellen Druck aufbrechenden Interessenskonflikte der unterschiedlichen Partizipanden in Frage gestellt. So erweisen sich die etablierten Mechanismen der Qualitätssicherung einer Zeitschrift, primär die Begutachtung der eingereichten Beiträge durch ein Gremium von Fachexperten, angesichts des wachsenden Aktualitätsdrucks gerade in innovativen Disziplinen häufig als dysfünktional. Die langen Zeiträume, die meist zwischen dem Einreichen eines Artikels und seiner Drucklegung liegen, verhindern auch das Zustandekommen einer fachlichen Diskussion zwischen Autoren und Lesern, 1 Als Beispiel einige Zahlen: Der gesamte Bibliotheksetat der TU Berlin ist von 8 Mio. DM im Jahre 1988 auf 6 Mio. DM im Jahre 1995 gesunken, der Etat des FB Mathematik belief sich 1978 auf 152.000 DM, 1995 auf 154.000 DM. Ein Vergleich des durchschnittlichen Jahresabonnements mathematischer Fachzeitschriften an der Universität Bielefeld ergab für 1980 den Wert von 224 DM, für 1990 hingegen 940 DM, was einer Preissteigerung von 319 % in 10 Jahren entspricht (Grötschel/ Lügger 1995). <?page no="219"?> Ausgewählte Aspekte des Publizierens im mvw 219 erreichen doch eventuelle Rückmeldungen die Autoren viel zu spät, um noch als fruchtbare Anregungen wirksam werden zu können. 2 Generell scheint das heutige System wissenschaftlicher Periodika eher für die Distribution von als gesichert beurteilten Forschungsergebnissen geeignet als für eine innovative und aktuelle Fachkommunikation. 1.2 Stand der Entwicklung von Ejournals Seit einigen Jahren bietet sich nun mit der Verbreitung des Internet und in der Folge der Ausbildung einer weltweit vernetzten universitären Gemeinschaft ein Ausweg aus diesem Dilemma des wissenschaftlichen Publizierens. Vor allem hinsichtlich des Zeitproblems und des Kostenproblems stellt sich das Publizieren via Internet als eine Lösung dar: Hier können Wissenschaftler ihre Forschungsergebnisse rasch und kostengünstig innerhalb ihrer scientific community publik machen, darüberhinaus bieten die interaktiven Potentiale des Internet die Möglichkeit einer innovativen fachlichen Diskussion. In diesem Sinne ist die Initiative zahlreicher Wissenschaftler zur Gründung elektronischer Zeitschriften als „Selbsthilfe der Wissenschaft“ zur Überwindung der skizzierten Defizite von Printpublikationen zu begreifen (Kuhlen 1995, S. 505). Folgerichtig ist die generell für das elektronische Publizieren kennzeichnende Tendenz der Disintermediation auch bei elektronischen Zeitschriften zu beobachten: Die traditionellen Funktionen von Autoren, Verlagen, Buchhandel und Bibliotheken unterliegen einer Neudefinition durch die technischen Rahmenbedingungen des elektronischen Publizierens, die es dem einzelnen ermöglichen, alle diese Aufgaben in einer Person wahrzunehmen (vgl. Bartz 1995, S. vii; zur Neudefinition der Rollen vgl. Götze 1995, de Kemp 1993, Mittler 1995, Schauder 1994, Wilson 1996, Quinn 1994). So erscheinen immer mehr Ejournals ohne die Beteiligung eines Verlages, auch die traditionelle Bibliotheksfünktion der Akquisition und Bereitstellung der Zeitschrift wird hinfällig: Das Internet begünstigt das Entstehen eines neuen „Endnutzermarktes“ des wissenschaftlichen Publizierens, der von direkten, nichtkommerziellen Formen des wissenschaftlichen Kommunizierens geprägt ist und für den in Anknüpfung an die Formen der Wissenschaftskommunikation der klassischen Antike der Begriff des „Forums“ geprägt wurde (Kuhlen 1995, S. 4). Der Erfolg des Angebots elektronischer Fachzeitschriften im Internet spricht dafür, daß sie tatsächlich eine Marktlücke im bisherigen System des wissen- 2 Laut Grötschel/ Lügger (1995) sind Zeiträume von 2-3 Jahren bis zur Drucklegung eines Artikels in der Mathematik nicht selten; die Archivierung und Aufstellung des Zeitschriftenexemplars in der Bibliothek nimmt häufig ein weiteres Jahr in Anspruch (Grötschel/ Lügger 1995). Auch bis zum Nachweis des Artikels in einem Referateorgan, wodurch er für den Leser eigentlich erst lokalisierbar wird, vergeht häufig zuviel Zeit (Grötschel/ Lügger/ Zimmermann 1995). <?page no="220"?> 220 Elisabeth Frisch schaftlichen Publizierens schließen. Innerhalb weniger Jahre haben sich rund 300 Fachzeitschriften etabliert, von denen die Hälfte die Qualitätssicherung ihrer Artikel durch Gutachtergremien von z.T. internationalem Renommee betreibt. Auch von ihrer fachlichen Ausrichtung her decken elektronische Zeitschriften mittlerweile nahezu alle Disziplinen ab. Nach der „Pionierphase“ Ende der 80er, in der listserver, mailserver und ftp-Angebote vorherrschend waren (vgl. Okerson 1991, Odlyzko 1994), scheinen sich derzeit WWW- Angebote als Standard durchzusetzen. \et5ca|ic'RlS Schuifnasib & Wo : Z The ABiirsach oi: Ftiäzy Logic RIS Vol.l, Pilot Issue, July 1996 For the representation of images, please choose one of the following options: small big, as thumbnails, as texthriks or not at all I Handling Vagueness as an Intelligent Component of I a Materials Information System Monika Schudnagis, Christa Womser-Haeker Keywords I fuzzy logic, information retrieval, graphical user interface, object-orientation Abstract In the context of an extended understanding of information retrieval within the paradigm of Information Science, the phenomenon of vagueness is discussed as a key problem of materials information system development. The WING-M2 prototype is presented which combines an object-oriented graphical user interface with natural language feedback and correction functionality as well as intelligent components for graphical result querying and fuzzy modeling of vague user needs. The dynamical combination of these tools leads to value added information effects. Contents Abb. 1: Aufbau eines Artikels der „Review of Information Science“. <?page no="221"?> Ausgewählte Aspekte des Publizierens im WWW 221 Als Anzeichen für die Konsolidierung dieses neuen elektronischen Wissenschaftsmarktes ist auch zu werten, daß sich die wissenschaftlichen Bibliotheken zunehmend für diesem Bereich verantwortlich fühlen und durch ihre Aktivitäten der Katalogisierung und Archivierung elektronischer Zeitschriften zu deren Aufwertung beitragen. Auch die Erfassung in den fachlich einschlägigen Nachweisdiensten wird vorangetrieben, wenn auch in dieser Hinsicht eine raschere Entwicklung wünschenswert wäre, ist doch die „Sichtbarkeit“ einer Publikation in den einschlägigen Abstracting- und Indexing-Diensten wesentlich für ihre Lokalisierung durch potentielle Leser. Für eine Übersicht sei auf die derzeit beste Auflistung elektronischer Zeitschriften unter der URL: http: / / www.edoc.com/ ejoumai/ sowie auf die mailinglist „newjour“ (Email an mjd@ccat.sas.upenn.edu, Inhalt: „subscribe newjour-digest“) verwiesen. 1.3 Das Beispiel der Konstanzer „Review of Information Science“ Zum Abschluß der Einführung in das Entstehen der elektronischen Zeitschriften des Internet soll noch kurz das Konstanzer Projekt der Entwicklung des informationswissenschaftlichen Ejoumals „Review of Information Science (RIS)“ vorgestellt werden. Dabei handelt es sich um eine unter der Leitung von Rainer Kuhlen von einer Projektgruppe (vgl. Haferburg/ Hahn/ Müller/ Schuffert 1996) entwickelte Fachzeitschrift, die vom Hochschulverband für Informationswissenschaft getragen und von einem Gremium namhafter Informationswissenschaftler herausgegeben wird. Die Zeitschrift erscheint vierteljährlich, die Publikationssprache ist Englisch. Die Informationswissenschaft zählt als kleine, stark spezialisierte Forschungsdisziplin mit ihrem grobmaschigen, aber weltweit geknüpften Netzwerk beteiligter Institute zu jenen Fächern, die zur Nutzung elektronischer Kommunikationsformen im allgemeinen und eines Ejoumals im besonderen geradezu prädestiniert erscheinen: Die Anforderung, die Distribution aktueller Forschungsergebnisse innerhalb einer zahlenmäßig kleinen, aber global verstreuten Fachgemeinde angesichts des hohen Aktualitätsdrucks einer innovativen Disziplin möglichst rasch zu gewährleisten, läßt sich mit dem Medium eines Ejoumals am ehesten umsetzen. Darüberhinaus favorisiert auch die interdisziplinäre Ausrichtung dieses Faches die Akzeptanz eines Ejoumals. Durch den einfachen und unmittelbaren Zugang zu Publikationen im Internet unterbleibt der in Bibliotheken vorherrschende Zwang zur eindeutigen Zuordnung einer Zeitschrift zu einem Fachgebiet mit der Konsequenz ihrer Aufstellung in der entsprechenden Fachbereichsbibliothek die für interdisziplinäre Fragestellungen bisher nötige Bereitschaft, sich auf „fremdes Territorium“ zu begeben, wird durch das integrative Angebot elektronischer Publikationen innerhalb der gewohnten Arbeitsumgebung des eigenen Rechners erleichtert. Die räumlich und organisatorisch markierten Fachgrenzen in einer Bibliothek werden in den <?page no="222"?> 222 Elisabeth Frisch virtuellen Bibliotheken des Internet durchlässig. An Beispielen wie dem „Journal of Computer-Mediated Communication (JCMC)“ (URL: shum.cc. huji.ac.il/ jcmc/ jcmc.htmi) läßt sich beobachten, daß es gelingt, einen sich über verschiedene Fachdisziplinen ausdifferenzierenden Themenbereich in diesem Medium zu fokussieren und ein Forum für eine grenzüberschreitende Fachdiskussion zu initiieren (Bartz 1995, S. 34). Aus dieser Intention erfolgte die Gründung der „Review of Information Science“, die ihrerseits in erster Linie ein Diskussionsforum mit interdisziplinären Bezügen sein soll. Daraus leiteten sich die Anforderungen an ihre Konzeption ab: Um die Seriosität der „Review of Information Science“ als Forum einer wissenschaftlichen Fachdiskussion zu gewährleisten, müssen die für gedruckte Periodika entwickelten Mechanismen der Qualitätskontrolle und des peer review genutzt werden; um die Aktualität der Diskussion zu erreichen, müssen diese Mechanismen durch ihr Automatisierungspotential im elektronischen Medium beschleunigt werden. Um möglichst allen Fachkollegen die Teilnahme an dieser Diskussion zu ermöglichen, muß der Zugang zu diesem Forum universell und ohne Restriktionen offenstehen. Aus diesem Grund wurde für die „Review of Information Science“ die Entscheidung getroffen, sich des WWW als des erfolgreichsten Internetdienstes zu bedienen und eine plattformunabhängige Realisierung zu wählen, die mit gängigen WWWbrowsern darstellbar ist, so daß die Installation zusätzlicher Software oder eines spezifischen WWW-clients nicht notwendig ist. Neben den in Fachzeit- <?page no="223"?> Ausgewählte Aspekte des Publizierens im www 223 Schriften üblichen Rubriken wie Rezensionen, Veranstaltungshinweisen, einer Zeitschriftenrundschau, Personalia und Hochschulnachrichten etc. und neben den eigentlichen Fachbeiträgen wird in der „Review of Information Science“ zu jedem Artikel ein sog. „Diskussionsforum“ angeboten, das in Form eines interaktiven WWW-Formulars realisiert wird, mit dem jeder Leser seine Anmerkungen zum jeweiligen Artikel an die Redaktion schicken kann. Diese Diskussionsbeiträge werden dann für alle anderen sichtbar im Anhang an den Artikel veröffentlicht und sollen bei der späteren Archivierung oder beim Ausdrucken als integrativer Bestandteil des Artikels behandelt werden. Abb. 2 zeigt dieses Diskussionsforum. Für genauere Information sowie eine ausführliche Vorstellung der Konzeption sei auf die Zeitschrift selbst verwiesen, die unter der URL: http: / / www.inf-wiss.uni-konstanz.de/ RIS zugänglich ist. 2. Probleme des Publizierens im WWW 2.1 Probleme der Informationsaufbereitung mit HTML Nachdem im vorigen Abschnitt die Motivation dafür erläutert wurde, die „Review of Information Science“ als Ejoumal im WWW anzubieten, soll nun auf einige der Probleme der Informationsaufbereitung im WWW eingegangen werden. Das World Wide Web (WWW) ist jener Teilbereich des Internet, der auf dem Hypertext Transfer Protocol (HTTP) beruht und in dem es möglich ist, Hypertextbzw. Hypermedia-Dokumente zu übertragen und darzustellen Die dafür vereinbarte Dokumentauszeichnungssprache HTML (Hypertext Markup Language) ist eine Dokumenttypdefinition der Standard Generalized Markup Language SGML, die sich vor allem durch ein Sprachelement zur Erzeugung von Hypertextlinks auszeichnet. Durch diese Verknüpfüngen entsteht aus den einzelnen Dokumenten ein gleichsam weltumspannender, global verteilter Hypertext, dessen durchschlagender Erfolg das WWW in den letzten Jahren zum meistfrequentierten Mehrwertdienst des Internet gemacht hat. Dieser Erfolg beruht im besonderen auch auf der allgemeinen Akzeptanz von HTML zur Dokumentauszeichnung. Das Problem der Konversion von Texten in Hypertexte stellt sich auf dieser Ebene zunächst als Problem der Konversion in HTML-Dateien dar. Um darlegen zu können, welche Konsequenzen dies für die Belange der Informationsaufbereitung hat, soll zuerst kurz auf das Verhältnis von HTML und SGML eingegangen werden. Die Standard Generalized Markup Language (SGML) ist seit 1986 als Norm zur Beschreibung von Dokumentklassen international anerkannt (ISO 8879). <?page no="224"?> 224 Elisabeth Frisch Entgegen eines weitverbreiteten Mißverständnisses ist SGML selbst jedoch keine Textbeschreibungssprache, sondern vielmehr eine Metasprache, die die Syntax zu entwickelnder konkreter Textbeschreibungssprachen festlegt. Die Grundidee von SGML zur Bewältigung der Probleme des Dokumentenmanagements liegt darin, die Beschreibung der logischen Struktur eines Dokumentes von dessen Gestaltung und dem Layout getrennt zu halten. Die logische Struktur wird dadurch beschreibbar, daß ein einzelnes Dokument als Ausprägung einer Dokumentklasse verstanden wird. Die Beschreibung einer Dokumentklasse besteht aus einer Menge von Markierungen für kennzeichnende Strukturelemente, die zusammen mit Regeln für ihre Verwendung in einer sog. Dokumenttypdefinition (DTD) festgehalten werden. In diesem Sinne kann HTML als die DTD des World Wide Web bezeichnet werden (Cailliau 1995, S. 223). Die konkrete Gestaltung des Layouts eines Dokumentes wird als Funktion seiner Struktur aufgefaßt und davon separat festgehalten. Durch seine Hard- und Software-Neutralität stellt SGML die Lösung für die gravierendsten Probleme des Dokumentenaustauschs, die sich z.B. durch die Heterogenität und Inkompatibilität der Vielzahl gängiger Texterstellungssoftware ergeben, dar. Des weiteren kann dadurch, daß das Dokument selbst unabhängig von seinem Layout existiert, die Gestaltung flexibel und mit geringem Aufwand jederzeit verändert werden. Ein weiterer wichtiger Vorteil dieses Ansatzes liegt darin, daß über die Markierungselemente {markup tags) und deren Attribute die Angabe zusätzlicher Information innerhalb des Dokumentes möglich wird, die für eine Auswertung durch entsprechende Programme zur Verfügung steht. Im Sinne dieses Ansatzes benötigt man für den Dokumentenaustausch erstens das markierte Dokument, zweitens die DTD, die die Bedeutung und die Verwendung der Markierungen festlegt, und drittens das style sheet, in dem die Präsentation und Darstellung der markierten Elemente geregelt ist. Wie Cailliau, einer der „Väter“ des WWW am CERN, dargelegt hat, funktioniert nun der Austausch von HTML-Dokumenten im WWW nicht nach diesen Regeln: „The way in which WWW uses SGML is (slightly simplified): the Web DTD is agreed beforehand by everyone (and called HTML), the presentation is left to the browser (client) so each individual can set it to his/ her liking, the document only is shipped from server to client.“ (Cailliau 1995, S. 223). Damit spricht Cailliau das aus Sicht eines Informationsanbieters derzeit größte Handicap des WWW an: die Verzögerungen bei der Entwicklung von style sheets für HTML, die zur Folge hatten, daß die Informationsaufbereitung nun durch die client- Software des Benutzers vorgenommen wird. Auf dieselbe Problematik weist Greenspun vom Massachusetts Institute of Technology (MIT) hin, wenn er in einer provokativ formulierten These HTML als den Schlechtestmöglichen Kompromiß zwischen den Anforderungen des Dokumentenaustauschs im WWW und der Philosophie von SGML darstellt: <?page no="225"?> Ausgewählte Aspekte des Publizierens im mvw 225 „html represents the worst of two worlds. We could have taken a formatting language and added hypertext anchors so that users had beautifully designed documents on their desktops. We could have developed a powerful document structure language so that browsers could automatically do intelligent things with Web documents. What we have got with HTML is ugly documents without formatting or structural information.“ (Greenspun 1995) RIS Review of Information Science A Peer Reviewed Electronic Journal Promoting Academic Research in Information Science ISSN 1431-5971 Managing Editor: Rainer Kuhlen (University of Konstanz) Under authority of Hochschulverband für Informationswissenschaft Abb. 3: Einstiegsseite der „Review of Information Science“ <?page no="226"?> 226 Elisabeth Frisch Das eben skizzierte Problem, daß HTML seiner Intention nach keine Formatierungssprache ist und das Layout der Dokumente wesentlich durch die Voreinstellungen des browsers bedingt wird, triffl den Anbieter einer informationswissenschaftlichen Fachzeitschrift mit besonderer Härte, zählen doch die Gestaltung von Benutzungsoberflächen und Fragen der Ergonomie der Informationsdarstellung von der Farbgestaltung bis hin zur Lesbarkeit von Schrift zu den Kernkompetenzen der Informationswissenschaft. Umso unbefriedigender ist es, die Ergebnisse der Forschung am Objekt der eigenen Fachzeitschrift nicht in die Praxis umsetzen zu können, da man als Informationsanbieter im WWW gerade auf diese Parameter keinen Einfluß hat. So läßt sich z.B. die Erkenntnis, daß serifenlose Schriften am Bildschirm eine bessere Lesbarkeit aufweisen, nicht für die Gestaltung eines WWW-Dokuments fruchtbar machen, denn HTML sieht die Spezifikation der Verwendung eines spezifischen Fonts nicht vor de facto prägen die Anbieter der Z>row5er-Software mit ihren Designentscheidungen die Standards der Präsentation der Dokumente. Zwar bietet z.B. der derzeitige Marktfuhrer Netscape dem Benutzer die Möglichkeit, eine Reihe von Einstellungen zu modifizieren und z.B. selbst die ergonomisch günstigste Schriftart auszuwählen, doch ist fraglich, ob das für diese Auswahl nötige Wissen bei Benutzern vorausgesetzt werden darf: „However, do we really believe it is more efficient for each of 20 million people to spent five minutes designing a document badly or for one professional to spend a few days designing a document well? “ (Greenspun 1995). Die Folge dieser mangelnden Kontrolle über die Informationsaufbereitung ist eine nivellierende, egalitäre Tendenz des WWW: Demonstrierten in einer realen Bibliothek in Leder oder Leinen gebundene Folianten gegenüber Paperbacks oder flüchtig kopierten Seminar-Tischvorlagen ihre Seriosität und Dauerhaftigkeit bereits durch ihre Ausstattung, so fehlen diese äußeren Signale für die Einordnung ihrer Inhalte bei Publikationen im WWW. Durch die beschränkten Ausdrucksmöglichkeiten von HTML treten uns Schülerzeitungen, Konferenzberichte und Regierungsverlautbarungen zunächst einmal gleich gegenüber. Umso wichtiger ist die Etablierung qualitätssichernder Maßnahmen bei wissenschaftlichen Fachzeitschriften im Internet, ebenso wie die Entwicklung eines neuen, der Semiotik der Ausstattung von unterschiedlichen Publikationsarten entsprechenden Systems äußerlicher Qualitätskennzeichnungen. Ein Blick ins WWW zeigt jedoch, daß diese tendenzielle Nivellierung der Informationspräsentation im WWW unterlaufen wird von Versuchen, HTML- Dokumenten allen Einschränkungen zum Trotz ein individuelles Layout zu geben. Diese Versuche beginnen damit, die markup tags zur Kennzeichung von Textelementen nicht im Sinne von SGML nach semantischen Kriterien auszuwählen als vielmehr nach ihrer Umsetzung durch einen spezifischen browser, <?page no="227"?> Ausgewählte Aspekte des Publizierens im WWW 221 und enden bei unter Web-Designern als Geheimtips gehandelten Tricks zur „Überlistung“ der browser wie z.B. demjenigen, durch mitten im Text plazierte transparente „1-Pixel-Gifs“ einen dem Tabulator vergleichbaren Effekt der Ausrichtung von Textelementen zu erreichen. Damit wird jedoch das von Greenspun angesprochene zweite Grundproblem von HTML, nämlich seine Unzulänglichkeit als Strukturbeschreibungssprache, noch zusätzlich radikalisiert. Neben das inhärente Defizit von HTML, daß der Raster seiner definierten Sprachelemente zu grob ist, um damit selbst einfach strukturierte Texte semantisch sinnvoll auszuzeichnen, tritt nun das Problem der „uneigentlichen“ Verwendung der vorhandenen markup tags unter Layout-Gesichtspunkten. Damit wird nun die SGML zugrundeliegende Philosophie der Trennung von Inhalt und Form ad absurdum geführt. Zugleich wird damit das enorme Potential von HTML, über die Integration von Zusatzinformationen die Basis für darauf aufsetzende, intelligente browser zu liefern, verschenkt. Greenspun nennt als Beispiel für eine solche intelligente Anwendung ein Programm, das aus einer elektronischen Konferenzankündigung im WWW automatisch die Deadline für die Einreichung eines Beitrags, den Anmeldetermin und den Konferenztermin selbst in den elektronischen Terminkalender des Benutzers überträgt (Greenspun 1995) eine Zukunftsvision, die sich wohl kaum umsetzen lassen wird in einem Medium, in dem schon die bloße Ermittlung der Anzahl der Abbildungen eines Textes an der Verwendung miniaturisierter Grafiken als Aufzählungszeichen oder gar als Tabulator-Ersatz scheitern muß. Welche Konsequenzen ergeben sich aus der dargelegten inhärenten Problematik der Informationsaufbereitung in HTML-Dokumenten für das Konzept einer elektronischen Zeitschrift? Eine technisch ambitionierte Lösung liegt sicherlich in der Entwicklung leistungsfähigerer Software sowohl seitens des servers als auch des clients, wie es z.B. mit dem Hypertextsystem Hyper-G und der Zeitschrift J.UCS (URL: http: / / hyperg.iicm.tu-graz.ac.at/ ) versucht wird. Daß diese Lösung für die „Review of Information Science“ vorerst nicht realisiert wurde, liegt am enormen Erfolg des WWW, das es trotz aller Nachteile allein unter dem Gesichtspunkt der Reichweite als attraktive Plattform für ein Ejoumal erscheinen läßt. Da die „Review of Information Science“ in erster Linie als Fachzeitschrift der Distribution informationswissenschaftlicher Forschungsergebnisse dienen soll und somit die Funktion der wissenschaftlichen Fachkommunikation im Vordergrund steht, kommt der Forderung nach universeller Zugänglichkeit hohe Priorität zu. Da die Notwendigkeit der Installation eines spezifischen browsers erfahrungsgemäß hemmend wirkt und den potentiellen Leserkreis einschränkt, wurde für RIS darauf verzichtet. Stattdessen wurde ein Teil der WWW-spezifischen Einschränkungen durch ein CGI- Skript umgangen, das versucht, die Intention von SGML hinsichtlich der Trennung von Text und Layout nachzuvollziehen: Alle Informationen zur Gestaltung des Layouts soweit deren Definition mit HTML-Sprachelementen mög- <?page no="228"?> 228 Elisabeth Frisch lieh ist werden getrennt von den eigentlichen Dokumenten festgehalten, das Layout selbst (Hintergrundfarbe, Kopf- und Fußzeile, Logo, Präsentation der Grafiken und der kontextsensitiven Navigationsinformation in einer Buttonleiste etc.) wird erst zur Laufzeit erzeugt. Damit gelingt es, jene layoutbezogenen HTML-Markierungen wie z.B. die Definition der Hintergrundfarbe, die als Konzession an den Gestaltungswillen der Informationsanbieter wider die Philosophie von SGML eingeräumt wurden, aus den HTML-Dokumenten selbst herauszuhalten. Da ein solches Vorgehen natürlich nur eine Interimslösung darstellt, bleibt die weitere Entwicklung der HTML-Spezifikation abzuwarten. 2.2 Probleme des Publizierens im einem globalen offenen Hypertextsystem Zum Abschluß soll die Frage nach der Konversion von Texten in Hypertexte noch unter einer anderen, inhaltlichen Perspektive betrachtet werden. Wie schon erwähnt, ist es das Sprachelement zur Definition von Hyperlinks, das den Erfolg von HTML ausmacht und die Grundlage des globalen offenen Hypertextsystems des WWW darstellt. Ein offenes Hypertextsystem ist das WWW deshalb, weil diese Links nicht nur dokumentintern, sondern auch extern angelegt werden können; referenzierbar ist jedes andere im WWW angebotene Dokument. Während in einem geschlossenen Hypertextsystem, z.B. einem auf CD-ROM vertriebenen Lernsystem, alle Links, denen der Leser nachgehen kann, vom Autor kontrolliert und mit einer klaren Intention angelegt und somit integraler Bestandteil des Textes sind, gilt dies in einem WWW-Dokument nur für einen Teil der Links, nämlich die internen. Ansonsten ist jedoch das eigene Dokument ein Knoten in einem unkontrollierten, weil unkontrollierbaren, dynamischen, globalen Netzwerk. Bereits die von einem Autor selbst angelegten, von seinem eigenen Dokument nach außen führenden Links unterliegen nur bedingt seiner Kontrolle, da er auf die Kontinuität des referenzierten Materials keinen Einfluß hat. Noch schwieriger ist es mit externen Verweisen auf den eigenen Text: Hier wird deutlich, daß die pragmatischen Rahmenbedingungen der Textrezeption in einem offenen Hypertextsystem zu einer qualitativen Neubestimmung des Textbegriffs führen. Ko- und Kontext eines Textes als wesentliche Determinanten seiner Rezeption können vom Autor nur sehr eingeschränkt mitbestimmt werden. Das browsing als kennzeichnende Form der Informationsaufhahme in Hypertexten bedeutet, daß weniger das gezielte Aufsuchen bereits bekannter Informationsangebote als typische Form der Navigation im Netz betrachtet werden kann als vielmehr das explorative Verfolgen vielversprechender Referenzen. Üblicherweise stößt der Leser also auf einen Text, indem er einem Link dorthin nachgeht, und zweifellos prägt der Kontext, aus dem heraus dieser Verweis erfolgt, seine Erwartungshaltung und prädisponiert sein Rezeptionsverhalten. Ein der „Review of Information Science“ entnommenes Beispiel hierfür sind die Rubriken „Zeitschriftenrundschau“ oder „Rezensionen“: Hier finden sich Verweise auf exter- <?page no="229"?> Ausgewählte Aspekte des Publizierens im mvw 229 ne Artikel aus einer kommentierenden, subjektiv wertenden Besprechung ihres Inhalts heraus ob man dem Link eines Verrisses oder einer Empfehlung folgt, determiniert entscheidend die Haltung dem Text gegenüber. Als Informationsanbieter ist es nun sehr schwierig, gerade diese Kontexte der Verweise auf die eigenen Dokumente einschätzen oder beeinflussen zu können. Diese Problematik externer Links hat für den Anbieter einer elektronischen Zeitschrift im WWW eine Reihe von Konsequenzen. Zum einen überfordert diese qualitative Veränderung des TextbegrifFs und in der Folge auch des AutorenbegrifFs heutige urheber- und verwertungsrechtliche Regelungen. Ungeklärt ist derzeit vor allem die Frage der Archivierung: Eine seriöse Fachzeitschrift muß die Zugreifbarkeit ihrer Artikel über einen den Zeithorizont des kurzlebigen WWW weit überschreitenden Zeitraum hinaus garantieren und deshalb realistischerweise eine Archivierung unabhängig von der Netzversion vorsehen. Jede aus ihrer Netzumgebung herausgelöste Fassung des Textes bedeutet jedoch die Einbuße zahlreicher, unter Umständen wesentlicher Bezüge. Wie soll man z.B bei einer Archivierung auf CD-ROM mit externen Referenzen verfahren? Betrachtet man das referenzierte Material als essentiellen Bestandteil des Textes, müßte man es ebenfalls archivieren, doch beim Kopieren fremder Dokumente entstehen rechtliche Probleme. Zudem stellt sich die Frage nach der Kontinuität externer Materialien. Angesichts der dem Medium inhärenten Kurzlebigkeit der Ressourcen ist man zum einen mit ins Leere verweisenden dangling links konfrontiert, zum anderen können Links aber auch durch den dynamischen Charakter vieler Ressourcen und die ständige Veränderung ihrer Inhalte obsolet werden. Durch dieses (vom Autor selbst nicht kontrollierbare) Wegfallen oder Veralten der Referenzen und die potentiellen Veränderungen des referenzierten Materials verlieren Texte als WWW-Dokumente ihren statischen Charakter, sie verändern sich im Laufe der Zeit. Dies kann durchaus ein beabsichtigter Effekt sein, so kann z.B. der Autor eines Wirtschaftsberichtes, anstatt zum Zeitpunkt der „Drucklegung“ bereits veraltete Tabellen in seinem Text zu verwenden, durch einen externen Link auf tagesaktuelle Wirtschaftsdaten, Börsenberichte, Währungskurse etc. verweisen. Für die Archivierung stellt diese Art von Aktualität allerdings ein Dilemma dar. Dennoch darf der zeitkritische Aspekt des WWW nicht mit an der Unveränderlichkeit gedruckter Publikationen geprägten Maßstäben als Ärgernis betrachtet werden, er stellt eines der größten Potentiale des elektronischen Publizierens im Internet dar. Ein weiteres Problem der Archivierung ist die Frage, wie weit ein im WWW angebotener Text sich im Bewußtsein des Lesers tatsächlich als abgeschlossene Einheit präsentiert und wie sehr sich diese Einheit des Textes im Geflecht von außen kommender und nach außen führender Verweise und Bezüge allmählich auflöst. Die Texte diftündieren, ihre Grenzen scheinen durchlässig nach allen Seiten. Verstärkt durch den nivellierenden Effekt von HTML, der die tendenziell ähnliche Darstellung von WWW-Dokumenten bewirkt, ist manch- <?page no="230"?> 230 Elisabeth Frisch mal fraglich, ob dem Leser beim browsing der Unterschied zwischen internen und externen Links immer deutlich wird. Im Einzelfall kann der mangelnden Transparenz der Navigation im WWW durch die deutliche Etikettierung externer Links oder durch das Angebot zusätzlicher Orientierungsinformation begegnet werden, wie es auch in der „Review of Information Science“ versucht wurde. Generell muß man sich jedoch bewußt machen, daß eine elektronische Zeitschrift im WWW nicht nur eine schnellere und effizientere Form der traditionellen Wissenschaftskommunikation mittels gedruckter Periodika darstellt, sondern daß das Publikationsmedium entscheidenden Einfluß auf die in ihm vermittelten Inhalte ausübt und auf lange Sicht den Charakter der in ihm verteilten Texte selbst qualitativ prägen und verändern wird. 3. Literatur Bartz, Tilman (1995): Organisationsformen von wissenschaftlichen Ejoumals im Internet und Kriterien ihrer Akzeptanz. Diplomarbeit Informationswissenschaft. Konstanz. Bennion, B.C. (1994): Why the Journal Crisis? In: Bulletin of the American Society for Information Science, February/ March, S. 25f. Cailliau, Robert (1995): About www. In: J.ucs 1, 4, S. 220-231. Available URL: http: / / hyperg.iicm.tu-graz.ac.at/ Frisch, Elisabeth (1996): Elektronische Fachzeitschriften im www als Paradigmenwechsel im System wissenschaftlichen Publizierens. In: Krause, Jürgen et al. (Hg.): Herausforderungen an die Informationswirtschaft. Proceedings des 5. Internationalen Symposiums für Informationswissenschaft ist '96. Berlin, 17.-19. Oktober 1996. Konstanz. Götze, Dietrich (1995): Die Rolle des Verlags. In: Honnefeider, Gottfried (Hg ): Die unendliche Bibliothek - Digitale Information in Wissenschaft, Verlag und Bibliothek. Wiesbaden. Available URL: http: / / www.ddb.de/ extra/ unendbib/ unendbib.htm Greenspun, Philip (1995): We Have Chosen Shame and Will Get War. In: The Journal of Electronic Publishing jep 1. Available url: http: / / www-swiss.ai.mit.edu/ philg/ research/ shame-and-war.html Grötschel, Martin/ Lügger, Joachim (1995): Neue Produkte für die digitale Bibliothek: die Rolle der Wissenschaften. In: Honnefeider, Gottfried (Hg.): Die unendliche Bibliothek - Digitale Information in Wissenschaft, Verlag und Bibliothek. Wiesbaden. Available URL: http: / / www.ddb.de/ extra/ unendbib/ unendbib.htm Grötschel, Martin/ Lügger, Joachim/ Zimmermann, Ulrich (1995): Wissenschaftliche Information am Wendepunkt? Zwänge, Krisen und Chancen aus Sicht der Mathematik. In: Proc. of the 4th Weinheim Librarian Meeting. Available url: http: / / www. vchgruop.de/ Books/ lib_meet_95/ inhalt.html Haferburg, Andrea/ Hahn, G./ Müller, P.J./ Schuffert, F. (1996): Projektbericht „Review of Information Science“. Projektkurs Informationswissenschaft. Konstanz. <?page no="231"?> Ausgewählte Aspekte des Publizierens im WWW 231 Kemp, Arnoud de (1993): The Role of Publishers. In: Gehr, Hans-Peter, Davies, I, Walckiers, M. (Hg ): Knowledge for Europe. Librarians and Publishers Working Together. München et al. S. 193-206. Kuhlen, Rainer (1995): Informationsmarkt. Chancen und Risiken der Kommerzialisierung von Wissen. Konstanz. Mittler, Elmar (1995): Die Rolle der Bibliothek. In: Honnefeider, Gottfried (Hg): Die unendliche Bibliothek - Digitale Information in Wissenschaft, Verlag und Bibliothek. Wiesbaden. Available URL: http: / / www.ddb.de/ extra/ unendbib/ unendbib.htm Odlyzko, Andrew M. (1994): Tragic Loss or Good Riddance? The Impending Demise of Traditional Scholarly Journals. In: J.ucs 0,0, (Pilot Issue), S. 3-52. Available URL: http: / / hyperg.iicm.tu-graz.ac.at/ Okerson, Ann (1991): The Electronic Journal: What, Whence, and When? In: The Public- Access Computer Systems Review, 2/ 1, S. 5-24. Available URL: http: / / info, lib.uh.edu/ pacsrev.html Quinn, F. (1994): A Role for Libraries in Electronic Publishing. In: EJoumal 4, S. 2. Available: Email to: listserv@albany.edu, Text of message: get ejrnl V4N2 Schaffner, A.C. (1994): The Future of Scientific Journals: Lessons from the Past. In: Information Technology and Libraries, 13, S. 239-247. Schauder, Donald E. (1994): Electronic Publishing of Professional Articles: Attitudes of Academics and Implications for the Scholarly Communication Industry. In: Journal of the American Society for Information Science JASIS, 45/ 2, S. 73-100. Wilson, Tom (1996): Electronic Publishing: Libraries, Universities, Scientific Societies, and Publishers. In: Proc. of the Conference on „Electronic Publishing and Libraries“, Bielefeld, March 96. Available URL: http: / / www.ub.uni-bielefeld.de/ aktuell/ kongress/ vortraeg <?page no="233"?> Bernhard Schröder / Jens Ostermann-Heimig Kants Werke als Hypertext 1. Einführung Die meisten hypermedialen Angebote enthalten Texte, die eigens für dieses Medium hergestellt oder strukturell überarbeitet wurden. Hypertexte weisen eigene strukturelle Merkmale auf, die sich sowohl sprachlich als auch in der Textgliederung niederschlagen. Jedoch finden sich auch mehr und mehr literarische Texte elektronisch neu herausgegeben in den Regalen der multimedialen Buchhandlungen. In der Regel handelt es sich um Veröffentlichungen mit pädagogischen Ansprüchen oder um Bemühungen, den Unterhaltungswert des Textmaterials durch multimediale Zugaben zu erhöhen. Unbestreitbar ist, daß durch hypermediale Techniken der Zugriff auf Hintergrundinformationen zum Verständnis eines Textes wesentlich erleichtert werden kann. Eine elektronische Edition kann Textausgabe, Kommentar und Speziallexikon gleichzeitig sein und all diese Elemente in einer viel bequemeren Zugriffsart anbieten, als sie es in Buchform je vermöchten. Darin liegen pädagogische Möglichkeiten der neuen Medien, nicht zu vergessen natürlich das Feld programmierter Interaktivität, das durch die Einbettung der Hypermedia-Materialien in Rechnerumgebungen eröffnet wird und das verschiedenste Arten der Selbstkontrolle und Übung in das Textmaterial zu integrieren erlaubt. Diese Dreingaben sind nicht das, was Benutzerinnen und Benutzer von einer elektronischen Textausgabe für den wissenschaftlichen Gebrauch in der Regel erwarten. Zwar können auf derselben CD-ROM verschiedene Interessentenkreise adressiert werden: Für eher einführende Studienzwecke können Kommentare zuschaltbar sein, im günstigsten Fall kann hypertextuelle Technik sogar dazu dienen, unterschiedliche Kommentare synoptisch nebeneinanderzustellen. Differierende Lesarten eines Textes, die auf einen Leser, der nur mit geringem philologischem Interesse einen Text studiert oder einen ersten Kontakt mit einem Text sucht, verwirrend wirken können, können für solche einführenden Zwecke ausblendbar sein. Eine derartige CD-ROM-Ausgabe kann im besten Fall ein zuverlässiger Begleiter für alle Phasen des Textstudiums sein. Doch konzentrieren sich die Interessen eines wissenschaftlich-philologischen Publikums an einer elektronischen Ausgabe von Texten auf zwei Bereiche. 1. Zum einen werden die Suchmöglichkeiten in einem elektronischen Text geschätzt, zumal dann, wenn es sich um sehr umfangreiches Textmaterial handelt. <?page no="234"?> 234 Bernhard Schröder/ Jens Ostermann-Heimig 2. Zum anderen übersteigen die Darstellungsmöglichkeiten elektronischer Medien durch Hypertext-Techniken weit die lineare und an das Seitenformat gebundene Buchform. Sie helfen den Überblick auch in einem durch vielfältige textkritische Anmerkungen angereicherten Textmaterial zu behalten. 2. Elektronische Textrecherche Der erste Bereich gehört zu den ältesten Anwendungsfeldern linguistischer Datenverarbeitung. Zu seiner Realisierung sind kaum graphische Qualitäten der Benutzeroberfläche und fortgeschrittenere Hypertext-Merkmale vonnöten. In der Vergangenheit dürfte die typische Art philologischer Arbeit mit elektronischen Suchhilfsmitteln die kombinierte Arbeit mit dem gedruckten Buch und der elektronischen Ausgabe gewesen sein. Diese Suchwerkzeuge hatten ihre papierene Entsprechung in regalfullenden Indizes, Konkordanzen, Thesauri u.ä., überrundeten ihre zentnerschweren Verwandten jedoch häufig in der Flexibilität der Suchmöglichkeiten. Der Versuch, boolesche Verknüpfungen in Indizes aufzunehmen, ließe den Papierbedarf mit jeder weiteren Verknüpfung exponentiell wachsen. Bei elektronischen Implementierungen dieser Suchmöglichkeiten stellt sich höchstens die Frage, ob man durch eine Vergrößerung der elektronisch bereitgehaltenen Indizes die ohnehin kaum ins Gewicht fallende Suchzeit noch weiter verkürzen möchte. Bei der Geschwindigkeit verfügbarer Suchalgorithmen auf heute handelsüblichen PCs und der Größe der Massenspeichermedien sind die Suchzeiten in Textmengen, die beispielsweise einer Autorengesamtausgabe entsprechen, also deutlich unterhalb von 100 MB Information liegen, und der Speicherbedarf für Texte und Indizes eher zu vernachlässigen. In dieser Hinsicht stehen Texte in angenehmem Kontrast zu graphischem und akustischem Material. Viele Programme, die nur Textmodus-Fähigkeiten des Computers beanspruchten, gehören zu den bewährten Klassikern dieser Werkzeuge. Doch zeigten bereits Programme wie WordCruncher für DOS oder TACT, daß die Integration rudimentärer im Textmodus realisierter Fenstertechniken die Benutzerfreundlichkeit derartiger Werkzeuge beträchtlich erhöhen kann, und wiesen damit aktuellen Entwicklungen mit graphischer Oberfläche den Weg. Jedoch beschränken sich die meisten Neuerungen, die die graphische Oberfläche dem Suchkomfort bietet, darauf, bisher durch Tastenkombinationen anwählbare Funktionen der Maus zugänglich zu machen und die Suchhistorie und komplexe Suchanfragen in Diagrammen zu veranschaulichen. Seit den Urzeiten der linguistischen Datenverarbeitung hat sich natürlich auch viel hinsichtlich der zur Verfügung stehenden Suchfünktionen getan. Einfache <?page no="235"?> Kants Werke als Hypertext 235 Kookkurrenzanalysen, wie beispielsweise Z-Score-Angaben, boten auch schon die obengenannten Texterschließungsklassiker. Die automatische Nutzung statistischer Analysen zur Ermittlung von inhaltlichen Ähnlichkeiten zwischen Texten und Textstücken ist in vielen Systemen zur Informationserschließung enthalten und nach wie vor Forschungsgegenstand. Wenn entsprechende Lexika vorliegen, lassen sich auch semantisch-konzeptuelle Informationen über vorkommende Wörter für Recherchezwecke nutzbar machen. 1 So wichtig die Entwicklung intelligenter Recherchierfunktionen für die anwachsenden Online-Bibliotheken ist, so gering ist oft das Interesse von Benutzerinnen und Benutzern einer elektronischen Textausgabe mit weitergehendem philologischem Interesse an diesen avancierteren Möglichkeiten. Gerade bei Textarten mit stark ideosynkratischem Sprachgebrauch nützen auf allgemeinen konzeptuellen Datenbasen beruhende Recherchesysteme oft wenig. Metaphorischer Sprachgebrauch fuhrt in belletristischen Texten ein konzeptionell basiertes System schnell in die Irre, während es bei philosophischen Texten oft der nicht-standardsprachliche Gebrauch von Wörtern ist. Forscherinnen und Forscher in diesem Bereich wissen meist sehr gut, nach welchen Wörtern bei einem bestimmten Autor zu suchen ist und haben meist auch relativ klare Intuitionen darüber, welche Wortkombinationen an den gesuchten Stellen zu finden sind. Ihnen ist durch bequeme Verfeinerungs- oder Erweiterungsmöglichkeiten ihrer Suche und eine übersichtliche Art geholfen, die Suchergebnisse darzustellen, derart, daß durch einen kontextuell erweiterten Überblick eine schnelle Auswertung unterstützt wird, welches die gesuchten Stellen sind. Eine leicht durchzuführende manuelle Filterung der Suchergebnisse ist für philologische Zwecke oft unerläßich. 3. Hypertext-Strukturen Hypertexte stellen eine neue Art textueller Gliederung dar, die weitgehend an elektronische Medien geknüpft ist. Versteht man jedoch als definierendes Merkmal von Hypertexten ausschließlich, daß in ihnen Verweise Vorkommen, die zur linearen Struktur von Texten hinzutreten und die auf andere Stellen in demselben Text oder in anderen Texten oder auf andere Medien, wie Graphiken, verweisen, so wird man auch schon in gedruckten Nachschlagewerken eine reiche Strukturierung dieser Art vorfinden. Lehrbücher zum Selbststudium machen ebenfalls starken Gebrauch von Verweisstrukturen. In einem weiteren Sinne können natürlich jegliche auf Texte und andere Medien explizit und implizit verweisenden Ausdrücke als hypertextuelle Merkmale gedeutet werden; faßt man den Begriff so weit, werden alle Texte zu Hypertexten. 1 Vgl. Müller (1993), Müller/ König (1993) und McCarty (1993). <?page no="236"?> 236 Bernhard Schröder/ Jens Ostermann-Heimig Es mag daher sinnvoll sein, sich auf folgende Verwendungsweisen der beteiligten Begriffe zu einigen: Explizite Textverweise sind alle Verweise, die die Leserin oder den Leser ausdrücklich auffordem, den linearen Lesefluß zugunsten eines anderen Textteils oder Mediums zu verlassen, wenn bestimmte Informationen gesucht werden; selbst wenn man die Anforderung der Ausdrücklichkeit sehr restriktiv deutet, können Textverweise in sehr vielfältigen Formen auftreten; Ausdrücke, wie siehe oben, vgl. S. 14, Pfeile oder in besondere Schriftarten gesetzte Wörter in Nachschlagewerken, die auf andere Lemmata verweisen, Fußnoten, Endnoten, Randtexte gehören in diese Klasse. Zu einem Hypertext im engeren Sinne gehört neben dem Vorhandensein von expliziten Verweisen auch ein Mechanismus, der bei Auswahl bestimmter expliziter Verweise durch ein Zeigerinstrument in der Regel eine Computermaus das Ziel des Verweises anzeigt. Zum Hypertext im hier vorausgesetzten Sinne gehört also neben einer bestimmten intendierten Textstruktur eine technische Unterstützung beim Verfolgen der Verweisstruktur. Explizite Verweisstrukturen fuhren einen Text erst dann aus seinem linearen Korsett, wenn die Verweisstrukturen der Leserin oder dem Leser bei einer mit den Autorenintentionen verträglichen Benutzung des Textes an einigen Stellen die Wahl läßt, ob den Verweisen nachgegangen wird oder man der linearen Ordnung des Textes folgt. Zu einem Hypertextsystem gehört also die Implementierung von Bewegungsalternativen durch einen Text oder ein Netz von Texten. Die zum Standard von Hypertextsystemen gehörenden Navigationsmöglichkeiten sind die Option, einem expliziten Verweis zu folgen und an das Ziel des Verweises zu springen (oder dies zu unterlassen), das Blättern in einem Text und die Rückkehr an Ausgangspunkte von Sprüngen; dies ist in der Regel mindestens durch die Rücknahme von Sprüngen einer nach dem anderen realisiert, kann jedoch auch durch die Anzeige einer ganzen „Sprunggeschichte“ unterstützt werden. Neben Suchwerkzeugen und flexibel anzupassenden Textanzeigen sowie einer sinnvollen Einbettung in den Kontext anderer Anwendungsprogramme (wie Textverarbeitung), die bei elektronischen Textausgaben allgemein für die Akzeptanz entscheidend sind, ist eine übersichtliche Navigationshilfe unerläßlich für ein benutzerfreundliches Hypertextsystem. Vergleicht man ein Hypertextsystem mit einem Stapel aufgeschlagener und mit Lesezeichen versehener Nachschlagewerke auf einem Schreibtisch, so kann man eine Navigationshilfe als ein automatisches Aufräum- und Kartographierungswerkzeug für den Schreibtisch betrachten. Damit sich die Benutzerin oder der Benutzer im Hypertext zurechtfmdet, ist es wichtig, daß die Benutzerschnittstelle auf die Grundstruktur des Hypertextes zugeschnitten ist. Am einfachsten sind hierarchisch organisierte Textstrukturen zu behandeln: Hat man es beispielsweise nur mit expliziten Verweisen durch hochgestellte Zahlen auf Fußnoten und Endnoten zu tun, so kann es aus dem Haupttext Verweise auf Fuß- oder Endnoten geben und aus den Fußnoten ausschließlich Verweise auf die Endnoten. Verweise durch hochgestellte <?page no="237"?> Kants Werke als Hypertext 237 Zahlen in die umgekehrte Richtung gibt es nicht. Das Navigationssystem muß es also im Wesentlichen erlauben, den Verweisen auf Fuß- und Endnoten zu folgen und zurück zum Ausgangspunkt eines solchen Sprungs zu gehen. Die Teiltexte gehören jeweils klar feststellbaren Hierarchieebenen an. Die Eingliederung von Suchfunktionen in ein derartiges Hypertextsystem sollte die hierarchische Strukturierung des Hypertextes berücksichtigen, indem die Suchfimktionen auf angebbare Hierarchieebenen beschränkt werden können und indem bei Anzeige der Fundstellen sichtbar gemacht wird, welcher Ebene ein gefundenes Textstück angehört. Die Fundstelle kann aber oft wertlos sein, wenn der Rücksprung auf vorausgehende Hierarchieebenen nicht möglich ist. Viele Fußnoten sind von geringem Interesse, wenn der Kontext der Fußnote nicht zu ermitteln ist. Hier liegt vielfach eine Schwäche aktueller Hypertextsysteme. Bei vielen Systemen, die einem HTML-artigen Standard in den Verweisstrukturen folgen, müssen Rückverweise auf übergeordnete Ebenen explizit kodiert werden. 2 Und im Gegensatz zu den ursprünglichen Verweisen, die nach dem HTML-Standard eindeutig sind, müssen Rückverweise nicht eindeutig sein: Auf eine Fußnote kann an verschiedenen Stellen des Haupttextes verwiesen werden. Verweise, die nicht von einer Hierarchieebene auf die nächste fuhren, stellen konzeptionell die größten Anforderungen an ein benutzerfreundliches Hypertextsystem. HTML-artige Systeme legen Verweise ja auch keineswegs auf solche zwischen Hierarchieebenen fest, sondern das Verweisnetz kann ganz beliebig zwischen Texten und Teiltexten geknüpft werden. Während bei hierarchisch organisierten Verweisen in der Regel die aktuelle Hierarchieebene ein Orientierungsmerkmal bei der Navigation darstellt, entfällt dies bei nichthierarchischer Organisation. Es ist nicht immer ersichtlich, wie weit man sich vom Haupttext wegbewegt hat und ob man sich durch Nachgehen von Verweisen tatsächlich in die „richtige Richtung“ bewegt. Nicht selten landet man bei Hypertexten in der Absicht, Querverweisen nachzugehen, unwillkürlich am 2 Werden Fußnoten in HTML-Seiten beispielweise durch Verweise auf neue die Fußnoten beinhaltende HTML-Seiten realisiert, so können die populären www-Suchmaschinen bei Suchanffagen zwar die die Fußnote beinhaltende Seite finden, aber nicht den Urspmng der Referenz auf diese Seite, wenn dieser auf der Seite nicht ausdrücklich als html- Verweis kodiert ist. Ähnliches gilt auch für HTML-Sprungverweise auf derselben Seite. Sollen Fußnoten in WordCruncher für Windows mit dem Haupttext zusammen durchsuchbar sein, so müssen sie als Sprungverweise innerhalb eines „WordCruncher-Buches“ realisiert sein; auch hier sind Rücksprünge an den Urspmng des Fußnotenverweises nur möglich, wenn sie explizit kodiert sind. Ganz Analoges gilt auch für die Jump Links von Folio Views. Neben diesen bietet Folio Views noch den Mechanismus der Popup Links für Textteile, die in eigenen Fenstern erscheinen sollen; diese Textteile sind allerdings nicht zusammen mit dem Haupttext durchsuchbar. Nur einige SGML-Betrachter, wie z B SoßQuad Explorer, verfügen über die Fähigkeit, auch Textteile zu durchsuchen, die in einem eigenen Fenster anzuzeigen sind und bei geglückter Suche, die Verweissymbole im Haupttext zu markieren, die auf die entsprechenden Textteile verweisen. <?page no="238"?> 238 Bernhard Schröder/ Jens Ostermann-Heimig Ausgangspunkt oder an einer Stelle, an die das lineare Weiterverfolgen des Ausgangstextes ohnehin geführt hätte. Anschauliche topologische Konzepte für nicht-hierarchisch organisierte Hypertexte sind noch weitestgehend ein Desiderat, und dies gilt in hohem Maße dann, wenn es sich um eine Vielzahl von Verweistypen handelt. Bei den bisher erwähnten hierarchischen Verweistypen kann deren Authentizität in der Regel als gesichert gelten: Die Zuordnung von Randtexten, Fuß- und Endnoten zu Textstellen ist im gedruckten Text meist hinreichend klar. Viele nicht-hierarchische Verweise sind jedoch nicht so eindeutig. Ein Verweis wie siehe oben kann Anlaß zu unterschiedlichen Interpretationen geben, welche Stelle oben genau gemeint sein könnte. Bei manchen Editionen mögen auch synoptische Verweise zwischen Texten nützlich sein, jedoch bringt der Herausgeber hiermit Verweistypen in den Text ein, die oft klarerweise nicht vom ursprünglichen Autor intendiert sind. HTML-artige Hypertext-Strukturierung und entsprechende Hypertext-Betrachter erlauben zwar die Unterscheidung verschiedener Darstellungen von Textverweisen (über Symbole und typographische Formatierungen), alle Verweistypen werden jedoch auf denselben Ankermechanismus zurückgeführt, Navigationshilfen geben der Benutzerin oder dem Benutzer keinerlei Anhaltspunkte, welcher Art die Verweise waren, die zu einer aktuellen Stelle geführt haben. Bei nicht-hierarchischen Verweisen können die jeweiligen Textebenen, die durch den Verweis in Beziehung gesetzt werden, als Anhaltspunkt nicht herhalten. Die größte Herausforderung im Bereich der elektronischen Textedition (abgesehen einmal von der Einbindung multimedialer Elemente), stellen kritische und evtl, kommentierte Ausgaben von Manuskripten und anderem Nachlaßmaterial dar. Hier kann man es, wie im Fall des Bonner Kant-Korpus nach den Texten der Akademie-Ausgabe, mit verschiedenen Textebenen zu tun haben, z.B. Kantischen Anmerkungen in dem Werk eines anderen Autors, die möglicherweise verschiedenen Zeitschichten zuzuordnen sind und aufeinander bezogen sind, hierzu dann möglicherweise Anmerkungen aus einem kritischen Apparat. Gerade auf der textuellen Metaebene, der kritischen Einordnung der Textfragmente, sind Verweise auf alle Textebenen zu berücksichtigen. Fraglos kann eine elektronische Ausgabe durch die flexiblen und benutzerspezifisch einzurichtenden Darstellungsoptionen sehr zur Lesbarkeit eines solchen Textes beitragen. Und es ist nicht zu vergessen, daß das elektronische Medium die Eingliederung verfügbarer Faksimiles erlaubt, ohne daß dies die Ausgabe zwangsläufig unhandlicher oder unfinanzierbar machte. 3 3 Selbstverständlich ist von Fall zu Fall über die sinnvollerweise zu wählende Graphikqualität zu entscheiden. Wo hochauflösende Graphik mit großer Farbtiefe erforderlich ist, stoßen heute standardmäßig verfügbare Speichermedien natürlich schnell an ihre Grenzen, die Arbeit mit CD-ROM-Stapeln kann nur bedingt befriedigen <?page no="239"?> Kants Werke als Hypertext 239 4. Kants gesammelte Schriften Da die Frage nach der Textkodierung teilweise unabhängig von speziellen Fragen der verfügbaren Textbetrachtertechnik beantwortet werden kann, lassen sich die momentanen Arbeiten an der elektronischen Ausgabe der Werke Kants am Institut für Kommunikationsforschung und Phonetik (IKP) der Universität Bonn in Zusammenarbeit mit dem Institut für angewandte Kommunikations- und Sprachforschung e.V. (IKS) in zwei Sparten einordnen: die Arbeiten an der Kodierung und die Bereitstellung in einem Betrachtersystem. 4.1 Arbeiten an der Kodierung Zum einen werden die schon seit einigen Jahren auf CD-ROM in einer Version für das Texterschließungssystem WordCruncher für DOS erhältlichen Bände I- XIII mit textgliedemden Annotationen (Überschriften, Abschnitte u.ä.) und Annotationen, die die Verweise zwischen den Hierarchieebenen vereindeutigen, versehen. Das alte Kodierungssystem, dessen Ursprünge in den 60er Jahren liegen, sah bereits Band-, Seiten-, Zeilenkodierungen, Kodierungen für Fremdsprachen und Randtexte vor. In der CD-ROM-Ausgabe fanden sich Randtexte und Fußnoten in den fortlaufenden Text eingestreut, nur im Falle der Randtexte durch eine besondere Kodierung hervorgehoben. Das Hauptaugenmerk der bisherigen Kodierung lag auf einer klaren Zuordnung von Datensätzen des elektronischen Dokuments zur gedruckten Ausgabe, eine unabhängige Benutzung des elektronischen Textes war nicht antizipiert. So fehlt jede Kodierung der graphischen Struktur der bei Kant so wesentlichen zueinander analog aufgebauten Tabellen (wie Kategorien- und Urteilstafel). Hinweise darauf, daß bei Kant Thesen-Antithesen-Textpaare parallelisiert sind, wobei ein Teiltext nur auf geraden, ein anderer auf ungeraden Seiten weitergeführt wird, fehlten in der bisherigen Kodierung, eine von dem gedruckten Text unabhängig zu benutzende Textausgabe kann auf Sichtbarmachung der Parallelisierungen nicht verzichten. Die Annotationen werden zu einer SGML-konformen Syntax vereinheitlicht und sind somit weitestgehend unabhängig von der Wahl spezieller Betrachter Auf der SGML-Ebene lassen sich Typen von Verweisen leicht durch Einführung neuer Elemente oder Attribute unterscheiden. Die Kodierung ist diesbezüglich also feiner strukturiert als es von den Betrachterwerkzeugen in der Regel vorgesehen ist. Nach dem unmittelbar bevorstehenden Abschluß der Kodierungsarbeiten an den Bänden I-XIII wird die Aufmerksamkeit auf die Nachlaßbände gerichtet werden. Hierfür wird ein Kodierungsschema entwickelt, das die Textebenen und Verweistypen widerzuspiegeln vermag. SGML ist durch die Realisierbarkeit von Zeigerstrukturen durch Attribute hinreichend flexibel. Die Konsistenz <?page no="240"?> 240 Bernhard Schröder/ Jens Ostermann-Heimig spezieller Verweislogiken (bestimmte Verweise müssen eindeutig sein, andere können mehrere Ziele haben u.ä. Einschränkungen) kann allerdings durch kontextfreie SGML-Parser nicht gewährleistet werden. Hier werden spezielle Validierungswerkzeuge zu entwickeln sein. 4.2 Bereitstellung in einem Betrachtersystem Eine aktualisierte Version der Bände I-XIII auf CD-ROM ist derzeit mit dem Texterschließungssystem WordCruncherfür Windows realisiert. Wie die DOS- Version arbeitet das System mit präindizierten Texten. Der Suchmanager präsentiert sich in einer Grundstruktur, die der DOS-Version ebenfalls nachempfunden ist, jedoch alle Bedienungsvorteile einer graphischen Benutzeroberfläche bereithält und in den Filtermöglichkeiten der Wortliste durch Wildcards erheblich verbessert wurde. Die Suchergebnisse stellt WordCruncher nach wie vor durch eine KWIC-artige Strukturierung in Kontextfenstern vor. An die Textstelle im Gesamtkontext gelangt man durch Auswahl eines Kontextfensters. Die Optionen, Thesauri einzubeziehen und auch nicht zusammenhängende Suchbereiche zu bestimmen, sind in die Windows-Version übernommen und sinnvoll in die graphische Benutzerumgebung integriert worden. Auch alle Funktionen zur Umsortierung der Textreferenzen nach Vor- oder Nachkontext und zur rudimentären statistischen Analyse von Kollokationen sind über Menüs erreichbar geworden. Die Analogie vieler Merkmale zur DOS-Version dürfte langjährigen Benutzern der DOS-Version den Umstieg erleichtern. Die graphischen Fähigkeiten zur Textdarstellung wurden durch flexible Schrift- und Farbwahl sowie Positionierungsoptionen relativ weit entwickelt. Die Positionierung von Graphiken in den Text ist allerdings nicht vorgesehen, auf graphische Elemente muß im Text durch Symbole die allerdings graphisch sein dürfen verwiesen werden; WordCruncher öffnet einen Graphikbetrachter, der sich durch Skalierbarkeit der Graphiken und die Verwaltung von Hotspots in den Abbildungen auszeichnet, die ihrerseits Rückverweise in den Text oder Verweise auf andere Graphiken beinhalten können. Trotz aller implementierten Merkmale, die den Aufruf anderer Windows-Anwendungen gestatten, bleibt WordCruncher ein textzentriertes System. Erfreulich, wenn auch mittelfristig erweiterungsbedürftig, ist die Berücksichtigung von zehn Textgliederungsebenen statt bisher drei. Nützlich ist die Tatsache, daß nicht alle Textgliederungsebenen nach Ober- und Untergliederungen organisiert sein müssen. Seiten- und Zeilengliederung kann konkurrierend neben Kapitel- und Abschnittsgliederungen bestehen. Filterkonzepte von SGMLnach WordCruncher-Markierungen bestehen in Ansätzen, deren Bewährung sich noch zeigen muß. <?page no="241"?> Kants Werke als Hypertext 241 In den Bänden I-XIII, auf die sich die nächste Ausgabe noch beschränken wird, spielen an bislang kodierten Verweisstrukturen neben den hierarchischen in erster Linie Verweise zwischen Paralleltexten eine Rolle: Dazu gehören sowohl synoptische Verweise zwischen verschiedenen Ausgaben eines Werkes (so die Ausgaben A und B der Kritik der reinen Vernunft) als auch von Kant Book#! - KANU filppip ust; ; yiew Sort filter Options Help n^>lSand 1 S 010.20 so wendet man alles an, seine Vermuthung S$|i! § zu machen. Nachdem man sich nun tausendmal bei einem Unterfangen verirrt hat, so wird der Gewinnst, der hiedurch der Erkenntnis der Wahrheiten zugewachsen [2/ 26] Band 1 S. 046: 23 wenn es ist, was ich vorher erwiesen habe, daß die Schwere in großem Zeiten größere Wirkung thue, so habe der Körper in B eine größere Geschwindigkeit erhalten müssen, als die Schwere in der Bewegung r [3/ 261 Band 1 S. 050: 35 lassen. Denn was In einem geometrischen Beweise als wa wird, das wird auch in Ewigkeit ÜÜI bleiben. 't befunden [4/ 261 Band 1 S. 050: 36 wird, das wird auch in Ewigkeit \ \ bleiben. ~—: Simä M"'l "" Abb. 1: Referenzliste in WordCruncher für Windows T-T bereits als solche intendierte Parallelisierungen von These und Antithese. Hier bietet WordCruncher für Windows das nützliche Mittel des parallelen Rollens in Texten: Texte mit paralleler Annotierung einiger Gliederungsebenen werden in zwei geöffneten Textfenstern immer analog zueinander bei Roll- oder Suchvorgängen positioniert. Das synchrone Rollen bietet zudem eine geeignete Möglichkeit zur Integration von Übersetzungen und Kommentaren oder sonstigen textbezogenen Informationen. Parallel zur CD-ROM-Ausgabe sollen auch Textrecherchemöglichkeiten im World Wide Web angeboten werden. <?page no="242"?> 242 Bernhard Schröder/ Jens Ostermann-Heimig 4.3 Der Kant-Such-Service Aus Gründen der verfügbaren Server-Kapazitäten und aus Lizenzgründen können die Kant-Texte im Internet nur mit gewissen Einschränkungen verfügbar und recherchierbar gemacht werden. Dies schließt eine direkte Bereitstellung der Texte als HTML-Dateien in einem öffentlichen WWW-Bereich aus, nur ein indirekter Zugriff auf die Daten über Suchanfragen ist möglich. » Band 1 S. 017: 03 Bord IR L Cd? 0401 Hl Weil ich glaube, daß es etwas zu der Absicht beitragen kann, welche ich I einmal gewiß und einige metaphysist Jedweder Körper hal eine 0000 wesentliche Kraft, überhaupt festgesi machen. Man sagt, daß ein habe. giw-guiljj I Denn Hindernisse überwinden, Federn spannen, Massen verrücken: dieses nennt alle Welt wirken. Wenn man nicht weiter sieht, als etwa die Sinne lehren, so hält man diese Kraft für etwas, was dem Körper ganz und gar von draußen mitgetheilt worden, und wovon er nichts wenn.er in RuhBÜst. Der ganze Haufe der Weltweisen vor Abb. 2: Randtextanzeige bei Kant-Ausgabe in WordCruncher für Windows Der Benutzer kann Suchanfragen nach dem Vorkommen bestimmter Wortformen oder Wortformenkombinationen stellen und erhält als Antwort die Textstellen, die seinen Suchkriterien entsprechen. Dabei kann die pro Anfrage bereitgestellte Anzahl an Fundstellen und die Kontextgröße der Fundstellen vom Betreiber des Such-Service benutzerspezifisch beschränkt werden. Es wurden Einschränkungen festgelegt, die das sukzessive Herunterladen des Gesamttextes durch eine automatisierte Generierung von Suchanffagen praktisch unmöglich machen. Im folgenden soll auf die Benutzersicht des Systems, die Komponenten und ihr Zusammenspiel und schließlich die Integration von Hypertext-Strukturen eingegangen werden. <?page no="243"?> Kants Werke als Hypertext 243 4.3.1 Benutzersicht des Kant-Such-Service Der Kant-Such-Service existiert bislang in einer ersten Testversion, die unter der WWW-AdreSSe http: / / www.ikp.uni-bonn.de/ IKS/ Kant-Service aufrufbar ist. Wenn man sich auf der Begrüßungsseite anmeldet, etwa als Gast, gelangt man zu dem in Abbildung 3 gezeigten Suchformular. Hierin können Suchmuster für die zu suchenden Wortformen in zweierlei syntaktischen Formen spezifiziert werden: - Es können wahlweise die DOS-Wildcards - T und für ein bzw. mehrere beliebige Zeichen - oder die Syntax der regulären Ausdrücke der Skriptsprache „Perl“ verwendet werden. - Die Felder einer Zeile stehen in Konjunktion, die einzelnen Zeilen in Disjunktion zueinander. Die Negation einzelner Textfelder erfolgt durch Auswahl des voranstehenden Radioknopfes ‘nicht’; diese bewirkt, daß nur diejenigen Textpassagen ausgewählt werden, in denen die durch das angegebene Muster spezifizierten Wortformen innerhalb des aktivierten Kontextes sämtlich nicht auftreten. IKS Kant Suchservice Generell Groß-/ Kleinschreibung ignorieren: •yes Ono Zu durchsuchende Bände wählen ODOS (? / *) »Regular Expressions Ausgabenkontext: Vorher: 5 Zeilen, Nachher: 5 Zeilen.. [Gedanke ~| |j N q □ nic ht 1 ItlND □ nicht I ISuchbereich: +/ - Zeilen ED I ~1 UND □ nicht I | UND □ nicht I |suchbereich: +/ - Zeilen I 5 I Abb. 3: Suchformular des iks Kant-Suchservice Neben den Suchmustern können die folgenden Parameter festgelegt werden: die Größe der angezeigten Textstellen vor und nach der Fundstelle (der Zeile, in der das erste Suchmuster einer Konjunktion gefünden wurde), die Anzahl der Zeilen vor und nach einer Fundstelle, in der die konjugierten Suchmuster auftreten müssen oder (im Falle der Negation) nicht dürfen, - Suche über alle verfügbaren Kantbände oder eine Auswahl. <?page no="244"?> 244 Bernhard Schröder/ Jens Ostermann-Heimig Als Antwort auf ein ausgefulltes und abgeschicktes Such-Formular erhält der Benutzer eine KWIC 4 -Liste mit Einträgen der von ihm angegebenen Kontextgröße. Am Ende dieser Liste findet sich ein Verweis auf ein neues Suchformular. Die Schnittstelle des Such-Service zum Benutzer wird durch WWW- ServerZ-Browser bereitgestellt, die Kommunikation erfolgt über HTML- Dokumente und -Formulare. Der Suchvorgang wird von einem Perl-Script ausgefuhrt, das zunächst das Suchformular auswertet und entsprechende Suchprozesse in den Kant-Texten anstößt. Der Benutzer hat Zugriff auf die Kant-Daten nur über diese Schnittstelle. Informationen über die für den jeweiligen Benutzer erlaubte Datenmenge werden dem Script aus einer Datenbank bereitgestellt. 4.3.2 Aufbau des Kant-Such-Service Das Interface zum Benutzer wird durch WWW-Server/ -Browser bereitgestellt, die Kommunikation erfolgt über HTML-Dokumente und -Formulare. Der Suchdienst wird von einem Perl-Script ausgeführt, das das Suchformular auswertet und Zugriff auf die Kant-Daten hat. Informationen über die für den jeweiligen Benutzer erlaubte Datenmenge werden dem Script aus einer Datenbank bereitgestellt. 4.3.3 Hypertext-Elemente im Kant-Such-Service Die Möglichkeiten von HTML werden bislang zur Bereitstellung einer Oberfläche und zur typographischen Textstrukturierung genutzt. In einem nächsten Schritt sollen die Möglichkeiten von HTML zur Realisierung der hierarchischen Verweisstrukturen eingesetzt werden. Diese Struktur soll in Zukunft auch bei der Intemetsuche gewahrt bleiben: Es ist vorgesehen, Verweise auf Fußnoten oder Randtexte im Kontext eines Wortbelegs durch einen HTML-Verweis vorzunehmen. Bei Fundstellen innerhalb eines Randtextes oder einer Fußnote soll hingegen zusätzlich zum Kontext innerhalb der Fußnote auch der Kontext der Fußnote im Text angeführt werden. Ein Rückverweis in den Haupttext selbst auf die jeweilige Textstelle kann dann problematisch sein, wenn der Text als Ganzes ein HTML-Dokument darstellt, das dann vollständig zu laden wäre. 4 KeyWord in Context <?page no="245"?> Kants Werke als Hypertext 245 ^Datenbank mit Benutzer- . informationen HTML-Dokumente HTML-Formulare Abb. 4: Zusammenspiel der Komponenten des Kant-Such-Service 5. Schluß Auch Texte im gedruckten Medium enthalten explizite Verweisstrukturen. Beschränkt man sich auf Verweisstrukturen mit präzisen Zielangaben, so ist die Anzahl der Verweistypen im Allgemeinen sehr begrenzt. Oft sind Verweise mit expliziten Zielangaben hierarchisch organisiert, d.h., sie fuhren in eine andere Textebene (wie Fuß- oder Endnoten), und Verweise desselben Typs fuhren nicht in die entgegengesetzte Richtung. Für hierarchische und nichthierarchische explizite Verweise bieten HTML-artige Annotationsformalismen geeignete Elemente. Somit reichen auch Textbetrachter- und Suchwerkzeuge mit Hypertextgrundfunktionen aus, Texte dieser Art elektronisch handhabbar zu machen, und die Wahl des Betrachtersystems wird in erster Line von den geforderten Such- und Analysefunktionen und dem gewünschten Lesekomfort abhängig sein. Steigt jedoch die Anzahl der hypertextartig dargestellten Verweistypen in einem Text, so können die standardmäßig verfügbaren Betrachterfünktionen in ihrer Unterstützung der Navigation nicht zuffiedenstellen, da anschauliche Mittel zur Darstellung einer Verweistypologie mit einer großen Anzahl von Verweistypen noch weitestgehend ein Desiderat sind. <?page no="246"?> 246 Bernhard Schröder/ Jens Ostermann-Heimig 6. Literatur 6.1 Gedruckte Literatur McCarty, Willard (1993): Das Texterschließungssystem TACT. In: Lenders, Winfried (Hg ). S.105-110. Kant, Immanuel: Kants Gesammelte Schriften. Nach den Bänden I-XIII der Akademie- Textausgabe aufbereitet für WordCruncher für Windows. Auf cd-rom für Windows 3.11, Windows NT, Windows95 hrsg. v. IKS e.V. Bonn, Jan. 1997. Lenders, Winfried (1993) (Hg ): Computereinsatz in der angewandten Linguistik. Konstruktion und Weiterverarbeitung sprachlicher Korpora. (Forum angewandte Linguistik). Frankfurt a.M. Müller, Heinrich H. (1993): Stärken und Schwächen vier mikrocomputerfähiger Programme zur Textanalyse. In: Lenders, Winfried (Hg.). S. 77-84. Müller, Heinrich H./ König, E. (1993): Universell einsetzbare Programme zur Sprach- und Textanalyse. In: Lenders, Winfried (Hg). S. 85-92. Willee, Gerd (1989) (Hg.): Kolloquium zur Speicherung der KANT-Texte auf Optical Disks im Rahmen des IBM-Studienprojekts. IKP-Arbeitsbericht Nr. 7. Bonn. 6.2 Elektronische Publikationen Informationen zu WordCruncher im WorldWideWeb: http: / / www. wordcruncher. com, http: / / www.ikp.uni-bonn.de/ IKS Informationen zu html im WorldWideWeb: http: / / www.w3. org Informationen zu Textretrievalsysteinen mit SGML-Unterstützung: http: / / www. sgmlopen.org/ sgml/ docs/ info.htm Guidelines der Text Encoding Initiative (tei) für die SGML-Kodierung von Dokumenten: http: / / etext.Virginia.edu/ TEI.html <?page no="247"?> Melina Alexa Text type analysis with TATOE 1. Introduction This paper presents the genre analysis of a corpus of English encyclopedic reference texts for text generation purposes, as this has been supported computationally by the ‘Text Analysis Tool with Object Encoding’ (TATOE). TATOE is a support tool for semi-automated, corpus-based text analysis. Genre analysis aims at examining and determining how different kinds of linguistic information inter-relate with, and inter-depend on each other, in order to produce a distinctive type of dicsourse. Due to the different kinds of linguistic information which need to be investigated and its demanding requirements with regards to computational support, genre analysis serves as an adequate analysis example for illustrating the kinds of computational support TATOE can offer. The particular genre analysis is performed as part of the current work for the multilingual text generation system KOMET-PENMAN. This system aims at genre-sensitive multilingual automatic generation of text. In order to support this, genre analysis has to come up with empirically evaluated and functionally motivated specifications of text types. Given an information request, text generation systems aim to construct the best text for a given situational context by choosing between a large number of possible options involving a wide range of knowledge resources. Choosing includes options regarding both the content and textual shape of what is to be automatically generated. A standard problem in text generation, therefore, is what the appropriate text type and overall (global) structure of the generated text is, when this is generated as a response to an information request. The approach followed by the KOMET-PENMAN multilingual text generation system, is that linguistic expression is constrained by the extra-linguistic contexts of culture and situation, as put forward according to the theory of Systemic Functional Linguistics (SFL). Context is instantiated in the KOMET-PENMAN architecture according to the proposal of Martin (1992) in which context is divided in two organizational strata, genre and register. Genre is formally represented in SFL by generic structure potential (GSP), which specifies the potential typically occurring stages, according to which a text of a particular genre develops or is structured (cf. Hasan 1978). To give an example, a typical job advertisement has a heading part and a main body part organized according to sections for qualifi- <?page no="248"?> 248 Melina Alexa cations/ requirements for the job advertised, the duties involved, what is offered and a contact procedure for those interested in applying. These all form a GSP for this particular text type. Register, on the other hand, is described in terms of three metafunctions: given a particular contextual situation, the metafiinction offield refers to the events and participants of the situation, the metafiinction of tenor refers to the kinds of participants and their statuses and, finally, the metafunction of mode concerns the channel used for the communication, e g. written or oral mode, and the rhetorical goals of the situation. To summarize, the KOMET-PENMAN system uses an explicit representation of a functionally motivated classification of text types, based on genre and register specifications. The representational means for these specifications is the system network formalism. The role of genre analysis for text generation purposes, therefore, is to provide sufficient contextual information for specifying the genre system networks which the system uses for choosing between different text type alternatives for the generated text. The question which arises when adopting this approach is how to arrive at reliable GSP specifications for the genre system networks. Given that these are intended to be used for generic applications and also, given that they are very time-costly to construct, it is necessary that reliability of such specification is ensured. Thus, functional motivation together with an empirical basis for analysis are necessary. These requisites presuppose that analysis is based on a corpus of real data and aims at discovering regularities of usage, which relate to combinations of features typical of different linguistic levels of description. Regularities of linguistic features determine the range of forms used in the corpus of texts, which can in turn determine the communicative contexts in which these are used. Recent discourse analysis studies, e g. Passonneau/ Litman (1993), Bateman (1994), and Vander Linden/ Martin (1995) demonstrate the need for an empirically motivated methodology for discourse analysis whereby integration of different linguistic information is necessary. Next to the relevant data resources, performing this kind of analysis also requires computational support tools. To be effective, tools need not only concern morphological or grammatical taggers of some kind, but also sophisticated software, which can assist both the extraction of particular kinds of linguistic information, as well as introspection and interpretation. This software needs to enable the integration of functionalities such as setting up and maintaining an interpretation framework for the classification of different linguistic phenomena, performing mark up, searching for words or word patterns, and extracting and displaying information in a single application. <?page no="249"?> Text Type Analysis with tatoe 249 This paper reports on genre analysis as supported by the Text Analysis Tool with Object Encoding (TATOE). The paper is structured as follows: We start with descriptions of the general application scenario and the generation system used. Next we present the basics of our approach and methodological process and explain the requirements for the computational support genre analysis poses. A large part of this paper is devoted to the presentation of TATOE; we describe the tool and illustrate in what ways it has assisted analysis. Finally, we outline some of the future work aimed at increasing the tool's functionality. 2. The general application some background 2.1 The practical context The general application scenario of this work is the Editor's Workbench electronic publishing application (cf. Rostek/ Möhr 1994 and Rostek et al. 1994) which has been developed within the RACE II EUROPUBLISHING-2042 project. The project aims at supporting editorial work during the production of a large art reference publication, namely the Macmillan Dictionary ofArt. As part of this development the possibility of multilingual text generation as a functionality for presenting retrieved information was investigated. For the purposes of such an application scenario, text generation has to be able to provide ‘natural’ and reliable text, in the sense of user-orientation and relevant text type. Genre analysis of the most predominant text types for the publication, namely artist biographies and archeological site descriptions, has been performed in order to support this requisite. 2.2 The KOMET-PENMAN system The KOMET-PENMAN multilingual text generation system, whose processes are based on the PENMAN generation system (cf. Mann/ Matthiesen 1985) as extended for multilingual generation according to Bateman et al. (1991a) and Bateman et al. (1991b) uses a systemic-fiinctionally-based approach to modeling the linguistic resources needed for text generation. The current system uses the functional grammars of English, German, and Dutch, whereby the linguistic specification is represented as system networks. A system network is a directed acyclic graph with labeled arcs whose nodes correspond to grammar choice points, called systems. Generating text is carried out by the traversal of the system network through those choices relevant for the particular text type (for a detailed description of this approach see Teich/ Bateman 1994). <?page no="250"?> 250 Melina Alexa Context is modeled as a separate stratum for the organization of linguistic resources, the other strata being semantics, lexicogrammar, and phonology. In order to assist text structuring, contextual and text type specific information is represented by means of specifying genre and register system networks. The prominent and typical features of a given context of situation are also represented in the system network formalism. To illustrate this, fig. 1 shows a graphical view of part of the genre system network for archeological site descriptions as part of factual genre. The figure shows two options which have been specified for this text type as particular types of descriptive text, full or partial description, and a number of further options, determining the structure of the text according to the information to be communicated are given. Fig. 1: Part of the genre system network for archeological site desciptions 3. Approach and methodological aspects As mentioned, the construction of a reliable genre system network specification requires that analysis is empirically based and functionally motivated. To ensure these two requisites genre analysis is performed in a corpus-based, data-driven, and inter-layered manner. 3.1 Corpus-based analysis Our approach to genre analysis, is corpus-based and data-driven in the sense that analysis is based on a representative collection of original texts belonging to a given text type. Corpus-based need not mean a huge collection of texts, as the amount of text required is always related to the complexity and variety of both text type and semantic domain. Rather, what is necessary is a corpus which is a sufficient and representative ‘slice’ of available texts belonging to <?page no="251"?> Text Type Analysis with TATOE 251 the text type(s) to be analyzed. It must be emphasized that the frequency of occurrence of the phenomena analyzed needs to be systematic in order to be relied upon. The analysis presented here concerns two text types of English encyclopedic art reference texts, namely artist biographies and archeological site descriptions. We have constructed two separate text corpora, one for each text type. Each corpus contains around one hundred characteristic texts. 1 These corpora form the test basis for the analysis. 3.2 Inter-layered analysis Text type analysis aims at examining and determining how different kinds of information inter-relate with, and inter-depend on each other, in order to produce a single piece of discourse. This forms the second aspect of our approach, namely inter-layered analysis. Inter-layered signifies that for analysis we select slices of the total language ‘system’ in such a way that the components of discourse structure, that is words, structures and propositions, are equally analyzed and their interdependence is accounted for. Methodologically, three analysis directions are followed (as influenced by Matthiesen 1993): a ‘bottom-up’ process where text type analysis starts with lexical items. The goal is to derive as much information about the lexical resources and organization of the particular text type in a particular language from relative frequencies, collocational patterns, etc., from a corpus of texts (in Matthiesen 1993 this direction is called delicacy slicing). a ‘top-down’ examination of text types by looking at features of the stratum of lexicogrammar. The assumption made is that text type features are projected onto lexicogrammar through the preselection of certain system features. Inverting the procedure through lexicogrammar one could infer text type characteristics (stratal analysis in Matthiesen 1993). cross-linguistic and „cross-genre“ comparison. Such methodology provides information necessary for ‘classifying’ or grouping the: typical and most frequent lexical forms used in a text type typical and most frequent lexicogrammatical features of a text type i The texts used for analysis and shown in the figures are from the preparatory phase of production of the Dictionary ofArt publication by Macmillan publishers and were used for the race-11 europublishing 2042 project. <?page no="252"?> 252 Melina Alexa typical combinations of regularly occurring lexicogrammatical patterns, by means of which text structure parts, i.e. GSP stages, are empirically determined and motivated. Clearly, the outlined directions for register analysis require that two main tasks be performed. The analyst needs to: identify, codify and extract (cumulative) information and interpret the results, i.e. be able to describe how the gathered information determines register description and representation. The first task forms the basis for stating the requirements for a support tool for genre and general discourse analysis. The second task is related to the general aim of genre analysis and will not be discussed further here. 4. Kinds of computational support required for genre analysis A corpus-based and inter-layered genre analysis presents at least the following requirements for a software tool designed to support this task: machine readable text corpora are defined as the basis for analysis with their internal structure, i.e. corpus, corpus text, paragraph, word, explicitly represented in order to be used for analysis, possibility to perform on-text mark up of a word or a string of words, definition of one (or/ and more) analysis or interpretation framework (henceforth categorization schema) to be used for marking up words or word strings in the corpus, possibility to work with a number of schemata for mark up and classification, in order to enable analysis according to different linguistic levels, frequency of occurrence information, frequency of occurrence information of the already marked items sorted according to schema categorization, different ways of controlling and obtaining concordance views, e g. on-text selection of a word or a string of words, selection according to existing mark up based on the categorization schema, possibility for interactive search according to both general corpus information and ‘meta-information’, i.e. the already performed mark up, utilization of different criteria, e g. frequency of occurrence, performed categorization, relations holding between categories, for graphical presentation of the encoded information. <?page no="253"?> Text Type Analysis with TATOE 253 For the particular genre analysis task we have used TATOE, which has been designed and implemented taking the above requirements as its starting point. For a more detailed description of the tool see Alexa/ Rostek (1996) and Alexa/ Rostek (in preparation). 5. Genre analysis with TATOE 5.1 Categorization schemata In order to enable examination of the correspondence between linguistic realization and function, we used different categorization schemata for our analysis: a schema for basic part of speech (PoS) category information, a different one for art domain-specific information, and a separate one for particular SFL lexicogrammatical features. Prior to being imported in TATOE the texts had been tagged we have used Brill’s tagger (Brill 1992) for this purpose and the PoS tagged output has then been imported in TATOE with the PoS categories forming a separate categorization schema. The art domain-specific categorization was used for analysis in order to mark up and classify information about artists, works of art, etc. This schema relates to the general domain knowledge in the Editor’s Workbench application. For the third schema a number of lexicogrammatical features according to SFL (henceforth the SFL schema) were defined, concerning, for example, theme and transitivity, in order to encode relevant text segments. The possibility of having different kinds of information simultaneously and in one application has been advantageous for both discovering and annotating relevant information consistently and relatively fast. The information extracted has been used firstly to empirically motivate the GSP stages for the particular text types and secondly to construct the genre system networks. 5.2 TATOE and its functionalities A general picture of the tool is given in fig. 2: the variety of information presented on the screen is arranged in five separate panes in order to keep corpus texts and information about these texts side by side. These panes are: the main text pane in the middle; the list of texts at the top left and the word list pane underneath it. On the top right there is the list of categories above the list of annotated instances. All the listings, with the exception of the text list, group different kinds of information concerning the words in the corpus, the categories used for mark up and the instances already marked up. <?page no="254"?> 254 Melina Alexa TA T CE: 1 of 16 texts. BD92 *1) word types <10 / 618) l«a styl« Sort Statistics miperuea Qua XvJ XM ömSki ol SO. ; martaafTltem^ .SW»! ««..,-.! ..refet»««...] ...fWffctrtlyjr.J j j ^: suidied/ VBD ilzl I J swovnaas : RcADArtText: S025 --i ! iReADArtTextiHOi; ; iRcADArtTextt Oft« iReADArtTtxt: FW8! iReÄDArttext; TÖ25! iReADArtTextJ AOeci RcADArtTcxt: B003I I i all word types j: strong {4 4 4> j -strong^ {4 4 4} [• iStructural {1 1 1) S ; structural {111} B istructure {5 5 5} I -structuml {2 2 2} g isuuggte {2 2 2} j Stuart {1 1 1} : Stubbs {1 1 1} : StUCCO {1 1 1} istudcnt {3 3 3} I Students (111} 1 Istudents {9 1010} istudies {10 10 10} Iistudio{ir20 20) JReADArtText: F009396 Frink, KHsal>«th (6 Thurlow, Suffolk, 14 Nov 1.930). English sculptor and printmaker. Sh»^S^atthe Guildford School ofArt (1946 - 9) and with Bernard Meadows at the Chetaea School of Art (1949 - 53). Shu has been linked with the postwar school of British sculptors, including Reg Butler, Meadows and Eduardo Paolozzi, though her work is distinguished by her commitment to naturalistic forms and themes. Fnuk's rangs cf sheets includes men, birds, dogs, horses and religious motife. Bird (1952; London., Tate), with its alert, menacing blanr», is typical of her early work in which she concentrated on bronze outdoor sculpture with a scarred surface created by lepeatecfiy coating an armature with wet plaster; each coating ia distressed and broken, eliminating detail and generalizing form. In the iS&Ds Frink's continuing fascination with flight was evident in a series of failing figures and winged men. While living in EV-vnce fnnn ; .9fi? : > > : 973. she began a series of threatening monumental goggled male heads. On reairning : x> England, she focused on the male nude, harre 1-chßstorl, will» mask-like features, attenuated limlis and a pitied surface, for example Running man (1976; Pittsburgh, PA, Carnegie Inst., Mus. A.). EVink'fc s<; idphm; ; and her ihhogruphs and aiohiuge ervated ae t.ax/ k i: : ue: ra { .jone, draw on archetypes expressing masculine strength, struggle and aggression. ! “*? H : • Scham« Categories: *f: ; cauial-tlieme *f: : existential sf: ; manner -theme if: : markrdTherae *f: : mod «1-adjunct sf: : role theme sf: : spatial-theme ^sf: . temporal-theme sf: ; textual-theme sf: ; unmarked Theme L- A few weeks later [n: t; A few v; eeks later [u t: a good chair (unrnari: t: a group of Belgian ai; u A painting of this nil; t: A sociable, active roa: t: After a few months 1 • t: After a few months j; i. After Ddaroche do» j c After Delarocitedo»; t: After his victory {ten I t: After his victory {ma | t: After producing earn | l After producing earn j Fig. 2: The TATOE user interface In general, the functionalities of TATOE concern set up and maintenance of the categorization schema (or schemata) to be used for the analysis, mark up, extraction of frequency of occurrence or performed mark up information, viewing text in context and obtaining statistical information. 5.2.1 Schema set up As mentioned, three schemata have been defined and used for analysis. Both the domain-specific and SFL schemata have been set up and developed specifically for (and during) the analysis. In contrast, the PoS schema was not developed specifically for the analysis, but rather it has been imported together with the PoS mark up of the corpora in TATOE. In general, a schema in TATOE may be modified and refined by adding, deleting, renaming, and merging categories, as well as by changing relations holding between schema categories. This holds both for schemata which have been developed within TATOE, and schemata which have been imported. The advantage of this possibility is that a schema need not be fully developed at the beginning; it may be developed further and modified during the analysis. <?page no="255"?> Text Type Analysis with tatoe 255 5.2.2 Selection and mark up When using TATOE it is possible to select a text (point and click selection of the items of the text list), a word (point and click selection of an item of the word list or a word on the main text pane), or a word string (by mouse clicking on a string of words on the main text pane). Searches in the corpus and concordance presentations require either on-text selection or selection of a word from the word list or of a category from the schema category listing. On-text selection from a concordance list view is also possible. Furthermore, selection and alternation of the schema used for mark up is also possible by choosing the appropriate menu option. A word or a string of words may be marked up more than once both according to a categorization schema and according to different schemata. For the particular genre analysis all words have been marked up at least once since both corpora had been tagged according to PoS. All further mark up is added to the existing one. A marked up word or string of words is indicated by means of using different colors. Switching from one schema to another within TATOE automatically changes the displayed color mark up according to the selected schema. 5.2.3 Viewing Existing mark is shown either (as already mentioned) by means of color on the text pane, or as a listing in the Marked instances pane. Furthermore, the analyst may view mark up in the following ways: as a list of occurrences in their context, i.e. concordance lists; as statistical tables containing mark up frequency of occurrence information (with each category together with the total number of word tokens or of types assigned to it); and as a graph with all the relations holding between the schema categories defined represented in a semantic network form. An example of the latter is shown in fig. 3, where the general category „ideational theme“ (of the SFL schema) is displayed graphically in the net editor display of TATOE with its narrower categories. Further developing, correction, refinement of a schema is performed in the graphical net editor where categories can be deleted, added and renamed. 5.2.4 Concordance lists For analysis purposes information about the context in which specific words or word strings occur is necessary in order to determine typical patterns of usage. Concordances yield such information. What is additionally, and often, needed in analysis is a means to enrich the search (and selection) for a concordance according to existing mark up; for instance, not all instances of the <?page no="256"?> 256 Melina Alexa word „studied“, but only those which are past tense form. TATOE provides three different possibilities for concordance lists: - The typical concordance list following selection of a word or a string of words, whereby in TATOE the number of characters for the left and right context of the selected word is determined by the user on the fly. - The category concordance list with all annotated instances according to one (or more) selected categories. An example of this is given in fig. 4, where the concordance display contains only instances which have been marked up for the domain-specific schema category „artist“. - A concordance list is provided after having selected a text segment together with its annotation. An example for the latter is the case where different concordance lists will be shown for the word „used“ depending on whether the word has been selected together with its annotation as a past participle (having a VBN tag) or past tense form (having a VBD tag). Fig. 3: Network view of the ideational theme schema category 5.2.5 Frequency of occurrence information Frequency of occurrence information is supplied in the word lists which display each word type of the corpus together with its frequency of occurrence information; frequency of occurrence is shown in relation to number of paragraphs and numbers of texts: in fig. 2 the word list item "studied{16,18,20}“ indicates that the word „studied“ has an overall frequency of occurrence of 20, and it appears in 18 paragraphs in 16 texts of the whole corpus. Another <?page no="257"?> Text Type Analysis with TATOE 257 kind of frequency of occurrence information concerns the already performed mark up, where lists of schema categories with frequency of occurrence are provided. Word lists and schema category lists can be sorted alphabetically, or by the highest frequency of occurrence in the whole corpus, or according to the number of paragraphs or texts in which an item occurs or by the highest frequency of a token in relation to the number of paragraphs or texts in which it occurs. The word list in fig. 5 is sorted according to the most frequent words in one text; interestingly, in such a list words whose general frequency is not high, such as artist names, appear close to the top, since they are frequently used within a single text. The example in the figure highlights the occurrences of the proper noun „Suvee“. In fact, this is a characteristic lexical cohesion practice in biography texts where the general tendency is for the name of the artist to be repeated instead of using pronominal reference. •Wipfel —SCM—} . W! €? , f .ÄSSSÄSLvkJ ; .-.„«S&SK&J .„ÄSKfrSUJ MtKlj J ^TatoeText: '8ÖÖ38l: Taioetext: 80Ö32S: TatoeText: TatoeText: latoeText; TatoeText: TatoeText: TatoeText: TatoeText: TatoeText; TatoeText: 8002211 BQ025t: AOOOtli AOOOi; : 800321; 0OO32(! B00361: C0046t: 80023? : terms Caulfield/ NNP ft Society/ NN 3 6( Her/ PRPSIl 3 61 space/ NN 15 5 51 exhit>ition/ NN15 5 : small/ UJS 5 5! may/ MD {5 5 5{ howewer/ R8lS5 5{ i often/ R8lS 5 SI ife/ NN 14 5 5| Three/ CD 14 5 5! SCuiptor/ NN 14 5 51; became/ VBD 14 5 5j: made/ VBN 14 5 SI : Although/ IN 14 5 SI mportant/ JJ J4 5 51: nciuding/ VBC 14 5 i Tttomas/ NNP 14 5 5; subject -matter/ NN: hen/ R814 5 51 sem: : artist Occurs 149 times in 40 texts (75 paragraphs) TatoeText: BO0329O %>•.<«Kr., ? »xo.v (b 3 March 1631; d at set, 16 Nov 1672). Dutch painter and draughtsman Ho u rise v/ su the son of Walloon parents, iXAXVfjXi and An«« ic r-nrsx. A teatiroony of 23 July 1658 states that... ... There u nothing to confirm a view of the early 20th-century »chalars Bode, Biedius and Vilenlincr that Boursse was a pupil of Rembrandt, although thetvo artists may have had some contact, once Rembrandt lived near Jan in Asjurttailws. According to an inventoiy of 24 November 1671, Jan collected a number of paintings, drawings and etching* by Rembrandt. Esn« entered the / ««»«ad«« Guild of St Luke about 1651 and shortJy thereafter travelled to ixxti? ; he returned to ... — are more tolemn and his painting technique haa a rougher surface lecture and darker tonality. Most of Bourtse's paintings appear to have been produced in the Ute 1650». Throe are dated: Woman cooking beside on unmade... .„ Ward, Ax<«o d>x«, 19 May 1934) and Interior Ariih woman at a spinning wheel (1661; Zu«»«xd««, Lsadas drew up a will in 1661 before embarking as a midshipman in the service of the Dutch East India Company. ... ... of Ceyio«, aswdl as a view of the Cape of Good Hope, these works are listed in Jan's inventory of 1671. Lsdus returned to A*»»* 4«» on 18 July 1663. On 24 October 1672 he went on a second trip for the East India ... * V-, i^Wv. <i, onuu. Schema Categories: ”sefn: Tart-soctety' y sem: : artist sem: ArtStyle sem; : city sem: : country sem; : domain w. sem: : foreign-w sem: : museum sem: ; non-artist sem: : person sem: : place sem: : royal sem: : workOfArt i c. abstraction farlStyl c: academies libres |d I c: academies libnes |f.' \ c: ACCB Imuseuml I c: Achilles among the : c: Adami. Valerio I c: Adriano Fiorentino I c: Adriano (artistl ! c: Albert, the Prince C ; c: Alesso Baldovinetti ( c: Alfred Chalon I c: Alfred Edward Cha j c: Amadeo iartist) i c: Amsterdam (cityl s c: Anne de Forest j c: Antönio Teixeira & j c: Arthur Cope j c: Association Intern« .Ml.: .xww.wwnwi.: Fig. 4: Type concordance list of all marked up instances of the category „artist“ Finally, frequency of occurrence of the performed mark up can be shown graphically in TATOE as tables sorted according to categorization schema and containing each category with the number of marked up instances according to it, as shown in fig. 7. The information contained in these tables can vary depending on whether the frequency of occurrence for each category is calculated according to word types or word tokens. <?page no="258"?> 258 Melina Alexa 6. Analysis with TATOE In the following sections we present some of the results obtained which illustrate how TATOE has supported genre analysis. The presentation is organized according to the bottom-up and top-down methodological directions for analysis (section 3). 6.1 ‘Bottom-up’ text type analysis Analysis has shown that specific domain and foreign words, as well as proper names and numbers, have high frequencies of occurrence in both corpora. The possibility to have different kinds of linguistic information available simultane- Fig. 5: Word list sorted according to token/ text frequency of occurence ously, such as PoS information with tags for proper nouns, foreign words and numbers with domain-specific markup, has been crucial for determining this. In general, the frequency of usage of domain-specific vocabulary can be indicative for the user type for which the texts are written. The very frequent usage of specialized vocabulary often makes the texts difficult to understand for the layman. For both text corpora the usage of history, archeology, and art specialized vocabulary leaves no doubt about the particular field and tenor (see section 1) dimensions of these text types. The texts are written for specialists with the assumption that the readers have knowledge of the specialized vocabulary used. <?page no="259"?> Text Type Analysis with TATOE 259 Frequency of usage information about proper nouns is useful if related to the semantic categories denoted by the specific proper nouns. As expected, one can see that the frequency of occurrence of proper nouns for specific geographical items is shown to be much higher in the archeological site texts in comparison with the biography ones. Biography texts contain, again as expected, high word frequencies for person proper nouns. What is worthwhile, though, about this kind of information, is that firstly we can establish which participants, together with which processes and under what circumstances can be expected. Secondly, it provides pointers for determining the GSP stages. The situation is similar to information gathered about the semantic types, to which the numbers occurring in the texts belong. Information about the different semantic types these belong to, e g. numbers used for dimensions or dates, has been used to distinguish between archeological descriptions and biographies and between different text parts. Fig. 6 shows one of the possible GSPs specified (based on the textual data) for the archeological site descriptive texts; the named parts stand for a characteristic stage of the global structure for a text belonging to the particular text type. Characteristic of every single archeological site text is that numbers are mainly used to denote distances, dimensions and time reference, whereas only the time reference is characteristic of the biography texts. The INTRO stage typically provides time and distance information, the FINDS stage may contain dimensions and time information, whereas numbers are seldom used for the SIGNIFICANCE stage. Frequency of occurrence information related to the semantic types it denotes, assists in determining different parts of text which point towards GSP stages. It seems almost trite to claim that in texts about art, lexical items referring to artists, paintings, sculpture, architecture, time and historical periods are frequent. It is interesting, however, once this information is encoded and obtained, to see whether there are systematically recurring patterns of groups of such lexical information and, if so, how these are distributed in texts. By mak- <?page no="260"?> 260 Melina Alexa ing use of the different concordance possibilities in TATOE we found that historical period words and place proper nouns are used predominantly in the introductory GSP (i.e. INTRO) stage of the archeological texts. Specific domain words such as art style concepts are part of the FINDS description GSP stage for the same text type. A final point to mention, concerns how lexical statistical information can indicate lexicogrammatical preferences for the given corpus of texts. One of the findings was that the frequency of occurrence of the PoS categories for prepositions and adverbs in the initial position of a clause is very high. Concordance lists containing all the relevant instances have shown high frequency of usage of sentence initial prepositional phrases and adjuncts denoting temporal and spatial information. This led us to examine thematic development preferences of the biography and archeological site descriptive texts more closely (see section 6.2). 6.2 ‘Top-down’ text type analysis This methodological direction for analysis has focused on lexicogrammatical choices, some of which may have been indicated by the analysis of the previous analysis step. For reasons of space we discuss only thematicity here. The thematicity choices discussed are marked-unmarked thematicity, ideational, interpersonal, textual themes, as well as the ideational temporal and spatial themes. Before we proceed further an explanation about the terminology used in SFL with regards to theme is necessary. Clauses in SFL are analyzed along functional dimensions, namely experiential, interpersonal and textual. Along the textual dimension clauses are analyzed into New-Given and Theme-Rheme. As defined in Halliday (1985) theme is the element which serves as the point of departure of the message and it is that with which the clause is concerned. This definition separates theme from the notions of Given and New. The realization of theme in English is predominantly its position and its intonation and, as a general rule, theme can be identified as the first element which comes in the first position in a clause. The rest of the clause is the rheme. A number of themes are distinguished depending on whether their function is interpersonal, ideational, or textual; typical ideational themes are spatial, temporal, causal, manner themes, typical interpersonal themes concern combinations of vocatives or modality markers, and typical textual themes are combinations of conjunctions or conjunctive adjuncts. Another distinction is made between unmarked and marked themes. Generally speaking, the mapping of the subject of a declarative clause on to the theme position is an unmarked theme and <?page no="261"?> Text Type Analysis with tatoe 261 anything else other than the subject which maps on to the theme position is a marked theme. We have used TATOE as a means for investigating (i) how lexical statistical information can indicate the thematic preferences and (ii) in what way statistical data concerning the frequency of usage of lexicogrammatical features can support text type description. With regards to the former point of investigation, examination of the frequency of occurrence and textual distribution of prepositions and adverbs as mentioned has shown that the frequency of occurrence of both of them in sentence initial positions is high. Obtaining a concordance with all instances of prepositions and adverbs at the beginning of a clause shown in context, has clearly demonstrated that a large number of these instances introduces temporal and spatial marked themes. For example in biography texts temporal marked themes of the kind „In 1943“, „After the end of World War I“, etc. are very frequent. Moving on to the second point of investigation, i.e. how statistical data concerning the frequency of usage of lexicogrammatical features can support text type description, theme positions have been marked up according to different types of ideational thematicity, e g. spatial, temporal, manner, etc., and marked-unmarked themes. We have found that there is a high frequency of usage of marked themes, with the ideational spatial and temporal themes being the most frequent. Temporal themes have been found to be more frequent in biography texts, whereas the marked theme positions in archeological site texts can be both spatial and temporal themes. A category type statistical table showing graphically the frequency of encoded themes in the biography texts corpus is shown in fig. 7. The occurrence range of the type statistics table, according to the SFL schema, is automatically scaled and in fig. 7 it is scaled to 200. The total of annotated themes is 266. There are 96 marked Theme and 78 unmarked Theme positions and the remaining are subcategories of ideational theme. The analysis has shown that almost all 96 marked Theme positions are also annotated ideational theme positions (total of 92). We have investigated how these different kinds of thematicity are distributed in each text and this has provided us with additional information for the determination of the GSP stages. For instance, temporal themes are used almost in every biography text in order to report on the artist development of the described person. Interestingly, marked thematicity is not a typical characteristic of the archeological site texts. Although information about time and especially space is frequently given, this is not the case in marked theme positions. The typical thematic development of archeological site descriptive texts is such that once a new theme has been introduced the topical theme of the next clause is part of the rheme of the previous clause. This is such, so that the <?page no="262"?> 262 Melina Alexa part of the clause indicating the ‘participant’ does not remain as the topical theme for a long stretch of discourse, a feature which contrasts with the thematic development tendency in the biography texts. concept name iraitsdThetne unmarkedThemi tempcraMheme tWtuä-the#» spatiä-ttieme mannef-theme Fig. 7: Statistical table displaying marked up theme instances according to the sfl schema 7. Conclusions and future work TATOE can support genre analysis by means of providing flexibly and fast information about word usage and frequencies of occurrences, and at the same time enabling mark up according to different categorization schemata. What is beneficial is the integration of corpus exploration and mark up functionalities in a single working environment. The analysis has shown that the data model of TATOE, i .e the representation of textual data, schemata which are used for mark up, and the relations between schema categories, is crucial for the flexibility it offers. A truly useful functionality would be to have cross genre or cross corpora presentations of the mark up. This is part of the current. A necessary extension related to the functionalities of TATOE is the further addition of search capabilities of complex formal patterns for extraction of collocational information in a more flexible way. The performance of the tool and its applicability and usability for general text analysis has to be tested for the size of corpus it can handle, as well as for working with parallel multi-language corpora and the ways the information need to be presented and sorted according to language and not only according to corpus and text. <?page no="263"?> Text Type Analysis with TATOE 263 8. Acknowledgements TATOE has been designed and implemented collaboratively with Lothar Rostek. I would like to thank Lothar Rostek, John Bateman and Archana Hinduja for reading and commenting on earlier drafts of this paper. 9. Literature Alexa, Melina/ Rostek, Lothar (1996): Computer-assisted corpus-based text analysis with TATOE. In: Book of Abstracts of the 1996 Joint Conference of the Association for Literary and Linguistic Computing and the Association for Computing in the Humanities (allc/ ach '96). Bergen. P. 11-17. Alexa, Melina/ Rostek, Lothar (i. prep ): tatoe: Text analysis tool with object encoding. Technical Report. Arbeitspapiere der gmd, gmd/ ipsi. Darmstadt. Bateman, John A./ Matthiessen, Christian M. I. M./ Nanri, Keizo/ Zeng, Licheng (1991a): The re-use of linguistic resources across languages in multilingual generation components. In: Proceedings of the 1991 International Joint Conference on Artificial Intelligence 2. Sydney. P. 966-971. Bateman, John A./ Matthiessen, Christian M. I. M./ Nanri, Keizo/ Zeng, Licheng (1991b): Multilingual text generation: an architecture based on functional typology. In: International Conference on Current Issues in Computational Linguistics. Penang, Malaysia. P. 342-360. Bateman, John A. (1994): Variations of discourse functions and discourse representations according to context: the Dandelion project. In: Varghese, Kadamula/ Pfleger, S./ Lefevre, J. P. (eds ): Advanced Speech Applications. European Research on Speech Technology. Research Reports esprit 1. Berlin. Brill, Eric (1992): A simple rule-based part of speech tagger. In: Proceedings of the Third Conference on Applied Natural Language Processing, acl. Trento. P. 152-155. Halliday, Michael A. K. (1985): An Introduction to Functional Grammar. London. Hasan, Ruqaiya (1978): Text in the systemic-functional model. In: Dressier, Wolfgang U. (ed ): Current trends in text linguistics. Berlin. P. 228-246. Mann, William C./ Matthiessen, Christian M. I. M. (1985): Demonstration of the Nigel text generation computer program. In: Benson, James D./ Greaves, William S. (eds ): Systemic Perspectives on Discourse 1. Norwood/ New Jersey. Martin, James R. (1992): English text: systems and structure. Amsterdam. Matthiessen, Christian (1993): Register in the round. In: Ghadessy, Mohsen (ed ): Register Analysis: Theory and Practice. London. P. 221-292. Paris, Cecile L./ Scott, Donia (1994): Stylistic variation in multilingual instructions. In: Proceedings of the Seventh International Workshop on Natural Language Generation, Kennebunkport, Maine, USA, June 21-24, 1994. Kennebunkport, Maine, USA P 45- 52. <?page no="264"?> 264 Melina Alexa Passonneau, Rebecca J./ Litman, Diana J. (1993): Intonation-based segmentation: Human reliability and correlation with linguistic cues. In: Proceedings of the 31st Annual Meeting of the Association for Computational Linguistics. Columbus. P. 148-155. Rostek, Lothar/ Möhr, Wiebke (1994): An editor's workbench for an art history reference work. In: Proceedings of the ACM European Conference on Hypermedia Technology 1994, Edinburgh. New York. Rostek, Lothar/ Möhr, Wiebke/ Fischer, Dietrich H. (1994): Weaving a web: The structure and creation of an object network representing an electronic reference network. In: Proceedings of Electronic Publishing (EP) '94, 6/ 4, p. 495-506. Teich, Elke/ Bateman, John A. (1994): Towards an application of text generation in an integrated publication system. In: Proceedings of the Seventh International Workshop on Natural Language Generation, Kennebunkport, Maine, USA, June 21-24, 1994. Kennebunkport, Maine, USA. P. 153-162. Vander Linden, Keith/ Martin, James H. (1995): Expressing rhetorical relations in instructional text: A case study of the purpose relation. In: Computational Linguistics, 21/ 1, p. 29-57. March 1995. <?page no="265"?> Rolf Todesco Effiziente Informationseinheiten im Hypertext 1. Einleitung Hypertexte mögen praktischen Nutzen haben was, falls es auch in diesem Band nicht getan wurde, noch zu zeigen wäre -, ich will mich mit ihrem theoretischen Nutzen befassen und dabei quasi in Kauf nehmen, dass praktische Anweisungen zum Schreiben von Hypertexten anfallen. Indem wir Hypertexte produzieren, wird uns neu bewusst, was Text überhaupt ist, und wozu wir Text verwenden (können). Kommunikation mittels Hypertext kann mit dem traditionellen Sender-Empfänger-Modell nicht adäquat beschrieben werden. Die Informationsmetapher, also die Vorstellung, dass mit Text Inhalte übermittelt werden, wird als Beschreibung trivialer Verhältnisse entlarvt. Hypertext revolutioniert unsere Auffassung von Kommunikation, indem durch Hypertext die Unterscheidung zwischen Autor und Leser im hegelschen Sinne aufgehoben, also auf eine neue Stufe gestellt wird. Hypertext ist politisch revolutionär, weil er wie die Enzyklopädie in der Aufklärung und die übersetzte Bibel in der Reformation dem Anspruch auf Text statt auf Lehrmeinungen und Interpretationen gerecht wird. Die Enzyklopädie, ein seiner Struktur nach noch schwach entwickelter Hypertext, ist keine Erfindung der Aufklärung, aber sie hat die Textform, die wir mit Aufklärung, also mit dem Kampf gegen Dogmen und mit moderner Wissenschaft schlechthin assoziieren. Ich erläutere zunächst genauer, was Hypertext ist, das heisst, weshalb Hypertext mehr mit Text als mit Computern und Multimedia zu tun hat. Ich diskutiere dann, welche Form von Lesen mit Hypertexten korrespondiert, respektive dass Lesen durch Hypertext auf einer neuen Ebene als Subjekt-, statt als textbestimmter Akt erkennbar wird. Schliesslich frage ich danach, wie Hypertexte konstruiert sein müssen, damit sie das Lesen, das sie provozieren, effizient unterstützen. 2. Hypertext Hypertexte sind von Multi und Media unberührt - Konglomerate von auf sich verweisenden Textteilen, die im Wissen konstruiert werden, dass der Leser selbst entscheidet, was er wann und in welcher Reihenfolge lesen will Je- <?page no="266"?> 266 RolfTodesco des Telefonbuch besteht aus Textteilen, die der Leser nach seinem Gutdünken konsultiert. Und jedes Lexikon hat ein Verweissystem, das dem Leser Hinweise auf semantische Nachbarschaften gibt, die er lesen kann, wenn und wann er will. Hypertexte werden auf Hypertextmaschinen, also auf Computern mit entsprechenden Programmen, hergestellt und gelesen, weil es solche Maschinen gibt und sie sehr praktisch sind. Aus demselben Grund verwenden wir Textverarbeitungen für konventionelle Texte, ohne dass die Texte dadurch an inhärenter Qualität gewinnen. Was mit Computern als Trägern von Hypertexten praktisch gewonnen wird, ist das effiziente Nachschlagen von bestimmten Textteilen und das Verfolgen von Verweisen in andere Textteile. Die Textteile eines Hypertextes heissen Karten. 1 Hyper-Karten sind wie alle Texte Mengen von grammatikalisch geordneten Zeichen, die zu Wörtern, Sätzen, Abschnitten usw. zusammengefasst sind, und die innerhalb des Hypertextes als konstruktiv festgelegte Ziele ausgezeichnet sind, auf welche der Hyperleser von anderen Karten verwiesen wird. Jeder Hyperverweis zeigt auf eine Karte. Text: Hyperkarte Textträger: Karteikarte Abb. 1: Hyperkarte und Karteikarte Die Kartenmetapher wird oft missverstanden. Sie wird von den Hypertextmaschinenherstellern verwendet, um die Organisation ihrer Softwareprodukte anhand von Karteibeispielen wie Agenden und Adressverwaltungen anschaulich zu machen. Probleme, die man früher mit Karteien löste, löst man auf dem Computer schon lange mit Schablonen, die Datenbankinhalte benennen. Aber Hypertextkarten sind weder Schablonen noch Textträger wie Karten oder Buchseiten, sondern Texteinheiten, die im Unterschied zu Karteikarten kein Format und keine textexterne Sortierordnung haben. Natürlich kann man mit den gängigen Hypertextmaschinen auch Karteien simulieren, aber dann schreibt man keinen Hypertext, sondern eine Karteienapplikation etwa im Sinne einer Adressverwaltung. i In der Hypertextsoftware Toolbook heissen die Karten Seiten, was an der Metaphernlogik nichts ändert, weil die Seiten als gebundene Karten verstanden werden. <?page no="267"?> Effiziente Informationseinheiten im Hypertext 267 In Hypertexten sind die Verweisadressen auf andere Karten implizit, das heisst der Leser kann sich die gewünschten Karten durch Anklicken einer Maschinenfunktion, die mit dem jeweiligen Verweisausdruck verbunden ist, auf den Bildschirm holen. Diese Funktionen werden Links genannt. Das entscheidende Konstruktionsmerkmal für Hypertexte sind aber die Karten, nicht die Links. Die Links helfen lediglich, die Karten effizient zu erreichen. Wer in einem Hypertext schreibt, muss sich für Karten entscheiden, die Links sind dann nur noch logische Folgen. Weil die Hypertextteile durch „Links“ verbunden sind, gilt auch der CIA-Agent Vannevar Bush, der bereits in den 40er Jahren ein Archivsystem mit Links auf Mikrofilmen vorgeschlagen hat, als einer der Erfinder von Hypertext. Und weil Hypertextmaschinen mit Computermäusen fünktionieren, wird modischerweise fast jede cursorsensitive Bildschirmoberfläche als Hypertext bezeichnet und dementsprechend der Computer-Maus-Erfinder Douglas Engelbart naheliegenderweise zu den Vätern des Hypertextes gezählt, da man mit der Maus eben auch in einem Hypertext Bildschirmfelder anklicken kann. Engelbart hat in der Tat auch die erste eigentliche Hypertextmaschine vorgestellt Die Namensgebung NLS (oN Line System) zeigt aber deutlich, dass er an der Maschine, nicht am Text interessiert war. So müsste man natürlich alle, die irgendetwas Relevantes zum Computer beigetragen haben, auch in die Ahnenreihe von Hypertext stellen. „Links“ und „Mäuse“ sind Erfindungen, die auch ganz unabhängig von Hypertext genügend Sinn machen, schliesslich dient die Maus ganz generell der Cursorsteuerung, während jeder hinreichend grosse Computerdialog auf Links zu Datenbanken beruht. Dann aber gäbe es auf Computern nur Hypertext, was gleichviel ist wie kein Hypertext. 2 Und wenn wir schon bei den Erfindern sind: dass Ted Nelson, der in den 60er Jahren begonnen hatte, ein Literatur-Archivierungssystem auf dem Computer zu entwickeln, den Ausdruck „Hypertext“ prägte, gehört auch zur Erfindergeschichte, die nicht recht weiss, zu welcher Idee sie Geschichte ist Auch Xanadu, das Projekt von Nelson, beschäftigt sich nicht mit Text, sondern mit einer „network storage engine“, einem „file-server programm for linked compound documents“ (Nelson 1987). Wo Hypertext wirklich erfünden wurde, ist so unbekannt, wie wo die erste Programmiersprache vom Himmel gefallen ist. Als die technischen Voraussetzungen vorhanden waren, war in beiden Fällen auch die Sache und vor allem ein völlig willkürlicher Name da. Auf die nicht erstaunliche Tatsache, dass es keine Geschichte über den Anfang der Programmiersprache gibt, obwohl die Programmiersprache die wohl wichtigste Komponente der Computer ist, habe ich schon früher hingewiesen (u.a. Todesco 1992, S. 67). Vernünftigerweise sollte man auch keine Erfinder von Hypertext erfinden. Entdeckt, das heisst wirklich erfünden, wird 2 Keil-Slawik (1990, S. 47ff.) hat die Entwicklung der Hypertext-Maschine unter dem Titel „Meilensteine der Systemgestaltung“ ausführlich beschrieben. Er ist aber auch an der Maschine, nicht am Text interessiert. <?page no="268"?> 268 RolfTodesco Hypertext erst allmählich, nämlich als neue Form der Sprache und als neues Paradigma der Kognitionstheorie, was ich in den nächsten Kapiteln genauer diskutieren will. 3. Hyper„texten“ als Leserautor Das „Lesen“ bleibt auch im Hypertext ein sequentieller Prozess. Die jeweils konkrete Textsequenz entsteht aber erst im Akt des Hyperlesens, in welchem eine vom Hyperleser ausgewählte dissipative, an den Akt des Lesens gebundene Textstruktur geschaffen wird. Die Autorenschaft im herkömmlichen Sinne ist also nur noch in bezug auf Textelemente gegeben. Erst im „Lesen“ entsteht der Text, den der „Leser“ liest. Der „Leser“ wird quasi zum Schrift- Um-Steller des Textes, den er aus den Textteilen des Schriftstellers realisiert, und mithin wird der „Leser“ natürlich auf einem qualitativ neuen Niveau mitverantwortlich für das, was er liest. Der „Leser“ sucht sich im Text die Stellen, die mit seinen aktuellen Bedürfnissen korrespondieren, er wird dadurch zum Hyperleserautor oder zum Hypertexter, in welchem die Unterscheidung zwischen Autor und Leser im hegelschen Sinne aufgehoben ist. Mithin wird in der Schrift nachgereicht, was der Schriftsteller Brecht auf das Radio abschieben wollte: die Wiedereinsetzung des Rezipienten als Produzent (Schmitz 1996, S. 13). Wenn wir uns heute beim Lesen ohne schlechtes Gewissen dabei beobachten, dass wir kaum einen längeren Text, geschweige denn ein ganzes Buch sequentiell durchlesen, dann wissen wir eben durch Hypertext einsichtig geworden, dass konventionelle Texte keine leseradäquate, sondern eine lehr(er)adäquate Form haben. Konventioneller Text beansprucht durch seine Form die Entscheidung, was der Leser in welcher Reihenfolgen lesen müsste. Konventioneller Text eignet sich deshalb, wenn der Autor weiss, was wirklich ist, und was der Leser davon wissen muss, also fürs Unterrichten oder genauer für erzieherisches Abrichten und für triviale Literatur. Nicht ganz zufällig ist die Bibel das Buch der Bücher. Die Textelemente eines Hypertextes bestimmen nicht, was der Leser als nächstes liest. Sie halten im Unterschied zu sequentiell geschriebenen Texten wie etwa jenem, den Sie gerade lesen die dem Benutzer „aufgezwungene Sequentialität“ (Keil-Slawik 1990, S. 167) möglichst gering. Im Lexikon liest ein aktiver Leser, jemand, der eigene Fragen hat und selbst entscheidet, was ihn interessiert. Und wie in einer Korrespondenz, ist bereits das zweite Textstück, das gelesen wird, primär vom Leser des ersten Textstückes und nicht vom Textstück selbst abhängig. Denn wüsste man, wie der Leser das erste Textstück einer Korrespondenz deutet, gäbe es nichts zu korrespondieren. Und <?page no="269"?> Effiziente Informationseinheiten im Hypertext 269 wüsste man, welche Hyperkarten der Hyperleser als nächste liest, würde man diese Texte in die aktuelle Karte und mithin konventionellen Text schreiben. Radikal: Natürlich ist auch das erste Textstück eines Hypertextes das Resultat einer nicht im Text begründbaren Entscheidung. Jeder Anfang liegt in der Geschichte des Anfangenden. Wo ich ein Lexikon aufschlage, bevor ich mich im Verfolgen von Verweisen darin verliere, hat nichts damit zu tun, was im Lexikon steht. Wo ich beim Arbeiten mit dem Computer das erste Mal Hilfetexte, die endlos nach weiteren Hilfetexten verlangen, lese, hat mit diesen nichts zu tun. Und schliesslich beobachten wir uns schmökernd oft genug dabei, einen Roman irgendwo zu öffnen und ein bisschen anzulesen etwas, was uns Okopenko (1970) mit seinem hypertextartigen Lexikon-Roman sogar lange vor dem Hypertextboom sehr nahelegt. Hypertexte haben auch logisch keinen Anfang und kein Ende, da von jeder Karte auf andere Karten verwiesen wird. Die einzelnen Briefe einer Korrespondenz bilden zwar per Datierung sehr wohl eine geordnete Reihe, aber eben nur im Nachhinein. Wenn sie geschrieben sind, sind sie ein Protokoll eines Kommunikationsprozesses, in welchem ein Leser des Briefwechsels beobachten kann, welche von den in der Kommunikation möglichen Textseqenzen im konkreten Falle realisiert wurde. Für den nachvollziehenden Leser mag sich innerhalb der Korrespondenz auch eine inhaltlich zwingende Logik ergeben, aus den einzelnen Briefen ist aber nie ersichtlich, was in den folgenden Briefen steht. Genau gleich verhält es sich mit den in einem Hypertext wirklich gelesenen Texten. Die Textelemente eines Hypertextes bilden lediglich ein Kontingent wirklicher Texte. Wenn aber der Leser über den Text entscheidet, verliert der Text den Charakter, Mitteilung oder Mittel einer Mitteilung zu sein. In diesem Sinne untergräbt Hypertext die hirn(physiologisch)verbrämte Auffassung der Kognitivisten, Kommunikation diene der Übermittlung von Information im Sinne von allenfalls interpretationsbedürftigen Inhalten. Eine Art Kommunikation findet vielmehr im Leser statt: Es ist seine eigene Energie, mit der er die Irritationen, die der Text in seinen Sinnen auslöst, kompensieren muss, um sein Selbst oder die Organisation seiner selbst aufrecht zu erhalten. Hypertext zwingt uns über die Konstruktion und die Funktion von Text neu nachzudenken. <?page no="270"?> 270 RolfTodesco 4. Die Konstruktion von Text Wenn Text nicht mentalistisch abgehoben, eine „(schriftlich fixierte) im Wortlaut festgelegte Folge von Aussagen“ (LexiRom 1995), sondern ein von Menschen intentional hergestelltes Produkt ist, kann man nicht nur nach seiner Wirkung, sondern auch nach seiner Gegenstandsbedeutung (Holzkamp 1976, 5. 25fF.) fragen. Wer Text produziert, mag zwar einen von Menschen interpretierbaren Verweis intendieren, aber er konstruiert einen physischen Gegenstand, also etwa eine Graphitkonstruktion auf Papier, die wir als Artefakt auffassen können, ohne uns dafür zu interessieren, was der Text für wen bedeuten soll. Text heisst dann jede durch eine Grammatik (Chomskygenerator) generierte Menge von Zeichenketten, unabhängig davon, wozu wir sie verwenden. Abstrakt, als Texte sind sich ein Computerprogramm und ein Liebesbrief gleich. Die Gegenstandsbedeutung von Text liegt nicht in deren Verwendung und ist nicht eine irgendwie geartete inhaltliche Bedeutung, die mittels Text übermittelt werden soll, sondern die Bedeutung des gegenständlichen Textes selbst, also seine gegenständliche Funktion im übergeordneten Prozess. Abb. 2: Textbedeutung und Hypertextrezeption Als Artefakt füngiert Text als Menge von Schaltern, mit welcher wir die Signale, etwa am Graphitpixelmuster gebrochenes Licht, die ins Auge des geneigten Lesers kommen sollen, steuern (Todesco 1995, S. 685fF). Die Grammatik bestimmt durch Produktionsregeln und semantische Bedingungen, welche Pixelmuster als Texte zulässig sind. Die Produktionsregeln von hinreichend grossen Sprachen bewirken, dass wir zwar mit endlich vielen Zeichen unendlich viele Texte erzeugen können, dass aber bestimmte Zeichenketten, bestimmte Wörter und bestimmte Wortgruppen sehr häufig Vorkommen. Deshalb kann man jeden Text als Kombination von typischen und von spezifischen Textelementen auffassen. Als Konstruktionselemente von Text erweisen sich dann nicht Buchstaben, Wörter oder Sätze, sondern die Elemente, die zwar aus Zeichen bestehen, die wir aber nicht mehr konstruieren müssen, weil sie wie Buchstaben und Wörter bereits zur Verfügung stehen. <?page no="271"?> Effiziente Informationseinheiten im Hypertext 271 5. Die Funktion von Text Natürlich sind wir, wenn wir Text erzeugen, nicht an den Reaktionen auf der Retina des Lesers interessiert. Was aber beim Lesen von Texten hinter dem Auge geschieht, ist komplex, von aussen schlicht nicht rekonstruierbar. Auch die kognitivistischste Hirnphysiologie liefert nicht die geringsten Anzeichen dafür, dass wir diese Prozesse hinter den Augen des Lesers von aussen je anders als behavioristisch verstehen könnten: Wir haben das Gefühl, verstanden zu werden, wenn andere Menschen, nachdem sie unsere Texte gelesen haben, etwas tun, was mit unseren Erwartungen in dieser Situation korrespondiert. Wenn der Leser wie eine triviale Maschine fünktioniert, die auf bestimmte Eingaben mit festgelegten Ausgaben reagiert, bestimmen wir mit Text natürlich das Verhalten des Lesers. Wenn wir andere Menschen mit Text steuern, so wie wir Computer mit Programmtext steuern, reagieren diese Menschen eben behavioristisch abgerichtet. Nach v. Foerster (1993a, S. 144ff.) ist Erziehung bis hin zum Militär der Versuch, den Zögling zu trivialisieren, ihn dahin zu bringen, dass er auf Texte in vorhersehbarer Weise reagiert. Wo konventionell geschriebene Texte im Nachhinein in vermeintliche Hypertexte verwandelt werden, geraten diese fast zwangsläufig zu modern aufgemachten, im Grunde aber reichlich überholten (computerunterstützten) Lernprogrammen, in welchen der Lernende sogar häufig nur weiterlesen darf, wenn er bestimmte Zwischenfragen richtig, das heisst im Sinne des Lehrenden, beantworten kann. Dabei wird die Autonomie des Lesers noch mehr zurückgebunden als durch ein Buch, die Qualität von Hypertext also in ihr Gegenteil verkehrt. Das Festhalten am unmündigen Leser, der auf einen wahren Wissensstand gebracht werden muss, äussert sich im Zusammenhang mit Hypermedia im Problem „lost in hyperspace“. „Lost“ ist sehr doppelsinnig: Verlieren nämlich die unmündigen Leser im Text die Orientierung, verliert der Autor die Führung des Lesers. Und eine selbstgewählte Odyssee des Lernenden ist das Letzte, was die Autorität Lehrer gebrauchen kann. Wenn der Leser aber auf Input nicht wie eine triviale Maschine, sondern wie ein komplexes System reagiert, ist Text in bezug auf den Leser eine Intervention mit nicht vorhersehbaren Folgen. Ein komplexes System anzustossen und schauen, was passiert, mag zeitweise sehr lustig, die generelle Intention von Text wird es gleichwohl kaum sein. So muss Text wohl den Autor des Textes betreffen, das heisst, Text wird primär ein Problem des Textproduzenten lösen. Auch wer Text für andere produziert, erfüllt zunächst ein eigenes Anliegen. Wer etwas mitteilt, will etwas mitteilen, auch wenn er es nur mitteilen will, weil er glaubt, der andere wolle es wissen. Hinter jedem Text steht in diesem Sinne zuerst, was der Textproduzent mit dem Text verbindet. Wenn der Text während des Hyperlesens erst entsteht, muss er seine Bedeutung unabhängig davon, was jemand mitteilen will, im Hyperleserautor haben. <?page no="272"?> 272 RolfTodesco Wenn wir mit Text zunächst unsere eigenen Probleme lösen, fragen wir sinnigerweise, was Text für uns ist. Diese Frage muss logischerweise jeder für sich selbst beantworten. Der Leser dieses Textes muss mithin entscheiden, ob er im folgenden das Textelement „ich“ als ich oder als er lesen will. Wenn ich bestimmte Dinge und Zustände in meiner Erfahrung von Umwelt mit bestimmten Texten in Verbindung setze, Texte also als Symbole verwende, helfen die Texte mir, mich an diese Dinge und Zustände zu erinnern, also die damit verbundenen Umweltzustände innerlich zu wiederholen. Texte haben wie alle Gegenstände, die ich herstelle oder manipuliere, auch die Funktion eines materiellen, externen Gedächtnisses (Keil-Slawik 1990, S. 147fF). Ein Flammer etwa erinnert mich unter anderem daran, wie man einen Nagel einschlägt, das materielle Textil aus Graphit mit der Form „Hammer“ erinnert mich an einen Hammer, „Liebe“ erinnert mich an emotionalen Zustände, die ich Liebe nenne. Dadurch, dass ich auch isolierte Textelemente mit Erfahrungselementen verknüpfe, kann ich mit Texten aufgrund von Kombinationen dieser Textelemente Erfahrungen rekonstruieren, die ich unabhängig vom Text nicht gemacht habe oder gar nicht machen kann. Aber natürlich reagiere ich nicht auf isolierte Textelemente, sondern auf Textelemente in Kontexten oder auf Dinge in Konstellationen, wobei meine Stimmungen selbst zu diesen Konstellationen gehören. Texte, die mir früher sehr gut gefallen haben, sagen mir heute eventuell nichts mehr, obwohl sie als Artefakte dieselben Texte geblieben sind Und Texte, die mir sehr gut gefallen, gefallen meinen Mitmenschen bei weitem nicht immer, und ob ich mich von einem Roman fesseln lasse, hat mehr mit meiner Muse als mit dem Roman zu tun. Es wäre also auch aufgrund der eigenen Erfahrung recht naiv zu glauben, dass ein Text an sich als Beschreibung von etwas oder als Anweisung zu etwas vom Textproduzenten unabhängig richtig oder falsch sein könnte. Beurteilen kann ich diesbezüglich nur, ob oder wie gut ich mit einem Text die mit ihm beabsichtigte Wirkung erreiche. Durch den Text, den ich jetzt gerade schreibe, wird mir zunächst aussprechbar bewusst, was Hypertext für mich bedeutet, was mir ohne die materielle Gedächtnisfünktion von Text in diesem Ausmass nicht möglich wäre. Und wenn andere Menschen durch meinen Text eigene Texte produzieren, die sie veranlassen, mit bestimmten meiner Erwartungen zu korrespondieren, dann bedeutet das für mich, dass es Menschen gibt, die mit Text einen Umgang pflegen, der für mich Sinn macht. <?page no="273"?> Effiziente Informationseinheiten im Hypertext 273 6. Die Konstruktion von Hypertexten Texte erinnern mich an das, was sie für mich referenzieren. Texte können insbesondere auch für andere Texte stehen. Das Textelement „Hammer“ erinnert mich unter anderem an das Textelement „Werkzeug, mit welchem man unter anderem Nägel einschlagen kann“. Diese Erinnerung ist nicht davon abhängig, dass man mit einem Hammer wirklich Nägel einschlagen kann, sondern davon, für welche Textelemente das Textelement „Hammer“ für mich unter anderem auch steht, also von meinen semantischen Vereinbarungen zu „Hammer“ Wenn ich sage, eine Hexe sei eine Frau, die zaubern könne, sage ich etwas über meine Textzuordnungen, nicht etwas über die Wirklichkeit. Abb. 3: Verweisstrukturen in Hypertexten Die Verweisstruktur im Hypertext ist offenkundig eine, die Textelemente verbindet. Hypertexte reflektieren die operationeile Geschlossenheit unserer Sprache. Dass wir unsere Aussagen verstehen, zeigen wir unter anderem genau dadurch, dass wir sie paraphrasieren können, also Textelemente durch andere Textelemente „erklären“ (Todesco 1996). Hypertext ist also zunächst eine explizite Vereinbarung darüber, welche Textelemente innerhalb einer gegebenen Grammatik mit welchen assoziiert werden können, mithin so etwas wie ein semantisches Lexikon für Textelemente. Die einfachste Assoziation ist die gegenseitige Ersetzbarkeit der verbundenen Textelemente. So kann ich etwa in einem Text die Definition eines Begriffes anstelle des Begriffes verwenden, ohne dass der Text seine Funktion verändert. Da in der Definition selbst wieder Begriffe mit Erläuterungsbedarf stehen, wird die Verweisstruktur zu einem Netzwerk, das, wenn es eine einheitliche Funktion haben soll, Konsistenz verlangt. Die Konsistenz von Definitionen in einem Hypertext ist also kein Ziel, sondern eine Konstruktionsbedingung, die bei der Textkonstruktion eingehalten werden muss, damit der Hypertext als Einheit brauchbar ist. Natürlich ist die Konsistenz eines aus einem Hypertext gewählten Textes immer die Konsistenz, die dem Leserautor des Textes gelingt. Die Konsistenz lässt sich aber umso <?page no="274"?> 274 RolfTodesco leichter prüfen und intakt halten, je mehr Verweise auf andere Karten die Karten enthalten. Umgekehrt werden Karten natürlich umso übersichtlicher, je mehr Text in andere Karten ausgelagert wird. 7. Der Sinn von Hypertext Ein Hypertext ist umso entwickelter, je mehr Verweise und je weniger Redundanz dessen Karten enthalten. Die Entwicklung eines Hypertextes lässt sich in diesem Sinne als „formalistisches“ Spiel auffassen, wobei die Konsistenz der Definitionen ein formales Kriterium bildet. Das Spiel selbst ist zweckfrei wie Schach oder Mathematik. Man kann es praktizieren wie jeden Weg ohne Ziel. Man kann das Spiel wie jedes formale Spiel von hinreichender Komplexität nicht lehren; mitteilen kann man lediglich die Spielregeln, und wie man vom Schach weiss, ist das in sehr kurzer Zeit getan. 3 Ziel des Spieles „Hypertext“ ist das Isolieren von Textelementen höherer Ordnung, die wir Karten nennen. Dass das Resultat des Spieles, etwa ein Hypertext aus begrifflichen Definitionen, beim Produzieren von Texten nützlich ist, ist fur Hypertext von gleicher Relevanz, wie für die Mathematik die Tatsache, dass wir beim Rechnen mathematische Erkenntnisse anwenden können. Letztlich bleibt unbegreifbar, wieso ein formales Spiel, das durch Regeln zur Manipulation von Zeichen bestimmt ist, praktische Bedeutung haben kann. 4 Das Unbegreifliche sind nicht unsere Texte, das Unbegreifliche sind wir. In Anlehnung an den Wiener Psychiater Viktor Frankl, der von einem seiner Patienten sagte: „Als er aber erkannte, dass er blind war, da konnte er sehen! “ (Foerster 1993b, S. 363), gilt für mich: „Seit ich weiss, dass man mit Text nichts mitteilen kann, kann ich Texte verstehen“. 8. Literatur Foerster, Heinz v. (1993a): KybemEthik. Berlin. Foerster, Heinz v. (1993b): Wissen und Gewissen. (= Suhrkamp Taschenbuch Wissen 876). Frankfurt a.M. Holzkamp, Klaus (1976): Sinnliche Erkenntnis. Historischer Urspmng und gesellschaftliche Funktion der Wahrnehmung. Kronberg. 3 Handelsübliche Hypertextsoftware kann man nach einer einstündigen Einführung prinzipiell handhaben. Die irreführende Kartenmetaphorik zeigt hier ihren guten Grund. 4 Genau diese Frage beschäftigte im sogenannten Gmndlagenstreit der Mathematik eine ganze Generation von Mathematikern, ohne dass eine plausible Erklärung gefunden wurde. <?page no="275"?> Effiziente Informationseinheiten im Hypertext 275 Keil-Slawik, Reinhard (1990): Konstruktives Design: ein ökologischer Ansatz zur Gestaltung interaktiver Systeme. (= Forschungsbericht des Fachbereichs Informatik der TU Berlin 1990/ 14). Berlin. LexiRom (1995): Multimediale Wissensbibliothek auf CD-ROM. Hrsg. v. Microsoft Nelson, Ted (1987): Computer Lib. Dream Machines. (= Tempus Books of Microsoft Press). Redmond. Okopenko, A. (1970): Lexikon einer sentimentalen Reise zum Exporteurtreffen in Druden. Roman. Salzburg. Schmitz, Ulrich (1996): Kuntermund und Löwenmaul. Multimediale interaktive Lernsoftware für Sprache und Linguistik (Prospekt). (= Universität GH Essen, FB3). Essen. Todesco, Rolf (1992): „Software“ virtueller Partner oder Werkzeug. In: Neue Zürcher Zeitung, 227, 30.9.92, S. 67. Todesco, Rolf (1995): Zeichen, Signal und Symbol. Überlegungen zur Begriffsverwendung in Umgangssprache und in Mensch-Maschinen-Kommunikation. In: Europäische Zeitschrift für Semiotische Studien, 7/ 3-4, S. 685-692. Institute for Socio-Semiotic Studies. Wien. Todesco, Rolf (1996): Die Definition als Textstruktur im Hyper-Sachbuch. In: Knorr, Dagmar/ Jakobs, Eva M. (Hg.): Textproduktion in elektronischen Umgebungen. (= Textproduktion und Medium 2). Frankfurt a.M. <?page no="277"?> Studien zur deutschen Sprache FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE Band 6 Andreas P. Müller ‘Reden ist Chefsache’ Linguistische Studien zu sprachlichen Formen sozialer ‘Kontrolle’ in innerbetrieblichen Arbeitsbesprechungen 1997, VIII, 371 Seiten, DM 148,-/ ÖS 1080,-/ SFr 133- ISBN 3-8233-5136-2 Acht authentische Arbeitsbesprechungen aus Unternehmen bilden die Basis fiiir eine detaillierte linguistische Analyse. Von Mikrosignalen bis hin zu rhetorischen Verfahren werden sprachliche Mittel im Hinblick aufsteuernde und manipulative Funktionen beschrieben. Aus dem Gesprächsverhalten der Teilnehmer entfaltet sich in actu ein Spektrum sozialer Strukturen in unternehmerischen Organisationen. Band 7 Kathrin Steyer Reformulierungen Sprachliche Relationen zwischen Äußerungen und Texten im öffentlichen Diskurs 1997, 294 Seiten, DM 136,-/ ÖS 993,-/ SFr 122,- ISBN 3-8233-5137-0 Der vorliegende Band diskutiert die Konzepte ‘Reformulierung’ und ‘Redewiedergabe’ aus intertextuell-diskursiver Sicht und beschreibt zugleich einen Teil jüngster deutscher Sprachgeschichte. Untersucht werden grammatisch-strukturelle, propositionale und funktionale Eigenschaften von Reformulierungen unter besonderer Berücksichtigung der argumentativen Einbettungen. Anhand einer Fallstudie aus dem deutsch-deutschen Diskurs zwischen ‘Wende’ und ‘Vereinigung’ im Frühjahr 1990 werden Wiederaufnahmen eines relevanten Originaltextes in Folgetexten beschrieben. Dabei geht es vor allem um sprachliche Indikatoren für Sprecher-, kontextbzw. diskursabhängige Modifikationen, Interpretationen und Bewertungen von Bezugsentitäten. Die Detailanalyse erlaubt schließlich die Rekonstruktion von komplexen Reformulierungsmustern, die das kommunikative Verhalten der Deutschen in der Folgezeit nicht unwesentlich prägten und als typisch für öffentliche Diskurse überhaupt gelten können. <?page no="278"?> Studien zur deutschen Sprache FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE Band 8 Reinhold Schmitt / Gerhard Stickel (FTrsg.) Polen und Deutsche im Gespräch 1997, VIII, 345 Seiten, DM 136-/ ÖS 993,-/ SFr 122,- ISBN 3-8233-5138-9 Der Band “Polen und Deutsche im Gespräch” ist das Ergebnis des Projektes “Polnischdeutsche Interkulturelle Kommunikation” des Instituts für deutsche Sprache in Mannheim. An dem Projekt waren polnische und deutsche Germanisten, Soziologen, Literatur- und Kulturwissenschaftler beteiligt. Den Beiträgen des Bandes ist die Frage gemeinsam, ob und wie sich die problematische deutsch-polnische Geschichte auf heutige Kontakte zwischen Polen und Deutschen auswirkt. Aufder Grundlage von Gesprächen, Interviews und Zeitungsartikeln werden die Rolle von Vorurteilen und des unterschiedlichen Wissens für das wechselseitige Verstehen untersucht. Biographie- und fotoanalytische Beiträge geben Einblicke in die Probleme der Biographie von Menschen, die durch das deutsch-polnische Spannungsverhältnis der Kriegsjahre geprägt worden ist. Dabei kommen u. a. Probleme zur Sprache, die aus der Situation von Repatriierten und Vertriebenen resultieren. Für die Frage nach den Möglichkeiten einer Annäherung und Aussöhnung zwischen Deutschen und Polen werden Verfahren beschrieben, mit denen die Gesprächspartner historisch-politisch bedingte Verständigungsprobleme zu überwinden versuchen. Besondere Aufmerksamkeit wird dabei auch Fragen der Kulturvermittlung im Rahmen von polnischdeutschen Jugendbegegnungen gewidmet. Band 9 Rainer Wimmer / Franz-Josef Berens (Hrsg.) Wortbildung und Phraseologie 1997, 271 Seiten, DM 78,-/ ÖS 569,-/ SFr 74,- ISBN 3-8233-5139-7 Der Band enthält Untersuchungen zu neueren theoretischen Entwicklungen in der Grammatik von Wortbildungen und Phraseologismen. Im Bereich der Wortbildung werden Adjektiv- und Negationsbildungen durch die Jahrhunderte verfolgt, Wortfamilienwörterbücher aufgearbeitet und ein neues Modell vorgestellt. Im Bereich der Phraseologie werden die unterschiedlichen Realisierungen in anderen Sprachen wie dem Finnischen und Ungarischen thematisiert. Beiträge zu Anwendungen neuerer Erkenntnisse in der Sprachdidaktik, in der Lexikographie und der Spracherwerbsforschung runden den Band ab. <?page no="279"?> Studien zur deutschen Sprache FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE Band 10 Daniel Bresson / Jacqueline Kubczak (Hrsg.) Abstrakte Nomina Vorarbeiten zu ihrer Erfassung in einem zweisprachigen syntagmatischen Wörterbuch 1997, 300 Seiten. DM 120,-/ / ÖS 876,-/ SFr 108- ISBN 3-8233-5140-0 In diesem Band werden die Ergebnisse eines deutsch-französischen Kooperationsprojekts vorgestellt. Im Zentrum steht ein Konzept für die Behandlung abstrakter Nomina in einem zweisprachigen syntagmatischen Wörterbuch deutsch-französisch/ französisch-deutsch. Die Nomina werden als Prädikate mit Argumentstrukturen betrachtet, die zusammen mit Stützverben (verbes supports) den Kern eines Satzes bilden. Neben der ausführlichen syntaktischen und semantischen Charakterisierung der Argumente wird besonders auf die angemessene Behandlung von Kollokationen, idiomatischen Phrasemen und Komposita Wert gelegt. Die hier entwickelte Konzeption hat inzwischen Pate gestanden für ein deutsch-ungarisches Valenzwörterbuch der Substantive, dessen Konzept ebenfalls erörtert wird. Weitere sich anschließende Beiträge greifen in einem großen Bogen Diskussionsthemen auf, die im Gesamtrahmen des deutsch-französischen Gemeinschaftsprojekts relevant sind. Band 11 Wolfgang Teubert (Hrsg.) Neologie und Korpus 1998, 170 Seiten, DM 68,-/ ÖS 496,-/ SFr 65,- ISBN 3-8233-5141-9 Der Sammelband enthält ausgewählte und umfassend überarbeitete Beiträge eines Kolloquiums über Möglichkeiten und Probleme einer korpusbasierten Neologismenlexikographie. Das in der Germanistik lange vernachlässigte Thema der Neologie und des lexikalischen Wandels wird in theoretischen, methodologischen und praktischen Aspekten beleuchtet. Es wird gezeigt, welchen Beitrag die Korpuslinguistik bei der Objektivierung des Bedeutungswechsels bereits vorhandener lexikalischer Ausdrücke leisten kann und welche Relevanzkriterien für die lexikographische Bearbeitung erfüllt sein müssen. <?page no="280"?> Die Beiträge des interdisziplinär ausgerichteten Sammelbandes behandeln aus theoretischer und aus anwendungsbezogener Perspektive die neuartigen Gestaltungsmöglichkeiten, die Hypermedia in den Bereichen Lexikographie, Terminographie und Grammatikschreibung eröffnet. Textlinguistische, informationswissenschaftliche und mediendidaktische Fragestellungen werden am Beispiel konkreter Anwendungen diskutiert. ISBN 3-8233-5142-7