eBooks

Korpusgestützte Textanalyse

2007
978-3-8233-7301-8
Gunter Narr Verlag 
Manfred Stede

Viele Arbeitsgebiete der Linguistik haben in den letzten Jahren von einer Hinwendung zu empirischen Daten profitiert: Allgemein verfügbare Korpora erlauben die nachvollziehbare Prüfung von Hypothesen. Der vorliegende Band geht diesen Weg für die Textlinguistik. Die wesentlichen Ebenen der Textanalyse werden systematisch erläutert und 'Textualität' als das Ergebnis der Interaktion dieser Ebenen gedeutet. Ergänzend werden jüngste Entwicklungen der Software-Technologie vorgestellt, die es erlauben, Texte auf den einzelnen Ebenen zu annotieren und diese zueinander in Beziehung zu setzen. Die Mechanismen der Textkohärenz können damit gründlicher untersucht werden als bisher, sowohl qualitativ als auch quantitativ. Aus dem Inhalt: Einleitung und Übersicht · Kohäsion, Kohärenz und Textualität · Textfunktion, Textsorte und Texttyp · Referentielle Struktur · Thematische Struktur · Temporale Struktur · Rhetorische Struktur · Minimale Diskurseinheiten und ihre Verknüpfung · Von Illokutionsstruktur zu Argumentativer Struktur · Interaktion zwischen Ebenen: Entstehung von Kohärenz · Anhang: XML und Linguistische Datenbanken

narr studienbücher narr studienbücher Viele Arbeitsgebiete der Linguistik haben in den letzten Jahren von einer Hinwendung zu empirischen Daten profitiert: Allgemein verfügbare Korpora erlauben die nachvollziehbare Prüfung von Hypothesen. Der vorliegende Band geht diesen Weg für die Textlinguistik. Die wesentlichen Ebenen der Textanalyse werden systematisch erläutert und ‘Textualität’ als das Ergebnis der Interaktion dieser Ebenen gedeutet. Ergänzend werden jüngste Entwicklungen der Software-Technologie vorgestellt, die es erlauben, Texte auf den einzelnen Ebenen zu annotieren und diese zueinander in Beziehung zu setzen. Die Mechanismen der Textkohärenz können damit gründlicher untersucht werden als bisher, sowohl qualitativ als auch quantitativ. Manfred Stede Korpusgestützte Textanalyse Grundzüge der Ebenenorientierten Textlinguistik Stede Korpusgestützte Textanalyse ISBN 978-3-8233-6301-9 020507 Stud. Stede 23.03.2007 14: 24 Uhr Seite 1 User: Steffen Hack Lpi: 175 Scale: 100% narr studienbücher Manfred Stede Korpusgestützte Textanalyse Grundzüge der Ebenen-orientierten Textlinguistik Gunter Narr Verlag Tübingen Prof. Dr. Manfred Stede lehrt Angewandte Computerlinguistik an der Universität Potsdam. Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über <http: / / dnb.d-nb.de> abrufbar. © 2007 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Gedruckt auf chlorfrei gebleichtem und säurefreiem Werkdruckpapier. Internet: http: / / www.narr-studienbuecher.de E-Mail: info@narr.de Druck: Gulde, Tübingen Bindung: Nädele, Nehren Printed in Germany ISSN 0941-8105 ISBN 978-3-8233-6301-9 Inhaltsverzeichnis Vorwort 9 Abbildungsverzeichnis 11 1. Einleitung und Übersicht 13 1.1. Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.2. Arbeit mit Text-Daten: Software-Werkzeuge . . . . . . . . . . . . . . . 16 1.3. Übersicht über das Buch . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.4. Übungsaufgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2. Kohäsion, Kohärenz und Textualität 19 2.1. Die Anfänge der Textlinguistik . . . . . . . . . . . . . . . . . . . . . . 19 2.2. Kohäsion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.3. Kohärenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.4. Textualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.4.1. Merkmale der Textualität . . . . . . . . . . . . . . . . . . . . . 26 2.4.2. Strukturen im Text . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.5. Weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.6. Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3. Textfunktion, Textsorte und Texttyp 31 3.1. Textfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.2. Textsorte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.2.1. Fallbeispiel: Kommentar . . . . . . . . . . . . . . . . . . . . . . 38 3.2.2. Quantitative Korpusanalyse . . . . . . . . . . . . . . . . . . . . 40 3.2.3. Textsortenwissen . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.3. Texttyp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.4. Weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.5. Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4. Referenzielle Struktur 49 4.1. Referenz und Koreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . 50 4.2. Referenzielle Ketten: Globale Effekte . . . . . . . . . . . . . . . . . . . 55 4.3. Koreferenz: Lokale Effekte . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.3.1. Aufmerksamkeitsfokus und Centering . . . . . . . . . . . . . 60 4.3.2. Aktivierungsgrad von Diskursgegenständen . . . . . . . . . . 64 4.3.3. Numerische Modelle: Aktivierungsfunktionen . . . . . . . . . 67 4.4. Annotation von Koreferenz im Korpus . . . . . . . . . . . . . . . . . . 68 Inhaltsverzeichnis 4.5. Weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . 71 4.6. Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 5. Thematische Struktur 73 5.1. Thema als Textgegenstand . . . . . . . . . . . . . . . . . . . . . . . . . 74 5.2. Textglobale thematische Strategien . . . . . . . . . . . . . . . . . . . . 77 5.2.1. Linearisierung der Textinformationen . . . . . . . . . . . . . . 77 5.2.2. Haupt- und Nebenstruktur . . . . . . . . . . . . . . . . . . . . 79 5.3. Lokale thematische Verknüpfung . . . . . . . . . . . . . . . . . . . . . 81 5.4. Informationsstruktur: Satztopik . . . . . . . . . . . . . . . . . . . . . . 84 5.5. Fazit: Textthema und Satzthema . . . . . . . . . . . . . . . . . . . . . 87 5.6. Annotation thematischer Information im Korpus . . . . . . . . . . . . 88 5.7. Weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . 90 5.8. Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 6. Temporale Struktur 91 6.1. Ereignisse in der temporalen Struktur . . . . . . . . . . . . . . . . . . 91 6.2. Zeitausdrücke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 6.3. Annotation von temporaler Struktur im Korpus . . . . . . . . . . . . 99 6.4. Weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . 100 6.5. Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 7. Von Illokutionsstruktur zu Argumentationsstruktur 101 7.1. Hintergrund: Sprechhandlungen . . . . . . . . . . . . . . . . . . . . . 101 7.2. Sprechhandlungen in Texten . . . . . . . . . . . . . . . . . . . . . . . . 104 7.2.1. Illokutionen von Textsegmenten . . . . . . . . . . . . . . . . . 105 7.2.2. Dependenzen zwischen Satzillokutionen . . . . . . . . . . . . 110 7.3. Argumentationsstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . 113 7.4. Inventar von Illokutionen . . . . . . . . . . . . . . . . . . . . . . . . . 118 7.5. Fazit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 7.6. Annotation von Illokutionsstruktur im Korpus . . . . . . . . . . . . . 128 7.7. Weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . 128 7.8. Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 8. Rhetorische Struktur 131 8.1. Lokale Kohärenz durch Relationen zwischen Textsegmenten . . . . . 131 8.1.1. Definitionsgrundlage . . . . . . . . . . . . . . . . . . . . . . . . 133 8.1.2. Inventar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 8.2. Von lokalen Relationen zu globalen Strukturen . . . . . . . . . . . . . 138 8.3. Aspekte der Verarbeitung: Inkrementalität . . . . . . . . . . . . . . . 144 8.4. Baumstruktur oder Graphstruktur? . . . . . . . . . . . . . . . . . . . . 148 8.5. Fazit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 8.6. Annotation von rhetorischer Struktur im Korpus . . . . . . . . . . . . 150 8.7. Weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . 151 8.8. Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 6 Inhaltsverzeichnis 9. Minimale Texteinheiten und ihre Verknüpfung 155 9.1. Segmentierung von Texten . . . . . . . . . . . . . . . . . . . . . . . . . 156 9.2. Identifikation von Illokutionen . . . . . . . . . . . . . . . . . . . . . . 159 9.2.1. Performative Formeln . . . . . . . . . . . . . . . . . . . . . . . 161 9.2.2. Satzart . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 9.2.3. Modalverben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 9.2.4. Adverbien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 9.3. Verknüpfung von Textsegmenten . . . . . . . . . . . . . . . . . . . . . 165 9.3.1. Begriffsbestimmung: Konnektor . . . . . . . . . . . . . . . . . 167 9.3.2. Syntaktische Charakterisierung . . . . . . . . . . . . . . . . . . 168 9.3.3. Semantik: Relationen, Ambiguität und Vagheit . . . . . . . . . 170 9.3.4. Pragmatik: Verknüpfungsebenen und Präsuppositionen . . . 175 9.4. Fazit: Die Rolle der Korpusannotation . . . . . . . . . . . . . . . . . . 178 9.5. Weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . 180 9.6. Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 10. Interaktionen zwischen Ebenen: Entstehung von Kohärenz 181 10.1. Die Ebenen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 10.2. Die Rolle von Text-Daten für die Text-Analyse . . . . . . . . . . . . . 183 10.3. Ebenen-Interaktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 Literaturverzeichnis 189 A. XML und Linguistische Datenbanken 201 Index 205 7 Vorwort Dieses Buch nähert sich der Aufgabe Textanalyse aus zwei verschiedenen Richtungen: Das grundsätzliche Anliegen, Strukturen in Texten aufzudecken und nach der Entstehung von Kohärenz zu fragen, ist das der Textlinguistik. Auch die Idee, dafür eine Reihe unterschiedlicher Ebenen heranzuziehen, wird von verschiedenen Autor/ innen der Textlinguistik vertreten. Sie ist jedoch ebenso in der Computerlinguistik prominent, und damit geht der Versuch einher, die Aufteilung in Ebenen und die Untersuchung ihrer Zusammenwirkung möglichst systematisch zu betreiben. Hinzu kommt die Betonung der Rolle eines datenorientierten Vorgehens, das (neben der Korpuslinguistik, per definitionem) gleichfalls in der Computerlinguistik seit vielen Jahren gründlich verankert ist. Während meiner Beschäftigung mit der Thematik fiel mir auf, wie merkwürdig separat die Disziplinen Textlinguistik und Computerlinguistik allerdings nebeneinander zu existieren scheinen: Die Textlinguistik nimmt kaum einmal die durchaus interessanten Ergebnisse der textbezogenen Computerlinguistik auf. Und in der Computerlinguistik werden mitunter Räder neu erfunden, die vor vielen Jahren in der Textlinguistik bereits bekannt waren, wenn auch möglicherweise noch nicht hinreichend formalisiert. Diese Entwicklung ist bedauerlich, und es erscheint mir wichtig, die beiden Disziplinen stärker aufeinander aufmerksam zu machen. Sollte das Buch dazu einen Beitrag leisten, so wäre ein Ziel erreicht. Das Buch möchte Studierenden einen Überblick über die verschiedenen Ebenen der linguistischen Textanalyse vermitteln. Weil am Ende die Einsicht in das Zusammenwirken der unterschiedlichen Ebenen stehen soll, ist das Unterfangen relativ “breit” angelegt - wir behandeln eine ganze Reihe recht unterschiedlicher Themen. Dies bedingt, dass bei der Diskussion der Einzelebenen einiges nur kursorisch besprochen wird, was von Fall zu Fall unbefriedigend erscheinen mag. Ich habe jedoch versucht, am Ende jedes Kapitels Hinweise auf geeignete weiterführende Lektüre zur jeweiligen Ebene anzugeben. Das Buch entstand im Verlauf dreier Veranstaltungen des Proseminars Textstrukturen an der Universität Potsdam. Allerlei Anregungen aus den Diskussionen mit Seminarteilnehmer/ innen flossen in die Überarbeitungen ein. Besonders bedanken möchte ich mich bei Eva Breindl, Christian Chiarcos, Stefanie Dipper, Michael Grabski, Alexander Mehler und Georg Rehm für ihre wertvollen Hinweise zur Verbesserung früherer Versionen einzelner Kapitel. Andreas Peldszus half bei einigen technischen Problemen und der Gestaltung von Abbildungen. Doch wie immer gilt: Für alle verbleibenden Fehler ist allein der Autor verantwortlich. Potsdam, im März 2007 Manfred Stede Abbildungsverzeichnis 3.1. Zwei Beispieltexte unterschiedlicher Sorten . . . . . . . . . . . . . . . 33 3.2. Merkmalbasierte Klassifikation von Gebrauchstextsorten . . . . . . . 34 3.3. Sorten von Pressetexten nach Hundsnurscher (1984) . . . . . . . . . . 36 3.4. Textsorten und funktionale Dimensionen (Biber, 1993, S. 230) . . . . . 42 4.1. Beispieltext Darfur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.2. Referenzielle Kette Sudan für den Beispieltext Darfur . . . . . . . . . . 57 4.3. Referenzielle Kette Pausenbrot für Beispiel 4.10 . . . . . . . . . . . . . 58 4.4. Referenz-Matrix zum Beispieltext Darfur . . . . . . . . . . . . . . . . . 59 4.5. Center-Übergänge nach Brennan u. a. (1987) . . . . . . . . . . . . . . . 63 4.6. Koreferenz-Annotation mit MMAX2 . . . . . . . . . . . . . . . . . . . 70 5.1. Makrostruktur eines Textes nach van Dijk (1980) . . . . . . . . . . . . 75 5.2. Beispieltext-Varianten World Wars (Fries, 1981) . . . . . . . . . . . . . 82 5.3. Schichten-orientierte Annotation mit EXMARaLDA . . . . . . . . . . 89 6.1. Temporale Relationen zwischen Ereignissen nach Allen (1984) . . . . 92 6.2. Beispieltext Findus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.3. Temporale Struktur des Beispieltexts Findus . . . . . . . . . . . . . . . 96 6.4. Temporale Struktur des Beispieltexts 6.5 . . . . . . . . . . . . . . . . . 98 7.1. Beispieltext Movie (Grosz u. Sidner, 1986) . . . . . . . . . . . . . . . . 106 7.2. Segmentierung des Beispieltexts Movie . . . . . . . . . . . . . . . . . . 106 7.3. Textstruktur und Handlungsstruktur nach Schröder (2003) . . . . . . 108 7.4. Illokutionsstruktur-Analyse aus Brandt u. Rosengren (1992) . . . . . 112 7.5. Schema einer Argumentation nach Toulmin (1958) . . . . . . . . . . . 114 7.6. Bausteine einer Argumentation nach Freeman (1991) . . . . . . . . . 115 7.7. Beispieltext Kreisel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 7.8. Analyse des Kreisel-Textes nach Freeman (1991) . . . . . . . . . . . . . 117 7.9. Taxonomie des Illokutionstyps Feststellung nach Motsch (1987) . . . . 123 7.10. Beispieltext Olympia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 8.1. Beispiele für RST-Definitionen nach Mann u. Thompson (1988) . . . . 139 8.2. Liste der RST-Relationen nach Mann u. Thompson (1988) . . . . . . . 141 8.3. Beispiel für die RST-Analyse eines kurzen Textes . . . . . . . . . . . . 142 8.4. Neben- und und Unterordnung in Baumstruktur nach Polanyi (1988) 146 8.5. Hierarchische Struktur des Textes Max’s evening . . . . . . . . . . . . 147 8.6. Segmentierung und Relations-Markierung mit RSTTool . . . . . . . . 152 12 Abbildungsverzeichnis 9.1. Hierarchie von Illokutionstypen . . . . . . . . . . . . . . . . . . . . . 159 A.1. Architektur der Daten-Annotation mit PAULA und ANNIS . . . . . 202 1. Einleitung und Übersicht 1.1. Motivation Texte sind vielschichtige Objekte. Lesen wir einen, so geschehen vielerlei Dinge mit uns: Unter anderem rufen wir die einzelnen Wörter oder Phraseme (Mehrworteinheiten) in unserem mentalen Lexikon ab; analysieren seine Sätze und ihre Bestandteile mit Hilfe unseres grammatischen Wissens; machen wir uns ein Bild von der Bedeutung der Sätze; stellen dazu Zusammenhänge zu anderen Sätzen her (z. B. beim Verstehen eines Pronomens); setzen wir auch die einzelnen Satzbedeutungen zueinander in Beziehung (z. B. beim Herstellen eines Kausalzusammenhangs, der nicht explizit ausgedrückt ist); stellen wir fest, “worum es geht” und registrieren Themen-Wechsel an bestimmten Textstellen; nehmen wir den Stil des Textes wahr: auf welche Weise spricht die Autorin oder der Autor mit uns; identifizieren wir gelegentlich versteckte Präsuppositionen und interpretieren unscheinbare Andeutungen; erkennen wir (oder glauben zu erkennen), was man uns mit diesem Text wirklich sagen will, welchen Zweck der Text erfüllen soll. All dies und mehr geschieht sehr schnell und zur gleichen Zeit - der Text geht nicht wie ein Computerprogramm “Schritt für Schritt” vor und serviert uns solcherlei Informationseinheiten und Verarbeitungsanweisungen in sauberer Reihenfolge, sondern lässt uns in hohem Maße parallel arbeiten, also rezipieren und konstruieren. Ein Blick auf die Etymologie des Wortes Text, wie ihn etwa Mistrik (1973, S. 10) vornahm, verdeutlicht die Komplexität: Das Verständnis dieses Begriffes wird uns durch den Rückgriff auf die ursprüngliche Bedeutung des lateinischen Verbums texo, texere und des lateinischen Substantivums textus erleichtert: texo, texere heißt weben, flechten, zusammenfügen, bauen; textus heißt Gewebe, Geflecht, Zusammenhang, Gefüge. Ein Text ist also ein kompaktes Ganzes, dessen Inneres auf eine bestimmte Weise geflochten, d.h. aus der Fügung sprachlicher Elemente entstanden ist. Er ist eine in sich geschlossene sprachliche Äußerung im allgemeinen Sinne. Mistrik betont hier auch, dass bei aller Komplexität ein (guter) Text am Ende die verschiedenen Fäden wieder zusammen laufen lässt, den Eindruck der Abgeschlossenheit vermittelt. Nach der Lektüre kann der Leser mit der Autorin übereinstimmen oder nicht, kann feststellen, dass vielleicht einige inhaltliche Fragen offen geblieben sind; doch das Lese-Erlebnis als solches ist erfolgreich beendet, wenn sich das Gefühl einstellt, das Anliegen des Textes insgesamt verstanden zu haben. 14 1. Einleitung und Übersicht Wie aber “funktioniert” ein solch komplexes Lese-Erlebnis? Wie gelingt es dem Text, uns ein solches Erlebnis zu verschaffen? Aus linguistischer Sicht ist dies bislang nur in einzelnen Ansätzen verstanden. Es gibt relativ gut ausgearbeitete Modelle für bestimmte Aspekte (z. B., wie finden wir ein Antezedens für ein Personalpronomen), aber es gibt keine umfassende Erklärung für das Zusammenwirken der verschiedenen Teilaufgaben, die wir beim Lesen bearbeiten. Dass man sich für die Suche nach einer solchen Erklärung auf ganz unterschiedliche Beschreibungsebenen begeben muss, dürfte heute weitgehend unstrittig sein. Bereits im Modell von Grosz u. Sidner (1986) ist von drei verschiedenen Strukturen die Rede (die allerdings nicht gleichermaßen ausgearbeitet wurden): einer intentionalen, einer aufmerksamkeitssteuernden (attentional) und einer linguistischen Struktur. Ähnlich unterscheidet Nussbaumer (1991) eine funktional-illokutive Ebene (Handlungsstruktur), eine inhaltlich-propositionale Ebene, sowie eine sprachlichausdrucksseitige Ebene. Sehr reichhaltig ist das Programm der Untersuchung dieser Vielfalt in dem Band Ebenen der Textstruktur (Motsch, 1996) artikuliert. Auch Brinker (2001) betont, dass künftige Forschung die einzelnen Ebenen zunächst isolieren und dann systematisch miteinander verbinden müsse. Allein fehlt bis heute eine Theorie, die auf der Grundlage sorgfältig ausgearbeiteter Einzelebenen dann genau das Zusammenwirken dieser Ebenen erklären könnte. Dieses Ziel wurde vor einiger Zeit bereits sehr eingängig von Brandt u. Rosengren (1992, S. 9) formuliert: Einigkeit besteht heute darüber, dass Texte multidimensionale Gebilde sind (...) In (Motsch 1990a) liegt ein Versuch vor, die einzelnen Ebenen zu identifizieren. Diese kurze Übersicht zeigt, dass die vielen theoretischen Ansätze, die oft neben- und unabhängig voneinander konzipiert wurden und häufig auch nur einen Aspekt des Textes beleuchten, in einem generellen Modell zueinander in Bezug gesetzt und an authentischem Material überprüft werden müssen. Ein solches Modell kann nicht auf Anhieb ausgearbeitet werden. Auch heute ist dieses Modell noch nicht in Sicht; bei der Feststellung, dass es “nicht auf Anhieb” entwickelt werden kann, dürfte es sich mithin um eine milde Formulierung handeln. Eine jüngere Untersuchung, die sich ebenfalls diesem Ziel verschreibt, ist die von Schröder (2003), der formuliert (S. 1, Hervorh. im Original): Entscheidend ist, dass die multidimensionale Textstruktur als ein Zusammenspiel aus verschiedenartigen Ebenen begriffen wird. Daraus folgt, dass die unterschiedlichen Ebenen der Textstrukturierung nicht nur getrennt und sozusagen ‘nebeneinander ’ existieren, sondern dass sie sich gegenseitig auch beeinflussen und untereinander in einem Verhältnis wechselseitiger Abhängigkeiten stehen. Für Schröder steht dann speziell die Handlungsstruktur im Mittelpunkt der Betrachtung, während es uns hier darum geht, nicht eine bestimmte Ebene vertieft zu behandeln, sondern mehrere Ebenen gleichermaßen zur Sprache zu bringen, und die Aufmerksamkeit auf die besagten wechselseitigen Abhängigkeiten zu richten. 1.1. Motivation 15 Um einen Beitrag zu dem eher langfristigen Ziel der Modellierung des Zusammenwirkens zu leisten, schlagen wir zwei, ihrerseits miteinander verwobene, Wege ein: • Wir versuchen, für eine Reihe interessanter Beschreibungsebenen den jeweiligen “Stand der Kunst” darzustellen, also Material zusammen zu tragen, das für die Ebene grundlegend ist und auf dessen Basis die Entwicklung präziserer Modelle möglich sein sollte. • Wir betonen die wichtige Rolle von Daten als Grundlage der Erkenntnissuche und der Theoriebildung. Für die Untersuchung des Satzes sind Korpora und insbesondere annotierte Daten (Baumbanken) heute bereits zu einer sehr wichtigen Informationsquelle für viele Syntaktiker geworden. Für den Text steht dieser Perspektivenwechsel - zumindest was die Arbeit mit annotierten Daten betrifft - noch weitgehend aus, was nicht zuletzt daran liegt, dass der Aufbau solcher Daten-Ressourcen einen hohen Aufwand voraussetzt. So wie bestimmte Baumbanken für Computerlinguisten, aber auch für weniger Computer-orientierte Syntaktiker die gemeinsame Datenbasis darstellen, anhand derer Hypothesen geprüft, weiterentwickelt und miteinander verglichen werden können, würde auch die Untersuchung von Texten erheblich von annotierten Korpora profitieren, anhand derer sich Phänomene aufzeigen lassen, die dann eben auch von Dritten nachvollzogen und weiter intepretiert werden können. Voraussetzung dafür ist freilich, dass die Annotationen einerseits nachvollziehbar und andererseits nützlich sind. Für die Textanalyse bedeutet das - und damit schließt sich unser Kreis - gut motivierte, voneinander getrennte Analyse-Ebenen, die einerseits in sich schlüssig motiviert sein müssen und andererseits dann das Auffinden von Korrelationen zwischen diesen Ebenen ermöglichen. Wenn, wie von Brandt/ Rosengren und vielen anderen richtigerweise betont, das Wechselspiel zwischen verschiedenen Ebenen letztlich die Textualität hervorbringt, dann setzt eine systematische Untersuchung dieser Phänomene eine geeignete Datengrundlage voraus: Texte, die gleichzeitig auf unterschiedlichen Ebenen annotiert sind. Dass die Arbeit mit solchen Text-Daten heute möglich ist, hat viel mit den technischen Entwicklungen der letzten Jahre zu tun; allein mit Papier oder einem Textverarbeitungsprogramm wäre die Arbeit kaum zu leisten. Wir werden diese technische Seite in diesem Buch mit ansprechen, sie ist aber kein zwingender Bestandteil der Lektüre. Die Diskussion der einzelnen Beschreibungsebenen wird rein inhaltlicher Natur sein. Unser Untersuchungsgegenstand sind allein geschriebene Texte, und wir treffen hier auch die oft übliche Einschränkung auf sog. Gebrauchstexte. Um dem komplexen “Funktionieren” von Texten auf die Spur zu kommen, sollte man einerseits mit “richtigen” Texten arbeiten und nicht allein mit handgefertigten Beispielen, andererseits aber die Komplexität auch begrenzen: Wie etwa Dichtung oder spielerische Werbetexte funktionieren, getrauen wir uns nicht zu untersuchen. Sämtliche multi-medialen Aspekte bleiben ebenfalls von der Betrachtung ausgeschlossen. Bedingt durch das unseren eigenen Untersuchungen meist zugrunde liegende Korpus, das Potsdamer Kommentarkorpus, gibt es darüber hinaus einen gewis- 16 1. Einleitung und Übersicht sen Schwerpunkt auf Phänomenen in argumentativen Texten; doch die meisten Kapitel und Abschnitte sind unabhängig von dieser Wahl und gleichermaßen für andere Texttypen gültig. 1.2. Arbeit mit Text-Daten: Software-Werkzeuge für Annotation und Recherche Mit der zunehmend stärkeren Korpus-Orientierung (auch, aber nicht nur in der Computerlinguistik) sind in den letzten Jahren eine Reihe von Software-Werkzeugen entstanden, die es erlauben, Textdaten nach unterschiedlichsten Kriterien zu annotieren und in den so entstehenden reichhaltig annotierten Korpora dann wiederum zu recherchieren. 1 Unter Annotation verstehen wir die Anreicherung von “Primärdaten” (in unserem Fall: Texten) mit Informationen, die aus linguistischer Interpretation hervorgehen. Dabei kann es sich um ganz unterschiedliche Arten von Information handeln: part-of-speech tags, Syntax-Bäume, Sprechakte uvm. Der Vorgang des Interpretierens und Annotierens braucht viel Aufmerksamkeit und Zeit - es empfiehlt sich also, darauf zu achten, dass die Ergebnisse möglichst vielfältig wiederverwendbar sind. Sind Primärdaten und Annotationen in digitaler Form gespeichert, ist es möglich, nach ihnen zu suchen, also bei der Erforschung bestimmter Phänomene gezielt in den Daten zu recherchieren. Besonders interessant ist es, wenn dieselben Primärdaten mit unterschiedlichen Annotationen versehen sind, aus deren Kombination sich dann - entweder durch manuelle Recherche oder durch statistische Auswertung - neue Erkenntnisse gewinnen lassen. Damit dieses Szenario der “Mehrebenenannotation” (engl. multi-level annotation) funktioniert, muss eine gewisse Systematik eingehalten werden: Die einzelnen Annotationen sollten strikt voneinander getrennt sein, damit sie separat recherchiert und ggf. auch verändert werden können. Um aber Korrelationen zwischen einzelnen Annotationsebenen aufdecken zu können, müssen alle Annotationen technisch mit den Primärdaten in derselben Weise verbunden sein. Dies wird durch eine sogenannte standoff-Annotation erreicht, bei der sowohl der Primärtext als auch jede Analyse-Ebene jeweils in einer einzelnen Datei gespeichert und die Verbindungen zwischen den Ebenen durch “Zeiger” realisiert werden. Eine technische Schlüsselentwicklung dafür ist die Verbreitung von XML (‘eXtensible Markup Language’) als standardisiertes Austauschformat für Daten zwischen verschiedenen Software- Systemen. Der große Vorteil ist, dass man für die verschiedenen Analyse-Ebenen jeweils spezielle Werkzeuge benutzen kann, die auf die zugrunde liegenden Strukturen zugeschnitten sind und damit ein möglichst einfaches und effektives Arbeiten erlauben. Annotiert man nun jeweils denselben Text mit verschiedenen Werkzeugen auf verschiedenen inhaltlichen Ebenen, müssen anschließend alle resultierenden Annotationen wieder zusammengefügt werden; dies geschieht in einer linguistischen Datenbank, die dann die Recherche erlaubt. Für Leser, die sich mit 1 Die Thematik der Erstellung linguistisch annotierter Korpora wird in einführender Form ausführlich von Lemnitzer u. Zinsmeister (2006) dargestellt. 1.3. Übersicht über das Buch 17 dieser praktischen Arbeit befassen möchten, bietet jedes Ebenen-Kapitel am Ende jeweils eine kurze Vorstellung eines geeigneten Analyse-Werkzeugs. Im Anhang wird die Zusammenführung in einer Datenbank diskutiert und insbesondere die dafür in Potsdam entwickelte Infrastruktur mit dem Austauschformat PAULA und der Datenbank ANNIS vorgestellt. Weitere Hinweise zu dieser Thematik sind auf der Homepage 2 zu diesem Buch zusammengestellt. Dort finden sich ebenfalls Musterlösungen zu den in den Kapiteln 2 bis 9 gestellten Übungsaufgaben. Die Mehrebenenannotation ist das Szenario, nach dem wir die Aufgabe der Textlinguistik hier primär als korpusgestützt auffassen. Die Korpuslinguistik im allgemeineren Sinne geht in der Regel anders vor und gewinnt Erkenntnisse durch statistische Analyse aus sehr großen, entweder gar nicht oder nur beschränkt annotierten Korpora. Auch dieses Vorgehen kann für die Textanalyse gewinnbringend sein (insbesondere bei der Untersuchung von Textsorten, vgl. Abschnitt 3.2.2), doch um den unterschiedlichen Phänomenen der Textkohärenz auf die Spur zu kommen, scheint der Weg über eine “tiefe” Analyse von (dementsprechend kleineren) Korpora insgesamt vielversprechender. 1.3. Übersicht über das Buch Wir beginnen mit einer Diskussion der Schlüsselbegriffe Kohäsion und Kohärenz, die üblicherweise als die zentralen Merkmale der Textualität verstanden werden (Kap. 2). Anschließend stellen wir Konzeptionen zu den miteinander verwandten Begriffen Textfunktion, Textsorte und Texttyp vor und betonen hier auch die wichtige Rolle von Korpora für den Erkenntnisgewinn (Kap. 3). In den Kapiteln 4 bis 8 finden sich die Besprechungen der verschiedenen Analyse-Ebenen; zunächst geht es um die Referenzielle Struktur, dann um die Thematische Struktur und die Verbindung zur Informationsstruktur von Sätzen. Nach einem Blick auf Temporale Struktur (Kap. 6) wenden wir uns in Kapitel 7 der Illokutionsstruktur zu und ergänzen diese für argumentative Texte zu einer spezifischen Argumentationsstruktur. In Kapitel 8 folgt eine Diskussion verschiedener integrativer Ansätze zur Rhetorischen Struktur; diese wirft die Frage nach den “minimalen Einheiten” einer Strukturanalyse sowie nach deren Verknüpfung auf, der wir in Kapitel 9 gesondert nachgehen. Am Schluss fasst Kapitel 10 dann das zentrale Anliegen noch einmal zusammen und weist exemplarisch auf Wechselwirkungen zwischen einzelnen Ebenen hin, die zur Entstehung von Kohärenz im Text wichtige Beiträge leisten. Die Kapitel sind so konzipiert, dass sie zwar nach einer gewissen Logik aufeinander folgen, doch sie lassen sich recht problemlos auch einzeln bearbeiten, wenn sich das Lese-Interesse auf ausgewählte Themen richtet. Abschließend zwei Hinweise zur Terminologie: (i) Die Frage der Verwendung geschlechts/ un/ spezifischer Bezeichnungen behandeln wir in diesem Buch durch zufälligen Wechsel zwischen maskuliner und femininer Form. (ii) Die “handeln- 2 www.ling.uni-potsdam.de/ ~stede/ KorpTA.html 18 1. Einleitung und Übersicht den Personen” rund um den Text bezeichnen wir meistens als ‘Autorin’ oder ‘Verfasser ’ und ‘Leser ’, doch mitunter (etwa bei der Diskussion von Sprechhandlungen) verwenden wir auch andere Begriffe wie ‘Sprecher ’, ‘Hörerin’, ‘Adressat’ oder ‘Rezipientin’, ohne damit jeweils wichtige theoretische Unterscheidungen zu verbinden. 1.4. Übungsaufgabe Wählen Sie aus dem Online-Angebot einer Tageszeitung einen nicht zu langen Kommentar (10-15 Sätze) aus und speichern Sie ihn in einer “plain text” Datei. Der Kommentar sollte nicht allzu schwierig sein in dem Sinne, dass er eher arm an komplexen syntaktischen Konstruktionen sein und möglichst keine wiedergegebene wörtliche Rede enthalten sollte. Dieser Text wird die Arbeitsgrundlage für viele der Übungsaufgaben der nachfolgenden Kapitel sein. Falls Sie planen, den technischen Anregungen zu folgen und spezielle Software-Werkzeuge für die Annotation Ihres Kommentars einzusetzen, können Sie in Ihrem Text Umlaute und Sonderzeichen ersetzen, um etwaige ärgerliche und zeitraubende Zeichensatz- und Konvertierungs-Probleme von vornherein zu vermeiden. Aber auch, wenn Sie sich mit spezieller Software nicht befassen wollen, werden Sie die verschiedenen Anmerkungen zu Ihrem Kommentar speichern und wiederfinden wollen. Sie brauchen mithin eine Datei und nicht nur einen Papier-Ausschnitt. 2. Kohäsion, Kohärenz und Textualität Dieses Kapitel wirft zunächst einen Blick auf die Wurzeln der Textlinguistik und beleuchtet dann in Kürze die wesentlichen Phänomene der Kohäsion und Kohärenz. Diese werden in den nachfolgenden Kapiteln dann vertieft dargestellt und im abschließenden Kapitel 10 noch einmal rekapituliert. 2.1. Die Anfänge der Textlinguistik In den 1960er Jahren, einer durch die bahnbrechenden Entwicklungen von Chomskys Generativer Transformationsgrammatik ausgelösten “Blütezeit der Syntax”, waren die Untersuchungsgegenstände der Linguistik das Morphem, das Wort, die systematischen Wortgruppen bzw. Konstituenten und der Satz. Nur wenige Sprachwissenschaftler zeigten sich von dieser Konzentration auf die Satz-Beschreibung unbefriedigt und meldeten Interesse an, auch satzübergreifende Phänomene zum Ziel linguistischer Untersuchung und Theoriebildung zu machen, mithin den Text als linguistische Einheit zu begreifen. Einer der wesentlichen Auslöser der Beschäftigung mit Texten war der Wunsch, die Funktion und Bedeutung von Pronomina linguistisch zu erklären. Pronomina sind die augenfälligsten sprachlichen Mittel, die Bezüge zwischen Sätzen herstellen. Hier ein auch von Linke u. a. (1994) zitiertes Textbeispiel aus einem Roman: (2.1) Ich glaube, dann war Nadja dran. Sie hatte sich für Jura beworben und wußte längst, daß sie zugelassen war. Sie hatte es telefonisch erfahren, und sie hatte mittlerweile auch einen Förderungsvertrag mit Patenschaft und so unterschrieben. Sie kriegte dann aber irgendwie Kontakt mit einer frustrierten Richterin, die den Laden von innen kannte. Von da an wollte Nadja nicht mehr. (Thomas Brussig: Wasserfarben) Mit Ausnahme eines einzelnen Teilsatzes ist kontinuierlich die Rede von Nadja, auf die nach der ersten Erwähnung durchgehend mit dem Personalpronomen sie verwiesen wird - bis zum letzten Satz, wo wieder ihr Name genannt wird, entweder um der drohenden Monotonie zu begegnen, oder um einer möglichen Verwechslung mit der Richterin vorzubeugen. Der Autor hat bei der Wahl seiner ‘referierenden Ausdrücke’ viele Freiheiten: Er kann Eigennamen, Pronomen, umschreibende Nominalphrasen (NP) verwenden. Gleichzeitig unterliegt er aber auch Beschränkungen, denn das intendierte Bezugsobjekt muss von der Leserin 20 2. Kohäsion, Kohärenz und Textualität auch ohne allzu viel Mühe rekonstruiert werden können. Solcherlei Beobachtungen, das Wechselspiel zwischen Wahlfreiheit und Einschränkung bei der Textproduktion, weckten das Interesse derjenigen, die den Blick über den sprichwörtlichen Tellerrand des Satzes hinaus richteten. Eine der “Pionierarbeiten” der Textlinguistik war die Dissertation von Roland Harweg (1968), in der er die unterschiedlichen Arten von Pronomina klassifizierte und ihre Rolle im Text untersuchte. Da er einen sehr weiten Begriff verwendete und auch einige definite NPs unter ‘Pronomina’ subsumiert, definierte er dann auch ‘Text’ als “ein durch ununterbrochene pronominale Verkettung konstituiertes Nacheinander sprachlicher Einheiten.” Als weiteren Wegbereiter der Textlinguistik nennt Adamzik (2004) vor allem Peter Hartmann (s. etwa Hartmann, 1968), der u. a. das Augenmerk auf die Funktion von Texten (im Gegensatz zu ihrer strukturellen Beschreibung) richtete und deutlich machte, dass Sprecher nicht in Worten, auch nicht in Sätzen, sondern mit Sätzen aus Worten in Texten sprechen, mithin der Text der primäre Untersuchungsgegenstand der Sprachwissenschaft sei. Ähnlich hatte auch Harald Weinrich mit seiner vielbeachteten Arbeit Tempus (Weinrich, 1964) dem Satz den Status als Haupt-Gegenstand der Linguistik abgesprochen; später legte er konsequenterweise dann auch eine Textgrammatik der deutschen Sprache vor (Weinrich, 2005, 3. Aufl.). Nach Adamzik (2004) lässt sich die Textlinguistik-Forschung (im deutschsprachigen Raum) grob in drei Phasen einteilen: 1. die transphrastische Phase, die Phänomene der Satzverknüpfung untersucht; 2. die kommunikativ-pragmatische Phase, die Texte als komplexe sprachliche Handlungen auffasst und analysiert; 3. die kognitivistische Phase, die die Prozesse der Produktion und Rezeption bei Sprachbenutzern in den Mittelpunkt stellt. Um Sätze oder Teilsätze miteinander zu verbinden, sind die oben genannten Pronomina ein prominentes, aber keineswegs das einzige sprachliche Mittel. Solche Verbindungen kommen immer dann zum Tragen, wenn die Interpretation einer sprachlichen Einheit die Interpretation einer anderen zur Voraussetzung hat. Wir sprechen dann von Kohäsion zwischen solchen Einheiten und nennen die entsprechenden Signale an der sprachlichen Oberfläche kohäsionsstiftende Mittel. 2.2. Kohäsion Zur Motivation des Themas zitieren Halliday u. Hasan (1989) das Beispiel eines stand-up comedian, der auf die Bühne trat und seinen Vortrag mit den Worten begann: So we pushed him under the other one. Dies ist (zumindest bis unmittelbar nach der Äußerung des Satzes) ein Exemplar eines rundum misslungenen Textes, der eine Anzahl unauflösbarer Verweise enthält - sozusagen ein vorgetäuschter Text, der Kohäsionsmittel einsetzt, aber dabei keinen Sinn vermittelt. Kohäsion ist also allein ein Aspekt der sprachlichen Oberfläche. In normalen Texten geht sie mit Sinnhaftigkeit (der im nächsten Abschnitt zu besprechenden Kohärenz) einher, doch ist diese Verbindung eben nicht zwangsläufig gegeben. Welche sprachlichen Mittel gibt es, um solcherlei Kohäsion herzustellen? Nach 2.2. Kohäsion 21 Bußmann (2002) handelt es sich “im Wesentlichen um Erscheinungen der Wiederholung, Ersetzung und Verknüpfung.” Die nachfolgende Liste ist eine Kombination und Ergänzung aus ähnlichen Listen von Halliday u. Hasan (1989), Linke u. a. (1994) und Bußmann (2002). Die Phänomene werden hier nur kurz erwähnt, die meisten werden in späteren Kapiteln ausführlicher behandelt. Rekurrenz bezeichnet nach Linke u. a. (1994) die “materielle Wiederaufnahme eines einmal eingeführten Textelements im nachfolgenden Text.” Dies kann durchgehende Koreferenz einschließen wie in Beispiel 2.2 (Vogel) oder nicht, wie in Beispiel 2.3 (Mutter); der letztgenannte Fall wird von einigen Autoren als weniger kohäsiv angesehen als der erste. (2.2) Gestern habe ich einen Vogel beim Nestbau beobachtet. Der Vogel war ganz klein, hat aber trotzdem ziemlich große Zweige angeschleppt. Als Nistplatz hatte sich der Vogel ausgerechnet die Nische über unserem Rollladenkasten ausgesucht. (2.3) Meine Mutter ist sehr ängstlich und denkt immer gleich das Schlimmste. Annas Mutter ist da viel pflegeleichter: Die lässt ihre Tochter abends auch allein weggehen. So eine Mutter wäre mir ja auch lieber. Substitution ist die Wiederaufnahme eines Textelements mit identischem Referenzobjekt, aber unterschiedlicher lexikalischer Realisierung. Typisch für Substitution sind die lexikalischen Relationen der (Quasi-) Synonymie, Hyponomie (Unterbegriff) und Hyperonymie (Oberbegriff). Typischerweise wird bei der späteren Wiederaufnahme ein Hyperonym gewählt: Gegen 19 Uhr trat ein Damhirsch aus dem Wald. Nachdem er die Hasen verscheucht hatte, knabberte der Hirsch genüsslich an den Kleeblättern. Ausnahmen von dieser Tendenz gibt es aber beispielsweise in Nachrichtentexten, wo mit referierenden Ausdrücken bei der Wiederaufnahme noch neue Information übermittelt wird: Ein 43 Jahre alter Mann überfiel die Sparkasse. Der Facharbeiter war mit einer Schreckschusspistole . . . Lexikalische Kohäsion ist ein umfassenderer Begriff als die beiden zuvor genannten. Wenn in aufeinanderfolgenden Sätzen die Wörter rufen, Lärm, Stimme verwendet werden, wird Kohäsion geschaffen, die weder auf Referenzidentität noch auf Rekurrenz (Beispiel 2.3) beruht, sondern auf semantischer Assoziation zwischen lexikalischen Einheiten. Verfolgt man nun die Methode der lexikalischen Komponentenanalyse, d.h. der Zerlegung der Wortbedeutung in “atomare” Merkmale, so entsteht lexikalische Kohäsion durch Rekurrenz solcher Merkmale, wofür in der Literatur oft der Terminus ‘Isotopie’ (in mehr oder minder gelungener Analogie zum entsprechenden Konzept der Chemie) verwendet wird. (In-)Definite Artikel werden benutzt, um die ‘Zugänglichkeit’ (engl. accessibility) eines Referenzobjekts zu markieren. Eine Faustregel lautet, dass mit indefiniten Artikeln neue Gegenstände in den Diskurs eingebracht werden, während definite 22 2. Kohäsion, Kohärenz und Textualität Artikel Anweisungen darstellen, im Kontext nach einem bereits eingeführten Gegenstand zu suchen: Ein Auto kurvte um unser Haus. Nach drei Metern fuhr das Auto gegen eine Ampel. Eine ganz ähnliche Situation, jedoch ohne exakte Referenzidentität, liegt vor, wenn der Gegenstand unmittelbar aus einem im Text bereits eingeführten Gegenstand abgeleitet werden kann, z. B. durch Meronymie (Teil-Ganzes Relation): Ich habe ein neues Auto. Das Dach ist undicht. (Dies ist eine spezifischere Relation als die oben genannte allgemeine semantische Assoziation.) Außerdem ist der definite Artikel angemessen, wenn der Gegenstand im Hörerwissen als eindeutig identifizierbar vorausgesetzt werden kann, wie der Papst oder die Eisenbahn. Auch hier handelt es sich um eine Such-Anweisung, allerdings ist der Suchraum nicht der Text, sondern das Weltwissen des Rezipienten. Ähnlich kann der definite Artikel, verbunden mit einer Zeigegeste, im Gespräch auf einen “real” vorhandenen Gegenstand verweisen: DEN Vogel habe ich gestern schon mal gesehen! Nun ist der Suchraum die außersprachliche Situation. - Diese beiden Fälle werden mitunter bei der Diskussion von Kohäsion mit behandelt, was aber nicht recht angemessen scheint, eben weil die Verbindung nicht im Text besteht, sondern ein Verweis aus dem Text heraus erfolgt. Den Begriff ‘Kohäsion’ wollen wir hier auf textinterne Verweise beschränken. Pro-Formen sind die verschiedenen Arten der eingangs bereits genannten Pronomina (Personal-, Demonstrativ-, Possessiv-), dazu Pronominaladverbien und einige andere Adverbien wie dort oder da. Die Bezugselemente (oder ‘Antezedenten’) können einzelne Wörter, Konstituenten, ganze Sätze oder auch Satzgruppen sein: Das war eine kurze Beschreibung des Phänomens ‘Pro-Formen’. Wir unterscheiden zwischen ‘anaphorischem’ Gebrauch, bei dem die Pro-Form dem Bezugselement im Text nachfolgt, und ‘kataphorischem’ Gebrauch, in dem die Pro-Form dem Bezugselement vorausgeht: Bevor sie ins Seminar ging, putzte Maria sich noch einmal die Nase. Ellipsen ähneln den Pro-Formen, wobei aber das anaphorische Element hier eine “Leerstelle” ist. Soll eine Ellipse zu Analysezwecken im Text markiert werden, ist dafür das Symbol ∅ gebräuchlich. Zu unterscheiden sind Substantiv-Ellipsen (Maria trinkt Kaffee mit Milch. Mir schmeckt schwarzer ∅ besser.) und Verb-Ellipsen (Maria trinkt Kaffee mit Milch, und ich ∅ einen Tee.). Im Deutschen ersetzt Elision auch die im Englischen gebräuchliche ‘one-anaphora’, wobei dann keine Referenzidentität zwischen den Objekten besteht: Diese Kekse sind hart. Wir brauchen frische ∅ . Bußmann (2002) weist darauf hin, dass nicht alle Ellipsen kohäsionsstiftend sind, weil bestimmte Typen syntaktisch motiviert sind. Dazu zählen lexikalische Ellipsen, in denen ein Argument qua Weltwissen vom Rezipienten ergänzt wird (Er isst gerade / Die Hühner legen gerade), Infinitivkonstruktionen (Luise hat aufgehört zu rauchen) und Subjekt-Elision in Imperativsätzen (Geh nach Hause! ). Metakommunikative Verknüpfung besteht dort, wo der Produzent im Text über den Text spricht, z. B. in Überschriften, Gliederungshinweisen und formelhaften 2.2. Kohäsion 23 Rückverweisen: im Folgenden; vgl. Abschnitt 3, wie oben bereits angedeutet; wie soeben dargelegt; . . . Tempus und Modus werden von Zifonun (2000, S. 315) so charakterisiert: “Die Tempora situieren oder lokalisieren die Proposition im Zeitablauf [...]. Die Modi tragen dazu bei, die Proposition in einer ‘Welt’ zu lokalisieren; sie signalisieren also, ob die Proposition bezogen auf die [...] wirkliche Welt interpretiert werden soll oder nur auf eine ‘mögliche Welt’, wie wir sie zum Beispiel in unseren Hoffnungen, Befürchtungen, Wünschen und Plänen konzipieren.” Gemeinhin wird diesen Merkmalen nur geringe kohäsive Kraft zugeschrieben, doch ist die Einhaltung der Regeln der consecutio temporum durchaus ein auf der Textebene angesiedeltes, die Kohärenz sicherndes Instrument. Konnektoren gelten neben Pro-Formen als Kohäsionsmittel “par excellence”, da sie ganz explizit eine Verbindung zwischen Texteinheiten herstellen. Die Art der Verbindung kann dabei recht klar (obwohl) oder auch nur vage (und) sein. Syntaktisch sind Konnektoren keine homogene Klasse, sondern teilen sich in subordinierende und koordinierende Konjunktionen, einige Präpositionen (trotz, wegen), Konjunktional- und andere Adverbien. Auch die Abgrenzung der Gruppe der Konnektoren ist nicht ganz einfach, etwa zur metakommunikativen Verknüpfung in Fällen, wo ein Konnektor nicht textexterne Sachverhalte verknüpft, sondern textinterne Objekte. Halliday u. Hasan (1989) nennen das Beispiel He is really a good fellow. First, he’s honest; next, he’s generous. Formgebende strukturelle Mittel sind verschiedene rhetorische Figuren im Satzbau, die kohäsiv wirken; die prominenteste ist die bewusste Wahl paralleler Satzstrukturen, z. B. um Gegensätze herauszustellen: Vor zwei Wochen hat Susanne aufgehört zu rauchen. Und in vier Monaten wird sie wohl anfangen zu joggen. Kohäsion findet im Wesentlichen zwischen Sätzen statt, aber in ganz ähnlicher Form auch zwischen Teilsätzen im komplexen Satz. Satzintern kommen dann die syntaktischen Bindungsbeschränkungen ins Spiel, die die Verwendung von Pronomina mit bestimmen. Was zwischen Sätzen eine Frage des “Glückens” von Referenz ist, kann innerhalb des Satzes zur Frage der Wohlgeformtheit werden. Die Kohäsion ist ohne Frage ein zentrales Merkmal von Texten, doch es erweist sich bei näherer Betrachtung als nicht hinreichend. Das eingangs genannte Beispiel des stand-up commedian hat das bereits illustriert. Linke u. a. (1994, S. 224) geben für dieses Argument folgenden Beispieltext an: (2.4) Wir haben sehr gute Sängerinnen und Sänger an unserer Oper. Die Sopranistin ist besonders umschwärmt. Mozart liegt ihr sehr. Mir ist von den Mozart-Opern die Zauberflöte am liebsten. Diese neuen plump-deutlichen Ausdeutungen der Tempelgemeinschaft als männerbündische Freimaurerloge scheinen mir allerdings eine sehr 24 2. Kohäsion, Kohärenz und Textualität fragwürdige Interpretation des Werkes. Aber die heutigen Opernleute schrecken ja vor nichts zurück. Bei Wagner-Inszenierungen ist das oft noch schlimmer, obwohl ich ja für solche pathetische Musik sowieso nicht viel übrig habe. Fraglos finden sich im Text vielfältige kohäsionsstiftende Mittel, doch bleiben wir nach der Lektüre unzufrieden: Der Text ergibt keinen rechten Sinn - er reiht Sätze aneinander, die jeweils irgendwie auch zueinander passen, doch sie fügen sich nicht zu einem stimmigen Gesamtbild. Dem Text mangelt es an Kohärenz. 2.3. Kohärenz (2.5) Gerhard Schröder war immer an der Gunst der Wirtschaftskapitäne interessiert. Im März schlug der Kanzler eine deutliche Senkung der Unternehmenssteuern vor. In diesem Beispiel (angelehnt an eines von Kehler (2004)) sind die beiden Sätze unabhängig voneinander interpretierbar - jeder Satz könnte auch für sich allein stehen. Rezipieren wir sie jedoch nacheinander, d.h. als Teile desselben Texts, tritt eine weitere Information hinzu: Wir sind geneigt, entweder die Aussage des ersten Satzes als Grund für die des zweiten zu interpretieren, oder die des zweiten als Evidenz für die Behauptung im ersten Satz. Damit etablieren wir eine Relation zwischen den Sätzen bzw. ihren Aussagen, die gewissermaßen einen “Mehrwert” gegenüber der Interpretation der jeweils einzelnen Sätze darstellt. Relationen gelten gemeinhin als das geeignete Beschreibungsmittel für (lokale) Kohärenz, was sich auch in der Definition von Bußmann (2002) zeigt: Semantisch-kognitiver Sinnzusammenhang eines Textes, darstellbar z. B. in Form semantischer Netze aus Konzepten und Relationen. Lokale K. besteht satzintern und zwischen benachbarten Äußerungen, globale K. konstituiert das Textthema bzw. die Textfunktion aus semantischpragmatischen Makrostrukturen. (. . . ) Ist die grundsätzliche Eignung des Relations-Begriffs weitgehend unumstritten, so scheiden sich die Autoren freilich bei der konkreten Ausgestaltung, d.h. bei der Angabe eines konkreten Inventars von Relationen und ihrer jeweiligen Definitionen. Auf einen recht einflussreichen Vorschlag, die Rhetorical Structure Theory (Mann u. Thompson, 1988), werden wir in Kapitel 8 genauer eingehen. An dieser Stelle sei aber vorab der Ansatz von Kehler (2002) erwähnt, der sich bei seinem Vorschlag einer Relationsmenge auf den Philosophen David Hume beruft, welcher drei Gruppen möglicher “connections among ideas” vorgeschlagen hatte: • Resemblance: Es werden die Gemeinsamkeiten, Unterschiede oder das Verhältnis der Generalisierung / Spezialisierung zwischen zwei Aussagen herausgestellt. • Cause-Effect: Eine Aussage wird als Grund, die andere als Folge interpretiert. 2.4. Textualität 25 • Contiguity: Teile derselben Situation werden beschrieben und als zusammengehörig interpretiert, z. B. als temporal aufeinanderfolgend. Diese Dreiteilung ist durchaus abbildbar auf andere in der Literatur vorgeschlagene Klassifikationen in vier Gruppen, wie die von Halliday u. Hasan (1989) (additive, temporal, causal, adversative) oder von Martin (1992) (addition, temporal, consequential, comparison) - man kann additive und temporal als Varianten von contiguity auffassen; adversative sowie comparison als spezielle Formen von resemblance; und causal/ consequential als äquivalent zu cause-effect. Welche konkreten Relationen zur Ausgestaltung dieser Gruppen vorgeschlagen wurden, wird uns wie gesagt in Kapitel 8 beschäftigen. Hier sei lediglich festgehalten, dass lokale Kohärenz zwischen benachbarten Sätzen genau dann entsteht, wenn die Interpretation des Ganzen mehr als die Summe der Interpretationen der Teile darstellt - wobei dieses “mehr” unterschiedlich ausgeprägt sein kann: Im obigen Beispiel 2.5, wo kein expliziter Konnektor die kausale Interpretation nahelegt, leisten wir die entsprechende Interpretations-“Mehrarbeit” unter dem Einfluss unseres Weltwissens; in einem Fall von Contiguity wie dem nachfolgenden konstruieren wir hingegen eine gemeinsame Einordnungsinstanz (“Person unterstützt Partei”) für die beiden Aussagen, ohne einen Kausalbezug zu postulieren. (2.6) Marianne verteilte Flugblätter für die Grünen. Sebastian organisierte die lokalen Sonntagsstammtische für die Partei. Die Zweckmäßigkeit der Unterscheidung zwischen lokaler und globaler Kohärenz (die wie gesehen u. a. von Bussmann, aber nicht von allen Autoren getroffen wird) lässt sich am weiter oben gezeigten Beispieltext 2.4 gut erkennen: Benachbarte Sätze sind dort nicht allein “pseudo-kohäsiv” verbunden, sondern in der Tat auch inhaltlich verknüpfbar - die lokale Kohärenz ist jeweils gewährleistet. Das Manko des Textes ist die mangelnde globale Kohärenz, denn der Text reiht Aussage an Aussage, ohne aber letzten Endes zu einem klaren Ziel zu führen. Globale Kohärenz werden wir im nächsten Kapitel zum Begriff der Textfunktion in Beziehung setzen. 2.4. Textualität Den oben gezeigten, recht “künstlichen” Beispielen kohäsiver, aber nicht kohärenter Texte zum Trotz: In der Praxis ist die große Mehrzahl der Texte sowohl kohäsiv als auch kohärent, schon allein aufgrund des Kohärenzkriteriums der Beibehaltung von Diskursgegenständen, die dementsprechend auch wiederholt im Text sprachlich bezeichnet werden und somit Kohäsion erzeugen. Wir betrachten daher die Kohäsion (an der Textoberfläche sichtbare Verknüpfung) als die linguistische Reflexion von Kohärenz (unter der Textoberfläche liegende, vom Rezipienten zu rekonstruierende, inhaltliche Verknüpfung). Und doch ist die Verbindung zwischen beiden nicht zwingend, weil auch “echte” Texte häufig kohärent sind, ohne dabei auf kohäsive Mittel angewiesen zu sein. Dafür nennt auch Redeker (1990) zwei Beispiele: 26 2. Kohäsion, Kohärenz und Textualität (2.7) Sally is crying. Nanny has thrown out the time-worn teddy bear. The holes were getting too large to fix. (2.8) Take those dirty shoes off. There’s a brand-new carpet in the hallway. Mom’s ALREADY mad at me. Zu 2.7 ist anzumerken, dass die definiten NPs the teddy bear und insbesondere the holes durchaus als kohäsionsstiftend betrachtet werden können (bei the holes handelt es sich um einen ‘indirekten Verweis’ 1 auf teddy bear); dennoch ist nicht zu leugnen, dass beide Texte sicherlich nur “minimal kohäsiv”, dabei aber durchaus kohärent sind - wir haben bei der Lektüre keine Schwierigkeiten, naheliegende inhaltliche Verknüpfungen zwischen den Sätzen zu konstruieren. Die Leichtigkeit dieser Aufgabe hängt dabei durchaus von der jeweiligen Kohärenzrelation ab. Eine Kausalrelation kann, wie gesehen, per Weltwissen oft problemlos inferiert, also erschlossen, werden. Für die Relation Concession hingegen scheint die explizite Signalisierung durch einen Konnektor (also durch ein kohäsionsstiftendes Mittel) schlicht unumgänglich: 2 (2.9) Die Sonne schien uns schon seit Stunden bei der Arbeit auf den Kopf. Dennoch verging uns die gute Laune nicht. (2.10) Die Sonne schien uns schon seit Stunden bei der Arbeit auf den Kopf. Die gute Laune verging uns nicht. Die unverknüpfte Satzfolge (die sog. ‘asyndetische Verknüpfung’) in 2.10 wird mit hoher Wahrscheinlichkeit völlig anders interpretiert als 2.9. Weil die Konzessionsbeziehung eine recht komplexe ist, benötigen wir als Leser ein explizites sprachliches Signal, um sie zwischen zwei Aussagen herzustellen. Für Beispiel 2.9 lässt sich der Zusammenhang so umschreiben: “Eigentlich gilt, wem die Sonne bei der Arbeit auf den Kopf scheint, der wird schlecht gelaunt; in der aktuellen Situation gilt die Regel aber ausnahmsweise nicht; wir sind bei Arbeit und Sonnenschein gut gelaunt.” Kohäsion und Kohärenz sind die wichtigsten Charakteristika von Texten, doch sie sind nicht die einzigen. 2.4.1. Merkmale der Textualität Vielfach wird bei der Charakterisierung der Merkmale von Texten auf die Liste von de Beaugrande u. Dressler (1981) zurückgegriffen. Zu den oben besprochenen textinternen Merkmalen Kohäsion und Kohärenz treten bei diesen Autoren die folgenden fünf textexternen Merkmale hinzu, die auf die Kommunikationssituation bezogen sind. 1 Siehe dazu Abschnitt 4.1. 2 In gesprochener Sprache kann der konzessive Zusammenhang mitunter auch mit prosodischen Mitteln angezeigt werden. 2.4. Textualität 27 Intentionalität: Der Textproduzent hat den Text nicht zufällig, sondern mit einer Absicht verfasst, er möchte eine bestimmte Wirkung erzielen. Akzeptabilität: Der Text ist so beschaffen, dass die Rezipienten ihn auch als solchen einstufen und verstehen können. Mit anderen Worten, der Produzent hat seine Intention in einer Weise umgesetzt, die auf die Rezipienten und ihre Gewohnheiten zugeschnitten ist - die Intention ist rekonstruierbar. Informativität: Der Text ist für den Rezipienten nicht nur formal akzeptabel, sondern auch inhaltlich nicht “leer”; er teilt etwas mit. Dies bedeutet einerseits, dass der Rezipient neue Information vorfindet (die aber in “alte” Information eingebettet ist, um Anknüpfungspunkte zu schaffen), und andererseits eine angemessene Mischung aus “erwarteter” und “unerwarteter” Information. Wir können Informativität in einen Gegensatz zum Kohäsionsmittel ‘Rekurrenz’ stellen: Ein Text kann sehr kohäsiv sein, indem er unablässig dasselbe wiederholt, dabei vielleicht immer etwas reformuliert - dann mangelt es jedoch an Informativität. Situationalität: Der Text ist für die jeweils vorliegende Kommunikationssituation angemessen. Er trifft die konventionell übliche Stilebene (u. a. den Grad der Höflichkeit) und deckt den in der Situation bestehenden Informationsbedarf. Intertextualität: Der Text steht im Zusammenhang mit anderen Texten, etwa mit Texten der gleichen Sorte (siehe Kap. 3) oder mit Texten, aus denen er wörtlich oder sinngemäß zitiert. Für das Verständnis des Textes ist der Bezug zu anderen, bereits bekannten, Texten von Bedeutung. 3 Wir sollten nicht in die Versuchung geraten, eine solche Liste wiederum als ‘Definition’ zu betrachten. Die Merkmale sind nicht alle gleichermaßen notwendig, damit ein komplexes sprachliches Zeichen als ‘Text’ aufzufassen ist (allerdings lässt sich wohl sagen, dass sie in der Summe durchaus als hinreichend gelten dürften). Stattdessen können wir sie als Merkmale ansehen, nach denen ein Text mehr oder weniger prototypisch ist: Je mehr Abweichungen, desto “ungewöhnlicher” ist ein vorliegendes Text-Exemplar. Auf der anderen Seite muss sich eine solche Merkmal-Liste der Prüfung aussetzen lassen, ob die einzelnen Merkmale hinlänglich unabhängig voneinander sind. Für Kohäsion und Kohärenz hatten wir dies bereits anhand von Beispielen gezeigt. Auch für die anderen sollte idealerweise gelten, dass jeweils ein Merkmal von einem Text verletzt werden kann, ohne dass andere Merkmale dabei zwangsläufig ebenfalls Schaden nehmen. Für die oben aufgeführten Merkmale gelingt dies allerdings nur bedingt; eine Wechselwirkung ist beispielsweise zwischen dem Kriterien ‘Akzeptabilität’ und ‘Situationalität’ zu vermuten: Ein Text, der für die Äußerungssituation unangemessen ist, wird sicherlich auch als nicht-akzeptabel einzuordnen 3 Eine ausführlichere Diskussion des Kriteriums der Intertextualität liefert Adamzik (2004). 28 2. Kohäsion, Kohärenz und Textualität sein. Umgekehrt allerdings kann Nicht-Akzeptabilität auch auf die Verletzung eines anderen Kriteriums zurückzuführen sein als dem der Situationalität, so dass die Kriterien sicherlich nicht einander äquivalent sind. Das Merkmal ‘Intentionalität’ ist in der Praxis ausgesprochen schwierig zu untersuchen: Woher nehmen wir die Gewissheit, dass der Autor nicht eher wahl- und ziellos seine, immerhin vielleicht kohärent wirkenden, Sätze aneinandergereiht hat? Wir haben diese Gewissheit nicht, entscheidend ist aber, dass wir als Leser diese Intentionalität dem Autor nahezu automatisch unterstellen: Sobald wir uns mit der Lektüre eines Textes beschäftigen, nehmen wir an, dass er mit einer bestimmten Absicht erstellt wurde, und ein zentraler Aspekt des Verstehens ist genau die Rekonstruktion dieser Absicht. - Dieser Punkt wird uns im nächsten Kapitel und später in den Kapiteln 7 und 8 noch genauer beschäftigen. Zusammenfassend stellen wir fest, dass Textualität ein graduelles Maß ist, dem Texte mehr oder weniger Genüge tun; sie lässt sich durch eine Reihe von Merkmalen charakterisieren - und sie entbindet uns von der müßigen Aufgabe, nach einer vorgeblich klaren, ‘binären’ Unterscheidung zwischen Texten und Nicht-Texten zu suchen. Die Merkmale sind dabei nicht gleichrangig; darauf weist auch Sandig (2000) in ihrer Untersuchung der Prototypikalität von Texten hin. Sie rückt die ‘Textfunktion’ in den Mittelpunkt und nennt dann Kohäsion, Kohärenz, Situationalität und Thematizität als nachgeordnete Merkmale, anschließend eine ganze Reihe weiterer Aspekte, die dann allerdings als peripher gelten, so zum Beispiel die Zweidimensionalität des Textes, seine Gliederung, etc. 2.4.2. Strukturen im Text Zum Schluss des Kapitels wollen wir die Frage aufgreifen, die in der Einleitung bereits angeschnitten wurde: ob für die Beschreibung von Texten der Begriff Struktur geeignet ist. In der einschlägigen Literatur begegnet uns Textstruktur oder englisch discourse structure ja auf Schritt und Tritt. Der Begriff ist aber insofern problematisch, als er eine Analogie zur Struktur von Sätzen nahelegt, die sich bekanntlich systematisch in eine Reihe von Konstituenten gliedern, die nach Regeln der Wohlgeformtheit miteinander kombiniert werden. Der mitunter auch heute noch verwendete Begriff der Textgrammatik suggeriert ebenfalls eine solche Analogie. Dass sie jedoch nicht fruchtbar ist, wurde beispielsweise von Halliday u. Hasan (1989) ausdrücklich betont; nach ihrer Auffassung ist der Text ein semantisches Objekt, weshalb der Oberflächen-orientierte Strukturbegriff aus der Satzbaulehre gar nicht greifen könne. Diese skeptische Haltung scheint uns berechtigt. Versuche, für einen Text die Struktur anzugeben (wir werden einige in Kapitel 8 beschreiben), konzentrieren sich jeweils auf bestimmte Aspekte, etwa die Bedingungen für Pronominalisierung oder die Hierarchisierung von im Text vollzogenen Sprechhandlungen. Dabei werden aber jeweils allerlei andere Faktoren der Textualität ausgeblendet, und darüber sollte man sich bei der Rezeption solcher Ansätze im Klaren sein. Dennoch ist die Suche nach Struktur im Text keineswegs sinnlos. Erinnert sei noch einmal an den lateinischen Ursprung texere: verweben, verflechten. Verfloch- 2.5. Weiterführende Literatur 29 ten sind miteinander ganz unterschiedliche Ebenen der Beschreibung, auf denen sich jeweils auch Strukturen bilden, die dann insgesamt den Text zu dem machen, was er ist. Unser Ziel ist, zentrale Ebenen des Geflechts zu unterscheiden, sie jeweils einzeln möglichst systematisch zu charakterisieren - Struktur zu identifizieren - und dann am Ende die Textualität als Zusammenspiel der einzelnen Ebenen aufzufassen. Die Diskussion der Ebenen beginnt in Kapitel 4; zuvor befassen wir uns noch mit möglichen Kategorisierungen von Texten in ihrer Ganzheit. 2.5. Weiterführende Literatur Die hier nur sehr kurz angedeutete geschichtliche Entwicklung der Textlinguistik im deutschsprachigen Raum wird ausführlicher dargestellt im ersten Kapitel von (Adamzik, 2004). Der auch heute noch sehr lesenswerte “Klassiker” zu den Themen Kohäsion und Kohärenz ist das ursprünglich 1976 erschienene Cohesion in English (Halliday u. Hasan, 1989). Dieses Buch bespricht die Themen Referenz, Substitution, Ellipse, Konjunktion und lexikalische Kohäsion am Beispiel des Englischen mit bemerkenswerter Gründlichkeit. Zu beachten ist, dass die Untersuchungen der englischen Phänomene sich nicht ganz einfach auf das Deutsche übertragen lassen (z. B. spielt im Deutschen Elision eine wichtigere Rolle als im Englischen, wo stattdessen häufig die sog. one-anaphora verwendet wird); zudem ist wichtig, dass Halliday und Hasan - anders als wir es hier getan haben - terminologisch nicht zwischen ‘Kohäsion’ und ‘Kohärenz’ unterscheiden; sie verwenden den Begriff cohesion in einem allumfassenden Sinn. Stärker auf den auch von uns verwendeten Kohärenz-Begriff zugeschnitten ist die Untersuchung Coherence, Reference, and the Theory of Grammar (Kehler, 2002), die eine Theorie der Kohärenzrelationen entwirft und damit einige linguistische Phänomene der Referenz und Elision behandelt. Eine kurze Zusammenfassung der zentralen Aspekte dieser Arbeit liefert Kehler (2004). 2.6. Übungsaufgaben 1. Markieren Sie in Ihrem Kommentar (s. Übung 1 auf S. 18) alle kohäsiven Mittel mit einer fortlaufenden Nummerierung und erläutern Sie jedes gefundene Mittel kurz. 2. Versuchen Sie, Ihren Kommentar dergestalt umzuformulieren, dass er möglichst unkohäsiv wird - wobei seine inhaltliche Kohärenz allerdings nicht oder möglichst wenig leiden sollte. 3. Textfunktion, Textsorte und Texttyp Texte fallen nicht vom Himmel. Sie werden vom Verfasser geschrieben und an bestimmte Adressaten gerichtet, weil er damit ein Ziel erreichen möchte, und dementsprechend soll der Text eine Funktion erfüllen. In der Regel nehmen die Rezipienten diese Funktion nicht allein durch das sprachliche Material des Texts wahr, sondern im Zusammenspiel mit einer aktiven, erwartungsgesteuerten Kategorisierung: Der Text wird nicht als “irgendein” Text gelesen, sondern als Exemplar einer bestimmten Textsorte - was unter anderem auch eng mit der Funktion des Texts zusammenhängt. Nach Besprechung dieser beiden textglobalen Merkmale werden wir uns der sprachlichen Realisierung einzelner Abschnitte zuwenden und Texttyp als ebenfalls funktionalen Begriff definieren, der jedoch enger mit Merkmalen der Sprachoberfläche verknüpft ist. 3.1. Textfunktion Die Frage nach der Funktion eines Textes gründet letztlich in der abstrakteren Frage nach den Funktionen von Sprache allgemein, denn der Text ist ja nichts anderes als eine - potenziell komplexe und sorgfältig geplante - sprachliche Äußerung. Als Rahmen für die Untersuchung der Sprachfunktion hat sich das von Bühler (1982, orig. 1934) entworfene Organon-Modell bewährt, demzufolge sprachliche Zeichen (gleichzeitig) drei Funktionen erfüllen können: • Funktion der Darstellung von Gegenständen, Sachverhalten und Ereignissen; • Funktion des Ausdrucks der inneren Befindlichkeit, der Emotionen und der Einstellungen des Zeichenbenutzers; • Funktion des Appells, mit dem ein Zeichenbenutzer den Adressaten zu bestimmten Reaktionen veranlassen möchte. Der parenthetische Verweis auf die potenzielle Parallelität dieser drei Ebenen bedeutet für den Text und seine Autorin, dass es die Funktion mitunter nicht gibt, sondern die Autorin mehrere Ziele gleichzeitig verfolgen kann. In einem Meinungstext beispielsweise kann sie Sachverhalte darstellen, auch ihre innere Einstellung zu diesen Sachverhalten kundtun, und möglicherweise auch an die Leserschaft appellieren, eine bestimmte Haltung dazu einzunehmen. Brinker (2001) geht daher davon aus, dass die Funktionsanalyse darauf zielt, jeweils die dominierende Textfunktion zu ermitteln, der die möglichen anderen nur nachgeordnet sind. 32 3. Textfunktion, Textsorte und Texttyp In unserem Beispiel des Meinungstexts könnten wir davon ausgehen, dass sowohl die Sachverhaltsdarstellung als auch die Einstellungskundgabe der Autorin letztlich zu dem Ziel beitragen sollen, die Haltung der Leser zu verändern; dann wäre die Appellfunktion die dominierende. Im Anschluss an Grosse (1976) charakterisiert Brinker (2001, S. 95) die Textfunktion als die “im Text mit bestimmten, konventionell geltenden, d. h. in der Kommunikationsgemeinschaft verbindlich festgelegten Mitteln ausgedrückte Kommunikationsabsicht” des Textproduzenten. Es handelt sich also nicht um das möglicherweise im Hintergrund bleibende verborgene Ziel der Autorin, sondern um dasjenige, welches die Leser dem Text entnehmen können, weil es durch konventionalisierte Mittel - vielleicht auch mit Hilfe des konventionalisierten Kontexts - erkennbar ist. Brinker (2001, Abschn. 4.4) knüpft mit seinem Vorschlag eines Inventars möglicher Textfunktionen an die Sprechakttheorie nach Austin und Searle an, auf die wir erst in Abschnitt 7.1 eingehen werden. An dieser Stelle seien daher Brinkers Funktionstypen ohne weitere historische Einordnung lediglich genannt: 1 • Informationsfunktion: Der Produzent gibt der Adressatin zu verstehen, dass er sie über etwas informieren, Wissen vermitteln möchte. • Appellfunktion: Der Produzent gibt der Adressatin zu verstehen, dass er sie dazu bewegen will, die Einstellung X einzunehmen oder die Handlung Y zu vollziehen. • Obligationsfunktion: Der Produzent gibt der Adressatin zu verstehen, dass er sich ihr gegenüber dazu verpflichtet, Handlung X auszuführen. • Kontaktfunktion: Der Produzent gibt der Adressatin zu verstehen, dass es ihm um die personale Beziehung zur Adressatin geht (um Herstellung, Erhaltung, Beendigung des persönlichen Kontakts). • Deklarationsfunktion: Der Produzent gibt der Adressatin zu verstehen, dass der Text eine neue Realität schafft, d. h. dass die Äußerung des Texts die Einführung eines bestimmten Faktums bedeutet. Wie ermittelt ein Leser nun die Textfunktion oder das, was er dafür hält? Die Frage hat zwei Aspekte: Zum einen ergibt sich die Textfunktion durch das Zusammenspiel der einzelnen Teile des Textes; um dies zu untersuchen, benötigen wir eine Begrifflichkeit für die Beschreibung dieser “Einzelteile” (siehe Kapitel 9), sowie eine Beschreibung des (funktionalen) Zusammenwirkens dieser Einzelteile - damit werden wir uns in den Kapiteln 7 und 8 beschäftigen. Zum anderen müssen wir nach den sprachlichen Signalen fragen, die die Funktion eines Satzes oder Textabschnitts anzeigen können und damit auch Hinweise auf die Gesamtfunktion des Textes liefern. Damit befassen wir uns in den Abschnitten 7.4 (Inventar von Sprechhandlungstypen) und 9.2 (sprachliche Signale für Sprechhandlungen). Auf den nächsten Seiten soll aber zunächst ein weiterer wichtiger Einflussfaktor zur Sprache kommen: die Sorte des Textes. 1 Eine vergleichende Diskussion der Ansätze von Bühler, Searle, Brinker und auch Jakobson findet sich bei Adamzik (2004). 3.2. Textsorte 33 Abbildung 3.1.: Zwei Beispieltexte unterschiedlicher Sorten 3.2. Textsorte Dass wir Texte unterschiedlichen Sorten zuordnen, leuchtet intuitiv sehr schnell ein, denn die Alltagssprache hält eine Vielzahl von Bezeichnungen bereit, mit denen wir Texte sortieren. Nicht das einzige, aber ein wichtiges Kriterium dafür ist bereits ihre äußere Gestalt: Schon ein flüchtiger Blick auf die beiden Texte in Abb. 3.1 2 macht deutlich, dass Nachrichtenmeldung und Kochrezept zwei sehr unterschiedliche und jeweils schnell identifizierbare Textsorten darstellen. In der Textlinguistik ist der Begriff der Textsorte außerordentlich intensiv untersucht worden, und entsprechend vielfältig ist die Menge entsprechender Publikationen. Und doch scheint der Begriff sich einer (auch breiter akzeptierten) Definition beharrlich zu widersetzen. So kommt Heinemann (2000) in einem Übersichtsbeitrag im ‘Handbuch Text- und Gesprächslinguistik’ zu diesem Schluss: Versucht man aber, aus der Vielzahl textsortenspezifischer Einzeldarstellungen (...) und aus den drei Kolloquien zu dieser Thematik (...) ein Resümee abzuleiten, dann zeigt sich, daß sich das Maß an GEMEIN- SAMKEITEN IN DEN ARBEITEN [Hervorh. d. Verf.] zur Textsortenproblematik eher bescheiden ausnimmt. (...) So bleibt im Grunde nur die alte Formel von Peter Hartmann (...): Textsorten sind ‘Mengen von Texten mit bestimmten gemeinsamen Eigenschaften’. Dies klingt für eine wissenschaftliche Untersuchung der Thematik zunächst nicht sehr vielversprechend. Um zu verstehen, von welcher Art die “gemeinsamen Eigenschaften” sein können, betrachten wir ein häufig zitiertes Beispiel aus einer 2 Die Abbildungen sind bewusst klein gehalten, um das Layout in den Vordergrund zu rücken. Quellen: www.tagesspiegel.de und www.maggi.de 34 3. Textfunktion, Textsorte und Texttyp gesprochen spontan monologisch dialogische Textform räumlicher Kontakt zeitlicher Kontakt akustischer Kontakt Form des Textanfangs Form des Textendes festgelegter Textaufbau Thema festgelegt 1. Person 2. Person 3. Person Imperativformen Tempusformen ökonomische Formen Redundanz Ausschließlich Sprachliches Gleichber. Kommunikationsp. Interview + ± − − ± + + ± ± − + + + + ± ± ± ± + − Brief − ± ± − − − − + + − ± + + + ± ± ± ± + ± Telefongespräch + ± − − − + + + + − ± + + + ± ± ± ± ± ± Gesetzestext − − + − − − − + + − + − − + − − − − + − Arztrezept − − + − − − − + + + + − − − − − + − + − Kochrezept ± − + − ± ± ± + − + + − − + ± − ± − + − Wetterbericht ± − + − − + ± + − + + − − + − − ± − + − Traueranzeige − − + − − − − + + + + ± − + − − ± − ± ± Vorlesung(sstunde) + ± + − + + + + ± − + ± ± + ± ± − ± ± − Vorlesungsmitschrift − − + − − − − ± − − + − − + − − + − ± + Reklame ± ± ± ± ± ± ± ± ± − ± ± ± ± ± ± ± ± ± − Stelleninserat − − + − − − − + + + + ± ± + ± − ± − + − Rundfunknachrichten + − + − − + + + + − − − − + − + − ± + − Zeitungsnachricht − − + − − − − + − − + − − + − + − − + − Telegramm − − + − − − − + + − + ± ± + ± − + − + ± Gebrauchsanweisung − − + − − − − ± − − + − ± + ± − ± ± ± − Diskussion + ± − − ± + + + + − + + + + ± + − ± + ± familiäres Gespräch + + − ± + + + ± − − − + + + ± ± ± + ± + Abbildung 3.2.: Merkmalbasierte Klassifikation von Gebrauchstextsorten (nach Sandig (1972, S. 118); Spaltenköpfe teilweise nach Heinemann u. Viehweger (1991, S. 136)) frühen Arbeit von Sandig (1972). In Abb. 3.2 3 vergleicht die Autorin 18 Textsorten miteinander und stellt die Abgrenzung durch die in den Spalten angegebenen Merkmale her. + und − geben an, ob das Merkmal für die Textsorte zutrifft oder nicht; bei ± trifft es nur auf manche Exemplare der Sorte zu. Das Ziel einer solchen Analyse besteht also darin, eine Menge von Merkmalen zu definieren, die einerseits geeignet ist, eine Textsorte hinlänglich zu charakterisieren, andererseits die jeweils untersuchten Sorten voneinander abgrenzt, also auch ihre Unterschiede benennt. Wenn Sandigs Zuordnungen stimmen (worauf wir hier nicht eingehen wollen), so ist das zweite Ziel erreicht, denn es gibt in der Tabelle keine zwei identischen Zeilen. Dass sich auf diesem Weg allerdings keine wirklich umfassende Klassifikation vieler (aller? ) Textsorten erstellen lässt, hat auch Sandig (1972) selbst bereits festgestellt; sie weist darauf hin, dass es nur ein fragmentarischer Vorschlag sei und dass viel zu viele Merkmale untersucht werden müssten, um eine größere Zahl von Textsorten zu behandeln. Ist demzufolge Pessimismus für die Frage nach Textsorten angebracht? Das hypothetische “Maximalziel” einer Behandlung des Begriffs umfasst wohl die folgenden drei Schritte: • Schlüssige und präzise Definition des Begriffs ‘Textsorte’; 3 Mit freundlicher Genehmigung des Autors entnommen aus (Rehm, 2007). 3.2. Textsorte 35 • Beschreibung der Beziehungen zwischen verschiedenen Textsorten, Aufstellung einer (möglichst vollständigen! ) Typologie; • Angabe der Merkmale, die jeweils eine Textsorte auszeichnen (Layout, Struktur- und Formulierungsbesonderheiten, inhaltlich-thematische Aspekte, die kommunikativen Funktionen, etc.) und sie von allen anderen Sorten abgrenzen. Mit diesem Anspruch auf Vollständigkeit ist das Ziel wohl nicht erreichbar. Adamzik (1995) rät denn auch dazu, die Perspektive der Textsortenforschung und die der Texttypologie auseinanderzuhalten: Erstere befasse sich mit der Beschreibung einzelner oder einer Menge verwandter Textsorten, während letztere das Ziel eines Gesamtüberblicks, einer schlüssigen Klassifikation im Prinzip aller Exemplare von Texten verfolge. Dies aber ist ein anspruchsvolles Unterfangen. Für die Umsetzung hatte bereits Isenberg (1974) eine einheitliche Typologisierungsbasis gefordert - eine wohlbegründete Menge von Kriterien, anhand derer alle Texte beurteilt werden müssten. Dem fügte Steger (1983) zwei Forderungen hinzu, nämlich die der Monotypie (die Kriterien sollen so gewählt sein, dass jeder Text genau einer Sorte zugeordnet wird) und die der Reproduzierbarkeit (die Auswertung der Kriterien für ein Textexemplar muss intersubjektiv nachvollziehbar sein). Die Schwierigkeit dieser Zielvorstellung wird deutlich, wenn wir die Bandbreite der von Sandig benannten Merkmale (Abb. 3.2) beleuchten: Hier spielen Faktoren des Kommunikationsmediums ebenso eine Rolle wie die der Kommunikationssituation, hinzu kommen syntaktische Merkmale, eher vage formulierte Beobachtungen zum Textaufbau, sowie “Meta-Merkmale” wie Redundanz. Streben wir nun eine “einheitliche Typologisierungsbasis” an, müssten wir uns wohl auf Merkmale einer bestimmten Beschreibungsebene konzentrieren; damit ginge aber einher, dass andere Typologisierungsbasen ebenfalls möglich wären, womit die Forderung nach Monotypie kaum zu erfüllen ist. Ein anderes Problem der Texttypologie haben wir eingangs bereits angedeutet: Die Alltagssprache hält durchaus Fragmente von Klassifikationen bereit, die von Sprachbenutzern problemlos verwendet werden; 4 eine wissenschaftliche Typologie müsste sich nun entscheiden, diese entweder zu integrieren, oder davon losgelöst zu operieren. Wie viele andere Autoren mahnt Heinemann (2000) an, dass eine Texttypologie zu Alltagsklassifikationen zumindest kompatibel sein sollte, um überhaupt aussagekräftig zu sein. In diesem Zusammenhang ist dann auf eine Untersuchung von Dimter (1981) zu verweisen, der nach Durchsicht des Duden Wörterbuchs 1642 Textsortenbezeichner identifiziert hat, wovon 480 ‘grundlegend’ und die übrigen ‘abgeleitet’ waren, z. B.: Bericht - Reisebericht, Arbeitsbericht, Ergebnisbericht, usw. Ein zweiter, vermutlich vielversprechenderer, Zugang zur Textsortenfrage besteht - wie oben dargestellt - in der Konzentration auf einzelne verwandte Sorten, die man möglichst gründlich charakterisieren und voneinander abzugrenzen sucht. Auch hier kommt man freilich nicht umhin, die existierenden alltagssprach- 4 Im Englischen ist dafür der Ausdrück folk taxonomies gebräuchlich. 36 3. Textfunktion, Textsorte und Texttyp Textsorten in Zeitungen Publizistische Textsorten informationsbetont vorrangig gewichtet rein faktenorientiert: BEKANNTGABE primär informierend: KURZNACHRICHT zusammenhangsorientiert: NACHRICHT chronologisch geschehensorientiert: BERICHT erlebnisorientiert: REPORTAGE beiläufig redaktionell: HINWEIS / MELDUNG amtlich: BEKANNTMACHUNG kommerziell: ANZEIGEN meinungsbetont stellvertretend argumentativ: KOMMENTAR polemisch: GLOSSE kritisch: BESPRECHUNG analytisch. DIAGNOSE direkt: INTERVIEW / LESERBRIEF / ZITAT Annektierte Textsorten literarisch: ROMAN / KURZGESCHICHTE / WITZ / ANEKDOTE / SPRUCH instruierend handlungsorientierend praktisch: ANLEITUNG / KOCHREZEPT lebenspraktisch: RATSCHLAG / HOROSKOP lektüreorientierend: IMPRESSUM / INHALTSVERZEICHNIS / BEILAGENHINWEIS Abbildung 3.3.: Sorten von Pressetexten nach Hundsnurscher (1984) lichen Begriffe zur Kenntnis zu nehmen. Zur Illustration zeigt Abb. 3.3 eine von Hundsnurscher (1984) vorgeschlagene Taxonomie der Textsorten in Zeitungen. 5 Das primäre Auswahlkriterium ist hier also die Zugehörigkeit zu einem “Alltagsgegenstand”, während die Merkmale zur Differenzierung der einzelnen Sorten dann aus ganz unterschiedlichen Domänen stammen. Lassen sich aber auch allgemeinere Kriterien zur Charakterisierung und Differenzierung von Textsorten angeben, die für möglichst viele Texte greifen? Listen solcher Kriterien wurden in der Literatur in der Tat mehrfach vorgeschlagen; die folgende ist eine Kombination aus denen von Linke u. a. (1994), Brinker (2001) und Gansel u. Jürgens (2002). Im allgemeinen wird unterschieden zwischen textinternen Faktoren: • Graphische Ebene: Layout • Textlänge • Textstrukturmuster: Abfolge der Teiltexte • Signale der Textgliederung • Eröffnungs- und Schlussformeln • Wortwahl: typische Lexeme und Kollokationen 5 Eine ebenfalls interessante Untersuchung des Bereichs ‘Pressekommunikation’ liefert Bucher (1986). 3.2. Textsorte 37 • Art und Häufigkeit von Satzbaumustern und gramm. Kategorien (Tempus, Modus) • Thema und Themenverlauf • Thema-Rhema Gliederung und textexternen Faktoren: • Textfunktion • Kommunikationsmedium: face-to-face, Telefon, Rundfunk, Fernsehen, Brief, Zeitungsartikel/ Buch (abgrenzbar durch die Merkmale Kommunikationsrichtung, unmittelbarer Kontakt, Sprache / Schrift) • Kommunikationssituation, Handlungsbereich: privat / offiziell (Geschäftspartner, o. ä.) / öffentlich (Massenmedien) Im Folgenden richten wir unsere Aufmerksamkeit auf die textinternen Faktoren und zunächst speziell auf die im engeren Sinne linguistischen Merkmale (also ohne Layout und Textaufbau). Sind diese womöglich bereits ausreichend für die Charakterisierung einer Textsorte? In ihrer einfachsten Form würde eine solche “Signaltheorie” (Bucher, 1986) besagen, dass sich die Textsorte aus einer Menge von strukturellen, an der Oberfläche erkennbaren Merkmalen des Textes direkt ablesen lässt. Dass dies nicht haltbar ist, dürfte wohl unstrittig sein, ebenso wie wir im letzten Abschnitt festgestellt haben, dass die Textfunktion nur in Ausnahmefällen unmittelbar “abgelesen” werden kann. Allerdings sollte die Kritik an linguistischstrukturellen Ansätzen auch nicht von vornherein Vereinfachungen unterstellen; Heinemann (2000, S. 530) etwa konstatiert, diese Ansätze “greifen offenkundig zu kurz” da beispielsweise die Satzkomplexität, der jeweilige Nomen-Verb-Quotient und der Gebrauch bestimmter Deiktika bei Pressenachrichten oder Verträgen nahezu kongruent sein könnten, obwohl diese Texte unterschiedlichen Sorten angehörten. - Die Tatsache, dass einige Merkmale nicht distinktiv sind, besagt ja nicht, dass eine Unterscheidung durch andere Merkmale ebenfalls unmöglich ist. Gerade für das Paar Vertrag-Pressenachricht dürfte dies relativ leicht bereits durch Gliederungsmerkmale realisierbar sein (etwa: Paragraphenzeichen, Nummerierung im Vertrag, aber nicht im Pressetext). Ein interessantes Indiz für die prinzipielle Verbindung zwischen strukturellen Merkmalen und Textsorten sind die Ergebnisse eines Experiments von Dimter (1981). Er stellte sich die Frage, ob Leser in der Lage sind, Texte unabhängig vom behandelten Thema bestimmten Sorten zuzuordnen. Dazu sammelte er Texte aus zehn verschiedenen Sorten (Bedienungsanleitung, Todesanzeige, Geschäftsbrief, Kommentar, etc.) und ersetzte die Inhaltswörter durch Zeichenfolgen, die keine deutschen Wörter darstellen, jedoch prosodisch “deutsch klingen” und die Flexionsendungen beibehalten. Jegliches Layout wurde entfernt. Im Text verblieben die originalen Pronomen, Artikel, Konjunktionen, Zahlwörter, sowie die Formen von haben, werden und sein. Zwei Beispiele für diese Text-Gebilde: 38 3. Textfunktion, Textsorte und Texttyp (3.1) Berrung Ihres Salex SSQ Duren und ablauffen des abrungenden Kattes as belasen Argen und Besinden. Beise Ergen sind kur einen Oppelund gefannt. Duren und anflaffen des abrungenden Kattes as belasen Argen und Besinden und seich sugen rellen Sie die langenden Veronden, ange Sie den Katt angedurkt woren. Duren Sie den abrungenden Katt enel ark anunder und laffen Sie ihm em al, belasen Kanot und Fat on der Munne. (3.2) Lestingers erwestete Rodenberk Der Lac Lestinger hat zwei Belickte das Belagen Lestingers als Bugatebreswüger wegelbrat und das Belagen des Gewoderkaribenten hale. Der Bugatebreswüger wenkte nebe behle einem begarren Vorwelbris magnen, wenn nicht der Gewosterkaribent herres winn grens lennem lechte. Wie wenk man ein solches Rabigernel emarst ertetene vermorren und sodann herre Boneter der Liwastik woten? Wie werk man sich erfenlas sum einen Granz rud lesenmasiges Kargbrienkei erhohren und sich ogenlas als eine Berg Lesenmaler betahnen? (...) Den Versuchspersonen wurden zunächst zur Orientierung beispielhaft drei Textsorten genannt, doch die Bezeichnungen der anderen zugrunde gelegten Sorten blieben unbekannt. Das Ergebnis: Todesanzeigen, Testamente, Kochrezepte wurden von den Versuchspersonen zu mehr als 90% als solche identifiziert, am Ende der Skala steht der Kommentar, der immerhin noch zu 42% richtig erkannt wurde. 6 In einem studentischen Semesterprojekt an der Universität Potsdam wurde Dimters Experiment in etwas veränderter Form nachgestellt, wobei seine Ergebnisse im Wesentlichen bestätigt wurden. Es scheint also für Leser durchaus nachvollziehbare Zusammenhänge zwischen der Textoberfläche und der unterstellten Textsorte zu geben. 3.2.1. Fallbeispiel: Kommentar Kommentare zählen zusammen mit vielen politischen Schriften, wissenschaftlichen Aufsätzen und Leserbriefen zu den argumentativen Texten (vgl. Abb. 3.3), in deren Mittelpunkt immer die Frage steht: “Für oder gegen T? ” (Eggs, 2000). Der Typus des zu verhandelnden Gegenstands T bestimmt nach Eggs auch den Typus der Argumentation: • das epistemische Argument belegt oder bestreitet einen bestimmten Sachverhalt (z. B.: “Der Präsident der USA ist der mächstigste Mann der Welt”); • das deontische Argument rät für oder gegen eine bestimmte Handlung (z. B. “Wir sollten das deutsche Bildungssystem reformieren”); 6 Die ausführliche Dokumentation findet such im Anhang des Buches von Dimter (1981). 3.2. Textsorte 39 • das ethisch/ ästhethische Argument bewertet etwas als gut vs. schlecht bzw. schön vs. unschön (z. B. “Richard von Weizsäcker war ein hervorragender Bundespräsident”). Alle drei Typen von Argumentationen haben gemeinsam, dass die Autorin die Einstellung der Leser beeinflussen möchte; im schwierigsten Fall soll ein Leser nach der Lektüre etwas glauben, was er zuvor nicht geglaubt hat oder von dessen Gegenteil er gar überzeugt war. Dies unterscheidet das Argumentieren vom Erklären, bei dem der Leser etwas verstehen soll, was er bislang nicht verstanden hat (Warum ist X der Fall? Zu welchem Zweck handelt X in dieser Weise? ) - wobei dieses X aber eben nicht ‘strittig’ ist, d. h. es geht nicht um “für oder gegen X”, sondern allein um “warum/ wozu X”. Während die obige Klassifikation den Typ des verhandelten Gegenstands betrifft, können Kommentare auch hinsichtlich ihrer Vorgehensweise unterschieden werden. So schlagen Schneider u. Raue (1996) folgende Kategorien von Kommentaren - also eine weitere Untergliederung dieser Textsorte - vor: • Einerseits-andererseits: Der Autor wägt Für und Wider ab, kommt möglicherweise zu einem Fazit; typisch sind Andeutungen und bedächtige Urteile; oft bleibt der Kommentar im Entweder-Oder stecken. • Pro und Kontra: Es gibt eine nachvollziehbare und spannende Argumentation und am Ende eine eindeutige Schlussfolgerung. • Meinungsartikel: Der Autor geht langsam vor, die Leser sollen vor allem nachdenklich gestimmt werden. • Kurzkommentar: Es gibt kaum Raum für eigene Argumente, stattdessen wird mit Zitaten gearbeitet und zu einem kräftigen Urteil zugespitzt. • Pamphlet: Die “gröbste” Form des Kommentars kommt auch ohne Argumente aus und “wirkt wie ein Keulenschlag”. Im Potsdamer Kommentarkorpus (Stede, 2004a) sind u. a. kurze Artikel aus der Rubrik ‘Pro & Contra’ des Berliner Tagesspiegel am Sonntag zusammengestellt, die sich recht eindeutig der o. g. gleichnamigen Kategorie zuordnen lassen: Es gibt eine aktuelle Streitfrage der Lokalpolitik, zu denen jeweils zwei konträre Meinungen ausgeführt werden. 7 Weisen diese Texte Gemeinsamkeiten im Aufbau auf, die als charakteristisch für die Textsorte gelten können? Nach Untersuchung von 30 zufällig ausgewählten Kommentaren aus dem Korpus hat sich gezeigt, dass die folgenden Bezeichnungen inhaltlicher Zonen geeignet sind, die Zusammensetzung der Kommentare zu beschreiben: • Einführung / Problemdarstellung • Hintergrundinformation 7 Zwei Beispieltexte finden sich auf den Seiten 116 und 126. 40 3. Textfunktion, Textsorte und Texttyp • Beispiel • These bzw. Forderung des Autors • Argumentation für die Meinung des Autors • Argumentation gegen die Meinung des Autors • Fakt zur Stützung einer Argumentation • Abschwächung / Widerlegung einer Argumentation • Schlussfolgerung / Fazit Nicht jeder Kommentar weist alle Zonen auf, und es gibt natürlich keine feste Abfolge der Zonen. Doch lassen sich klare Tendenzen ermitteln, welche Zonen häufiger oder seltener benachbart auftreten, und welche besonders häufig am Anfang bzw. Ende des Kommentars auftreten. Diese Analyse führt zu einer abstrakten Darstellung der typischen Argumentationsmuster in solchen ‘Pro & Contra’ Texten, was wir hier aber nicht vertiefen wollen. Stattdessen werfen wir noch einen Blick auf Merkmale der einzelnen Sätze. Hier ist eine Korpusuntersuchung von Morgenthaler (1980, S. 117) von Interesse, der die Textsorten Nachricht und Kommentar miteinander verglichen hat. Er hat seine Beispieltext zunächst in ihre “kleinsten kommunikativen Einheiten” aufgeteilt und diese dann auf ihre pragmatische Funktion hin überprüft. In den Nachrichten fanden sich unter den insgesamt 945 Einheiten 926 ‘Mitteilungen’, 19 ‘Wertungen’ und 18 ‘Behauptungen’. Die Kommentare hingegen setzten sich anders zusammen: Von insgesamt 713 Einheiten waren 503 ‘Wertungen’, 112 ‘Behauptungen’, 62 ‘Mitteilungen’, 27 ‘Aufforderungen’ und 11 ‘Äußerungen von Emotionen’. Hier schließt sich nun die Frage an, ob die pragmatische Funktion jeweils mit linguistischen Merkmalen an der Satzoberfläche einhergeht - ein Aspekt, dem wir uns aber erst in Abschnitt 9.2 zuwenden werden. 3.2.2. Quantitative Korpusanalyse In seinem Buch Linguistische Textanalyse beschließt Brinker (2001) den Abschnitt zu Textsorten mit der Beobachtung, dass in einzelnen Textsorten “gewisse Präferenzen für bestimmte lexikalische und/ oder syntaktische Mittel” vorliegen, die mit quantitativ-statistischen Methoden zu erfassen seien. Diesen wichtigen Hinweis wollen wir hier aufnehmen und einen Schritt weiterführen, indem wir einen Ansatz zur statistischen Analyse von Textsorten kurz vorstellen. Insbesondere wenn man sich der Sortenfrage aus linguistisch-grammatischer Perspektive nähert, benötigt man nachprüfbare quantitative Informationen, um Aussagen über das Vorkommen sprachlicher Phänomene in Texten bestimmter Sorten zu treffen; und die Frage, ob die Sorten sich hinsichtlich des Auftretens dieser Phänomene auch wirklich signifikant unterscheiden, kann nur durch statistische Auswertung ermittelt werden, die über die bloße Auszählung von Merkmalen hinausgeht. 3.2. Textsorte 41 Als wegweisend für diese Untersuchungsrichtung gelten die Arbeiten von Douglas Biber, der sich insbesondere mit Unterschieden zwischen gesprochener und geschriebener Sprache, aber auch mit solchen zwischen Textsorten befasst hat. Im Folgenden beziehen wir uns auf die Darstellung in (Biber, 1993), die einige, teils mündliche, teils schriftliche sog. registers miteinander vergleicht; wir verwenden dafür in diesem Abschnitt wiederum den Terminus Textsorte, hier also in einem etwas weiteren Sinne. Biber arbeitete mit zwei recht bekannten Korpora des gesprochenen und geschriebenen English (‘Lancaster-Oslo/ Bergen’ sowie ‘London-Lund’), die er zunächst mit 67 linguistischen Merkmalen annotierte - weitgehend automatisch, jedoch mit manueller Nachkorrektur. Zu den Merkmalen zählen beispielsweise Tempus, Aspekt, Zeit- und Ortsadverbiale, die Wortarten, Modalverben, lexikalische Spezifizität, stilistisch-lexikalische Klassen (ausweichende oder emphatische Wörter etc.), Elision, diskontinuierliche Strukturen, Passiv, subordinierte Sätze, Koordination, und Fragesätze. Nach dieser Vorverarbeitung zählte er zunächst die Häufigkeit der Merkmale in den einzelnen Texten, die er dann normalisierte zur Zahl des Auftretens je 1000 Wörter. Der zentrale statistische Analyseschritt ist nun die Faktorenanalyse, die errechnet, welche der Merkmale überdurchschnittlich häufig miteinander auftreten - wie dies im Detail geschieht, ist in (Biber, 1993) nachzulesen. Aus der Faktorenanalyse resultieren Merkmalsbündel, die Biber Dimensionen nennt. Die grundlegende These seiner Arbeit ist, dass die Merkmalsbündel sich nicht rein zufällig ergeben, sondern dass die Dimensionen funktional interpretiert werden können. In seiner Studie gelangte Biber zu folgenden fünf Dimensionen, die wir hier mit einigen der Merkmale illustrieren. Ebenfalls sind Textsorten angegeben, die sich anhand der Dimensionen gut unterscheiden lassen. (1) Informational versus involved production Die beiden Pole dieser Skala werden durch sorgfältig produzierte monologische Texte (“offizielle” Dokumente, akademische Aufsätze, etc.) auf der einen, und persönliche Interaktion (Gespräche, private Briefe, etc.) auf der anderen Seite gebildet. Für erstere steht die Informationsvermittlung im Vordergrund, es werden viele Substantive, Adjektive, Präpositionalphrasen verwendet; lange Wörter sind häufig. Bei der Interaktion treten demgegenüber viele Pronomina und Elisionen, Fragen und stilistisch markierte Wörter auf. (2) Narrative versus nonnarrative concerns Die erzählenden Texte (Sorte: fiktional) zeichnen sich durch Vergangenheitsformen, perfektiven Aspekt und Pronomina der 3. Person aus. In nicht-erzählenden Texten (u. a. Geschäftsbriefe, Telefongespräche, darstellende Texte) findet sich eher das Präsens, attribuierende Adjektive sind häufig. (3) Elaborated versus situation-dependent reference Texte mit situationsbezogener Referenz (Rundfunkmeldungen, Gespräche, fiktionale Texte und private Brie- 42 3. Textfunktion, Textsorte und Texttyp Abbildung 3.4.: Textsorten und funktionale Dimensionen (Biber, 1993, S. 230) fe) verwenden Zeit- und Ortsadverbiale überdurchschnittlich häufig; abstraktere Texte mit situationsunabhängiger Referenz (u. a. offizielle Dokumente, Geschäftsbriefe) sind demgegenüber reich an WH-Relativsätzen, phrasaler Koordination und pied-piping constructions. (4) Overt expression of persuasion Offen argumentierende Texte (Meinungsartikel, Geschäftsbriefe) verwenden auffallend viele Modalausdrücke, illokutive Verben und konditionale Unterordnung (z. B. wenn-dann Sätze). Am anderen Ende der Skala stehen nicht-argumentierende Rundfunkmeldungen und Presseberichte, die nicht durch besonders häufige Merkmale gekennzeichnet sind. (5) Abstract versus nonabstract style Auch hier nennt Biber Merkmale nur für die Textsorten an einem Ende der Skala, den abstrakten Stil: Technische und akademische Texte sowie Geschäftsbriefe verwenden gern Passivkonstruktionen ver- 3.2. Textsorte 43 schiedener Art; dies gilt nicht für Gespräche, fiktionale Texte, private Briefe u. a. Im nächsten Schritt werden für die Dimensionen numerische Skalen definiert, auf der sich die Textsorten dann auftragen lassen. Beschränkt man sich auf zwei Dimensionen, lässt sich das Ergebnis im Koordinatensystem anschaulich darstellen; ein Beispiel gibt Abb. 3.4 mit den o. g. Dimensionen 1 und 3. Fügt man die weiteren Dimensionen hinzu, so erhält man einen höherdimensionalen Vektorraum, in dem jede Textsorte verortet ist, und es lassen sich beispielsweise die Abstände zwischen ihnen berechnen. Biber zeigt, dass die von ihm untersuchten Sorten entlang der genannten fünf Dimensionen in der Tat klar voneinander unterschieden werden können. Verfahren dieser und ähnlicher Art haben dann auch in der Computerlinguistik zu erfolgreichen Systemen zur automatischen Klassifikation von Texten anhand eines vorgegebenen Sorteninventars oder zum clustering (Gruppierung von Texten gemäß Ähnlichkeit, ohne vorgegebenes Inventar) geführt. 3.2.3. Textsortenwissen Eine recht gelungene Charakterisierung des Textsortenbegriffs geben Gansel u. Jürgens (2002, S. 78): Textsorten konstituieren sich durch ein prototypisches Aufeinander- Bezogen-Sein kontextueller und struktureller Merkmale. Sie bilden den Rahmen für prototypische, auf Konventionen der Sprachteilhaber beruhende sprachliche Muster mit charakteristischen funktionalen, medial-situativen und thematischen Merkmalen sowie einer diesen Merkmalen entsprechenden formalen Struktur. Sowohl bei der Textproduktion als auch bei der Textrezeption spielen also konventionalisierte Muster eine zentrale Rolle: Sie geben uns bei der Textproduktion (flexible) Schablonen vor und lösen bei der Rezeption eine Erwartungshaltung zu Form und Inhalt aus, die die Verarbeitung des Textes steuert und effizienter gestaltet. Damit steht solcherlei Wissen über Textsorten freilich in unmittelbarer Nachbarschaft zu anderem Wissen über sonstige konventionalisierte, nicht-textgebundene Handlungsmuster: Wie bestelle ich ein Menü im Schnellrestaurant versus im gehobenen Restaurant; wie führe ich ein Bewerbungsgespräch; wie befrage ich als Arzt meinen Patienten, um die Quelle des Unwohlseins einzukreisen; etc. pp. Unser Textsortenwissen befähigt uns also bei der Rezeption, einen Text als Exemplar einer bestimmten Textsorte zu identifizieren, und bei der Produktion, einen - in bezug auf Layout und sprachliche Form - angemessenen Text zu erstellen. Entsprechende Merkmale hatten wir oben (S. 36) genannt, wir fassen hier noch einmal zusammen: Die Textfunktion und das Thema (siehe Kapitel 5) sind häufig mit der Textsorte eng verbunden: Eine Nachricht soll informieren, ein Kommentar zur Meinungsbildung anregen und eine Bedienungsanweisung instruieren - um welchen Gegenstand es sich dabei jeweils handelt, ist normalerweise sehr schnell ersichtlich. 44 3. Textfunktion, Textsorte und Texttyp Wenn der rezipierte Text also nicht von zunächst unbekannter Art ist und wir seine Funktion erst über die Auswertung des Inhalts erschließen müssen, so ist sie Bestandteil des Textsortenwissens. Das globale Layout des Textes ist oftmals Konventionen unterworfen, die den Gebrauch von Bildern, Tabellen und Diagrammen, die optische Anordnung der Textbausteine, oder auch die Gestaltung von Überschriften, Aufzählungen, Textboxen etc. regeln. Die inhaltlichen Zonen sind für manche Textsorten relativ klar vorgegeben, wie unser Beispiel ‘Kommentar ’ (S. 39) gezeigt hat. Ein noch klarerer Fall ist die Sorte ‘Filmrezension’, für die sich unabhängig von ihrer spezifischen Quelle sehr enge Vorgaben dazu identifizieren lassen, was in ihr übermittelt wird und wie dies geschieht (Steger, 1983, s. auch Abschnitt 5.2). Neben der Angabe, welche Zonen vorkommen können und ob sie obligatorisch bzw. fakultativ sind, zählen Beschränkungen oder Präferenzen zur Abfolge der Zonen zum Textsortenwissen, ebenso aber auch Erwartungen zur typischen Länge solcher Zonen. Weiterhin kann es für jede Zone wiederum einzelne Layout-Konventionen geben, oder der Gebrauch bestimmter Formulierungen ist standardisiert (Eröffnungs-, Schluss-, Grußformeln, usw.). Syntaktische und lexikalische Merkmale können sowohl für den gesamten Text als auch für einzelne Zonen charakteristisch sein. Sie betreffen einerseits die Verwendung von fachgebundenem und nicht-fachgebundenem Vokabular (Lexeme, Kollokationen), andererseits von syntaktischen Konstruktionen (Extraposition, Passiv, etc.) und Merkmalen (Modus, Tempus, etc.), wie oben mit den von Biber verwendeten Kriterien illustriert. Nach Gansel u. Jürgens (2002, S. 77) sind die textexternen Merkmale (vor allem technisches Medium und Kommunikationssituation) für die Charakterisierung einer Textsorte primär, und die internen, also auch die sprachlichen, Merkmale sind weniger zentral. Für unsere Untersuchung, die sich auf geschriebene Gebrauchstexte konzentriert, sind hingegen die externen Merkmale weit weniger relevant. Um hinsichtlich der sprachlichen Mittel zu interessanten Aussagen über Textsorten zu gelangen, erscheint es allerdings unerlässlich, quantitative Untersuchungen zu betreiben: Mit methodisch sorgfältiger Analyse relativer Häufigkeiten von geeigneten Merkmalen gelangt man zu nachvollziehbaren und überprüfbaren Modellen dessen, was eine Textsorte an der sprachlichen Oberfläche auszeichnet. Damit erfasst man keineswegs alles, was die Textsorte bestimmt, aber doch einen sehr wesentlichen Teil, wie nicht zuletzt das Experiment von Dimter (1981, siehe S. 37) gezeigt hat, demzufolge wir viele Textsorten allein aufgrund ihrer sprachlichen Merkmale (unter Ausschluss der Lexik! ) identifizieren können. Wie können wir uns die Form unseres Textsortenwissens vorstellen? Dazu greifen wir hier den Vorschlag von Sandig (2000) auf, die Kategorie-Zugehörigkeit mittels der Prototyptheorie (Rosch u. Mervis, 1975) zu beschreiben. Dem liegt die Erkenntnis zugrunde, dass sich Kategorien (und, das ist der Vorschlag, eben auch Textsorten) nicht durch Angabe notwendiger und hinreichender Merkmale im engen Sinne definieren lassen. Das heißt, man kann z. B. für die Sorte ‘Bedienungsan- 3.3. Texttyp 45 leitung’ weder eine Menge von Mindest-Merkmalen aufzählen, die immer vorliegen müssen, damit ein Text eine Bedienungsanleitung sein kann (notwendige Merkmale), noch eine Menge von Merkmalen, bei deren Vorliegen ein Text auf jeden Fall eine Bedienungsanleitung ist (hinreichende Merkmale). Damit geht einher, dass die Grenzen zwischen Kategorien nicht klar festgelegt, sondern durchaus fließend sind. Recht bekannt sind die Experimente von Labov (1973), bei denen Versuchspersonen Zeichnungen von unterschiedlich geformten Gefäßen als Tasse oder Becher einordnen sollten, was zu Grauzonen von “sowohl-als-auch Gefäßen” führt. Anders als in großen Teilen der Mathematik und Naturwissenschaften sind die Dinge also unbestimmter - was aber keineswegs bedeutet, dass die Arbeit mit Merkmalen zwecklos wäre. Für durch Prototypikalität bestimmte Kategorien sind Merkmale allerdings nicht binär, und dies in zweierlei Hinsicht: Zum einen sind die möglichen Werte von Merkmalen nicht + und -, sondern eine geschlossene oder auch offene Skala; zum anderen sind Merkmale für eine Kategorie von unterschiedlicher Wichtigkeit: Für eine Tasse ist die Existenz eines Henkels (zur Unterscheidung vom Becher) wohl ‘zentraler ’ als der mundgerecht abgerundete Rand. Oder anders gesagt: Für die Kategorisierungsentscheidung ist der abgerundete Rand ggf. verzichtbarer als der Henkel. Daraus ergibt sich dann insgesamt das Bild, dass Vertreter einer Kategorie mehr oder weniger (un-)typisch sein können, wohlbekannte Beispiele sind der Pinguin und der Strauß als relativ untypische Vögel. Die “besten” Vertreter werden als prototypisch bezeichnet - was man sich entweder als nur mentales “Idealbild” der Kategorie, oder als einen real existierenden Vetreter vorstellen kann, der diesem Idealbild am nächsten kommt. Wenden wir diese Konzeption auf das Textsortenwissen an, 8 so dürften die Merkmale Textfunktion und -thema für die meisten Sorten zentral sein, während beispielsweise Gliederungs- und Layout-Merkmale mehr oder weniger wichtig sein können. Für die Sorte ‘wissenschaftlicher Aufsatz’ wären die Gliederungsmerkmale sehr zentral (weil stark konventionalisiert), für den Feuilleton-Artikel weit weniger. Bei der Betrachtung der Filmrezensionen haben wir gesehen, dass bestimmte Inhaltszonen obligatorisch sind, andere fakultativ (wenn auch typisch), und dass es bestimmte Präferenzen für die absolute und relative lineare Anordnung der Zonen gibt. Dass nicht alle Textexemplare einer Sorte gleichermaßen schnell als solche erkennbar sind, spricht für die Bandbreite der Prototypikalität der Vertreter: Eine schlecht gestaltete Bedienungsanleitung mag erst nach Lektüre der ersten Sätze als Vertreterin ihrer Art identifizierbar sein, ein verunglückter Kommentar, bei dem die Meinung der Autorin nicht recht klar wird, womöglich überhaupt nicht. 3.3. Texttyp Während wir für die Charakterisierung von Textsorten eine ganze Reihe unterschiedlicher Arten von Merkmalen zugelassen haben, wollen wir den Begriff des 8 Siehe dazu auch Rehm (2007, Abschn. 2.2.9). 46 3. Textfunktion, Textsorte und Texttyp Texttyps im Anschluss an Werlich (1975) oder auch Virtanen (1992) eng mit sprachlichen Merkmalen verknüpfen. Werlich spricht davon, dass den Texttypen jeweils ein “Vertextungsmuster” sowie ein bestimmter “kontextueller Fokus” (unten in Klammern) und damit verbunden dann auch bestimmte Oberflächenmerkmale zugrunde liegen. Er unterscheidet diese fünf Texttypen: • deskriptiv (spatial/ Raum): phänomenregistrierende Sätze Thousands of glasses were on the table. • narrativ (temporal/ Zeit): handlungsaufzeichnende Sätze The passengers landed in New York in the middle of the night. • expositorisch (Zerlegung/ Zusammensetzung von Konzepten): phänomenidentifzierende oder -verknüpfende Sätze One part of the brain is the cortex. When unfolded, it measures 1800 cm 2 . • argumentativ (Beziehungen zu Konzepten oder Aussagen der Sprecher): qualitätsattribuierende Sätze The current obsession with durability in the arts is not permanent. • instruktiv (künftiges Verhalten von Sprecher/ Hörer betreffend): handlungsfordernde Sätze Be reasonable for a moment! Für den deskriptiven Typ folgen wir (Brinker, 2001, S. 69) und unterscheiden noch einmal das Berichten (eines Geschehens) vom Beschreiben (eines Lebewesens, Objekts oder Geschehens als Instanz einer bestimmten Klasse). Typisch für den deskriptiven Typ sind nach Werlich etwa lokale Verknüpfungen über räumliche Beziehungen, sowie Präpositionalphrasen in Thema-Position. 9 Narrative Texte unterscheiden sich vom Berichten dadurch, dass es sich nicht um eine eher kurze, neutrale Schilderung handelt, sondern um eine Erzählung aus einer spezifischen Perspektive. Diese Texte bevorzugen nach Werlich eine temporale Verknüpfung über die zeitliche Folge, entsprechend seien temporale Konnektoren und Aktionsverben häufig, die Tempus-Folge spiele eine wichtige Rolle. - Für expositorische Texte sei eine “analytische Verknüpfung” über Differenzierung oder Synthese charakteristisch, ebenso partikularisierende Relationen, die durch Wörter wie namely, incidentally, for example, in other words angezeigt sind. In der Terminologie von Brinker (2001) dürfte dieser Typ weitgehend der Kategorie ‘explikativ’ entsprechen, er sieht hier als sprachliches Merkmal eine Dominanz von Konnektoren, Adverbien und Präpositionen, die Kausalbeziehungen signalisieren. In argumentativen Texten herrscht nach Werlich eine kontrastive Verknüpfung mit entsprechend frequenten kontrastiven Konnektoren und lexikalischen Kontrasten vor. Brinker sieht außerdem eine Tendenz zu subordinierten Sätzen, die nicht nur kontrastiv, sondern auch kausal, konditional und konsekutiv verknüpft 9 Werlich (1975) untermauert seine Darstellung nicht mit Frequenzanalysen, eine Untersuchung im Stile der von Biber (1993) (vgl. Abschnitt 3.2.2) wäre hier ein Desiderat. 3.3. Texttyp 47 sind. Instruktive Texte schließlich seien reich an Enumerationen und aufzählenden, sequenzialisierenden Konnektoren. Mit dreien der fünf Kategorien assoziiert Brinker (2001) spezifische Formen der ‘Themen-Entfaltung’, worauf wir in Kapitel 5 eingehen werden. Der Terminus Texttyp wird häufig im Sinne einer “Großklasse” von Textsorten verwendet. Wir möchten ihn hier jedoch nur in dem genannten engeren Sinne benutzen, nach dem er ein funktional interpretierbares Bündel linguistischer Merkmale bezeichnet. Das hat zur Folge, dass Texttyp keineswegs immer eine Eigenschaft eines vollständigen Textes ist, sondern sich oft nur auf mehr oder weniger lange Textabschnitte bezieht. Viele Texte vermengen ja erzählende, beschreibende oder andere Passagen miteinander, um ihr Gesamtziel zu erreichen. Um nur drei Beispiele zu nennen: Erzählende Prosa, etwa eine Kurzgeschichte, wird oftmals zum großen Teil vom Typ narrativ sein, kann aber problemlos deskriptive Passagen enthalten, wenn eine Person, ein Ort o. ä. beschrieben wird. Ein persönlicher Brief kann zunächst Erlebnisse des Schreibenden berichten (narrativ), um daraus dann konkrete Handlungsvorschläge (instruktiv) für den Adressaten abzuleiten. Oder, eine Bedienungsanleitung kann vorwiegend instruktiven Charakter haben, an bestimmten Stellen aber auch bestimmte Schritte durch Erklärung der Funktionsweise eines Geräts (expositorisch) begleiten. Dies bedeutet, dass es zwar Tendenzen für die Korrelation zwischen Textsorten und Texttypen gibt, aber keine festen Zuordnungen, und dass insbesondere - in unserer Verwendung des Begriffs - die Texttypen nicht Bestandteil einer Hierarchie von Textsorten sein sollten, sondern sich “orthogonal” dazu verhalten: Textsorten sind individuell mit einem oder mehreren Texttypen in Beziehung zu setzen. Damit haben wir en passant auch die Abgrenzung zum Begriff der Textfunktion vorgenommen: Letztere ist eine Eigenschaft des gesamten Textes, die sicherlich von den im Text anzutreffenden Typen beeinflusst, aber nur in einigen Fällen mit ihr identisch ist (etwa in rein narrativen Texten). Hinzu kommt noch, dass beispielsweise ein Text vom narrativen Typ durchaus ein persuasives Ziel verfolgen kann - die Autorin mag lediglich ein Erlebnis schildern, es dabei aber in einer Weise darstellen, dass sie damit einen mehr oder weniger klar durchschaubaren Appell an den Leser richtet. Wir reservieren also Texttyp für die Charakterisierung der sprachlichen Oberfläche innerhalb des Textes und Textfunktion für das (vom Leser nachvollziehbare) Ziel des Gesamttexts. Eine letzte Begründung für die Nützlichkeit dieser Auffassung vom Texttyp liefert die Frage nach einem Kriterium für Textverstehen. Wann haben wir einen Text(abschnitt) erfolgreich gelesen? Der idealtypische deskriptive Text ist verstanden, wenn wir eine mentale Repräsentation des fraglichen Objekts oder Sachverhalts aufgebaut haben. Gleiches gilt für die Exposition, bei der Objekt oder Sachverhalt häufig allerdings komplizierter sein werden. Die idealtypische Narration ist verstanden, wenn wir die Abfolge von Ereignissen in ihrem zeitlichen Zusammenhang rekonstruiert haben (was ja nicht immer trivial ist). Ähnlich besteht das Verstehenskriterium für die Instruktion darin, die Sequenz der auszuführenden 48 3. Textfunktion, Textsorte und Texttyp Handlungen korrekt zu identifizieren. Der argumentative Text schließlich ist verstanden, wenn wir die Kernthese des Textes gefunden haben und zuordnen können, von welchen Textelementen sie argumentativ gestützt wird, direkt oder indirekt (mehr dazu in Abschnitt 7.3). 3.4. Weiterführende Literatur Bei der Besprechung von Textfunktion, Textsorte und Texttyp haben wir uns hier nur auf einen Ausschnitt der in der Textlinguistik untersuchten Terminologie beschränkt, die überdies verschiedene weitere Begriffe wie Textklasse, Textmuster, Textexemplar etc. verwendet. Zu diesen Themen gibt es eine Reihe von Beiträgen im ‘Handbuch Text- und Gesprächslinguistik’ (u. a. Heinemann, 2000). Um aber zuvor einen guten Überblick über den breiteren Rahmen der Textsortenforschung “aus einem Guß” zu bekommen, ist das zweite Kapitel von Rehm (2007) sehr empfehlenswert. Gerade zu Textsorten ist die Forschungsliteratur außerordentlich reichhaltig, wie die kommentierte Bibliographie von Adamzik (1995) zeigt. Als eine sehr interessante Untersuchung der sprachlichen Merkmale in unterschiedlichen Texttypen sei Smith (2003) empfohlen. Die Autorin verwendet zur Abgrenzung von den englischsprachigen Begriffen genre und register den Begriff discourse mode für das, was wir hier als Texttyp eingeführt haben. 3.5. Übungsaufgaben 1. Untersuchen Sie Ihren Kommentar und andere (Tagespresse! ) auf typische Merkmale. Lassen sich Attribute (beliebiger Art) angeben, die für diese Textsorte charakteristisch erscheinen? Woran ist ein Kommentar als Kommentar erkennbar, unabhängig von seiner Thematik? 2. Beschreiben Sie informell, wie Ihr Kommentar inhaltlich “funktioniert”. Wie erreicht er seine Wirkung? Ist der Verlauf des Arguments erkennbar? Gibt es sprachliche Phänomene, die in direktem Zusammenhang mit der Argumentation stehen? 3. Überprüfen Sie, ob sich die einzelnen (Teil-) Sätze Ihres Kommentars durch das auf Seite 39 f. vorgeschlagene Inventar von ‘Inhaltszonen’ vollständig beschreiben lassen, oder ob noch weitere Zonen-Bezeichner benötigt werden. 4. Referenzielle Struktur (4.1) Meine Katze hat ein neues Lieblingsspielzeug. Sie tobt jetzt ständig mit einem grünen Wollknäuel herum. Es ist schon ein bisschen zerfetzt. Erfüllt diese Satzfolge die in Abschnitt 2.4 genannten Textualitätskriterien? Sicherlich. Sie wirkt schon allein deshalb als Text, weil die drei Sätze von denselben zwei Objekten berichten. In der Tat wird das ‘Prinzip der Wiederaufnahme’ oftmals als das zentrale Kriterium für Kohärenz in Texten genannt: Ein Text sei demnach eine Folge von Sätzen, in denen wiederholt über dieselben Diskursgegenstände gesprochen wird. So fasste bereits eine der Pionier-Arbeiten der Textlinguistik, (Harweg, 1968), die Verwendung von Pronomen als konstitutiv für das Objekt ‘Text’ auf, und viele nachfolgende Autoren haben bei der Untersuchung von Texten ebenfalls die Wiederaufnahme in den Mittelpunkt ihrer Betrachtungen gerückt. Somit ist es nur naheliegend, unsere Behandlung verschiedener Ebenen der Textstruktur mit der referenziellen Ebene zu beginnen. Wie auch bereits Brinker (2001, S. 41) gezeigt hat, ist die Wiederaufnahme allein jedoch nicht hinreichend für Kohärenz. Das lässt sich durch konstruierte Beispiele illustrieren: (4.2) Auf der A10 besteht bei Leest Gefahr durch Radfahrer auf der Fahrbahn. Die Radfahrer sind überwiegend evangelisch. Leest wurde im Jahr 1268 von Kurfürst Friedrich gegründet. Viele Menschen schauen samstags von Brücken auf die A10. Auch der Samstag hat 24 Stunden. Hier bestehen zwischen den einzelnen Sätzen durchaus Beziehungen der Art, dass Aussagen über dieselben Gegenstände getroffen werden, doch ergeben diese Aussagen damit noch keineswegs auch einen zusammenhängenden Sinn. Wir fassen die in diesem Kapitel untersuchte, durch Wiederaufnahmen entstehende referenzielle Struktur somit als nur eine unter mehreren Strukturebenen auf, die in den Folgekapiteln durch weitere zu ergänzen sein wird. Zunächst wenden wir uns in Abschnitt 4.1 der Frage zu, welche sprachlichen Ausdrücke eigentlich ‘referenziell’ interpretiert werden können oder müssen, wobei wir unterscheiden zwischen solchen, die neue Gegenstände in den Diskurs einführen, und denen, die bereits bekannte Gegenstände wieder aufnehmen, die Anaphern. Abschnitt 4.2 untersucht dann zunächst die globalen Wechselwirkungen zwischen Referenzbeziehungen und der inhaltlichen Strukturierung des Textes. Bei den lokalen Effekten (Abschnitt 4.3) geht es hingegen um die Wahl der Form eines referenziellen Ausdrucks in einem konkreten Kontext - die davon abhängt, ob, wann und in welcher Form auf denselben Gegenstand bereits Bezug genommen wurde. Dass wir bei der Textproduktion in der Wahl dieser Ausdrücke 50 4. Referenzielle Struktur keineswegs frei sind, hat unter anderem die Centering Theorie (4.3.1) untersucht und dabei speziell das Wechselspiel zwischen Pronominalisierung und grammatischen Funktionen im Satz in den Blickpunkt gerückt. Dass aber in einem noch allgemeineren Sinne die Distanz (in näher zu bestimmender Form) zwischen anaphorischem Ausdruck und Bezugsausdruck eine wichtige Rolle spielt, wird von Ansätzen berücksichtigt, die eine Skala des Aktivierungsgrads von Diskursgegenständen zugrunde legen (4.3.2); eine Möglichkeit, daraus wiederum Modelle für die Produktion (beim Schreiben) bzw. Auflösung (beim Lesen) anaphorischer Bezüge zu gewinnen, besteht darin, numerische Aktivierungsfunktionen zu definieren, die den Verlauf der Aktivierung von Diskursgegenständen über den Text hinweg darstellen (4.3.3). Am Ende des Kapitels wenden wir uns in 4.4 dann der Erstellung und Nutzung von Textkorpora zu, die mit Referenz-Information annotiert sind. 4.1. Referenz und Koreferenz In der Sprachphilosophie und in der (formalen) Semantik spielt die Frage der Referenz seit langer Zeit eine zentrale Rolle: Welche sprachlichen Ausdrücke können auf außersprachliche Gegenstände (im weitesten Sinne) verweisen, und welche sinnvollen Gruppierungen lassen sich hier vornehmen? Völlig unstrittig ist eigentlich nur, dass Substantive, die Gegenstände der realen Welt bezeichnen, also etwa die Teetasse auf meinem Schreibtisch oder den Kölner Dom, referenziell sind. Sie bilden die transparenteste Gruppe, die insbesondere die “Abbild-Theorie” der Sprache motiviert hat, nach der ein Satz der natürlichen Sprache einen Sachverhalt der realen Welt beschreibt, oder eben nicht, und über dessen Wahrheit dementsprechend geurteilt werden kann. Das Bild wird sukzessive komplizierter, wenn wir zunächst weitere Substantive betrachten, die zum Beispiel Abstrakta bezeichen (wie Interesse) oder Gegenstände, die es in der derzeitigen “realen” Welt nicht gibt, wohl aber in der Vergangenheit (wie König Friedrich II. von Preußen) oder solche, die es nur in unserer Vorstellungswelt gibt, etwa Aschenputtel. Bilder von der Vergangenheit und Vorstellungswelten teilen die Sprecher einer Sprache zu einem gewissen Grad, aber natürlich nicht vollständig, so dass die Frage nach der Referenz schwieriger wird. Semantiker arbeiten mit dem Konstrukt “möglicher Welten”, in denen bestimmte Sachverhalte jeweils wahr oder falsch sind, und sie untersuchen dann auch die Zusammenhänge zwischen solchen möglichen Welten, um die Bedeutung von Sätzen möglichst präzise angeben zu können. Verlassen wir die Substantive, wird die Situation nicht einfacher. Ein Adjektiv wie blau kann unter einer ‘extensionalen’ Sicht genau die Menge der blauen Gegenstände in einer (möglichen) Welt bezeichnen und damit referenziell sein - aber für ein Adjektiv wie großartig ist die Angabe seiner ‘Extension’ in weitaus höherem Maße subjektiv. Billigen wir aber im Prinzip den Adjektiven zu, dass sie referenziell sind, sollten wir es wohl auch den Verben nicht verwehren, die dann freilich nicht (greifbare oder abstrakte) Gegenstände bezeichnen, sondern Zustände und 4.1. Referenz und Koreferenz 51 Ereignisse, die stattfinden, stattgefunden haben oder vielleicht stattfinden werden (oder eben nicht). Analog wäre dann die Extension von herunterfallen die Menge aller Ereignisse, in denen irgendetwas irgendwo herunterfällt, in der realen oder in möglichen Welten. Damit umzugehen, wird abermals verwickelter. Welche Wörter verbleiben dann noch als definitiv nicht referenziell? Es sind vermutlich die Mehrzahl der geschlossenen Wortklassen, also die Funktionswörter wie Konjunktionen, Artikel, Präpositionen - wobei man bereits wieder fragen kann, ob nicht die Extension einer Präposition wie unter die Menge aller Paare von Gegenständen sein kann, die in einer räumlichen Beziehung des Untereinanderseins stehen? Und ist nicht die Extension eines Zahlworts wie vier die Menge aller Mengen von Gegenständen, die genau vier Elemente umfassen? Für unsere Zwecke der Textanalyse können wir all diese Fragen glücklicherweise umschiffen und ein relativ klares Kriterium angeben, anhand dessen die Referenz-Frage zu entscheiden ist. Wir konzentrieren uns ja auf die “Wiederaufnahme” von Gegenständen im Text, also auf eine Relation zwischen zwei (oder mitunter mehreren) sprachlichen Ausdrücken innerhalb eines Texts: Der eine verweist auf einen anderen, im Spiel sind also immer ein verweisender Ausdruck und zumindest ein Bezugsausdruck. Mehrere Bezugsausdrücke werden dann gebraucht, wenn der verweisende Ausdruck eine Menge von Gegenständen des Textes gleichzeitig wieder aufnimmt, wie in diesem Beispiel 1 : (4.3) Gestern hat Susanne i ihr Pausenbrot mit Marco j geteilt. Die beiden i,j verstehen sich sehr gut. Damit ein sprachlicher Ausdruck im Text aus Sicht der referenziellen Struktur relevant sein kann, muss es also möglich sein, ihn wiederaufzunehmen. Dies lässt sich, zumindest für die Nominalphrasen, durch einen Fragetest gut überprüfen: Wenn wir eine NP eines Satzes später wiederaufnehmen möchten, muss es möglich sein, an den Satz eine sinnvolle Frage anzuschließen, die genau auf diese NP als Antwort zielt. Dabei fallen insbesondere solche Phrasen heraus, die idiomatisch verwendet werden. Zudem weist der Test darauf hin, dass in einer komplexen Nominalphrase auch einzelne Bestandteile wiederaufnehmbar sein können: (4.4) Peters Bruder hat in jeder Hinsicht zum Erfolg der Mannschaft beigetragen. • Wer hat zum Erfolg der Mannschaft beigetragen? - Peters Bruder. • Wessen Bruder hat zum Erfolg der Mannschaft beigetragen? - Peters. • Wozu hat Peters Bruder beigetragen? - Zum Erfolg der Mannschaft. • Zu wessen Erfolg hat Peters Bruder beigetragen? - Zu dem der Mannschaft. • ? Worin hat Peters Bruder zum Erfolg der Mannschaft beigetragen? - In jeder Hinsicht. 1 Hier und in den folgenden Beispielen markieren wir Ausdrücke, die sich auf denselben Diskursgegenstand beziehen sollen, mit identischen Buchstaben-Indizes. 52 4. Referenzielle Struktur Terminologisch unterscheiden wir zwischen dem anaphorischen Bezug, der im Text einen Rückwärtsverweis herstellt (z. B. 4.3), und dem weitaus selteneren kataphorischen Verweis, der seinen Bezugsausdruck im Text erst ankündigt: Bevor sie i die Bühne betrat, trank die Schauspielerin i noch ein Glas Wasser. Im anaphorischen Fall wird der Bezugsausdruck auch als Antezedens bezeichnet. Die Beziehung zwischen anaphorischem/ kataphorischem Ausdruck und Bezugsausdruck nennen wir Koreferenz. Im Folgenden werden wir die Kataphorik nicht genauer untersuchen, sondern uns weitgehend auf die Anaphorik beschränken. Was also “gewinnen” wir durch die Beschränkung auf die Text-Perspektive mit Untersuchung der Koreferenz? Wir können viele, wenn auch nicht alle, Fragen nach dem Zusammenhang zwischen Sprache und Welt beiseite lassen. Wir klammern damit auch zunächst die Frage aus, ob Referenz nicht besser als Beziehung zwischen sprachlichen Ausdrücken und mentalen Konzepten verstanden werden sollte, die dann ihrerseits für Gegenstände der Welt stehen können (eine kognitiv orientierte Sicht würde diesen Aspekt in den Mittelpunkt rücken). Konkret müssen wir nicht für jedes Wort des Textes entscheiden, ob es referenziell zu lesen ist, sondern lediglich die verweisenden Ausdrücke identifizieren, deren Verständnis voraussetzt, dass wir einen anderen Ausdruck im Text verstanden haben, nämlich den Bezugsausdruck - auch diesen gilt es also zu identifizieren, womit dann die Koreferenz-Beziehung bzw. die Wiederaufnahme aufgedeckt ist. “Lediglich” soll hier nicht suggerieren, dass dies in jedem Fall ganz einfach ist, allein im Vergleich zum allgemeinen, oben kurz skizzierten, Referenzproblem haben wir es hier durchaus leichter. Sind alle Koreferenz-Beziehungen im Text identifiziert, so fassen wir die Summe dieser Beziehungen dann als die referenzielle Struktur des Textes auf. Fragen wir jetzt nach möglichen Arten der Koreferenz, können wir uns also von den Arten anaphorischer Ausdrücke leiten lassen, die die Sprache zur Verfügung stellt. Für eine grobe Gliederung folgen wir Vater (1991) und ergänzen die einzelnen Bereiche um Beobachtungen zu den möglichen Anaphern und deren Bezugsausdrücken - allerdings ohne hier eine vollständige Katalogisierung anzustreben. Vorab eine letzte terminologische Klärung: Solche anaphorischen Ausdrücke, die für sich bedeutungsleer sind, also ausschließlich die Funktion erfüllen, auf einen Bezugsausdruck zu verweisen, fassen wir unter dem Begriff Pro-Form zusammen: Es handelt sich um Pronomina und Pronominaladverbien, die für etwas anderes als sich selbst stehen. Sie sind zu unterscheiden von Ausdrücken, die zwar auch einen Diskursgegenstand wieder aufnehmen, dabei aber zusätzlich noch Information über ihn vermitteln, etwa eine subjektive Einschätzung des Sprechers, wie in Gestern vergaß ich, meinen Kater i zu füttern. Das arme Tier i war ganz verstört. Gegenstandsreferenz Mit dem Begriff Gegenstand bezeichnen wir hier sowohl “greifbare” als auch abstrakte Objekte der “realen Welt” oder einer Vorstellungswelt - das Spektrum reicht also (beispielsweise) von Pferd über Glück zu Einhorn und Atlantis. Ein Gegenstand in diesem weiten Sinne kann durch seinen Eigennamen, durch eine indefinite Kennzeichung (Gegen neun betrat ein Mann das Lokal) oder auch durch eine definite Kennzeichnung erstmals in den Diskurs eingeführt 4.1. Referenz und Koreferenz 53 werden. Die definite Kennzeichnung ist bei der Ersterwähnung allerdings nur eingeschränkt verwendbar, nämlich • bei generischen Lesarten (Wir wissen, dass der Wal ein Säugetier ist), • wenn der Gegenstand in der Welt “einzigartig” ist (Wir haben den Papst gesehen), oder • wenn der Gegenstand im situativen Kontext eindeutig identifizierbar ist, etwa wenn in einer Stadtzeitung berichtet wird: Die Bürgermeisterin gab ein Interview. Für die Wiederaufnahme kommt die indefinite Kennzeichnung nicht in Frage, dafür treten als eine wichtige Kategorie die verschiedenen Pronomina hinzu (Personal-, Demonstrativ-, Relativ-, Possessivpronomina). Eigennamen können wiederholt werden, oft geschieht dies allerdings in abgekürzter Form (z. B. bei Ersterwähnung Vor- und Nachname einer Person, bei Wiederaufnahme nur Nachname). Auch definite Kennzeichnungen sind natürlich möglich, wobei das Substantiv wiederholt oder stattdessen ein Synonym oder Hyperonym verwendet werden kann (die Zeitung - das Blatt / das Druckerzeugnis). Für diese wie auch die drei folgenden Kategorien gilt, dass die Wiederaufnahme sich auf den gesamten Gegenstand beziehen kann oder, wenn der “Gegenstand” eine Menge von Objekten bezeichnet, nur auf einen Teil davon: Die Klasse 2b i hatte gestern Wandertag. Die Mädchen i haben viel gesungen. Des weiteren kann sich die Wiederaufnahme auf einen Teilgegenstand oder einen bestimmten Aspekt desselben beziehen; oder die Verbindung zwischen den beiden referenziellen Ausdrücken kann noch lockerer sein. Die folgenden Beispiele illustrieren das Spektrum: (4.5) a Ich habe mir mal wieder einen neuen Computer i gekauft. Die Maus i ist kabellos. b Ich habe mir mal wieder einen neuen Computer i gekauft. Die Prozessorgeschwindigkeit i haut mich wirklich um. c Ich habe mir mal wieder einen neuen Computer i gekauft. Man muss die Firma Apple i ja gelegentlich unterstützen. Phänomene dieser Art werden oft als ‘indirekte Wiederaufnahme’, in der englischsprachigen Literatur (und oft entlehnt auch in der deutschsprachigen) als ‘bridging anaphora’ bezeichnet. Vielfach liegen die Relationen Objekt-Teilobjekt (Meronymie, vgl. 4.5[a]), Menge-Teilmenge oder Objekt-Attribut (4.5[b]) zugrunde, doch ist der Spielraum groß und in Grenzfällen ist die Entscheidung, ob eine definite Kennzeichnung einen bereits eingeführten Gegenstand indirekt wieder aufnimmt oder ob ein neuer Gegenstand eingeführt wird, schwierig. In Beispiel 4.5[c] könnte man geneigt sein, keine Koreferenz mehr zuzubilligen, allerdings ist 54 4. Referenzielle Struktur der Sinnzusammenhang (der zweite Satz begründet den ersten) nur erschließbar, wenn man annimmt, dass das Objekt der Unterstützung in Satz 2 wirklich der Hersteller des Kaufobjekts in Satz 1 ist. Verschiedene Arten der indirekten Wiederaufnahme wurden bereits von Harweg (1968) unterschieden, zu den häufigsten zählen der logisch-begriffliche Zusammenhang wie bei Anfang - Ende oder öffnen - schließen; der ontologische, naturgesetzliche Zusammenhang wie bei Blitz - Donner oder Vater - Mutter; und der kulturell geprägte Zusammenhang wie bei Universität - Rektor oder Nation - Flagge. Eine weitere Komplikation betrifft den Umfang der angenommenen Bezugseinheit. Insbesondere wenn präzise Richtlinien für die Annotation von Daten erstellt werden sollen (siehe Abschnitt 4.4), muss man sich festlegen, ob man Bezugseinheiten möglichst eng oder weit markieren möchte. Im folgenden Beispiel wird also eine Konvention benötigt, ob Er sich allein auf das Substantiv Kater bezieht, ob man das Adjektiv hinzunimmt, oder auch den indefiniten Artikel, oder auch die Präpositionalphrase, oder zudem den Relativsatz. Dies ist keine Frage der richtigen oder falschen Entscheidung, aber es muss festgelegt und bei der Daten-Annotation einheitlich gehandhabt werden. (4.6) Auf der Straße begegnete ich einem grauen Kater mit weißen Ohren, die lustig in verschiedene Richtungen zeigten. Er lief leider schnell weg. Die Gegenstandsreferenz steht im Mittelpunkt der folgenden Abschnitte, doch zuvor seien drei andere Arten kurz erwähnt. Ereignisreferenz Neben Gegenständen sind es vor allem Ereignisse, die in Texten durch anaphorische Verweise wieder aufgenommen werden können. Die Verweise können verblose, elliptische Sätze sein, in denen die Anapher also nicht lexikalisch realisiert ist: (4.7) Ich habe mal wieder einen neuen Computer gekauft. Und meine Frau eine neue Stereo-Anlage. Hier ist die Ermittlung des Antezedens entsprechend unproblematisch. Die Elision kann neben dem Verb auch weitere Mitspieler umfassen, etwa wenn im zweiten Satz des Beispiels meine durch meiner ersetzt wird, womit die Frau zum grammatischen indirekten Objekt und das Subjekt nun auch durch eine “leere” Anapher dargestellt ist. Die Bezugsobjekte sind oftmals, wie hier im Beispiel, Sätze mit finitem Verb, können aber auch infinite Sätze oder Nominalphrasen sein, die ein Ereignis ausdrücken. In diesem Fall sind als Anaphern dann auch Personalpronomen möglich: (4.8) Der Kauf i des Computers fand am Sonnabend statt. Er i dauerte nur eine halbe Stunde. An der Stelle des Personalpronomens kann ebenso ein Demonstrativpronomen stehen: Dies dauerte nur eine halbe Stunde. In diesem Fall allerdings kann die Bestimmung des Antezedens erheblich schwieriger werden, da sich ein solches Pronomen nicht nur auf einen Verbalkomplex, sondern auf mehrere Sätze oder gar 4.2. Referenzielle Ketten: Globale Effekte 55 ganze Textabschnitte beziehen kann. Es kann dann durchaus eine Frage der subjektiven Interpretation sein, welchen Umfang das referenzierte Textmaterial hat, wenn in einem Text etwa der Satz auftritt Das gefällt mir nicht. Wie oben bereits erwähnt, lassen sich die verschiedenen Formen des ‘bridging’ natürlich auch mit Ereignisreferenzen vornehmen: (4.9) Ich habe mir mal wieder, in einem Anfall von Leichtsinn, einen neuen Computer gekauft. Das Bankkonto ? ist jetzt ganz schön leer. Wir verstehen gut, welches Bankkonto hier gemeint ist, es darf also problemlos mit definitem Artikel bezeichnet sein. Was aber ist das Bezugsobjekt im Text? Es könnte ich sein, als vermutlicher Inhaber des Kontos, aber auch das Kaufereignis, von dem wir über das Konzept des Bezahlens die Brücke zum Konto assoziieren. Aber zählt dann auch der auslösende Leichtsinnsanfall noch zum Bezugsobjekt? Fälle wie dieser verdeutlichen das Problem, das entsteht, wenn Referenz auf relativ komplexe Sachverhalte an den Elementen des Textes genau festgemacht werden soll: Es ist für viele der oben genannten Demonstrativpronomina oder für bridging-Anaphern nicht möglich, ganz exakt dasjenige sprachliche Material zu benennen, das als Antezedens fungiert. Der Grund ist, dass die Diskursgegenstände vielfach abstrakte Objekte sind, die wir beim Lesen aus unterschiedlichen Teilen des Textes zusammensetzen - es sind Objekte, die zeitweilig in unserer mentalen Repräsentation des Textes eine Rolle spielen, die aufgrund ihrer komplexen Konstruktionsbedingungen aber nur indirekt an der Sprachoberfläche festgemacht werden können. In solchen Fällen müssen wir im Auge behalten, dass eine Annotation von Anaphern und Bezugsausdrücken an der Sprachoberfläche des Textes nur eine “Idealisierung”, eine Annäherung an das gemeinte abstrakte Objekt, sein kann. 2 Ortsreferenz Mit Adverbialen wie hier, dort können Ortsangaben aus dem Text wieder aufgenommen werden und mit den abgeleiteten hierhin, dorthin entsprechend die Zielorte einer Bewegung. Zeitreferenz Ähnlich nehmen Adverbiale wie dann, später Bezug auf zuvor genannte Zeitpunkte, oder aber auf Ereignisse und stellen zu diesen eine temporale Relation her. 4.2. Referenzielle Ketten: Globale Effekte Der erste Schritt der Referenzanalyse besteht darin, die koreferenten Ausdrücke zu identifizieren und jeweils einer gemeinsamen Klasse zuzuordnen. Für den Beispieltext in Abb. 4.1 ist dies durch eckige Klammern und Indizes markiert, die jeweils ein Kürzel für den zugrunde liegenden Gegenstand bilden. Zu beachten ist, 2 Als vertiefende Lektüre zu diesem Thema, aus der Perspektive der formalen Semantik, sei Asher (1993) empfohlen. 56 4. Referenzielle Struktur Internationaler Einsatz in Darfur scheint möglich A DDIS A BEBA - [Der [Sudan] Sud hat [UN] U N -Generalsekretär [Kofi Annan] KA zu Folge erstmals grünes Licht für den [Einsatz] Ein von [[UN] U N -Truppen] T ru in der [[Bürgerkriegsprovinz] Bk Darfur] Sud,Dar gegeben] GE , streitet aber über [dessen] Ein Ausmaß. [Annan] KA erreichte offenbar bei einem Krisentreffen in Addis Abeba die [Grundsatzeinigung] GE . Allerdings machte die [Führung] Sud,SF in [Khartum] Sud,Kha klar, dass [sie] SF unter anderem bei der Stärke der [Truppe] T ru andere Vorstellungen als die [UN] U N hat, sowie bei der Frage, wer den [Einsatz] Ein führt. Der seit drei Jahren andauernde [Bürgerkrieg] Bk , bei [dem] Bk nach [UN] U N -Angaben mehr als 200 000 Menschen starben und [der] Bk Auswirkungen auf die Nachbarländer [Tschad] T sch und Zentralafrikanische Republik hat, führte am Freitag dazu, dass der [Tschad] T sch die Generalmobilmachung anordnete. Derzeit sind [7000 Mann] 7 M der Afrikanischen Union in [Darfur] Dar im Einsatz, [deren] 7 M Mandat Ende des Jahres ausläuft. (Potsdamer Neueste Nachrichten, 18.11.06) Abbildung 4.1.: Beispieltext Darfur dass der gesamte erste Teilsatz von Der Sudan bis gegeben ebenfalls einen Diskursgegenstand darstellt, da später mit der definiten NP die Grundsatzeinigung darauf Bezug genommen wird (Ereignisanapher). Außerdem gibt es zwei Fälle geschachtelter Bezugsausdrücke, weil auf Bestandteile einer komplexen NP Bezug genommen wird; diese Möglichkeit hatten wir oben in Beispiel 4.4 bereits illustriert. Im zweiten Schritt sind auf dieser Grundlage die Relationen zwischen Anapher und Antezedens festzulegen. Dabei haben wir dann die Wahl, als Antezedens durchgängig die Ersterwähnung des Diskursgegenstands zu verwenden (als Repräsentanten der Äquivalenzklasse), oder aber seine jeweils letzte Erwähnung. Letzteres ist für die Untersuchung der Textstruktur praktischer, da wir dann nicht nur die Information erhalten, wie oft ein Gegenstand erwähnt wurde, sondern auch unmittelbar die Abstände zwischen den einzelnen Erwähnungen sowie die Form der letzten Erwähnung ablesen können - beides hat Einfluss auf die Form der jeweils aktuell gewählten Anapher und ist ein wichtiger Untersuchungsgegenstand, wie wir im nächsten Abschnitt sehen werden. Folgen wir diesem Prinzip, ergibt sich für jeden Diskursgegenstand eine referenzielle Kette (siehe dazu auch Martin, 1992, Abschnitt 3.5). In Diagrammform notiert sie jedes Auftreten des Gegenstands in Gestalt des jeweiligen referenziellen Ausdrucks und verknüpft ihn durch einen Pfeil mit seinem “Vorgänger” im Text. Die Art der Verknüpfung ist dabei nicht immer dieselbe; verschiedene Varianten wie Mengen- und Teilmengenbildung oder die indirekte Wiederaufnahme haben 4.2. Referenzielle Ketten: Globale Effekte 57 Darfur die Führung Khartum die Bürgerkriegsprovinz Darfur Der Sudan ind ind meronym sie Abbildung 4.2.: Referenzielle Kette Sudan für den Beispieltext Darfur wir genannt. Wenn wir eine Menge möglicher Verknüpfungsrelationen definieren, können wir jeden Pfeil in der referenziellen Kette mit einer solchen Relation bezeichnen. Da ‘Identität’ in der Regel die häufigste Relation ist, kann diese Bezeichnung der Übersichtlichkeit halber weggelassen werden, der Pfeil also unbeschriftet bleiben. Falls aus einem Diskursgegenstand weitere abgeleitet werden (durch indirekte Wiederaufnahme), können dafür jeweils separate Ketten erstellt oder aber ein zusammenfassender Graph gezeichnet werden, in dem der “Wurzel”-Gegenstand dann nur einmal vorkommt. Für den Beispieltext Darfur aus Bild 4.1 gibt Abbildung 4.2 den Graph an, der sich für Sudan aus den dort verzeichneten Koreferenz- Indizes ergibt. Das Land wird nur einmal zu Textbeginn erwähnt, doch seine Provinz Darfur tritt anschließend zweimal auf (Relation ‘Meronymie’), ebenso die Führung des Landes; hier ist die Relation ‘indirekt’, im Bild als ‘ind’ abgekürzt. Auch die Hauptstadt wird später genannt; ob sie wirklich ein Fall von indirekter Wiederaufnahme von Sudan ist oder aber einen neuen Gegenstand einführt, könnte diskutiert werden; für die Wiederaufnahme-Relation spricht, dass ein Nachrichtentext vermutlich nicht Karthum als Ersterwähnung der sudanesischen Hauptstadt verwenden würde, da deren Name vielen deutschen Lesern nicht geläufig sein dürfte. Im vorliegenden Text kann der Name ohne weitere Beschreibung verwendet werden, da unmittelbar zuvor bereits vom Sudan und seiner Führung die Rede war. Für die meisten Texte dürfte das Bild einer Menge einzelner “Ketten” (im Sinne des einfachen Aufeinanderfolgens von referenziellen Ausdrücken) zur Beschreibung der referenziellen Struktur nicht ausreichend sein. Abbildung 4.2 illustriert eine mögliche Komplikation (verschiedene Ketten mit gemeinsamer Wurzel). Weitere ergeben sich durch die Bildung von Mengen und Teilmengen der Diskursgegenstände. Betrachten wir eine mögliche Fortsetzung des bereits genannten Pausenbrot-Beispiels: (4.10) Gestern hat Susanne ihr Pausenbrot mit Marco geteilt. Die beiden verstehen sich sehr gut. Susanne besucht ihn oft, und die beiden musizieren dann. 58 4. Referenzielle Struktur teilmenge Marco die beiden Susanne menge menge Die beiden ihn Susanne menge menge teilmenge Abbildung 4.3.: Referenzielle Kette Pausenbrot für Beispiel 4.10 Die zweite Erwähnung von Susanne hat als unmittelbaren Vorgänger nicht etwa ihre Ersterwähnung, sondern den Ausdruck die beiden im zweiten Satz. Gleiches gilt für Marco, und am Ende wird dann wiederum auf beide gleichzeitig referiert. Unter Verwendung der Relationen menge und teilmenge ergibt sich die in Bild 4.3 gezeigte Struktur. Das Beispiel illustriert das Problem, dass man für die Kette einerseits die “logische” Letzterwähnung wählen kann, oder aber die linguistische: Das Pronomen ihn bezeichnet ja lediglich Marco und kongruiert hinsichtlich Numerus und Genus auch mit diesem Bezeichner. Um auch die Zuordnung der individuellen Diskursgegenstände zu ermöglichen, sind im Bild für Susanne und ihn jeweils beide Antezedenten angegeben. Eine andere Facette der Problematik, Koreferenz entweder an der sprachlichen Bezeichnung oder aber an der logischen Identität der Gegenstände festzumachen, illustriert die folgende Abwandlung eines Beispiels von Martin (1992): (4.11) Mathias suchte seinen Frosch. Schließlich fand er auch einen. Aber er war sich nicht sicher, ob das Tierchen nun wirklich sein Frosch war. Wollen wir uns an logischer Referenzidentität orientieren, müssten wir uns im Graph entscheiden, ob einen (Satz 2) identisch mit seinem Frosch (Satz 1) ist; abhängig von dieser Entscheidung ist dann sein Frosch im dritten Satz anzuknüpfen, während das Tierchen in jedem Fall auf einen verweist. In unseren Beispielen scheint es überflüssig zu sein, jeweils die Pfeilrichtung anzugeben, da sie stets von rechts nach links verläuft. Die Pfeilrichtung kann jedoch genutzt werden, um anaphorische von kataphorischen Verweisen zu unterscheiden: Tritt die Pro-Form vor dem Bezugsausdruck auf, so zeigt der Pfeil in der entsprechenden referenziellen Kette von links nach rechts. Fassen wir alle referenziellen Ketten bzw. Graphen eines Textes zusammen, erhalten wir eine recht gut lesbare Darstellungsform der referenziellen Textstruktur. Zu den in den obigen Beispielen gezeigten Pfeildiagrammen fügen wir noch die Information über die Position der referenziellen Ausdrücke im Text hinzu. Dann gibt die referenzielle Struktur Auskunft darüber, an welchen Stellen des Textes in wel- 4.2. Referenzielle Ketten: Globale Effekte 59 Abbildung 4.4.: Referenz-Matrix zum Beispieltext Darfur chen Formen über welche Diskursgegenstände gesprochen wird. Es lässt sich ablesen, welche Gegenstände im gesamten Text immer wieder aufgegriffen werden und welche nur in begrenzten Abschnitten auftreten. Dies wiederum lässt Rückschlüsse auf die thematische Gliederung des Textes zu: Die Positionen, an denen referenzielle Ketten beginnen und andere enden, deuten auf eine Themenverschiebung im Text hin. Bei kurzen Texten ist dies naturgemäß weniger augenfällig als bei längeren, doch lässt sich die Idee auch beim Darfur-Text aus Abb. 4.1 nachvollziehen. Als Darstellungsform wählen wir eine Matrix, in der eine Spalte jeweils drei aufeinanderfolgende Wörter des Textes und eine Zeile einen Diskursgegenstand repräsentiert - siehe Abbildung 4.4 3 . Wir füllen ein Kästchen der Matrix schwarz aus, wenn der der Zeile entsprechende Diskursgegenstand innerhalb der der Spalte entsprechenden drei Wörter durch einen referenziellen Ausdruck bezeichnet wird. Zwischen der erstmaligen und der letztmaligen Erwähnung färben wir die Kästchen der Zeile grau, um anzuzeigen, dass der Gegenstand im Text “aktuell” ist (eine Verfeinerung dieser Idee wird unten in Abschnitt 4.3.2 eingeführt). Ebenso führen indirekte Wiederaufnahmen zur Graufärbung: Sudan bleibt auch nach der einzigen expliziten Erwähnung “grau”, weil der Gegenstand (wie auch in Abb. 4.2 dargestellt) durch Führung, Khartum, Darfur jeweils indirekt wieder aufgenommen wird. Die Matrix zeigt einerseits, dass Darfur und die UN durchgängig eine Rolle spielen, und deutet andererseits eine gewisse Teilung des Textes etwa im Verhältnis 2 3 zu 1 3 an. Dies trifft in der Tat zu, denn der erste Teil des Textes berichtet über das aktuelle Ereignis, während das letzte Drittel Hintergrundinformation über den schon lange andauernden Konflikt liefert. Tagesaktuelle Gegenstände verschwinden deshalb, während die Nachbarländer und deren Armeen neu ins Spiel kommen. In längeren Texten kann also die referenzielle Struktur Hinweise auf die zentralen, durchgehend behandelten Gegenstände liefern (in einer Kurzgeschichte z. B. dürfte der Protagonist am häufigsten und nahezu im gesamten Text “aktuell” sein) 3 Die Ereigniskoreferenz zwischen Grundsatzeinigung und Satz 1 ist hier nicht berücksichtigt. 60 4. Referenzielle Struktur und daneben die Gliederung in inhaltliche Abschnitte anzeigen. Konzeptionen wie die “Hauptversus Nebenstruktur” von Texten, denen wir uns im nächsten Kapitel zuwenden werden, lassen sich durch die Analyse der referenziellen Struktur recht genau erkennen, worauf bereits Figge (1971) verwiesen hat. 4.3. Koreferenz: Lokale Effekte Im letzten Abschnitt haben wir uns dafür interessiert, wie häufig im Text auf bestimmte Gegenstände Bezug genommen wird, und daraus Schlüsse für die Strukturierung des Gesamttextes gezogen. Ebenso interessant ist es nun, die Form der referenziellen Ausdrücke genauer zu untersuchen, die ja nicht völlig beliebig ist, sondern bestimmten Regeln folgt - welche aber freilich immer noch großen Spielraum für die stilistische Wahl zwischen Alternativen lassen. Es ergeben sich daraus Erkenntnisse zu eher lokalen Phänomenen der Bestimmung referenzieller Ausdrücke. Um uns dies zu verdeutlichen, nehmen wir vorübergehend einmal die Perspektive der Textproduktion ein. Als Textproduzenten wissen wir, über welche Dinge wir schreiben wollen und was wir über sie sagen wollen; wir ordnen das Material und bringen es in eine geeignete Reihenfolge (Linearisierung), die zu einem insgesamt kohärenten Text führt. Eine wichtige Produktionsentscheidung ist dann jeweils die Auswahl eines sprachlichen Ausdrucks, um einen Diskursgegenstand zu bezeichnen - dies müssen wir dergestalt tun, dass unsere Leser den intendierten Gegenstand mit möglichst geringem Aufwand identifizieren können, was unter anderem bedeutet, dass eine Verwechslung mit “ähnlichen” Gegenständen möglichst ausgeschlossen sein soll. Darüber hinaus wollen wir womöglich nicht allein referieren, sondern (durch definite Kennzeichnungen) auch weitere Informationen über den Gegenstand kommunizieren. Und schließlich gibt es stilistische Gepflogenheiten, die es zu beachten gilt. Etwa: Wenn in einer Kurzgeschichte eine Person namens Sabine häufig auftritt und sie die einzige Sabine, mithin unverwechselbar ist, so wird sie dennoch höchstwahrscheinlich nicht durchgehend als Sabine bezeichnet, sondern die Autorin wird sich verschiedener Varianten bedienen. Wann also ist welcher referenzielle Ausdruck, auszuwählen aus dem in Abschnitt 4.1 genannten Inventar, richtig oder angemessen? 4.3.1. Aufmerksamkeitsfokus und Centering Die Centering-Theorie (Grosz u. a., 1995) entstand in den 1980er Jahren als Modell für die lokale Kohärenz zwischen Sätzen. Diese wurde vor allem als gelungene Wahl von referenziellen Ausdrücken und ihrer syntaktischen Einbettung (einschließlich der Konstituentenfolge) verstanden. Die zugrunde liegende These ist, dass Texte leichter zu verstehen sind, wenn es zu jedem Zeitpunkt einen klar identifizierbaren “zentralen” Diskursgegenstand gibt, auf den sich die Aufmerksamkeit der Leserin richten kann, und mit dem die übrigen Gegenstände jeweils verbunden sind. Der Autor sollte in jedem Satz des Textes die Realisierungsformen der referenziellen Ausdrücke und die syntaktische Struktur so wählen, dass der 4.3. Koreferenz: Lokale Effekte 61 Leserin die Identifikation des Zentrums möglichst leicht gemacht wird. Denn Eigennamen, definite Kennzeichnungen und Pronomen, so das Credo der Centering- Theorie, signalisieren ganz unterschiedliche Gewichtungen der Diskursgegenstände in unserer Aufmerksamkeit und müssen daher so gewählt werden, dass die Leserin jeweils das “richtige” Zentrum wahrnimmt. Psycholinguistische Experimente, die die These vom Zentrum stützen, wurden etwa von Hudson u. a. (1986) vorgestellt. Durch Messung von Lesezeiten stellten sie fest, dass Texte am schnellsten verstanden werden können, wenn im aktuellen Satz der jeweils zentrale Diskursgegenstand durch ein Pronomen realisiert ist; zudem bestätigten sie die seit längerem bekannte Hypothese, dass die Subjektposition im Satz für die Steuerung des Aufmerksamkeits-Fokus eine besonders wichtige Rolle spielt. Soll die Aufmerksamkeit auf einen neuen Diskursgegenstand übergeleitet werden, so seien dafür volle Nominalphrasen, auch in Subjektposition, ein wesentlich geeigneteres Mittel als Pronomen. Wenn ein kurzer Text sich vor allem mit einem einzelnen Diskursgegenstand beschäftigt, so wird dieser kontinuierlich im Zentrum stehen, und die Wahl der genannten linguistischen Mittel ist vor allem eine Frage der Abwechslung, also des Stils. Im Normalfall aber bewegt sich ein Text über mehrere Themen und Sub- Themen, und dann wird es wichtig, die jeweilige Verschiebung des Zentrums für die Leser geeignet anzuzeigen. Wir verdeutlichen uns dies an einer konstruierten Variation des Anfangs des Darfur-Beispieltexts aus Abb. 4.1: (4.12) (1) UN-Generalsekretär Annan berichtete, dass die Sudanesische Regierung einem UN-Truppeneinsatz in Darfur zugestimmt hat. (2) Die Regierung streitet ihm zufolge aber noch über das Ausmaß des Einsatzes. (3) Das Zugeständnis machte die Regierung bei einem Krisentreffen in Addis Abeba. (4) Er teilte mit, dass sie vor allem hinsichtlich der Truppenstärke andere Auffassungen hat als die UN. Die Informationen, die hier vermittelt werden, sind im Wesentlichen die gleichen, die der Anfang des Originaltexts mitteilt. Doch ist die Lesbarkeit der Variation merklich schlechter; die vier Sätze folgen zwar “logisch” aufeinander, aber sie sind nicht “flüssig” formuliert. Genauer besehen liegt das Problem darin, dass Text 4.12 sich nicht recht entscheiden mag, um welchen Protagonisten es eigentlich geht - der Text schwankt hin und her zwischen der Sudanesischen Regierung und dem Generalsekretär Annan. Beide spielen kontinuierlich eine Rolle, doch keiner von beiden steht anhaltend im Zentrum der Aufmerksamkeit. Mit kleinen Umformungen lässt sich dies jedoch verbessern: (4.13) (1) Die Sudanesische Regierung hat laut UN-Generalsekretär Annan einem UN-Truppeneinsatz in Darfur zugestimmt. (2) Sie streite aber noch über das Ausmaß des Einsatzes, wie er berichtete. (3) Die Regierung machte das Zugeständnis bei einem Krisentreffen in Addis Abeba. (4) Annan teilte mit, dass sie vor allem hinsichtlich der Truppenstärke andere Auffassungen hat als die UN. 62 4. Referenzielle Struktur In der ersten Variante wird zunächst Annan in den Vordergrund gestellt, während der Anfang des zweiten Texts bereits die Sudanesische Regierung ins Zentrum der Aufmerksamkeit rückt. Im letzten Satz ist jeweils Generalsekretär Annan das handelnde Subjekt; wichtig ist, wie häufig gewechselt wird, und wie sich dann auch in Satz 4 der Unterschied zwischen Pronomen und Eigennamen im Lichte der vorangehenden Sätze darstellt. An dieser Stelle verdeutlichen wir uns noch einmal den Zusammenhang zwischen Kohäsion und Kohärenz: Sowohl 4.12 als auch 4.13 sind kohäsiv, sie setzen in ganz ähnlicher Weise kohäsionsstiftende Mittel ein, wie wir sie in Kapitel 2 kennengelernt haben. In 4.13 führt dieser Einsatz jedoch zu einem besseren Ergebnis: Beim Übergang von Satz zu Satz erschließt sich der inhaltliche Zusammenhang leichter, die lokale Kohärenz ist verbessert. Wir sehen, dass kohäsive Mittel nicht per se den Text verbessern, sondern auch mit Bedacht eingesetzt werden müssen. Für die Centering-Theorie 4 sind die beiden entscheidenden Gestaltungsfaktoren die Zuordnung der Diskursgegenstände zu den grammatischen Funktionen des Satzes und die Pronominalisierung. Sie beeinflussen die lokale Kohärenz, die in diesem Modell durch die Verbindungen zwischen den Diskursgegenständen eines Satzes und denen der benachbarten Sätze dargestellt ist. Zur Bezeichnung der Sätze verwenden wir S n für den n-ten Satz des Textes und entsprechend S n −1 und S n +1 für dessen Vorgänger und Nachfolger. Die über die Sätze verbundenen Diskursgegenstände werden centers genannt, von denen es die folgenden drei Ausprägungen gibt: • Die Liste der forward-looking centers des Satzes S n , abgekürzt C f (S n ), ist die partiell geordnete Menge der in S n vorkommenden Diskursgegenstände, wobei die Ordnung durch die grammatischen Funktionen gegeben ist. An der Spitze steht das Subjekt, gefolgt vom direkten Objekt, gefolgt von anderen (indirektes Objekt, sonstige). Die Ordnung ist damit nur partiell, denn die “anderen” sind untereinander nicht geordnet. • Das preferred center des Satzes S n , abgekürzt C p (S n ), ist derjenige Diskursgegenstand, der an der Spitze der Liste der forward-looking centers steht. • Das backward-looking center des Satzes S n , abgekürzt C b (S n ), ist der ranghöchste Diskursgegenstand des vorangehenden Satzes (also von den C f (S n −1 )), der auch im aktuellen Satz S n realisiert ist. Die C f sind somit für die mögliche Anbindung des Satzes an seinen Folgesatz zuständig, während das C b die Verknüpfung zum Vorgänger darstellt - dies repräsentiert die eingangs genannte These, dass es eben stets genau einen “zentralen” Diskursgegenstand geben soll, der sich im Laufe des Textes verschieben kann. Wir verdeutlichen uns die Zuordnungen an den kurzen Beispieltexten 4.12 und 4.13. 4 Wir stellen hier im Wesentlichen die Form der Theorie nach Grosz u. a. (1995) dar. Das bedingt auch einen vereinfachten Umgang mit eingebetteten Sätzen, die wir hier nicht vom Matrixsatz getrennt analysieren. Zu vorgeschlagenen Erweiterungen und Variationen finden sich Literaturhinweise in Abschnitt 4.5. 4.3. Koreferenz: Lokale Effekte 63 C f bildet eine geordnete Liste, die jedoch an einigen Positionen auch ungeordnete Elemente enthalten kann (wegen des gleichen Ranges von indirektem Objekt und Adverbialen); diese notieren wir in runden Klammern. • Center-Zuweisungen für (4.12): Satz 1 C f : Annan - (Sud.Reg. / Truppeneinsatz) C p : Annan / C b = ∅ Satz 2 C f : Sud.Reg. - (Annan / Einsatz-Ausmaß) C p : Sud.Reg. / C b = Annan Satz 3 C f : Sud.Reg. - Zugeständnis - (Krisengespräch / Addis Abeba) C p : Sud.Reg. / C b = Sud.Reg. Satz 4 C f : Annan - (Sud.Reg. / Truppeneinsatz / UN) C p : Annan / C b = Sud.Reg. • Center-Zuweisungen für (4.13): Satz 1 C f : Sud.Reg. - Truppeneinsatz - Annan C p : Sud.Reg. / C b = ∅ Satz 2 C f : Sud.Reg. - (Einsatz-Ausmaß / Annan) C p : Sud.Reg. / C b = Sud.Reg. Satz 3 C f : Sud.Reg. - Zugeständnis - (Krisengespräch / Addis Abeba) C p : Sud.Reg. / C b = Sud.Reg. Satz 4 C f : Annan - (Sud.Reg. / Truppeneinsatz / UN) C p : Annan / C b = Sud.Reg. In den Blickpunkt rückt nun die Art und Weise, in der sich das center von einem Satz zum nächsten entwickelt. Nach Brennan u. a. (1987) gibt es dafür vier Möglichkeiten, die in Abb. 4.5 dargestellt sind. Der Übergang zwischen zwei Sätzen hängt einerseits davon ab, ob das backward center identisch bleibt oder nicht (die beiden Spalten der Tabelle) und andererseits davon, ob im aktuellen Satz das backward center gleich dem preferred center ist oder nicht (die beiden Zeilen). Welche Arten von Übergängen in einem Text vorliegen, sei nun entscheidend für dessen lokale Kohärenz; Brennan u. a. legen dafür die folgende Präferenz-Hierarchie fest: CONTINUE > RETAIN > SMOOTH SHIFT > ROUGH SHIFT Wir können nun die Benennung der Übergänge für unsere Beispieltexte vornehmen. Zwischen Satz 1 und Satz 2 lässt sich der Übergang nur unvollständig berechnen, weil Satz 1 naturgemäß noch kein backward-looking center besitzt. Legen C b (S n ) = C b (S n −1 ) C b (S n ) = C b (S n −1 ) C b (S n ) = C p (S n ) CONTINUE SMOOTH SHIFT C b (S n ) = C p (S n ) RETAIN ROUGH SHIFT Abbildung 4.5.: Center-Übergänge nach Brennan u. a. (1987) 64 4. Referenzielle Struktur wir aber einen Wechsel des C b zugrunde, erhalten wir gemäß der oben dargestellten center-Übergänge für Text 4.12 einen ROUGH SHIFT und für 4.13 einen SMOOTH SHIFT . Zwischen den Sätzen 2 und 3 ergibt sich für Text 4.12 ein SMOOTH SHIFT und für 4.13 ein CONTINUE . Zwischen den Sätzen drei und vier besteht in beiden Beispieltexten ein RETAIN . Da in der Präferenz-Hierarchie einerseits SMOOTH SHIFT vor ROUGH SHIFT und andererseits CONTINUE deutlich vor SMOOTH SHIFT rangiert, hätte die Centering Theorie in der hier geschilderten Form den intuitiv erkennbaren Unterschied zwischen den beiden Beispieltexten also in der Tat erklärt. Dabei ist aber zu beachten, dass der Unterschied zwischen den dritten Sätzen der Beispieltexte (Topikalisierung versus Standard-Wortstellung) auf die Center-Berechnung keinen Einfluss hat; entscheidend dafür sind ja (in der oben vorgestellten Version) allein die grammatischen Funktionen. Spätere Arbeiten haben den Zusammenhang zwischen Centering und Wortstellung beleuchtet; gerade für das Deutsche ist dies relevant, weil die Bindung zwischen grammatischem Subjekt und satzinitialer Position lockerer ist als im Englischen (siehe dazu etwa Rambow, 1993). Das zweite wesentliche Anliegen von Centering besteht wie gesagt darin, Vorhersagen zur Pronominalisierung zu machen. Dazu formulierten Grosz u. a. (1995) die Regel: Wenn ein Element aus C f (S n ) in S n +1 als Pronomen realisiert ist, dann muss auch der C b des Satzes S n +1 dort als Pronomen realisiert sein. Damit wird die Intuition erfasst, dass die Benutzung eines Pronomens der Leserin signalisieren soll, dass der zentrale Diskursgegenstand beibehalten wird. Eine Verletzung der Regel würde bedeuten, dass der zentrale Gegenstand nicht pronominalisiert wird, irgendein anderer, nicht im Zentrum stehender, Gegenstand hingegen pronominalisiert ist - was für das mentale Verfolgen des centers recht irritierend wäre. Wir können uns leicht davon überzeugen, dass diese Regel in beiden Beispieltexten 4.12 und 4.13 eingehalten wurde, wobei 4.12 allerdings eine Pronominalisierung enthält, die ihr Antezedens erst in S n −2 findet, wozu die hier erläuterte Version von Centering keine Aussage trifft. Eine ganze Reihe weiterer (englischer) Beispiele zur Unterstützung der Voraussagen der Centering-Theorie sind in (Grosz u. a., 1995) zu finden. Wir halten abschließend ihre grundlegende These fest, nach der Entscheidungen der Sprachproduktion über Pronominalisierung, Zuweisung von Diskursgegenständen zu grammatischen Funktionen sowie die Wahl zwischen Wortstellungsvarianten nicht allein von der Syntax, auch nicht allein von der Semantik und auch nicht allein von der Pragmatik bestimmt werden. Stattdessen handelt es sich um ein Wechselspiel zwischen diesen Beschreibungsebenen, das dementsprechend auch Ebenenübergreifend modelliert und erklärt werden muss. 4.3.2. Aktivierungsgrad von Diskursgegenständen Wir haben mehrfach darauf hingewiesen, dass das auch im Centering untersuchte Phänomen der Pronominalisierung in der Linguistik (einschließlich der Textlinguistik und der Computerlinguistik) eine beachtliche Popularität erreicht hat. Interessieren wir uns für die Form referenzieller Ausdrücke und deren Rolle im 4.3. Koreferenz: Lokale Effekte 65 Text, so finden sich neben den Personalpronomen aber noch eine ganze Reihe anderer Varianten - in Kapitel 2 und zu Beginn dieses Kapitels haben wir das bereits kurz skizziert. Derselbe Diskursgegenstand kann in einem Text also mit sehr unterschiedlichen Ausdrücken bezeichnet werden. Die einfachste Unterscheidung, die man in diesem Spektrum treffen kann, ist die zwischen alt und neu (englisch given/ new): Wurde über den Gegenstand schon einmal gesprochen oder nicht? Davon hängt dann etwa, nach einer bekannten “Faustregel”, die Wahl eines indefiniten Artikels für die Ersterwähnung und einer definiten Kennzeichnung für spätere Erwähnungen ab. Dass eine bloße Zweiteilung dem Spektrum sprachlicher Ausdrücke aber nicht gerecht wird, liegt auf der Hand. Wegweisend waren in diesem Zusammenhang Arbeiten von Givón (1983) und von Prince (1981), die jeweils feinkörnigere Einteilungen vorschlugen. Wichtig ist, dass damit aber auch ein Wechsel der Perspektive einhergeht, nämlich von einer rein “textzentrierten” Betrachtung zu einer, die die kognitiven Prozesse der Leserin des Textes mit einbezieht. Entscheidend ist dann nicht mehr, ob ein bestimmter Gegenstand “im Text vorerwähnt” ist, sondern ob er “im mentalen Modell der Leserin zugänglich” ist. Dies hat zwei entscheidende Vorteile: • Der Blick auf das mentale Modell legt nahe, dass Gegenstände “mehr oder weniger” zugänglich sind (wie zugänglich, sollte das Modell erklären). • Unter Rückgriff auf das mentale Modell lässt sich auch erklären, warum Gegenstände, die nicht im Text, sondern in “der Welt”, u. a. in der akuten Äußerungssituation, eine Rolle spielen, sprachlich durch bestimmte referenzielle Ausdrücke bezeichnet werden. Für unser Ziel der Textanalyse ist der zweite Punkt hier weniger relevant, der erste jedoch ist sehr bedeutsam. So bestimmt die Unterscheidung zwischen der Text- Welt und der Hörer-Welt die Ausgestaltung der Terminologie von Prince (1981), nach der wir jetzt den Gegenstand aus der “Welt” (einschließlich der Text-Welt) trennen müssen vom Diskursreferenten, dem Objekt im mentalen Modell, das den Gegenstand repräsentiert. Prince schlägt auf dieser Grundlage die folgende Taxonomie der Zugänglichkeit vor: 1. Brand-new: neuer Diskursreferent für bisher unbekannten Gegenstand. Eine Variante davon ist ‘brand-new anchored’, wo der Diskursreferent an einen bereits bekannten Gegenstand anknüpft: a guy I work with 2. Inferrable: neuer Diskursreferent für inferierbaren Gegenstand. Es gibt zwei Varianten, ‘containing’ (one of those eggs) und ‘non-containing’ (I hopped on a bus. The driver stopped me.) 3. Unused: neuer Diskursreferent für bekannten Gegenstand. Ein als bekannt vorausgesetzter Gegenstand erscheint erstmals im Text, wie in I wanted to meet the Pope. 66 4. Referenzielle Struktur 4. Evoked: Zugriff auf verfügbaren, weil im Text bereits erwähnten Diskursreferenten. Jeder Vorschlag einer solchen Skala muss sich daran messen lassen, wie gut er die möglichen Variationen von referenziellen Ausdrücken in bestimmten Kontexten erklären kann. Dazu gab es konkrete Vorschläge, beispielsweise den von Gundel u. a. (1993), wonach für die unterschiedlichen Grade von ‘Identifizierbarkeit’ und ihre linguistischen Signale im Englischen die folgende Skala gelte, geordnet wiederum von ‘wenig zugänglich’ bis ‘leicht zugänglich’: 1. Unidentifiable: “a N” 2. Referential: indefinite “this N” 5 3. Identifiable: “the N” 4. Familiar: “this N” / “that N” 5. Activated: “this” / “that” 6. Focus: “it” Die ersten beiden Gruppen realisieren die Kategorie brand-new von Prince, identifiable entspricht sowohl inferrable als auch unused. Die übrigen Gruppen verfeinern Prince’ Kategorie evoked; dabei entspricht focus dem, was wir im vorigen Abschnitt als center diskutiert haben, es handelt sich also um den ‘Aufmerksamkeitsfokus’ (im Gegensatz zu dem informationsstrukturellen Begriff). In einer solchen Skala findet sich einerseits die genannte einfache Faustregel wieder, nach der ein nichtidentifizierbarer Gegenstand indefinit eingeführt wird; darüber hinaus liefert sie eine feinere Gliederung der möglichen sprachlichen Realisierungsformen und postuliert, dass mit ihrer Verwendung ein jeweils unterschiedlicher Grad an Zugänglichkeit im mentalen Modell einhergeht. Wie angemessen eine solche Skala ist, kann an Texten überprüft werden, indem festgestellt wird, ob eine Nominalphrase der entsprechenden Form mit dem jeweiligen Aktivierungsstatus des Diskursreferenten übereinstimmt - was natürlich voraussetzt, dass eine Metrik für die Bestimmung des Aktivierungsstatus zur Verfügung steht. Nach Givón (1983) sollten in eine solche Metrik zumindest drei Faktoren eingehen: • die Distanz zur letzten Erwähnung des Gegenstandes (Givón misst sie in clauses), • die Anzahl möglicher Verwechslungskandidaten in der näheren Umgebung (die Wahl einer einfachen definiten NP wie der Hund hängt davon ab, ob es im mentalen Modell noch andere, ähnlich leicht zugängliche Gegenstände vom Typ Hund gibt), • die Fortführung des Gegenstandes im nachfolgenden Diskurs, gemessen als Zahl der aufeinanderfolgenden clauses, in denen der Gegenstand kontinuierlich erwähnt wird. 5 Gemeint sind hier Verwendungen wie in “You know, I met this man on the bus today. He . . . ” 4.3. Koreferenz: Lokale Effekte 67 Die Situation bleibt allerdings nicht so übersichtlich. Zum einen ist die Bandbreite möglicher referenzieller Ausdrücke - zwischen denen also eine Abstufung hinsichtlich ihrer Zugänglichkeit gefunden werden müsste - abermals größer als die o. g. Liste von Gundel u. a. Wir betrachten dazu die von Ariel (2001) vorgeschlagene Skala, die sich wieder von niedriger zu hoher Zugänglichkeit bewegt: Vor- und Nachname - lange definite Beschreibung - kurze definite Beschreibung - Nachname - Vorname - distales Demonstrativpronomen (“jener”) - proximales Demonstrativpronomen (“dieser”) - betontes Pronomen mit Sprachgeste - betontes Pronomen - klitisches Pronomen - referenzielle Flexionsendung - Ellipse. Zum anderen genügt es für die Untersuchung der Korrelation zwischen Aktivierung und Realisierung nicht, allein die Nominalphrase zu betrachten; auch die syntaktische Struktur muss berücksichtigt werden. So führt etwa Givón (1983) in seiner entsprechenden Skala rechtsversetzte und linksversetzte NPs (“Er ist clever, der Peter” / “Peter, der ist clever”) als unterschiedlich zugänglich auf, was sinnvoll ist, da solche Konstruktionen gerade dazu dienen, den Grad der ‘Topikalität’ eines Gegenstandes anzuzeigen (mehr dazu im nächsten Kapitel). Weitere Untersuchungen zum Zusammenhang zwischen syntaktischer Form und Aktivierung, auf die wir hier nicht weiter eingehen können, finden sich zum Beispiel in (Birner u. Ward, 1998). 4.3.3. Numerische Modelle: Aktivierungsfunktionen Die im letzten Abschnitt genannten Ansätze zur Charakterisierung der “Aktivierung” von Diskursgegenständen haben gemeinsam, dass sie alle mit (allerdings unterschiedlicher Zahl von) diskreten Kategorien arbeiten, d.h. mit einer relativ kleinen Menge von Kategorien, die mit möglichst aussagekräftigen Bezeichnern versehen sind. Das alternative Vorgehen besteht darin, auf die Festlegung einer bestimmten Zahl von Kategorien zu verzichten und stattdessen mit einem skalaren System zu arbeiten, wonach der Aktivierungsgrad eines Diskursreferenten auf einer numerischen Skala (zum Beispiel mit reellen Zahlen zwischen 0 und 1) modelliert wird. 6 Diese Methode ist in eher kognitiv oder psycholinguistisch ausgerichteten Arbeiten gebräuchlicher, wo vielfach numerische Modelle herangezogen werden, um komplexe Interaktionen zwischen vielen Einflussfaktoren, etwa in der Sprachproduktion, erklären zu können. Dass eine solche Situation - komplexe Interaktion vieler Faktoren - bei der Wahl referenzieller Ausdrücke im Text gegeben sein könnte, dafür gibt es in der Tat viele Hinweise. Das Spektrum möglicher syntaktischer Realisierungen von Diskursgegenständen, sowohl für die Gestalt der Nominalphrase als auch für ihre syntaktische Einbettung in mehr oder weniger “typischen” Strukturen, ist so vielfältig, dass für die Arbeit mit realen Texten eine überschaubare Zuordnung zu Kategorien des Aktivierungsgrades kaum möglich, geschweige denn empirisch belegbar erscheint. 6 Ein frühes Beispiel findet sich in Sgall u. a. (1986, S. 263). 68 4. Referenzielle Struktur Auf der gegenüberliegenden Seite ist aber auch das Spektrum der Merkmale von Diskursgegenständen und von ihren möglichen Kontexten, die eine Rolle für die sprachliche Realisierung der Gegenstände spielen können, nicht minder vielfältig. Für die Gegenstände selbst spielt das Kriterium der Belebtheit eine interessante Rolle, aber auch das der ‘Rigidität’, d.h. der semantischen Eindeutigkeit (z. B., ist ein Gegenstand ein prototypischer Vertreter seiner Klasse? - Für die Klasse Möbel gilt das für Stuhl, aber nicht für Teewagen). Überschreiten wir dann die Grenze zur Situierung des Gegenstands im Kontext, stoßen wir zunächst auf das Merkmal ‘Agentivität’: Spielt der Gegenstand eine Rolle als Handelnder, oder bleibt er passiv? Im konkreten sprachlichen Kontext schließlich kommen, wie oben bemerkt, Faktoren wie die Distanz zur letzten Erwähnung und die Häufigkeit der bisherigen Vorerwähnungen hinzu. Bei der Diskussion des Centering haben wir auf die wichtige Rolle der grammatischen Funktion, speziell des Subjektstatus verwiesen. Hinzu tritt aber auch die “Erwartbarkeit” des Gegenstands im Kontext - kommt seine Erwähnung überraschend oder nicht? Dies hängt u. a. mit der Existenz von ‘bridging’-Relationen zu anderen Diskursgegenständen zusammen. Und zuletzt sei das Merkmal genannt, ob der Gegenstand in einer Vorerwähnung im Text mit lexikalischen Mitteln als besonders “wichtig” markiert wurde, oder möglicherweise im Gegenteil als “nebensächlich”. Wenn wir davon ausgehen, dass in der Tat eine solche Vielzahl von Faktoren bei der Wahl sprachlicher Realisierungsformen mitspielt, scheidet die Idee aus, sie mit symbolischen Regeln zueinander in Beziehung setzen zu wollen, um aus dem Modell einer Äußerungssituation die “beste” Realisierung vorherzusagen. Stattdessen bietet sich das Instrument eines numerischen Modells an, bei dem unterschiedliche Kriterien als numerische Faktoren in die ‘Aktivierungsfunktion’ eines Diskursgegenstandes eingehen. Die Grundidee besteht darin, dass aus Sicht des Textverstehens für jeden im Text behandelten Diskursgegenstand eine solche Funktion definiert wird, deren Wert zu Textbeginn gleich null ist. Bei der ersten Erwähnung wird die Aktivierung auf einen bestimmten Wert gesetzt, in Abhängigkeit von der lexikalischen und strukturellen Realisierungsform (Subjekte sind aktiver als Objekte, etc.), aber auch von den Merkmalen des Gegenstands (s. o.). Von nun an sinkt die Aktivierung des Gegenstands kontinuierlich mit jeder verarbeiteten Einheit, bis er wieder erwähnt wird und sich sein Gewicht um einen bestimmten Faktor, wiederum abhängig von den unterschiedlichen Kriterien, erhöht. Wird der Gegenstand hingegen nicht mehr erwähnt, geht seine Aktivierung allmählich wieder dem Wert null entgegen. 4.4. Annotation von Koreferenz im Korpus Diagramme von Wiederaufnahmestrukturen in Texten, wie in Abschnitt 4.2 an kleinen Beispielen illustriert (Abb. 4.2 und 4.3), finden sich in verschiedenen textlinguistischen Lehrbüchern, wie etwa (Brinker, 2001) oder (Martin, 1992). Sie erläutern, was unter einer solchen Struktur zu verstehen ist, und analysieren exemplarisch einen oder einige wenige Texte. Diese Analysen können uns zur Motivation 4.4. Annotation von Koreferenz im Korpus 69 für eigene Analysen dienen, doch das Medium Papier erlaubt es naturgemäß nicht, nach bestimmten Analyse-Phänomenen gezielt zu suchen, ähnliche miteinander zu vergleichen, Hypothesen zu prüfen, Schlüsse zu ziehen. Dies ist der Grund, weshalb wir in diesem Buch den Weg der computergestützten Annotation gehen. Um die referenzielle Struktur für einen Text zu annotieren, benötigen wir wie gesehen die folgenden Schritte: 1. Identifizieren derjenigen sprachlichen Einheiten (einschließlich Ellipsen), die anaphorisch oder kataphorisch auf eine andere Einheit im Text verweisen ( ANAPH ), 2. identifizieren der zugehörigen Antezedens-Einheiten ( ANTE ), 3. benennen der Relationen zwischen ANAPH und ANTE , 4. (optional) festlegen eines Aktivierungsgrads für jedes Auftreten eines ANAPH oder ANTE , nach einer gewählten Skala. In den Schritten 1 und 2 muss auch festgelegt werden, ob Ereignisreferenz mit behandelt werden soll, und zu welchem Teil die indirekte Wiederaufnahme (bridging) zu annotieren ist. Während man für textbezogene Untersuchungen der referenziellen Struktur auf Ereignisreferenz oft verzichten kann, spielen bridging-Relationen für aussagefähige referenzielle Ketten oft eine wichtige Rolle. Ein besonders für die Annotation von Koreferenz gut geeignetes Software-Werkzeug ist MMAX2 7 (Müller u. Strube, 2006). Es gestattet das komfortable Markieren von referenziellen Ausdrücken (genannt markables) und das Verbinden von koreferenten Ausdrücken mit der Maus. Entstehende Relationen können mit einer Bezeichnung versehen werden. Zur Illustration zeigt Abb. 4.6 einen Bildschirmabzug. MMAX2 ist in Java implementiert und damit auf allen gängigen Betriebssystemen lauffähig. Bevor ein Text in MMAX2 geladen werden kann, muss er zunächst in das spezielle Eingabeformat der Software umgewandelt werden. Dafür werden entsprechende Konvertierungsskripte mitgeliefert. In der Computerlinguistik laufen seit einigen Jahren verschiedene Vorhaben, die größere Textkorpora mit Koreferenz-Information annotieren und die Ergebnisse für Forschungszwecke verfügbar machen. Frühe Arbeiten entstanden für die englische Sprache in den USA im Rahmen der Message Understanding Conferences, in Europa folgte das GNOME Korpus mit zugehörigen Annotationsanweisungen (Poesio, 2004). Für das Deutsche entstehen ähnliche Daten im Rahmen des Potsdamer Kommentarkorpus, nähere Angaben dazu finden sich auf der zum Buch gehörigen Homepage 8 . Die Annotation von Koreferenz-Information ist besonders nützlich, wenn sie, wie im Einleitungskapitel angedeutet, mit weiteren Analyse-Ebenen in Beziehung gesetzt werden kann. Doch auch ein Datenbestand, der nur den “rohen” Text und 7 www.eml-research.de/ english/ research/ nlp/ download/ mmax.php 8 www.ling.uni-potsdam.de/ ~stede/ KorpTA.html 70 4. Referenzielle Struktur Abbildung 4.6.: Koreferenz-Annotation mit MMAX2 die Koreferenz umfasst, erlaubt interessante Auswertungsschritte. So können die in Abschnitt 4.2 skizzierten referenziellen Ketten automatisch aus den Daten extrahiert und die Koreferenz-Relationen mit der Information über die Distanz (Anzahl der Wörter) zwischen den koreferenten Ausdrücken angereichert werden. Damit lassen sich statistische Auswertungen zur Form referenzieller Ausdrücke in Abhängigkeit einfacher Parameter der Vorerwähntheit durchführen, Untersuchungen zur relativen Häufigkeit kataphorischer Verweise, etc. Die Möglichkeiten steigen, wenn der Text auch mit syntaktischer Information angereichert ist, wobei das Spektrum von einfachen (automatisch erstellbaren) partof-speech tags über Nominalphrasen (teilweise automatisch erkennbar), weiter zur Information über grammatische Rollen, bis hin zu kompletten syntaktischen Strukturen reicht. In Verbindung mit der Syntax kann die Realisierungsform referenzieller Ausdrücke zu vielen der im Kapitel genannten Parameter in Beziehung gesetzt werden, um Modelle für die Vorhersage der Form referenzieller Ausdrücke zu überprüfen und zu verbessern. So lassen sich beispielsweise verschiedene Ausprägungen der Centering Theorie empirisch überprüfen, indem aus der Kombination von Syntax und Koreferenz die C f , C p und C b automatisch errechnet werden, woraufhin z. B. die Pronominalisierungsregel (“ist ein Element von C f (S n −1 ) pronominalisiert, muss auch C b pronominalisiert sein”) an konkreten Daten getestet werden kann. Des weiteren kann man aus Syntax und Koreferenz den Aktivierungsstatus der Diskursreferenten nach bestimmten Regeln automatisch errechnen, braucht ihn al- 4.5. Weiterführende Literatur 71 so nicht manuell zu annotieren. Interessiert man sich für eine numerische Modellierung der Realisierungsform referenzieller Ausdrücke im Kontext, so können die zugrunde gelegten Aktivierungsfunktionen an den Daten getestet werden - oder aber man gewinnt diese Funktionen unmittelbar aus den Daten mit Methoden des maschinellen Lernens. 4.5. Weiterführende Literatur Die Literatur zum Thema Referenz ist, insbesondere aus philosophischer und formal-semantischer Sicht, ausgesprochen reichhaltig; darauf können wir hier nicht eingehen. Als nächsten Schritt zur Vertiefung der in diesem Kapitel skizzierten Phänomene ist das Übersichtskapitel in (Braunmüller, 1977) geeignet; einen stärkeren Textbezug bietet die Untersuchung von Schwarz (2000). Für die Computerlinguistik liefert die Monographie von Mitkov (2002) einen Einblick in den derzeitigen Stand der Kunst. Zum Thema Centering bietet das Buch (Walker u. a., 1998) einen umfassenden Überblick über verschiedene Facetten der Theorie. Eine jüngere und kürzere Bestandsaufnahme findet sich in Poesio u. a. (2004). 4.6. Übungsaufgaben 1. Analysieren Sie Ihren Kommentar im Hinblick auf seine referierenden Ausdrücke: Welche Phrasen führen einen neuen Gegenstand in den Diskurs ein, welche Phrasen verweisen anaphorisch auf bereits eingeführte Gegenstände? Stellen Sie das Ergebnis analog zu Bild 4.4 als Matrix dar, in der jeweils in Drei-Wort-Schritten die Diskursgegenstände markiert sind, die neu eingeführt oder wieder aufgenommen werden. Vermutlich wird es dabei Zweifelsfälle und problematische Entscheidungen geben. Benennen Sie diese stichwortartig. 2. Konstruieren Sie einige weitere, auch nicht “flüssige”, Varianten unserer Beispieltexte 4.12 und 4.13. Überprüfen Sie dann anhand der Centering Theorie, ob die Art der Übergänge zwischen den Sätzen ( CONTINUE etc.) die Unterschiede in der Verständlichkeit erklärt oder nicht. Prüfen Sie auch, ob die Pronominalisierungsregel jeweils erfüllt ist. Wäre es sinnvoll, die partielle Ordnung der C f oder die Hierarchie der Übergänge (Abb. 4.5) für unsere deutschen Beispiele anders zu definieren als es die besprochenen Autoren für das Englische taten? 3. Wenn Sie sich dafür entschieden haben, auch die “technische” Seite der Daten- Annotation zu bearbeiten, verschaffen Sie sich Zugang zu dem Programm MMAX2 (Quelle: s. o.), konvertieren Sie die Textdatei Ihres Kommentars in das MMAX2-Inputformat und erstellen Sie eine Annotation der in Übung 1 ausgeführten referenziellen Struktur. 5. Thematische Struktur (5.1) Gestern lief alles großartig. Mein Lieblingsverein hat den DFB-Pokal gewonnen, und vor der Schule lagen doch tatsächlich 10 Euro auf dem Gehsteig! Befragen wir diese Satzfolge nach ihrer Textualität, besteht wohl wenig Zweifel daran, dass sie “funktioniert”. Anders als in Beispiel 4.1 zu Beginn des letzten Kapitels kann dafür allerdings nicht die Kontinuität der Diskursgegenstände verantwortlich sein, denn die referenzielle Struktur zeigt zwischen den drei Sätzen nicht eine einzige Koreferenz an. Die Verbindung muss also tiefer liegen und wird gemeinhin als ‘thematisch’ bezeichnet. ‘Thema’ ist allerdings ein Begriff, der sich in der Alltagssprache durch bemerkenswerte Vagheit und dann in der linguistischen Fachliteratur obendrein durch verwirrende Mehrdeutigkeit auszeichnet. Befragen wir aber zunächst ein Lexikon 1 nach dem Begriff ‘Thema’, so finden wir die Erläuterung: Thema [griech., eigtl. “das Gesetzte”], Hauptgedanke; Aufgabe, zu behandelnder Gegenstand; Leitmotiv; Gesprächsstoff. Einen solchen alltagssprachlichen Begriff legen wir in Abschnitt 5.1 zugrunde, wenn wir das Thema als den Textgegenstand untersuchen, der salopp gesagt die Antwort auf die Frage “worum geht es? ” darstellt. In 5.2 weiten wir die Frage aus zu “wie geht es darum? ” und stellen fest, dass sich Themen im Textverlauf unterschiedlich verschieben können, dass es dafür aber gewisse Regularitäten gibt, die an die Diskussion von Textsorte und Texttyp in Kapitel 3 anknüpfen. Im folgenden Abschnitt 5.3 verschiebt sich der Schwerpunkt auf die lokale Rolle von Themen bei der Gestaltung der “Nahtstellen” von benachbarten Sätzen. Wir werden feststellen, dass die Formulierung der einzelnen Sätze sowohl von globalen Vorgaben als auch von den zuletzt gewählten Formulierungen der Vorgängersätze beeinflusst wird. Eine spezifische Ausprägung dieser Fragestellung ist die in der Linguistik intensiv untersuchte Informationsstruktur, die wir in 5.4 behandeln. Dort wird der Begriff ‘Thema’ enger gefasst, leider aber auch keineswegs einheitlich verwendet. Insgesamt stehen sich textbezogene und satzbezogene Thema-Begriffe heute recht unvermittelt gegenüber (vgl. Hoffmann, 2000), und mit der in diesem Kapitel gewählten Reihenfolge der Themen [sic] soll eine “Landkarte” vorgeschlagen werden, anhand derer sich die sehr reichhaltige Literatur zu den verschiedenen Spielarten von ‘Thema’ einsortieren lässt. 1 Meyers Großes Taschenlexikon in 24 Bänden, B.I. Taschenbuchverlag Mannheim/ Wien/ Zürich, 1987, Band 22, S. 69 74 5. Thematische Struktur 5.1. Thema als Textgegenstand Wenn wir nach der Lektüre eines Textes eine kurze und treffende Antwort auf die Frage formulieren, wovon der Text denn handele, haben wir im o. g. alltagssprachlichen Sinn sein Thema benannt. Eine angemessene Benennung kann allerdings von unterschiedlichem Typ sein, sie kann aus einem einzigen Wort (meist wohl ein Substantiv), einer Phrase, einem oder mehreren Sätzen bestehen - oder aber auch als Fragestellung formuliert sein. Verschiedene Autoren (z. B. Lötscher, 1987) haben darauf hingewiesen, dass die Form des Themas im Zusammenhang zum Texttyp und zur Textfunktion steht. So wird ein instruktiver Text meistens gut durch eine Phrase beschrieben sein, die den auszuführenden Vorgang bezeichnet (“Wechseln der Zündkerzen”). Das Thema eines deskriptiven oder eines expositorischen Texts lässt sich häufig durch den Gegenstand angeben, der erläutert wird (“Die Solarzelle”). Für den argumentativen Text kommt tendenziell eine Fragestellung (“Soll die Legehennenverordnung novelliert werden? ”) oder aber die vom Autor vertretene These (“Die Legehennenverordnung sollte novelliert werden! ”) in Frage. Für den narrativen Text sind die Möglichkeiten vielfältiger, da eine Erzählung sich mit den unterschiedlichsten Arten von Dingen befassen kann (“Ein Tag im Leben des jungen Friedrich”). Wenn ein möglicher Thema-Typ hier ‘Gegenstand’ heißt, impliziert das nicht zwangsläufig, dass es sich im Sinne des letzten Kapitels auch um einen ‘Diskursgegenstand’ handelt; der Thema-Gegenstand muss nicht unbedingt als solcher auch explizit im Text vorkommen. Denn die Bildung des Themas ist immer ein Abstraktionsprozess, was bedeutet, dass einerseits weggelassen, andererseits verallgemeinert wird. Relevantes wird von weniger Relevantem unterschieden, am Ende können dann die relevantesten Gegenstände zu einem einzelnen Begriff zusammengefasst werden. Einfaches Beispiel: Ein kurzer Text berichtet über Silvias Pony, ihren Hamster und ihren Wellsittich; das Thema wäre dann durchaus treffend als “Silvias Haustiere” bezeichnet. Da der Textgegenstand zudem wie gesagt keineswegs immer ein Gegenstand im engeren Sinne ist, sondern auch ein Sachverhalt bzw. eine Proposition sein kann, wird deutlich, dass der Prozess seiner Identifikation nicht allein auf der Ebene der Textoberfläche verlaufen kann, sondern vielmehr eine semantische Operation sein muss. Ein bekannter Vorschlag, auf diesem Weg durch formale Regeln das Textthema aus den Bedeutungen der Sätze abzuleiten, stammt von van Dijk (1980). Er motiviert seinen Ansatz auch mit dem Ziel der kognitiven Modellierung und schreibt auf S. 45: Wir müssen uns Einsicht verschaffen in das sehr wesentliche Vermögen des Sprachgebrauchers, das ihm ermöglicht, auch bei sehr langen und komplizierten Texten Fragen zu beantworten wie ‘Wovon war die Rede? ’, ‘Was war der Gegenstand des Gesprächs? ’ u. a. Ein Sprachgebraucher kann das auch dann, wenn Thema oder Gegenstand selbst als Ganzes nicht explizit im Text erwähnt werden. Er muss also das Thema aus dem Text ableiten. 5.1. Thema als Textgegenstand 75 ... M 1 i M n−1 1 M 2 n−1 M 3 n−1 M 1 n P k1 P k2 P k3 ... ... ... ... ... ... Abbildung 5.1.: Makrostruktur eines Textes nach van Dijk (1980) Sein Ansatz beruht auf der gängigen Vorstellung, dass die Satzbedeutung als Prädikat-Argument-Struktur darstellbar ist, die Teilhandlungen des Satzinhalts das Referieren und das Prädizieren sind, und die Prädikation dann als Proposition bezeichnet wird (mehr dazu in Abschnitt 7.1). Interpretiert eine Rezipientin einen Satz, steht sie vor der Aufgabe, alle Propositionen offenzulegen, auch die nicht expliziten, jedoch “mitzuverstehenden” (Präsuppositionen, Konnotationen). Die Ausweitung dieses Bildes auf den Text ergibt nach van Dijk dann einen “Propositionenkomplex”, wobei diese Propositionen nicht unverbunden nebeneinander stehen, sondern durch additive, kausale, konditionale und andere Relationen zueinander in Beziehung gesetzt werden (siehe dazu Kapitel 8). Für van Dijk besteht Textverstehen darin, die “semantische Tiefenstruktur” des Texts zu rekonstruieren, indem die einzelnen Propositionen aufgedeckt und darüber hinaus komplexere Propositionen, sog. ‘Makropropositionen’ aktiv gebildet werden. Diese abstrahieren auf jeweils unterschiedliche Weise von den beteiligten Propositionen, stellen also das Ergebnis einer Informationsreduktion dar. Indem dieser Vorgang zunächst für die einzelnen Propositionen und dann auch weiter über die Makropropositionen, also rekursiv für den gesamten Text abläuft, entsteht die ‘Makrostruktur ’ des Textes als Baum mit einem ausgezeichneten Wurzelknoten, nämlich derjenigen Proposition, die das Textthema repräsentiert. Abbildung 5.1 illustriert diese Strukturbildung. An den Blättern des Baums stehen die P für Propositionen, die Textsegmenten k i entsprechen. Die M sind Makropropositionen, bezeichnet mit einem Superskript für die Abstraktionsebene (von 1, dem ersten Schritt über dem Text, bis n, dem Gesamttext) und einem Subskript zur lau- 76 5. Thematische Struktur fenden Nummerierung auf derselben Ebene. Die Regeln für die Verknüpfung von Propositionen sind: • Selektion: Weglassen irrelevanter Propositionen, oder solcher, die Bestandteile, Präsuppositionen, Folgen einer nicht weggelassenen Proposition sind. Peter lief zu seinem Auto. Er stieg ein. Peter fuhr nach Frankfurt. −→ Peter fuhr nach Frankfurt. • Generalisierung: Zusammenfassen von Begriffen durch Hyperonym. Eine Puppe lag auf dem Boden. Bausteine lagen auf dem Boden. −→ Spielzeug lag auf dem Boden. • Konstruktion: Aus expliziten und impliziten Propositionen des Textes wird eine rahmenbildende Proposition, die ihrerseits das Thema enthält. Ich ging zum Bahnhof. Ich kaufte eine Fahrkarte. (...) Ich stieg in den Zug ein. Er fuhr ab. −→ Ich nahm den Zug. Während in einfachen Fällen also lexikalisches Wissen (Hyperonymie) für die Ausführung der Regeln ausreicht, kann im Allgemeinen allerdings beliebiges Weltwissen im Spiel sein, wenn ein Leser diese Abstraktionen vollzieht. Aufgefasst als Modell menschlichen Leseverhaltens, postuliert van Dijks Vorschlag, dass die Bildung der Makrostruktur bei der Textverarbeitung linear abläuft, es sich also um einen bottom-up Prozess handelt, der ausgehend von der seriellen Rezeption einzelner Propositionen die Struktur konstruiert. Kritiker, unter ihnen auch Brinker (2001), haben hingegen darauf hingewiesen, dass die textanalytische Bestimmung des Themas auf durchaus komplexeren interpretativen Verfahren beruhe und es dafür keine “mechanische” Prozedur geben könne. Vielmehr sei ein Gesamtverständnis des Textes die Voraussetzung für die Angabe des Textthemas - dieses könne also erst nach der Verarbeitung des gesamten Textes im Nachhinein konstruiert werden, mithin als Mischung aus top-down und bottom-up Verarbeitung. Dieser kritischen Sicht ist für hinreichend komplexe Texte sicherlich zuzustimmen, während van Dijks Verfahren für sehr einfache Textbeispiele durchaus nachvollziehbar ist. Die von van Dijk vorgeschlagene Makrostruktur gibt den wichtigen Hinweis, dass die Bestimmung des Textthemas eine rekursive Prozedur ist, die zu einer hierarchischen Darstellung führt: Ein thematisch zusammenhängender Textabschnitt kann sich seinerseits in kleinere Teile gliedern, die thematisch zwar voneinander unterscheidbar sind, von denen aber jeder für sich wiederum mit dem Thema des gesamten Abschnitts eng verbunden ist. Betrachten wir die 5 Sätze des Beispieltexts Darfur (ohne die Überschrift) aus Bild 4.1 (S. 56) aus diesem Blickwinkel, können wir den Sätzen 1-3 das Thema “Sudan stimmt UN-Einsatz in Darfur zu” zuschreiben und darin dem Satz 3 das Sub-Thema “noch bestehender Dissens”. Die Sätze 4 und 5 können durch das Thema “Involvierung der Nachbarländer” charakterisiert werden, und darin wiederum 5 durch das Sub-Thema “Laufender Truppeneinsatz der Afrikanischen Union”. Die Original-Überschrift des Textes fasst lediglich die Sätze 1-3 zusammen, die offenbar als die zentrale aktuelle 5.2. Textglobale thematische Strategien 77 Nachricht bewertet werden. Wollten wir ein umfassenderes Thema für die Sätze 1-5 benennen, müssten wir von der Überschrift abstrahieren, etwa zu “Aktuelle Entwicklungen im Bürgerkrieg in Darfur”. 5.2. Textglobale thematische Strategien Wenn die soeben besprochene, erste Frage zum Thema Thema lautet “Worum geht es? ”, so schließt sich als zweite Frage an, auf welche Weise der Text dieses Thema behandelt und wie der Text durch eine thematische Gliederung strukturiert wird. Dass es hier textglobale (sortenspezifische) Vorgaben für die Abfolge von Inhaltszonen geben kann, haben wir in Kapitel 3 bereits gesehen, wollen aber die dortigen Ausführungen durch einen Blick auf die Textsorte Filmrezension etwas ergänzen. In einer Korpusstudie mit 150 englisch- und deutschsprachigen Filmrezensionen (aus Tageszeitungen und verschiedenen Internet-Quellen) haben Stede u. Suryiawongkul (2008) und Neumann (2007) ein Inventar von Inhaltszonen bestimmt, in die diese Rezensionen sich gliedern. Dies umfasst einerseits eine ganze Reihe relativ kurzer Angaben wie Titel, Regie, Datum der Rezension, Copyright-Vermerk u. a., andererseits die Textbausteine, die sich grob in Absätze des Typs Beschreibung und solche des Typs Meinung gliedern - das Inventar unterscheidet dann noch genauer zwischen einigen Subtypen (was wird beschrieben bzw. kommentiert). Es zeigt sich, dass einige dieser Zonen mit computerlinguistischen Methoden recht genau automatisch identifiziert werden können, zudem gibt es für die Mehrzahl der Zonen klare Präferenzen entweder hinsichtlich ihrer absoluten Position in der Rezension oder aber hinsichtlich ihrer Nachbarschaft zu anderen Zonen. Die Abfolge der Inhaltszonen ist somit keineswegs beliebig, sondern unterliegt zu einem nicht geringen Teil konventionalisierten Beschränkungen, die einen Teil unseres Textsortenwissens (s. Abschnitt 3.2.3) bilden. Wir halten also fest, dass oft die Textsorte einen wichtigen Einflussfaktor für die globale thematische Struktur des Textes darstellt; neben den Filmrezensionen gilt dies beispielsweise auch für Geschäftsbriefe oder wissenschaftliche Aufsätze, und in Grenzen auch für Nachrichtentexte: Sie sollen sich an den bekannten “journalistischen Ws” orientieren (wer, wann, wo, was, wie), können aber die Reihenfolge der Informationen verändern, wenn die relative Wichtigkeit der Beteiligten es nahelegt. 5.2.1. Linearisierung der Textinformationen Der mögliche Einfluss der Textsorte ist eher statischer Natur: Er besagt, dass bestimmte Abfolgen für die Informationseinheiten konventioneller sind als andere. Von Fall zu Fall kann mit einer solchen konventionalisierten Abfolge auch ein Vorteil für die kognitive Verarbeitung einhergehen - wenn die Abfolge nicht willkürlich festgelegt ist, sondern auch einer “inneren Logik” folgt. Interessanter sind in diesem Zusammenhang allerdings die von der Textsorte eher unabhängigen Linearisierungsstrategien, nach denen Autoren vorgehen, wenn Anordnungskonventionen keine Rolle spielen. Nach Lötscher (1991) gibt es zwei Motive für eine nicht 78 5. Thematische Struktur wahllose Anordnung der Informationen bzw. der Themen des Textes: • Kognitives Motiv: den Rezipienten soll die Verarbeitbarkeit, die Einordnung in die bisher aufgebaute Textrepräsentation, erleichtert werden. • Rhetorisches Motiv: der Produzent möchte möglichst wirkungsvoll ein Ziel erreichen, die Rezipienten in bestimmter Weise zu beeinflussen. Diese beiden Motive werden oft gleichermaßen verfolgt, allerdings spielen sie je nach Text unterschiedliche Rollen - wofür sich der in Abschnitt 3.3 eingeführte Begriff des Texttyp als nützlich erweist. Im argumentativen Text gibt es verschiedene, mehr oder weniger wirkungsvolle Muster der Reihung von (wichtigen versus weniger wichtigen) Argumenten, möglichen Gegenargumenten und deren Entkräftung - hier steht offenkundig das rhetorische Motiv im Vordergrund. Brinker (2001) verweist für die thematische Gliederung des argumentativen Texts auf das Argumentationsschema von Toulmin (1958), das diejenigen inhaltlichen Elemente enthalte, die sich in Kommentaren und ähnlichen Texten finden. Wir stellen dieses Schema im Abschnitt 7.3 vor, wenn wir argumentative Texte genauer untersuchen. Im instruktiven Text bildet trivialerweise die Reihenfolge der zu erledigenden Teil-Schritte die Vorgabe für die Abfolge im Text, und dies folgt primär dem kognitiven, ggf. aber auch dem rhetorischen Motiv: Ein Kochrezept ist sehr viel einfacher zu befolgen, wenn die Schritte klar und in der “richtigen” Reihenfolge beschrieben sind (getreu dem Ikonizitätsprinzip). In der Narration gibt es eine ähnliche Ausgangslage: Wenn Ereignisse ohne explizite Angabe ihrer temporalen Verankerung geschildert sind, werden Rezipienten in aller Regel eine chronologische Reihenfolge unterstellen. Interessante Erzählungen weichen davon allerdings vielfach ab - wobei dann aber linguistische Markierungen (vor allem: Tempus-Wechsel, bestimmte Konnektoren) erforderlich sind, die es dem Rezipienten erlauben, den tatsächlichen Gang der Ereignisse zu rekonstruieren. Für den deskriptiven Text schlägt Lötscher (1991, S. 84ff.) folgende Linearisierungsregeln vor, die zum guten Teil auch für expositorische Texte anwendbar sind: 1. “Das Nächste ist das Nächste” — Der Text soll nicht zwischen den Gegenständen springen, sondern sich, soweit möglich, immer zunächst einem Nachbargegenstand bzw. ‘Nachfolger ’ zuwenden. Zu jedem Zeitpunkt sollte dasjenige Wissen thematisiert werden, das bei den gegebenen Interessen vom gegebenen Kontext aus inferentiell/ assoziativ am direktesten zugänglich ist. 2. Die Teile einer gerichteten linearen Struktur sollen im Text so thematisiert werden, dass in der Abfolge der Thematisierung der einzelnen Elemente die (gerichtete lineare) zeitliche Struktur des Textes analog zur gerichteten linearen Struktur des Beschreibungsobjekts ist. 3. Wenn ein Element zwei direkte Nachfolger hat, thematisiere wenn möglich zuerst jenes, welches in Bezug auf die Hauptrichtung in einer sekundären Richtung liegt. 5.2. Textglobale thematische Strategien 79 4. Wenn eine (Teil-) Struktur fertig beschrieben ist, thematisiere als nächstes den letzten (d. h. “nächst-zurückliegenden”) noch unthematisiert gebliebenen direkten Nachfolger eines früher thematisierten Elementes. 5. Thematisiere und benenne erst das Ganze, dann die Teile. 6. Thematisiere zuerst das Wichtigere, dann das weniger Wichtige. 7. Thematisiere Situationselemente in der Reihenfolge, in der sie aufgrund von Relevanz- oder Empathiefaktoren die Aufmerksamkeit auf sich ziehen. Für den von Brinker (2001, S. 70) behandelten explikativen Text (eine Variante des Typs expositorisch; Brinker fasst darunter etwa wissenschaftliche Erklärungen) schlägt der Autor folgendes zugrunde liegende Schema vor, das insbesondere die zentralen Bestandteile Explanans (das zu Erklärende) und Explanandum (die Erklärung) unterscheidet: A 1 , A 2 , ..., A n (singuläre Aussagen, die die Anfangsbedingungen beschreiben) G 1 , G 2 , ..., G m (Gesetzesaussagen) Explanans E (Aussage, die das zu erklärende Explanandum Phänomen beschreibt) Brinker illustriert dies mit folgendem Textbeispiel; wir setzen die Abkürzungen gemäß dem obigen Schema direkt in den Text ein, er beginnt also mit dem Explanandum, bietet dann die Beobachtungen dar, und schließt mit einer generellen Aussage: (5.2) Die Heizungsrohre im Keller sind geplatzt (E), weil es heute Nacht Frost gegeben hat (A 1 ) und die Glaswatteverkleidung für die Heizungsanlage nicht geliefert worden ist (A 2 ); denn Frost lässt das Wasser in den Heizungsrohren gefrieren, wenn sie nicht durch eine isolierende Verkleidung gegen Temperatureinflüsse geschützt sind (G 1 ). 5.2.2. Haupt- und Nebenstruktur Werden Texte komplexer, so genügen die eher “idealen” Modelle der Art von van Dijk oder die Linearisierungsstrategien von Lötscher und Brinker nicht mehr allein zur Strukturbeschreibung. Eine Komplikation besteht darin, dass Texte neben ihrer “hauptsächlichen” Argumentation, Narration, Exposition o. ä. auch Abschweifungen enthalten können, die bestimmte Aspekte vertiefend behandeln; dabei kann wie oben bereits erwähnt insbesondere der Texttyp wechseln. Für den Fall der Narration hat von Stutterheim (1994) dies mit folgendem kurzen Text illustriert, der eine Antwort auf die Frage “Wie sah denn Deine alte Wohnung aus? ” darstellt: (5.3) Sie hatte vier Zimmer und eine relativ große Küche. Die Räume waren sehr hoch und hell, zwei gingen zur Straße und drei auf einen grünen Hof. Dort haben die Kinder immer gespielt. So etwas fehlt uns jetzt... 80 5. Thematische Struktur Im Modell von von Stutterheim bildet die (hier explizite) Fragestellung die Quaestio, die das Thema für den Text setzt und darüber hinaus auch Vorgaben für die Linearisierung der einzelnen Sätze macht. Von Stutterheim nennt diejenigen Sätze, die unmittelbar zur Antwort auf die Quaestio beitragen, die Hauptinformation und alle anderen die Nebeninformation des Textes. Eine weitere Untergliederung schlägt Konerding (2000) vor, indem er zunächst die Hauptinformation von der Restinformation unterscheidet und letztere dann einteilt in subsidiäre Information (restriktive Modifikatoren und Adverbiale zur Identifikation von Diskursgegenständen und zur Situierung des Sachverhalts in Zeit und Raum) und Nebeninformation mit weiterführendem Charakter (vor allem nichtrestriktive Nebensätze). Im Fall der Narration wird die Hauptinformation durch das “Skelett” der Erzählung gebildet (was geschah zum Zeitpunkt X am Ort Y), während im Hintergrund als Nebeninformation zusätzlich deskriptives, kommentierendes, oder interaktionsbezogenes Material geliefert werden kann. In einer früheren Arbeit hatte Hartmann (1984) anschaulich von der Reliefgebung gesprochen - bestimmte Teile des Textes rücken nach vorn, andere treten dahinter zurück. Die Trennung zwischen Haupt- und Nebeninformation sollte nicht vermischt werden mit dem Phänomen der kommunikativen Gewichtung, mit der ein Autor Teile des Textes als besonders wichtig ausweisen kann. Eine solche Gewichtung kann lokal an beliebigen Stellen - sowohl innerhalb der Hauptals auch der Nebeninformation - vorgenommen werden (vgl. dazu auch Klein u. von Stutterheim, 1992). Zur Illustration hier eine fiktive Bedienungsanweisung: (5.4) 1. Öffnen Sie das Gehäuse. 2. Nehmen Sie langsam die Tonerkassette (A) aus der Verankerung (B) und halten Sie dabei unbedingt den Entriegelungshebel (C) gedrückt! 3. Befreien Sie die nun frei liegenden Laufschienen (D) der Tonerkassette von etwaigem Tonerstaub. Bei längerem Betrieb des Druckers können sich feine Tonerreste rund um die Kassette ablagern und auf den Laufschienen die Bewegung der Kassette behindern, was dringend vermieden werden sollte. 4. Setzen Sie die neue Tonerkassette ein, wiederum mit hinuntergedrücktem Entriegelungshebel. 5. Schließen Sie das Gehäuse. Hier wird die Hauptinformation durch die Schritte 1-5 gegeben, und lediglich in (3) findet sich nach dem Anweisungssatz eine Nebeninformation, die für die Quaestio “Wie wechsele ich die Tonerkassette” weniger relevant ist. Markierungen für unterschiedliche ‘Wichtigkeit’ finden sich jedoch gleichermaßen in der Hauptinformation (zweiter Satz von (2), unbedingt) und in der Nebeninformation (Erläuterung zu (3), dringend). Um im Hartmann’schen Bild des Reliefs zu bleiben: Wenn die Unterscheidung zwischen Haupt- und Nebeninformation durch unterschiedliche Tiefe beim Blick auf den Text symbolisiert ist, so wäre die kommunikative 5.3. Lokale thematische Verknüpfung 81 Gewichtung orthogonal dazu etwa durch eine zweite Farbe (bzw. im graduellen Fall durch unterschiedliche Helligkeitsstufen dieser Farbe) anzuzeigen. Auch Brandt (1994) betont die unterschiedlichen Rollen der Trennung zwischen Haupt-/ Nebeninformation einerseits und der kommunikativen Gewichtung andererseits. Erstere zählt sie zur inhaltlichen Informationsstrukturierung und weist darauf hin, dass etwaige lexikalische Indikatoren typischerweise der Nebeninformation beigegeben werden: Nebenbei gesagt, übrigens, etc. Die kommunikative Gewichtung hingegen betreffe die formale globale Informationsstrukturierung, eine durch formale Mittel bewirkte Hervorhebung bzw. Herunterstufung von Informationen, die der Produzentin wichtig oder eben weniger wichtig sind, unabhängig von ihrer Zugehörigkeit zur Hauptinformation. Lexikalische, metakommunikative Ausdrücke werden hier besonders häufig zur Hervorhebung (und nicht zur Herabstufung) eingesetzt: ich möchte betonen, dass...; wichtig ist in diesem Zusammenhang ..., etc. Auch typographische Mittel (Unterstreichung, Fettdruck, Kursivschrift) verfolgen stets das Ziel der Hervorhebung, nicht der Herabstufung. 5.3. Lokale thematische Verknüpfung Begeben wir uns nun von der Gliederung des Textes in thematische Abschnitte auf die Ebene der einzelnen Sätze, so stellt sich - wenn wir bei unserer “top-down” Richtung bleiben - zunächst die Frage nach der Verknüpfung zwischen Sätzen, die dem Leser anzeigen muss, ob das aktuelle Thema beibehalten, spezialisiert oder gewechselt wird. Dies wird in der Literatur (mit recht unterschiedlichen Terminologien und Konzeptionen! ) unter der Überschrift thematische Entwicklung bzw. thematic development diskutiert. Wir verdeutlichen uns die Rolle dieser Entwicklung an einem (etwas gekürzten) Textbeispiel von Fries (1981), siehe Abbildung 5.2. Es handelt sich um zwei Versionen desselben Texts, wobei die oben dargestellte Version eine bewusst veränderte, die unten stehende die “originale” Version ist. Fries möchte mit diesen unterschiedlich gut lesbaren Textvarianten deutlich machen, wie wichtig die Gestaltung der jeweiligen Satzanfänge für den “Fluss” des Textes und damit für seine lokale Kohärenz ist. Als Erklärungsmodell wählt Fries die theme/ rheme-Konzeption der systemisch-funktionalen Grammatik (SFG; Halliday, 2004). Für Halliday ist das theme durch die Position im Satz bestimmt, und zwar handelt es sich um das Material, das dem finiten Verb vorausgeht; der Rest bildet das korrespondierende rheme des Satzes. Halliday untersucht das Englische und macht keine Angaben zur Übertragbarkeit auf andere Sprachen, insbesondere solche mit freierer Wortstellung - doch seine Frage der theme choice dürfte weitgehend mit der für das Deutsche relevanten Fragestellung der Vorfeldbesetzung übereinstimmen (mit der Ausnahme, dass die Halliday-Schule themes auch für eingebettete clauses sowie groups definiert). Fries und Halliday knüpfen dabei bewusst an die traditionelle Definition von Mathesius (1939) an: “The theme is that which is known or at least obvious in the given situation and from which the speaker proceeds.” 2 2 Allerdings nimmt Halliday dann eine Trennung zwischen positionsbestimmtem theme und der infor- 82 5. Thematische Struktur Although the United States participated heavily in World War I, the nature of that participation was fundamentally different from what it became in World War II. For the Navy, the earlier conflict was a one-ocean war and for the Army a one-theater war; the latter was a two-ocean war for the Navy and one of five major theaters for the Army. A vital responsibility of the Navy was escort-of-convoy and anti-submarine work in both wars, but it never clashed with the enemy on the surface in the 1917-1918 conflict; whilst some twenty major and countless minor engagements were fought with the Japanese Navy between 1941 and 1945. Although the United States participated heavily in World War I, the nature of that participation was fundamentally different from what it became in World War II. The earlier conflict, was a one-ocean war for the Navy and a one-theater war for the Army; the latter was a two-ocean war for the Navy and one of five major theaters for the Army. In both wars, a vital responsibility of the Navy was escort-of-convoy and anti-submarine work, but in the 1917-1918 conflict it never clashed with the enemy on the surface; whilst between 1941 and 1945 some twenty major and countless minor engagements were fought with the Japanese Navy. Abbildung 5.2.: Beispieltext-Varianten World Wars (Fries, 1981) In authentischen Texten sind nun die Satzanfänge keineswegs immer mit referierenden - also im engeren Sinne “themafähigen” - Ausdrücken besetzt, sondern auch mit Adverbien oder Konjunktionen. Fries legt daher fest, dass es verschiedene Typen von themes gibt, gemäß den metafunctions der SFG, bezüglich derer ein Satz im Stil einer Partitur jeweils gleichermaßen analysiert wird: • Ideational: Prozess und Partizipanten (Agens, Instrument, etc.) • Interpersonal: Beziehung zwischen Produzentin und Adressatin, ausgdrückt durch Satzmodus, Modalität, etc. • Textual: Text-interne Verknüpfung, ausgedrückt durch Konnektoren, etc. Ein Satz wie Frankly, however, yesterday he was obusive hat für Fries mithin drei themes: Das interpersonale frankly zeigt die Einstellung des Sprechers zum Sachverhalt, das textuelle however verbindet den Satz mit dem vorangehenden, und das ideationale yesterday verankert den Sachverhalt zeitlich. Die auf solche Weise von Fries deklarierten themes sind im Beispieltext World Wars jeweils kursiv gesetzt. Fries betont nun, dass die themes vom Autor bei der mationellen given/ new Unterscheidung vor - siehe den nächsten Abschnitt. 5.3. Lokale thematische Verknüpfung 83 Textproduktion weitgehend frei gewählt werden (außer bei sehr einfachen, “kanonisch” geformten Sätzen), somit funktional zu interpretieren sind. In der unteren Version des Beispiels ist diese Wahl gelungener, denn es wird kontinuierlich der Kontrast zwischen den beiden Kriegen thematisiert, anstatt zwischen verschiedenen Gesichtspunkten hin und her zu springen. Die Summe der theme choices des Autors in den einzelnen Sätzen ergibt dann die thematische Entwicklung des Textes, wie sie beispielsweise in der häufig zitierten Arbeit von Daneš (1974) beschrieben wurde. So kann das Thema von einem Satz zum anderen konstant bleiben (Klaus öffnete die Tür. Er erstarrte vor Schreck.), oder ein Element aus dem Rhema des vorangehenden Satzes kann zum Thema werden (Klaus öffnete die Tür. Sie knarrte beträchtlich.). Weiterhin nannte Daneš die Möglichkeit, ein Thema aus einem anderen abzuleiten, was dem in Abschnitt 4.1 beschriebenen bridging entspricht, außerdem die Aufspaltung eines Thema in mehrere Subthemen in den Folgesätzen. Fries und andere Autoren (etwa von Stutterheim, 1994) weisen nun darauf hin, dass die Form der thematischen Entwicklung von der Textsorte und dem Texttyp mitbestimmt wird. So sei es für die Narration typisch, dass das Thema von handelnden Personen oder von Zeit- und Ortsbestimmungen gebildet wird. Im argumentativen Text hingegen sei die inhaltliche Struktur (der Argumentationsverlauf) potenziell kompliziert, weshalb die Linearisierung es dem Leser möglichst einfach machen solle, diese Struktur nachzuvollziehen - und so finde sich vorwiegend der verkettende Verlauf, bei dem das Thema jeweils aus dem Rhema des Vorgängersatzes hervorgeht. Einen anschaulichen Beleg für die These der Textsorten- und Texttypabhängigkeit der theme choice geben Ramm u. Villiger (1995, S. 10). Die Autorinnen untersuchten u. a. Reiseführer unter thematischen Gesichtspunkten und fanden in Stadtbeschreibungen eine deutliche Tendenz daür, das Satzthema jeweils mit Ortsangaben zu belegen, wie in diesem (etwas gekürzten) Beispiel, wiederum mit kursiv gesetzten Themen: (5.5) Sevillas Zentrum liegt östlich eines Seitenkanals des Rio Guadalquivir, der die Stadt in Nord-Süd-Richtung durchzieht. Hauptstraße ist die Avenida de la Constitucion; in ihrer unmittelbaren Umgebung liegen ... die bedeutendsten Sehenswürdigkeiten der Stadt. Östlich schließt sich das Barrio de Santa Cruz an. Die Avenida de la Constitucion beginnt im Süden ... Hier liegt auch das Geschäftsviertel um die Haupteinkaufsstraße Calle Sierpes. Südlich des engeren Zentrums erstrecken sich ... Wir können diese Tendenz als textsortenabhängig-konventionalisiert deuten, aber auch als im Einklang mit der Textfunktion: Der Text soll ja die Leserin orientieren, die (vor Ort oder vorbereitend bei der Anreise) sich ein mentales Modell von den örtlichen Gegebenheiten schaffen möchte. Eine einheitliche Verkettungsstrategie ist dabei ebenso nützlich wie im World Wars Text (Abb.5.2), der zwei Ereignisse unter verschiedenen Gesichtspunkten vergleichend gegenüberstellt. Entscheidend ist, was auch von Stutterheim (1994, S. 260; Hervorh. d. Verf.) betont: “Kohärente Texte sind dadurch gekennzeichnet, dass sie einem einheitlichen Linearisierungskriterium folgen” - und dass dies sich auch in der Wahl der themes niederschlägt. 84 5. Thematische Struktur 5.4. Informationsstruktur: Satztopik Am Ende der Wegstrecke vom Thema des gesamten Textes hinunter zu den kleineren Einheiten steht der Satz, in dem der Thema-Begriff im Rahmen der Informationsstruktur behandelt wird. Dies beruht auf der Erkenntnis, dass die Struktur eines Satzes nicht allein von grammatischen Bedingungen bestimmt wird, sondern darüber hinaus von Faktoren der Informationsübermittlung. So sprach etwa Hermann Paul (1975, orig. 1880) im Anschluss an v. d. Gabelentz zur Abgrenzung vom grammatischen auch vom psychologischen Subjekt und Prädikat. Das psychologische Subjekt sei “das, worüber der Sprechende den Hörenden denken lassen, worauf er seine Aufmerksamkeit hinleiten will, das psychologische Prädikat dasjenige, was er darüber denken soll.” Im letzten Abschnitt haben wir mit der theme/ rheme Dichotomie bereits eine Spielart der Informationsstruktur kennengelernt, doch es gibt eine ganze Reihe anderer Aspekte (was dieses Forschungsfeld recht unübersichtlich macht). Schon die genannten Definitionen von Mathesius, Halliday und Paul machen deutlich, dass es ihnen um ähnliche, aber eben nicht ganz identische Dinge geht. So macht Halliday sein theme positionsabhängig, Paul sein psychologisches Subjekt hingegen nicht. Zur Illustration zeigen die Beispiele 5.6[a]-[c] unterschiedlich akzeptable Varianten des jeweils zweiten Satzes, und 5.6[d] demonstriert, dass die Variante in [c] nicht per se weniger akzeptabel ist, sondern im geeigneten Kontext durchaus gut geeignet sein kann. (5.6) a Mein Sittich ist gestern wieder zur Baumgruppe im Nachbargarten geflogen. Er wird wohl sein Nest in der Birke bauen. b Mein Sittich ist gestern wieder zur Baumgruppe im Nachbargarten geflogen. In der Birke wird er wohl sein Nest bauen. c ? Mein Sittich ist gestern wieder zur Baumgruppe im Nachbargarten geflogen. Sein Nest wird er wohl in der Birke bauen. d Mein Sittich hat gestern wieder die Baumgruppe im Nachbargarten nach möglichen Behausungen abgesucht. Sein Nest wird er wohl in der Birke bauen. Im Gegensatz zur traditionellen Grammatik, die eine klare Unterscheidung zwischen wohlgeformten und nicht-wohlgeformten Sätzen zu treffen suchte, geht es bei der Informationsstruktur aber nicht um ‘richtig’ und ‘falsch’, sondern lediglich um ‘mehr oder weniger angemessen’. Dementsprechend handelt es sich nur um “weiche” Faktoren, die für diese Strukturierung verantwortlich sind. Zudem zählen diese Faktoren zu den unterschiedlichsten sprachlichen und nicht-sprachlichen Wissensdomänen, und man kann sich ihnen aus ganz verschiedenen Perspektiven nähern, etwa: 5.4. Informationsstruktur: Satztopik 85 • Prosodie: Wie und warum werden Teile einer Äußerung unterschiedlich intonatorisch markiert? • Lexikon: Welche lexikalischen Mittel (z. B. Pronomina, Fokuspartikeln) bestimmen die Informationsstruktur mit? • Morphologie und Syntax: Welche morphologische und grammatische Mittel bietet eine Sprache, um bei gleicher Satzbedeutung (im engen Sinn) den Informationseinheiten unterschiedlichen Status zuzuweisen (z. B. Affixe, Topikalisierung, Versetzungen)? • Semantik: Wie interagiert die Bedeutung des Satzes (im engen Sinn) mit der Informationsstruktur, z. B. bei Quantifikation? • Pragmatik/ Diskurs: Wie beeinflussen der bisherige und der nachfolgende Diskursverlauf die Informationsstruktur einer Äußerung bzw. eines Satzes? • Typologie: Wie unterscheiden sich Sprachen und Sprachfamilien hinsichtlich der o. g. linguistischen Mittel? Da die beteiligten Beschreibungsebenen keineswegs unabhängig voneinander sind und man die Fragen obendrein natürlich durch die Brillen unterschiedlicher linguistischer “Schulen” betrachten kann, wurde für die Informationsstruktur eine Fülle von Beschreibungsansätzen entwickelt, die teilweise gleiche Begriffe verwenden, diese aber keineswegs identisch interpretieren. 3 Als weitgehende Gemeinsamkeit immerhin können wir konstatieren, dass es in den meisten Ansätzen darum geht, jeweils eine Zweiteilung (in jüngeren Ansätzen mitunter eine Dreiteilung) des Satzes in komplementäre Bereiche vorzunehmen. Eine dieser “klassischen” Dichotomien ist die zwischen Given und New, d. h. den Diskursgegenständen (bzw. den sie bezeichnenden Wörtern), die zum Zeitpunkt der Äußerung des Satzes dem Rezipienten bereits bekannt sind und denen, die dies nicht sind. Beschäftigt man sich damit aus Sicht von Prosodie oder Syntax, erscheint eine Zweiteilung oft ausreichend, man geht davon aus, dass Sätze zu Beginn die gegebenen und dann die neuen Informationen ausdrücken (vgl. die o. g. Definition von Mathesius, 1939). Aus einer Diskursperspektive betrachtet gibt es allerdings gute Gründe, nicht nur die beiden Pole zu unterscheiden, sondern eine Reihe von Zwischenstufen; dazu hatten wir in Abschnitt 4.3.2 Arbeiten vorgestellt. Beispielsweise argumentieren Ward u. Prince (1991), dass die Möglichkeit zur Topikalisierung indefiniter NPs nicht von syntaktischen oder semantischen Kriterien abhängt, sondern von ihrem Aktivierungsstatus: Seien sie brand-new, so sei eine Topikalisierung nicht lizensiert. Eine zweite angenommene Dichotomie ist die zwischen Fokus und Hintergrund; diese Unterscheidung ist besonders (aber nicht ausschließlich) für die Intonation relevant. Das Fokuselement sei die Information, die innerhalb der Äußerung den größten Mitteilungswert besitzt: Hast Du gestern Kommilitonen getroffen? - Ja, ich bin 3 Auf die Vielfalt der Ansätze können wir hier nicht eingehen; einen (auch geschichtlichen) Überblick vermitteln beispielsweise Hoffmann (2000) und Kruijff-Korbayová u. Steedman (2003). 86 5. Thematische Struktur nachmittags MARtin begegnet. Die Annotationsrichtlinien für Informationsstruktur von Götze u. a. (2007) nennen eine Reihe von Subtypen und betonen vor allem die gängige Unterscheidung zwischen new-information focus (dem soeben charakterisierten) und contrastive focus, der zu einem im Diskurs bereits gegebenen Element in Kontrastbeziehung steht: Ich mag keine bunten Hemden. Ich kaufe eigentlich immer nur EINfarbige Kleidung. Der uns hier besonders interessierende Begriff Thema schließlich taucht in verschiedenen Variationen auf. Im vorigen Abschnitt hatten wir die theme/ rheme-Konzeption aus der systemisch-funktionalen Linguistik genannt. Weiterhin wird das Begriffspaar Thema/ Rhema mitunter zur Unterscheidung von vorerwähnter und nicht-vorerwähnter Information verwendet; dafür haben wir allerdings bereits das Instrument der Given/ New-Skala eingeführt, die u. a. den Vorteil bietet, dass nicht nur ein Element im Satz vorerwähnt sein kann (wie es in traditionellen Ansätzen der Fall ist), sondern durchaus mehrere, was in der Praxis sehr häufig vorkommt (vgl. im Beispiel 5.6 die Wiederaufnahmen Sittich / er und Baumgruppe / Birke). 4 Der wohl gebräuchlichste Thema-Begriff entspringt der vor allem mit der Dichotomie Topik/ Kommentar assoziierten Unterscheidung zwischen Satzgegenstand und Satzaussage, also dem Objekt, über das gesprochen wird, und der Aussage, die über dieses Objekt getroffen wird. Zur Abgrenzung von anderen Topik- Begriffen (siehe dazu Jacobs, 2001) wird es häufig als aboutness-Topik umschrieben. Jacobs charakterisiert es als Adressierung im mentalen Modell: In einer Äußerung mit Topik X und Kommentar Y bildet X die Adresse für Y, wenn die Information Y zum Äußerungszeitpunkt an der durch X bezeichneten Position gespeichert wird. Zur expliziten Markierung von Topiks bietet das Deutsche einige syntaktische Konstruktionen an, etwa die Linksversetzung (Den Wellensittich, den werde ich morgen verkaufen.) oder das freie Topik (Was Wellensittiche betrifft, so habe ich langsam die Nase voll.) Eine solche Markierung ist freilich nicht obligatorisch, doch laut Gundel u. a. (1993) liefert die Syntax hier immerhin eine hinreichende Bedingung: “An expression which refers to the topic and which occupies a syntactic position reserved for topics will be referred to as a syntactic topic. While syntactic topics always refer to pragmatic topics, a pragmatic topic is not always encoded as a syntactic topic.” Wir beenden diesen kurzen Blick auf Informationsstruktur und Topiks mit einer möglichen Erklärung des Beispiels 5.6. Nach verbreiteter Auffassung ist die Topikalisierung einer Konstituente lizensiert, wenn der entsprechende Diskursgegenstand bereits given ist; besonders günstig sind die Voraussetzungen, wenn das ‘kanonische’ satzinitiale Element (Subjekt) im Gegensatz dazu new ist: Peter kam mit seinem neuen Hund zur Party. Das Tier hatte ihm ein Freund der Familie geschenkt. Eine weitere begünstigende Bedingung besteht laut Ward u. Prince (1991) dann, wenn das topikalisierte Element in einer partially-ordered set (poset) Relation zu einem anderen, bereits gegebenen Element besteht. Solche Relationen sind beispielsweise Teil-von oder Subtyp. Und eine Teil-von Relation besteht in 5.6[b] zwischen 4 Dabei soll nicht verschwiegen werden, dass given und andere Thema-Ausprägungen, und ebenso das in diesem Zusammenhang auch häufig besprochene Subjekt des Satzes sehr häufig miteinander identisch sind - dies ist einer der Gründe für die Uneinigkeit bei der Festlegung der Terminologie und der Theoriebildung. 5.5. Fazit: Textthema und Satzthema 87 der topikalisierten Birke und der vorerwähnten Baumgruppe; etwas weniger eindeutig aber noch erkennbar ist sie in [c] zwischen Nest und Behausung. 5.5. Fazit: Textthema und Satzthema Wir haben die vier wesentlichen Apekte der Rolle von Thema im Text besprochen: Angefangen mit der Frage, worum es im Text als Ganzes geht, sind wir auf die Gliederung in Sub-Themen eingegangen, die einerseits von der Textsorte beeinflusst werden kann, andererseits von textglobalen Informationspräsentationsstrategien, die ihrerseits mit dem Texttyp in Zusammenhang stehen. Sobald geklärt ist, was und in welcher Reihenfolge es gesagt werden soll, stellt sich die Frage nach der sprachlichen Form - hier haben wir uns zunächst der Verkettung der Sätze zugewandt und dabei die wichtige Rolle der Gestaltung des Satzanfangs betont. Am Schluss stand ein etwas genauerer Blick auf den Aufbau des Satzes unter dem Gesichtspunkt der Informationsstruktur, die verschiedene Auffassungen vom Begriff des Satzthemas bereithält. Über den Zusammenhang zwischen Satzthemen und (Teil-) Textthemen ist bislang nur wenig bekannt. Die Forschung zur Satz-Informationsstruktur aus prosodischer, syntaktischer oder semantischer Perspektive arbeitet traditionell mit konstruierten Frage-Antwort-Paaren, in denen die Formulierung der Frage genau die informationelle Situation schafft, auf die die Formulierung der Antwort reagieren soll. Dies ist für eine rein satzbezogene Untersuchung legitim, doch aus Diskursperspektive besteht die Herausforderung darin, im Kontext diejenigen Faktoren zu ermitteln, die an der Position des zu untersuchenden Satzes eine Situation schaffen, die aus Informationsstruktur-Sicht zu den jeweils formulierten “Fragen” äquivalent ist. Genau dies ist das “ideale” Ziel eines zugespitzten Quaestio-Ansatzes (Hellwig, 1984, von Stutterheim, 1994), der jeden Satz des Textes als Antwort auf eine vom bisherigen Text bis zu diesem Punkt aufgeworfene Fragestellung begreift. In einer Narration kann dies ein unspezifisches was geschah dann? sein, aber bei erwarteter Topik-Kontinuität auch etwas konkreter: Was machte Anne als nächstes? Das Ziel ist “ideal”, weil viele Texte reich an Überraschungsmomenten sind und die Rolle des nächsten Satzes mithin nicht immer vorhersagbar ist; dennoch ist der Ansatz interessant, weil er die (in der klassischen Rhetorik untersuchte) Quaestio des Gesamttextes in Verbindung setzt nicht nur zu den Inhalten, sondern auch zur Form der einzelnen Sätze und zu deren Verknüpfung. Die enge Verbindung zwischen der thematischen und der referenziellen Struktur dürfte während des gesamten Kapitels deutlich geworden sein, besonders vielleicht im letzten Abschnitt; die Zusammenhänge zwischen Vorerwähntheit und grammatischer Realisierung standen ja auch im Mittelpunkt unserer Diskussion des centering in Abschnitt 4.3.1 - allerdings hatten Grosz u. a. (1995) in ihrer Untersuchung des Englischen lediglich die grammatische Funktion als bestimmendes Element herangezogen. Für Sprachen mit freierer Wortstellung muss man das Blickfeld erweitern, wie es beispielsweise Strube u. Hahn (1996) mit ihrem functional centering taten. Viele Arbeiten haben sich mit den Bedingungen beschäftigt, 88 5. Thematische Struktur unter denen ein Satz im Text eine “nicht-kanonische” Konstituentenfolge haben kann - stellvertretend sei hier nur auf (Birner u. Ward, 1998) verwiesen. Ein umfassender Erklärungsansatz für die Zusammenhänge zwischen Diskursstruktur und Satzstruktur ist allerdings noch nicht in Sicht. Wie auch Brinker (2001, S. 48) bemerkt, ist selbst der Zusammenhang zwischen referenzieller und textthematischer Struktur bislang nur wenig untersucht worden. Ein möglicher Ansatzpunkt dafür kann die Frage nach dem Textthema-als-Gegenstand sein. Eine einfache Antwort besteht ja beispielsweise darin, aus der referenziellen Struktur die längste Kette zu entnehmen und den damit bezeichneten Diskursgegenstand zum Textthema zu erklären; für einen Text wie Kreisel auf S. 116 funktioniert das auch sehr gut - dies gilt aber sicherlich nicht für alle Texte. Fasst man das Textthema hingegen als Proposition, so kann man zu seiner Bestimmung ebenfalls auf die referenzielle Struktur zurückgreifen: Bereits Agricola (1979) schlug vor, dafür nur diejenigen Propositionen des Textes in Betracht zu ziehen, die von den “wesentlichen” referenziellen Ketten berührt werden (in denen die zentralen Diskursgegenstände als Partizipanten auftreten). Ein aufwändigeres Verfahren würde dagegen die thematische Struktur der einzelnen Sätze berücksichtigen und unterscheiden, ob die Partizipanten als Topik fungieren oder “lediglich” im Kommentar des Satzes erscheinen. Ob sich auf diese Weise aber wirklich ein enger Zusammenhang zwischen Satzthemen und Textthemen herstellen lässt, ist einstweilen unklar; eine skeptische Haltung nehmen dazu beispielsweise Lötscher (1987) und Schröder (2003) ein. Im Gegensatz zur referenziellen Struktur gibt es für die thematische Struktur bislang keinen ausgearbeiten und erprobten Vorschlag eines Annotationsschemas. Einer der Gründe dafür ist, dass Themen von den Analysierenden jeweils selbst benannt werden müssen, also kein vorgefertigtes Inventar von zu annotierenden Merkmalen besteht (wie es in den anderen hier diskutierten Ebenen der Fall ist). Die Themenzuweisung ist darüber hinaus schwieriger zu objektivieren - präzise Richtlinien, anhand derer verschiedene Annotatoren zu ähnlichen Ergebnissen gelangen, sind schwer zu formulieren. Aber dennoch ist gerade für eine schwierig zu überschauende Beschreibungsebene wie die thematische Struktur eine Orientierung auf annotierte Daten ein vielversprechendes Werkzeug: Insbesondere wenn Texte auch mit syntaktischer Struktur annotiert sind, lassen sich im Zusammenspiel zwischen referenzieller und thematischer Struktur viele der oben aufgeworfenen Fragen nachvollziehbar untersuchen. 5.6. Annotation thematischer Information im Korpus Ein Annotationsschema für thematische Struktur müsste auf “globaler” Ebene die Gliederung des Textes in thematische Einheiten umfassen und auf “lokaler” Ebene die Art des Übergangs zwischen Themen benennen: Wechselt der Text von einem Thema zu einem Sub-Thema, zu einem verwandten, oder zu einem völlig neuen? Erfolgt eine Rückkehr zu einem zuvor behandelten Thema? Für die Untersuchung der Zusammenhänge zur Satzstruktur müsste dann eine Brücke zur Informationsstruktur errichtet werden; dafür schlagen Götze u. a. (2007) ein Schema vor. 5.6. Annotation thematischer Information im Korpus 89 Abbildung 5.3.: Schichten-orientierte Annotation mit EXMARaLDA Bei der Annotation der referenziellen Struktur im letzten Kapitel war die wesentliche Operation das Markieren und Verbinden von Wörtern des Textes mit der Maus. Jetzt geht es hingegen darum, Spannen des Texts zu markieren und zu beschriften, und dies rekursiv auf mehreren Ebenen. Ein dafür geeignetes Werkzeug ist der “Partitur-Editor” EXMARaLDA 5 (Schmidt, 2004), der eine schichtenbasierte Annotation von jeweils individuell zu definierenden Segmenten erlaubt, siehe Abb. 5.3. Der Editor wurde primär als Transkriptionswerkzeug für gesprochene Sprache entwickelt (im Bildschirmabzug sieht man in der zweiten Ebene die segmentierten Wörter, darunter eine englische Transkription, darunter dann verschiedene phonetische und syntaktische Annotationsebenen), kann jedoch auch für die Bearbeitung geschriebener Texte verwendet werden. Die Benutzerin kann beliebig viele Annotationsebenen einführen und benennen, und (wichtig) die Segmente für die Annotationen müssen nicht übereinstimmen, sondern können einander überlappen, wie auch Abb. 5.3 zeigt. Exmaralda eignet sich damit sehr gut für eine “tiefe” Annotation kurzer Textspannen (vor allem innerhalb von Sätzen), denn der Bildschirm zeigt jeweils nur den Textausschnitt, der in eine Zeile passt. Für die textglobale Markierung längerer thematischer Segmente ist Exmaralda daher weniger geeignet, stattdessen sollte man für solche Zwecke zum Beispiel MMAX2 (s. S. 69) verwenden. 5 www1.uni-hamburg.de/ exmaralda 90 5. Thematische Struktur 5.7. Weiterführende Literatur Um in der recht unüberschaubaren Literatur zu verschiedenen Aspekten von Thema einen “roten Faden” zu gewinnen, ist der Beitrag von Hoffmann (2000) nützlich. Die meisten der in diesem Kapitel behandelten Aspekte versucht von Stutterheim (1994) im Quaestio-Modell einheitlich zu behandeln; die Arbeit bezieht sich auf gesprochene Sprache, gibt aber einen gut verständlichen Überblick über die einzelnen Fragestellungen. Zur Vertiefung der Abschnitte 5.1 und 5.2 sei die Monographie von Lötscher (1987) empfohlen. Der im Text zitierte Beitrag von Fries (1981) illustriert sehr anschaulich die Problematik der Satz-Verkettung. Für Fragen zur Informationsstruktur schließlich ist als Einstieg neben Hoffmann (2000) auch der Überblick von Kruijff-Korbayová u. Steedman (2003) gut geeignet, und speziell zum Topik-Begriff die Arbeit von Jacobs (2001). 5.8. Übungsaufgaben 1. Prüfen Sie, inwieweit Ihr Kommentar sich durch Anwendung der von van Dijk (1980) vorgeschlagenen ‘Makroregeln’ (s. S. 76) zusammenfassen lässt. Können Sie weitere Regeln angeben, die man dafür benötigen würde? 2. Untersuchen Sie Ihren Kommentar und zusätzlich einen längeren Zeitungstext auf thematische Gliederungssignale: Mit welchen lexikalischen oder syntaktischen Mitteln wird angezeigt, wenn sich das Thema verschiebt? 3. Versuchen Sie, in den Sätzen Ihres Kommentars einerseits themes im Sinne von Halliday/ Fries, andererseits aboutness topics (Satzgegenstände) zu identifizieren. Prüfen Sie dann, wie die Satzverkettung mit diesen themes und topics arbeitet. Machen Sie Experimente mit Umstellungen von Konstituenten (vor allem Topikalisierung): Wie wird die Satzverkettung dadurch beeinträchtigt? 6. Temporale Struktur (6.1) Heute morgen bin ich schon um halb sieben aufgestanden. Es regnete in Strömen. Als ich in der Schule ankam, läutete gerade die Glocke zur ersten Stunde. Die Lehrerin erschien mit einer dicken Plastiktüte unterm Arm. In dieser Satzfolge, ebenso wie im einleitenden Beispiel des letzten Kapitels, kann die referenzielle Struktur nicht die “Hauptverantwortung” für die Textualität tragen. Abgesehen vom zweimaligen Auftreten von ich und einigen bridging-Relationen zwischen den Diskursgegenständen des Bereichs Schule gibt es keine referenziellen Verbindungen. Eine thematische Kontinuität scheint gegeben, aber im Vergleich zum Kurztext aus 5.1 tritt diesmal ein wichtiges Merkmal hinzu: Wir sind geneigt, die benannten Ereignisse dahingehend zu interpretieren, dass sie sich in einer ganz bestimmten zeitlichen Reihenfolge abgespielt haben - und eine solche Interpretation nehmen wir auch dann vor, wenn sie nicht durch eindeutige sprachliche Signale (wie aufeinanderfolgende Uhrzeitangaben oder durchgehende Verwendung temporaler Konnektoren) erzwungen wird. Wir wenden uns damit einer dritten Ebene der Textkohärenz zu und runden damit das Spektrum ab, das Givón (1983) als drei Typen der Kontinuität in Texten beschrieben hat: die Gegenstandskontinuität, die thematische Kontinuität und die Ereigniskontinuität. 6.1. Ereignisse in der temporalen Struktur In Abschnitt 3.3 haben wir herausgestellt, dass die zentrale Aufgabe bei der Rezeption von Texten des Typs narrativ darin besteht, die geschilderten Ereignisse soweit wie möglich in ihrer zeitlichen Abfolge zu rekonstruieren. Dabei verwenden wir den Begriff Ereignis in diesem Kapitel so, dass er Zustände mit einschließt, also anders als es in der Regel in der Literatur zu Aspektualität geschieht. Dort wird gemeinhin unterschieden zwischen • Ereignis (engl. event): Geschehnis, bei dem jemand aktiv handelt und/ oder das eine Veränderung mit sich bringt, z. B. trinken, aufbauen, einsehen • Zustand (engl. state): anhaltendes inaktives Geschehen, z. B. besitzen, rot sein, in Köln sein In Ermangelung eines eingeführten deutschsprachigen Oberbegriffs steht also ‘Ereignis’ hier für beide Formen. Wenn wir nun dem Text entnommen haben, in welcher Reihenfolge die Ereignisse verlaufen, so haben wir einen wesentlichen Aspekt der Narration verstanden; 92 6. Temporale Struktur Sequenz: Überlappung: Inklusion: Abbildung 6.1.: Temporale Relationen zwischen Ereignissen nach Allen (1984) die nicht minder bedeutenden Aspekte der Charaktere, ihrer Motivationen und tieferer Interpretationsebenen lassen wir hier einmal beiseite. Eine weitere Vereinfachung: Wir ignorieren hier die Aufgabe, etwaige unterschiedliche Handlungsstränge einer Narration voneinander zu unterscheiden; stattdessen beschränken wir uns auf relativ einfache Fälle einer einzelnen Ereignisfolge. Wenn über den “minimalen Fall” von genau zwei Ereignissen berichtet wird, so können diese prinzipiell in drei verschiedenen temporalen Beziehungen zueinander stehen (Allen, 1984), siehe die schematische Darstellung in Abbildung 6.1. Zum einen können sie aufeinanderfolgen, und zwar entweder unmittelbar angrenzend, oder mit zeitlichem Abstand. Die Unterscheidung kann durch temporale Adverbien markiert werden, wie in diesen Beispielen: (a) Gerade als der Bus die Haltestelle erreicht hatte, sprang die Katze auf die Straße. (b) Der Bus erreichte die Haltestelle. Kurz darauf sprang die Katze auf die Straße. Die Reihenfolge kann natürlich auch die umgekehrte sein, also das im zweiten Satz beschriebene Ereignis dem des ersten zeitlich vorausgehen. (Abb. 6.1 macht keinen Unterschied hinsichtlich der Reihenfolge der Ereignisse.) Die zweite Möglichkeit besteht darin, dass ein Ereignis das andere zeitlich einschließt, wie in Während ich den ‘Tatort’ sah, rief mich meine Mutter an. Theoretisch sind hier vier Varianten zu unterscheiden, nämlich kann das eingeschlossene Ereignis seinen Anfang oder sein Ende mit dem einschließenden gemeinsam haben; oder auch beides, womit der Spezialfall der Identität der Zeiträume vorliegt; oder auch keines, womit im engen Sinn vollständige Eingeschlossenheit vorliegt. Diese Varianten in der sprachlichen Formulierung voneinander abzugrenzen, ist jedoch umständlich, und so lassen sich die Varianten in Texten nur selten sicher identifizieren. Die dritte Möglichkeit ist die der Überlappung der beiden Ereignisse, bei der also ein Endpunkt des einen Ereignisses innerhalb des anderen Ereignisses liegt. Ein Beispiel wäre Während wir nach Glienicke radelten, begann ein vierstündiges Gewitter, sofern wir unterstellen, dass die Radfahrt nicht das gesamte Gewitter überdauert hat. 6.1. Ereignisse in der temporalen Struktur 93 Die linguistische Markierung des temporalen Zusammenhangs erfolgt einerseits durch lexikalische Einheiten, vor allem durch geeignete Konnektoren (während, daraufhin, zuvor uvm.); dies ist im eingangs genannten Beispiel (6.1) zwischen den mit als verbundenen Teilsätzen des dritten Satzes der Fall. Dort findet sich mit gerade auch ein Beispiel für ein temporales Adverb, das nicht als Konnektor fungiert (da es nicht semantisch zweistellig ist - siehe zu Konnektoren den Abschnitt 9.3.1). Die zweite Informationsquelle sind die syntaktischen Merkmale Tempus und Aspekt (etwa: ist das Ereignis abgeschlossen oder nicht - perfektiver Aspekt). Ergänzen wir das Beispiel (6.1) um den Satz Sie hatte die Klassenarbeiten also bereits korrigiert, so ist dieses Ereignis nicht nur als abgeschlossen, sondern überdies als “vorzeitig” markiert: Wir erfahren, dass es sich vor allen anderen zuvor erwähnten abgespielt hat. Eine dritte Komponente für das Zusammenspiel der temporalen Signale ist die dem Verb inhärente Aktionsart; zwei dieser Klassen sind beispielsweise durative (z. B. regnen) und punktuelle Verben (z. B. platzen). Oft ist diese freilich nicht lexikalisch eindeutig fixiert, sondern erst im Kontext interpretierbar: Mit Läuten kann das einmalige Anschlagen der Türglocke gemeint sein, oder aber ein länger anhaltendes Ereignis - wie in besagtem drittem Satz von (6.1), den wir wohl so verstehen, dass das Ereignis des Ankommens zeitlich innerhalb des Läutens liegt. Zwischen Verb, Argumenten und auch Adjunkten kann es zu recht komplexen kompositionalen Beziehungen kommen, die insgesamt zur Spezifizierung der temporalen Ausdehnung des Ereignisses, und damit auch zu den möglichen Relationen zu den im Text benachbarten Ereignissen beitragen; dies können wir hier nur in Andeutungen skizzieren. Ein bekanntes Phänomen ist beispielsweise das der bare plurals, die die vom Verb stammende Aktionsart im Satz ändern können: (6.2) a Melissa überquerte die Straße. b Ameisen überquerten die Staße. Die Aktionsart in 6.2[a] ist accomplishment: das beschriebene Ereignis erreicht seinen Endpunkt. Demgegenüber beschreibt 6.2[b] eine activity: Das Ereignis hält für unbestimmte Zeit an. Ein gebräuchlicher Test für diese Unterscheidung ist die Einfügung eines temporalen Adverbials in den Satz, hier eines, das eine Dauer bezeichnet, wie eine halbe Stunde lang. Ergänzen wir diese Phrase in 6.2[b], ergibt sich keine Änderung der Akzeptabilität und der Bedeutung (abgesehen von der hinzukommenden Zeitdauer natürlich); in 6.2[a] hingegen würden wir den Satz dann vermutlich so verstehen, dass Melissa kontinuierlich die Straßenseite wechselt, was eine Änderung gegenüber dem Originalsatz darstellt. Ein weiteres vielfach untersuchtes Phänomen besteht darin, dass die zeitliche Ausdehnung von beschriebenen Zuständen eine andere ist als die von anderen Ereignistypen. Ein Beispiel von Dowty (1986): (6.3) 1 John entered the president’s office. 94 6. Temporale Struktur 2 The president walked over to him. 2’ The clock on the wall ticked loudly. Während wir 6.3[2] als auf 6.3[1] folgend interpretieren, gehen wir davon aus, dass der in 6.3[2’] beschriebene Zustand auch vor und nach dem Ereignis von 6.3[1] besteht. Eine häufig genannte “Faustregel” besagt dementsprechend, dass Zustandsbeschreibungen die Ereignisse der Narration nicht vorantreiben; dies ist allein anderen Ereignistypen vorbehalten. - Allerdings ist Dowtys Beispiel nicht ganz unabhängig von unserem Weltwissen (hier: über Uhren und ihre Geräusche); dessen Rolle wird noch klarer bei dem folgenden Beispiel von Webber (1988), mit dem wir diese sehr kurze Exkursion in die Fragestellungen von Aspekt und Aktionsart beenden wollen. (6.4) a John bought Mary some flowers. He picked out three red roses, two white ones and one pale pink. b John went into the florist shop. He picked out three red roses, two white ones and one pale pink. Im Text ist die temporale Relation also sehr oft nicht vollständig expliziert, vielmehr muss der Leser sie sich selbst erschließen. Dabei liegt gewöhnlich das Prinzip der Ikonizität zugrunde: In Abwesenheit expliziter Signale, die eine gegenläufige Orientierung anzeigen, gehen wir davon aus, dass der Text Ereignisse in der Reihenfolge schildert, in der sie sich auch zugetragen haben (vgl. 6.4[b]). Das Prinzip ist auch dann noch erfüllt, wenn wir das Ereignis des zweiten Satzes nicht als dem ersten nachfolgend, sondern als Teil-Ereignis des ersten interpretieren (vgl. 6.4[a]). Falls aber unser Weltwissen es nahelegt, so gelangen wir auch zu einer zum Ikonizitätsprinzip widersprüchlichen Interpretation. Typische Fälle davon sind schematische kausale Verbindungen, die wir bei der Rezeption eines Satzpaars unterstellen, wie in diesem Beispiel von Asher u. Lascarides (2003): John fell. Max pushed him. Die Versuchung, das Ereignis des zweiten Satzes als Ursache des im ersten beschriebenen, und damit als temporal vorangehend, zu begreifen, ist in der Tat groß. Gehen wir nun von der isolierten Betrachtung zweier Ereignisse zur Analyse der temporalen Struktur ganzer (wenn auch einfacher) Texte über, so besteht die Aufgabe darin, zunächst einmal die Ereignisse zu identifizieren, die für die zeitliche Einordnung des berichteten Geschehens relevant sind. In unserem Beispiel (6.1) gilt das für alle dort genannten Ereignisse; sie können jeweils zeitlich aufeinander bezogen werden. Die Abweichungen von solchen “idealen” Narrationen sind aber natürlich vielfältig, und insbesondere müssen vier Punkte berücksichtigt werden: • Nicht-Ereignisse: Sätze, die kein Ereignis zum Ausdruck bringen, sondern beispielsweise generische Zustandsbeschreibungen (z. B. Mein Hund ist wirklich dumm) darstellen, werden in der temporalen Struktur nicht berücksichtigt. Im Beispieltext Findus (Abb. 6.2) gilt dies für die Segmente 9 und 10. 6.1. Ereignisse in der temporalen Struktur 95 [1] Findus hat dreimal im Jahr Geburtstag, [2] einfach, weil das so lustiger ist. [3] Jedes Mal, wenn der Kater Geburtstag hatte, [4] backte Pettersson ihm eine Pfannkuchentorte. [5] Wie gewöhnlich war Pettersson an jenem Morgen im Hühnerstall gewesen [6] und hatte die Eier in den Korb gesammelt. [7] Und jetzt saß er auf der Bank vor der Küchentür [8] und putzte die Eier. [9] Hübsch sauber sollten sie sein, [10] denn Pettersson war schließlich ein ordentlicher alter Mann. [11] Findus lief ungeduldig auf der Bank hin und her [12] und wartete darauf, [13] dass es mit der Pfannkuchenbäckerei endlich losging. Aus: Sven Nordqvist: Eine Geburtstagstorte für die Katze Abbildung 6.2.: Beispieltext Findus • Pseudo-Ereignisse: Manche Sätze scheinen über Ereignisse zu berichten, doch handelt es sich nicht um ein konkretes, temporal zu verankerndes Ereignis, sondern um allgemeine Aussagen über das Auftreten solcher Ereignisse. Dazu zählen im Findus-Text die Segmente 1 bis 4. Sie tragen ebenfalls nicht zur temporalen Struktur bei. • Negation und Modaloperatoren: Wenn über ein Ereignis berichet wird, dass es nicht stattgefunden hat (Sie hatte die Klassenarbeiten noch nicht korrigiert), kann dieses Ereignis nicht Teil der temporalen Struktur sein, sondern muss entweder ignoriert oder besonders markiert werden. Gleiches gilt für Ereignisse im Skopus von Modaloperatoren: Sie hätte eigentlich die Klassenarbeiten korrigieren wollen. • Eingebettete Ereignisse: Ebenfalls eine Sonderrolle spielen Ereignisse, die in Komplementsätzen zu kognitiven Verben auftreten oder die als direkte oder indirekte Rede gekennzeichnet sind. Im Text Findus gilt das für Segment 13. Solche Segmente können nicht ignoriert werden, weil sonst das einbettende Segment unvollständig in der Struktur verbliebe; sie müssen aber gesondert markiert werden, da sie selbst nicht den Ereignisfluss vorantreiben. Nach einem Vorschlag von Mani u. Pustejovsky (2004) wird die temporale Struktur eines Textes als Baum dargestellt, in dem zunächst jedes Ereignis bzw. das von ihm ausgefüllte Zeitintervall einen Knoten bildet. 1 Die Kanten des Baums, also die Beziehungen zwischen Mutter- und Töchterknoten, repräsentieren die Inklusion von Ereignissen: Liegt die zeitliche Ausdehnung eines Ereignisses innerhalb der eines anderen, so bildet ersteres einen Tochterknoten. 2 Weitere Knoten kön- 1 Dies ist nicht der erste Vorschlag seiner Art; beispielsweise benutzt auch Eberle (1991) eine solche Baumstruktur, die noch mit verschiedenen Relationen angereichert ist. 2 Die Autoren erwähnen nicht den Grenzfall der Identität der Zeitintervalle - dann muss man sich entscheiden, welches Ereignis den Mutterknoten bildet. 96 6. Temporale Struktur Abbildung 6.3.: Temporale Struktur des Beispieltexts Findus nen durch abstrakte Ereignisse gebildet werden, denen kein Segment des Texts entspricht, sondern die für die Analyse eine Reihe von Ereignissen zusammenfassen können. Auf diese Weise entsteht auch der Wurzelknoten des Baums, der als übergreifendes “story”-Ereignis alle geschilderten Geschehnisse zusammenfasst. Abbildung 6.3 zeigt die so konstruierte Struktur für den Beispieltext Findus, wobei wir zusätzlich die Relation emb für ‘embedded’ in das Schema aufgenommen haben; sie besteht hier zwischen den Knoten 12 und 13. Das abstrakte Ereignis A1 repräsentiert die Geschichte als Ganzes, und die beiden unmittelbar darin eingeschlossenen Ereignisse sind der morgendliche Aufenthalt im Hühnerstall (5) und das “jetzige” Sitzen auf der Bank (7). Das Sammeln (6) und Putzen (8) der Eier sind ihrerseits wiederum jeweils darin eingeschlossen. Segment 11 (Findus läuft auf der Bank) muss man nicht zwangsläufig als in 8 eingeschlossen interpretieren, das Adverb ungeduldig legt aber nahe, dass sein Umherlaufen während des Eierputzens stattfindet, und nicht im Anschluss daran. Analog interpretieren wir, dass Findus wartet (12), während er läuft, und nicht danach. Zu beachten ist nun, dass es in solchen Strukturen unter den Töchterknoten jeweils keine inhärente Ordnung gibt - sie sind hier zwar gemäß der im Text auftretenden Reihenfolge eingezeichnet, damit ist jedoch in der Struktur keine Aussage über ihre temporale Relation verbunden. Mani und Pustejovsky stellen diese Information getrennt vom Baum als Menge von Beschränkungen dar, die für jeweils zwei Ereignisse die temporale Präzedenz angeben, dafür wird das Symbol < verwendet. Im Beispiel liegt nur eine Präzedenzrelation vor, die dem Text wegen der Zeitangaben am Morgen und jetzt direkt zu entnehmen ist: {(5 < 7)}. Ein Vorteil dieser Darstellung ist, dass man zunächst nur die Beschränkungen angeben kann, die explizit im Text genannt sind (etwa durch temporale Konnektoren); implizite Präzedenzen gemäß des o. g. Ikonizitätsprinzips können dann hinzugefügt werden. Es ist aber 6.2. Zeitausdrücke 97 ebenso gut möglich, für bestimmte Relationspaare die Präzedenz nicht zu notieren, wenn dem Text keine Aussage darüber zu entnehmen ist. Auf diese Weise kann textimmanente von textexterner, interpretierter Präzedenz-Information getrennt werden. Freilich erlaubt die Darstellung diese Unterspezifikation allerdings nicht für die Inklusionsbeziehung: der Baum wird in dieser Hinsicht als vollständig vorausgesetzt. 6.2. Zeitausdrücke Die Repräsentation der temporalen Textstruktur, die wir bislang eingeführt haben, stellt lediglich die Abfolge der Ereignisse des Textes relativ zueinander dar. Für viele Texte ist jedoch auch die Verankerung von Ereignissen in ihren konkreten Zeitpunkten (seien sie real oder fiktiv) bedeutsam; zudem erschließt sich mitunter auch die richtige Ereignisfolge nur unter Berücksichtigung der konkreten Zeitangaben. Solche sprachlichen Formen, die auf Zeitpunkte oder -intervalle verweisen, nennen wir Zeitausdrücke. Sie sind also von den o. g. Konnektoren zu unterscheiden, die jeweils zwei Ereignisse relativ zueinander anordnen können. (6.5) (1) Letzten Dienstag fuhren wir nach Toulouse (2) und besuchten zwei interessante Galerien. (3) Tags darauf flogen wir schon nach San Francisco, (4) wo wir aber wegen diverser Probleme erst Donnerstag nachmittag ankamen. (5) Das Hotel erreichten wir um fünf, (6) und weil die Museen lang geöffnet sind, (7) stürmten wir bis 22 Uhr noch einmal schnell durch das SF-MOMA. Zeitausdrücke in Texten sind gelegentlich vollständig spezifiziert (Ich wurde am 3.5.1972 um 14.42 Uhr geboren), oft aber nur relativ zum Äußerungszeitpunkt interpretierbar, wie etwa letzten Dienstag im ersten Satz des obigen Beispiels (6.5). Ebenso ist ein Zeitausdruck häufig auch relativ zu einem im Text zuvor genannten Referenzzeitpunkt zu interpretieren - wie tags darauf im zweiten Satz von (6.5). Die temporale Textstruktur sollte aus diesen Gründen die im Text genannten temporalen “Anker” mit repräsentieren, was dadurch geschehen kann, dass die nicht-abstrakten Knoten des Baumes optional um einen (mehr oder weniger spezifischen) “Zeitstempel” ergänzt werden. Dazu müssen die Zeitausdrücke im Text identifiziert, Ereignissen zugeordnet, und soweit möglich vervollständigt werden. Da Zeitausdrücke nur sehr selten präzise Zeitpunkte bezeichnen, bietet es sich an, als Darstellungsform Intervalle vorzusehen, deren Grenzen manchmal genau angegeben werden, häufig aber auch vage sind, wie etwa im Sommer. Ein Vorschlag für ein Inventar von Zeitausdrücken des Deutschen wurde von Endriss u. a. (1998) vorgelegt. Die Autoren definierten auch eine Repräsentationssprache (Temporal Expression Language, TEL), welche von der Vielzahl der natürlichsprachlichen Mittel zu einem gewissen Grad abstrahiert und damit ähnliche Ausdrücke zu einer gemeinsamen Darstellungsform zusammenfasst. Aus dieser abstrahierten Form können dann optional mit Hilfe von Kalender-Wissen konkrete 98 6. Temporale Struktur Abbildung 6.4.: Temporale Struktur des Beispieltexts 6.5 Zeitintervalle errechnet werden. Dieser zweite Schritt soll uns hier nicht beschäftigen, doch geben wir kurz einige der von Endriss u. a. untersuchten Kategorien an, um das Spektrum der sprachlichen Formen zu illustrieren. Die Autoren treffen eine Unterscheidung zwischen ‘einfachen’ und ‘komplexen’ Zeitausdrücken, welche auf den einfachen aufbauen. Zu den einfachen zählen die Angabe von Uhrzeit, Tageszeit, Wochentag, Datum, Jahr; hinzu kommen Feiertage und deiktische Ausdrücke wie jetzt oder vorgestern. Die Beschreibungssprache TEL sieht dafür eine Reihe von Elementen vor. Tageszeiten werden nach dem Schema tod: hh : min (tod = time of day) dargestellt. Der Ausdruck tod: 11: 45 beispielsweise abstrahiert über die Zeitausdrücke viertel vor zwölf, dreiviertel zwölf, fünfzehn Minuten vor zwölf, elf Uhr fündunvierzig. Für Tageszeiten wie am Morgen oder nachts werden jeweils Primitiva ( morning, night ) verwendet, die ebenfalls hinter tod: stehen. Ganz ähnlich werden Wochentagsangaben wie montags, am Montag mit dow: mon (day of week) dargestellt. Die verschiedenen deiktischen Tagesangaben wie heute, gestern, übermorgen sind in dem Primitiv deictic-day: zusammengefasst, an das eine Zahl zwischen -2 und 2 angeschlossen wird, im Falle von heute die 0, für vorgestern die -2, usw. Dies sind Angaben, die relativ zum Äußerungszeitpunkt ausgewertet werden müssen. Andere sind relativ zu einem im Text zuvor genannten Referenzzeitpunkt, wie etwa zwei Wochen später oder am nächsten Tag. Dafür sieht TEL andere Operatoren vor, für das letztgenannte Beispiel etwa next(day) . Einige weitere Primitive sind dom: für die Tage des Monats (1 bis 31), moy: für die Monate jan, feb etc., und year: für Jahreszahlen. Der Ausdruck Januar 2007 würde beispielsweise als [moy: jan, year: 2007] dargestellt. Zu den komplexen Zeitausdrücken zählen zunächst die Intervalle, wie etwa von drei bis fünf Uhr morgens oder zwischen dem 12. und 16. Mai. Die beiden Endpunk- 6.3. Annotation von temporaler Struktur im Korpus 99 te werden durch die oben beschriebenen einfachen Ausdrücke gebildet und dann mit dem Konstruktor between zusammengefasst. Unser erstes Beispiel wird also so dargestellt: between(tod: 03: 00,tod: 05: 00) . Demgegenüber geben offene Intervalle nur eine Grenze an, entsprechend nehmen die Operatoren before und after nur einen Zeitpunkt als Argument. Zu den weiteren komplexen Ausdrücken zählen relationale Angaben wie die Woche vom ersten bis zum fünften oder Angaben mit Abzählungen wie die dritte Woche nach Ostern. Außerdem sind Operatoren für die Markierung von Vagheit vorgesehen, um Ausdrücke wie gegen elf Uhr von um elf Uhr zu unterscheiden. Reichern wir nun, wie oben bereits vorgeschlagen, die von Mani u. Pustejovsky (2004) benutzte Baumdarstellung mit TEL-Ausdrücken an, so ergibt sich für den Text aus Beispiel 6.5 die in Abbildung 6.4 gezeigte Repräsentation. Hinzu kommen die Präzedenz-Beschränkungen {(1 < 2), (3 < 4), (4 < 7)}. Die Berechnung der “wirklichen” Zeitpunkte würde den Baum in Übereinstimmung mit den Beschränkungen in chronologischer Reihenfolge durchlaufen und müsste zunächst anhand eines Kalenders das Datum für letzten Dienstag am Knoten A1 bestimmen. Dies ist der Referenzzeitpunkt für die Berechnung des nächsten Tages an Knoten 3 und des darauffolgenden Donnerstags an Knoten 4; relativ zu diesem sind dann die Tagezeiten an 4, 5 und 7 zu bestimmen. 6.3. Annotation von temporaler Struktur im Korpus In den letzten Jahren ist in den USA eine reichhaltige Infrastruktur für die Annotation temporaler Information in Texten aufgebaut worden. Unter dem Oberbegriff TimeML (Time Markup Language) werden über die zugehörige Webseite 3 Spezifikationen des Annotationsschemas und gezielt für diesen Zweck entwickelte Annotationswerkzeuge verfügbar gemacht. TimeML umfasst sowohl die Annotation von Ereignissen als auch die von Zeitausdrücken; für letzteres wurde ein entsprechender ISO-Standard geschaffen. Es existieren auch nach TimeML annotierte Korpora, diese sind jedoch nicht frei erhältlich, sondern müssen über das Linguistic Data Consortium 4 erworben werden. Das für TimeML verwendete Annotationswerkzeug Callisto 5 ist mittlerweile zu einer umfangreichen, allgemein verwendbaren - aber damit auch nicht ganz unkomplizierten - Annotationswerkbank entwickelt worden. Die Software ist in Java implementiert und damit auf allen gängigen Betriebssystemen lauffähig. Beschränkt man sich auf die Annotation von TEL (o.ä.) Ausdrücken an natürlichsprachlichen Zeitausdrücken im Text, so ist dafür ein Schicht-orientiertes Werkzeug am besten geeignet, etwa das im letzten Kapitel vorgestellte Exmaralda. 3 www.timeml.org 4 www.ldc.upenn.edu 5 callisto.mitre.org 100 6. Temporale Struktur 6.4. Weiterführende Literatur Als Einstieg in die hier nur sehr kurz erwähnte Thematik von Tempus, Aspekt und Aktionsart sei der Beitrag von Zifonun (2000) im Handbuch ‘Text- und Gesprächslinguistik’ empfohlen. Detallierte semantische Studien zur Verknüpfung von Ereignissen entstanden im Rahmen der Diskursrepräsentationstheorie (DRT) (Kamp u. Reyle, 1993), hier sei mit der Arbeit von Eberle (1991) nur eine erwähnt, die auch explizit den Zusammenhang zu Kohärenzrelationen herstellt, wie wir sie in Kapitel 8 besprechen. Die Rolle temporaler Information für den Aufbau der Diskursstruktur ist auch ein zentrales Thema in der Segmented Discourse Representation Theory (Asher u. Lascarides, 2003). Ein aktueller Sammelband, der verschiedene Beiträge, auch zum Annotationsschema TimeML und dessen Anwendungen, zusammenfasst, ist Mani u. a. (2005). 6.5. Übungsaufgaben 1. Stellen Sie fest, ob Ihr Kommentar auch narrative Passagen enthält, also über zeitlich lokalisierte Ereignisse berichtet. Wenn nicht, suchen Sie für die folgenden Aufgaben ersatzweise eine (kurze) Kurzgeschichte. 2. Markieren Sie in Ihrem Text alle Zeitausdrücke. 3. Markieren Sie im Texte alle zeitlich verankerten Ereignisse. 4. Zeichnen Sie jetzt einen Baum für die temporale Struktur und geben Sie Präzedenz-Beschränkungen an, gemäß Abschnitt 6.1. Stellen Sie fest, ob sich die Abfolge der Ereignisse vollständig rekonstruieren lässt. Ist die oben vorgestellte Darstellungsform der Baumstruktur mächtig genug? Soweit im Text Zeitausdrücke vorhanden sind, ergänzen Sie die enstprechenden Knoten des Baums damit. 7. Von Illokutionsstruktur zu Argumentationsstruktur (7.1) Wir sollten jetzt bald einen neuen Computer kaufen. In sechs Wochen wird die Mehrwertsteuer erhöht. Auch dieser kurze Text lässt keine Zweifel an seiner Kohärenz. Dafür kann in diesem Fall nicht primär das Mittel der Koreferenz verantwortlich sein, denn es gibt hier keine direkte Wiederaufnahme. Ein thematischer Zusammenhang lässt sich als ‘bridging’ zwischen kaufen und Mehrwertsteuer herstellen, doch erfassen wir damit den inneren Zusammenhalt des Textes noch nicht wirklich. Entscheidend ist hier vielmehr der Bezug zwischen den Zielen der Sätze: Der erste fordert zu einer Handlung auf und der zweite liefert zu dieser Aufforderung eine Begründung. Wenn der erste Satz allein seinen Zweck nicht erfüllt, weil die Hörerin fragen würde “weshalb? ”, so soll der zweite Satz das Motiv liefern, damit die Aufforderung möglichst in die Tat umgesetzt wird. 7.1. Hintergrund: Sprechhandlungen Textbeispiele wie 7.1 führen uns in diesem Kapitel zu einem grundlegenden Perspektivenwechsel. Bei der Betrachtung von referenzieller, thematischer und temporaler Struktur haben wir uns fast ausschließlich “im Inneren” des Textes bewegt (Ausnahmen waren der gelegentliche Rückgriff auf Weltwissen beim Herstellen von ‘bridging’-Bezügen und der Ableitung thematischer und temporaler Zusammenhänge). Dass wir damit dem Spektrum der Funktionen von Sprache nicht gerecht werden, wissen wir (spätestens) seit der Diskussion der Textualitätskriterien von de Beaugrande u. Dressler (1981) in Kapitel 2, wo wir auch Merkmale wie Intentionalität oder Situationalität genannt haben. Die textinternen Merkmale bilden insgesamt den Schwerpunkt dieses Buches, doch dieses und das folgende Kapitel befassen sich mit einigen wesentlichen Aspekten der Intentionalität. Ganz neu ist uns diese Sicht natürlich nicht, denn wir haben in Kapitel 3 bereits von der Rolle der Textfunktion gesprochen. Diesen Blickwinkel erweitern wir jetzt vom Gesamttext zu seinen einzelnen Bestandteilen und ihrer Rolle für das Erfüllen der Textfunktion. In der Textlinguistik fand dieser Perspektivenwechsel als wichtige Verschiebung des Interessenschwerpunkts um 1970 statt; diese Phase wird heute als “pragmatische Wende” bezeichnet. Wir gehen auf diese disziplininternen Entwicklungen hier nicht weiter ein, eine gute Darstellung liefert beispielsweise Feilke (2000). 102 7. Von Illokutionsstruktur zu Argumentationsstruktur Während die Semantik traditionell die Bedeutung eines Satzes beschreibt als diejenige Aussage, die er über die Welt macht, also die Abbildungsfunktion der Sprache (und dann die Bedingungen der Wahrheit solcher abbildenden Aussagen) in den Mittelpunkt stellt, weist die Pragmatik darauf hin, dass Sprecher mit Äußerungen und Schreiber mit Texten nicht nur über die Welt berichten, sondern unmittelbar auch in der Welt agieren: Die Produktion einer sprachlichen Äußerung wirkt selbst verändernd auf die Welt ein - eine Sprecherin handelt, indem sie sich äußert. Zwar verändert sich die Welt nicht unmittelbar materiell, doch häufig verändern sich die Dispositionen der Hörer bzw. Leser. Oder zumindest beabsichtigt die Sprecherin möglicherweise solche Veränderungen. In Beispiel 7.1 ist die Absicht allem Anschein nach direkt ausgedrückt, dies muss allerdings nicht immer der Fall sein, die Absicht kann auch indirekt formuliert sein oder sich gar hinter einer anderen, in der Äußerung ausgedrückten “Nebenabsicht” verstecken. Eine Pionier-Rolle für die Hinwendung zu einer solchen Sprachauffassung spielte der Philosoph John Austin. Eine Mitschrift seiner Vorlesung wurde 1962 posthum unter dem Titel “How to do things with words” veröffentlicht (Austin, 1975). Austin richtete die Aufmerksamkeit auf Sätze wie Ich verurteile Sie zu einer Geldbuße von 7000 Euro oder Ich wette zehn Euro, dass die Bayern morgen verlieren, die - geäußert von jeweils “befugten” Personen in adäquaten Situationen - eben nicht einen Aspekt der Welt beschreiben (wofür sich wie gesagt die Semantik traditionell ausschließlich interessiert hatte), sondern steuernd in die Welt eingreifen. Austin nannte solche Sätze performativ. Das Äußern der Sätze stellt eine eigenständige Handlung dar, die erheblich über das reine Äußern hinaus reicht: nach Äußerung des ersten Beispielsatzes ist der Angeklagte verurteilt; mit Äußerung des zweiten Beispiels hat sich der Sprecher zu einer Zahlung verpflichtet, falls ein bestimmter Fall in der Welt nicht eintritt. Solche performativen Äußerungen sind für die Textsorten, die uns in diesem Buch vorrangig interessieren, allerdings kaum von Bedeutung; auch in der Alltagssprache sind sie selten anzutreffen. Damit unterscheiden sie sich deutlich von unserem Beispiel 7.1, das keinen solchen unmittelbaren Eingriff in die Zustände der Welt darstellt, sondern “lediglich” versucht, die Zuhörer oder Leserinnen zu einer Handlung zu bewegen. Ein zentraler Beitrag von Austin bestand darin, herauszustreichen, dass eine sprachliche Äußerung aus pragmatischer Sicht auf drei verschiedenen Ebenen betrachtet werden kann. Austin charakterisiert es so, dass die Äußerung eines Satzes gleichzeitig drei verschiedene Akte vollziehen kann, die dann zusammen den komplexen Sprechakt bilden: • Lokutionärer Akt: das Äußern selbst, d.h. das Hervorbringen einer Zeichenkette; Beispiel: Ich finde Deine Zeichnung sehr gelungen. • Illokutionärer Akt: die mit der Äußerung intendierte Funktion: fragen, informieren, beurteilen, usw.; Illokution des Beispiels: beurteilen • Perlokutionärer Akt: die von der Äußerung hervorgerufene Wirkung bei Le- 7.1. Hintergrund: Sprechhandlungen 103 ser oder Hörerin, auf ihre Gefühle, Gedanken oder Handlungen: erfreut, beleidigt, erschrocken, getröstet, veranlasst zu X, überzeugt von X, usw. Mögliche Perlokution des Beispiels: geschmeichelt Oft entspricht der perlokutionäre Akt der Intention der Sprecherin, doch muss das keineswegs immer der Fall sein: Während die Sprecherin meint, beiläufig eine belanglose Feststellung zu treffen, kann der Hörer sie aufgrund bestimmter Umstände beispielsweise als Beleidigung (miss-)verstehen. Für das Verhältnis zwischen Äußerung und Perlokution gilt, dass es eines der Kausalität ist: Die Äußerung ruft eine bestimmte Wirkung hervor bzw. löst sie aus. Das gilt jedoch nicht für das Verhältnis zwischen Äußerung und Illokution. Das Äußern eines Feststellungsatzes löst keineswegs ein Informieren unmittelbar aus, vielmehr ist die Illokution von der Sprecherin intendiert - was der Hörer aber daraus macht, steht noch auf einem anderen Blatt. Dass Illokutionen in der Mehrzahl der Fälle aber durchaus richtig verstanden werden, liegt daran, dass sie konventionalisiert sind: Bestimmte Arten von Äußerungen werden in bestimmten Situationen von Hörern gewohnheitsmäßig mit bestimmten Illokutionen in Verbindung gebracht, wie im viel zitierten hier zieht es, das oftmals intendiert und/ oder intepretiert wird als Aufforderung, das Fenster zu schließen. Für den Zusammenhang zwischen Lokution und Illokution können wir auch den von Heringer (1974) diskutierten Begriff der “indem- Beziehung” verwenden: Der Sprecher führt den illokutionären Akt aus, indem er die entsprechende Äußerung tätigt (den lokutionären Akt ausführt). Wir werden uns mit dem Verhältnis zwischen Lokution und Illokution im Abschnitt 9.2 noch etwas ausführlicher beschäftigen. Austins Arbeit wurde fortgeführt von seinem Schüler John Searle, dessen Schriften erheblich weitere Verbreitung erlangten (z. B. (Searle, 1971)) und in der Linguistik einige Aufmerksamkeit erregten. Eine der wichtigen Weiterentwicklungen der Austin’schen Theorie durch Searle bestand darin, den lokutionären Akt zu ersetzen durch eine Kombination aus Äußerungsakt und propositionalem Akt. Die durch einen Satz ausgedrückte Proposition bestehe aus zwei wesentlichen Bestandteilen: • Referenz: Verweis auf außersprachliche Gegenstände (vgl. Kap. 4) • Prädikation: Die Aussage über die benannten Gegenstände Searle wies dann darauf hin, dass es möglich ist, eine gegebene Kombination aus Referenz und Prädikation mit ganz unterschiedlichen Illokutionen zu verknüpfen, was dann den verschiedenen Äußerungen entspricht: Du gibst mir vier Euro. / Gibst Du mir vier Euro? / Gib mir vier Euro! Searle schlägt damit erstmals eine konkrete Form für die Illokution vor: In dem Ausdruck ‘F(RP)’ steht F für die sog. ‘illokutive Rolle’ (z. B.: Feststellung, Aufforderung, etc. - siehe Abschnitt 7.4), die als Funktion auf die beiden Argumente Referenz (R) und Prädikation (P) anzuwenden ist. 1 Mit dem Begriff ‘Pragmatik’ werden in der Linguistik typischerweise zwei verwandte, aber doch verschiedene Dinge verbunden: einerseits die Beschäftigung 1 Diese Darstellung wurde dann auch von der Semantik aufgenommen und weiter ausgearbeitet, siehe etwa Jacobs (1984). 104 7. Von Illokutionsstruktur zu Argumentationsstruktur mit der Sprechakttheorie, andererseits die Konzentration auf Phänomene jenseits der Satzebene, also solche des Diskurses (geschriebene Texte und mündliche Dialoge). Ironischerweise wurde die oben erwähnte “pragmatische Wende” in der Textlinguistik seinerzeit von den Sprechakt-Arbeiten angestoßen, die aber ihrerseits keinen Bezug zur Textebene herstellen: Austin und Searle hatten sich eindeutig dem Satz verschrieben und diesen unter innovativer Perspektive betrachtet - nicht jedoch den Text. 2 Die Verknüpfung von Sprechakttheorie und Textuntersuchung ließ damals noch einige Jahre auf sich warten (s. etwa Viehweger, 1989) und ist laut Schröder (2003, S. 2) auch heute nicht befriedigend gelöst: “Obwohl die Auffassung, dass mit Texten sprachliche Handlungen vollzogen werden, alles andere als neu ist, wurde der Frage nach einem textspezifischen (auf die Besonderheiten von monologischen Texten zugeschnittenen) Handlungsbegriff bislang überraschend wenig Aufmerksamkeit gewidmet.” 7.2. Sprechhandlungen in Texten Die im vorigen Abschnitt dargestellten “Pioniere” Austin und Searle sind der Disziplin Sprachphilosophie zuzurechnen, nicht der Linguistik. Damit wir den Sprechaktbegriff für unsere Zwecke nutzbar machen können, also Texte hinsichtlich ihrer Illokutionsstruktur eines Textes analysieren können, ist noch eine Wegstrecke zurückzulegen. Zu untersuchen ist allgemein das Verhältnis zwischen Grammatik und Pragmatik, und speziell die Abbildung zwischen den Intentionen eines Sprechers und den produzierten sprachlichen Äußerungen - respektive deren Rekonstruktion aus der Perspektive des Hörers. Unstrittig ist, dass diese Abbildung keine einfache 1: 1 Abbildung ist; wir schließen uns hier der Auffassung an, die beispielsweise auch Liedtke (1998) vertritt, nach der bestimmte linguistische Merkmale die Menge der möglichen zugrunde liegenden Illokutionen einschränken, aber die Illokution nicht etwa vollständig determinieren. Liedtke illustriert dies an dem Beispiel der Äußerung Ich bitte Dich, zu gehen, deren illokutive Rolle 3 aufgrund des Satzmodus zunächst als A SSERTION einzustufen ist, die in bestimmten Kontexten aufgrund des performativen Verbs aber dann eben auch als D IREKTI - VUM aufgefasst werden kann. Wir können uns hier aber nicht auf die Ebene einer “idealen” Grammatik-Pragmatik Beziehung beschränken, sondern müssen überdies in das kalte Wasser “echter” Texte springen, was die Verhältnisse abermals beträchtlich verkompliziert. Insgesamt sind folgende Teilaufgaben zu betrachten: 1. Festlegen eines Inventars von Illokutionen 2. Festlegen von Kriterien zur Segmentierung von Texten in eine Folge von Illokutionen 2 Feilke (2000) schildert diese historische Entwicklung genauer. 3 Wir verwenden im Folgenden ‘Illokution’ sowohl für die illokutive Rolle als auch im ursprünglichen Sinn für den kompletten Ausdruck der Form F(RP). 7.2. Sprechhandlungen in Texten 105 3. Festlegen von Kriterien zur Identifikation konkreter Illokutionen: Welche Illokution(en) können einem gegebenen Textsegment unter welchen Bedingungen zugeschrieben werden? 4. Definieren von Regeln zur Komposition von Illokutionen zu einer Illokutionsstruktur All diese Fragen sind bisher empirisch, also an konkreten Texten, nur in Ansätzen untersucht (siehe Liedtke, 1998; Schmitt, 2000), wir betreten also ein noch keineswegs systematisiertes Terrain. Der Übersichtlichkeit halber konzentrieren wir uns in diesem Kapitel allein auf die textstrukturellen Phänomene und verschieben die Diskussion der sprachlichen Merkmale für Aufgaben 2 und 3 in das Kapitel 9. Im Folgenden besprechen wir zunächst die Komposition von Illokutionen im Text und gehen im letzten Abschnitt auf Vorschläge zu Inventaren von Illokutionstypen ein. 7.2.1. Illokutionen von Textsegmenten Ein früher und besonders in der Computerlinguistik sehr einflussreicher Vorschlag für eine Konzeption der Illokutionsstruktur stammt von Grosz u. Sidner (1986). 4 Ihr Modell war primär, aber nicht ausschließlich, für Dialoge konzipiert und schlägt als eine zentrale Beschreibungsebene eine intentional structure vor (neben linguistic structure, der Gruppierung von Äußerungen zu zusammenhängenden ‘Diskurssegmenten’, und attentional structure, einem Vorläufer des in Abschnitt 4.3.1 vorgestellten Centering-Modells). Ausgangspunkt ist der Gedanke, dass der Autor mit dem Text als Ganzem ein bestimmtes Ziel verfolgt (‘discourse purpose’, DP), wie zum Beispiel den Leser zu einer bestimmten Tätigkeit zu ermuntern, ihm nahezulegen, eine Einstellung zu einem Sachverhalt zu übernehmen, oder auch ein bestimmtes Produkt zu kaufen. Das Ziel wird verfolgt, indem Teile des Textes (Segmente) ihrerseits einen bestimmten Zweck erfüllen sollen (‘discourse segment purpose’, DSP), und die DSPs der ersten Zerlegungsebene dann kollektiv dem DP dienen. Segmente können sich ihrerseits in kleinere Segmente aufgliedern, die jeweils das übergeordnete DSP mit unterstützen, bis hinunter zur Ebene der einzelnen Sätze oder Teilsätze. Für diese minimalen Einheiten der Analyse, die kleinsten Textsegmente, die einer Illokution entsprechen, verwenden wir fortan das in der englischsprachigen Literatur weit verbreitete Akronym ‘EDU’ (elementary discourse unit). Ein Segment, das größer als eine EDU ist, kann sowohl aus EDUs als auch aus weiteren Segmenten bestehen, die Anordnung der Ebenen ist also nicht streng hierarchisch. Ein weiteres Charakteristikum ist die Möglichkeit zur Einbettung von Segmenten in der Mitte des übergeordneten Segments - ein Textabschnitt kann also kurzzeitig ein Segment unterbrechen, diesem ein unterstützendes Ziel “zuliefern”, bevor das übergeordnete Segment fortgesetzt wird. 4 Es handelt sich jedoch nicht um den ersten Vorschlag dieser Art; erwähnt sei hier nur, dass auch van Dijk (1977) eine Erweiterung seiner thematischen Makrostrukturen um Sprechakte und Makro- Sprechakte vornahm. 106 7. Von Illokutionsstruktur zu Argumentationsstruktur [1] The “movies” are so attractive to the great American public, [2] especially to young people, [3] that it is time to take careful thought about their effect on mind and morals. [4] Ought any parent to permit his children to attend a moving picture show often or without being quite certain of the show he permits them to see? [5] No one can deny, of course, that great educational and ethical gains may be made through the movies [6] because of their astonishing vividness. [7] But the important fact to be determined is the total result of continuous and indiscriminate attendance on shows of this kind. [8] Can it be other than harmful? (...) [12] Without spoken words, facial expression and gesture must carry the meaning; [13] but only strong emotion, or buffoonery can be represented through facial expression and gesture. [14] The more reasonable and quiet aspects of life are necessarily neglected. [15] How can our young people drink in through their eyes a continuous spectacle of intense and strained activity and feeling without harmful effects? [16] Parents and teachers will do well to guard the young against overindulgence in the taste for the “movie”. Abbildung 7.1.: Beispieltext Movie (Grosz u. Sidner, 1986) Auf diese Weise entsteht eine Baumstruktur aus Segmenten, deren DSPs jeweils in einer Relation der ‘dominance’ oder, umgekehrt betrachtet, der ‘contribution’ stehen. Wir illustrieren dies an einer leicht gekürzten Fassung des von Grosz und Sidner verwendeten Beispieltexts aus der Stummfilmzeit (der seinerseits bereits von Cohen (1983) verwendet wurde) mit der von Cohen vorgenommenen Gliederung in (Teil-) Sätze. Der Text ist in Abb. 7.1 angegeben, die Gliederung in Segmente in Abb. 7.2. Wie bestimmen wir nun bei der Textanalyse die DSPs sowie das DP? Nach Grosz und Sidner gibt es vier Varianten: Seg 0 Seg 1 Seg 3 Seg 7 Seg 4 1 2 3 4 5 6 7 8 ... 12 13 14 15 16 Seg 2 Abbildung 7.2.: Segmentierung des Beispieltexts Movie 7.2. Sprechhandlungen in Texten 107 1. explizit: Die Illokution wird mit performativem Verb unmissverständlich angezeigt, z. B. Ich erwarte, dass Sie mir umgehend antworten; 2. direkt, in einem Satz/ Teilsatz ablesbar; 3. direkt, aber auf mehrere Sätze/ Teilsätze verteilt; 4. indirekt, durch Ableitung aus einem oder mehreren Sätzen/ Teilsätzen im Kontext. Beispiele für Varianten 2-4 finden sich in unserem Beispieltext. Hier stellt nach Grosz und Sidner (16) die zentrale Aussage (also das DP) dar, und die damit verbundene Intention ist, dass die Rezipientin des Textes die zum Ausdruck gebrachte Proposition glaubt. 5 (16) repräsentiert damit die zentrale Intention des größten Diskurssegments (1-16), dem zwei Segmente unmittelbar untergeordnet sind. Das eine davon ist (1-3) mit der in (3) zum Ausdruck gebrachten Intention, das andere ist (4-15) mit seiner Haupt-Intention in (15). Damit sind (16), (3) und (15) Beispiele für den o. g. Fall 2 der DSP-Bestimmung (direkt in einem Satz ablesbar). Segment (4-15) enthält seinerseits zwei Subsegmente, nämlich (5-6) mit der Intention in (5), sowie (7-14) 6 , dessen zentrale Intention in (13-14) ausgedrückt ist - mithin ein Beispiel für den Fall 3. Parallel zur Einbettung der Segmente wird jeweils eine ‘dominance’ Relation zwischen den zugrunde liegenden Intentionen postuliert, woraus eine Hierarchisierung resultiert, die als Wechselspiel zwischen linguistischer Struktur (Einbettung von Segmenten) und intentionaler Struktur (Intentionen, die sich gegenseitig unterstützen können) aufgefasst wird. Die Abbildung 7.2 zeigt diese Hierarchie, wobei die jeweils “zentralen” Sub-Segmente (aus denen mehr oder weniger direkt die Intention des Segments abgelesen wird) unterstrichen dargestellt sind. Im Klartext lauten die Dominanzbeziehungen: • I(7-8) dominiert I(13-14): Weil nur starke Gefühle im Gesichtsausdruck ablesbar sind und vernünftigere Einstellungen vernachlässigt werden, kann lang anhaltendes Filmschauen nur schadhaft sein. • I(15) dominiert I(5) und I(7-8): Weil einerseits zwar Weiterbildungseffekte erzielbar sind, aber andererseits lang anhaltendes Filmschauen nur schadhaft sein kann, können junge Leute bei anhaltender intensiver und anstrengender Augenaktivität nur Schaden nehmen. Dies ist ein Beispiel für die Ableitung der intendierten Proposition (Fall 4 in obiger Liste) aus der rhetorischen Frage in (15), die ja ihre Intention nur indirekt vermittelt. • I(16) dominiert I(3) und I(15): Weil es an der Zeit ist, die Effekte von Filmen auf Geist und Moral zu untersuchen, und weil junge Leute durch stetige visuelle Belastung nur Schaden nehmen können, sollten Eltern und Lehrer 5 Im Folgenden nennen wir lediglich das jeweils zentrale Textsegment; die vollständige Intention besteht für dieses Textbeispiel jeweils darin, dass die Leser die jeweilige Proposition glauben. 6 Um die Darstellung abzukürzen, lassen wir (9-11) beiseite. 108 7. Von Illokutionsstruktur zu Argumentationsstruktur Abbildung 7.3.: Textstruktur und Handlungsstruktur nach Schröder (2003) junge Leute davor schützen, sich allzu sehr in den Konsum von Filmen zu stürzen. Neben ‘dominance’ postulieren Grosz und Sidner eine zweite Relation, die zwischen DSPs bestehen kann. Wenn die Reihenfolge der Verarbeitung von DSPs wichtig ist, nämlich das eine Ziel erst erreicht sein muss, bevor das nächste angegangen werden kann, wird dafür die Relation ‘satisfaction-precedence’ verwendet. Im hier gezeigten Beispieltext tritt sie nicht auf; typische Verwendungen sind Anweisungstexte, in denen die Reihenfolge einzelner Handlungen bedeutsam ist, aber auch komplexe Erläuterungen oder Argumentationen, in denen die Glaubwürdigkeit einer These davon abhängt, dass zuvor bereits eine andere These vermittelt wurde. Die ‘intentional structure’ von Grosz und Sidner ist ein erster, recht “grobkörniger” Vorschlag, der auf den Zusammenhang zwischen linguistischer Segmentierung von Texten (und Dialogen) und Dominanz-Beziehungen zwischen den zugehörigen Intentionen verweist, ohne hier eine detailliertere Klassifikation anzustre- 7.2. Sprechhandlungen in Texten 109 ben. In die gleiche Richtung geht auch Schröder (2003), der zu einem ganz ähnlichen Modell gelangt wie Grosz/ Sidner. In Schröders Modell der Handlungsstruktur von Texten zerfällt der Text in Teiltexte, diese zerfallen abermals in Teiltexte und schließlich in die einzelnen Sätze (die Schröder hier mit EDUs gleichsetzt). All diesen Einheiten entsprechen Handlungen: die Texthandlung (bei Grosz/ Sidner: DP), die Teiltexthandlungen (DSPs) und schließlich die Satzhandlungen. Die Einbettung einer Handlung geschieht zunächst durch die ‘indem’-Beziehung, weitere Teilhandlungen können daran mit der ‘und dann’-Beziehung angeschlossen werden. Abb. 7.3 illustriert das Schema für die so entstehenden Strukturen. Die Relation ‘und dann’ ist nicht so eng gefasst wie die ‘satisfaction-precedence’ bei Grosz/ Sidner, sondern dient immer zur Verknüpfung von nebengeordneten Teilhandlungen, auch wenn die Reihenfolge für das Erreichen des Handlungsziels nicht strikt erforderlich ist. Eine Analyse des Movie-Beispieltexts aus Abb. 7.1 nach Schröders Schema könnte wie folgt aussehen (A = Autor): [1-16] A kritisiert die Gefahr des Filmkonsum bei Jugendlichen INDEM [1-3] A darauf hinweist, dass die Filme so populär geworden sind, dass man sich über sie Gedanken machen muss UND DANN [4-15] A das Für und Wider des Filmkonsums abwägt INDEM [4] A fragt, ob Eltern ihre Kinder oft ins Kino lassen sollen UND DANN [5-6] A die Lebhaftigkeit des bewegten Bildes einräumt UND DANN [7-14] A die negativen Aspekte des Kinos betont INDEM [7-8] A den anhaltenden und wahllosen Filmkonsum als schadhaft einstuft UND DANN [12-14] A darauf hinweist, dass wegen des fehlenden Tons nur starke Emotionen und Possen dargestellt werden können UND DANN [15] A feststellt, dass Filmkonsum anstrengt und Schaden hervorrufen muss UND DANN [16] A fordert, dass Eltern und Lehrer die Jugend vor übertriebenem Filmkonsum schützen sollen Kommen wir auf die oben genannten vier Möglichkeiten der Bestimmung von DSPs zurück, so weist der Grosz/ Sidner-Ansatz eine Neigung zur Beibehaltung von Satz-Illokutionen als DSPs auf (Fälle 1-3), während Schröder eher die Ableitung von DSPs (Fall 4) als Normalfall betrachtet. Er betont den konzeptuellen Unterschied zwischen ‘Satzhandlung’ auf der einen und ‘Texthandlung’ auf der anderen Seite - wobei letztere dann auch die ‘Teiltexthandlung’ subsumiert. 110 7. Von Illokutionsstruktur zu Argumentationsstruktur Zu den strukturbildenden Beziehungen ‘indem’, ‘und dann’ treten in Schröders Ansatz noch funktionale Beziehungen als zweites Beschreibungsmittel. Funktionale Beziehungen können die Stützungsbeziehung ergänzen; sie gliedern sich in zwei Gruppen: • Funktionale Unterordnung/ Abhängigkeit: Das übergeordnete Segment wird vom untergeordneten konkretisiert oder präzisert, näher erläutert, mit einer Quelle belegt, etc. Das untergeordnete Element allein könnte die Rolle des übergeordneten für den Text nicht erfüllen. • Funktionale Nebenordnung: Kein Segment ist “wichtiger” als das andere, sie agieren gemeinsam auf derselben Ebene. Schröder unterscheidet drei Fälle: - Funktionale Ergänzung: Es wird eine Information nachgetragen, ein Detail ergänzt. Die ergänzende Mitteilung dient der gleichen Funktion wie die ergänzte Mitteilung. - Funktionale Reihung: Aufzählungen von Informationen; die entsprechenden Teilhandlungen sind nicht voneinander abhängig. - Funktionale Fortsetzung: Die Teilhandlungen haben die stützende Funktion nicht einzeln inne, sondern erfüllen sie nur gemeinsam. 7.2.2. Dependenzen zwischen Satzillokutionen Die Zuweisung von Illokutionen zu Textsegmenten (im Sinne der DSPs) stellt einen Interpretationsschritt dar, der bewusst über die Analyse der Funktion einzelner Sätze hinaus geht - Illokutionen werden ja für jedes Segment von der Annotatorin selbst formuliert. Dementsprechend groß ist der Spielraum, den ein solcher Ansatz eröffnet: Allein das Festlegen der Grenzen von Diskurssegmenten kann unter verschiedenen Annotatoren recht unterschiedlich ausfallen. Ein etwas “vorsichtigeres” Analyseschema beschränkt sich darauf, allein die EDUs und ihre Illokutionen, sowie die Zusammenhänge der minimalen Illokutionen untereinander zu betrachten. Diesen Weg haben etwa Brandt u. Rosengren (1992) beschritten und eine Hierarchisierung der einzelnen Illokutionen vorgeschlagen. Gleichzeitig treffen sie eine Reihe feinerer Unterscheidungen als es Grosz/ Sidner und Schröder taten. Ihre Untersuchung entstand an einem Textkorpus aus Geschäftsbriefen, und die Autoren weisen darauf hin, dass die Ergebnisse speziell für diese Textsorte gültig und möglicherweise nicht in allen Einzelheiten verallgemeinerbar sind. Das der Hierarchisierung zugrunde liegende allgemeine Prinzip ist für Brandt und Rosengren (im Folgenden ‘BR’) das “Erfolgsprinzip”, nach dem die Sprecherin weiß, dass es oft nicht reicht, eine bestimmte sprachliche Handlung zu vollziehen, sondern dass sie für den Erfolg der Handlung arbeiten muss, indem sie die Illokution abstützt - so wie in den oben bereits gezeigten Beispielen. BR bezeichnen die Grosz/ Sidner ’sche Dominanzbeziehung als Stützungsbeziehung, was einfach einer Umkehrung der Blickrichtung gleichkommt. Im Modell der Illokutionsstruktur werden (nach der Terminologie von Schmitt (2000)) zwei Typen stützender Illokutionen unterschieden: unmittelbar und mittelbar stützende. 7.2. Sprechhandlungen in Texten 111 Mittelbar stützende Illokutionen sind die schwächeren, sie tragen nur mehr indirekt zum Ziel der dominierenden Illokution bei, und von ihnen gibt es wiederum zwei Arten. ‘Sachverhaltsklärende’ Segmente liefern Hintergrundinformation oder orientierende Ergänzungen, wie zum Beispiel Wir nehmen mit diesem Brief Bezug auf unser heutiges Telefonat. ‘Kooperationssichernde’ Segmente dienen dazu, die persönliche Beziehung zwischen den Kommunikationspartnern aufrecht zu erhalten, es handelt sich überwiegend um konventionalisierte Ausdrücke wie Wir stehen Ihnen jederzeit wieder zur Verfügung. Wichtiger sind die unmittelbar stützenden Beziehungen. Dies sind Hilfshandlungen, die den Erfolg der übergeordneten Handlung sicherstellen sollen. Diese lassen sich je nach Art der Handlungen in unterschiedliche Kategorien gruppieren; hier der Vorschlag von Schmitt (2000), der den von BR etwas weiterentwickelt: • Verstehenssichernde Illokutionen: Sprecher gibt Zusatzinformationen, die geeignet sind, das Verstehen der übergeordneten Illokution zu erleichtern: Ich schlage vor, dass wir uns am Stachus treffen. Das ist ein anderer Name für den Karlsplatz. • Glaubensstützende Illokutionen: Sprecher begründet eine Illokution, macht deutlich, weshalb auch Hörer die in der übergeordneten Illokution ausgedrückte These glauben sollte: Der Stachus ist ein guter Treffpunkt für eine Unterredung. Es gibt eine ganze Reihe hübscher Lokale. • Motivationsstützende Illokutionen: Sprecher möchte Hörer zu einer Handlung motivieren, und die stützende Illokution soll Verständnis für die übergeordnete schaffen: Schneide doch bitte das Gras. Morgen wird es zu lang sein, als dass wir es mit dem alten Rasenmäher schaffen. • Ausführungssichernde Illokutionen: Sprecher möchte dem Hörer das Ausführen einer Handlung erleichtern: Mäh doch mal schnell den Rasen. Der Mäher steht in der Garage. Zur Verdeutlichung des Ansatzes zitieren wir eine Beispiel-Analyse aus (Brandt u. Rosengren, 1992, S. 36). Der zugrunde liegende Text, mit markierten Segmenten, ist: 1.1a Mit unserem Schreiben vom 18.12.79 haben wir Ihnen die Rückzahlung Ihrer Anzahlung . . . garantiert, falls unsere Konzernfirma . . . nicht erfüllen sollte. 1.1b Gleichzeitig wurde unser Werkshaftbrief mit dem Zeitpunkt befristet, an dem sämtliche Lieferungen und Leistungen laut Ihrer Bestellung durchgeführt sind. 1.2 Da in der Zwischenzeit alle vertraglichen Verpflichtungen von unserer Konzernfirma erfüllt wurden 1.2.1 - die Abnahme des Kranes erfolgte am 17.10.79 - 1. ersuchen wir Sie, uns den eingangs erwähnten Garantiebrief zurück zusenden. 1.3 Wir danken für eine baldige Erledigung im voraus. 112 7. Von Illokutionsstruktur zu Argumentationsstruktur 1.2 Info 1. DIR 1.1a ASS 1.1 b ASS 1.3 DANK>DIR 1.2.1 ASS sach koop/ sach sach unmi Abbildung 7.4.: Illokutionsstruktur-Analyse aus Brandt u. Rosengren (1992) Abbildung 7.4 zeigt die grafische Darstellung der Illokutionsstruktur nach BR. Neben den Segmentbezeichnern erscheinen Kürzel für die Illokution der EDU: ASS - A SSERTION ; Info - I NFORMATION ; DIR - D IREKTIVUM . Die Wurzel der Illokutionshierarchie bildet stets ein Direktivum, das von den anderen Segmenten direkt oder indirekt abgestützt wird. Die horizontale Linie über 1.1a und 1.1.b zeigt an, dass diese beiden Segmente zu einem Block zusammengefasst sind, der nicht weiter in Illokutionen zu gliedern ist; stattdessen besteht ein rein semantischer Zusammenhang. Gemeinsam bilden die Segmente eine sachverhaltserklärende (also nur mittelbare) Stützung für das zentrale Direktivum, das Segment 1. Es wird in ähnlicher Weise von 1.3 gestützt, wobei die Entscheidung zwischen den beiden möglichen mittelbaren Beziehungen (sachverhaltserklärend oder kooperationssichernd) offen gelassen wird. Schließlich gibt es eine unmittelbare Sützung, nämlich von der Informationsübermittlung in 1.2; diese wird ihrerseits durch 1.2.1 sachverhaltserklärend gestützt. Neben der Illokutionshierarchie ist für die Beschreibung des Textes nach BR noch eine zweite Ebene anzunehmen, nämlich die der Sequenzierung. Sie nehmen die Illokutionshierarchie als prinzipiell ungeordnet an: Stützungsbeziehungen sind in der Regel nicht daran gebunden, in welcher Reihenfolge die Segmente im Text erscheinen. Davon kann man sich für EDUs leicht überzeugen: (7.2) a Mähe doch bitte das Gras. Morgen wird es zu lang sein, als dass wir es mit dem alten Rasenmäher schaffen. b Morgen wird das Gras zu lang sein, als dass wir es mit dem alten Rasenmäher schaffen. Mähe es doch bitte. Bezogen auf den gesamten Text sind die Entscheidungen über die Anordnung aber natürlich nicht beliebig. Die Sequenzierung unterliegt ebenso wie die Hierarchisierung dem allgemeinen Erfolgsprinzip (s. o.), folgt darüber hinaus aber auch spezi- 7.3. Argumentationsstruktur 113 elleren Prinzipien, die den Raum der möglichen Anordnungen einschränken (vgl. auch Abschnitt 5.2). BR vertiefen diesen Punkt nicht weiter, doch die vorgeschlagenen Prinzipien seien hier kurz genannt: • Hierarchieprinzip: Illokutionen, die zusammen eine andere Illokution stützen, können nicht unkontrolliert auseinander gerissen werden. • Ikonizitätsprinzip: Die zeitliche und kausale Abfolge der Inhalte des Textes bestimmen die Sequenzierung mit. • Situationsprinzip: Textsorte, Kontext der Einbettung, mitunter auch das Ziel des Sprechers bestimmen die Sequenzierung mit. Wenn minimale Segmente durch Stützungsbeziehungen verbunden werden und eine Sequenzierung vorgenommen wird, entsteht eine Strukturbeschreibung des Textes. Welche Bedingungen sind an eine solche Struktur geknüpft? BR machen dazu keine sehr engen Vorgaben. Während der “ideale” Text durch eine einzelne Illokutionshierarchie gekennzeichnet ist (wie im obigen Beispiel), kann es in einem Text durchaus auch mehrere Hierarchien geben, falls er mehr als eine Funktion erfüllt. Überdies ist es möglich, dass ein Segment mehr als eine dominierende Illokution stützt. Als ein Zugeständnis an die Bildung von Textsegmenten (wie bei Grosz/ Sidner und Schröder) gehen wie gesehen auch BR davon aus, dass es im Text inhaltlich zusammenhängende Blöcke geben kann, die nicht in eine Illokutionshierarchie zu zergliedern sind, sondern als Ganzes eine Funktion erfüllen; innerhalb des Blocks bestehen dann Beziehungen nicht zwischen Illokutionen, sondern allein auf der inhaltlichen Ebene; mehr dazu im nächsten Kapitel. Befragen wir nun die geschilderten Modelle nach ihrem Bezug zur Textfunktion, so finden wir, dass bei Brandt/ Rosengren die Funktion des Textes gleichgesetzt wird mit der “Wurzel” der Illokutionshierarchie, also der insgesamt dominierenden Illokution. Das bedeutet, dass die Gesamtfunktion jeweils an einer konkreten Stelle des Textes identifiziert werden kann, sie stellt einen der Sprechakte des Textes dar. Anders bei Grosz/ Sidner und Schröder, die davon ausgehen, dass sich Sätze zu Textsegmenten zusammenfügen und entsprechend aus einzelnen Satzhandlungen jeweils Segmenthandlungen abgeleitet werden. Wie auch Schröder (2003) bemerkt, entspricht dies recht genau der Unterscheidung zwischen Dependenzstruktur und Konstituentenstruktur in der linguistischen Analyse von Sätzen: Im einen Fall spielen größere Segmente eine konstitutive Rolle für die Gesamtstruktur, im anderen Fall sind es allein die Dependenzbeziehungen zwischen elementaren Einheiten, die die Struktur ergeben. 7.3. Argumentationsstruktur Bislang haben wir Illokutionen über die Stützungsbeziehung miteinander verbunden und davon eine Reihe verschiedener Typen unterschieden. Für relativ einfach “gestrickte” Texte mag das genügen. Wenden wir uns aber nun gezielt dem Texttyp argumentativ und entsprechend der Analyse der im Text verfolgten Argumentation 114 7. Von Illokutionsstruktur zu Argumentationsstruktur Abbildung 7.5.: Schema einer Argumentation nach Toulmin (1958) zu, so erweist sich der Illokutionsstruktur-Ansatz als nicht ausreichend. Charakteristisch für eine Argumentation ist oftmals, dass sie fallweise die Perspektive wechselt und mögliche Gegenargumente anführt - die dann aber freilich wieder entkräftet werden, damit insgesamt die eigene These gestützt wird. Das einfache Schema “Aufstellen einer Behauptung und Anführen von Gründen” muss also ergänzt werden. Wir können uns die Aufgabe an dem oben behandelten Beispieltext Movie (Bild 7.1) verdeutlichen. Dort gibt der Autor im Segment (5-6) zu, dass der Kinofilm positive Aspekte hat, wischt dies aber dann mit stärkeren Gegenargumenten wieder vom Tisch. In unserer Analyse (sowohl nach Grosz u. Sidner (1986) als auch Schröder (2003)) konnten wir dieses “Einräumen” aber lediglich verbal in den Umschreibungen ausdrücken - es gab kein strukturelles Instrument, um das für die Struktur der Argumentation sehr wichtige Vorgehen explizit zu kennzeichnen. Wir benötigen dafür also geeignetere Beschreibungsmittel. Ein viel zitierter Vorschlag zur allgemeinen Darstellung eines Arguments ist der von Toulmin (1958), der sich als Diagramm wie in Abb. 7.5 darstellen lässt. Ziel des Sprechers ist, den Hörer von der These C zu überzeugen, die er auf der Grundlage einer Beobachtung D aufstellt - zum Beispiel Morgen wird es regnen, denn die Schwalben fliegen sehr tief. Mit einem Modaloperator Q ist es möglich, die These einzuschränken, zu betonen, etc., wie in Morgen wird es bestimmt regnen. Damit D wirklich als Stütze für C fungieren kann, muss es eine allgemein akzeptierte (und auch dem Hörer bekannte) Regel W geben, in unserem Beispiel “Wenn die Schwalben tief fliegen, wird es Regen geben.” Die Aussagekraft von W oder die Anwendbarkeit im konkreten Fall kann wiederum abgestützt werden, etwa durch eine dahinter stehende Autorität: So besagt es eine alte Bauernregel. Und schließlich ist es möglich, die Folgerungsbeziehung für den konkreten Fall mit einem Gegenargument außer Kraft zu setzen, dies besagt der Bestandteil “Unless R”. Im Beispiel könnte ein R vielleicht darin bestehen, dass die Schwalben sich von der großen Hitze täuschen lassen. - In dieser Weise können Argumentationen in ihre typischen Be- 7.3. Argumentationsstruktur 115 Abbildung 7.6.: Bausteine einer Argumentation nach Freeman (1991) standteile aufgeschlüsselt werden, wobei mitunter auch zutage treten kann, dass sie zwar oberflächlich zu “funktionieren” scheinen, letztlich aber auf nicht gedeckten Prämissen beruhen. Wie lässt sich Toulmins Schema nun für die Analyse eines argumentativen Texts nutzbar machen? Es liefert Hinweise auf Bestandteile und deren Zusammenwirken, doch es lässt sich nicht unmittelbar als Grundlage einer Strukturbeschreibung verwenden. Toulmin behandelt das Problem aus einer philosophischen, nicht aus einer textanalytischen Perspektive - er beschreibt, wie ein Argument “an sich” funktioniert. Um die Struktur eines konkreten Textes anzugeben, benötigen wir demgegenüber einen kompositionalen Ansatz, der es erlaubt, für jeden Satz seine Rolle im Gefüge der Argumentation anzugeben - analog zur oben diskutierten Illokutionsstruktur, jedoch mit weiter gehenden Möglichkeiten zur Komposition von Elementen. Einen Vorschlag dazu unterbreitete Freeman (1991), der zwar insofern in der Toulmin’schen Tradition steht, als er ebenfalls philosophisch motiviert ist, aber gut für eine Textanalyse verwendet werden kann. Freeman schlägt eine Reihe von Kompositionsschemata vor, von denen wir die wesentlichen hier vorstellen und anhand eines Beispieltextes illustrieren. Abb. 7.6 zeigt die vier Grundbausteine. (K1) ist der einfache Fall, in dem Beobachtung D unmittelbar die These C stützt, analog zur Beziehung zwischen D und C im Toulmin-Schema. In (K2) wird C von zwei Beobachtungen D1 und D2 gestützt, die unabhängig voneinander sind; hier könnten auch mehr als zwei Ds stehen. Ein ähnlicher Fall ist (K3), allerdings sind hier die stützenden Beobachtungen nicht unabhängig voneinander, sondern sie bedingen sich gegenseitig: die eine könnte ohne die andere nicht als Stützung fungieren. (K4) entspricht zunächst dem “unless rebuttal” von Toulmin: Die Stützung von C durch B wird von R außer Kraft gesetzt, was auch die fett gezeichnete Durchstreichung andeuten soll. In der Regel sind aber im argumentativen Text die Gegenargumente nur potenziell gültig - sie werden ihrerseits abgeschwächt oder außer Kraft gesetzt, damit die These des Autors abermals gestützt wird. Da- 116 7. Von Illokutionsstruktur zu Argumentationsstruktur Soll der Steglitzer Kreisel abgerissen werden? [1] Alles spricht gegen den Steglitzer Kreisel. [2] Selbst wenn man vergisst, dass der olle Schuhkarton in bester Lage einst ein privates Prestigeobjekt war, [3] das der öffentlichen Hand für teures Geld aufgenötigt wurde. [4] Ein Symbol der West-Berliner Filzwirtschaft in den späten sechziger Jahren. [5] Aber lassen wir das ruhig beiseite. [6] Der Kreisel ist Asbest verseucht. [7] Nicht nur hier und da, sondern durch und durch. [8] Zwar könnte man, wie beim Palast der Republik, den Bau bis aufs wackelige Stahlskelett entkleiden und neu aufbauen. [9] Aber das würde mindestens 84 Millionen Euro, vielleicht auch das Doppelte kosten. [10] Was für ein Preis für die Restaurierung eines städtebaulichen Schandflecks, [11] der seit mehr als dreißig Jahren Schatten auf die nette, gutbürgerliche Umgebung wirft. [12] Von allen Seiten versperrt der Kreisel die Sicht. [13] Er ist keine Sehenswürdigkeit. [14] Und für die Mitarbeiter des Bezirks Steglitz, die im Hochhaus arbeiten, kann die Lebensqualität bei einem Umzug in ein anderes Dienstgebäude nur steigen. [15] Der Kreisel ist auch innen hässlich, [16] zudem zugig und Energie verschleudernd. [17] Einzig brauchbar ist die gute Verkehrsanbindung und [18] der Blick aus dem 24. Stock auf den Süden Berlins. [19] Aber beides rechtfertigt es nicht, das marode Gebäude zu sanieren. [20] Für das viele Geld kann man fast zwei neue, wirklich schöne Häuser bauen. (Der Tagesspiegel, 23.5.2004) Abbildung 7.7.: Beispieltext Kreisel zu dient das “counter rebuttal” CR, das die Wirkung von R eliminiert. Zu beachten ist, dass die Schemata keine Aussagen über die Reihenfolge der einzelnen Elemente im Text machen, sondern davon abstrahieren. Hier jeweils ein Beispiel für jedes Schema: (1) Die Bayern sind dieses Jahr in Topform. Darum werden sie sicher Deutscher Meister. (2) Die Bayern sind dieses Jahr in Topform, und Bremen muss den Weggang von Klose verkraften. Darum werden die Bayern sicher Deutscher Meister. (3) Die Bayern sind dieses Jahr in Topform, und die Form ist letztlich für den Saisonverlauf entscheidend. Darum werden sie sicher Deutscher Meister. (4) Werder Bremen hätte wegen seines starken Sturms gute Chancen auf die Meisterschaft, aber der Torwart ist in einer Dauerkrise. Darum werden sicher die Bayern Meister, denn die sind in Topform. 7.3. Argumentationsstruktur 117 Abbildung 7.8.: Analyse des Kreisel-Textes nach Freeman (1991) Entscheidend ist nun, dass die Freeman’schen Konstruktionen (K1)-(K4) miteinander kombiniert werden können, um komplexere Argumentationen abzubilden. So lassen sich Ketten von Stützungsbeziehungen bilden, aber auch ein Gegenargument sowie seine Entkräftung können sich aus mehreren Elementen zusammensetzen. Im obigen Beispiel (4) beispielsweise entspricht dem Element R aus Konstruktion K4 selbst eine Stützungsbeziehung, nämlich die zwischen Werder hat starken Sturm und Werder hat gute Chancen auf die Meisterschaft. Zur Illustration zeigt Abb. 7.8 eine komplette Analyse für den in Bild 7.7 aufgeführten Beispieltext Kreisel 7 bei dem die zentrale These recht plakativ gleich zu Beginn des Textes erscheint, und dann verschiedene Pfade der Abstützung eingeschlagen werden, zweimal auch mit Entkräftung potenzieller Gegenargumente. Zu beachten ist, dass die Analyse recht freimütig von der Reihenfolge der EDUs im Text abweicht: Die Argumentationsstruktur soll allein die inhaltlichen Stützungszusammenhänge abbilden, die nicht immer linear im Text aufeinander folgen müssen. Ein zweiter Aspekt der Abstraktion ist das Auslassen von EDUs, die für die Argumentation keine wirkliche Rolle spielen; hier betrifft es das Segment (5), das eine rhetorische Formel darstellt, die natürlich nicht wörtlich gemeint ist: (2-4) soll keineswegs “beiseite gelassen” werden, vielmehr sind die auf (5) folgenden Argumente im Sinne eines “obendrein” zu verstehen. Damit trägt (5) aber sachlich nichts zu den Stützungsbeziehungen bei, findet also in dieser Struktur keinen Platz. Eine von Freeman (1991) inspirierte Argumentationsstruktur ist nicht so allgemeingültig wie das Toulmin’sche Schema, doch besteht ihr Anliegen ja auch wie 7 Der Steglitzer Kreisel ist ein allein stehendes Hochhaus, das die Bezirksverwaltung von Berlin-Steglitz beherbergt. 118 7. Von Illokutionsstruktur zu Argumentationsstruktur gesagt darin, letztlich die Form des Arguments abzubilden, und nicht die Form des Textes. Das Argumentationsgerüst wird gewissermaßen “herausgeschält”. Da, wie wir gesehen haben, auch Einheiten des Textes beiseite gelassen werden können, ist dies in einem engen Sinn also eigentlich nicht mehr eine Ebene der Textstruktur, sondern ein Interpretationsergebnis. Wir haben den Ansatz hier dennoch behandelt, weil er für den Texttyp argumentativ exemplarisch gewissermaßen den “Endpunkt” der Analyse darstellt: Wenn es mir gelungen ist, die Argumentationsstruktur eines Kommentars oder eines anderen argumentativen Texts darzustellen (nach Freeman oder einem anderen Ansatz), so habe ich den Text verstanden und seine Funktion nicht nur identifiziert, sondern auch rekonstruiert. Damit ist also die Ziellinie der Textanalyse erreicht. Für andere Texttypen wäre diese freilich anders zu definieren: Für den instruktiven Text müsste es eine Repräsentation der Abfolge der Anweisungen sein, für eine Erzählung eine Darstellung der Ereignisfolge und der eingestreuten beschreibenden Anteile (siehe Kapitel 6), etc. 7.4. Inventar von Illokutionen Nachdem wir uns mit der Verknüpfung von Illokutionen zu übergeordneten Strukturen beschäftigt haben, bleibt noch die Frage nach den elementaren “Bausteinen” einer Illokutionsstruktur zu behandeln. Gemäß dem zu Anfang des Kapitels diskutierten Leitsatz “Sprechen ist Handeln” definieren wir mit Motsch (1987, S. 45f.) unsere Bausteine als illokutive Handlungen (IH), die sich prinzipiell als 4-Tupel darstellen lassen: IH = <ä, int, kond, kons> Hier bezeichnet ä die Äußerung eines sprachlichen Ausdrucks; int die Absicht des Sprechers, mit ä ein bestimmtes Ziel z zu erreichen; kond eine Menge von Bedingungen, die in der Äußerungssituation erfüllt sein müssen, damit IH erfolgreich sein kann; und kons eine Menge von Konsequenzen, die mit dem Vollzug von IH verbunden sein kann. Um dies systematisch untersuchen zu können, müssen wir (ebenfalls mit Motsch) voraussetzen, dass die IH sich bestimmten Typen zuordnen lassen, die ihrerseits durch Typen der vier Bestandteile charakterisiert sind. Wir gehen davon aus, dass diese Handlungstypen konventionalisierte Muster sind, die von den Mitgliedern der Sprachgemeinschaft ebenso erworben werden wie das grammatische Wissen. Dieses “Sprachhandlungswissen” beschreibt also, wie eine Sprecherin in bestimmten Situationen unter Rückgriff auf bestimmte sprachliche Formen bestimmte Ziele erreichen kann. Die Suche nach einem für die Textanalyse (insbesondere die Untersuchung der Illokutionsstruktur) geeigneten Inventar solcher Typen steht im Mittelpunkt dieses Abschnitts - wir verwenden dafür weiterhin den Begriff der Illokution. Die Korrelation zwischen Typen von Illokutionen und Typen von Äußerungen (ä im 4-Tupel) wird uns in Abschnitt 9.2 beschäftigen. Es sei jedoch hier bereits (mit einem Beispiel von Schmitt (2000)) illustriert, dass identische sprachliche Formen sehr unterschiedliche Illokutionen tragen können. 7.4. Inventar von Illokutionen 119 (7.3) a Stefan fehlte heute im Sportunterricht. Er war krank. b Stefan fehlte heute im Sportunterricht. Auch Patrick kann das bezeugen. Die oberflächliche Identität des ersten Satzes kann nicht darüber hinwegtäuschen, dass er jeweils eine ganz andere Rolle spielt, und dass dementsprechend die Gesamtintention der beiden Satzpaare sehr verschieden ist: [a] informiert die Leserin über Stefans Fehlen und den Grund dafür, während [b] Vorsorge dafür trifft, dass die Leserin vielleicht nicht glaubt, dass Stefan gefehlt hat (womöglich weil ihr zuvor etwas Gegenteiliges mitgeteilt wurde). In [b] stützt der zweite Satz die Illokution des ersten, während der zweite Satz in [a] die Begründung für die im ersten Satz ausgedrückte Proposition liefert - nicht für die Illokution (wir erinnern uns an das Repräsentationsschema ‘F(RP)’). Damit geht einher, dass der erste Satz in der Kommunikationssituation jeweils einen unterschiedlichen Status hat, ihm also verschiedene Illokutionen zukommen. Ein ganz ähnliches Motiv für die Beschäftigung mit Illokutionen von EDUs liefern die vier in Abschnitt 7.2.2 genannten Typen von unmittelbaren Stützungsbeziehungen (verstehenssichernd, glaubensstützend, motivationsstützend, ausführungssichernd). Sie lassen sich zum Teil durch Attribute der beteiligten Illokutionen unterscheiden: Bei motivationsstützenden und ausführungssicherenden Stützungen muss die dominierende Illokution eine Handlung des Adressaten zum Inhalt haben (ihn zu einer Handlung auffordern, sie empfehlen, etc.). Bei der glaubensstützenden Beziehung steht stattdessen eine These im Vordergrund, eine Proposition, die sich “behaupten” lässt. Die Verstehenssicherung schließlich bezieht sich nicht auf den Status einer Proposition als These, sondern als Aussage über die Welt, die zunächst einmal nicht zu bezweifeln sein soll, aber eben möglicherweise nicht ohne weiteres inhaltlich verstanden wird. Wenn wir uns also jetzt damit befassen, ob sich ein überschaubares Inventar von elementaren Illokutionen angeben lässt, müssen wir zunächst auf die ‘discourse segment purposes’ von Grosz u. Sidner (1986) (Abschnitt 7.2.1) zurückkommen. Die Autorinnen hatten die Positionen vertreten, dass die Menge möglicher Intentionen von Sprechern (Leser glaube eine Aussage; Leser sei in der Lage, ein Objekt zu identifizieren; Leser kenne eine Eigenschaft eines Objekts; etc.) im Prinzip offen sei, da wir mit einem Text oder einem Teiltext sehr viele verschiedene Ziele verfolgen können. Dagegen lässt sich wenig einwenden, doch es macht womöglich einen Unterschied, ob wir die Funktion ganzer Textsegmente untersuchen oder lediglich die von minimalen Segmenten, also maximal die von Sätzen. Dann geht es nicht darum, das Spektrum möglicher inhaltlicher Ziele von Sprechern zu klassifizieren, sondern lediglich die Typen von Zielen einzelner Äußerungen zu benennen, die mit einer Äußerung erreicht werden sollen. Dass wir dazu von den Phänomenen der sprachlichen Oberfläche erheblich abstrahieren müssen, stellte bereits Austin (1975) fest, der eine Zählung der performativen Verben des Englischen vornahm und daraus ableitete, man müsse ca. 1000 verschiedene Sprechakte annehmen. Eine solchermaßen “feinkörnige” Differenzierung wäre freilich wenig hilfreich. Die 120 7. Von Illokutionsstruktur zu Argumentationsstruktur Pionierarbeit für eine kleine (weil abstrakte) und gleichzeitig aussagekräftige Menge von Illokutionen stammt vom ebenfalls in Abschnitt 7.1 genannten John Searle. In Searle (1980) benennt er 12 Kriterien für die Klassifikation von Illokutionen, von denen er drei als besonders wichtig ansieht und die er dann auch seiner Taxonomie zugrunde legt: • Illokutionszweck: Was ist das Ziel, das die Sprecherin verfolgt; was möchte sie erreichen? Searle verwendet dafür Symbole wie (Behauptung), ! (Aufforderung zu Handlung), K (Absichtserklärung zu einer Handlung der Sprecherin), E (Ausdruck einer Einstellung), D (Deklaration einer Handlung). • Entsprechungsrichtung: Soll durch die Äußerung die Welt in Einklang mit den Worten gebracht werden, oder sind die Worte im Einklang mit der Welt? Der zweite Fall liegt vor, wenn ich etwas darstelle, die Entsprechungsrichtung verläuft von der Äußerung zur Welt (Symbol: ↓ ); beim Auffordern (Symbol: ↑ ) ist es umgekehrt. • Psychische Einstellung: Was ist die Haltung des Sprechers zur ausgedrückten Proposition - ist es der Wunsch, dass X der Fall sein möge (Symbol: W); der Glaube daran, dass X der Fall ist (G); die Absicht, X zu tun (A); das Bedauern über X; etc.? Eines der übrigen Kriterien, das hier erwähnt sei, ist die Illokutionsintensität, quasi die Vehemenz, mit der das Ziel verfolgt wird (z. B. ich denke eigentlich nicht, dass X versus ich bestreite entschieden, dass X). Die weithin bekannte Typologie von Illokutionen, zu der Searle (wiederum im Anschluss an Austins Arbeiten) gelangte, unterscheidet fünf Kategorien, die sich durch die o. g. drei Merkmale (und ihre Symbole) charakterisieren lassen, sowie durch den propositionalen Gehalt, hier jeweils zum Schluss genannt: 1. Repräsentativa: ↓ G (p) Illokutionszweck ist die Behauptung, die Richtung verläuft von den Worten zur Welt, die psychische Einstellung ist ‘Glauben’. Dies ist die in Texten am häufigsten anzutreffende Kategorie, zuständig für Feststellungen, Beschreibungen, Behauptungen, etc. der für wahr gehaltenen Proposition p. 2. Direktiva: ! ↑ W (H vollzieht A) Zusätzlich zu Aufforderungen, Bitten, etc. zu einer Aktion A rechnet Searle auch Fragen zu den Direktiva; er fasst sie auf als Aufforderungen an den Hörer H, dem Sprecher eine Antwort zu geben. Die Welt soll im Einklang mit den Worten sein, daher die im Vergleich zu Repräsentativa umgekehrte Entsprechungsrichtung. 3. Kommissiva: K ↑ A (S vollzieht A) Sprecher erklärt die Absicht, die Handlung A auszuführen, und damit die Welt im Einklang mit den Worten zu gestalten. 7.4. Inventar von Illokutionen 121 4. Expressiva: E ∅ (P) (S/ H + Attribut) Sprecher drückt seine Einstellung zu einer Proposition aus, die dem Sprecher oder Hörer ein bestimmtes Attribut zuschreibt. Die Zahl möglicher psychologischer Einstellungen ist sehr hoch, daher steht (P) hier für eine Variable. Eine Entsprechungsrichtung gibt es bei Expressiva nicht (daher ∅ ), da die “Welt” nicht involviert ist. 5. Deklarationen: D ∅ (p) Der in der Proposition ausgedrückte Zustand wird durch die Äußerung verwirklicht (z. B. Hiermit taufe ich . . . ). Hier ist die Entsprechung zwischen Worten und Welt in beiden Richtungen gegeben, während es keine psychische Einstellung gibt. Weitere Sub-Klassifikationen ergeben sich für Searle durch Berücksichtigung der weiteren neun Merkmale, auf die wir hier aber nicht eingehen wollen - ebensowenig wie auf die an Searle anschließende ausgiebige kritische Diskussion und die Vielzahl unterbreiteter Gegenvorschläge. Stattdessen wenden wir uns wieder unserer Aufgabe der Analyse authentischer Texte zu und stellen dann fest, dass Searles Taxonomie dafür nicht unmittelbar geeignet ist. Zum einen enthält sie Kategorien, die für unseren Zweck nur wenig relevant sind: Kommissiva und Deklarationen spielen in Texten der Art, wie sie uns hier interessieren, kaum eine Rolle. Zum anderen sind bestimmte feinere Unterscheidungen, die wir etwa im Hinblick auf die Argumentationsanalyse gern treffen würden, mit Searles Merkmalen nicht zu erhalten. Wir benötigen eine Verschiebung der Perspektive: Searles Untersuchung von Sprechakten ist eine philosophische, er interessiert sich für Formen des Handelns (mit Sprache). Unser Augenmerk richtet sich primär auf Funktionen der Sprache, und diese sollten dementsprechend die taxonomischen Unterscheidungen motivieren. Dafür kann man nun im ersten Schritt auf den (in Kapitel 3 bereits erwähnten) klassischen Vorschlag von Bühler (1982, orig. 1934) zurückgreifen, der drei Funktionen sprachlicher Äußerungen unterscheidet, wie sie sich auch in anderen funktional-linguistischen Beschreibungsansätzen (etwa der systemic-functional grammar nach Halliday (2004)) wiederfinden: • Darstellungsfunktion: Das sprachliche Zeichen ist Symbol für dargestellte Gegenstände und Sachverhalte. • Ausdrucksfunktion: Das sprachliche Zeichen drückt die Intention des Sprechers aus. • Appellfunktion: Das Sprachzeichen steuert das Verhalten des Adressaten. Für Bühler (ebenso wie für Halliday und andere) leistet eine Äußerung für alle drei Funktionen gleichzeitig einen Beitrag. Für unsere Zwecke der Zuweisung einer Illokution zu einer EDU geht es dann darum, die jeweilige Hauptfunktion zu identifizieren; ein Inventar möglicher Illokutionen kann aber nichtsdestotrotz von diesen drei Kategorien ausgehen. Eine Ausdifferenzierung, die explizit auf die Untersuchung authentischer Texte zielt, hat Schmitt (2000) vorgeschlagen. Grundlegend ist die Unterscheidung 122 7. Von Illokutionsstruktur zu Argumentationsstruktur zwischen primären und sekundären Illokutionen. Erstere stellen im engeren Sinne eigenständige Handlungen dar und können daher problemlos isoliert auftreten. Schmitts Kategorien knüpfen an die von Searle an: • Reportiva entsprechen Verben wie berichten, bekanntmachen, ankündigen uvm. Ihr propositionaler Gehalt p ist meistens (aber nicht zwingend) ein in der Vergangenheit liegendes Ereignis. Die Sprecherin hat p in der Regel selbst erlebt, erfahren oder herausgefunden, und das wesentliche Merkmal der Illokution ist die Weitergabe der Information p . • Estimativa (einschätzen, behaupten, vermuten uvm.) tragen einen propositionalen Gehalt, dessen Wahrheit die Sprecherin annimmt, ohne darüber aber letzte Gewissheit zu haben. Wesentliches Merkmal ist die Weitergabe einer solchen mit Ungewissheit behafteten Information. • Evaluativa sind Bewertungen und Werturteile, die die Sprecherin ausdrückt. Hinsichtlich des möglichen propositionalen Gehalts gibt es kaum Beschränkungen. • Identifikativa sind Äußerungen von Gefühlen, Hoffnungen, Wünschen oder Grundwerten der Sprecherin, etc. Es geht um innere Zustände, jedoch nicht um Kenntnisse oder Überzeugungen der Sprecherin. Wesentlich ist, dass die Sprecherin einen Aspekt ihrer eigenen Persönlichkeit mitteilt. • Relationata werden von der Sprecherin verwendet, um die persönliche Beziehung zur Adressatin zu etablieren, modifizieren, etc. Zugrunde liegt hier in der Regel keine Proposition mit Bestandteilen R und P; stattdessen werden konventionalisierte Formeln verwendet, um zu danken, begrüßen, der Adressatin etwas zu wünschen, zu verabschieden, zu beleidigen, uvm. • Direktiva sind Aufforderungen zu einer künftigen Handlung der Adressatin. Der propositionale Gehalt besteht aus dem, wozu aufgefordert wird. Je nach gewählter Emphase können Direktiva ‘obligatorisch’ oder ‘fakultativ’ sein. Erstere (bestimmen, anordnen, beauftragen, etc.) setzen ein entsprechendes Verhältnis zwischen Sprecher und Adressat voraus, letztere (bitten, Rat geben, vorschlagen, etc.) dürften in Texten die häufigeren sein. Das Anliegen der sekundären Illokutionen ist demgegenüber, andere Äußerungsteile verständlich zu machen. Sie sind daher niemals in Isolation anzutreffen und stellen keine eigenständigen Handlungen dar, sondern erfüllen eine innertextuelle Funktion, indem sie einen bestimmten Teil des Texts (ihren Skopus) erklären, kommentieren, gliedern, etc. Sie zu systematisieren, erweist sich als schwierig. Schmitt fasst darunter zum Beispiel ‘bekanntheitsreportierende’ (wie Sie wissen; so haben wir gesehen; etc.) und ‘quellenreportierende’ wie Das gab die Deutsche Bundespost heute bekannt. Hier erscheint einerseits die Abgrenzung zu den Reportiva schwierig, andererseits die Begrenzung der Menge möglicher sekundärer Illokutionstypen. Unstrittig dürfte aber die Rolle von ‘Textillokutionen’ sein, oft auch als ‘metakommunikative Akte’ bezeichnet: Sie geben den Lesern Signale zur Gliederung des 7.4. Inventar von Illokutionen 123 Textes, können ihn eröffnen oder abschließen. Beispiele: Wie wir im Folgenden sehen werden; wir beenden diesen Abschnitt mit X; später wird zu zeigen sein, dass X. Kehren wir zu den (interessanteren) primären Illokutionen zurück und konzentrieren uns jetzt auf Textsorten, die uns in den vergangenen Kapiteln besonders beschäftigt haben, so erweisen sich die bislang getroffenen Unterscheidungen als noch nicht aussagekräftig genug, wenn wir etwa das zu Beginn des Abschnitts genannte Beispiel 7.3 erklären wollen. In (a) wie in (b) müssten wir wohl beide Sätze als Reportiva einstufen und hätten damit keinen Hinweis auf die zugrunde liegende Differenz. Der Grund dafür ist, dass sowohl Searle als auch Schmitt sich in ihren Definitionen auf die Perspektive der Sprecherin konzentrieren und keine weiteren Unterscheidungen bzgl. der Annahmen über den Hörer treffen. Schmitt differenziert zwischen einigen Einstellungen, die die Sprecherin zur Proposition haben kann, aber nicht zwischen den Rollen, die die Proposition für den Hörer spielen kann oder soll. Und wie die Diskussion des Beispiels 7.3 gezeigt hatte, ist dies ein sehr wesentlicher Gesichtspunkt. Mitteilen Konstatierungen Vermutungen Annahmen Vol−Aussagen W−Aussagen Ep−Aussagen Val−Aussagen Behauptungen Informationen Verraten (uvm.) Melden Bekannt geben Feststellungen Hypothesen Vorhersagen Prognosen Abbildung 7.9.: Taxonomie des Illokutionstyps Feststellung nach Motsch (1987) Um an dieser Stelle noch einen Schritt voran zu gehen, greifen wir zum Abschluss den Vorschlag von Motsch (1987) auf, der speziell für die von ihm so genannten “Feststellungstexte” eine detailliertere Taxonomie von Illokutionstypen vorschlug. 8 Sie ist in Abb. 7.9 gezeigt und tritt im Schmitt’schen Inventar an die Stelle der drei Gruppen Reportiva, Estimativa und Evaluativa. Motsch nimmt die Grundunterscheidung in vier Typen von Feststellungen anhand des Kriteriums der Präsenz verschiedener Adverbiale vor, weist aber darauf hin, dass bestimmte Verben die Markierung ebenfalls vornehmen können. So seien die Val-Aussagen durch valuative Adverbien gekennzeichnet, die eine Bewertung des Sachverhalts anzeigen, entsprechend den Schmidt’schen Evaluativa. In Vol-Aussagen liegen voluntative Adverbien vor, mit denen die Sprecherin den Wunsch ausdrückt, dass ein Sachverhalt (nicht) eintrete, so wie in Hoffentlich wird der Opposition etwas Schlag- 8 Ähnliche Unterscheidungen wie Motsch trifft beispielsweise auch Morgenthaler (1980). 124 7. Von Illokutionsstruktur zu Argumentationsstruktur kräftiges dazu einfallen. Im Zentrum des Interesses stehen für Motsch die W-Aussagen, die den Bereich der Repräsentativa bzw. Reportiva auffächern. Sie werden durch eine Reihe von konstitutiven Bedingungen charakterisiert, die dann auch die Unterschiede zwischen den einzelnen Typen beschreiben. Allen W-Aussagen sind zwei Bedingungen 9 gemeinsam, nämlich die Aufrichtigkeit des Sprechers und sein Glaube an die Relevanz der übermittelten Proposition p (B1 und B2). Die anderen Bedingungen unterscheiden die Subtypen voneinander. • (B1) Sprecher ist davon überzeugt, dass p . • (B2) Sprecher glaubt, dass der Zustand “Hörer glaubt, dass p ” in der Äußerungssituation relevant ist. • (B2’) Sprecher glaubt, dass “Sagen, dass p , obwohl Hörer glaubt, dass p ” in der Äußerungssituation besondere Relevanz hat. • (B3) Sprecher glaubt, dass Hörer nicht glaubt, dass p ( p ist für Hörer nicht bereits bekannt). • (B3’) Sprecher glaubt, dass Hörer glaubt, dass p . • (B4) Sprecher glaubt, dass Hörer keinen Grund hat, zu bezweifeln, dass p . • (B4’) Sprecher glaubt, dass Hörer nicht ohne weiteres glauben wird, dass p . • (B5) Der Inhalt der Mitteilung hat eine besondere Relevanz. Für Informationen und Behauptungen gilt B3 - die Information ist für den Hörer neu. Konstatierungen hingegen sind durch B3’ und B2’ charakterisiert, der Hörer weiß also über p bereits Bescheid, doch gibt es einen guten Grund, p nochmals herauszustellen. Beispiele für solche Konstatierungen sind Wie Du weißt, trinke ich keinen Kaffee und Der neue Tenor hat ja einen Bart. Informationen und Behauptungen wiederum unterscheiden sich durch B4/ B4’. Die Information kann ohne weitere Umstände übermittelt werden, weil der Sprecher voraussetzt, dass sie vom Hörer nicht in Zweifel gezogen werden wird (B4). Anders bei der Behauptung (B4’), die genau dadurch gekennzeichnet ist, dass der Sprecher sich darüber klar ist, etwas möglicherweise Kontroverses zu äußern, das in der einen oder anderen Form der Untermauerung bedarf. Alle drei Typen von W-Aussagen lassen sich weiter untergliedern, was Motsch allerdings nur für die Informationen ansatzweise ausführt. Der häufigste Fall ist die Mitteilung, für die die Bedingungen B1-B4 gelten; andere sind dann durch zusätzliche Bedingungen gekennzeichnet. So gilt für das Bekannt geben etwa B5 - eine Bedingung, die allerdings interpretationsbedürftiger ist als die anderen. Beispiele sind die Bekanntgabe von Entscheidungen, wichtigen Daten oder Regelungen. Für die übrigen Subtypen von Informationen gelten ähnliche spezifische Bedingungen, auf die wir hier nicht weiter eingehen. 9 Die Bedingungen weisen Ähnlichkeiten zu den von Grice (1975) formulierten Konversationsmaximen auf, worauf Motsch allerdings keinen Bezug nimmt. 7.4. Inventar von Illokutionen 125 Die sprachliche Form gibt häufig kein explizites Signal für den vorliegenden Typ von W-Aussage, vielmehr muss die Hörerin ihn erschließen. Dies setzt voraus, dass der Sprecher zutreffende Annahmen über das von beiden Kommunikationspartnern geteilte Wissen macht. In der gesprochenen Sprache können die Unterschiede zum Teil durch die Prosodie angedeutet werden, in der geschriebenen Sprache stehen andere Mittel zur Verfügung, wie die Benutzung von Partikeln: Das ja im o. g. Beispiel einer Konstatierung zeigt an, dass der Sprecher die Proposition als bereits bekannt ansieht. Die epistemischen Aussagen (Ep-Aussagen) werden von Motsch in vier Gruppen geteilt. Mit einer Vorhersage äußert sich der Sprecher zu einem zukünftigen Sachverhalt, der nicht bereits evident ist. Wenn der Sprecher nicht erwartet, dass sich die Hörerin der Vorhersage sogleich anschließt, liegt der Sonderfall der Prognose vor, für die wieder eine Relevanzbedingung (analog zu B2) und eine “Überzeugungsbedingung” (analog zu B4’) gelten. Die Aufrichtigkeitsbedingung lautet hier “Sprecher hält p für wahrscheinlich.” Diese drei Bedingungen haben die Prognosen mit den Hypothesen gemeinsam, die sich allerdings nicht auf künftige Sachverhalte, sondern die Wahrscheinlichkeit eines bereits stattgefundenen (oder zeitlosen) Sachverhalts beziehen. Sie ähneln den oben besprochenen Behauptungen. Motsch nennt das Beispiel Es gibt nur zwei Wortarten, Verben und Nomen, das den Status einer Hypothese hat und vom Sprecher sicherlich begründet werden müsste. Bei Vermutungen geht der Sprecher davon aus, dass die Hörerin keine Einwände gegen die vorgebrachte Wahrscheinlichkeitsbewertung von p haben wird. Sie weisen damit Ähnlichkeit zum o. g. Typ der Informationen auf. Annahmen schließlich ähneln den Konstatierungen und betrachten Sachverhaltsbeschreibungen als wahre Aussagen, um auf dieser Grundlage eine Hypothese zu überprüfen. Beispiel: Angenommen, dass es heute nacht regnet. Dann wird unser neues Zelt ja sofort nass! Die Festlegung der Illokutionen von EDUs stellt die erste Stufe einer handlungsorientierten Textanalyse dar: Haben wir jeweils identifiziert, welche Funktion die einzelnen EDUs innehaben, so können wir anschließend über ihr Zusammenspiel entscheiden, also die Rolle der einzelnen EDUs für den Text betrachten. Die zu Beginn des Kapitels eingeführten Stützungsbeziehungen sind ein Ansatz dafür, die im nächsten Kapitel zu betrachtenden Kohärenzrelationen sind ein zweiter. Zunächst aber illustrieren wir die Analyse der einzelnen Illokutionen anhand eines Beispieltexts, gezeigt in Abb. 7.10. Als Kategorien legen wir dabei einerseits die von Motsch (1987) vorgeschlagenen Typen von Feststellungen, andererseits die von Schmitt (2000) genannten Direktiva, Relationata und Identifikativa zugrunde. Der Text beginnt mit zwei Bewertungen (also Val-Aussagen) in [1-2], die der Autor als unkontrovers voraussetzt, denn aus ihnen gewinnt er in [3-4] die zentrale These des Kommentars. Auch diese beiden sind Meinungsäußerungen, doch steht hier wohl der Aufforderungscharakter im Vordergrund, wie sich in den verwendeten Modalverben darf und muss zeigt; daher scheint eine Analyse als fakultative Direktiva angemessen. [5] ist eine weitere Val-Aussage, die von [6-9] abgestützt wird. Dabei sind [6] und [7] Behauptungen - die erste relativ vage, die zweite so 126 7. Von Illokutionsstruktur zu Argumentationsstruktur Soll Berlin sich um Olympia 2016 bewerben? [1] Hamburg hat es längst begriffen: Olympia ist Gold wert. [2] Wer die Spiele in die Stadt holt, steht im weltweiten Wettstreit um Aufmerksamkeit auf dem Siegertreppchen. [3] Darum darf Berlin die Chance auf Olympia 2016 jetzt nicht verspielen. [4] Die Hauptstadt muss den Staffelstab von Leipzig übernehmen und sich als Austragungsort bewerben. [5] Barcelona hat gezeigt, dass der olympische Effekt unbezahlbar ist. [6] Mit den Spielen 1992 hat sich die Stadt neu erfunden - [7] und macht bis heute Gewinn. [8] Die Zahl der Übernachtungen hat sich verdoppelt, [9] die Wirtschaft profitiert noch immer. [10] Wenn sich Berlin nun im zweiten Anlauf bewirbt, zeigen wir der Welt, dass wir es besser können als einst. [11] Schließlich bringt die Stadt heute mit, was ein Kandidat braucht: Metropolenflair, Hotelbetten, Infrastruktur. [12] Die für Olympia 2000 konzipierten Sportstätten wie das Velodrom und die Max-Schmeling-Halle stehen, das Olympiastadion ist so gut wie neu, die Anschutz-Arena kommt. [13] Schon durch die erneute Bewerbung würde sich Berlin modernisieren und international profilieren. [14] Staatliche und private Gelder könnten fließen, Millionenzuschüsse vom IOC würden folgen. [15] Und selbst, wenn schon 2012 eine europäische Metropole Ausrichter werden sollte: [16] Man muss die Muskeln früh spielen lassen, um die Spiele, wenn nicht mit der zweiten, dann eben mit der dritten Bewerbung in die Stadt zu holen. [17] Berlin an die Startblöcke: Achtung, fertig, los! (Der Tagesspiegel, 23.5.2004) Abbildung 7.10.: Beispieltext Olympia konkret, dass sie ihrerseits abgestützt wird, nämlich mit den Mitteilungen in [8- 9] (dies sind “objektive”, überprüfbare Angaben). Von [10] an geht der Autor auf das mögliche Gegenargument der gescheiterten Berliner Bewerbung im Jahr 2000 ein. Den Anfang macht die Val-Aussage [10] (wir können es heute besser), welche durch die Behauptung [11] gestützt wird (wir haben, was man braucht). Sie wird ihrerseits durch die Mitteilung [12] ergänzt und gestützt. Dass sich die Stadt modernisieren und profilieren würde [13], kann als Behauptung gedeutet werden, die durch eine konkretere Vorhersage [14] gestützt wird. Zum Abschluss knüpfen [15- 17] mit ihrem Appellcharakter (fakultative Direktiva) noch einmal an die zentrale These [3-4] an. Das mögliche Gegenargument [15] wird von [16] beiseite gewischt, und [17] liefert einen olympisch-rhetorisch angemessenen Ausklang. 7.5. Fazit 127 7.5. Fazit Am Anfang der Beschäftigung mit Illokutionsstrukturen steht die Einsicht, dass wir mit Sprache handeln, also zielorientiert etwas tun, das Veränderung bewirken soll - in diesem Fall beim Adressaten des Sprechakts. Der Transfer dieser Einsicht zur Aufgabe der Textanalyse umfasst zwei Schritte: das Festlegen eines Inventars möglicher Illokutionen und die Untersuchung der Strukturbildung durch Beziehungen zwischen Textsegmenten bzw. den ihnen zugrunde liegenden Illokutionen. Letzteres entspricht der Bildung komplexer Handlungen, die von Textsegmenten und schließlich dem gesamten Text vollzogen werden. Umgekehrt betrachtet: Das dem Text zugeschriebene Gesamtziel soll durch eine Verkettung von Teilzielen erreicht werden. Als die wesentliche Beziehung haben wir hier die Stützung (oder in entgegengesetzter Richtung die Dominanz) besprochen, und für die Strukturbildung haben wir die beiden Alternativen diskutiert, entweder ganzen Textsegmenten interpretativ eine Illokution zuzuweisen (die nicht mit der Illokution eines beteiligten Segments identisch sein muss) oder aber sich weitgehend auf Abhängigkeiten zwischen den Illokutionen von EDUs zu beschränken. Im Gegensatz zu den Textstruktur-Ebenen der früheren Kapitel müssen wir uns jetzt vergegenwärtigen, dass eine Illokutionsstruktur nicht für jeden Text(abschnitt) eine angemessene Beschreibung ist. Während Koreferenz, Thematizität und Tempus in jedem Text wohl zwangsläufig vorgefunden werden und beschrieben werden können, ist die Handlungsperspektive nicht immer die adäquate: Fiktionale Texte beispielsweise erzählen uns etwas, beabsichtigen damit vielleicht auch etwas, aber eine Illokutionsstruktur im hier beschriebenen Sinne wäre recht langweilig, weil jedes Segment berichtet und der Text als Ganzes ebenfalls berichtet. Dass auf einer übergeordneten Ebene eine literaturwissenschaftliche Analyse möglich oder geboten ist, ist natürlich unbestritten, hat jedoch mit der hier diskutierten Illokutionsstruktur wenig zu tun. Die Relevanz der Illokutionsstruktur können wir mit unseren in Kapitel 3 eingeführten Texttypen charakterisieren: Es sind vornehmlich die argumentativen und die instruktiven Texte, die eine “interessante” Illokutionsstruktur aufweisen, denn genau diese Texte verfolgen das klare Ziel, die Leser zu überzeugen oder zu einem bestimmten Handeln zu motivieren. Ein zweiter Unterschied zu den zuvor beschriebenen Ebenen besteht darin, dass eine Illokutionsanalyse in höherem Maße subjektiv ist: Wir decken ja beim Lesen nicht die “wahren” Intentionen der Autorin auf, sondern wir schreiben ihr welche zu, in der Annahme, dass es auch die “wahren” sind. Die sprachliche Oberfläche determiniert diese Zuschreibung nicht, sondern schränkt sie lediglich ein, gibt uns Hinweise - mehr dazu in Kapitel 9. Will man präzise Annotationsrichtlinien für die Illokutionsstruktur angeben, so ist dies eine Gratwanderung: Einerseits darf die Intuition der Annotatorin nicht zu stark eingeschränkt werden - sie soll den Text möglichst “natürlich” verstehen und annotieren; andererseits muss eine Vergleichbarkeit unterschiedlicher Analysen hergestellt werden, was zumindest ein identisches Inventar von Illokutionen und gewisse Prinzipien für die Strukturbildung voraussetzt. 128 7. Von Illokutionsstruktur zu Argumentationsstruktur 7.6. Annotation von Illokutionsstruktur im Korpus Es existieren bislang keine mit Illokutionsstruktur annotierten Korpora, und auch kaum konkrete Vorschläge für Annotationsschemata. Den wohl interessantesten Schritt in dieser Richtung hat bislang Schmitt (2000) unternommen, der auch eine ganze Reihe von Textanalysen vorgelegt hat (freilich “auf Papier”). Annotationsrichtlinien für die Gewinnung von intersubjektiv nachvollziehbaren Analysen können darauf aufbauen und die in Abschnitt 7.4 genannten Illokutionen für EDUs weiter verfeinern und präzisieren, und dann mit den in Abschnitt 7.2.2 genannten Stützungsbeziehungen verbinden. Ein Software-Werkzeug zur Erstellung von Analysen der Illokutions- oder der Argumentationsstruktur muss die Bildung von größeren Segmenten und deren Hierarchisierung unterstützen und anschaulich darstellen, ggf. auch die Benennung von Relationen zwischen Segmenten. Ein Schichten-orientiertes Werkzeug wie Exmaralda (s. S. 89) kann im Prinzip für die Hierarchisierung genutzt werden, doch wird die Darstellung schnell unübersichtlich, sobald die Ebenen sich über mehrere Sätze erstrecken. Für die Annotation hierarchischer Textstrukturen leistet stattdessen das RSTTool gute Dienste, das wir am Ende des nächsten Kapitels vorstellen werden. 7.7. Weiterführende Literatur Es gibt zahlreiche Einführungen in die Pragmatik; empfohlen sei hier die Darstellung der theoretischen Grundlagen von Sprechhandlungen von Harras (2004), die im ersten Teil auch einen Überblick über Analytische Handlungstheorie (unabhängig von Sprache) vermittelt. Das in Abschnitt 7.2.1 erwähnte Buch von Schröder (2003) diskutiert neben der Handlungsstruktur auch Bezüge zur thematischen Struktur und geht auf die Realisierungsformen von Texthandlungen an der sprachlichen Oberfläche ein. Ein ähnliches Ziel, jedoch stärker fokussiert auf die Illokutionsstruktur, verfolgt Schmitt (2000), der anhand vieler Textuntersuchungen ein Inventar von Illokutionstypen vorschlägt und auch einige Hinweise für ihre Identifizierung im Text angibt. Neben diesen Monographien sei als kompakte Darstellung der handlungsbezogenen Analyse von Sprache und Texten der Beitrag von Motsch (2000) im ‘Handbuch zur Sprach- und Kommunikationswissenschaft’ empfohlen, sowie speziell zur Ausdifferenzierung von Illokutionstypen der im Kapitel bereits zitierte Artikel (Motsch, 1987). 7.8. Übungsaufgaben 1. Gliedern Sie Ihren Kommentar in Sätze oder Teilsätze, denen jeweils eine einzelne Illokution entspricht (EDUs). Gehen Sie dabei intuitiv vor (das Problem der Segmentierung wird in Kapitel 9 genauer behandelt). Anschließend 7.8. Übungsaufgaben 129 weisen Sie jeder EDU eine Illokution zu, nach dem in Abschnitt 7.4 vorgeschlagenen Inventar (Kombination aus (Schmitt, 2000) und (Motsch, 1987); siehe auch Abb. 9.1 auf S. 159). 2. Welche Stützungsbeziehungen (Abschnitt 7.2.2) können Sie zwischen den Illokutionen der EDUs erkennen? Weisen Sie dem Text eine Illokutionsstruktur (im Sinne von Brandt/ Rosengren oder Schmitt) zu. 3. Erweitern Sie die Illokutionsstruktur jetzt zu einer Argumentationsanalyse nach Freeman (1991). 4. Erstellen Sie abschließend eine Analyse nach dem Ansatz von Schröder (2003), also mit ‘Teiltexthandlungen’, die möglicherweise nicht direkt mit Illokutionen von EDUs übereinstimmen. Dann beurteilen Sie, welche der Analysen Ihrem Kommentar am besten gerecht wird. 8. Rhetorische Struktur (8.1) Mein Kater hat gestern die Chinesische Vase im Wohnzimmer umgeworfen. Sie zersprang in ein Dutzend Stücke. Ich war so traurig. Kannst Du mir zum Geburtstag nicht eine neue schenken? Dieser Text bezieht seine Kohärenz zum einen aus durchgehenden referenziellen Ketten, zum anderen aus einer klar ersichtlichen Abstützung der Illokution des letzen Satzes, dessen Aufforderung zum Schenken zuvor begründet wird. Darüber hinaus bestehen jedoch auch inhaltliche Zusammenhänge zwischen den ersten drei Sätzen, die wir mit dem Instrument der Illokutionsstruktur nicht erfassen können (weil Abstützung von Sprechhandlungen hier nicht das verbindende Element sind). So unterstellen wir bei der Lektüre problemlos und unterschwellig einen Zusammenhang der Kausalität zwischen dem ersten und dem zweiten Satz. Auch verstehen wir den Inhalt des dritten Satzes als Reaktion auf das zuvor beschriebene Ereignis, was wiederum keine Frage der Illokutionen und ihrer Stützungsbeziehungen ist. Wie also beschreiben wir Inhaltszusammenhänge in komplexen sprachlichen Äußerungen, in denen der Handlungsaspekt nicht unbedingt im Vordergrund steht? 1 8.1. Lokale Kohärenz durch Relationen zwischen Textsegmenten Wenn Kohärenz, wie von einigen Autoren formuliert, den “inneren Sinnzusammenhang” eines Textes bezeichnet, dann sollte eine Explizierung dieses Begriffs den Unterschied zwischen den folgenden Variationen von Beispiel 7.3 beschreiben können: (8.2) a Stefan fehlte heute im Sportunterricht. Er war krank. b Stefan fehlte heute im Sportunterricht. Er trägt am liebsten rote Pullover. Es sind nicht die Illokutionen, die hier eine Erklärung liefern können, sondern es geht um die inhaltlichen, semantischen Zusammenhänge zwischen den Sätzen. 1 Im letzten Kapitel haben wir darauf hingewiesen, dass in einer dependenzorientierten Illokutionsstruktur “Blockbildung” vorgesehen ist für Textabschnitte, die keine interne Handlungsstruktur aufweisen. Auch um die Binnenstruktur solcher Blöcke geht es nun in diesem Kapitel. 132 8. Rhetorische Struktur Intuitiv stellen wir fest, dass in Text [a] der zweite Satz eine Erläuterung oder Begründung des ersten Satzes liefert, weshalb wir beide Sätze problemlos als kohärent wahrnehmen. Für Text [b] ist dies sehr viel schwieriger; wir stutzen und lehnen dann den “Text” entweder ab oder konstruieren mit Mühe einen Kontext, in dem beide Sätze in der Tat nebeneinander stehen können und einen bestimmten inhaltlichen Zusammenhang aufweisen. Die dafür nötige Mühe zeigt uns auch noch einmal, dass Koreferenz eben nicht ausreichend ist, um einen Text kohärent zu machen - in [b] liegt es zwar sehr nahe, das Pronomen des zweiten Satzes auf Stefan zu beziehen, doch ist damit die Kohärenz noch keineswegs hergestellt. Wichtig ist an Beispiel 8.2 außerdem, dass die Information über die Art des Zusammenhangs weder in [a] noch in [b] explizit im Text gegeben wird; vielmehr ist es Aufgabe der Leserin, sich diesen Zusammenhang zu erschließen. Grundlage dafür ist unser Weltwissen, das uns für [a] die genannte Interpretation des Zusammenhangs - Erläuterung, Begründung - unmittelbar nahelegt. Dass Textverstehen in dieser Weise als Wechselspiel zwischen der Aufnahme von Information aus dem Text und dem Herantragen von Vorwissen an den Text aufzufassen ist, dürfte weitgehend unbestritten sein; die weiter gehende und durchaus strittige Frage ist dann jedoch die nach dem Inventar möglicher Sinnzusammenhänge, die zwischen Sätzen (oder Textabschnitten) bestehen können. Lässt es sich vollständig, und dabei möglichst systematisch, beschreiben? Grosz und Sidner (s. Abschnitt 7.2.1) hatten diese Frage explizit mit “nein” beantwortet — die Menge möglicher Sinnzusammenhänge sei prinzipiell unendlich und der Versuch einer Aufzählung mithin zum Scheitern verurteilt. Ein früher Vertreter der Gegenposition war Grimes (1975), der eine Reihe von “rhetorischen Prädikaten” vorschlug, die die Rolle eines Segmentes für den gesamten Text benennen; dazu zählten beispielsweise ‘Analogy’ oder ‘Example’. Diese Idee wurde in etlichen späteren Arbeiten zu systematischeren Konzeptionen von zweistelligen Relationen ausgebaut, die wir hier Kohärenzrelationen nennen. 2 Dem liegt die These zugrunde, dass ein Satz - genauer: eine minimale Einheit der Textstruktur (EDU) - im allgemeinen Fall nicht eine ausgezeichnete Rolle relativ zum gesamten Text spielt (wie im Fall der einstelligen Relation bzw. des rhetorischen Prädikats), sondern relativ zu einer benachbarten EDU oder einem längeren Textabschnitt. EDUs tragen danach nicht individuell zur Gesamtheit der Textinformation bei, sondern gehen eine Verbindung mit ihren Nachbarn ein. Damit wird lokale Kohärenz, in Gestalt solcher Relationen, zum Pendant der Kohäsion: Während kohäsive Mittel die Textsegmente an der Oberfläche miteinander verbinden (siehe Kapitel 2), bezeichnet die Kohärenzrelation die Art des “tieferen” bzw. “inneren” Zusammenhangs zwischen den ausgedrückten Propositionen. In Weil die Vase vom Tisch fiel, zerbrach sie in hundert Stücke stiften das Pronomen und der Konnektor weil die Kohäsion, und letzterer zeigt den kausalen Zusammenhang zwischen beiden EDUs an. In einem Beispiel wie diesem kann der Konnektor jedoch auch implizit bleiben, weil die Leser die zugrunde liegende Kohärenzrelation unmittelbar 2 Andere Termini in der Literatur sind discourse relation, rhetorical relation und die deutschen Entsprechungen dazu. 8.1. Lokale Kohärenz durch Relationen zwischen Textsegmenten 133 erschließen können: Die Vase fiel vom Tisch. Sie zersprang in hundert Stücke. Um über einen rein intuitiven Begriff hinaus zu gelangen, muss eine Konzeption von Kohärenzrelationen drei (eng zusammenhängende) Fragen beantworten: (1) In welcher Weise, auf welcher Beschreibungsebene, mit welchem Erklärungsziel sollen solche Relationen definiert werden? (2) Welche Menge von Relationen kann erschöpfend beschreiben, welche Arten von Zusammenhängen in Texten möglich sind? (3) Welche Art von Struktur ergibt sich durch Zuweisung der einzelnen Relationen insgesamt für den Text? 8.1.1. Definitionsgrundlage Die Tatsache, dass es in der Literatur eine Vielzahl sehr unterschiedlicher Vorschläge für Inventare von Kohärenzrelationen gibt, belegt das methodische Problem, ein solches Inventar zu rechtfertigen. Einige Autoren entwickeln es primär durch Introspektion: Eine bestimmte Menge von Sinnzusammenhängen erscheint einleuchtend und lässt sich jeweils durch sprachliche Beispiele illustrieren - womit allerdings keine Vollständigkeit angestrebt werden sollte. Ein zweiter Weg besteht darin, sich von sprachlichen Phänomenen leiten zu lassen, eine Kohärenzrelation also dann zu definieren, wenn das Sprachsystem Evidenz für sie liefert. Dabei handelt es sich zum einen um lexikalische Einheiten, vor allem um die Konnektoren einer Sprache. So geben viele Grammatiken für das Deutsche semantisch motivierte Klassen von Konnektoren an. Zwei einfache Beispiele sind das als ‘konzessiv’ zu klassifizierende trotzdem und das eine temporale Abfolge signalisierende seitdem (mehr zu Konnektoren in Abschnitt 9.3). Dieses Vorgehen erscheint dementsprechend zunächst erheblich besser motiviert, birgt jedoch das Problem, dass die Mehrzahl der Sätze eines Textes keinen Konnektor enthält - ohne dass der Text dadurch weniger kohärent würde. Ein Inventar von Relationen sollte also auch Sinnzusammenhänge berücksichtigen, die nicht von Konnektoren angezeigt werden (es sei denn, man arbeitet mit der Hypothese, dass im Prinzip jede Satzverbindung durch einen Konnektor markiert werden könnte, sie lediglich oft überflüssig sind). Das Sprachsystem liefert Evidenz aber nicht nur unmittelbar durch Lexeme, sondern auch indirekt durch Oberflächenmerkmale, die Hinweise auf die semantische Struktur des Gesagten geben. Für einen Ansatz wie die Segmented Discourse Representation Theory (SDRT) (Asher u. Lascarides, 2003) sind es denn auch semantische Objekte, die die Argumente der Kohärenzrelationen bilden, und nicht die Zeichenketten an der Textoberfläche. Es gilt dann, für diese Objekte logisch fundierte Repräsentationen zu entwerfen und Inferenzregeln anzugeben, nach denen der Beitrag der Kohärenzrelation formal abgeleitet werden kann - einerseits durch Analyse syntaktischer Merkmale der zugrunde liegenden Sätze (etwa Tempus und Aspekt), andererseits durch Rückgriff auf axiomatisch repräsentiertes Weltwissen. Eine weitere Möglichkeit, Relationen zu begründen, besteht im Rückgriff auf psycholinguistische Experimente oder Modelle. So argumentieren Sanders u. a. (1992), dass Kohärenz - weil sie eben nicht immer mit kohäsiven Mitteln an der Textoberfläche einhergeht - letztlich “jenseits” des Textes erklärt werden muss und 134 8. Rhetorische Struktur dass als Beschreibungsebene dafür nur die mentale Repräsentation des Textinhalts in Frage komme. Die These ist dann, dass Kohärenzrelationen eine Rolle in diesen Repräsentationen spielen, also kognitiv relevant sind; und um dies zu belegen, seien psycholinguistische Experimente das probate Mittel. Der Grundgedanke ist also ähnlich wie beim formal-semantischen Vorgehen - man muss mit abstrakten Objekten arbeiten, nicht mit dem Text selbst -, doch besteht der Unterschied in der Art der Begründung dieser Objekte: Für die Semantiker ist es die Rolle des Objekts im größeren Zusammenhang eines Inferenzsystems auf der Basis formaler Logik, während die Psycholinguisten das Inventar experimenteller Methoden heranziehen, um Hypothesen über Existenz und Gestalt solcher abstrakter Objekte in unseren mentalen Repräsentationen zu stützen. Verbunden mit der Wahl der “Inspirationsquelle” für Kohärenzrelationen ist der zu wählende Rahmen für die Definitionen, der eher der Perspektive der (formalen) Semantik oder der Pragmatik entsprechen kann. Die semantische Sichtweise betont, dass durch einen Satz (bzw. eine EDU) eine Proposition vermittelt wird. Die interessante Eigenschaft des Textes ist aus dieser Sicht, dass er nicht allein die Summe der Propositionen der Sätze kommuniziert, sondern weitere Propositionen hinzutreten, die die Leserin durch Inferenzprozesse aktiv konstruiert - und dieser Vorgang, den wir in Beispiel 8.2 mit dem impliziten kausalen Bezug illustriert hatten, entspricht der Identifikation einer Kohärenzrelation und stellt gewissermaßen ihren “Mehrwert” dar, weil sie zur expliziten Information des Textes weiteres hinzufügt. Vertreter dieser Sicht sind beispielsweise Hobbs (1979), Kehler (2002) und Asher u. Lascarides (2003). Als Beispiel sei hier die Definition der Relation ‘Explanation’ von (Kehler, 2002, S. 21) genannt. S 1 und S 2 sind die beiden EDUs, P und Q sind Propositionen. Explanation: Infer P from the assertion of S 1 and Q from the assertion of S 2 , where normally Q → P . Kehler nennt dafür die Textbeispiele George is dishonest because he’s a politican und George is dishonest. He’s a politician. ‘Explanation’ zählt damit zu den Relationen, die durch einen Konnektor angezeigt werden können, aber nicht müssen. Eine primär pragmatische Orientierung rückt dagegen die Intention der Sprecherin in den Vordergrund, die jeder EDU zugeschrieben werden kann und die vom Leser identifiziert werden muss. Es geht mithin um den beim Leser zu erzielenden Effekt: Er soll nach Lektüre der EDU etwas Neues glauben, etwas gut oder schlecht finden, etc. Hier ist dann die These, wie im letzten Kapitel ausgeführt, dass diese Intentionen in hierarchischen Beziehungen zueinander stehen, es also auch eine Gesamtintention des Textes gibt. Die ‘Rhetorical Structure Theory’ (Mann u. Thompson, 1988) mit ihrem konkreten Vorschlag solcher Intentionen und Relationen, die wir in Abschnitt 8.2 ausführlicher vorstellen, ist primär vor diesem Hintergrund entstanden. Eine methodische Frage, die von der Wahl zwischen Semantik- oder Pragmatik- Perspektive unabhängig ist, betrifft den Grad der Verzahnung der Relationen miteinander. In den meisten Ansätzen wird jede Relation einzeln definiert, so dass sich letztlich kein klares Kriterium für die Abgeschlossenheit der Relationsmenge 8.1. Lokale Kohärenz durch Relationen zwischen Textsegmenten 135 ergibt. Die Alternative besteht darin, die Defintionen in eine Menge von geeigneten Attribut/ Wert-Paaren zu dekomponieren. Die Menge der möglichen Kombinationen dieser Paare bestimmt dann, was als Kohärenzrelation überhaupt auftreten kann, insofern ist dieser Ansatz methodisch eleganter und auch “mutiger”. Diesen Weg gingen Sanders u. a. (1992) und Bateman u. Rondhuis (1997). Sanders u. a. begründen ihr Vorgehen mit dem Ziel der psychologischen Plausibilität: Es müsse eine überschaubare Menge kognitiver Primitive geben, aus denen sich Relationen zusammensetzen, und die aber auch unabhängig von ihrer Verwendung in Kohärenzrelationen eine Rolle in der Kognition spielen. Sie schlugen diese vier Primitive vor: • Basisoperation: additiv / kausal Die zugrunde liegende prätheoretische Intuition ist, dass EDUs entweder nur locker (additiv) oder eng (kausal) verbunden sind; im ersten Fall kann der Leser lediglich die Propositionen p und q der EDUs ableiten, im zweiten Fall darüber hinaus eine Implikation p → q (dies ist aber nicht im engeren Sinn konditional gemeint, sondern Relevanz-orientiert). • Quelle der Kohärenz: semantisch / pragmatisch Bei einer semantischen Relation besteht der Zusammenhang zwischen den Propositionen der EDUs, bei einer pragmatischen Relation zwischen ihren Intentionen bzw. Illokutionen. 3 Ein Beispiel für eine pragmatische Relation ist: Das Bier ist im Kühlschrank. Ich habe viel zu tun. Es kann paraphrasiert werden als Das Bier ist im Kühlschrank. Ich sage das, weil ich viel zu tun habe. (= Bitte hole es dir selbst.) • Lineare Anordnung der EDUs: elementar / nicht-elementar Dieses Merkmal ist nur in Verbindung mit kausalen Relationen möglich und bezeichnet die Unterscheidung, ob die EDU, die das p aus p → q ausdrückt, im Text der q -EDU vorangeht (elementar) oder umgekehrt (nicht-elementar). • Polarität: positiv / negativ Dieses Merkmal wird von Sanders et al. nicht sehr gründlich definiert, kann aber so umschrieben werden, dass in der Definition der Relation entweder eine Negation enthalten ist oder nicht; zudem gehe die Unterscheidung mit verschiedenen Konnektoren einher: and, because signalisierten positive, although, but hingegen negative Relationen. Eine der möglichen Kombinationen dieser Merkmale ist dann beispielsweise causal + pragmatic + basic order + positive, was nach Sanders et al. der Relation ‘Argument- Claim’ entspricht: Zunächst wird eine Aussage getroffen, dann eine Behauptung aufgestellt, welche von der Aussage gestützt wird. Die Autoren nennen folgendes Beispiel: Nests or dead birds may clog up chimneys. Therefore, have your chimney checked once a year and swept when necessary. 3 Siehe dazu auch (Knott, 2001). 136 8. Rhetorische Struktur Die Dekomposition in Primitive ist ein attraktiver, aber auch sehr ambitionierter Ansatz, denn es gilt, die richtige Zahl von Primitiven zu finden, diese jeweils individuell zu motivieren (sie sollen eine belegbare kognitive Relevanz haben) und dann zu zeigen, dass die Kombinationen der Attribut/ Wert-Paare Kohärenzrelationen entsprechen - was wiederum zwei Aspekte hat: Einerseits sollte jede Relation, die aus “externen” Gründen sinnvoll erscheint (zum Beispiel, weil die Sprache Konnektoren bereitstellt, die sie signalisieren), auch als Attribut/ Wert-Paar darstellbar sein. Zum anderen sollte zumindest theoretisch jeder möglichen Kombination von Werten auch eine Relation entsprechen; falls dies für eine bestimmte Kombination nicht zutrifft, so müsste das zumindest gut begründbar sein. 8.1.2. Inventar Die Frage nach der Motivation des Inventars von Kohärenzrelationen hängt natürlich von der gewählten Antwort auf die Frage nach der Definitionsgrundlage ab. Wenn man sich auf das schwierige Problem der Dekomposition von Definitionen in eine überschaubare Merkmalsmenge nicht einlassen möchte, so hat man zunächst die Möglichkeit, die methodische Herausforderung der Gründlichkeit gar nicht anzunehmen, sondern sich mit der Angabe einer jeweils “nützlichen” Menge von Relationen zu bescheiden, ohne dabei einen Anspruch auf Vollständigkeit zu erheben. Diesen Weg geht etwa die im nächsten Abschnitt zu beschreibende Rhetorical Structure Theory (RST) (Mann u. Thompson, 1988), deren Entwickler eine recht große Zahl verschiedener Texte analysiert haben und deren Relations- Inventar sich für eben diese Texte als hinreichend herausgestellt hat, was freilich nicht bedeutet, dass künftige Untersuchungen weiterer Texte nicht das Postulieren weiterer Relationen nahelegen können. Interessanterweise ist das von Mann und Thompson vorgeschlagene Inventar in der seither sehr regen Diskussion um RST nur sehr geringfügig erweitert worden, hat sich also als recht aussagekräftig erwiesen. Ein zweiter Weg besteht im systematischen Rückgriff auf die sprachlichen Kohäsionsmittel: Knott u. Dale (1994) erstellen zunächst ein Inventar der Konnektoren des Englischen und führen dann systematische Ersetzungsproben durch, um festzustellen, welche Konnektoren unter welchen Umständen, also in welchen Kontexten, wechselseitig ausgetauscht werden können, ohne dass sich die Bedeutung des Satzes wesentlich verändert. Auf diesem Weg lässt sich beispielsweise zeigen, dass obwohl und obschon immer austauschbar sind, mithin die gleiche Relation signalisieren. Demgegenüber scheint das Verhältnis zwischen aber und obwohl eines der Subsumtion zu sein: Mit obwohl ausgedrückte konzessive Zusammenhänge können in aller Regel auch mit aber ausgedrückt werden, doch kann aber auch noch andere Rollen spielen, etwa die der kontrastiven Gegenüberstellung. 4 Aus der so entstehenden Taxonomie von Konnektoren kann dann eine Menge von Relationen abgeleitet werden - die aber eben nur solche Relationen enthält, die auch durch sprachliche Konnektoren realisiert werden können. Das Bild bleibt daher unvoll- 4 Zur Methodik der Ersetzungstests zur Motivation von Kohärenzrelationen siehe Abschnitt 9.3.3. 8.1. Lokale Kohärenz durch Relationen zwischen Textsegmenten 137 ständig, doch hat dieser Ansatz den Vorteil der Reproduzierbarkeit, zumindest insoweit die Ersetzungsproben intersubjektiv nachvollziehbar sind (Knott und Dale haben dies nicht experimentell überprüft, sondern vertrauten ihrer eigenen Intuition). 5 Neben der Sprache kann aber auch das Forschungsparadigma bzw. der zugrunde liegende Formalismus die Wahl eines Relationsinventars beeinflussen. So liegen die Wurzeln der SDRT (Asher u. Lascarides, 2003) in der formalen Semantik, genauer in dem Bestreben, die semantischen Satzanalysen der Diskursrepräsentationstheorie (Kamp u. Reyle, 1993) auf der Diskursebene auch unter Einsatz von Kohärenzrelationen fortzuführen. Der Vorzug ist, dass die Relationen relativ präzise definiert werden, da auch ein Kalkül für ihre Ableitung in Repräsentationen des Kontexts mitgeliefert wird. Das bedeutet aber auch, dass man sich auf solche Relationen konzentriert, für die eine solch präzise Definition überhaupt möglich ist. So spielen beispielsweise Erwägungen über Sprecherziele (die im Zentrum der Illokutionsstrukturen des letzten Kapitels stehen) in der SDRT bewusst keine Rolle, da sie sich einer Formalisierung weitgehend entziehen. Ein letzter Weg schließlich ist der Rückgriff auf benachbarte Forschungsdiziplinen, die für die Untersuchung der Fragestellung möglicherweise schon auf eine längere Tradition zurückblicken können. So beruft sich Kehler (2002) beim Vorschlag seiner insgesamt 14 Relationen auf die von David Hume vorgeschlagenen Arten von “connections among ideas” und sortiert sie in diese Kategorien: • Resemblance: Es werden die Gemeinsamkeiten, Unterschiede oder das Verhältnis der Generalisierung/ Spezialisierung zwischen zwei Aussagen herausgestellt. • Cause-Effect: Eine Aussage wird als Grund, die andere als Folge interpretiert. • Contiguity: Teile derselben Situation werden beschrieben und als zusammengehörig interpretiert, z. B. als temporal aufeinanderfolgend. Für die Unterteilung einer Liste von Relationen spielen neben diesem inhaltlichen Kriterium weitere Faktoren eine Rolle. Die Einteilung in semantische versus pragmatische Relationen, die wir oben bei der Besprechung von Sanders et al. sahen, gibt es in ganz ähnlicher Form, wenn auch unter verschiedenen Bezeichnungen, bei den meisten Ansätzen, die die Aufgabe primär aus der pragmatischen Perspektive angehen. Bei eher linguistisch/ semantischen Ansätzen ist eine andere Unterscheidung relevanter, nämlich die zwischen unterordnenden und nebenordnenden Relationen, so wie unten in 8.3 beschrieben. 5 Einen interessanten Schritt in die Richtung plausiblerer Begründung von Kohärenzrelationen gingen Knott u. Sanders (1998) mit ihrer Arbeit, in der die Idee der Dekomposition (Sanders) mit der Konnektor-basierten Herangehensweise (Knott) verknüpft wird zu einer sprachübergreifenden Betrachtung englischer und niederländischer Konnektoren. 138 8. Rhetorische Struktur 8.2. Von lokalen Relationen zu globalen Strukturen Die Idee der Kohärenzrelation wächst mit unserem Thema der Textstruktur zusammen, wenn man davon ausgeht, dass solche Relationen nicht nur lokal zwischen benachbarten EDUs, sondern dann auch rekursiv zwischen immer größeren (wiederum benachbarten) Textabschnitten bestehen — womit sich eine Hierarchisierung des Texts ergibt. Von den Vorschlägen, die dies umsetzen, stellen wir nun die Rhetorical Structure Theory (RST) (Mann u. Thompson, 1988, Matthiessen u. Thompson, 1988) etwas ausführlicher vor, weil sie explizit aus einer empirischen, korpusbasierten Perspektive heraus entwickelt wurde und im Prinzip für beliebige Texte verwendbar sein soll. Nach ausgedehnten Analysen unterschiedlicher englischsprachiger Texte schlugen Mann, Matthiessen und Thompson Relationen und Konstruktionsprinzipien vor, mit denen einem Text eine Baumstruktur zugewiesen wird, die dann als Indiz seiner Kohärenz zu betrachten ist. Die Konstruktionsprinzipien sind als eine Reihe von Anwendungsschemata für die Relationen beschrieben, und besagen vor allem, dass Relationen immer nur zwischen unmittelbar benachbarten Segmenten (EDUs oder größeren Textabschnitten) bestehen. Die dem zugrunde liegende These besteht darin, dass (global) kohärente Texte keine inhaltlichen “Lücken” (nonsequiturs) aufweisen: Jede EDU spielt ihre Rolle im Text, indem sie zu einer benachbarten EDU oder einem benachbarten größeren Segment in einer Kohärenzrelation steht. Am Ende wird die Wurzel des RST-Baums von einer überspannenden Relation gebildet, die dann auch die grobe Gliederung des Textes angibt. Kreuzende Kanten sind in diesem Baum nicht erlaubt. Dies sind also recht enge formale Vorgaben für die erlaubten Strukturen (was ein Grund für die Popularität von RST in der Computerlinguistik ist). Eine RST-Struktur unterscheidet sich also hinsichtlich ihres Status fundamental von allen anderen, die wir in den früheren Kapiteln besprochen haben: Die früheren waren klar auf eine unter vielen Ebenen beschränkt und erhoben zum Teil auch nicht den Anspruch, für den gesamten Text relevant zu sein. Theorien der Diskursstruktur wie RST hingegen treten an, um “die” Textstruktur zu erfassen - Kohärenzrelationen werden als das ganz zentrale Merkmal von Textualität angesehen, und einige andere Phänomene aus früheren Kapiteln werden auch durch Kohärenzrelationen modelliert, was wir später noch bewerten werden. Eine wichtige Annahme der RST ist die der Nuklearität: Nahezu alle Relationen verbinden nicht zwei “gleichgewichtige” Segmente, sondern ein für die Relation zentrales Segment, den ‘Nukleus’, mit einem weniger wichtigen, unterstützenden Segment, dem ‘Satelliten’. Beispiele sind in Abb. 8.1 zu sehen, aus der auch das Muster der Relationsdefinitionen ersichtlich ist. Jede Definition hat: • einen Effekt, der beim Leser durch die Verwendung der Relation erzielt werden soll; • Beschränkungen für Nukleus und Satellit, d.h., Bedingungen, die erfüllt sein müssen, damit die Relation verwendet werden kann; 8.2. Von lokalen Relationen zu globalen Strukturen 139 Contrast constraints on N: multi-nuclear constraints on the combination of nuclei: no more than two nuclei; the situations presented in these two nuclei are (a) comprehended as the same in many respects, (b) comprehended as differing in a few respects and (c) compared with respect to one or more of these differences the effect: reader recognizes the comparability and the difference(s) yielded by the comparison being made locus of the effect: multiple nuclei Antithesis constraints on N: writer has positive regard for the situation presented in N constraints on S: none constraints on the N+S combination: the situations presented in N and S are in contrast (cf. Contrast definition); because of an incompatibility that arises from the contrast, one cannot have positive regard for both the situations presented in N and S; comprehending S and the incompatibility between the situations presented in N and S increases reader ’s positive regard for the situation presented in N the effect: reader ’s positive regard for N is increased locus of the effect: N Evidence constraints on N: reader might not believe N to a degree satisfactory to writer constraints on S: reader believes S or will find it credible constraints on the N+S combination: reader ’s comprehending S increases reader ’s belief of N the effect: reader ’s belief of N is increased locus of the effect: N Abbildung 8.1.: Beispiele für RST-Definitionen nach Mann u. Thompson (1988) • analog dazu Beschränkungen für die Kombination von Nukleus und Satellit (die ja letztlich den “Mehrwert”, also den Kern der Kohärenzrelation ausmacht). Als Kriterium für die Nuklearitätsentscheidung bei einer Textanalyse geben Mann u. Thompson (1988) an, der Nukleus sei für die Ziele der Autorin von größerer Bedeutung (“more central to the writer ’s purposes”). Bezogen auf den Gesamttext wird als Indiz vorgeschlagen, dass die Satellit-EDUs eines Textes im Prinzip ausgelassen werden könnten, ohne dass er seinen wesentlichen Sinn verliere - der Text sollte im wesentlichen noch verständlich bleiben. Nuklei hingegen können nicht aus dem Text entfernt werden, ohne dass der Text inkohärent wird. In Mann u. Thompson (1988) werden zwei Dutzend Kohärenzrelationen definiert, deren Namen sich in Abb. 8.2 finden. 6 Dort ist zu sehen, dass einige Relationen als ‘multinuklear ’ verstanden werden: Für sie gilt die Nukleus/ Satellit- 6 Die Autoren haben diese Menge ausdrücklich als “offen” bezeichnet. In der Literatur wurden dann auch gelegentlich neue Relationen vorgeschlagen, von denen wahrscheinlich die Relation ‘List’ am 140 8. Rhetorische Struktur Unterscheidung nicht, sondern sie verbinden in der Tat gleichgewichtige Segmente. Der Unterschied lässt sich beispielsweise am Paar der Relationen Antithesis / Contrast identifizieren (Abb. 8.1), die einander recht ähnlich sind. Contrast stellt zwei Segmente gegenüber, um die Leserin auf Gemeinsamkeiten und vor allem Unterschiede aufmerksam zu machen, während Antithesis darüber hinaus eines der Segmente in den Vordergrund rückt, weil die Leserin dem Inhalt dieses Segments größere Wertschätzung beimessen soll. Für die Kausalrelation gilt, dass sie sich systematisch in vier Varianten aufteilt. Dafür ist einerseits das Merkmal ‘volitional’ verantwortlich, das prüft, ob das Resultat der Handlung absichtsvoll herbeigeführt wurde (Mensch betätigt Lichtschalter) oder nicht (Sturm entwurzelt Baum). Parallel dazu kann die Nuklearitätsentscheidung frei getroffen werden: Stuft man in der dargestellten Kausalbeziehung den Grund als für den Text (oder das Ziel der Autorin) “wichtiger” ein, wählt man eine Result Relation; ist hingegen die Folge wichtiger, wählt man eine Cause Relation. Ansonsten sind die Definitionen von Cause und Result identisch. Kausalität ist der einzige Fall, bei dem Nuklearität unabhängig von der Relationswahl entschieden werden kann; für alle anderen Relationen ist die Nukleus/ Satellit-Verteilung fest vorgegeben. Die Relationen sind also in der RST primär über die Intentionen des Textproduzenten und die beabsichtigten Effekte beim Leser definiert. Mann und Thompson verwenden dafür ein Vokabular, das Ziele wie “increase positive regard for X” oder “increase hearer ’s belief in X” verwendet. Freilich verfolgt nicht jede einzelne EDU ein solches Ziel — die Sprache hat oft ja auch eine reine Darstellungsfunktion. In diesem Fall lautet die Formulierung des Effekts der Relation “reader recognizes that X”. Hier geht es also nicht darum, Einstellungen des Lesers zu verändern, sondern ihm lediglich Informationen zu übermitteln. Dieser Unterschied in den Effekten der Relationen motiviert die Aufteilung in ‘presentational’ und ‘subject matter ’ Relationen, wie sie in Abb. 8.2 zu sehen ist. Prominente ‘subject matter ’ Relationen, bei denen die Darstellung eines Sachverhalts “in der Welt” im Zentrum steht, sind die verschiedenen Kausalrelationen. Beim Erstellen einer RST-Struktur muss man jede EDU sowohl in Bezug auf ihre Nachbarschaft untersuchen als auch ihren Beitrag für den Gesamttext beurteilen, denn davon hängt ab, an welchen Stellen im Text die Grenzen für größere Segmente zu ziehen sind, die in etwa den “Teiltexten” im Sinne von Schröder (2003) entsprechen (vgl. Abschnitt 7.2.1). Die Entscheidung für die Zuweisung einer Relation ähnelt der Auswahl einer Stützungsbeziehung zwischen Illokutionen (Abschnitt 7.2.2), ist aber schwieriger, weil wir ein deutlich größeres Spektrum von Relationen zur Auswahl haben, mit denen wir der Textkohärenz insgesamt Rechnung tragen. 7 So ist eine Relation wie ‘Elaboration’, bei der es, knapp formuliert, darum geht, dass auf eine allgemeinere Aussage eine speziellere folgt (z. B. Ich mag das Frühjahr am liebsten. Im April gefällt mir die Krokusblüte, . . . ), von ihrer Definition häufigsten wieder aufgegriffen wurde, weil sie in der Tat eine Lücke schließt (Verbindung mehrerer gleichwertiger Elemente zu einer Aufzählung). 7 Die Definitionen aller Relationen finden sich in Mann u. Thompson (1988), aber auch auf www.sfu. ca/ rst . 8.2. Von lokalen Relationen zu globalen Strukturen 141 Subject matter Presentational Nucleus Elaboration Motivation and Circumstance Antithesis Satellite Solutionhood Background (Non-)Volitional Cause Enablement (Non-)Volitional Result Evidence Purpose Justify Condition Concession Otherwise Interpretation Evaluation Restatement Summary Multi- Sequence nuclear Contrast Joint Abbildung 8.2.: Liste der RST-Relationen nach Mann u. Thompson (1988) her betrachtet wohl in recht vielen Fällen verwendbar, aber nur selten wird sie die einzige sein, deren Definition für eine bestimmte Textstelle “passt”. Ähnlich wie bei der Zuweisung von Illokutionen geht es also darum, die im Vordergrund stehende Relation zu identifizieren. Wie diese Entscheidung zu treffen ist, darüber machen Mann, Matthiessen und Thompson nur wenige Aussagen, so wie sie auch insgesamt der Beziehung zur linguistischen Realisierung der Relation recht wenig Aufmerksamkeit widmen. Diese Fragen werden ausführlicher in den später entstandenen Annotationsrichtlinien von Carlson u. Marcu (2001) behandelt, die allerdings auch eine sehr viel größere Relationsmenge verwenden. Zur Illustration zeigt Abb. 8.3 eine Analyse eines kurzen Textes 8 ; die Abbildung enstand mit dem RSTTool (s. Abschnitt 8.6). Die von Mann und Thompson vorgeschlagene Notation zieht einen gebogenen Pfeil vom Satellit-Segment zum Nukleus und benennt diesen Pfeil mit der Relation; vom Nukleus geht ein senkrechter Strich nach oben. Über das so entstehende größere Segment wird ein waagerechter Strich gezogen, der dann seinerseits für die übergeordnete Relation verwendet wird. Bei multinuklearen Relationen entfällt der Pfeil, stattdessen werden die Nuklei einfach durch eine Linie mit dem Mittelpunkt der Linie des übergeordneten Segments verbunden. Unser Beispieltext folgt einem recht einfachen Muster. Zunächst wird das Thema ‘elektronischer Gesundheitspass’ in positives Licht gestellt (wenn auch bereits mit der “Vorwarnung” auf den ersten Blick), und zwar mit einer allgemein wertenden Aussage, die von zwei konkreteren Thesen gefolgt wird. Damit ist die Definition 8 Quelle: BILD Zeitung vom 12.6.2002 142 8. Rhetorische Struktur Abbildung 8.3.: Beispiel für die RST-Analyse eines kurzen Textes 8.2. Von lokalen Relationen zu globalen Strukturen 143 für Elaboration erfüllt; man könnte aber an dieser Stelle alternativ wohl auch mit Evidence (vgl. Abb. 8.1) arbeiten. Sätze 2 und 3 sind lediglich mit List verbunden, da sie in keinem Zusammenhang zueinander stehen, außer dass sie beide in derselben Beziehung zu Satz 1 stehen. Dieselbe Struktur wiederholt sich dann in 4-6, allerdings mit umgekehrtem Vorzeichen: allgemeine Warnung, gefolgt von zwei konkreten Gefahren (oder was der Autor dafür hält). Satz 7 liefert keine neue Information, sondern reformuliert noch einmal 5, wofür RST die Relation Restatement bereitstellt. Zwischen den Blöcken 1-3 und 4-7 ist die Relation Antithese gegeben, deren Definition wir in Bild 8.1 gezeigt hatten. 8 liefert mit dem gläsernen Patienten eine subjektiv gefärbte Umschreibung, die von 9 sehr explizit bewertet wird (Relation Evaluation). Die Analyse fasst dann 8 und 9 gemeinsam wiederum als Bewertung der vorangegangenen Gegenüberstellung der positiven und negativen Sicht auf. Die Erstellung einer RST-Analyse zu einem Text ist eine komplexe Aufgabe, die wie gesehen vier verschiedene, aber miteinander eng verbundene Aspekte beinhaltet: • Teilung des Textes in EDUs, • Festlegung der Hierarchie (Baumstruktur), • Zuweisung des Nuklearitätsstatus an Segmente, • Zuweisung von Relationen zu Segmenten. In der Praxis fallen diese Entscheidungen oft gleichzeitg, u. a. weil RST den Nuklearitätsstatus direkt mit der Relation verknüpft. Man sollte sich jedoch darüber im Klaren sein, dass man bei der Erstellung eines RST-Baums solcherlei unterschiedliche, sich aber gegenseitig beeinflussende Festlegungen trifft. Für die Analyse hat sich folgende Vorgehensweise als nützlich erwiesen: 1. Lesen Sie den gesamten Text. 2. Zerfällt der Text in erkennbare größere (thematische) Einheiten? Markieren Sie etwaige Grenzen zwischen solchen Segmenten. 3. Teilen Sie den Text in seine EDUs auf. Vereinfachte Faustregel: Ein Satz ist eine EDU; Teilsätze, die durch eine Konjunktion verbunden sind, sind separate EDUs. 9 4. Untersuchen Sie der Reihe nach jede EDU und ihre unmittelbaren Nachbarn. Gibt es eine klar erkennbare (z. B. durch einen Konnektor signalisierte) Relation zwischen der EDU und einem Nachbarn? • Wenn ja, entscheiden Sie sich ggf. für einen Nukleus und markieren Sie diesen. 9 Die Frage der Definition von EDUs werden wir im nächsten Kapitel genauer erörtern. 144 8. Rhetorische Struktur • Wenn nein, kann diese EDU sich an der Grenze einer in der Struktur übergeordneten Relation befinden. Suchen Sie nach Relationen zwischen größeren Segmenten. Nuklearität hängt hier stärker von der Rolle des Segments für den Gesamttext ab! 5. Führen Sie diese Prozedur fort, bis eine komplette Baumstruktur entstanden ist. Wichtig ist, jeweils alle vier Komponenten der Relationsdefinitionen in Betracht zu ziehen und die Entscheidungen nicht allein vom intendierten Effekt leiten zu lassen; beachtet man die anderen Felder nicht, entsteht erheblich größere Mehrdeutigkeit bei der Analyse. Nur in den seltensten Fällen allerdings wird sich Mehrdeutigkeit ganz vermeiden lassen. Auch Mann und Thompson haben betont, dass es ganz natürlich sei, wenn sich für einen Text mehrere Analysen angeben lassen. Dies wird der RST mitunter zum Vorwurf gemacht, doch sollte man stets den Zweck einer RST-Analyse nicht aus den Augen verlieren: Es geht nicht um die Angabe der einzigen richtigen Baumstruktur, sondern eher darum, das Ergebnis der Interpretation des Texts systematisch abzubilden; Interpretation jedoch ist naturgemäß ein subjektiver Vorgang und so sollte es nicht verwundern, wenn verschiedene Annotatoren zu verschiedenen Ergebnissen gelangen. Problematisch allerdings scheint es, wenn ein und derselbe Annotator sich an bestimmten Textstellen zwischen konkurrierenden, gleichermaßen “passenden” Relationsdefinitionen schlechterdings nicht entscheiden kann; darauf kommen wir am Ende des Kapitels zurück. Der in RST prominente Aspekt der Nuklearität wurde von anderen Autoren weiterentwickelt zur sog. “strong nuclearity hypothesis” (Marcu, 2000). Danach findet man die wichtigsten EDUs eines Textes, indem man beginnend an der Wurzel des Baumes der Linie des Nukleus nach unten folgt, bis man bei einem Blatt des Baumes, also bei einer EDU landet. Falls auf dem Weg multinukleare Relationen angetroffen werden, wird jede der Linien weiter verfolgt. So entsteht eine Menge aus EDUs, die nach der Hypothese den zentralen Gehalt des Texts ausmachen. In der Beispiel-Analyse in Bild 8.3 bildet nach diesem Kriterium Segment 4 allein die “zentrale” Aussage des Textes; naturgemäß ist die Idee allerdings bei längeren Texten fruchtbarer als bei kurzen. Diese “strong hypothesis” kann noch weiter fortentwickelt werden zu einer Skala der EDU-Wichtigkeit, indem man z. B. für jede nukleare EDU auszählt, wie viele Nukleus-Verbindungen auf dem Weg von ihr aufwärts liegen, bis man erstmals eine Satellit-Verbindung erreicht. So lassen sich am Ende alle EDU-Nuklei in eine (partielle) Ordung der “Wichtigkeit für den Text” bringen. 8.3. Aspekte der Verarbeitung: Inkrementalität Wir haben RST als Analyse-Werkzeug vorgestellt, mit dem man durch Kombination der Blickrichtungen auf die rein lokale Verknüpfung und auf die Rolle von 8.3. Aspekte der Verarbeitung: Inkrementalität 145 EDUs und größeren Segmenten im Gesamttext zu einer insgesamt plausiblen Analyse gelangen kann. Damit haben wir diesen Ansatz explizit nicht als mögliches Modell für die kognitive Verarbeitung durch die Leserin dargestellt; das entspräche auch nicht der Absicht von Mann, Matthiessen und Thompson. Andere Modelle rücken demgegenüber die Verbindung von kognitiver Adäquatheit und linguistischer Verarbeitung in den Vordergrund. Hier wird dann der Begriff ‘Textstruktur ’ in einem engeren und sehr spezifischen Sinn, nämlich für die systematische Erweiterung der Analyse von Satzstrukturen verwendet: Analog zum Aufbau der syntaktischen und semantischen Struktur für Sätze wird eine Baumstruktur für Texte aufgebaut, die jeweils inkrementell um die Repräsentation des aktuell verarbeiteten Satzes angereichert wird. Dabei kann man entweder syntaktische Konstituenten zugrunde legen, wie im D-LTAG 10 Modell von Webber u. a. (2003), oder semantische Repräsentationen wie in der SDRT (Asher u. Lascarides, 2003). Solchen Ansätzen ist gemeinsam, dass sie versuchen, Textverstehen als Fortsetzung des Satzverstehens zu erklären, und dabei homogene Strukturen zugrunde legen. Für Webber u. a. (2003) etwa spielen die Konnektoren (siehe Abschnitt 9.3) auf der Text-Ebene die analoge Rolle zu der der Verben auf der Satz- Ebene bei der Projektion von Prädikat-Argument Strukturen. Nach Polanyi (1988, S. 608) kann Textstruktur als rekursive Nebeneinanderstellung und Einbettung von Diskurssegmenten verschiedener Typen aufgefasst werden. Polanyi unterscheidet in ihrem Modell, ganz ähnlich wie Grosz und Sidner mit satisfaction-precedence und dominance (s. Abschnitt 7.2.1), grundsätzlich zwischen Nebenordnung und Unterordnung. Im Fall der Nebenordnung folgen im Text eine Reihe von Segmenten aufeinander, die alle thematisch miteinander verbunden und Spezifikationen einer gemeinsamen Proposition sind, die nicht im Text selbst ausgedrückt, sondern auf einer höheren Ebene angesiedelt ist. Wir illustrieren dies mit der deutschen Übersetzung von Polanyis Beispiel nach Sassen (2005): (8.3) Peter hat blondes Haar. Er wiegt 75 kg. Er hat eine nette Freundin. Er arbeitet als Berater in einer Bank. Alle Sätze spezifizieren eine allgemeine Aussage oder ein Thema, das wir “Eigenschaften von Peter” nennen können, und das in der Baumstruktur als Knoten vom Typ C (für coordination, also Nebenordnung) die Sätze des Textes zusammenfügt, wie im oberen Baum in Abbildung 8.4 11 gezeigt. Eine Relation der Unterordnung hingegen besteht dann, wenn ein Textsegment durch die Propositionen der unmittelbar nachfolgenden Segmente semantisch weitergeführt wird, wie im Beispiel (8.4), ebenfalls aus Sassen (2005). Im Baum erhält der entsprechende Knoten den Typ S (für subordination) und ist mit dem übergeordneten Segment bestückt; siehe den unteren Baum in Abb. 8.4. (8.4) Peter kennt sich gut mit Film aus. Er hat die einschlägige Literatur gelesen. Er war jahrelang Filmvorführer in einem Programmkino. Er hilft Archiven bei der Identifizierung von Filmen. 10 Discourse Lexicalized Tree Adjoin Grammar 11 Quelle: (Sassen, 2005) 146 8. Rhetorische Struktur Identifikation blondes Haar wiegt 75 kg nette Freundin Berater in einer Bank S : Peter kennt sich gut mit Film aus C : <Eigenschaften von Peter> einschlägige Literatur gelesen Programmkino Filmvorführer in für Archive Abbildung 8.4.: Neben- und und Unterordnung in Baumstruktur nach Polanyi (1988) Für den inkrementellen, also das lineare Textverstehen modellierenden Aufbau einer solchen Baumstruktur stellen sich zwei zentrale Fragen. Die eine ist die Entscheidung zwischen Neben- und Unterordnung; sie wird dem Weltwissen des Rezipienten zugeschrieben, ist also keine linguistische oder strukturell bedingte Entscheidung. Die andere Frage betrifft die Anknüpfungsstelle für das jeweils nächste Segment: Gegeben die für die bisherigen n Segmente des Textes aufgebaute Baumstruktur, wo ist die Satzstruktur des Segments n+1 anzuknüpfen? Da nicht einfach alle Sätze gleichberechtigt nebeneinander stehen, sondern die hierarchische Struktur des Textes abbilden, lassen sich dafür nun strukturelle Beschränkungen formulieren. Im Modell von Grosz u. Sidner (1986) geschieht dies über den Mechanismus des focus stack, eine Datenstruktur, die abbildet, auf welche Diskursgegenstände sich jeweils die Aufmerksamkeit der Rezipientin richtet. Die Repräsentanten liegen auf einem Stapel, und bei der Verarbeitung eines Diskurssegments können neue Diskursgegenstände auf diesen Stapel gelegt werden (etwa wenn ein neues Thema begonnen wird) oder “abgearbeitete” können davon entfernt werden (etwa wenn nach Ende einer Abschweifung zu einem alten Thema zurückgekehrt wird). Das gleiche Ziel, jedoch mit einem engeren Bezug zur linguistischen Struktur, verfolgt das right-frontier constraint (RFC), das von Polanyi (1988) vorgeschlagen und (u. a.) von den oben genannten weiteren Ansätzen aufgegriffen wurde. Es besagt, dass für die Anbindung des aktuell verarbeiteten Satzes lediglich die Sätze in Frage kommen, deren Wurzelknoten den rechten Rand des bisher aufgebauten Diskurs-Baumes bilden - also das aktuell letzte Segment des Textes sowie diejenigen, die dieses Segment dominieren. Diese Beschränkung sei für die Interpretation des Segments relevant und schlage sich dann insbesondere in der Zugänglichkeit für anaphorische Pronomen nieder. Zur Illustration ziehen wir folgendes Beispiel 8.3. Aspekte der Verarbeitung: Inkrementalität 147 (5) (1) (2) (3) (4) Abbildung 8.5.: Hierarchische Struktur des Textes Max’s evening von Asher u. Lascarides (2003) heran: (8.5) (1) Max had a great evening last night. (2) He had a great meal. (3) He ate salmon. (4) He devoured lots of cheese. (5) He then won a dancing competition. Erzählt wird eine kurze Geschichte, die aus einigen Ereignissen besteht; doch folgen diese Ereignisse keineswegs unabhängig aufeinander. Sätze (3) und (4) werden wir kaum so verstehen, dass sie Ereignisse schildern, die auf das Ereignis in (2) folgen - vielmehr charakterisieren sie das (2)-Ereignis genauer. (5) wechselt dann das Thema vom Essen zu einer anderweitigen Beschäftigung, die wir anhand unseres Weltwissens aber immer noch als Bestandteil eines great evening ansehen würden; d.h. Ereignis (5) folgt nicht auf das von (1), sondern auf das von (2). (2-4) und (5) liefern damit gemeinsam eine Erläuterung der abstrakteren Aussage in (1). Daraus ergibt sich eine hierarchische Struktur des Textes, wie in Abb. 8.5 dargestellt. 12 Im Beispieltext haben wir es auf den ersten Blick mit einer sehr einfachen referenziellen Struktur zu tun, da nach seiner Ersterwähnung durchgängig pronominal, und jeweils in Subjektfunktion, auf Max verwiesen wird. Satz (5) enthält jedoch auch die temporale Anapher then, die hier eine wichtige Rolle spielt, wie sich zeigt, wenn wir den Satz einmal ohne dieses then lesen. Der Text würde dann eine monotone Fortführung der Schilderung von Ereignissen liefern (he ate X, he devoured Y, he won Z), die oberflächlich betrachtet als temporal aufeinander folgend geschildert sind. Was ja im Einzelnen auch stimmt, aber eben der oben diskutierten Strukturierung nicht gerecht wird. Then signalisiert uns die Möglichkeit, dass der Satz einen Themenwechsel oder eine Rückkehr zu einem bereits besprochenen Thema mit sich bringt; unser Weltwissen bestätigt uns dann diese Vermutung, da Tanzen keine spezielle Form des Essens ist. Ohne then hätte der Text die gleiche Bedeutung, wäre aber schwieriger zu verarbeiten. Der Text könnte nun durch den Satz It was run by a charity organization fortgesetzt werden, wobei sich it dann höchstwahrscheinlich auf dancing competition bezieht, 12 In diesem Fall besteht ein enger Zusammenhang zwischen dieser ‘rhetorischen’ Struktur und der temporalen Struktur, die wir in Kapitel 6 behandelt haben; dies ist jedoch nicht immer so. 148 8. Rhetorische Struktur der Satz mithin an (5) anknüpft. Ebenso wäre eine Fortsetzung wie It really was one of the most memorable nights of the year for him denkbar, die dann jedoch an (1) anknüpft. Die, wie in Abb. 8.5 zu sehen, gemäß RFC nicht zugänglichen Sätze (2), (3) und (4) wären jedoch für ein Pronomen nicht erreichbar; so ist es beispielsweise nicht möglich, mit einem Satz wie It was red auf salmon zurückzukommen, also an (3) anzuknüpfen. Ein Nebenneffekt des inkrementellen Vorgehens besteht darin, dass im Gegensatz zu RST viele Relationen zweifach definiert werden müssen, nämlich in Abhängigkeit von der linearen Abfolge der Segmente. So wie Sanders u. a. (1992) das Merkmal ‘order ’ in ihr Raster zur Relationsdefinition aufgenommen hatten, finden sich beispielsweise in SDRT die Relationen Result und Explanation, die denselben semantischen Zusammenhang bezeichnen, sich jedoch in der Segmentreihenfolge unterscheiden. Für RST ist dies nicht relevant, da wie beschrieben insgesamt der Bezug zur sprachlichen Oberfläche nicht so eng ist; Mann u. a. haben sich darauf beschränkt, die Art des “inneren Zusammenhangs” zwischen den Segmenten anzugeben, unabhängig von der im Text gewählten Linearisierung. 8.4. Baumstruktur oder Graphstruktur? Das (u. a.) von RST vertretene Postulat, dass die Textstruktur als Baum dargestellt werden kann, besagt, dass immer nur aneinander grenzende (adjazente) Segmente miteinander verbunden werden und es keine “kreuzenden Kanten” in der Analyse- Struktur gibt. Die Frage, ob dies als Darstellungsinstrument ausreichend mächtig ist oder ob man allgemeinere Graph-Strukturen benötigt, kann wiederum aus verschiedenen Perspektiven betrachtet werden. Aus kognitiver Sicht geht es darum, wie die mentale Verarbeitung von Diskurssegmenten funktioniert und ob beispielsweise ein “Stapel”-Modell wie das von Grosz u. Sidner (1986) für die Repräsentation und Verwaltung der Diskursgegenstände plausibel ist, also durch experimentelle Befunde gestützt werden kann. Aus computerlinguistischer Sicht hat ein Baum Vorteile für die Verarbeitungsstrategie: Die Algorithmen beispielsweise für die Automatische Textgenerierung vereinfachen sich gegenüber allgemeiner Graph-Verarbeitung erheblich. Aus linguistisch-deskriptiver Sicht schließlich ist die Frage, ob die im Text beobachteten sprachlichen Phänomene der Annahme einer Baumstruktur entgegenstehen oder nicht. So argumentieren Webber u. a. (2003) dafür, dass die Menge der sprachlichen Konnektoren sich in zwei sehr unterschiedliche Gruppen teilt: • ‘Strukturelle’ Konnektoren (im wesentlichen Konjunktionen) verbinden in der Tat immer adjazente Segmente. • ‘Anaphorische’ Konnektoren (im wesentlichen Adverbiale) können analog zu anaphorischen Pronomen ein Antezedens anbinden, das nicht unbedingt adjazent zum Bezugssegment sein muss. Diese These lässt sich zunächst durch die Beobachtung stützen, dass ein Textsegment durchaus zwei verschiedene Konnektoren enthalten kann, womit das “ein- 8.5. Fazit 149 fache” Bild der RST - jeweils eine Verbindung zwischen zwei benachbarten Segmenten - ins Wanken gerät. Ein Beispiel: (8.6) (1) Das Spiel wurde wegen heftiger Ausschreitungen auf den Rängen in der 77. Minute abgebrochen. (2) Die meisten Zuschauer verließen das Stadion umgehend und ruhig. (3) Aber der Verein wird deshalb wohl eine heftige Geldstrafe zahlen müssen. Während die Konjunktion aber den Satz 3 mit Satz 2 (oder der Spanne 1-2) verbindet, bezieht sich deshalb nicht auf 2, sondern ausschließlich auf 1. Auf solche (und ähnliche) Beobachtungen kann man unterschiedlich reagieren: SDRT (Asher u. Lascarides, 2003) sowie der Ansatz von Wolf u. Gibson (2005) halten (wenn auch aus unterschiedlichen Gründen) Baumstrukturen für prinzipiell unzureichend; hingegen machen Webber u. a. (2003) für die Textstruktur im engeren Sinne allein die ‘strukturellen’ Konnektoren verantwortlich, womit die Baumstruktur erhalten bleibt, und verlagern Fälle wie das obige deshalb in den Bereich der event anaphora (siehe Kapitel 4), die per Definition keine Adjazenz-Beschränkungen kennt - dann aber eben nicht Teil der Textstruktur “im engeren Sinne” ist. 8.5. Fazit Die in diesem Kapitel beschriebene “Familie” von Modellierungsansätzen versucht, die Kohärenz von Texten mit einer Strukturbeschreibung zu erklären, die sich auf Relationen zwischen benachbarten Segmenten gründet. Unterschiede zwischen den Familienmitgliedern ergeben sich durch verschiedene Zielsetzungen; so kann man (wie RST) den Text als statisches Gebilde begreifen und seinen inneren Zusammenhalt abzubilden versuchen, oder aber (wie LDM, D-LTAG, SDRT) sich für den Prozess des Textverstehens interessieren und Segment für Segment ein inkrementelles Ableiten einer Diskursrelation und einer “Anknüpfungsstelle” modellieren. Andere Unterschiede ergeben sich, wie erläutert, beim Vorgehen der Definition von Relationen, die primär kognitiv (wie bei Sanders u. a. (1992)) oder empirisch (wie bei RST) oder philosophisch und linguistisch (wie bei Kehler (2002)) motiviert sein kann, aber auch die Einpassung in einen formal-semantischen Formalismus betonen kann (wie SDRT). Ebenso kann man geteilter Ansicht darüber sein, ob ein Segment jeweils nur mit einer Relation angebunden sein kann oder mit mehreren, auch dies hatten wir herausgestellt. Die engste Vorgabe für diesen strukturellen Aspekt macht RST mit der Annahme einer Baumstruktur ohne kreuzende Kanten. Neben allen Unterschieden besteht die zentrale Gemeinsamkeit der Ansätze darin, die Kohärenzrelation als alleiniges Instrument der Strukturbeschreibung zu verwenden. Mann u. Thompson (1988) beispielsweise sehen den Beitrag des RST- Baums darin, für jedes Textsegment die inhaltliche Verknüpfung zu seinen Nachbarn anzugeben und damit der Beobachtung Rechnung zu tragen, dass es in kohärenten Texten keine non-sequiturs gebe - keine Segmente, die unvermittelt und 150 8. Rhetorische Struktur ohne Verbindung zum Rest des Textes im Raum stehen. Der Preis für diese Homogenität ist, dass die Relationen sehr unterschiedliche Arten von Verknüpfungen beschreiben, und dass - zumindest im Fall von RST - das Postulat darin besteht, dass jeweils nur eine Verknüpfung möglich sei. Diese Annahme führt zu übersichtlichen Strukturbeschreibungen, ist aber aus deskriptiver Sicht wohl zu stark. Beispielsweise argumentieren Knott u. a. (2001), dass die Relation Elaboration, zumindest in der Spielart object-attribute (erstes Segment handelt von einem Gegenstand, zweites Segment von einer Eigenschaft dieses Gegenstands), nicht als “rhetorische” Relation aufgefasst werden solle, sondern ein anderes Instrument der Kohärenzsicherung darstelle. Die Autoren schlagen vor, diese Relation aus dem Inventar zu streichen und an ihre Stelle einen Wechsel im Aufmerksamkeitsfokus, einen Übergang von einem Diskursgegenstand zu einem anderen, zu setzen. Damit ergibt sich als Textrepräsentation eine Folge von kleineren RST-Bäumen und deren Verknüpfung durch Fokus-Wechsel, was die Autoren als entity chains bezeichnen. Dieser Vorschlag bewegt sich natürlich in die Richtung unserer in den vergangenen Kapiteln skizzierten Ebenen-Unterscheidung; wir kommen darauf in Kapitel 10 zurück. Wir haben in diesem Kapitel kaum Aussagen zu den linguistischen Faktoren für die Identifikation von EDUs und von Relationen in Texten getroffen. Diese für eine praktische Arbeit mit rhetorischer Struktur allerdings sehr wichtigen Fragen werden im nächsten Kapitel besprochen. 8.6. Annotation von rhetorischer Struktur im Korpus Auch bei der Annotation von rhetorischer Struktur muss man im Blick behalten, dass die Zuweisung von Relationen zu Textsegmenten nur ein indirektes Abbild der Verhältnisse liefert. Nicht nur Autoren wie van Dijk, Hobbs, Asher und Lascarides, Sanders u. a. haben betont, dass Kohärenzelationen nicht an der Sprachoberfläche angesiedelt sind, sondern abstraktere Einheiten verknüpfen; auch für Mann und Thompson sind die Relationen “pre-realizational”. Wenn wir den Text als primären Zugang zu den abstrakteren Repräsentationen ansehen und Relationen zwischen Textsegmenten annotieren, müssen wir uns darüber im Klaren sein, dass wir eine Vereinfachung vornehmen. Speziell für die Annotation von Texten nach RST hat Mick O’Donnell ein frei verfügbares Werkzeug implementiert, das ‘RSTTool’. 13 Mit RSTTool muss die Benutzerin zunächst im ‘Edit’-Modus die EDUs markieren (siehe oben in Abb. 8.6) und kann dann im ‘Structurer ’-Modus sukzessive per Mausklick Relationen zwischen EDUs markieren und dadurch größere Segmente bilden, die ihrerseits durch Relationen verbunden werden, wobei die von Mann und Thompson vorgeschlagene grafische Darstellungsweise erzeugt wird - siehe unten in Abb. 8.6. Während Nukleus-Satellit Relationen sehr einfach und intuitiv markiert werden (Mausklick 13 Siehe: www.wagsoft.com . Eine Variation des RSTTool wurde von Daniel Marcu entwickelt und ist unter www.isi.edu/ ~marcu verfügbar. 8.7. Weiterführende Literatur 151 auf Satellit, Ziehen der Maus zum Nukleus, Auswahl der Relation aus einem Menü), ist die Markierung multinuklearer Relationen etwas umständlicher. Bei langen Texten wird es naturgemäß schwierig, den Überblick über die bereits getätigten Annotationen und das entstehende “Gesamtbild” zu behalten. Um das horizontale scrolling in Grenzen zu halten, kann man einzelne Teilbäume zeitweilig zu einem einzelnen Meta-Knoten zusammenfassen und später wieder expandieren. Bei großen Bäumen stellt sich dann auch das Problem, sie zu Papier zu bringen; RSTTool erlaubt das Erstellen von PDF-Dateien für beliebige Teilbäume, die dann einzeln ausgedruckt werden können. Die Menge der Kohärenzrelationen ist nicht durch RSTTool festgelegt, sondern wird in einer separaten Datei spezifiziert, die nach Programmstart geladen wird. Das bedeutet, dass die Benutzerin nicht auf die von Mann u. Thompson (1988) definierten RST-Relationen festgelegt ist, sondern nach Belieben eigene Bezeichner verwenden, also zum Beispiel auch nach SDRT annotieren kann; auch eine “Entlehnung” des Werkzeugs zur Annotation dependenzorientierter Illokutionsstrukturen, wie in Abschnitt 7.2.2 besprochen, ist möglich. Möchte man auch die EDUs mit Illokutionsbezeichnern versehen, müssen diese allerdings direkt in den Originaltext eingefügt werden. RSTTool speichert die annotierten Texte in einem eigenen XML-Format. Bestandteil der Linguistischen Datenbank ANNIS (siehe Anhang) ist ein Konvertierungsskript, mit dem RSTTool-Daten in das PAULA-Format umgesetzt und dann in AN- NIS importiert werden können. Ein englischsprachiges Korpus von Texten, die mit RST-inspirierten Relationen annotiert sind, ist zusammen mit den zugrunde liegenden Annotationsanweisungen (Carlson u. Marcu, 2001) als ‘RST Treebank’ über das Linguistic Data Consortium 14 zu beziehen. Eine jüngere korpusbasierte Untersuchung zur Annotation rhetorischer Struktur (nach Prinzipien, die teilweise im Widerspruch zur RST stehen) ist Wolf u. Gibson (2005). Deutschsprachige Texte wurden im Potsdamer Kommentarkorpus (Stede, 2004b) nach RST annotiert und sind auf Anfrage verfügbar, siehe dazu die Homepage dieses Buches. 8.7. Weiterführende Literatur Eine empfehlenswerte, umfangreichere Darstellung der Problematik von Kohärenzrelationen, mit engem Bezug zu Phänomenen der linguistischen Realisierung, liefert Kehler (2002). Zur Rhetorical Structure Theory sind neben den in 8.2 bereits genannten Original- Artikeln (Mann u. Thompson, 1988, Matthiessen u. Thompson, 1988) vor allem zwei jüngere Überblicksbeiträge von Taboada empfehlenswert (Taboada, 2006a,b). Daneben bietet die RST-Webseite 15 umfassende und aktuelle Informationen. 14 www.ldc.upenn.edu 15 www.sfu.ca/ rst 152 8. Rhetorische Struktur Abbildung 8.6.: Segmentierung und Relations-Markierung mit RSTTool 8.8. Übungsaufgaben 153 Einen guten Einblick in das hierarchische Linguistic Discourse Model von Polanyi bietet (Polanyi, 1988). Die definitive, gründliche Darstellung der Segmented Discourse Representation Theory ist das Buch Asher u. Lascarides (2003). 8.8. Übungsaufgaben 1. Machen Sie sich mit den Definitionen der Kohärenzrelationen nach RST vertraut. Prüfen Sie jetzt zunächst lokal zwischen benachbarten EDUs Ihres Kommentars, welche Relation(en) in Frage kommen. 2. Erstellen Sie jetzt eine umfassende RST-Analyse, indem Sie für Ihre Nuklearitäts- und Relations-Entscheidungen auch den Bezug zum Gesamttext herstellen. Welche größeren Textsegmente ergeben sich? Sind sie identisch mit denen, die Sie in Übung 4 von Kapitel 7 ermittelt hatten? 3. Vergleichen Sie Ihre RST-Analyse mit den nur lokal ermittelten Relationskandidaten aus Übung 1 und stellen Sie fest, ob es für Ihren Text sinnvoller wäre, mehr als eine Relation zwischen Segmenten, oder auch Relationen zwischen nicht benachbarten Segmenten zuzulassen. 9. Minimale Texteinheiten und ihre Verknüpfung (9.1) Ich fahre schnell in die Stadt, weil ich noch Blumen kaufen muss. Danach können wir das Essen kochen. (9.2) Ich rufe Dich an nicht weil, sondern obwohl Du gestern durch den Besuch von Karl so irritiert warst. Unser erstes Beispiel ist ganz “nach dem Geschmack” von textstrukturellen Theorien wie den im letzten Kapitel genannten. In dem klaren Muster “X, weil Y. Danach Z.” lassen sich problemlos zwei Kohärenzrelationen entdecken, und der Text macht auch deutlich, dass danach sich auf den ganzen vorangehenden Satz bezieht, also ‘Diskurs-Skopus’ über das gesamte Satzpaar hat. In zugespitzter Form mahnt uns das zweite Beispiel, dass die Verhältnisse so klar nicht immer sind. In nur einem Satz finden wir zwischen einem Besuch und einer Irritation eine kompakt formulierte Kausalbeziehung; diese ist ihrerseits mit dem Anruf der Sprecherin verbunden; und die im Text zunächst genannte Art dieser Verbindung (weil, kausal) wird durch sondern zum letzendlich konzessiven Gesamtzusammenhang korrigiert. Die Frage nach dem Zusammenhang zwischen Satzbedeutung und Textbedeutung kann also sehr kompliziert werden und hält noch eine Vielzahl ungelöster Fragen bereit. Die Schwierigkeiten beginnen bei der Festlegung der minimalen Einheiten für eine Analyse der Textstruktur (der “EDUs”) - was für eine datenbezogene Herangehensweise, die sich mit authentischen Texten beschäftigt, der Erstellung von möglichst klaren Annotationsrichtlinien gleichkommt. Im ersten Abschnitt stellen wir in Kürze zwei solche Ansätze vor, die sich diesem Problem widmen. Anschließend gehen wir auf die in Abschnitt 7.4 vertagte Frage nach Kriterien für die Identifikation von Illokutionen ein: Was sind sprachliche Indizien für die unterschiedlichen Sprechhandlungen, die wir mit EDUs vollziehen können? Der dritte Abschnitt schließlich beschäftigt sich mit den Möglichkeiten der Verknüpfung von Textsegmenten; dass wir diesen Aspekt hier separat besprechen, sollte nicht darüber hinwegtäuschen, dass die Antworten auf die beiden Fragestellungen ‘Segmentierung’ und ‘Verknüpfung’ sich natürlich gegenseitig bedingen, wenn wir davon ausgehen, dass sich Textstruktur und Textbedeutung aus Bausteinen und ihren Verbindungselementen ergeben. 156 9. Minimale Texteinheiten und ihre Verknüpfung 9.1. Segmentierung von Texten Die Aufgabe, Kriterien für eine Textsegmentierung zu definieren, stellt sich letzten Endes für alle in den Kapiteln 5 bis 8 diskutierten Beschreibungsebenen. Besonders kritisch ist sie allerdings für die Ansätze aus Kapitel 8, insofern als diese die Textstruktur als Fortsetzung der Satzstruktur begreifen und somit eine explizite Brücke zur sprachlichen Oberfläche herzustellen versuchen. Wir werden uns im Folgenden auf die Identifikation von EDUs beschränken und den speziellen Aspekt der Markierung größerer Texteinheiten beiseite lassen; zu diesem Thema sei auf die Untersuchung von Gliederungssignalen in deutschsprachigen (vor allem narrativen) Texten von Gülich u. Raible (1977) sowie, mit engerem Bezug zu Zeitungstexten, auf den Abschnitt 3.2 von (Schröder, 2003) verwiesen. Was also ist die minimale Einheit der Textanalyse? Die linguistische Pragmatik hatte darauf zunächst eine klare Antwort: der Satz. Bereits bei der Diskussion der frühen Arbeiten von Austin und Searle in Kapitel 7 hatten wir darauf hingewiesen, dass sie - aus philosophischer Tradition kommend - der Beschreibungsebene Text wenig Bedeutung beimaßen, sondern idealsprachlich den Satz zum Maß der Dinge machten. Die interessierende Analyseeinheit war die Kombination aus Illokutionsoperator und Proposition (wiederum dekomponiert in Referenz und Prädikation), und mithin hatte auch für die Textanalyse ein semantisch/ pragmatisches Kriterium zu gelten. Jede sprachliche Einheit, der sich die Elemente des Terms F(RP) zuordnen lassen, bildet eine EDU; dies ist beispielsweise auch die Ausgangsposition von Motsch (1987, S. 48). Folgerichtig werden diese Einheiten als “satzwertig” bezeichnet. Sobald wir uns allerdings mit authentischen Texten und ihrer Vielzahl von mitunter komplex strukturierten Satztypen beschäftigen, kann die Aufgabe, “satzwertige Einheiten” zu identifizieren, sehr schwierig werden und wird gern umgangen. In Kapitel 8 sahen wir, dass beispielsweise auch in der Rhetorical Structure Theory das Problem der EDU-Definition zunächst ausgeblendet wurde: Mann u. Thompson (1988) zogen sich auf die Aussage zurück, die Einheiten der Analyse seien “typically clauses”. Erst mit der Weiterentwicklung der RST von Carlson u. Marcu (2001) wurden konkrete Vorschläge für die Abgrenzung von EDUs bei der Textannotation gemacht. Eine korpusorientierte Arbeitsweise, die Phänomene der Textstruktur an authentischen Texten untersuchen möchte, benötigt Segmentierungskriterien, die soweit möglich Merkmale der sprachlichen Oberfläche ausschöpfen. Denn die nachfolgenden Analyseschritte, die auf der Segmentierung aufbauen, sollten nicht darauf fußen, dass etwa die Annotatoren instruiert waren, lediglich intuitiv “illokutionswertige Einheiten” zu annotieren. Stattdessen sind verständliche und präzise Richtlinien unabdingbar, um nachvollziehbare und vergleichbare Ergebnisse zu erzielen. Dies betrifft auch auf den ersten Blick unwesentliche Details wie die Frage, welchem der benachbarten Segmente jeweils die Konnektoren (s. Abschnitt 9.3.1) und die Interpunktionszeichen zugerechnet werden - auch so etwas muss geregelt sein, wenn man einheitliche Segmentierungen erhalten möchte, mit denen dann systematisch weitergearbeitet werden kann. Solche Richtlinien lassen sich dementsprechend nicht in wenigen Absätzen for- 9.1. Segmentierung von Texten 157 mulieren. Die RST-Richtlinien von Carlson u. Marcu (2001) für das Englische und die (auf SDRT abzielenden) von Jasinskaja u. a. (2007) für das Deutsche umfassen allein für die Segmentierung jeweils circa 30 Seiten (wobei jeweils zahlreiche Beispiele enthalten sind). Im Folgenden beziehen wir uns zum großen Teil auf diese beiden Dokumente und nennen die wesentlichen Kriterien, die dort behandelt werden. Unstrittig ist, dass eine Satzgrenze auch eine EDU-Grenze ist - ein Segment, das aus mehr als einem Satz besteht, kann nicht elementary sein, sondern ist selbst bereits zusammengesetzt. 1 Ebenso unstrittig ist, dass für die Definition von EDUs unterhalb der Satzgrenze dann der Begriff der clause bzw. des Teilsatzes zentral ist. Hier jedoch steckt der Teufel im Detail: Wie sich eine clause definiert und welche Typen von clauses als EDUs fungieren sollen, ist in authentischen Texten oft schwierig zu entscheiden. Insofern erscheinen die o.g. Annotationsrichtlinien an einigen Stellen etwas willkürlich - man könnte wohl ebenso gut anders entscheiden - doch wie eingangs festgestellt, ist es für die Aufgabe besonders wichtig, unter Annotatoren Konsens über die Segmentbildung herzustellen, damit für die übergeordneten Ebenen vergleichbare Analysen ermöglicht werden. Ein einfacher Fall liegt vor, wenn ein Satz eine Verbindung (mit oder ohne Konjunktion) aus mehreren Hauptsätzen darstellt; diese sind dann jeweils separate EDUs (die wir im Folgenden durch eckige Klammern kennzeichnen): [Die Sonne schien vier Stunden lang,] [und der Wald erwärmte sich kräftig.] [Der Buntspecht arbeitete an seiner Höhle,] [der Eichelhäher ließ unablässig seinen Warnruf vernehmen.] Verbindungen aus Haupt- und Nebensatz werden in der Regel als zwei getrennte EDUs betrachtet, allerdings analysieren Carlson u. Marcu (2001) solche Nebensätze nicht als EDUs, die Satzkomplemente des Matrixverbs sind. Also: [Sarah schrieb, dass es ihr gut gehe.] Eine Ausnahme davon wiederum bilden Verben der Kognition oder eines Sprechakts (einsehen, ahnen, vorschlagen, . . . ), für die zwischen Haupt- und Nebensatz eine spezielle Kohärenzrelation namens Attribution angesetzt wird. Partizipialkonstruktionen, die im Englischen besonders häufig sind, werden meistens als eigenständige EDUs betrachtet: [Scratching his head,] [he entered the room quietly.] / [Getragen von einer Welle der Euphorie] [lief die Mannschaft ins Stadion ein.] Anders wiederum, wenn die Partizipialphrase ein Komplement des Verbs darstellt: [Jill joined Mark in selecting the photographs for the presentation.] Auch als Subjekt oder Objekt fungierende Partizipien stellen nach Carlson/ Marcu keine eigenständige EDU dar: [Finding the best restaurant in town can take several weeks.] Infinitivsätze werden von Carlson/ Marcu als EDUs gesehen, sofern sie keine Komplemente sind: ([I was not at home] [to answer the phone] aber [My son decided to skip school today.]. Ähnlich isolieren Jasinskaja u. a. um zu-Konstruktionen als eigene EDUs, Komplementsätze und andere Infinitive (wie Nominalisierungen) jedoch nicht: [Sie beeilte sich,] [um den Zug noch zu erreichen.] / [Beim Lesen dieses Buches kam ihm eine gute Idee.] 1 Dabei soll nicht verschwiegen werden, dass es durchaus problematische “Sätze” gibt, die kein Verb enthalten, etwa: Wie auch immer. Siehe dazu (Jasinskaja u. a., 2007, Abschnitt 1.4). 158 9. Minimale Texteinheiten und ihre Verknüpfung Kompliziert wird die Beurteilung von Clause-Verbindungen auch durch die vielfältigen Möglichkeiten der Elision von Konstituenten. Für deren Diskussion müssen wir hier auf die genannten Richtlinien verweisen, halten jedoch die Faustregeln fest: Koordinierte Konstituenten bilden zwei EDUs, wenn zumindest eine der EDUs aus unabhängigen Gründen als EDU klassifiziert wird. Die Koordination von Verbalphrasen wird von Carlson/ Marcu und Jasinskaja u. a. unterschiedlich beurteilt; letztere nehmen getrennte EDUs an, wenn Subjekt oder andere Konstituenten von den VPs geteilt sind: [Es ist anzunehmen,] [dass Marianne die Möbel gekauft] [und die Wohnung gemietet hat.] Während die “klassische” RST nach Mann u. Thompson (1988) eine relativ grobkörnige Analyse favorisiert und damit recht übersichtliche Strukturen erhält, wenden sich Carlson/ Marcu auch dem Problem der Einbettung unterschiedlicher Arten von EDUs zu. So werden Relativsätze als EDUs klassifiziert, sofern sie ein Verb enthalten; ihre Verbindung zum übergeordneten Segment wird durch einen speziellen Relationstyp Embedding vorgenommen, um anzuzeigen, dass sie nicht mit dem vollständigen Segment, sondern nur mit einem Teil davon verknüpft sind. Relativsätze ebenso wie Appositionen und parenthetische Einheiten können eine andere EDU unterbrechen. Dies stellen Carlson/ Marcu mit einer künstlichen, multinuklearen Relation Same-Unit dar, die die beiden voneinander getrennten Teilsegmente wieder zusammenfügt. Zu den syntaktischen Kriterien tritt bei Carlson/ Marcu noch ein lexikalisches hinzu: Sie postulieren die Annahme getrennter EDUs, wenn “strong discourse cues” vorliegen, so in despite-Präpositionalphrasen, die eine Concession Relation ausdrücken (We ignored the book despite the teacher’s recommendation.) oder Phrasen der Art as a result of X. Damit wird deutlich, dass die Segmentierung nicht nur von satzinternen, formellen Merkmalen bestimmt ist, sondern eben auch zielorientiert von Erwägungen der Diskurssemantik. Eine Diskussion der frühen 1990er Jahre aufnehmend, haben Grabski u. Stede (2006) am Beispiel der deutschen Präposition bei darauf hingewiesen, dass man konsequenterweise auch vielen Präpositionalphrasen den Status einer EDU zuschreiben muss, wenn sie als Adjunkt fungieren und mit dem Verb eine Beziehung eingehen, die aus Diskursperspektive als Kohärenzrelation gedeutet werden würde. Eine notwendige Bedingung dafür ist, dass das interne Argument der Präpositionalphrase ein Ereignis oder einen Zustand bezeichnet. So stellt etwa Bei schlechtem Wetter sollten Sie den Berg sofort verlassen eine Formulierung der Relation Condition dar, die sich paraphrasieren lässt als Wenn das Wetter schlecht ist/ wird, sollten Sie den Berg sofort verlassen. Der syntaktische Zugang erweist sich zur Definition von EDUs also letztlich als nicht ausreichend. Ein weiteres Beispiel dafür ist die Behandlung von Relativsätzen: Wenn sie nicht-restriktiv verwendet werden, sondern “weiterführend” sind, kann man dafür argumentieren, sie als separate EDUs aufzufassen. Ein Beispiel bietet der Kreisel-Text auf S. 116: Was für ein Preis für die Restaurierung eines städtebaulichen Schandflecks, der seit mehr als dreißig Jahren Schatten auf die nette, gutbürgerliche Umgebung wirft. Der Relativsatz dient nicht dazu, aus der Menge aller städtebaulichen Schandflecke einen konkreten herauszugreifen (restriktive Funk- 9.2. Identifikation von Illokutionen 159 (Evaluativa) Konstatierungen Vermutungen Annahmen W−Aussagen Ep−Aussagen Behauptungen Informationen Feststellungen Hypothesen Vorhersagen (Estimativa) (Reportiva) Relationata Illokutionstypen Direktiva Identifikativa (u.a.: Vol−Aussagen) Val−Aussagen Abbildung 9.1.: Hierarchie von Illokutionstypen tion), sondern über den bereits identifizierbaren Gegenstand neue Information zu übermitteln. Rein syntaktisch sind restriktive und nicht-restriktive Relativsätze im Deutschen aber nicht zu unterscheiden. Auch das oben genannte Beispiel der bei- Präpositionalphrase wirft die Frage auf, wie zu entscheiden ist, ob eine Nominalphrase ein Ereignis/ Zustand ausdrückt oder nicht. Letzten Endes verbleibt für die EDU-Entscheidungen also ein “Rest”, der nach der Intuition der Annotatorin zu entscheiden ist, die sich dabei nicht allein von syntaktischen, sondern auch von semantischen und diskursorientierten Aspekten leiten lassen sollte. 9.2. Identifikation von Illokutionen Für eine Analyse der Illokutionsstruktur folgt auf die Segmentierung die Aufgabe, den EDUs jeweils eine Illokution zuzuweisen. Im Grund gilt dies auch für eine RST-inspirierte Analyse, da dort die rhetorischen Relationen auch über die Ziele des Sprechers und Annahmen über die Adressatin definiert sind - allerdings wird dieser Schritt in der rhetorischen Struktur nach Mann u. Thompson nicht explizit getätigt. Die Rollen der beiden Relata werden nicht einzeln geklärt und expliziert, sondern dies wird mit der Relationszuweisung en passant erledigt. Im Abschnitt 7.4 hatten wir mit Searle (1980) und Schmitt (2000) zunächst ein grobes Raster von Illokutionstypen genannt und es anschließend für die uns interessierenden Textsorten angepasst, was einerseits zur Auslassung einiger Typen, andererseits zur feineren Untergliederung des Bereichs der ‘Feststellungen’ anhand der Arbeit von Motsch (1987) führte. Abb. 9.1 zeigt eine Synthese der beiden Ansätze, wobei allerdings die von Motsch vorgenommene letzte Stufe der Verfeinerung weggelassen ist, da wir auf diese Unterscheidungen hier nicht mehr einge- 160 9. Minimale Texteinheiten und ihre Verknüpfung hen werden. Des weiteren sind zum Zweck der Vereinheitlichung die von Motsch unter Feststellungen subsumierten Vol-Aussagen (Sätze, die Wünsche der Sprecherin ausdrücken) hier den Schmitt’schen Identifikativa zugeordnet (Aussagen, mit denen der Sprecher etwas über seine inneren Zustände mitteilt: Gefühle, Hoffnungen, Wünsche, etc.). Die von Schmitt verwendeten Begriffe sind in der Abbildung kursiv gesetzt. Im Folgenden stellen wir die wesentlichen Typen von Kriterien zusammen, die Hinweise auf die einer EDU zugrunde liegende Illokution geben können. In der Mehrzahl der Fälle sind diese Hinweise keineswegs eindeutig: Ähnlich wie die Zuweisung einer Kohärenzrelation ist auch die Entscheidung für die Illokution einer EDU ein Interpretationsschritt, der erheblich vom sprachlichen und situativen Kontext beeinflusst ist, mitunter auch vom Weltwissen der Annotatorin. Ein gerade für die Textsorte Kommentar häufig schwieriger Fall ist die Unterscheidung zwischen Information und Behauptung (im Sinne der Motsch-Klassifikation): Betrachtet die Autorin die in der EDU enthaltene Proposition als potenziell strittig oder als unstrittig? Signale an der Sprachoberfläche können allgemein die Interpretationsentscheidung unterstützen, weil sie mit bestimmten Illokutionstypen korrelieren oder bestimmte Typen aus der Menge der Möglichkeiten ausschließen. In der Literatur werden diese Signale häufig als illocutionary force indicating devices, kurz IFIDs, bezeichnet; wir werden diese Abkürzung im Folgenden auch verwenden. Das wohl bekannteste Problem im Zusammenhang mit IFIDs und Illokutionstypen ist das der sog. indirekten Sprechakte. Hier besteht zwischen den in der EDU verwendeten IFIDs und dem Illokutionstyp keine Korrespondenz, sondern ein Konflikt. In der linguistischen Pragmatik wurde dies ausführlich untersucht, wir geben unten im Abschnitt zum Satzmodus ein Beispiel, gehen auf diese Diskussion aber nicht weiter ein. Stattdessen konzentrieren wir uns hier allein auf die sprachliche Oberfläche und die dort ablesbare “vordergründige” Illokution. Liedtke (1998) unterscheidet in diesem Zusammenhang systematisch zwischen zwei Verwendungsmodi für IFIDs: Sind die Kommunikationspartner miteinander vertraut und liefert der Äußerungskontext deutliche Hinweise auf die jeweils intendierten Sprechhandlungen, so ist die Bindung zwischen IFID-Verwendung und Illokution nicht sonderlich eng; Liedtke nennt dies den resultativen Modus, weil das Resultat der Kommunikation im Zentrum steht und nicht die eigentlich “korrekte” Form. Anders im instrumentalen Modus, wo Sprecher und Adressat sich weniger auf Kontextinformation verlassen. Stattdessen muss die Äußerungsform “illokutiv stimmig” sein. Das ist in den in diesem Buch vorzugsweise besprochenen Zeitungstexten fast durchgängig der Fall. Eine andere Textsorte, die den instrumentalen Modus nahelegt, sind Behördenbriefe; Liedtke illustriert dies mit der offenkundig fehlformulierten Aufforderung Kommen Sie am Donnerstag doch mal beim Amtsgericht vorbei. Insgesamt ist der Zusammenhang zwischen sprachlichen Merkmalen und Illokutionstypen bislang nur unzureichend untersucht, weil einerseits nur wenige zu Syntax und Semantik arbeitende Linguisten sich auch für Sprechhandlungen 9.2. Identifikation von Illokutionen 161 interessieren und andererseits viele Pragmatik-Forscher den Schritt zur konkreten Sprachoberfläche in ihrer ganzen Bandbreite (also jenseits von “Laborsätzen”) scheuen. Gerade für dieses Thema kann daher die Bereitstellung von annotierten Daten, die auch quantitativ ausgewertet werden können, wichtige Fortschritte ermöglichen. 9.2.1. Performative Formeln Das wohl klarste Signal, das ein Sprecher zur Anzeige des Illokutionstyps verwenden kann, ist die explizite performative Formel. Darauf sind wir in Kapitel 7 bereits kurz eingegangen und haben auch auf Austins Zählung der performativen Verben des Englischen (ca. 1000) hingewiesen. Verwende ich also ein solches Verb, lasse ich der Leserin kaum eine Wahl bei der Identifikation der Illokution (zumindest der vordergründigen - siehe oben). (9.3) Ich bitte Dich, mir das Buch morgen zurückzugeben. (9.4) Wir fordern Sie auf, am Donnerstag, dem 12. Juli, im Amtsgericht zu erscheinen. (9.5) Für den Vorfall entschuldige ich mich in aller Form. In der Literatur wird der Begriff ‘performatives Verb’ nicht ganz einheitlich verwendet. Eine enge Lesart beschränkt ihn auf diejenigen Verben, deren korrelierte Sprechakte im engeren Sinn zu den Performativa (im Unterschied zu Konstativa) zählen: Die Äußerung verwirklicht die ausgedrückte Proposition und ändert damit einen Zustand in der Welt (vgl. Searles Deklarationen auf S. 121: Hiermit taufe ich . . . ). Diese eingeschränkte Verwendung schlägt auch Bußmann (2002) vor und bezeichnet die übrigen, den Sprechakt unmittelbar anzeigenden Verben als ‘illokutionäre Verben’ - womit wir uns unter dem Aspekt der IFID-Kategorisierung verwirrenderweise aber immer noch im Bereich der gemeinhin so genannten ‘performativen Formeln’ befinden. Ein Verwendungsbeispiel für ein illokutionäres Verb ist Ich meine, wir sollten jetzt gehen. Bussmann gibt als Diagnose die Einfügung des Adverbs hiermit an, die bei performativen Verben problemlos akzeptabel sei, bei illokutiven jedoch nicht: ? Ich vermute hiermit, dass Du recht hast. Wie die Überschrift anzeigt, ist diese Kategorie nicht auf die Verwendung einzelner Verben beschränkt, sondern schließt auch komplexere, formelhafte Ausdrücke ein, wie etwa Es ist zu bezweifeln, dass X oder Wir müssen darauf achten, dass X. Sie drücken ebenfalls eine Sprechereinstellung aus, die in einem entsprechend “feinkörnigen” Inventar jeweils mit einem Illokutionstyp in Beziehung zu setzen ist. Als letzte Beispiele sei auf die jeweils ersten Sätze der Texte Kreisel (S. 116) und Olympia (S. 126) verwiesen. Sie lauten Alles spricht gegen den Steglitzer Kreisel und Olympia ist Gold wert, und beiden liegen Mehrwortausdrücke zugrunde, die den Sätzen den Illokutionstyp Val-Aussage zukommen lassen. 162 9. Minimale Texteinheiten und ihre Verknüpfung 9.2.2. Satzart In der Linguistik sowie in Standard-Grammatiken werden die Begriffe für die Unterscheidung unterschiedlicher Klassen von Sätzen nicht einheitlich gebraucht. Es gibt das Bestreben, die rein syntaktisch begründete Klassenbildung zu trennen von semantisch und pragmatisch motivierten Gruppierungen; unklar ist allerdings, ob sich die beiden letztgenannten auseinander halten lassen. Betrachten wir aber zunächst die Syntax, die häufig den Ausdruck Satztyp nutzt, um strukturelle Unterscheidungen im Aufbau von Sätzen zu benennen (die auch mit prosodischen Merkmalen einhergehen). Dies kann man eher oberflächennah anhand der Verbstellung tun und für das Deutsche dann Verberst-, Verbzweit- und Verbletztsätze unterscheiden (z. B. Eisenberg, 1989), oder im Rahmen einer spezifischen syntaktischen Theorie anhand entsprechender Untersuchung auch der “Tiefenstruktur”, wie es etwa Brandt u. a. (1992) für die Government and Binding Theorie tun (und darüber hinaus auch den Bezug zu Satzmodus und zur Illokution herstellen). Ob die Unterscheidung zwischen einer semantischen und einer pragmatischen Beschreibungsebene systematisierbar ist, soll uns hier nicht beschäftigen. Statt dessen folgen wir Bußmann (2002) und einer Reihe von Grammatiken (z. B. Helbig u. Buscha, 2001) in der Gruppierung von Satzarten: • Aussagesätze gelten mit ihrer Verbzweitstellung als Vertreter der “prototypischen” Satzart, die die vielfältigsten Verwendungsmöglichkeiten bietet. • Fragesätze lassen sich weiter einteilen, üblicherweise in Entscheidungsfragen mit Verberststellung (Liest Du das Buch? ) und Ergänzungsfragen mit Verbzweitstellung (Welches Buch liest Du? ); weitere Klassen schlägt z.B. Liedtke (1998) vor. • Aufforderungssätze sind an der Verberststellung und (im Falle vertraulicher Anrede) dem Verbmodus Imperativ erkennbar (Bring mir das Buch! ), es gibt aber eine Reihe von Sonderformen, auf die wir nicht eingehen. • Wunschsätze beziehen sich ebenso wie Aufforderungen auf noch nicht realisierte Sachverhalte, sprechen aber den Adressaten nicht direkt an. Beispiele: Würde es doch endlich mal regnen! / Wenn ich doch noch mal jung sein könnte. • Ausrufesätze sind nach Helbig u. Buscha (2001) strukturell entweder den Aussage- oder den Fragesätzen ähnlich, erfüllen jedoch die Funktion, eine Emotion auszudrücken: Du hast das aber schön gemacht! / Wie erschöpft ich bin! Eisenberg (1989) nennt als weitere Satzart den subordinierten Satz, der aber keine semantische oder pragmatische, sondern lediglich eine syntaktische Funktion erfülle; wir erinnern hier aber an die Diskussion der weiterführenden Nebensätze im vorigen Abschnitt, denen man oft durchaus auch den Status einer eigenständigen Illokution zubilligen kann. Die Erläuterungen der Satzarten, etwa bei Helbig u. Buscha (2001), verwenden fallweise sowohl strukturelle (morphologische, syntaktische, prosodische) Merk- 9.2. Identifikation von Illokutionen 163 male als auch Sprechhandlungskriterien. Daher sind Überlappungen und “Grauzonen” zwischen den Arten keineswegs ausgeschlossen; beispielsweise könnte man unser erstes Beispiel für den Wunschsatz auch dem Ausrufesatz zuordnen. Für die uns hier letzlich interessierende Beschreibungsebene der Illokution gilt naheliegenderweise eine recht enge Korrelation zwischen der Satzart Aufforderung und der Illokution Direktivum, und analog zwischen dem Fragesatz und einer Illokution, die man als Quaesitiv bezeichnen kann - mit diesen beiden hat sich die Pragmatik ausführlich beschäftigt. Dies sollte jedoch keinesfalls zur Annahme einer unmittelbaren Korrespondenz zwischen Satzart und Illokutionstyp führen - die anderen hier besprochenen Arten von IFIDs spielen ihrerseits eine Rolle, und auf die wesentliche Rolle der Interpretation im Kontext haben wir eingangs hingewiesen. Gerade für Aufforderungen und Fragen gilt ja, dass die vordergründige und die “hintergründige” Illokution häufig nicht übereinstimmen. Um aufzufordern, können wir anstelle des imperativischen Gib mir doch mal die Fernbedienung ein ganzes Spektrum indirekter Formulierungen verwenden, auch solche, die dann in Nachbarschaft zur Satzart Wunschsatz stehen: Es wäre zu schön, wenn ich die Fernbedienung hätte. - Andererseits besteht aber auch keine Beliebigkeit; gerade beim letztgenannten Beispiel sind das Modalverb, der konditionale Konnektor und der Verbmodus in dieser Kombination ein sehr klares Signal für die zumindest vordergündige Illokution Identifikativum, die man in einer angemessenen Äußerungssituation (ein Kommunikationspartner ist im Raum und hat die Fernbedienung) als Direktivum interpretieren kann. Es bestehen also zwischen Satzart und Illokutionstyp tendenzielle Korrelationen, doch die Interpretationsentscheidung fällt stets im Zusammenhang mit weiteren IFIDs und im Kontext. Die Tendenzen sind: Aussagesatz - Feststellung; Fragesatz - Quaesitivum; Aufforderungssatz - Direktivum; Wunschsatz - Identifikativum; Ausrufesatz - Identifikativum. Im Hinblick auf die uns besonders interessierenden Textsorten können verschiedene Verfeinerungen vorgenommen werden, und wir werfen auf drei Satzarten noch kurz einen weiteren Blick. Zum Fragesatz ist festzustellen, dass der Illokutionstyp Quaesitiv für gedruckte Texte immer nur vordergründig sein kann (wenn wir einmal von Quizfragen absehen). Gerade in Kommentaren werden Fragen gern “rhetorisch” verwendet; ein Beispiel sahen wir im Text Movie auf Seite 106: How can our young people drink in through their eyes a continuous spectacle of intense and strained activity and feeling without harmful effects? Die Leser sind hier natürlich nicht aufgefordert, über die erfragte Art und Weise eines ungefährlichen visuellen Konsums nachzudenken, sondern sie sollen sich der bereits gegebenen Antwort anschließen - die harmful effects sind unvermeidbar, mithin ist der zugrunde liegende Illokutionstyp hier die Val-Aussage. Auch Aufforderungssätze sind in Meinungstexten nur selten als Direktiva gemeint, nämlich dann, wenn Entscheidungssträger (z. B. Politiker) unmittelbar zu einer bestimmten Handlung ermuntert werden. Ansonsten sind die Aufforderungen als Appelle an die Einstellung der Leser zu verstehen. Einer der Subtypen von Aufforderungssätzen ist der Adhortativsatz, der nicht den Verbmodus Imperativ 164 9. Minimale Texteinheiten und ihre Verknüpfung verwendet, sondern beispielsweise lassen-Konstruktionen. Ein Beispiel findet sich im Text Kreisel auf S. 116: Lassen wir das ruhig beiseite. Den Aussagesatz haben wir oben als die flexibelste Satzart bezeichnet, und eine Durchsicht unserer Beispieltexte im Kapitel 7 bestätigt diese These leicht. Der Aussagesatz deckt das gesamte Spektrum der von Motsch ausdifferenzierten Feststellungen ab (Abb. 9.1): Mit ihm kann der Autor informieren, behaupten, vorhersagen, bewerten, uvm. Darüber hinaus können auch Identifikativa (Mir geht es gut), Relationata (Ich begrüße unsere neuen Leser) und Direktiva (Du gehst sofort ins Bett) die Form von Aussagesätzen aufweisen. Besonders zur Unterscheidung zwischen den Typen von Feststellungen sind daher die nächsten beiden IFID-Arten sehr wichtig: Modalverben und Adverbien. 9.2.3. Modalverben Die Modalverben des Deutschen 2 (müssen, sollen, dürfen, können, mögen, wollen; mitunter werden noch einige andere dazu gezählt) können in zwei verschiedenen Lesarten gebraucht werden: In epistemischer Verwendung modulieren sie den Grad der Möglichkeit oder Wahrscheinlichkeit, mit der der beschriebene Sachverhalt nach Meinung des Sprechers eintritt - er formuliert also einen Aspekt seiner Einstellung (Gewissheit) zum Sachverhalt. Beispiele: (9.6) Er kommt um 9 am Bahnhof an. / Er dürfte um 9 am Bahnhof ankommen. / Er müsste um 9 am Bahnhof ankommen. / Er mag um 9 am Bahnhof ankommen. Während die Variante ohne Modalverb als Information gelesen werden kann (jedoch nicht zwangsläufig so gelesen werden muss), verschiebt das Modalverb die Illokution in Richtung eines Estimativums (zu den Unterschieden zwischen den Typen von Estimativa siehe Abschnitt 7.4). In deontischer Verwendung formuliert die Sprecherin hingegen, dass sie den Sachverhalt für notwendig oder erlaubt hält, hier geht es also häufig auch um das Verhältnis des Adressaten zum Sachverhalt. So lässt sich mit müssen die Notwendigkeit ausdrücken, wobei dann allerdings anders als im obigen Beispiel nicht der Konjunktiv zu wählen ist, sondern: Er muss um 9 am Bahnhof ankommen. (Der Satz kann freilich auch in dieser Form epistemisch gelesen werden! ) Mit dürfen und können lässt sich Erlaubnis zu einer Handlung signalisieren, mit letzterem aber natürlich auch die Fähigkeit zu einer Handlung (Sie kann Autos reparieren). Besonders vielfältig sind die Gebrauchsweisen von sollen, mit dem ein Sachverhalt als gefordert, beabsichtigt oder behauptet markiert werden kann. Der Illokutionstyp ist bei deontisch verwendeten Modalverben häufig Direktivum, aber es wären auch weitere Sub-Typen von W-Aussagen anzusetzen (etwa: Erlaubnis geben), die in Abb. 9.1 nicht berücksichtigt sind. 2 Wir geben hier nur einen äußerst groben Überblick über ein komplexes Thema; für eine exemplarische tiefergehende Untersuchung des Illokutionspotenzials eines einzelnen Modalverbs (können) sei auf Liedtke (1998, S. 227ff.) verwiesen. 9.3. Verknüpfung von Textsegmenten 165 Anhand von Verbmodus (u. a. Konjunktiv, wie illustriert) und Tempus kann die intendierte Lesart für die Adressatin mitunter expliziert oder zumindest eingeschränkt werden (z. B. lässt sich mit einer Vergangenheitsform offensichtlich kein Direktivum vollziehen). Auch die grammatische ‘Person’ spielt oft eine Rolle, vgl. den engen Zusammenhang zwischen Identifikativa und der 1. Pers. sg./ pl. Doch häufig sind die sprachlichen Signale auch in der Summe nicht eindeutig, und die Entscheidung der Adressatin fällt per Interpretation im Kontext. 9.2.4. Adverbien Einige der Funktionen der Modalverben können auch von Satzadverbien übernommen werden, die es aber durch die Vielzahl der lexikalischen Möglichkeiten gestatten, erheblich feinere Abstufungen vorzunehmen. So kann man die Einschätzung der Un-/ Gewissheit über das Eintreten eines Sachverhalts mit Wörtern wie zweifellos, höchstwahrscheinlich, möglicherweise etc. markieren. Für den Ausdruck innerer Zustände (also für Identifikativa) stehen dem Sprecher Adverbiale wie leider, glücklicherweise, endlich zur Verfügung, mit denen er seine emotionale Einstellung gegenüber dem beschriebenen Sachverhalt signalisieren kann. Die Abgrenzung zu den Evaluativa ist hier nicht ganz einfach. Wir hatten in Abschnitt 7.4 darauf hingewiesen, dass für das Identifikativum die Beschreibung des inneren Zustands des Sprechers im Vordergrund steht, für das Evaluativum die Bewertung eines externen Gegenstands oder Sachverhalts. Er ist ein kluger Kopf fällt damit in die Kategorie Evaluativum, während Ich freue mich, dass er so ein kluger Kopf ist ein Identifikativum darstellt. In der “Grauzone” liegt Glücklicherweise ist er ein kluger Kopf, doch spricht die Voranstellung des Adverbs hier ebenfalls für die Einordnung als Identifikativum. Bei den Evaluativa lassen sich die Bewertungen natürlich nicht nur mit Adverbien, sondern vor allem mit Adjektiven vornehmen, aber auch mit Substantiven (Mein Klavierlehrer ist ein Gentleman) oder Verben (Mein Klavierlehrer hat versagt). Für die meisten der hier verhandelten Adverbien gilt, dass ihre Verwendung weitgehend auf den Aussagesatz beschränkt ist, sie dienen also in der Tat dazu, Differenzierungen innerhalb des Bereichs des Illokutionstyps Feststellung zu treffen. Vergleiche: ? Kommst Du höchstwahrscheinlich zum Abendessen? / ? Gib mir zweifellos das Buch! 9.3. Verknüpfung von Textsegmenten Nach der Segmentierung des Texts in EDUs und der Identifikation von einzelnen Illokutionen soll uns nun die Frage der Verknüpfung von Segmenten beschäftigen: Wie werden benachbarte Segmente zueinander in Beziehung gesetzt? Dies betrifft sowohl EDUs als auch größere Segmente; wir werden uns im Folgenden wiederum auf die Verknüpfung von EDUs konzentrieren, doch gilt vieles auch für den rekursiven Fall der Verbindung zwischen größeren Segmenten. Um die Bandbreite der sprachlichen Formen zu illustrieren, die für die Aufgabe der Verknüpfung 166 9. Minimale Texteinheiten und ihre Verknüpfung zur Verfügung stehen, betrachten wir die folgenden Textvarianten: (9.7) a Gestern tobte ein heftiger Sturm. Ein Baum wurde entwurzelt. b Gestern tobte ein heftiger Sturm. Dadurch wurde ein Baum entwurzelt. c Gestern tobte ein heftiger Sturm, sodass ein Baum entwurzelt wurde. d Gestern wurde ein Baum entwurzelt, weil ein heftiger Sturm tobte. e Der gestrige heftige Sturm führte dazu, dass ein Baum entwurzelt wurde. f Durch den gestrigen heftigen Sturm wurde ein Baum entwurzelt. g Der gestrige heftige Sturm verursachte einen entwurzelten Baum. h Der gestrige heftige Sturm entwurzelte einen Baum. i Der Grund für den entwurzelten Baum ist der gestrige heftige Sturm. Wenn wir akzeptieren, dass [a]-[i] grosso modo die gleiche Bedeutung haben (die Wahrheitsbedingungen immerhin dürften identisch sein), so sind wir mit einem breiten Spektrum von Möglichkeiten, den kausalen Zusammenhang zweier Ereignisse auszudrücken, konfrontiert. Eine Entscheidung besteht darin, einen oder zwei Sätze zu verwenden. Des weiteren ist die Reihenfolge der Konnekte festzulegen, also entweder die Ursache oder die Folge zuerst zu benennen, vgl. den Unterschied zwischen [c] und [d]. Schließlich kann man für die Verknüpfung explizit ein lexikalisches Element verwenden oder nicht. Und für diesen Zweck stehen unterschiedliche verknüpfende Elemente zur Verfügung: Adverbiale, verschiedene Arten von Konjunktionen, Präpositionen, Nominale, Verben. Bei Abwesenheit eines lexikalischen Signals ([a]) spricht man von asyndetischer Verknüpfung: Die beiden (Teil-) Sätze sind nur durch ein Interpunktionszeichen miteinander verbunden. Dies ist in Texten sicher die häufigste Form der Verknüpfung 3 , die der Leserin dementsprechend viel Freiheit bei der inhaltlichen Deutung des Zusammenhangs lässt - oder anders gesagt: ihr dementsprechend viel Interpretationsarbeit auferlegt. Jedoch lässt sich die Interpretation nicht nur mit lexikalischen, sondern auch mit syntaktischen Mitteln steuern. Ein klares Beispiel sind Konstruktionen wie Hättest Du mir das früher gesagt, wäre ich gekommen, in denen die Kombination aus Verberststellung und Modus der beiden Teilsätze den konditionalen Zusammenhang eindeutig herstellt. Weitere Beispiele für syntaktische Merkmale in asyndetischen Verknüpfungen, die den Interpretationsspielraum zumindest einengen, geben Breindl u. Wassner (2006). Liegt für die Verknüpfung hingegen ein explizites lexikalisches Signal vor, so kann dies ein Konnektor sein, aber auch (s. 9.7[e,g,h]) ein Verb oder ein Substantiv [i]. Gerade der letzte Punkt führt uns wieder zu der im ersten Abschnitt diskutierten Frage der Abgrenzung von EDUs: Wenn ein Verb oder ein Substantiv 3 Beispielsweise berichten Schauer u. Hahn (2001), dass in ihrem Korpus von Artikeln aus Computerzeitschriften etwa 30% der Satzverbindungen lexikalisch markiert sind. 9.3. Verknüpfung von Textsegmenten 167 die Funktion übernimmt, den inhaltlichen Zusammenhang zwischen zwei Sachverhalten zu übermitteln, wie entscheiden wir dann die Frage, ob es sich um eine oder um zwei EDUs handelt? - Dies sind weitgehend ungelöste und bislang auch nur relativ wenig diskutierte Fragen der Diskursstrukturierung, genauer: der Schnittstelle zwischen Satzbedeutung und Textbedeutung. Zum Problem der relationsanzeigenden Verben und Substantive tritt noch das der vielfältigen phrasalen Verknüpfungssignale wie zum Beispiel aus all diesen Gründen. . . (s. auch 9.7[e]), und darüber hinaus das der Interpunktion: Satzzeichen wie Gedankenstrich, Parenthese, Doppelpunkt oder Semikolon können ebenfalls Hinweise auf die Natur des Zusammenhangs zwischen den EDUs liefern. Auch dazu gibt es jedoch nur wenige Untersuchungen. Besser sieht es aus, wenn wir uns im Folgenden auf die Konnektoren beschränken - die glücklicherweise auch die Mehrzahl der in Texten verwendeten Verknüpfungssignale bilden. Auch sie sind nicht ganz einfach abzugrenzen und zu definieren, doch gehören sie geschlossenen Wortklassen an und bilden damit eine noch relativ überschaubare Menge von Einheiten. 9.3.1. Begriffsbestimmung: Konnektor Ein Konnektor 4 verknüpft zwei Textsegmente und zeigt dabei mehr oder weniger klar die Natur des inhaltlichen Zusammenhangs zwischen diesen Segmenten an. Wir nennen das Segment, zu dessen syntaktischer Einheit der Konnektor gehört, das Trägerkonnekt; das damit verbundene ist das Bezugskonnekt. Da es sich bei den Konnektoren nicht um eine in syntaktischer Hinsicht homogene Gruppe handelt, ist es nicht ganz einfach, eine hinlänglich präzise Definition des Begriffs zu geben. Einige Beispiele sahen wir oben in 9.7: die Subjunktoren (unterordnenden Konjunktionen) sodass und weil, die Präposition durch und das Adverb dadurch. Damit ist bereits klar, dass ‘Konnektor ’ keine syntaktische Kategorie sein kann, sondern Lexeme zusammenfasst, welche die funktionale Gemeinsamkeit aufweisen, eine inhaltliche Verknüpfung zwischen Textsegmenten herzustellen, die in aller Regel benachbart sind (auf diesen Punkt kommen wir noch zurück). Die mit Abstand umfangreichste Informationsquelle zu diesem Thema ist das Handbuch der deutschen Konnektoren (Pasch u. a., 2003), im Folgenden HdK, in dem ca. 350 Konnektoren vorwiegend aus syntaktischer Perspektive klassifiziert und ausführlich beschrieben werden. Um ihren Gegenstandsbereich abzugrenzen, haben die Autor/ innen fünf Merkmale (morphologisch, syntaktisch, semantisch) zusammengestellt, anhand derer sich ein Wort x als Konnektor identifizieren lässt (S. 331): (M1) x ist nicht flektierbar. (M2) x vergibt keine Kasusmerkmale an seine syntaktische Umgebung. (M3) Die Bedeutung von x ist eine zweistellige Relation. (M4) Die Argumente der Bedeutung von x sind propositionale Strukturen. 4 Mitunter auch: Konnektiv; englisch: connective 168 9. Minimale Texteinheiten und ihre Verknüpfung (M5) Die Ausdrücke für die Argumente der Bedeutung von x müssen Satzstrukturen sein können. Die obige Definition schließt wegen des Merkmals M2 Präpositionen aus, die aus funktionaler Sicht aber durchaus als Konnektor fungieren können (und dies im Deutschen wegen der Tendenz zu Nominalisierungen auch deutlich häufiger tun als etwa im Englischen); wir sahen oben bereits das Beispiel durch, weitere sind trotz, wegen, aufgrund oder auch das ausgesprochen mehrdeutige bei. Wir zählen daher im Folgenden auch Präpositionen zu den Konnektoren, sofern ihre Verwendung jeweils auch M3-M5 erfüllt; mehr dazu in den nächsten Abschnitten. Entscheidend ist also vor allem die semantische Zweistelligkeit, die Konnektoren insbesondere von anderen Adverbialen abgrenzt, deren Bedeutung in der Modifikation eines einzelnen Arguments besteht (wie zum Beispiel vorwiegend oder auf jeden Fall). Die semantische Zweistelligkeit zu erkennen, ist bereits ein Interpretationsschritt, und wegen der doch recht großen Zahl möglicher Verknüpfungsoperatoren in Texten schlug Knott (1996, S. 78) einen oberflächenorientierten Test für das Englische vor, um die von ihm ‘cue phrases’ genannten Signale für eine Verknüpfung zu erkennen. Er stellt eine Prozedur dar, mit der im Text kompakt formulierte Sachverhalte sukzessive expliziert werden (u. a.: setze Antezedenten für Anaphern und Ellipsen ein; Anpassungen der Wortstellung), bis am Ende eine klar erkennbare Verbindung zweier vollwertiger clauses vorliegt. Wenn dies gelingt, war die ursprüngliche Formulierung tatsächlich eine Kombination aus ‘cue phrase’ und zwei potenziell satzwertigen Elementen. Später hat Grote (2003, S. 85f.) diesen Test für das Deutsche modifiziert und ergänzt, u. a. um die richtige Behandlung von Präpositionalphrasen sicherzustellen. 9.3.2. Syntaktische Charakterisierung Da Konnektoren eine so heterogene Gruppe bilden, ist ihre syntaktische Beschreibung, vor allem im Hinblick auf ihre Wortstellungspräferenzen und -restriktionen, ein sehr komplexes Unterfangen, wie beispielsweise die Beschäftigung mit dem HdK schnell verdeutlicht. Wir beschränken uns hier darauf, in Kürze ein grobes Raster von Kategorien anzugeben und jeweils Beispiele dazu zu nennen. Die vergleichsweise noch am einfachsten zu beschreibende Gruppe sind die Konjunktionen, die in der Satzgrammatik die Aufgabe der Konnexion erfüllen und dementsprechend gründlich untersucht sind. Unterschieden werden hier gemeinhin die nebenordnenden (und, oder) von den unterordnenden Konjunktionen bzw. Subjunktoren (z. B. wenn, weil). Das HdK verwendet für beide den Oberbegriff des nichtkonnektintegrierbaren Konnektors: Er kann allein keine Konstituente eines der beiden Konnekte bilden, in diesem Sinne nicht in ein Konnekt integriert werden. Es ist allerdings für die unterordnende Konjunktion durchaus möglich, zusammen mit dem Trägerkonnekt in den Matrixsatz und damit in das Bezugskonnekt eingebettet zu werden: Wir gehen, weil die Sonne so schön scheint, für eine Stunde in den Park. 9.3. Verknüpfung von Textsegmenten 169 Zu diesen nichtkonnektintegrierbaren Konnektoren zählt HdK noch zwei weitere Kategorien. Postponierer (z. B. sodass) haben die eingeschränkte Funktion, Verbletztsätze einzuleiten, die dem Hauptsatz nachgestellt sein müssen: Die Sonne verschwand, sodass wir wieder umkehrten. Demgegenüber kann der von einem Subjunktor eingeleitete Teilsatz sowohl voranals auch nachgestellt sein. Dies gilt auch für die Verbzweitsatzeinbetter (z. B. vorausgesetzt), die aber nicht mit der gewöhnlichen Nebensatzstellung einhergehen: Wir gehen nachher noch in den Park, vorausgesetzt Du kommst pünktlich. Für die als Konnektor fungierenden Adverbiale (z. B. also, hingegen) gilt, dass ihre semantische Zweistelligkeit (im Gegensatz zu den Konjunktionen) nicht mit einer syntaktischen Zweistelligkeit einhergeht. Weil sie eine Konstituente innerhalb des Konnekts bilden können, nennt HdK sie zur Abgrenzung von den oben besprochenen vier Kategorien integrierbar. Eine prominente Gruppe bilden die Pronominaladverbien (z. B. dadurch und deswegen), die morphologisch eine deiktische Komponente (da-, dar-, desetc.) enthalten. Diese Adverbien scheinen auf den ersten Blick auch semantisch einstellig zu sein, doch verweist eben die deiktische (in Texten: anaphorische) Komponente genau auf das Bezugskonnekt, so dass mit dem Schritt der Anaphernauflösung die Bedingung der Zweistelligkeit wieder erfüllt ist. Aufgrund dieser anaphorischen Funktion von Pronominaladverbien ist es durchaus möglich, dass ein solcher Konnektor gemeinsam mit einer Konjunktion auftritt: Jetzt regnet es schon wieder, aber trotzdem machen wir unseren Spaziergang. Dass dies Folgen für die Beschreibung der Textstruktur hat, werden wir am Ende des Kapitels verdeutlichen. Die Präpositionen sind hinsichtlich der oben genannten Kriterien M3-M5 daraufhin zu untersuchen, ob sie in ihrer jeweiligen Verwendung als Konnektor fungieren. Da in der Präpositionalphrase kein finites Verb auftritt, fällt die Entscheidung, ob es sich um eine “potenzielle Satzstruktur” (im Sinne von Merkmal M5 im letzten Abschnitt) handelt, mitunter nicht leicht. Entscheidend ist, ob die eingebettete Nominalphrase eine Proposition oder einen Gegenstand bezeichnet; dies haben wir in Abschnitt 9.1 angesprochen. Das Problem der Ambiguität “Konnektor oder nicht” stellt sich nicht nur bei Präpositionen, sondern auch bei vielen Adverbien; es trägt seinerseits zur Unübersichtlichkeit der “Landschaft” der Konnektoren bei. So wird allerdings meist als Signal für einen Kontrast (genauer: einer Einschränkung) verwendet, kann aber auch mit Betonung auf der letzten Silbe eine einstellige, affirmative Partikel sein: Du meinst, ich schaffe das nicht? AllerDINGS kriege ich das hin! Besonders augenfällig ist die Ambiguität bei der Gruppe der Pronominaladverbien, was wir hier anhand der Beispiele danach und dabei illustrieren: (1) Die Partei veröffentlichte ihr neues Programm. (2) Danach wird es in der nahen Zukunft keine Steuererhöhungen geben. (2 ′ ) Danach meldeten sich sofort die Gewerkschaften zu Wort. (3) Das Programm wurde weitgehend von der Vorsitzenden verfasst. (4) Dabei half ihr der Generalsekretär. (4 ′ ) Dabei hatte sie die Sache eigentlich dem Präsidium überlassen wollen. 170 9. Minimale Texteinheiten und ihre Verknüpfung Syntaktische Ambiguität besteht auch innerhalb der Gruppe der Konnektoren; als Beispiel sei sowie genannt, das als additive Konjunktion (Sie hat ein ganzes Glas Wein getrunken, sowie die Nudeln verspeist) oder als temporaler Subjunktor auftreten kann (Sowie der Briefträger klingelte, sprang er auf und lief zur Tür). Dieser sehr kurze Blick auf syntaktische Merkmale von Konnektoren soll mit dem Hinweis auf eine weitere Komplikation beschlossen werden, die sich durch mehrteilige Konnektoren ergibt. Zu ihnen zählen entweder-oder und weder-noch, von denen jeweils der zweite Bestandteil auch isoliert auftreten kann, während die Verwendung des ersten die des zweiten erzwingt. Wir bewegen uns hier an der Grenze zu den eingangs erwähnten phrasalen Einheiten, wie insbesondere das Beispiel einerseits-andererseits deutlich macht, von dem diverse Mehrwortvarianten wie auf der einen/ anderen Seite gebräuchlich sind. 9.3.3. Semantik: Relationen, Ambiguität und Vagheit Fragen wir nun nach der Bedeutung eines Konnektors, so richtet sich das Interesse vor allem auf die Art des von ihm signalisierten Zusammenhangs zwischen den Konnekten. Vorschläge für Kategorisierungen finden sich in traditionellen Grammatiken, allerdings verstreut über mehrere Kapitel, da für die Grammatik ja die syntaktische Gruppierung das primäre Ordnungsmerkmal ist; dementsprechend werden Konnektoren an unterschiedlichen Stellen behandelt. Zur Illustration nennen wir die “semantischen Klassen der Adverbialsätze” nach Kap. 19 von Helbig u. Buscha (2001); in den Abschnitt 4.4 und 8.3 schlagen die Autoren ganz ähnliche semantische Klassen der Adverbien bzw. Konjunktionen vor. • Temporalsatz (Gleichzeitigkeit / Vorzeitigkeit / Nachzeitigkeit): Seit ich in Potsdam wohne, hat es nicht mehr geschneit. • Lokalsatz: Ich wohne in Potsdam, wo es selten schneit. • Modalsatz - Instrumentalsatz: Sie arrangierte sich mit Potsdam, indem sie sich mit dem lauen Winter abfand. - M. des fehlenden Begleitumstandes: Er verbrachte einen Winter in Potsdam, ohne dass es jemals schneite. - Komparativsatz: Es hat in Potsdam so wenig geschneit, wie ich erwartet habe. - M. der Spezifizierung: Ein Potsdamer Winter ist insofern eigenartig, als es so gut wie nie schneit. - Restriktivsatz (Einschränkung des Geltungsbereichs): Soweit ich es sehe, schneit es in Potsdam nie. • Kausalsatz - K. im engeren Sinne: In Potsdam schneit es nie. Darum ziehen wir nach Ulm. 9.3. Verknüpfung von Textsegmenten 171 - Konditionalsatz: Wenn es diesen Winter wieder nicht schneit, ziehen wir nach Ulm. - Konzessivsatz: Obwohl es letzten Winter geschneit hat, ziehen wir jetzt nach Ulm. - Konsekutivsatz: Es schneit heute in Potsdam sehr stark, so dass die Parks geschlossen sind. - Finalsatz: Ich ziehe nach Potsdam, damit ich mal wieder Schnee erlebe. • Substitutivsatz: Anstatt dass ich sofort nach Potsdam ziehe, erkundige ich mich erst einmal nach dem Winterwetter. • Adversativsatz: Während es in Potsdam kaum schneit, gibt es in Ulm regelrechte Dachlawinen. Spätestens bei Durchsicht dieser Liste erinnern wir uns an den in Kapitel 8 eingeführten Begriff der Kohärenzrelation. Cause, Concession, Sequence usw. bezeichnen ja Beziehungen, die den oben genannten durchaus nahe kommen. Der Konnektor steht an der Schnittstelle zwischen zwei Segmenten, die nach Relation-basierten Kohärenztheorien die Argumente einer solchen Relation bilden; dann ist der Konnektor ein mehr oder weniger deutliches Signal dafür, um welche Relation es sich handelt. Das Verhältnis zwischen Konnektoren und Kohärenzrelationen ist nun allerdings kein ganz einfaches. Die Mehrzahl der Ansätze zu Kohärenzrelationen entwirft ihr Inventar ohne ausdrückliche Berücksichtigung der sprachlichen Konnektoren, sondern aus “übergeordneten” Erwägungen heraus. Dabei werden zum einen auch Relationen vorgeschlagen, denen typischerweise kein Konnektor entspricht (etwa Background). Zum anderen findet sich beispielsweise Inventar von Mann u. Thompson (1988) die sehr spezifische, nahezu etwas idiosynkratisch anmutende Relation Otherwise (s. Abb. 8.2); gleichzeitig hält aber die Relationsmenge nicht für jeden Konnektor oder dessen semantische Klasse ein direktes Pendant bereit. Ein Beispiel dafür sind die ‘substituierenden’ Konnektoren statt, stattdessen, anstelle von etc., die in den einschlägigen Relationsinventaren wohl unter Contrast oder Antithesis zu subsumieren sind, was dann zu sehr umfassenden und damit wenig aussagekräftigen Kohärenzrelationen führt. Wenn wir dieses Vorgehen als “top-down” bezeichnen (von diskurstheoretischen, philosophischen o. ä. Unterscheidungen ausgehend, hin zu den feineren Unterscheidungen, die die Sprache trifft), so steht dem ein “bottom-up” Ansatz gegenüber, wie wir ihn in Abschnitt 8.1.2 beschrieben hatten: In der Arbeit von Knott u. Dale (1994) wird die Menge der Relationen direkt aus den Konnektoren des Englischen gewonnen. Von den vorgefundenen Daten, nämlich den Konnektoren in (hoffentlich repräsentativen) Verwendungskontexten, werden also abstraktere Prinzipien abgeleitet. 5 Dazu muss eine Systematik entwickelt werden, anhand 5 Der Versuch einer Synthese von top-down und bottom-up findet sich in (Knott u. Sanders, 1998), wo die Autoren ihre älteren Arbeiten (stellvertretend: Knott (1996), Sanders u. a. (1992); vgl. Abschnitt 8.1.1) zueinander in Beziehung setzen. 172 9. Minimale Texteinheiten und ihre Verknüpfung welcher Kriterien die Abstraktion von Konnektoren zu Relationen geschehen soll, m. a. W., welche Gruppe von Konnektoren als Signale derselben Relation zusammengefasst werden sollen. Dies geschieht in aller Regel durch das Instrument des Ersetzungstests, den wir oben im Beispiel 9.7 bereits in sehr allgemeiner Form illustriert haben. Nach Knott (1996, S. 85) gibt es vier mögliche Ergebnisse einer Ersetzungsprüfung zwischen Konnektoren A und B: • A ist synonym mit B, wenn in jedem Kontext, in dem A benutzt werden kann, auch B benutzt werden kann. Beispiel: {Obwohl / obschon}) es regnet, gehen wir in den Park. • A und B sind exklusiv, wenn sie sich in keinem Kontext gegenseitig ersetzen können. Beispiel: trotz / wegen • A ist Hyperonym von B (und damit B Hyponym von A), wenn B in jedem Kontext durch A ersetzt werden kann, A aber nicht in jedem Kontext durch B ersetzt werden kann. Beispiel: aber / allerdings • A und B sind bedingt substituierbar, wenn es Kontexte gibt, in denen A und B sich gegenseitig ersetzen können, aber auch Kontexte, in denen jeweils nur A und nur B verwendet werden können. Beispiel: allerdings / dennoch (1) Die Bayern haben eigentlich ein ganz gutes Spiel gemacht. (2) {Allerdings / Dennoch} sind wir nicht so richtig begeistert. (2 ′ ) {Allerdings / ? Dennoch} war die Abwehr ein bisschen angeschlagen. (2 ′′ ) {Dennoch / ? Allerdings} haben sie danach den Trainer entlassen. Wenn wir uns die syntaktische Vielfalt der Konnektoren in Erinnerung rufen, wird rasch deutlich, dass ein Ersetzungstest allerdings nicht so unkompliziert verläuft wie beispielsweise einer für Substantive. Da wir uns für die funktionalen Gemeinsamkeiten der Konnektoren interessieren, muss erlaubt sein, dass die Konnektorenersetzung mit syntaktischen Umstellungen einhergeht. Dementsprechend sieht Knott (1996, S. 71) nach dem Austauschen eines Konnektors etwaig notwendige Anpassungen in der Interpunktion sowie bei vom Konnektor abhängigen Wörtern im Satz vor. Die Ersetzung stuft er dann als geglückt ein, wenn der neue Text dieselben Sachverhalte beschreibt und die gleichen Ziele erreicht wie der alte; es sei nicht relevant, wenn sich stilistische Unterschiede einstellen, die Konnektoren eigentlich für Textspannen unterschiedlicher Größe funktionieren, oder unterschiedliches Hintergrundwissen für die Interpretation der beiden Texte vorausgesetzt wird. Eine Anwendung des Ersetzungstests für kontrastive Konnektoren des Deutschen zeigt Stede (2004a) und weist darauf hin, dass für die Beurteilung des “identischen Sachverhalts” insbesondere der Skopus des jeweiligen Konnektors eine zentrale Rolle spielt. Die Untersuchung zeigt eine sehr hohe Ähnlichkeit zwischen aber, doch und jedoch, und jeweils Überlappungen zwischen dieser Gruppe und den einzelnen Konnektoren hingegen, allerdings und dennoch. Zwischen hingegen und dennoch ergibt sich jedoch keine Überlappung, d. h., in keinem der un- 9.3. Verknüpfung von Textsegmenten 173 tersuchten Korpusbeispiele waren diese Konnektoren bedeutungserhaltend austauschbar. Im Ergebnis schlägt Stede (2004a) dann eine feinkörnigere Aufteilung der von RST vorgeschlagenen Relationen Contrast, Antithesis, Concession vor. Eine solche bottom-up Herangehensweise, die Relationen aus Konnektoren gewinnt, fasst die zu einer Relation zählenden Konnektoren als Wortfeld auf (siehe dazu Lutzeier, 1981). Sie ergibt für relativ klar abgrenzbare Relationen wie etwa die Concession eine zuverlässige Menge von sie ausdrückenden Konnektoren (obwohl, dennoch, trotzdem, trotz und andere) mit nur wenigen an der Peripherie des Feldes liegenden Vertretern - für die Concession ist es aber, das mitunter ein konzessives Verhältnis, darüber hinaus aber auch andere kontrastive Verhältnisse signalisieren kann. Das bottom-up Vorgehen führt (ähnlich zu den von Grammatiken vorgeschlagenen semantischen Gruppen) in aller Regel zu feineren Aufteilungen und damit zu mehr Kohärenzrelationen als sie von top-down Ansätzen vorgeschlagen werden. Die zentrale Forschungsfrage besteht also darin, einen Brückenschlag zwischen beiden Perspektiven vorzunehmen und die “Korngröße” der Ebene zu motivieren, auf der Kohärenzrelationen einerseits diskurstheoretisch (oder kognitiv oder philosophisch) begründet werden können und sie andererseits sinnvolle Abstraktionen der in der Sprache vorgefundenen Konnektoren vornehmen. Wie auch in “klassischen” Wortfeldern (die Theorie wurde ursprünglich für Inhaltswörter und nicht für Funktionswörter vorgeschlagen) kann man im nächsten Schritt durch vergleichende Analyse der Konnektoren innerhalb eines Feldes nach Merkmalen suchen, anhand derer sich die Wörter jenseits der gemeinsamen Grundbedeutung weiter differenzieren lassen. Dazu zählen einzelne semantische Merkmale wie im Falle kausaler Konnektoren etwa das der Volitionalität (vgl. die Kohärenzrelationen Non- / Volitional-Cause in der Rhetorical Structure Theory, Abschnitt 8.2): Bei Verwendung von durch ist die Verursachung in aller Regel nicht von einer handelnden Person willentlich herbeigeführt, vielmehr sind die Verursacher Naturgewalten oder unbeabsichtigt eingetretene Ereignisse. Der Konnektor damit (in der Lesart als finaler Subjunktor) hingegen kann nur eine intendierte, zielgerichtete Verursachung anzeigen: Durch das Gewitter wurden drei Telefonmasten beschädigt. / Ich gebe Dir heute zwei Butterbrote, damit Du in der Pause nicht wieder hungrig bist. Ein anderes Differenzierungsmerkmal für Konnektoren betrifft die Möglichkeit, informationsstrukturelle Gliederungen anzuzeigen. So unterscheiden sich zum Beispiel die sehr bedeutungsähnlichen hingegen und demgegenüber: (1) Die älteren Kinder liefen über die Straße. (2) Sabine {hingegen / ? demgegenüber} wartete, bis die Ampel grün wurde. (2 ′ ) {Hingegen / Demgegenüber} wartete Sabine, bis die Ampel grün wurde. Darüber hinaus betritt man mit der Wortfeldanalyse auch die Gebiete der regionalen und der medialen Variation (etwa zur Differenzierung zwischen obwohl, obschon, obzwar), sowie das der Stilistik, das die Unterschiede zwischen dem sehr gebräuchlichen trotzdem und den selteneren nichtsdestotrotz / nichtsdestoweniger / dessenungeachtet durch Angabe von Merkmalen wie ‘Formalität’, wohl auch durch die Unterscheidung zwischen gesprochener und geschriebener Sprache, deuten 174 9. Minimale Texteinheiten und ihre Verknüpfung müsste. Eine weitere, wenig überraschende Parallele zu “klassischen” lexikalischen Untersuchungen besteht darin, dass die Aufteilung in Felder keineswegs durch einfach erkennbare, klare Grenzen gekennzeichnet ist. Vielmehr treffen wir auf die gewohnten Probleme der Ambiguität und der Vagheit. Beide lassen sich nur relativ zu einem Kategorisierungsraster beschreiben, das wir hier wie gesagt in Gestalt von Kohärenzrelationen zugrundelegen. • Ambiguität: Die Bedeutung eines Konnektors ist ambig, wenn er mehr als eine Relation signalisieren kann, die nicht in einem Verhältnis unterschiedlicher Spezifizität zueinander stehen. Beispiel: während - Während mein Bruder rote Haare hat, ist meine Schwester blond. (Contrast) - Während ich schlief, kam mir eine gute Idee. (Temporal-Simultaneity) • Vagheit: Die Bedeutung eines Konnektors ist vage, wenn er mehrere Interpretationen zulässt, die auch unterschiedlich spezifisch sein können; seine eher unspezifische Grundbedeutung ist im Kontext genauer interpretierbar. Beispiel: und - Ich lief zur Schule und kam gerade noch pünktlich an. (Temporal-Sequence) - Mein Bruder hat rote Haare und meine Schwester ist blond. (Contrast? List? ) - Ich lief zur Schule und Marianne lief zum Kindergarten. (Contrast? List? Temporal-Sequence? Temporal-Simultaneity? ) Unsere obigen Beispiele für das ambige während sind eindeutig, doch fällt die Interpretation nicht immer so leicht, denn temporale Gleichzeitigkeit und Kontrastivität schließen sich ja keineswegs aus: Während ich schlief, hat meine Schwester noch gelesen. Mitunter kann aufgrund von Parallelität der Strukturen, Tempus, Aspekt und anderen Merkmalen eine eindeutige Interpretation gewonnen werden, doch ist dies nicht immer möglich. Exemplarisch geben Breindl u. Wassner (2006) für den Konnektor schließlich entsprechende Desambiguierungsmerkmale an, um zwischen der temporalen und der folgernden Lesart zu unterscheiden; vgl. dieses Beispiel: (1) Einer nach dem anderen traf auf dem Sportplatz ein. (2) Schließlich trottete auch Freddi heran. (2 ′ ) Schließlich hatte der Trainer um pünktliches Erscheinen gebeten. Die Vagheit eines Konnektors kann in einer dekompositionellen Bedeutungsanalyse so aufgefasst werden, dass sie hinsichtlich bestimmter Merkmale nicht spezifiziert ist, also die Werte offen lässt. Im jeweiligen Kontext können diese dann durch die Interpretation der Konnekte belegt werden - oder auch nicht. Im ersten Fall resultiert eine spezifische Kohärenzrelation (analog zu den obigen während- Beispielen); im zweiten Fall verbleibt die Relation unspezifisch. Dieser Ansatz impliziert, dass die Kohärenzrelationen nicht alle auf der gleichen Abstraktionsebene angesiedelt, sondern in einer Taxonomie organisiert sind. Dann kann man und eine abstrakte Relation wie Additive zuordnen und zulassen, dass der Konnektor in 9.3. Verknüpfung von Textsegmenten 175 bestimmten Kontexten zu einer spezielleren Relation “überinterpretiert” werden kann, beispielsweise zu Contrast. Ähnliches gilt für aber, das die Art des kontrastiven Zusammenhangs mehr oder weniger spezifisch signalisieren kann (siehe dazu Umbach, 2001). Eine solche Merkmal-basierte Behandlung der Vagheit liefert also ein Motiv für die Dekomposition von Relationsdefinitionen, wie sie von Sanders u. a. (1992) vorgeschlagen worden war, vgl. Abschnitt 8.1.1. 9.3.4. Pragmatik: Verknüpfungsebenen und Präsuppositionen Am Ende dieser kurzen Betrachtung der Konnektoren schlagen wir wieder den Bogen zum ersten Abschnitt des Kapitels zurück und fragen, von welcher Art die von Konnektoren verknüpften Objekte eigentlich sind bzw. sein können. 6 Dazu streifen wir eine in der deutschsprachigen Forschungsliteratur sehr intensiv geführte Diskussion 7 um drei im weiten Sinne kausale Konnektoren. Beginnen wir mit dem Unterschied zwischen denn und weil, den Wunderlich (1980, S. 113) mit folgendem Beispiel illustriert: (9.8) a Draußen ist es so nass, weil es die ganze Nacht geregnet hat. b ? Draußen ist es so nass, denn es hat die ganze Nacht geregnet. c Er muss zuhause sein, denn in der Uni habe ich ihn nicht gesehen. d Er muss zuhause sein, weil ich ihn in der Uni nicht gesehen habe. Wunderlich (und andere) nennen denn einen ‘argumentativen’ Konnektor und weil einen ‘nicht-argumentativen’ bzw. ‘propositionalen’. Anders ausgedrückt, denn liefert eine Begründung für den vorangegangenen Satz - weshalb dieser zunächst einmal prinzipiell “begründbar” sein muss. In [c] ist dies der Fall, da die Sprecherin offenkundig eine These aufstellt. In [b] hingegen ist die Situation anders, weil die Information “draußen ist es so nass” eher nicht als neue, in den Raum gestellte Hypothese interpretiert wird. 8 Damit können wir den Bogen zu den im letzten Abschnitt behandelten Illokutionstypen schlagen. Angewandt auf die Beschreibung von denn: Der vorangehende Satz muss ein Estimativum oder ein Evaluativum sein, um “begründbar” zu sein - aber jedenfalls keine Feststellung. Die Konjunktion weil ist in dieser Hinsicht flexibler und kann neben ihrer hauptsächlichen Verwendung (Verknüpfung von Propositionen) mitunter auch in eigentlich argumentativen Situationen gebraucht werden. 9 In [d] wird das Zuhause-Sein ja 6 Wir subsumieren diese Diskussion unter ‘Pragmatik’, ohne die bekanntlich schwierige Frage der Abgrenzung zwischen Semantik und Pragmatik hier zu erörten. 7 Zahlreiche Verweise auf Quellen und Terminologievorschläge finden sich beispielsweise in (Nussbaumer, 1991, S. 190ff.). 8 Verantwortlich dafür ist neben dem “beschreibenden” Inhalt der Aussage hier auch die Modalpartikel so. 9 Damit verbunden ist die in der Literatur ebenfalls ausgiebig diskutierte Beobachtung, dass in der gesprochenen Sprache weil zunehmend auch Verbzweitsätzen vorangestellt wird, wo traditionell eigentlich denn seinen Platz hat. 176 9. Minimale Texteinheiten und ihre Verknüpfung keineswegs vom Nicht-gesehen-Haben verursacht, sondern letzteres ist wiederum nur ein “Symptom”, das auf ersteres hindeutet. Nehmen wir die Darstellung der Satzbedeutung als F(RP) aus Abschnitt 7.1 wieder auf, so lässt sich die Beobachtung so formulieren, dass denn eine Verknüpfung auf der Ebene der illokutiven Rolle, also F leistet, während weil primär auf der Propositionebene RP verknüpft, aber auch auf F ausgedehnt werden kann. An dieser Stelle schließt sich dann auch der Kreis zur Aufgabe der Bestimmung von EDUs: Wenn weil “klassisch” Propositionen verknüpft, können wir (mit Nussbaumer (1991) und anderen) insgesamt nur eine Illokution für den komplexen Satz annehmen; schematisch: F(weil(R1P1, R2P2)). Wohingegen denn auf jeden Fall zwei separate Illokutionen verbindet: denn(F1(R1P1), F2(R2P2)). Zur Ergänzung werfen wir noch einen Blick auf die Konjunktion da. Sie wird in der Literatur häufig in die Nähe von denn gerückt, da sie ebenfalls argumentativ orientiert sei. Dafür spricht, dass wir in Beispiel 9.8[d] für weil durchaus da einsetzen können und einen akzeptablen Satz erhalten. Demgegenüber ist in Beispiel 9.9[b] (von Pasch, 1989) ein da nicht möglich, weil eben nicht für die Gültigkeit des voranstehenden Satzes er schläft argumentiert wird - dass dies der Fall ist, davon sind ja beide Gesprächspartner bereits überzeugt. (9.9) a Hans schläft wieder. — Ja, aber er schläft, weil er zuviel arbeitet. b Hans schläft wieder. — Ja, aber er schläft, ∗ da er zuviel arbeitet. c Hans schläft schon wieder, und er wird Ärger bekommen, weil er schon wieder schläft. d Hans schläft schon wieder, und er wird Ärger bekommen, ∗ da er schon wieder schläft. Ganz ähnlich zu der Differenzierung zwischen den englischen Konnektoren because und since (in kausaler Verwendung) ist da dadurch gekennzeichnet, dass es eine Präsupposition trägt, wonach die damit eingeleitete Information der Hörerin bereits bekannt sein sollte, sie wird als “unterstellt” markiert. Sowohl weil als auch denn hingegen liefern entweder eine neue Information (z. B. in 9.8[a]) oder stellen heraus, dass die folgende Information als Grund für etwas fungiert (was dann der “neue” Informationsanteil ist), wie in 9.9[c]. Ein Hinweis auf diesen “unterstellenden” Bedeutungsanteil von da liegt auch in seiner auffällig häufigen Kollokation mit der Partikel ja, die dieselbe Präsupposition übermitteln kann: Da Sie unsere Zahlungsbedingungen ja kennen, gehen wir von einer unverzüglichen Überweisung des Betrages aus. Zu dem propositionsverknüpfenden und dem illokutionsverknüpfenden Gebrauch (mancher) kausaler Konnektoren tritt noch ein sprechaktverknüpfender hinzu, auf den u. a. Küper (1984) hingewiesen hat. 10 Er nennt zur Illustration eine bekannte Zeile der Rolling Stones: I can’t get no satisfaction, ’cause I try and I 10 Küper nennt dafür zwei Kategorien, den “parenthetisch-explikativen” und den “sprechaktbezogenen” Gebrauch, doch der Unterschied erscheint nur marginal. 9.3. Verknüpfung von Textsegmenten 177 try and I try. Die zahllosen Versuche werden kaum die Ursache des Misserfolgs sein (was der propositionalen Lesart entspräche), vielmehr ist die Schilderung der Versuche der Grund für die Schilderung des Misserfolgs. Weitere Beispiele für die Verknüpfung von Sprechakten sind diese: (9.10) Falls Du durstig bist, im Kühlschrank ist ein Bier. (9.11) Wollen wir den zweiten Zahn auch heute gleich ziehen, da Sie so eine weite Anfahrt haben? Um die Lesarten transparent zu machen, hilft das, was bereits Austin (1975) vorgeschlagen hatte (vgl. Abschnitt 7.1): das “Ausbuchstabieren”, die Umformung zum expliziten Sprechakt. Daraus resultieren diese beide Varianten: Im Kühlschrank ist ein Bier. Ich weise darauf hin für den Fall, dass Du durstig bist. / Wollen wir den zweiten Zahn auch gleich ziehen? Ich schlage das vor, weil Sie so eine weite Anfahrt haben. Diese Beobachtungen hat Sweetser (1990) verallgemeinert und die These aufgestellt, dass zumindest kausale und adversative 11 Konnektoren auf drei verschiedenen Ebenen operieren können. Damit ersetzt sie die individuelle Polysemie von einzelnen Konnektoren durch die These einer generellen systematischen Pragmatik-basierten Ambiguität. Die Ebenen sind: • Propositional: verknüpft werden Aussagen über die Welt, und auch der behauptete Zusammenhang besteht in der Welt. (Beispiele 9.8[a], 9.9[a]) • Epistemisch: verknüpft werden Überzeugungen des Sprechers (im kausalen Fall: eine auch für den Hörer bereits akzeptable Proposition mit einer Folgerung, die zunächst nur die Sprecherin akzeptiert) (Beispiel 9.8[c]; oben bezeichnet als Verknüpfung auf der Ebene der illokutiven Rolle) • Sprechakt: verknüpft werden komplette Sprechhandlungen (Beispiele 9.10, 9.11) Eine vierte Ebene der Verknüpfung ist die mitunter als textuell, häufiger als metakommunikativ bezeichnete. Allgemein werden auf dieser Ebene Gliederungshinweise angesiedelt, die die Autorin der Leserin an die Hand gibt (im Folgenden besprechen wir zunächst X und dann Y), sowie anderweitige Referenzen auf den Text selbst (Dies hatten wir im letzten Abschnitt bereits gezeigt). In der Literatur werden gelegentlich auch Umschreibungen und Verdeutlichungen als metakommunikative Elemente betrachtet: Wir sollten dringend mit der Befragung beginnen, also den Klienten herein bitten und unsere Fragen stellen. Brandt u. Rosengren (1992) beispielsweise würden den zweiten Satz nicht als eigenständige Illokution auffassen (in ihrer Sichtweise, wonach eine Illokution eine Rolle in der Struktur aus Stützungsbeziehungen spielt; vgl. Abschnitt 7.2.2). Das also im letzten Beispiel verdeutlicht, dass die Fragestellung auch für die Untersuchung der Konnektoren relevant ist: Es 11 Eine Replik auf Sweetser ’s Vorschlag, speziell für den Bereich der adversativen Konnektoren, gibt Lang (2000). 178 9. Minimale Texteinheiten und ihre Verknüpfung operiert auf keiner der von Sweetser unterschiedenen Ebenen, sondern auf der textuellen. Auch temporale Konnektoren werden häufig textuell gebraucht. So kann man mit zunächst und schließlich einerseits die Reihenfolge von Ereignissen in der Welt beschreiben, andererseits aber auch eine Anordnung der Elemente eines Textes vornehmen: Wir können Frau Müller nun wirklich nicht länger beschäftigen. Zunächst, sie kommt fast jeden Tag zu spät. Die Kolleginnen beschweren sich schon über ihre vielen Krankheitszeiten. Und schließlich, sie verstößt immer wieder gegen unser Rauchverbot. Zum Abschluss dieser Darstellung der Konnektoren-Problematik soll illustriert werden, dass gerade für argumentative Texte die “Konnektorenstruktur” wichtige, an der Textoberfläche unmittelbar ablesbare, Hinweise auf die Textstruktur liefert. Als Beispiel wählen wir den Kreisel Text aus Abb. 7.7 von Seite 116. Wenn wir die einzelnen Segmente durch Zahlen ersetzen und lediglich Konnektoren und die segmentverbindenden Interpunktionszeichen darstellen, so erhalten wir: (1). Selbst wenn (2). (3). Aber (4). (5). Nicht nur (6), sondern (7). Zwar (8). Aber (9). (10), (11). (12). (13). Und (14). (15), zudem (16). (17). Aber (18). (19). 9.4. Fazit: Die Rolle der Korpusannotation Leser konstruieren Textrepräsentationen aus abstrakten, semantischen und pragmatischen Einheiten, denn sie interpretieren den Text Stück für Stück, und das, was sie zusammenfügen, sind die (Zwischen-) Resultate dieser Interpretation. So werden beispielsweise Illokutionen mit Propositionen zu Sprechakten verbunden, die ihrerseits als Bestandteile in Kohärenzrelationen eingehen können. Mangels “Zugang” zu mentalen Repräsentationen bleibt uns (neben gezielten psycholinguistischen Experimenten) nur der Text selbst als Studienobjekt. Wenn wir uns in diesem Kapitel mit verschiedenen Phänomenen der sprachlichen Oberfläche befasst haben, dürfen wir also nicht vergessen, dass diese nur ein “indirektes” Bild der Kohärenz von Texten liefern. So sind die grammatischen Eigenschaften der im letzten Abschnitt diskutierten Konnektoren einerseits auf die syntaktischen Gegebenheiten in den verbundenen Textsegmenten bezogen; aber andererseits findet die inhaltliche Verknüpfung auf der Basis semantisch und - besonders im Fall der am Ende angesprochenen Sprechaktverknüpfung - pragmatisch interpretierter Einheiten statt. Die sprachlichen Ausprägungen dieser abstrakten Einheiten sind zunächst die EDUs, dann aber - und das ist eines der ganz wichtigen Postulate einer Theorie wie der RST - rekursiv auch längere Abschnitte: Danach sind es dieselben Relationen, die sowohl EDUs als auch bereits gebildete Segmente aus Relationen und EDUs zueinander in Beziehung setzen. Ob dies tatsächlich stimmt, oder ob es Gründe gibt, je nach Größe der Segmente Unterschiede in den Kohärenzrelationen anzunehmen, ist eine empirisch zu untersuchende Frage, die von der Verfügbarkeit analysierter Daten profitiert. Aus diesem Grund haben wir bereits an 9.4. Fazit: Die Rolle der Korpusannotation 179 verschiedenen Stellen des Buches auf die Notwendigkeit der Erstellung präziser Annotationsrichtlinien verwiesen. Die Faktoren, die dazu beitragen, dass eine Leserin einem Textsegment eine bestimmte vom Autor intendierte Illokution zuschreibt, sind - wie im zweiten Abschnitt gesehen - sehr vielfältig, und ihr Zusammenspiel kann recht kompliziert werden. Von einem auch nur annähernd “vollständigen” Katalog von Merkmalen und ihrer Zuordnung zu Illokutionstypen sind wir heute noch weit entfernt: Weder sind die die Merkmale, ihre Interaktionen und ihre Bezüge zum Kontext systematisiert, noch besteht überhaupt Einigkeit über ein zugrunde zu legendes Inventar von Illokutionstypen. Wie lassen sich hier mit einem korpusorientierten Vorgehen Fortschritte erzielen? Indem eine überschaubare Menge von Illokutionen, am besten texttypund/ oder textsortenspezifisch ohne Bezug zu sprachlichen Merkmalen so präzise charakterisiert werden (etwa im Stil der ‘Bedingungen’ von Motsch, s. Abschnitt 7.4), dass Annotatoren anhand dieser Vorgaben in der Lage sind, für die EDUs eines Textes Illokutionen zu benennen, und dabei möglicht wenig arbiträre Entscheidungen treffen müssen (wenn die Anweisungen nicht alle Fälle präzise erfassen). Sobald auf diese Weise eine größere Menge annotierter Daten entsteht, kann man sowohl qualitativ als auch quantitativ die Korrelationen mit sprachlichen Oberflächenmerkmalen untersuchen; die so gefundenen Hypothesen sind dann daraufhin zu prüfen, ob sie auf andere Texttypen und -sorten übertragbar sind. Sind die Daten allgemein zugänglich, können die Hypothesen auch von anderen überprüft, verfeinert oder revidiert werden - und die neuen Hypothesen lassen sich jeweils auch an denselben Daten daraufhin überprüfen, ob sie wirklich empirisch adäquater sind. Aktuelle Aktivitäten zur Schaffung von Annotationsrichtlinien für die oberflächennahen Aspekte der Textstruktur umfassen einerseits die Segmentierung, dazu hatten wir in Abschnitt 9.1 die Arbeiten von Carlson u. Marcu (2001) für das Englische und von Jasinskaja u. a. (2007) für das Deutsche genannt. Erstere wurden in der RST Treebank (s. Abschnitt 8.6) exemplarisch umgesetzt; letztere werden die Grundlage für eine erneuerte Segmentierung im Potsdamer Kommentarkorpus bilden. Ein Projekt, das sich der Markierung von Konnektoren und ihrem Skopus als ergänzende Schicht bereits annotierter (englischsprachiger) Korpora verschrieben hat, ist die Penn Discourse Treebank (Prasad u. a., 2004). Hierfür wird das Werkzeug WordFreak 12 eingesetzt. Auch im Potsdamer Kommentarkorpus ist eine solche Annotationsschicht vorhanden, für die Erstellung wurde gezielt das halbautomatisch arbeitende Werkzeug ConAno implementiert (Stede u. Heintze, 2004). Weiterhin wird auch im Projekt HyTex 13 neben anderen diskursbezogenen Phänomenen die Konnexion untersucht und in Korpora annotiert, speziell unter dem Gesichtspunkt der Konversion von Texten zu Hypertexten. 12 wordfeak.sourceforge.net 13 www.hytex.uni-dortmund.de 180 9. Minimale Texteinheiten und ihre Verknüpfung 9.5. Weiterführende Literatur Zur Textsegmentierung hatten wir in Abschnitt 9.1 bereits auf die einschlägigen Annotationsrichtlinien verwiesen. Die Identifikation von Illokutionen wird in den korpus- (aber papier-) basierten Studien von Morgenthaler (1980) und Schmitt (2000) behandelt; eine ausführliche Verbindung zur Diskussion in der linguistischen Pragmatik bietet Liedtke (1998). Einen ausführlicheren Überblick über die verschiedenen Spielarten der Satzverknüpfung vermittelt Fabricius-Hansen (2000). Zu den deutschen Konnektoren ist die wichtigste Quelle das Handbuch von Pasch u. a. (2003). Einträge zu den einzelnen Konnektoren finden sich auch in dem vom Institut für deutsche Sprache online zur Verfügung gestellten ‘Grammatischen Wörterbuch’, das Teil des Informationssystems grammis 14 ist. Die Menge der Untersuchungen zu einzelnen Konnektoren oder Gruppen ist kaum überschaubar, doch für die Recherche bietet grammis auch eine sehr umfangreiche online-Bibliografie, erreichbar über die genannte URL unter “Grammatische Bibliografie”. 9.6. Übungsaufgaben 1. Überprüfen Sie im Lichte der Ausführungen des ersten Abschnitts noch einmal die Segmentierung Ihres Kommentars in EDUs, die Sie in Übung 1 von Kapitel 7 (S. 128) zunächst rein intuitiv vorgenommen hatten. 2. In Übung 2 auf S. 128 hatten Sie den EDUs Illokutionstypen zugewiesen. Untersuchen Sie jetzt, wie diese Typen mit Oberflächenmerkmalen der in Abschnitt 9.2 besprochenen Art korrelieren. 3. Identifizieren Sie in Ihrem Kommentar alle Konnektoren und legen Sie ihren Skopus fest: Welche Textabschnitte werden jeweils verknüpft? 4. Untersuchen Sie jeden Konnektor daraufhin, auf welcher Ebene (vgl. Abschnitt 9.3.4) die Verknüpfung erfolgt. 5. Betrachten Sie jetzt jede Verbindung zwischen Textsegmenten, die nicht durch einen Konnektor markiert ist, sondern nur durch Interpunktionszeichen. Welcher Konnektor könnte hier stehen, ohne dass sich die Textbedeutung ändern würde? Machen Sie sich jeweils klar, warum dieser hypothetische Konnektor an der entsprechenden Stelle redundant ist. 14 hypermedia.ids-mannheim.de 10. Interaktionen zwischen Ebenen: Entstehung von Kohärenz “Divide et explana” Die Fragen, wie Texte “funktionieren”, wie ihre Autoren mit ihrer Hilfe Ziele verfolgen, und was diese Texte im Innersten zusammenhält, sind trotz vieler seit dem Aufkommen der Textlinguistik gewonnener Einzelerkenntnisse bis heute nur unvollständig zu beantworten. Dieses Buch hat nicht den Versuch unternommen, dazu eine geschlossene Theorie vorzulegen, sondern vielmehr soll ein Programm vorgeschlagen werden, um die Suche nach umfassenderen und aussagekräftigeren Antworten zu befördern: das der korpusgestützen Entwicklung eines Ebenen- Modells. Dabei haben wir nicht nur Lösungsvorschläge gesammelt, sondern auch vielerlei offen bleibende Fragen genannt. Insbesondere haben wir für die Ebenen hier jeweils keine kompletten Annotationsrichtlinien vorgeschlagen, sondern lediglich Wegweisungen für deren Entwicklung angegeben. (Verweise auf existierende Annotationsrichtlinien finden sich im Text, aber auch gesammelt auf der Webseite des Buches.) Um die zusammengetragenen Bausteine jetzt noch einmal abschließend zu beleuchten, wenden wir uns drei Aspekten zu: den behandelten Ebenen, der Rolle von annotierten Daten und der Erkundung von Interaktionen zwischen einzelnen Ebenen, die uns dem Verständnis von Kohärenz näherbringen soll. 10.1. Die Ebenen In den Kapiteln 4 bis 8 haben wir eine Reihe von Beschreibungsebenen für Texte untersucht und anschließend in Kapitel 9 einige Aspekte der sprachlichen Realisierung behandelt. Um nun also den Blick wieder auf die Synthese der Ebenen zu lenken, sei zunächst noch einmal in Kürze zusammengestellt, was das jeweils zentrale Anliegen der sechs Ebenen ist, von denen die ersten zwei unabhängig vom Texttyp relevant sind, während die übrigen je nach Texttyp eine unterschiedlich wichtige Rolle spielen. Referenzielle Struktur. Eine zentrale Säule der Kohärenz von Texten ist die Koreferenz: sprachliche Ausdrücke verweisen aufeinander (mit Pro-Formen) bzw. auf dieselben Diskursgegenstände. Die referenzielle Struktur bildet dies mit referenziellen Ketten ab, die für jeden Diskursgegenstand anzeigen, wann und wie im Text auf 182 10. Interaktionen zwischen Ebenen: Entstehung von Kohärenz ihn verwiesen wird. Im einfachen Fall sind dies direkte Wiederaufnahmen, während es bei indirekten Wiederaufnahmen oder bridging Anaphern oft schwierig zu entscheiden ist, ob ein neuer Gegenstand eingeführt wird oder auf einen bereits eingeführten Bezug genommen wird. In Abhängigkeit vom jeweils letzten Auftreten des Gegenstands und der syntaktischen Realisierung kann man jedes Glied der referenziellen Kette mit einem Aktivierungsgrad versehen. Eine weitere Komplikation bringen Ereignisanaphern mit sich, die nicht auf Gegenstände im engeren Sinne, sondern auf Sachverhalte/ Ereignisse verweisen, denn hier können Antezedenten komplex und von sehr unterschiedlicher Form sein. Thematische Struktur. Die für den Text bzw. einen Textabschnitt längsten referenziellen Ketten geben Hinweise auf das Thema des Texts bzw. Textabschnitts. Es kann durch den prominentesten Diskursgegenstand angemessen benannt sein; je nach Textsorte und Texttyp können jedoch auch Aussagen oder Fragestellungen eine adäquate Themenbeschreibung darstellen. Die thematische Struktur macht dies explizit; sie geht davon aus, dass ein Abschnitt jeweils ein Thema behandelt, das aber in einer Teil-von-Beziehung zum Thema eines längeren Abschnitts stehen kann, in den er eingebettet ist. Aus der thematischen Textstruktur ist also zu entnehmen, wann sich ein Thema ändert, wann von einem allgemeinen zu einem speziellen Thema gewechselt und ggf. wieder zurückgekehrt wird. Temporale Struktur. Wenn Texte über mehrere, möglicherweise komplexe, Ereignisse berichten, kann es für den Leser mehr oder minder schwierig sein, die beschriebene Abfolge von Ereignissen und Teilereignissen zu rekonstruieren. Dies ist besonders im narrativen Text ein wesentlicher Aspekt des Textverstehens. Die temporale Struktur macht die dem Text zu entnehmende Information über zeitliche Abfolge- und Inklusionsbeziehungen zwischen beschriebenen Ereignissen explizit. Darüber hinaus kann sie die im Text genannten temporalen Referenzpunkte (im Jahr 1962; am Sonntag) festhalten und zueinander in Beziehung setzen (zwei Tage später), womit auch die Ausdehnung bzw. der Abstand zwischen Ereignissen repräsentiert werden kann. Illokutionsstruktur. Ist die primäre Textfunktion appellativ, möchte die Autorin also aktiv Einfluss auf die Einstellung oder das Handeln des Lesers nehmen, so ist die Illokutionsstruktur eine zentrale Beschreibungsebene. Sie legt zunächst die illokutiven Rollen der minimalen Diskurseinheiten fest und setzt dann diejenigen Einheiten zueinander in Beziehung, deren Illokutionen sich gegenseitig stützen - wo also die eine zum Gelingen der anderen beiträgt (Dependenzmodell). Alternativ kann man sich von den minimalen Einheiten lösen und jeweils Textabschnitten eine ‘Teiltexthandlung’ zuweisen und diese dann zueinander in Beziehung setzen (Konstituentenmodell). Argumentationsstruktur. Für den argumentativen Text geht die Argumentationsstruktur einen Schritt weiter und stellt auf einer abstrakteren Ebene (d. h. unab- 10.2. Die Rolle von Text-Daten für die Text-Analyse 183 hängiger von der Textoberfläche) dar, wie der Autor seine zentrale These abstützt und dabei möglicherweise auch Gegenargumente in Betracht zieht und diese entkräftet. Rhetorische Struktur. Die rhetorische Struktur erhebt - anders als die bisher genannten Ebenen - auf der Basis einer relativ breiten Menge von Kohärenzrelationen eine Art “Alleinvertretungsanspruch”: Sie möchte die Kohärenz des Textes dadurch erklären, dass sowohl die minimalen als auch (rekursiv) die größeren Diskurseinheiten mit ganz unterschiedlichen Relationen zu einer Baum- oder Graphstruktur verbunden werden. Im Fall der Rhetorical Structure Theory ist es eine Baumstruktur, und zwischen zwei Einheiten kann jeweils nur eine Relation bestehen: Man kann also entweder den illokutiven Zusammenhang herausstellen, oder den inhaltlich-semantischen, oder den rein thematischen (mit einer Relation wie Elaboration). Zudem geht die RST davon aus, dass Einheiten in den meisten Fällen unterschiedlich “wichtig” sind, und assoziiert diese Information mit den Relationen (Nuklearität). Das hier behandelte Inventar von Ebenen soll nicht als “endgültig” oder “vollständig” verstanden werden; beispielsweise ist eine Beschreibungsebene, die wir hier nicht diskutiert haben, die der Subjektivität: Aus welcher Perspektive wird im Text berichtet, wem wird die Schilderung in einem Diskurssegment zugeschrieben (der Autorin oder einer im Text genannten Person), wer lässt welche Einstellungen zu Sachverhalten erkennen? Nichtsdestotrotz dürften die in den vergangenen Kapiteln diskutierten Ebenen - je nach Texttyp - aber auf jeden Fall zu den zentralen kohärenzstiftenden Mechanismen im Text zählen, die in ihrem Zusammenwirken die Textualität hervorbringen. Ist ein solcherlei “chirurgisches” Vorgehen - Zerteilen des Textes in Beschreibungsebenen - angemessen, wird man dem Text und seiner Funktion damit gerecht? Schröder (2003) beispielsweise argumentiert, dass thematische Struktur und Handlungsstruktur so eng miteinander verbunden seien, dass man sie nicht als eigenständige Ebenen behandeln solle. Wir denken jedoch, dass insgesamt größere Klarheit geschaffen werden kann, wenn die einzelnen Phänomene zunächst einmal voneinander isoliert werden und das Zusammenspiel der Ebenen dann systematisch an authentischen Daten untersucht wird. 10.2. Die Rolle von Text-Daten für die Text-Analyse Beschäftigt man sich mit Text aus einem engeren Blickwinkel, etwa der Perspektive der (formalen) Semantik, so ist man daran interessiert, gezielt einzelne Phänomene gründlich zu untersuchen und zu erklären; zu dem Zweck besteht die angemessene Arbeitsweise in der Konstruktion kurzer Texte, an denen sich der Untersuchungsgegenstand ideal herauspräparieren lässt. Nimmt man aber demgegenüber einen breiteren, empirischen Standpunkt ein und interessiert sich für 184 10. Interaktionen zwischen Ebenen: Entstehung von Kohärenz das gesamte Spektrum der Facetten von Textualität, so lässt man sich auf die Untersuchung authentischer Texte mit all ihren Komplikationen und - für die Analyse eines Einzelphänomens - “störenden” Faktoren ein. Diese zunächst einmal schwierigere Ausgangsposition bietet aber die Chance, zu einem insgesamt umfassenderen Bild von Textualität zu gelangen. Um mit authentischen Texten effektiv zu arbeiten, ist es äußerst ratsam, die Möglichkeiten der digitalen Verarbeitung umfassend zu nutzen, denn die Komplexität von “ausbuchstabierten” Mehrebenenanalysen ist beträchtlich: Entscheidungen auf Ebene x sind mit Entscheidungen auf Ebene y in Beziehung zu setzen, zu überprüfen und ggf. zu revidieren. Die Suche nach wiederkehrenden Mustern zwischen einzelnen Ebenen setzt voraus, dass möglichst viele Annotationen von möglichst vielen Texten gleichzeitig betrachtet werden können - eine Aufgabe, bei der wir uns erfahrungsgemäß vom Computer unterstützen lassen sollten. Die sorgfältige, digitale Annotation von Textdaten ist aufwändig, jedoch gibt es Möglichkeiten, die Arbeit zu vereinfachen. Die eine besteht in der halbautomatischen Annotation: Mit computerlinguistischen Methoden kann die rein manuelle Annotation beschleunigt werden, indem relativ einfache Analyseaufgaben vom Annotationswerkzeug übernommen werden. Ein Beispiel ist das ConAno Programm (Stede u. Heintze, 2004) zur Annotation von Konnektoren und ihrem Skopus: Es sucht selbsttätig im Text nach möglichen Konnektoren und markiert diese, und macht anhand einfacher Analyseregeln auch einen Vorschlag für Träger- und Bezugskonnekt. Einen großen Schritt weiter geht @nnotate 1 , das die Annotation von syntaktischen Strukturen durch einen Parser unterstützt, der selbst eine Struktur (oder Teile davon) ermittelt, die dann vom Nutzer per Mausklick nötigenfalls überarbeitet werden kann. Der zweite Aspekt betrifft Annotationsstandards und shared corpora: Annotierte Daten nützen nicht nur denjenigen, die sie annotiert haben. Sie stellen eine wichtige Ressource für die Forschung dar, und es gibt verschiedene Modelle, solche Ressourcen allgemein verfügbar zu machen (siehe dazu Lemnitzer u. Zinsmeister, 2006). Gerade der Ansatz der Mehrebenen-Annotation (MEA) bietet sich für eine “verteilte Entwicklung” an: Dieselben Daten können auf verschiedenen Ebenen annotiert werden - und dies durchaus von verschiedenen Annotatoren an verschiedenen Orten; das Gesamtergebnis ist dann für alle nützlich. Damit dies funktioniert, ist die Arbeit mit präzisen, verständlichen und evaluierten Annotationsrichtlinien allerdings unerlässlich, denn Daten, die man nicht selbst annotiert hat, sind nur in Verbindung mit den zugrunde liegenden Annotationsrichtlinien wirklich nutzbar. Es muss sorgfältig dokumentiert sein, was auf welche Weise annotiert wurde, damit die Ergebnisse nachvollziehbar sind. Zu bedenken ist auch die Frage nach der Definition der minimalen Analyseeinheiten (EDUs). Damit die Annotationen der verschiedenen Ebenen miteinander vergleichbar sind, ist es hilfreich, wenn die EDUs identisch sind - ansonsten kann es schwer fallen, aussagekräftige Korrelationen zwischen Ebenen zu bestimmen. Diese Aufgabe ist nicht ganz einfach; wir haben in Abschnitt 9.1 darauf hingewiesen, dass existierende Segmentie- 1 www.coli.uni-saarland.de/ projects/ sfb378/ negra-corpus/ annotate.html 10.3. Ebenen-Interaktionen 185 rungsrichtlinien relativ umfänglich sind. Der Vorteil einer gut durchdachten EDU- Definition wiederum besteht darin, dass die Segmentierung eines Textes dann nur einmal vorgenommen werden muss, und die dabei entstehenden EDUs können bereits die Eingabe für die Annotation der Ebenen bilden, so dass die Annotatoren dann nicht mehr über Segmentierung nachdenken müssen. Um MEA-Korpora auszuwerten und Korrelationen zwischen Ebenen zu ermitteln, ist es besonders wichtig, die Abhängigkeiten zwischen den einzelnen Annotationsebenen genau zu kennen. Ein einfaches Beispiel: Möchten wir eine Aussage darüber gewinnen, wie häufig eine Kohärenzrelation durch einen bestimmten Konnektor signalisiert wird, so setzt dies voraus, dass die Annotationsrichtlinien für die Relationen (soweit möglich) unabhängig von Konnektoren formuliert sind - ansonsten lesen wir aus den Daten ja nur das heraus, was wir vorher auch hinein gelegt haben. Dieses Problem wird umso dringender, je mehr Ebenen betrachtet werden (etwa: wann wird die Kohärenzrelation Concession mit der Präposition trotz und der entsprechenden PP im Vorfeld des Satzes realisiert). Da MEA ein noch junges Gebiet ist, sind die entsprechenden Methoden für ihre Gewinnung und Auswertung ein aktueller Forschungsgegenstand; beispielsweise diskutiert Lüdeling (2007) mögliche Probleme am Beispiel der Annotation von Fehlern in Lernerkorpora des Fremdsprachenunterrichts. 10.3. Ebenen-Interaktionen Um den konzeptionellen “Mehrwert” einer Mehrebenen-Analyse zu beleuchten, stellen wir diesen Ansatz zunächst einmal exemplarisch der Analyse nach RST (Mann u. Thompson, 1988) gegenüber und geben dann noch einige beispielhafte Fragestellungen an, die sich anhand von MEA-Daten untersuchen lassen. Am Ende steht dann ein abschließender Blick auf das Phänomen der Kohärenz. Die RST (s. Abschnitt 8.2) als empirisch orientierte Theorie der Textstruktur geht davon aus, dass sich Texte in EDUs segmentieren lassen und diese dann mit Kohärenzrelationen zueinander in Beziehung gesetzt werden; die entstehenden größeren Einheiten werden ihrerseits durch Relationen verbunden, bis die entstandene Baumstruktur den gesamten Text abdeckt. An dieser Stelle wollen wir zwei Annahmen der RST hinterfragen: dass zwei Segmente jeweils durch genau eine Relation verbunden sind, und dass die Nuklearität der Relationen ein allgemeines Prinzip der Textstrukturierung darstellt. Wie in Abb. 8.2 (S. 141) dargestellt, haben Mann u. Thompson die Menge der RST-Relationen in die Gruppen presentational und subject matter geteilt. Das heißt, zwei Segmente können entweder über eine illokutive Stützungsbeziehung (in verschiedenen Varianten) oder über einen inhaltlich-semantischen Zusammenhang verbunden sein. Eine gewisse Sonderrolle spielt dabei die Elaboration, die in RST zwar zu den subject matter Relationen gezählt wird, aber letztlich einen anderen Status hat, denn sie verknüpft nicht inhaltlich, sondern thematisch (siehe dazu Knott u. a., 2001): Der Inhalt des zweiten Segments ist “spezifischer” als der des ersten, wie in Alle Kinder zogen schnell die Jacken an. Tim brauchte dafür ziemlich lange. 186 10. Interaktionen zwischen Ebenen: Entstehung von Kohärenz Wenn zwei Segmente laut RST jeweils nur durch eine Relation verbunden sein können, sollten sich die einzelnen Definitionen idealerweise gegenseitig ausschließen - was sie jedoch infolge ihrer (kaum vermeidbaren) Vagheit nicht tun können. So fällt es nicht schwer, Beispiele anzugeben, in denen sowohl eine illokutive Stützung als auch ein inhaltlich-semantischer Zusammenhang gegeben sind. Das folgende lehnt sich an ein von Moore u. Pollack (1992) diskutiertes an: (10.1) (1) Komm doch vor sieben Uhr nach Hause! (2) Dann können wir noch wegen der Schrauben zum Baumarkt fahren und (3) Dein Bücherregal wird heute abend noch fertig. Durch eine subject matter Brille betrachtet, stellt der Inhalt von (1) eine Vorbedingung für (2) und dies wiederum eine Vorbedingung für (3) dar. Richten wir die Aufmerksamkeit allerdings auf die Illokutionen, so dürfte (1) die zentrale Handlung ein, die unmittelbar von (3) gestützt wird (unterstellt, dass dem Adressat an einer Fertigstellung des Regals gelegen ist). Beide Analysen lassen sich nun aber nicht in einer einzigen RST-artigen Darstellung unterbringen - was auch nicht hilfreich wäre, denn Illokutionsstruktur und inhaltlich-semantische Relationen sind eben nicht dasselbe, sondern (gemäß unserem Vorschlag) auf unterschiedlichen Beschreibungsebenen anzusiedeln. In ähnlicher Weise können Textbeispiele auch eine Illokutionsstützung mit unterschiedlichen thematischen Verhältnissen kombinieren: (10.2) a Die SPÖ wird sicherlich die Wahl gewinnen. Sie hat einen fehlerfreien Wahlkampf geführt. b Die SPÖ wird sicherlich die Wahl gewinnen. Die Leute sind so enorm unzufrieden mit der derzeitigen Wirtschaftspolitik. In beiden Fällen kann der zweite Satz Evidenz für die Voraussage des ersten liefern, doch bleibt [a] beim Thema SPÖ, während [b] das Thema wechselt. Ein für [a] und [b] identischer RST-Baum mit Evidence Relation kann diesen - für den weiteren Textverlauf möglicherweise bedeutsamen - Unterschied nicht darstellen. Eine ähnliche Argumentation könnte herausstellen, dass auch die Rekonstruktion der temporalen Struktur eines Textes keineswegs konform mit der thematischen oder der Illokutionsstruktur sein muss; wir verzichten hier darauf, das zu illustrieren. Stattdessen gehen wir kurz auf den Aspekt Nuklearität ein, den Mann und Thompson mit der großen Mehrzahl der Relationen verknüpfen (s. Abb. 8.2 auf S. 141) und als zentrales Prinzip der Textorganisation postulieren. Die Beobachtung, dass unterschiedliche Segmente eines Textes von der Autorin für unterschiedlich “wichtig” erachtet und auch als solche markiert werden, ist wohl unstrittig. Doch liegt das wirklich daran, dass die jeweilige Kohärenzrelation die Zuweisung von Nukleus und Satellit an die beiden Segmente fest vorschreibt? Auch hier spricht vieles dafür, die Beschreibungsebenen auseinanderzuhalten und verschiedene Indizien der relativen “Wichtigkeit” eines Segments S n zu unterscheiden, wie etwa: 2 2 Siehe dazu ausführlich Stede (2007). 10.3. Ebenen-Interaktionen 187 • S n trägt unmittelbar zur Funktion des Textes bei. - (wichtig) • S n stützt die Illokution eines benachbarten Segments S n −1 oder S n +1 . - (wichtig) • S n ist mit lexikalischen Emphase-Signalen markiert, wie es ist bedeutsam, dass oder ich betone hiermit. - (wichtig) • Das Thema von S n wird im späteren Textverlauf fortgesetzt. - (wichtig) • S n stellt eine kurze Abschweifung vom Hauptthema des Textes dar. - (unwichtig) • S n wiederholt lediglich (vielleicht aus rhetorischen Gründen), was schon einmal gesagt wurde. - (unwichtig) • S n hat nur textinterne Funktion, sagt z. B. etwas über die Textgliederung. - (unwichtig) • S n ist seinem Nachbarsegment S n −1 oder S n +1 syntaktisch untergeordnet. - (unwichtig) Faktoren dieser Art können natürlich miteinander korrelieren, sie müssen es aber nicht - im Prinzip sind sie unabhängig voneinander und verweisen wiederum auf unterschiedliche Beschreibungsebenen, auf denen verschiedene Begriffe von “Wichtigkeit” präziser zu definieren wären. Ein durchgängiges Nuklearitätsprinzip, das allein auf einer Ebene operiert, kann dies nicht angemessen darstellen. Wir nennen jetzt in loser Folge noch beispielhaft einige Fragestellungen, die sich anhand von MEA-Daten untersuchen lassen. Dabei lässt sich das Spektrum erweitern, wenn neben den textbezogenen Ebenen zuätzlich die syntaktische Struktur der einzelnen Sätze expliziert wird. Im Fall des Potsdamer Kommentarkorpus (Stede, 2004a) sind es Annotationen nach dem ‘TIGER’ Schema (Brants u. a., 2002), die es erlauben, die textuellen Informationen mit den Satzstrukturen zu verknüpfen. So ist es möglich, anhand der RST-Annotationen in den Daten den von Matthiessen u. Thompson (1988) postulierten engen Zusammenhang zwischen dem Satelliten- Status von Segmenten und syntaktischer Subordination zu überprüfen. Können subordinierte Sätze tatsächlich keine Nuklei sein, oder unter welchen Bedingungen ist dies doch möglich? Denkt man hier etwa an weiterführende Nebensätze, so kann man als dritte Ebene die thematische Struktur hinzuziehen und den Einfluss von Themenwechseln prüfen. Ein anderer Vorschlag aus dem Umfeld der RST besagt, dass die anaphorische Zugänglichkeit mit dem Nukleus-Status korreliert (dass Antezedenten für Anaphern bevorzugt in Nukleus-Segmenten zu finden sind) - dies kann an Daten, die mit referenzieller und rhetorischer Struktur annotiert sind, empirisch überprüft werden. Bei der Besprechung der verschiedenen Facetten thematischer Struktur in Kapitel 5 hatten wir auf allerlei offene Fragen hingewiesen; in Verbindung mit der syntaktischen Struktur ist beispielsweise die Untersuchung der Bedingungen für die Verwendung syntaktisch auffälliger Topik- 188 10. Interaktionen zwischen Ebenen: Entstehung von Kohärenz markierender Konstruktionen interessant; dazu ist eine gründlich annotierte referenzielle Struktur - einschließlich indirekter Wiederaufnahmen bzw. bridging - nötig. Auch über die Verwendungsbedingungen und -präferenzen von bedeutungsähnlichen Konnektoren herrscht noch einige Unklarheit, die durch statistische Auswertung der Kontextmerkmale reduziert werden kann (Frohning, 2007). MEA-Daten sind dafür eine sehr nützliche Grundlage, da die Faktoren der Konnektorenwahl von ganz unterschiedlicher Art sind. Neben einigen anderen spielt Tempus eine wichtige Rolle, was u. a. von Asher u. Lascarides (2003) untersucht wurde. Wir schließen mit einem abermaligen Blick auf das Phänomen der Kohärenz, das wir hier im Wesentlichen als Eigenschaft eines Textes behandelt haben. Dies ist im Einklang mit dem alltäglichen Sprachgebrauch, doch sollten wir im Auge behalten, dass der Ausdruck “kohärenter Text” letztlich eine Kurzbeschreibung für “Text, den ein Rezipient als kohärent empfindet” ist. Die Kohärenz wohnt nicht dem Text inne, sondern stellt sich bei der Verarbeitung des Textes beim Leser ein - sofern der Text bestimmte Voraussetzungen erfüllt (von denen wir einige in diesem Buch besprochen haben). Wie beispielsweise Viehweger (1989) betont, greift der Leser beim Textverstehen auf eine Reihe verschiedener Wissensquellen zurück: Sprachliches Wissen bildet die lexikalische, syntaktische und semantische Grundlage; Hintergrundwissen über die “Welt” und die Inhaltsdomäne des Textes befähigt den Leser, beispielsweise bridging Zusammenhänge herzustellen oder die nicht explizit signalisierten kausalen oder temporalen Relationen zu identifizieren; Illokutionswissen umfasst die Konventionen über sprachliche Mittel zum Vollzug von Handlungen, aber auch Vorbedingungen für den Vollzug dieser Handlungen, etc.; Muster- oder Schema-Wissen betrifft die inhaltliche und intentionale Organisation von Texten (vgl. unser ‘Textsortenwissen’, Abschnitt 3.2.3); Wissen über Konversationsprinzipien (etwa im Sinne von Grice, 1975) schließlich besagt, wie Sprechhandlungen in soziale Kontexte eingebettet sind. In einfachen Texten mögen einige dieser Aspekte nicht zum Tragen kommen, doch im allgemeinen Fall resultiert der Eindruck der Kohärenz beim Leser aus dem Zusammenspiel von Text und diesen Wissensquellen, oder mit Viehwegers Worten: durch Interaktion verschiedener Module. Aus kognitiver Sicht ist die Kohärenz dann auch keineswegs ein Phänomen, das auf Textproduktion und Textverstehen beschränkt wäre, sondern es betrifft auch andere Arten menschlicher Informationsverarbeitung (wie die visuelle Verarbeitung, aber auch die von Musik, etc.). Aussagekräftige Modelle, auch darauf weist Viehweger hin, müssen daher letztlich prozedurale Modelle der Verarbeitung sein; für den Text liefert die in diesem Buch dargelegte deklarative Sichtweise (d. h. die Beschreibung struktureller Zusammenhänge) dementsprechend noch kein Modell, aber wichtige Hinweise für die Entwicklung solcher Verarbeitungsmodelle. Für deren empirische Überprüfung - um ein letztes Mal auf die Rolle von Daten zurückzukommen - können Texte mit Mehrebenen- Annotation ebenfalls einen nützlichen Beitrag leisten. Literaturverzeichnis [Adamzik 1995] A DAMZIK , Kirsten: Aspekte und Perspektiven der Textsortenlinguistik. In: A DAMZIK , Kirsten (Hrsg.): Textsorten - Texttypologie. Eine kommentierte Bibliographie. Münster : Nodus, 1995, S. 11-40 [Adamzik 2004] A DAMZIK , Kirsten: Textlinguistik. Eine einführende Darstellung. Tübingen : Niemeyer, 2004 [Agricola 1979] A GRICOLA , Erhard: Textstruktur - Textanalyse - Informationskern. Leipzig : VEB Verlag Enzyklopädie, 1979 [Allen 1984] A LLEN , James: Towards a general theory of action and time. In: Artificial Intelligence 23 (1984), S. 67-90 [Ariel 2001] A RIEL , Mira: Accessibility theory: an overview. In: S ANDERS , Ted (Hrsg.) ; S POOREN , Wilbert (Hrsg.): Text representation: linguistic and psycholinguistic aspects. Amsterdam : John Benjamins, 2001, S. 29-88 [Asher 1993] A SHER , Nicholas: Reference to abstract objects in discourse. Dordrecht : Kluwer, 1993 [Asher u. Lascarides 2003] A SHER , Nicholas ; L ASCARIDE S , Alex: Logics of Conversation. Cambridge : Cambridge University Press, 2003 [Austin 1975] A USTIN , John L.: How to do things with words. Cambridge/ MA : Harvard University Press, 1975 [Bateman u. Rondhuis 1997] B ATEMAN , John ; R ONDHUIS , Klaas J.: “Coherence relations”: towards a general specification. In: Discourse Processes 24 (1997), Nr. 1, S. 3-50 [de Beaugrande u. Dressler 1981] B EAUGRANDE , Robert de ; D RE SSLER , Wolfgang: Einführung in die Textlinguistik. Tübingen : Niemeyer, 1981 [Biber 1993] B IBER , Douglas: Using register-diversified corpora for general language studies. In: Computational Linguistics 19 (1993), Nr. 2, S. 219-241 [Birner u. Ward 1998] B IRNER , B. ; W ARD , G.: Information status and noncanonical word order in English. Philadelphia/ Amsterdam : John Benjamins, 1998 [Brandt u. a. 1992] B RANDT , Margareta ; R EIS , Marga ; R OSENGREN , Inger ; Z IMMERMANN , Ilse: Satztyp, Satzmodus und lllokution. In: R OSENGREN , Inger (Hrsg.): Satz und Illokution. Tübingen : Niemeyer, 1992, S. 1-90 [Brandt u. Rosengren 1992] B RANDT , Margareta ; R OSENGREN , Inger: Zur Illokutionsstruktur von Texten. In: Zeitschrift für Literaturwissenschaft und Linguistik 86 (1992), S. 9-51 190 Literaturverzeichnis [Brandt 1994] B RANDT , Margaretha: Subordination und Parenthese als Mittel der Informationsstrukturierung in Texten / Universität Lundt. 1994 (Arbeitsberichte Sprache und Pragmatik 32). - Forschungsbericht [Brants u. a. 2002] B RANTS , Sabine ; D IPPER , Stefanie ; H ANSEN , Silvia ; L EZIUS , Wolfgang ; S MITH , George: The TIGER Treebank. In: Proceedings of the Workshop on Treebanks and Linguistic Theories. Sozopol, 2002 [Braunmüller 1977] B RAUNMÜLLER , Kurt: Referenz und Pronominalisierung: zu den Deiktika und Proformen des Deutschen. Tübingen : Niemeyer, 1977 [Breindl u. Wassner 2006] B REINDL , Eva ; W ASSNER , Ulrich H.: Syndese vs. Asyndese. Konnektoren und andere Wegweiser für die Interpretation semantischer Relationen in Texten. In: B LÜHDORN , Hardarik (Hrsg.) ; B REINDL , Eva (Hrsg.) ; W ASSNER , Ulrich H. (Hrsg.): Text-Verstehen. Grammatik und darüber hinaus. Berlin/ New York : Walter de Gruyter, 2006, S. 46-70 [Brennan u. a. 1987] B RENNAN , Susan ; F RIEDMAN , M. ; P OLLARD , Carl: A centering approach to pronouns. In: Proceedings of the 25th Annual Meeting of the Assoc. for Computational Linguistics, Assoc. for Computational Linguistics, 1987, S. 155-162 [Brinker 2001] B RINKER , Klaus: Linguistische Textanalyse. Fünfte Auflage. Berlin : Erich Schmidt Verlag, 2001 [Bucher 1986] B UCHER , Hans-Jürgen: Pressekommunikation. Tübingen : Niemeyer, 1986 [Bühler 1982] B ÜHLER , Karl: Sprachtheorie: Die Darstellungsfunktion der Sprache. Stuttgart : Fischer, 1982. - (Originalausgabe: 1934) [Bußmann 2002] B USSMANN , Hadumod: Lexikon der Sprachwissenschaft. Stuttgart : Kröner, 2002 [Carlson u. Marcu 2001] C ARLSON , Lynn ; M ARCU , Daniel: Discourse Tagging Reference Manual / Univ. of Southern California/ ISI. 2001. - Forschungsbericht [Cohen 1983] C OHEN , Robin: A computational model for the analysis of arguments / Computer Systems Research Group, University of Toronto. Toronto, Canada, 1983. - Forschungsbericht [Daneš 1974] D ANEŠ , František: Functional sentence perspective and the organization of the text. In: D ANEŠ , František (Hrsg.): Papers on Functional Sentence Perspective. 1974, S. 106-128 [van Dijk 1977] D IJK , Teun van: Text and Context. Explorations in the Semantics and Pragmatics of Discourse. London, New York : Klett, 1977 [van Dijk 1980] D IJK , Teun van: Textwissenschaft - eine interdisziplinäre Einführung. Tübingen : Niemeyer, 1980 [Dimter 1981] D IMTER , Mathias: Textklassenkonzepte heutiger Alltagssprache. Tübingen : Niemeyer, 1981 Literaturverzeichnis 191 [Dipper 2005] D IPPER , Stefanie: XML-based Stand-off Representation and Exploitation of Multi-Level Linguistic Annotation. In: E CKSTEIN , Rainer (Hrsg.) ; T OLKSDORF , Robert (Hrsg.): Proceedings of Berliner XML Tage, 2005, S. 39-50 [Dipper u. a. 2004] D IPPER , Stefanie ; G ÖTZE , Michael ; S TEDE , Manfred ; W EGST , Tillmann: ANNIS: A linguistic database for exploring information structure. In: Interdisciplinary Studies on Information Structure. 2004 (ISIS Working papers of the SFB 632 (1)), S. 245-279 [Dowty 1986] D OWTY , David: The effects of aspectual class on the temporal structure of discourse: semantics or pragmatics? In: Linguistics and Philosophy 9 (1986), Nr. 1, S. 37-62 [Eberle 1991] E BERLE , Kurt: On representing the temporal structure of texts. In: H ERZOG , Otthein (Hrsg.) ; R OLLINGER , Claus-Rainer (Hrsg.): Text Understanding in LILOG: Integrating Computational Linguistics and Artificial Intelligence. Berlin/ Heidelberg : Springer, 1991, S. 313-341 [Eggs 2000] E GGS , Ekkehard: Vertextungsmuster Argumentation: Logische Grundlagen. In: B RINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 397-414 [Eisenberg 1989] E ISENBERG , Peter: Grundriss der deutschen Grammatik. Zweite Auflage. Stuttgart : Metzler, 1989 [Endriss u. a. 1998] E NDRISS , Ulrich ; K ÜSSNER , Uwe ; S TEDE , Manfred: Repräsentation zeitlicher Ausdrücke: die ‘Temporal Expression Language’ / Technische Universität Berlin. 1998 (Verbmobil Memo 133). - Forschungsbericht. - Online verfügbar unter www.ling.uni-potsdam.de/ ~stede/ publications.html [Fabricius-Hansen 2000] F ABRICIUS -H ANSEN , Cathrine: Formen der Konnexion. In: B RIN - KER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 331-343 [Feilke 2000] F EILKE , Klaus: Die pragmatische Wende in der Textlinguistik. In: B RINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 64-82 [Figge 1971] F IGGE , Udo L.: Syntagmatik, Distribution und Text. In: S TEMPEL , W.-D. (Hrsg.): Beiträge zur Textlinguistik. München, 1971, S. 161-181 [Freeman 1991] F REEMAN , James B.: Dialectics and the Macrostructure of Argument. Berlin : Foris, 1991 [Fries 1981] F RIE S , Peter H.: On the status of theme in English: arguments from discourse. In: Forum Linguisticum 6 (1981), Nr. 1, S. 1-38 [Frohning 2007] F ROHNING , Dagmar: Kausalmarker zwischen Pragmatik und Kognition. Korpusbasierte Analysen zur Variation im Deutschen. Tübingen : Niemeyer, 2007. - (Im Erscheinen) [Gansel u. Jürgens 2002] G ANSEL , Christina ; J ÜRGENS , Frank: Textlinguistik und Textgrammatik. Wiesbaden : Westdeutscher Verlag, 2002 192 Literaturverzeichnis [Givón 1983] G IVÓN , T.: Topic continuity in discourse: an introduction. In: G IVÓN , T. (Hrsg.): Topic continuity in discourse: A quantitative cross-linguistic study. Amsterdam : John Benjamins, 1983, S. 1-42 [Götze u. a. 2007] G ÖTZE , Michael ; E NDRISS , Cornelia ; H INTERWIMMER , Stefan ; F IEDLER , Ines ; P ETROVA , Svetlana ; S CHWARZ , Anne ; S KOPETEAS , Stavros ; S TOEL , Ruben ; W E S - KOTT , Thomas: Information structure. In: Information structure in cross-linguistic corpora: annotation guidelines for morphology, syntax, semantics, and information structure Bd. 7. 2007, S. 145-187 [Grabski u. Stede 2006] G RAB SKI , Michael ; S TEDE , Manfred: ’bei’: Intra-clausal coherence relations illustrated with a German preposition. In: Discourse Processes 41 (2006), Nr. 2, S. 195-219 [Grice 1975] G RICE , H. P.: Logic and Conversation. In: C OLE , Peter (Hrsg.) ; M ORGAN , Jerry L. (Hrsg.): Syntax and Semantics, Vol. 3. New York : Academic Press, 1975, S. 41-58 [Grimes 1975] G RIME S , Joseph: The Thread of Discourse. The Hague : Mouton, 1975 [Grosse 1976] G ROSSE , Ernst U.: Text und Kommunikation. Stuttgart : Kohlhammer, 1976 [Grosz u. a. 1995] G ROSZ , Barbara ; J OSHI , Aravind ; W EINSTEIN , Scott: Attention, Intentions, and the Structure of Discourse. In: Computational Linguistics 21 (1995), Nr. 2, S. 203-226 [Grosz u. Sidner 1986] G ROSZ , Barbara ; S IDNER , Candace: Attention, Intentions, and the Structure of Discourse. In: Computational Linguistics 12 (1986), Nr. 3, S. 175-204 [Grote 2003] G ROTE , Brigitte: Signaling coherence relations in text generation: A case study of German temporal discourse markers, Universität Bremen, Diss., 2003. - Online verfügbar über elib.suub.uni-bremen.de/ cocoon/ diss/ start [Gundel u. a. 1993] G UNDEL , J. ; H EDBERG , N. ; Z ACHARSKI , R.: Cognitive status and the form of referring expressions in discourse. In: Language 69 (1993), Nr. 2, S. 274-307 [Gülich u. Raible 1977] G ÜLICH , Elisabeth ; R AIBLE , Wolfgang: Überlegungen zu einer makrostrukturellen Textanalyse. In: D IJK , T.A. van (Hrsg.) ; P ETÖFI , J.S. (Hrsg.): Grammars and Descriptions. Berlin/ New York : de Gruyter, 1977, S. 132-175 [Halliday 2004] H ALLIDAY , M.A.K.: An introduction to functional grammar. 3. Auflage. London : Arnold, 2004 [Halliday u. Hasan 1989] H ALLIDAY , M.A.K. ; H ASAN , R.: Cohesion in English. London : Longman, 1989 [Harras 2004] H ARRAS , Gisela: Handlungssprache und Sprechhandlung. Berlin : de Gruyter, 2004 [Hartmann 1984] H ARTMANN , Dietrich: Reliefgebung: Informationsvordergrund und Informationshintergrund in Texten als Problem von Textlinguistik und Stilistik. In: Wirkendes Wort 4 (1984), S. 305-323 [Hartmann 1968] H ARTMANN , Peter: Textlinguistik als neue linguistische Teildisziplin. In: Replik 2 (1968), S. 2-7 Literaturverzeichnis 193 [Harweg 1968] H ARWEG , Roland: Pronomina und Textkonstitution. München : Fink, 1968 [Heinemann 2000] H EINEMANN , Wolfgang: Aspekte der Textsortendifferenzierung. In: B RINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 523-546 [Heinemann u. Viehweger 1991] H EINEMANN , Wolfgang ; V IEHWEGER , Dieter: Textlinguistik - Eine Einführung. Tübingen : Niemeyer, 1991 [Helbig u. Buscha 2001] H ELBIG , Gerhard ; B USCHA , Joachim: Deutsche Grammatik — ein Handbuch für den Ausländerunterricht. 16. Auflage. Leipzig : Langenscheidt / Verlag Enzyklopädie, 2001 [Hellwig 1984] H ELLWIG , Peter: Grundzüge einer Theorie des Textzusammenhangs. In: R OTHKEGEL , A. (Hrsg.) ; S ANDIG , B. (Hrsg.): Text - Textsorten - Semantik. Hamburg : Buske, 1984, S. 51-79 [Heringer 1974] H ERINGER , Hans J.: Praktische Semantik. Stuttgart : Klett, 1974 [Hobbs 1979] H OBB S , Jerry: Coherence and coreference. In: Cognitive Science 3 (1979), S. 67-90 [Hoffmann 2000] H OFFMANN , Ludger: Thema, Themenentfaltung, Makrostruktur. In: B RINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 344-356 [Hudson u. a. 1986] H UDSON , Susan ; T ANENHAUS , Michael ; D ELL , Gary: The effect of the Discourse Center on the local coherence of a discourse. In: Proceedings of the Eighth Annual Conference of the Cognitive Science Society, Lawrence Erlbaum, 1986, S. 96-101 [Hundsnurscher 1984] H UNDSNURSCHER , Franz: Theorie und Praxis der Textklassifikation. In: R OSENGREN , Inger (Hrsg.): Sprache und Pragmatik. Malmö, 1984, S. 75-97 [Isenberg 1974] I SENBERG , Horst: Texttheorie und Gegenstand der Grammatik. Berlin : Akademie der Wissenschaften der DDR, Zentralinstitut für Sprachwissenschaft, 1974 (Linguistische Studien - Arbeitsberichte) [Jacobs 1984] J ACOB S , Joachim: Funktionale Satzperspektive und Illokutionssemantik. In: Linguistische Berichte (1984), Nr. 91, S. 25-58 [Jacobs 2001] J ACOB S , Joachim: The dimensions of Topic-Comment. In: Linguistics 39 (2001), Nr. 4, S. 641-681 [Jasinskaja u. a. 2007] J ASINSKAJA , Katja ; M AYER , Jörg ; B OETHKE , Jutta ; N EUMANN , Annika ; P ELDSZUS , Andreas ; R ODRÍGUEZ , Kepa J.: Discourse Tagging Guidelines for German Radio News and Newspaper Commentaries. 2007. - Ms., Universität Potsdam [Kamp u. Reyle 1993] K AMP , Hans ; R EYLE , Uwe: From Discourse to Logic. Dordrecht : Kluwer, 1993 [Kehler 2002] K EHLER , Andrew: Coherence, Reference, and the Theory of Grammar. Stanford : CSLI Publications, 2002 194 Literaturverzeichnis [Kehler 2004] K EHLER , Andrew: Discourse Coherence. In: H ORN , Laurence R. (Hrsg.) ; W ARD , Gregory (Hrsg.): Handbook of Pragmatics. Oxford : Basil Blackwell, 2004 [Klein u. von Stutterheim 1992] K LEIN , Wolfgang ; S TUTTERHEIM , Christiane von: Textstruktur und referentielle Bewegung. In: Textlinguistik. Zeitschrift für Literaturwissenschaft und Linguistik. Göttingen : Vandenhoeck & Ruprecht, 1992, S. 67-92 [Knott 1996] K NOTT , Alistair: A Data-Driven Methodology for Motivating a Set of Coherence Relations, University of Edinburgh, Diss., 1996 [Knott 2001] K NOTT , Alistair: Semantic and Pragmatic relations and their intended effects. In: S ANDERS , T. (Hrsg.) ; S CHILPEROORD , J. (Hrsg.) ; S POOREN , W. (Hrsg.): Text representation: linguistic and psycholinguistic aspects. Amsterdam : John Benjamins, 2001, S. 127-151 [Knott u. Dale 1994] K NOTT , Alistair ; D ALE , Robert: Using linguistic phenomena to motivate a set of coherence relations. In: Discourse Processes 18 (1994), Nr. 1, S. 35-62 [Knott u. a. 2001] K NOTT , Alistair ; O BERLANDER , Jon ; O’D ONNELL , Mick ; M ELLISH , Chris: Beyond Elaboration: The interaction of relations and focus in coherent text. In: S ANDERS , T. (Hrsg.) ; S CHILPEROORD , J. (Hrsg.) ; S POOREN , W. (Hrsg.): Text representation: linguistic and psycholinguistic aspects. Amsterdam : John Benjamins, 2001, S. 181-196 [Knott u. Sanders 1998] K NOTT , Alistair ; S ANDERS , Ted: The Classification of Coherence Relations and their Linguistic Markers: An Exploration of Two Languages. In: Journal of Pragmatics 30 (1998), S. 135-175 [Konerding 2000] K ONERDING , Klaus-Peter: Komplemente, Adjunkte und Informationsstruktur. Aspekte der Interdependenz von Lexik und Grammatik bei der thematischen Organisation von Texten. In: W ARNKE , Ingo (Hrsg.): Schnittstelle Text - Diskurs. Frankfurt : Lang, 2000, S. 149-162 [Kruijff-Korbayová u. Steedman 2003] K RUIJ FF -K ORBAYOVÁ , Ivana ; S TEEDMAN , Mark: Discourse and Information Structure. In: Journal of Logic, Language and Information: Special Issue on Discourse and Information Structure 12 (2003), Nr. 3, S. 249-259 [Küper 1984] K ÜPER , Christoph: Zum sprechaktbezogenen Gebrauch der Kausalverknüpfer ‘denn und ‘weil’. In: Linguistische Berichte 92 (1984), S. 15-30 [Labov 1973] L ABOV , William: The Boundaries of Words and their Meanings. In: B AILEY , C. (Hrsg.) ; S HUY , R. (Hrsg.): New Ways of Analyzing Variation in English. Washington : Georgetown University Press, 1973, S. 340-373 [Lang 2000] L ANG , Ewald: Adversative connectors on distinct levels of discourse: a reexamination of Eve Sweetser ’s three-level approach. In: C OUPER -K UHLEN , E. (Hrsg.) ; K ORTMANN , B. (Hrsg.): Cause - Condition - Concession - Contrast. Berlin : Mouton de Gruyter, 2000, S. 235-256 [Lemnitzer u. Zinsmeister 2006] L EMNITZER , Lothar ; Z INSMEISTER , Heike: Korpuslinguistik - Eine Einführung. Narr : Tübingen, 2006 [Liedtke 1998] L IEDTKE , Frank: Grammatik der Illokution. Tübingen : Narr, 1998 [Linke u. a. 1994] L INKE , Angelika ; N USSBAUMER , Markus ; P ORTMANN , Paul: Studienbuch Linguistik. Tübingen : Niemeyer, 1994 Literaturverzeichnis 195 [Lötscher 1987] L ÖTSCHER , Andreas: Text und Thema. Studien zur thematischen Konstituenz von Texten. Tübingen : Niemeyer, 1987 [Lötscher 1991] L ÖTSCHER , Andreas: Thematische Textorganisation in deskriptiven Texten als Selektions-/ Linearisierungsproblem. In: B RINKER , Klaus (Hrsg.): Aspekte der Textlinguistik. Hildesheim : Georg Olms, 1991, S. 73-105 [Lüdeling 2007] L ÜDELING , Anke: Mehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora. In: G ROMME S , Patrick (Hrsg.) ; W ALTER , Maik (Hrsg.): Fortgeschrittene Lernervarietäten. 2007. - (Im Erscheinen) [Lutzeier 1981] L UTZEIER , Peter R.: Wort und Feld. Wortsemantische Fragestellungen unter besonderer Berücksichtigung des Wortfeldbegriffs. Tübingen : Niemeyer, 1981 [Mani u. Pustejovsky 2004] M ANI , Inderjeet ; P USTE JOVSKY , James: Temporal discourse models for narrative structure. In: Proceedings of the ACL Workshop on Discourse Annotation. Barcelona, 2004 [Mani u. a. 2005] M ANI , Inderjeet ; P USTE JOVSKY , James ; G AIZAUSKAS , Robert: The Language of Time: A Reader. Oxford : Oxford University Press, 2005 [Mann u. Thompson 1988] M ANN , William ; T HOMPSON , Sandra: Rhetorical Structure Theory: Towards a Functional Theory of Text Organization. In: TEXT 8 (1988), S. 243-281 [Marcu 2000] M ARCU , Daniel: The theory and practice of discourse parsing and summarization. Cambridge/ MA : MIT Press, 2000 [Martin 1992] M ARTIN , James R.: English text: system and structure. Philadelphia/ Amsterdam : John Benjamins, 1992 [Mathesius 1939] M ATHE SIUS , Vilém: O tak zvaném aktuálním ˇ clenˇ eni vˇ etném. In: Slovo a slovesnost 5 (1939), S. 171-174 [Matthiessen u. Thompson 1988] M ATTHIE SSEN , Christian ; T HOMPSON , Sandra: The structure of discourse and ‘subordination’. In: H AIMAN , J. (Hrsg.) ; T HOMPSON , S. (Hrsg.): Clause combining in grammar and discourse. Amsterdam : John Benjamins, 1988, S. 275-329 [Mehler u. Lobin 2004] M EHLER , Alexander (Hrsg.) ; L OBIN , Henning (Hrsg.): Automatische Textanalyse. Systeme und Methoden zur Annotation und Analyse natürlichsprachlicher Texte. Wiesbaden : Verlag für Sozialwissenschaften, 2004 [Mistrik 1973] M ISTRIK , Jozef: Exakte Typologie von Texten. München : Otto Sagner, 1973 [Mitkov 2002] M ITKOV , Ruslan: Anaphora Resolution. London : Longman, 2002 [Moore u. Pollack 1992] M OORE , Johanna ; P OLLACK , Martha: A Problem for RST: The need for Multi-Level Discourse Analysis. In: Computational Linguistics 18 (1992), Nr. 4, S. 537-544 [Morgenthaler 1980] M ORGENTHALER , Erwin: Kommunikationsorientiere Textgrammatik. Düsseldorf : Schwann, 1980 (Schriften des Institus für deutsche Sprache 51) [Motsch 1987] M OTSCH , Wolfgang: Zur Illokutionsstruktur von Feststellungtexten. In: Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung 40 (1987), Nr. 1, S. 45- 67 196 Literaturverzeichnis [Motsch 1996] M OTSCH , Wolfgang: Ebenen der Textstruktur. Tübingen : Niemeyer, 1996 [Motsch 2000] M OTSCH , Wolfgang: Handlungsstrukturen von Texten. In: B RINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 414-422 [Müller u. Strube 2006] M ÜLLER , Christoph ; S TRUBE , Michael: Multi-level Annotation of Linguistic Data with MMAX2. In: B RAUN , S. (Hrsg.) ; K OHN , K. (Hrsg.) ; M UKHERJ EE , J. (Hrsg.): Corpus Technology and Language Pedagogy. Frankfurt : Peter Lang, 2006, S. 197-214 [Neumann 2007] N EUMANN , Annika: Zur Rolle des Textsortenwissens in der Automatischen Textzusammenfassung. Universität Potsdam, Institut für Linguistik, Diplomarbeit, 2007. - Online verfügbar unter opus.kobv.de/ ubp/ [Nussbaumer 1991] N USSBAUMER , Markus: Was Texte sind und wie sie sein sollen. Tübingen : Niemeyer, 1991 [Pasch 1989] P ASCH , Renate: Adverbialsätze - Kommentarsätze - Adjungierte Sätze. Eine Hypothese zu den Typen der Bedeutungen von ‘weil’, ‘da’ und ‘denn’. In: M OTSCH , Wolfgang (Hrsg.): Wortstruktur und Satzstruktur. Berlin : Akademie der Wissenschaften der DDR, 1989 (Linguistische Studien des ZISW: Reihe A - Arbeitsberichte 194), S. 141- 158 [Pasch u. a. 2003] P ASCH , Renate ; B RAUSSE , Ursula ; B REINDL , Eva ; W ASSNER , Ulrich H.: Handbuch der deutschen Konnektoren. Berlin/ New York : Walter de Gruyter, 2003 [Paul 1975] P AUL , Herrmann: Prinzipien der Sprachgeschichte. 8. Auflage; Originalausgabe: 1880. Tübingen : Niemeyer, 1975 [Poesio 2004] P OE SIO , Massimo: The MATE/ GNOME proposals for anaphoric annotation, revisited. In: Proceedings of the SIGDIAL ’04 Workshop. Cambridge/ MA : Assoc. for Computational Linguistics, 2004 [Poesio u. a. 2004] P OE SIO , Massimo ; S TEVENSON , Rosemary ; E UGENIO , Barbara di ; H IT - ZEMAN , Janet: Centering: a parametric theory and its instantiations. In: Computational Linguistics 30 (2004), Nr. 3, S. 309-363 [Polanyi 1988] P OLANYI , Livia: A formal model of the structure of discourse. In: Journal of Pragmatics 12 (1988), S. 601-638 [Prasad u. a. 2004] P RASAD , Rashmi ; M ILT SAKAKI , Eleni ; J OSHI , Aravind ; W EBBER , Bonnie: Annotation and Data Mining of the Penn Discourse TreeBank. In: Proceedings of the ACL Workshop on Discourse Annotation. Barcelona, 2004 [Prince 1981] P RINCE , Ellen F.: Towards a taxonomy of given-new information. In: C OLE , P. (Hrsg.): Radical pragmatics. New York : Academic Press, 1981, S. 223-255 [Rambow 1993] R AMBOW , Owen: Pragmatic aspects of scrambling and topicalisation in German. In: Proceedings of the IRCS Workshop on Centering in Discourse. Univ. of Pennsylvania, 1993 [Ramm u. Villiger 1995] R AMM , Wiebke ; V ILLIGER , Claudia: Global text organization and sentence-grammatical realization / Universität des Saarlandes. 1995 (CLAUS Report 61). - Forschungsbericht Literaturverzeichnis 197 [Redeker 1990] R EDEKER , Gisela: Ideational and pragmatic markers of discourse structure. In: Journal of Pragmatics 14 (1990), S. 367-381 [Rehm 2007] R EHM , Georg: Hypertextsorten: Definition - Struktur - Klassifikation. Norderstedt : Books on Demand, 2007. - Auch: Diss., Justus-Liebig-Universität Gießen, 2005; online verfügbar über geb.uni-giessen.de [Rosch u. Mervis 1975] R OSCH , Eleanor ; M ERVIS , Carolyn: Family resemblances: Studies in the internal structure of categories. In: Cognitive Psychology 7 (1975), S. 573-605 [Sanders u. a. 1992] S ANDERS , Ted ; S POOREN , Wilbert ; N OORDMAN , Leo: Toward a taxonomy of coherence relations. In: Discourse Processes 15 (1992), S. 1-35 [Sandig 1972] S ANDIG , Barbara: Zur Differenzierung gebrauchssprachlicher Textsorten im Deutschen. In: G ÜLICH , Elisabeth (Hrsg.) ; R AIBLE , Wolfgang (Hrsg.): Textsorten - Differenzierungskriterien aus linguistischer Sicht. Frankfurt/ Main : Athenäum, 1972, S. 113-124 [Sandig 2000] S ANDIG , Barbara: Text als protoypisches Konzept. In: M ANGASSER -W AHL , Martina (Hrsg.): Prototypentheorie in der Linguistik. Tübingen : Stauffenburg, 2000, S. 93- 112 [Sassen 2005] S ASSEN , Claudia: Grenzen des Right Frontier Constraint im Chat. In: Chat- Kommunikation in Beruf, Bildung und Medien: Konzepte - Werkzeuge - Anwendungsfelder. Stuttgart : ibidem, 2005, S. 303-321 [Schauer u. Hahn 2001] S CHAUER , Holger ; H AHN , Udo: Anaphoric cues for coherence relations. In: A NGELOVA , Galia (Hrsg.): Proc. of the Conference on Recent Advances in Natural Language Processing (RANLP). 2001, S. 228-234 [Schmidt 2004] S CHMIDT , Thomas: EXMARaLDA ein System zur computergestützten Diskurstranskription. In: M EHLER , Alexander (Hrsg.) ; L OBIN , Henning (Hrsg.): Automatische Textanalyse. Wiesbaden : Verlag für Sozialwissenschaften, 2004, S. 203-218 [Schmitt 2000] S CHMITT , Holger: Zur Illokutionsanalyse monologischer Texte. Frankfurt : Peter Lang, 2000 [Schneider u. Raue 1996] S CHNEIDER , W. ; R AUE , P.: Handbuch des Journalismus. Hamburg : Rowohlt, 1996 [Schröder 2003] S CHRÖDER , Thomas: Die Handlungsstruktur von Texten. Tübingen : Narr, 2003 [Schwarz 2000] S CHWARZ , Monika: Indirekte Anaphern in Texten: Studien zur domänengebundenen Referenz und Kohärenz im Deutschen. Tübingen : Niemeyer, 2000 [Searle 1971] S EARLE , John R.: Sprechakte. Frankfurt/ Main : Suhrkamp, 1971 [Searle 1980] S EARLE , John R.: Eine Klassifikation der Illokutionsakte. In: K USSMAUL , Paul (Hrsg.): Sprechakttheorie: Ein Reader. Wiesbaden : Athenaion, 1980, S. 82-108 [Sgall u. a. 1986] S GALL , Petr ; H AJI ˇ COVÁ , Eva ; P ANEVOVÁ , Jarmila: The meaning of the sentence in its semantic and pragmatic aspects. Dordrecht : Kluwer, 1986 198 Literaturverzeichnis [Smith 2003] S MITH , Carlota: Modes of discourse. The local structure of texts. Cambridge : Cambridge University Press, 2003 [Stede 2004a] S TEDE , Manfred: Kontrast im Diskurs. In: B LÜHDORN , H. (Hrsg.) ; B REINDL , E. (Hrsg.) ; W ASSNER , H.U. (Hrsg.): Brücken schlagen. Grundlagen der Konnektorensemantik. Berlin : Walter de Gruyter, 2004, S. 255-286 [Stede 2004b] S TEDE , Manfred: The Potsdam Commentary Corpus. In: Proceedings of the ACL Workshop on Discourse Annotation. Barcelona, 2004, S. 96-102 [Stede 2007] S TEDE , Manfred: RST revisited: disentangling nuclearity. In: F ABRICIUS - H ANSEN , Cathrine (Hrsg.) ; R AMM , Wiebke (Hrsg.): ‘Subordination’ versus ‘coordination’ in sentence and text - from a cross-linguistic perspective. Amsterdam : John Benjamins, 2007. - (Im Erscheinen) [Stede u. Heintze 2004] S TEDE , Manfred ; H EINTZE , Silvan: Machine-assisted rhetorical structure annotation. In: Proceedings of the 20th International Conference on Computational Linguistics. Geneva, 2004, S. 425-431 [Stede u. Suryiawongkul 2008] S TEDE , Manfred ; S URYIAWONGKUL , Arthit: Identifying logical structure and content structure in loosely-structured documents. In: W ITT , Andreas (Hrsg.) ; M ETZING , Dieter (Hrsg.): Linguistic modelling of information and markup languages. Dordrecht : Springer, 2008. - (In Vorb.) [Steger 1983] S TEGER , Hugo: Über Textsorten und andere Textklassen. In: Textsorten und literarische Gattungen. Berlin : E. Schmidt, 1983, S. 25-67. - (Dokumentation des Germanistentages in Hamburg) [Strube u. Hahn 1996] S TRUBE , Michael ; H AHN , Udo: Functional centering. In: Proceedings of the 34th Annual Meeting of the Assoc. for Computational Linguistics, Assoc. for Computational Linguistics, 1996, S. 270-277 [von Stutterheim 1994] S TUTTERHEIM , Christiane von: Quaestio und Textaufbau. In: K OR - NADT , H. (Hrsg.) ; G RABOWSKI , J. (Hrsg.) ; M ANGOLD -A LLWINN , R. (Hrsg.): Sprache und Kognition. Heidelberg : Spektrum, 1994, S. 251-272 [Sweetser 1990] S WEETSER , Eve: From etymology to pragmatics. Cambridge : Cambridge University Press, 1990 [Taboada 2006a] T ABOADA , Maite: Applications of Rhetorical Structure Theory. In: Discourse Studies 8 (2006), Nr. 4, S. 567-588 [Taboada 2006b] T ABOADA , Maite: Rhetorical Structure Theory: Looking back and moving ahead. In: Discourse Studies 8 (2006), Nr. 4, S. 423-459 [Toulmin 1958] T OULMIN , Stephen: The Uses of Argument. Cambridge : Cambridge University Press, 1958 [Umbach 2001] U MBACH , Carla: Contrast and contrastive topic. In: Proceedings of the ES- SLLI 2001 Workshop on Information Structure, Discourse Structure and Discourse Semantics. Helsinki, 2001 [Vater 1991] V ATER , Heinz: Referenzrelationen in Texten. In: B RINKER , Klaus (Hrsg.): Aspekte der Textlinguistik. Hildesheim : Olms, 1991, S. 19-54 [Viehweger 1989] V IEHWEGER , D.: Coherence - Interaction of Modules. In: H EYDRICH , Wolfgang (Hrsg.) ; N EUBAUER , F. (Hrsg.) ; P ETÖFI , János S. (Hrsg.) ; S ÖZER , Emel (Hrsg.): Connexity and Coherence. Analysis of Text and Discourse. Berlin/ New York : De Gruyter, 1989, S. 257-274 [Virtanen 1992] V IRTANEN , Tuija: Issues of text typology: narrative - a ‘basic’ type of text? In: TEXT 12 (1992), Nr. 2, S. 293-310 [Walker u. a. 1998] W ALKER , Marilyn ; J OSHI , Aravind ; P RINCE , Ellen: Centering in Discourse. Oxford : Oxford University Press, 1998 [Ward u. Prince 1991] W ARD , Gregory ; P RINCE , Ellen: On the topicalization of indefinite NPs. In: Journal of Pragmatics 16 (1991), S. 167-177 [Webber 1988] W EBBER , Bonnie: Tense as discourse anaphora. In: Computational Linguistics 14 (1988), Nr. 2, S. 61-73 [Webber u. a. 2003] W EBBER , Bonnie ; S TONE , Matthew ; J OSHI , Aravind ; K NOTT , Alistair: Anaphora and Discourse Structure. In: Computational Linguistics 29 (2003), Nr. 4, S. 545- 587 [Weinrich 1964] W EINRICH , Harald: Tempus. Besprochene und erzählte Welt. Stuttgart : Kohlhammer, 1964 [Weinrich 2005] W EINRICH , Harald: Textgrammatik der deutschen Sprache. 3. Hildesheim : Georg Olms, 2005 [Werlich 1975] W ERLICH , Egon: Typologie der Texte. Heidelberg : Quelle und Meyer, 1975 [Wolf u. Gibson 2005] W OLF , Florian ; G IB SON , Edward: Representing discourse coherence: a corpus-based study. In: Computational Linguistics 31 (2005), Nr. 2, S. 249-287 [Wunderlich 1980] W UNDERLICH , Dieter: Arbeitsbuch Semantik. Königstein : Athenäum, 1980 [Zifonun 2000] Z IFONUN , Gisela: Textkonstitutive Funktionen von Tempus, Modus und Genus Verbi. In: B RINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 315-330 A. XML und Linguistische Datenbanken Ein zentrales Desiderat für die Annotation von Textdaten ist, wie mehrfach betont, die Verwendung von jeweils speziell auf die Aufgabe zugeschnittenen Annotationswerkzeugen: Die Markierung anaphorischer Bezüge ist ein grundsätzlich anderer Vorgang als etwa die Festlegung einer rhetorischen Textstruktur, etc. Sobald mehr als nur minimale Mengen von Daten bearbeitet werden, ist es unerlässlich, Werkzeuge zu verwenden, die es möglichst leicht machen, die jeweilige Aufgabe zu erledigen. Am Ende eines jeden Ebenen-Kapitels haben wir exemplarisch jeweils eine geeignete Software kurz vorgestellt. Annotationswerkzeuge für die verschiedensten Zwecke gibt es seit geraumer Zeit, doch erst seit einigen Jahren speichern praktisch alle Programme die Daten in einem XML-konformen Format ab. XML (eXtensible Markup Languge) ist eine Dokumentauszeichnungssprache, die bestimmte - rein syntaktische - Formatvorgaben dafür macht, wie Textdaten mit Markierungen zu versehen sind. Innerhalb dieser Vorgaben von XML können dann für konkrete Zwecke jeweils spezielle “Dokumentgrammatiken” erstellt werden, die angeben, wie Textdokumente eines bestimmten Typs strukturiert sind. Für den Fall der RST-Analyse beispielsweise besagt diese Grammatik, dass ein Dokument aus hierarchisch angeordneten Einheiten vom Typ “EDU” besteht, die jeweils als “Nukleus” oder “Satellit” gekennzeichnet sein müssen. Viele Software-Werkzeuge unterstützen die Arbeit mit XML-Daten, überprüfen beispielsweise, ob ein Textdokument einer bestimmten Dokumentgrammatik entspricht oder nicht. Historisch ist XML aus SGML (Standardized General Markup Language) entstanden, aber auch aus den Erfahrungen mit HTML (Hypertext markup language), der Sprache von WWW-Dokumenten, die eigentlich eine Trennung von “Form” und “Inhalt” angestrebt hatte, aber nicht recht verwirklichte. Erst mit XML und einer Vielzahl assoziierter standardisierter Sprachen und Werkzeuge ist dies gelungen. Dass die verschiedenen Annotationswerkzeuge XML-konforme Dateien erzeugen, ermöglicht eine relativ einfache Weiterverarbeitung dieser Dateien, beispielsweise (in Grenzen) eine Konvertierung in das Format, das ein anderes Annotationswerkzeug verwendet. Damit aber ist möglich, was für eine Mehrebenenannotation (MEA) prinzipiell den sprichwörtlichen “Flaschenhals” darstellt: Wenn derselbe Text mit verschiedenen Werkzeugen auf verschiedenen Ebenen annotiert wird, so sind die entstehenden Daten unter dem Gesichtspunkt von MEA nur dann nützlich, wenn es gelingt, die einzelnen Ebenen auch wieder zusammenzuführen. Wir interessieren uns ja dafür, Korrelationen zwischen verschiedenen Ebenen 202 A. XML und Linguistische Datenbanken Abbildung A.1.: Architektur der Daten-Annotation mit PAULA und ANNIS zu untersuchen, und dazu müssen alle Annotationen sowie der Text selbst mit ein und derselben Software bearbeitbar sein. Um diese Aufgabe zu lösen, sind mehrere Wege denkbar. Einer besteht darin, eine “Komplettsoftware” zu entwickeln, die es erlaubt, einen Text auf mehreren Ebenen, jeweils mit geeigneten Methoden, zu annotieren. Dies wäre allerdings ein sehr aufwändiges Unterfangen und würde die Vielzahl der heute bereits frei verfügbaren und sehr guten Werkzeuge ignorieren. Die MEA-Architektur, die an der Universität Potsdam entwickelt wird, geht daher einen anderen Weg: Existierende Werkzeuge werden zur Annotation eingesetzt und ihre Ausgabe-Dateien automatisch in ein sehr allgemeines, “generisches” XML-Format umgewandelt (PAULA; Dipper 2005). Damit liegen alle Annotationen einheitlich vor und können nun weiter bearbeitet werden; beispielsweise lassen sich statistische Analysen mit einer Software wie WEKA 1 vornehmen - was allerdings wiederum eine Konvertierung in das Eingabeformat von WEKA voraussetzt. Der Vorteil der Verwendung des PAULA-Formates ist freilich, dass man diese Konvertierung nur für ein Format durchführen muss, und nicht etwa individuell für jedes Annotationswerkzeug. 1 www.cs.waikato.ac.nz/ ~ml/ weka/ A. XML und Linguistische Datenbanken 203 Noch wichtiger ist es aber für die meisten Zwecke, die Annotationen zu einem Text gemeinsam ansehen und darin recherchieren zu können. Für diesen Zweck benötigt man eine (linguistische) Datenbank, die Daten im PAULA-Format einliest und darstellt. Eine Möglichkeit dafür ist die Software ANNIS (Dipper u. a., 2004), die im Rahmen des von der Deutschen Forschungsgemeinschaft geförderten Sonderforschungsbereichs 632 2 an der Universität Potsdam entstanden ist. AN- NIS zeigt Annotationsebenen zu einem Text - ähnlich wie EXMARaLDA (s. S. 89) - in einer Schicht-Darstellung, optional können allerdings auch satzbezogene Baumstrukturen grafisch dargestellt werden. Ein wichtiges Merkmal von ANNIS ist nun, dass die Benutzerin Suchanfragen formulieren kann, die mehrere Annotationsebenen miteinander verbinden. Angenommen, zu den gespeicherten Texten liegen Annotationen zur Syntax, zum Informationsstatus der Diskursgegenstände und zur rhetorischen Struktur vor, so ist es beispielsweise möglich, alle Textstellen zu finden, in denen (i) eine Präpositionalphrase am Satzanfang steht, (ii) der in der eingebetteten NP denotierte Diskursgegenstand brand-new ist, und (iii) die PP als Satellit der Kohärenzrelation Concession verwendet wird. (Ein entsprechender Satz könnte lauten: Trotz einer Einladung zum DFB-Pokalfinale hatte Leonie heute sehr schlechte Laune.) Abbildung A.1 verdeutlicht das beschriebene Zusammenspiel der verschiedenen Werkzeuge. Auf der Homepage 3 zu diesem Buch finden sich weitere Informationen zur Verfügbarkeit von ANNIS, zur Konvertierung von Daten von und nach PAULA, sowie Verweise auf verfügbare Annotationswerkzeuge. Zur weiteren Vertiefung dieser Materie seien die Beiträge in dem Sammelband von Mehler u. Lobin (2004) empfohlen. 2 www.sfb632.uni-potsdam.de 3 www.ling.uni-potsdam.de/ ~stede/ KorpTA.html Index Aboutness-Topik, 86 Aktionsart, 93 Akzeptabilität, 27 Anapher, 52-56, 69, 187 ANNIS, 17, 151, 203 Annotationsrichtlinien, 69, 179, 184 Argumentation, 38 Argumentationsstruktur, 114, 115, 117, 118, 182 Freeman-Schema, 115, 117 Toulmin-Schema, 114 Artikel, 21 Aspekt, 93 Asyndetische Verknüpfung, 26 Bridging, 53, 55, 69 Centering, 60-64, 70, 87 Definitheit, 21, 52, 53 Discourse Lexicalized Tree Adjoin Grammar (D-LTAG), 145 Discourse Segment Purpose (DSP), 105- 108, 119 Diskursgegenstand, 25, 49, 50, 52, 55- 57, 60, 74, 88 Aktivierung, 66-68, 70, 85, 86 Zugänglichkeit, 65-67 Elementary Discourse Unit (EDU), 105, 125, 132, 143, 144, 156-158, 165-167, 178 Ellipse, 22 Entity chain, 150 Ereignis, 54, 91, 94-96 temporale Abfolge, 92-94 EXMARaLDA, 89, 128 Faktorenanalyse, 41 Filmrezension (Textsorte), 77 Fokus/ Hintergrund, 85 Given/ New, 65, 85, 86 Hauptinformation, 80, 81 Ikonizitätsprinzip, 94 Illoc. Force Ind. Device (IFID), 160, 161, 163, 164 Illokution, 103-105, 159, 163, 164, 175- 177 Deklaration, 121 Direktivum, 120, 122 Estimativum, 122 Evaluativum, 122 Expressivum, 121 Feststellung (Taxonomie), 123-125 Identifikativum, 122 Kommissivum, 120 Relationatum, 122 Reportivum, 122 Repräsentativum, 120 Segmentierung, 113 Sequenzierung, 112 Stützung, 110-113, 186 Typisierung, 118-125 Illokutionsstruktur, 110-113, 127, 182, 186 Illokutive Handlung, 118 Informationsstruktur, 84-87, 89 Informativität, 27 Intention, 140 Intentionale Struktur, 105-108 Intentionalität, 27 Intertextualität, 27 206 Index Katapher, 52 Kohärenz, 24, 188 global, 24, 25 lokal, 24, 25, 131 Kohärenzrelation, 24, 25, 132-137, 140- 146, 171, 172, 178 Antithesis, 139 Contrast, 139 Dekomposition, 135, 136 Elaboration, 185 Evidence, 139 Explanation, 134 nebenordnend, 145, 146 unterordnend, 145, 146 Kohäsion, 20-23 Kommentar (Textsorte), 38-40 Kommunikative Gewichtung, 80, 81 Konnektor, 23, 26, 133, 145, 148, 188 Ambiguität, 169, 170, 174 Definition, 167, 168 Ersetzungstest, 136, 172 Präsupposition, 176 Semant. Klassifikation, 170-173 Synt. Klassifikation, 168, 169 Vagheit, 174 Verknüpfungsebene, 175-177 Koreferenz, 21, 52-54 Linearisierungsstrategie, 77, 78 Makrostruktur, 75, 76 Mehrebenen-Annotation, 16, 17, 184, 185, 188 Metafunction (syst.-fkt. Gr.), 82 MMAX2, 69, 89 Modalverb, 164 Modus, 23 Nachricht (Textsorte), 40, 77 Nebeninformation, 80, 81 Nuklearität, 138, 139, 144, 186, 187 Organon-Modell, 31, 121 PAULA, 17, 202 Penn Discourse Treebank, 179 Performativ, 102 Performative Formel, 161 Performatives Verb, 119, 161 Poset-Relation, 86 Potsdamer Kommentarkorpus, 15, 39, 151, 179, 187 Prädikation, 75 Pragmatik, 103 Pro-Form, 22 Pronomina, 19, 20, 49, 62, 64 Pronominaladverb, 169 Proposition, 75, 76, 88, 134 Prototypikalität eines Textes, 27, 28, 44, 45 Psychologisches Subjekt, 84 Quaestio, 80, 87 Quantitative Analyse, 40 Referenz, 50, 52, 55, 75 Referenz-Matrix, 59 Referenzielle Kette, 56-59, 88 Referenzielle Struktur, 49, 52, 58, 59, 87, 88, 181 Referierende Ausdrücke, 19 Rekurrenz, 21, 27 Reliefgebung, 80 Rhetorical Structure Theory (RST), 24, 136, 138-144, 149, 156-159, 185-187 Rhetorische Struktur, 131, 183 Right Frontier Constraint, 146, 147 RST Treebank, 151 RSTTool, 150-152 Satzart, 162 Segmented Disc. Repres. Theory (SDRT), 133, 137, 145, 147, 149 Situationalität, 27, 28 Sprechakt Illokution, 102 Lokution, 102, 103 Perlokution, 102 Sprechhandlung, 101, 104 Standoff-Annotation, 16 Index 207 Subjektivität, 183 Substitution, 21 Systemisch-Funktionale Grammatik, 81, 121 Temporal Expr. Language, 97-99 Temporale Struktur, 94-99, 182 Tempus, 23, 93, 188 Text Etymologie, 13 Layout, 44 Segmentierung, 156-158 Textfunktion, 31, 32, 43, 47, 74, 83, 113 Textgrammatik, 28 Texthandlung, 109 Textsorte, 33, 34, 40, 43, 47, 83 Inhaltszonen, 44, 77 Merkmale, 34-37, 44, 45 Muster, 43 Textsortenwissen, 43-45, 77 Textstruktur, 28, 29 Baum/ Graph, 148 Funktionale Beziehung, 110 Texttyp, 45, 47 argumentativ, 46, 48, 74, 78, 83, 113, 118 deskriptiv, 46, 47, 74, 78 expositorisch, 46, 47, 74, 78, 79 instruktiv, 46, 47, 74, 78 narrativ, 46, 47, 74, 78-80, 83, 91 Texttypologie, 35 Textualität, 15, 25, 28, 29 Thema, 43, 147 alltagssprachlich, 73, 74 Textgegenstand, 74-76, 88 Thema/ Rhema, 81-84, 86 Thematische Entwicklung, 81, 83 Thematische Struktur, 73, 87, 182 TimeML, 99 Topik/ Kommentar, 86-88 Topikalisierung, 85, 86 Verknüpfung asyndetisch, 166 Vorfeldbesetzung, 81 WEKA, 202 Wiederaufnahme, 49, 51, 53 XML, 16, 201 Zeitausdruck, 97-99 Zustand, 91, 93 narr studienbücher narr studienbücher Viele Arbeitsgebiete der Linguistik haben in den letzten Jahren von einer Hinwendung zu empirischen Daten profitiert: Allgemein verfügbare Korpora erlauben die nachvollziehbare Prüfung von Hypothesen. Der vorliegende Band geht diesen Weg für die Textlinguistik. Die wesentlichen Ebenen der Textanalyse werden systematisch erläutert und ‘Textualität’ als das Ergebnis der Interaktion dieser Ebenen gedeutet. Ergänzend werden jüngste Entwicklungen der Software-Technologie vorgestellt, die es erlauben, Texte auf den einzelnen Ebenen zu annotieren und diese zueinander in Beziehung zu setzen. Die Mechanismen der Textkohärenz können damit gründlicher untersucht werden als bisher, sowohl qualitativ als auch quantitativ. Manfred Stede Korpusgestützte Textanalyse Grundzüge der Ebenenorientierten Textlinguistik Stede Korpusgestützte Textanalyse ISBN 978-3-8233-6301-9 020507 Stud. Stede 23.03.2007 14: 24 Uhr Seite 1 User: Steffen Hack Lpi: 175 Scale: 100%