Korpusgestützte Textanalyse

Manfred Stede

eBooks

Korpusgestützte Textanalyse

2018

978-3-8233-9204-0

Gunter Narr Verlag

Manfred Stede

Viele Arbeitsgebiete der Linguistik haben in den letzten Jahren von einer Hinwendung zu empirischen Daten profitiert: Allgemein verfügbare Korpora erlauben die nachvollziehbare Prüfung von Hypothesen. Der vorliegende Band geht diesen Weg für die Textlinguistik. Die wesentlichen Ebenen der Textanalyse werden systematisch erläutert und ,Textualität' als das Ergebnis der Interaktion dieser Ebenen gedeutet. Anhand einer linguistischen Datenbank und eines auf mehreren Ebenen annotierten Textkorpus können praktische Recherchen durchgeführt und die Mechanismen der Textkohärenz gründlicher untersucht werden als bisher - sowohl qualitativ als auch quantitativ. Die 2. Auflage wurde vollständig überarbeitet und an vielen Stellen ergänzt, u.a. um ein eigenständiges Kapitel zur "Argumentationsstruktur". Zudem steht jetzt für die Korpusrecherche das "Potsdamer Kommentarkorpus" online bereit und ist in die Übungsaufgaben des Buches integriert. Stimmen zum Buch: "... eine uneingeschränkte Empfehlung für alle, die sich mit moderner Textanalyse in praktischer Hinsicht befassen wollen." - Info DaF 36, 2/3 (2009) "Studierende der Sprachwissenschaft im allgemeinen und der Textlinguistik sowie der Computerlinguistik im besonderen werden dieses Buch als ein gutes Lernmittel erleben" - ZfS 26 (2007)

ISBN 978-3-8233-8204-1 Viele Arbeitsgebiete der Linguisti k haben in den letzten Jahren von einer Hinwendung zu empirischen Daten profiti ert: Allgemein verfügbare Korpora erlauben die nachvollziehbare Prüfung von Hypothesen. Der vorliegende Band geht diesen Weg für die Textlinguisti k. Die wesentlichen Ebenen der Textanalyse werden systemati sch erläutert und ‚Textualität‘ als das Ergebnis der Interakti on dieser Ebenen gedeutet. Anhand einer linguisti schen Datenbank und eines auf mehreren Ebenen annoti erten Textkorpus können prakti sche Recherchen durchgeführt und die Mechanismen der Textkohärenz gründlicher untersucht werden als bisher - sowohl qualitati v als auch quanti tati v. Die 2. Auflage wurde vollständig überarbeitet und an vielen Stellen ergänzt, u.a. um ein eigenständiges Kapitel zur „Argumentati onsstruktur“. Zudem steht jetzt für die Korpusrecherche das „Potsdamer Kommentarkorpus“ online bereit und ist in die Übungsaufgaben des Buches integriert. Sti mmen zum Buch: „... eine uneingeschränkte Empfehlung für alle, die sich mit moderner Textanalyse in prakti scher Hinsicht befassen wollen.“ - Info DaF 36, 2/ 3 (2009) „Studierende der Sprachwissenschaft im allgemeinen und der Textlinguisti k sowie der Computerlinguisti k im besonderen werden dieses Buch als ein gutes Lernmitt el erleben.“ - ZfS 26 (2007) Stede Korpusgestützte Textanalyse Korpusgestützte Textanalyse Manfred Stede Grundzüge der Ebenen-orienti erten Textlinguisti k 2., überarbeitete Auflage 18204_Umschlag.indd 1-3 31.08.2018 17: 33: 02 ISBN 978-3-8233-8204-1 Viele Arbeitsgebiete der Linguisti k haben in den letzten Jahren von einer Hinwendung zu empirischen Daten profiti ert: Allgemein verfügbare Korpora erlauben die nachvollziehbare Prüfung von Hypothesen. Der vorliegende Band geht diesen Weg für die Textlinguisti k. Die wesentlichen Ebenen der Textanalyse werden systemati sch erläutert und ‚Textualität‘ als das Ergebnis der Interakti on dieser Ebenen gedeutet. Anhand einer linguisti schen Datenbank und eines auf mehreren Ebenen annoti erten Textkorpus können prakti sche Recherchen durchgeführt und die Mechanismen der Textkohärenz gründlicher untersucht werden als bisher - sowohl qualitati v als auch quanti tati v. Die 2. Auflage wurde vollständig überarbeitet und an vielen Stellen ergänzt, u.a. um ein eigenständiges Kapitel zur „Argumentati onsstruktur“. Zudem steht jetzt für die Korpusrecherche das „Potsdamer Kommentarkorpus“ online bereit und ist in die Übungsaufgaben des Buches integriert. Sti mmen zum Buch: „... eine uneingeschränkte Empfehlung für alle, die sich mit moderner Textanalyse in prakti scher Hinsicht befassen wollen.“ - Info DaF 36, 2/ 3 (2009) „Studierende der Sprachwissenschaft im allgemeinen und der Textlinguisti k sowie der Computerlinguisti k im besonderen werden dieses Buch als ein gutes Lernmitt el erleben.“ - ZfS 26 (2007) Stede Korpusgestützte Textanalyse Korpusgestützte Textanalyse Manfred Stede Grundzüge der Ebenen-orienti erten Textlinguisti k 2., überarbeitete Auflage 18204_Umschlag.indd 1-3 31.08.2018 17: 33: 02 Manfred Stede Korpusgestützte Textanalyse Grundzüge der Ebenen-orientierten Textlinguistik 2., überarbeitete Auflage Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http: / / dnb.dnb.de abrufbar. 2., überarbeitete Auflage 2018 1. Auflage 2007 © 2018 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Internet: www.narr-studienbuecher.de E-Mail: info@narr.de Satz: pagina GmbH, Tübingen Printed in Germany ISSN 0941-8105 ISBN 978-3-8233-9204-0 5 Inhalt Inhalt Vorworte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Teil I Einführung und Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1 Einleitung und Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.2 Arbeit mit Textkorpora: Software-Werkzeuge für Annotation und Recherche 15 1.3 Das Potsdamer Kommentarkorpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.4 Übersicht über das Buch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.5 Übungsaufgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2 Kohäsion, Kohärenz und Textualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.1 Die Anfänge der Textlinguistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.2 Kohäsion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.3 Kohärenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.4 Textualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.5 Korpusuntersuchungen zu Kohäsion und Kohärenz . . . . . . . . . . . . . . . . . . . . . 35 2.6 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3 Textfunktion, Textsorte und Texttyp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.1 Textfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.2 Textsorte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.3 Texttyp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 3.4 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Teil II Strukturstiftende Phänomene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 4 Referenzielle Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.1 Referenz und Koreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 4.2 Referenzielle Ketten: Globale Effekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 4.3 Koreferenz: Lokale Effekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.4 Annotation von Koreferenz in Korpora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 4.5 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 5 Thematische Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 5.1 Thema als Textgegenstand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.2 Textglobale thematische Strategien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 5.3 Lokale thematische Verknüpfung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 5.4 Die Sicht der Informationsstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 5.5 Annotation thematischer Information in Korpora . . . . . . . . . . . . . . . . . . . . . 105 6 Inhalt 5.6 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 6 Temporale Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 6.1 Ereignisse in der temporalen Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 6.2 Zeitausdrücke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 6.3 Annotation von temporaler Struktur in Korpora . . . . . . . . . . . . . . . . . . . . . . 114 6.4 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 7 Sprechhandlungen und Illokutionsstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 7.1 Hintergrund: Sprechhandlungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 7.2 Sprechhandlungen in Texten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 7.3 Inventar von Illokutionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 7.4 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 8 Argumentationsstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 8.1 Argumentieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 8.2 Argumentation im Text . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 8.3 Annotation von Argumentationsstrukturen in Korpora . . . . . . . . . . . . . . . . . 144 8.4 Übungsaufgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 Teil III Phänomenübergreifende Textstruktur . . . . . . . . . . . . . . . . . . . . . . . . . 147 9 Minimale Texteinheiten und ihre Verknüpfung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 9.1 Segmentierung von Texten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 9.2 Identifikation von Illokutionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 9.3 Verknüpfung von Textsegmenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 9.4 Annotation von Konnektoren und Segmenten in Korpora . . . . . . . . . . . . . . . 171 9.5 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 10 Rhetorische Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 10.1 Lokale Kohärenz durch Relationen zwischen Textsegmenten . . . . . . . . . . . . 175 10.2 Von lokalen Relationen zu globalen Strukturen . . . . . . . . . . . . . . . . . . . . . . . 181 10.3 Inkrementelles Textverstehen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 10.4 Baumstruktur oder Graphstruktur? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 10.5 Fazit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 10.6 Annotation von rhetorischer Struktur in Korpora . . . . . . . . . . . . . . . . . . . . . 193 10.7 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 7 Inhalt 11 Schluss: Entstehung von Kohärenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 11.1 Die Ebenen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 11.2 Mehr-Ebenen-Analyse und Korpora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 11.3 Textkohärenz: Beziehungen zwischen Ebenen . . . . . . . . . . . . . . . . . . . . . . . . 200 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 Für Brigitte, Leonie und Tim 9 Vorwort zur 1. Auflage Vorworte Vorwort zur 2.Auflage Als im Jahr 2006 die erste Ausgabe dieses Buches entstand, waren korpusbasierte Ansätze in der Linguistik bereits recht weit verbreitet, doch für die Beschreibungsebene Text gab es nur wenige Korpora, die mit textlinguistisch relevanten Phänomenen annotiert waren- - zumal für die deutsche Sprache. Das lag in erster Linie daran, dass diese Phänomene (wie etwa die Koreferenz zwischen Nominalphrasen oder die Gliederung eines Textes in seine Diskursstruktur) einerseits für eine automatische Analyse zu schwierig waren und andererseits eine manuelle Annotation mit hohem Aufwand verbunden war. Insofern war der Titel Korpusgestützte Textanalyse seinerzeit vor allem als programmatisch zu verstehen. Seither hat sich das Forschungsfeld jedoch kräftig weiter entwickelt: Auch für das Deutsche sind eine ganze Reihe interessanter Korpora entstanden, annotiert mit vielfältigen textlinguistischen Phänomenen, sowie leistungsfähige Software-Werkzeuge, die eine komfortable Recherche in diesen Korpora ermöglichen. Die vorliegende Neuauflage greift diese Entwicklungen auf und berichtet an vielen Stellen über die Möglichkeiten des Erkenntnisgewinns mit Hilfe solcher Werkzeuge. Insbesondere steht nun das frei zugängliche Potsdamer Kommentarkorpus, implementiert in der linguistischen Datenbank ANNIS 3, mit seiner Mehrebenen-Annotation für praktische Übungen zur Verfügung; hier danke ich Peter Bourgonje und Thomas Krause für die technische Unterstützung. Darüber hinaus sind alle Kapitel gründlich durchgesehen und teilweise ergänzt worden, um neuere Entwicklungen der Textanalyse zu integrieren. Potsdam, im Juni 2018 Manfred Stede Vorwort zur 1.Auflage Dieses Buch nähert sich der Aufgabe Textanalyse aus zwei verschiedenen Richtungen: Das grundsätzliche Anliegen, Strukturen in Texten aufzudecken und nach der Entstehung von Kohärenz zu fragen, ist das der Textlinguistik. Auch die Idee, dafür eine Reihe unterschiedlicher Ebenen heranzuziehen, wird von verschiedenen Autor / innen der Textlinguistik vertreten. Sie ist jedoch ebenso in der Computerlinguistik prominent, und damit geht der Versuch einher, die Aufteilung in Ebenen und die Untersuchung ihrer Zusammenwirkung möglichst systematisch zu betreiben. Hinzu kommt die Betonung der Rolle eines datenorientierten Vorgehens, das (neben der Korpuslinguistik, per definitionem) gleichfalls in der Computerlinguistik seit vielen Jahren gründlich verankert ist. Während meiner Beschäftigung mit der Thematik fiel mir auf, wie merkwürdig separat die Disziplinen Textlinguistik und Computerlinguistik allerdings nebeneinander zu existieren scheinen: Die Textlinguistik nimmt kaum einmal die durchaus interessanten Ergebnisse der textbezogenen Computerlinguistik auf. Und in der Computerlinguistik werden mitunter Räder neu erfunden, die vor vielen Jahren in der Textlinguistik bereits bekannt waren, wenn auch möglicherweise noch nicht 10 Vorworte hinreichend formalisiert. Diese Entwicklung ist bedauerlich, und es erscheint mir wichtig, die beiden Disziplinen stärker aufeinander aufmerksam zu machen. Sollte das Buch dazu einen Beitrag leisten, so wäre ein Ziel erreicht. Das Buch möchte Studierenden einen Überblick über die verschiedenen Ebenen der linguistischen Textanalyse vermitteln. Weil am Ende die Einsicht in das Zusammenwirken der unterschiedlichen Ebenen stehen soll, ist das Unterfangen relativ „breit“ angelegt-- wir behandeln eine ganze Reihe recht unterschiedlicher Themen. Dies bedingt, dass bei der Diskussion der Einzelebenen einiges nur kursorisch besprochen wird, was von Fall zu Fall unbefriedigend erscheinen mag. Ich habe jedoch versucht, am Ende jedes Kapitels Hinweise auf geeignete weiterführende Lektüre zur jeweiligen Ebene anzugeben. Das Buch entstand im Verlauf dreier Veranstaltungen des Proseminars Textstrukturen an der Universität Potsdam. Allerlei Anregungen aus den Diskussionen mit Seminarteilnehmer / innen flossen in die Überarbeitungen ein. Besonders bedanken möchte ich mich bei Eva Breindl, Christian Chiarcos, Stefanie Dipper, Michael Grabski, Alexander Mehler und Georg Rehm für ihre wertvollen Hinweise zur Verbesserung früherer Versionen einzelner Kapitel. Andreas Peldszus half bei einigen technischen Problemen und der Gestaltung von Abbildungen. Doch wie immer gilt: Für alle verbleibenden Fehler ist allein der Autor verantwortlich. Potsdam, im März 2007 Manfred Stede Teil I Einführung und Grundbegriffe 13 Vorwort zur 1. Auflage 1 Einleitung und Übersicht 1.1 Motivation Texte sind vielschichtige Objekte. Lesen wir einen, so geschehen vielerlei Dinge mit uns: Unter anderem rufen wir die einzelnen Wörter oder Phraseme (Mehrworteinheiten) in unserem mentalen Lexikon ab; analysieren wir seine Sätze und ihre Bestandteile mit Hilfe unseres grammatischen Wissens; machen uns ein Bild von der Bedeutung der Sätze; stellen dazu Zusammenhänge zu anderen Sätzen her (z. B. beim Verstehen eines Pronomens); setzen auch die einzelnen Satzbedeutungen zueinander in Beziehung (z. B. beim Herstellen eines Kausalzusammenhangs, der nicht explizit ausgedrückt ist); stellen fest, „worum es geht“ und registrieren Themen-Wechsel an bestimmten Textstellen; nehmen den Stil des Textes wahr: auf welche Weise spricht die Autorin oder der Autor mit uns; identifizieren wir gelegentlich versteckte Präsuppositionen und interpretieren unscheinbare Andeutungen; erkennen wir (oder glauben zu erkennen), was man uns mit diesem Text wirklich sagen will, welchen Zweck der Text erfüllen soll. All dies und mehr geschieht sehr schnell und zur gleichen Zeit-- der Text geht nicht wie ein Computerprogramm „Schritt für Schritt“ vor und serviert uns solcherlei Informationseinheiten und Verarbeitungsanweisungen in sauberer Reihenfolge, sondern lässt uns in hohem Maße parallel arbeiten, also rezipieren und konstruieren. Ein Blick auf die Etymologie des Wortes Text, wie ihn etwa Mistrik (1973, S. 10) vornahm, verdeutlicht die Komplexität: Das Verständnis dieses Begriffes wird uns durch den Rückgriff auf die ursprüngliche Bedeutung des lateinischen Verbums texo, texere und des lateinischen Substantivums textus erleichtert: texo, texere heißt weben, flechten, zusammenfügen, bauen; textus heißt Gewebe, Geflecht, Zusammenhang, Gefüge. Ein Text ist also ein kompaktes Ganzes, dessen Inneres auf eine bestimmte Weise geflochten, d. h. aus der Fügung sprachlicher Elemente entstanden ist. Er ist eine in sich geschlossene sprachliche Äußerung im allgemeinen Sinne. Mistrik betont hier auch, dass bei aller Komplexität ein (guter) Text am Ende die verschiedenen Fäden wieder zusammen laufen lässt, den Eindruck der Abgeschlossenheit vermittelt. Nach der Lektüre kann der Leser mit der Autorin übereinstimmen oder nicht, kann feststellen, dass vielleicht einige inhaltliche Fragen offen geblieben sind; doch das Lese-Erlebnis als solches ist erfolgreich beendet, wenn sich das Gefühl einstellt, das Anliegen des Textes insgesamt verstanden zu haben. Wie aber „funktioniert“ ein solch komplexes Lese-Erlebnis? Wie gelingt es dem Text, uns ein solches Erlebnis zu verschaffen? Aus linguistischer Sicht ist dies bislang nur in einzelnen Ansätzen verstanden. Es gibt relativ gut ausgearbeitete Modelle für bestimmte Aspekte (z. B., wie finden wir ein Antezedens für ein Personalpronomen), aber es gibt keine umfassende Erklärung für das Zusammenwirken der verschiedenen Teilaufgaben, die wir beim Lesen bearbeiten. Dass man sich für die Suche nach einer solchen Erklärung auf ganz unterschiedliche Beschreibungsebenen begeben muss, dürfte heute weitgehend unstrittig sein. Bereits im Modell von Grosz u. Sidner (1986) ist von drei verschiedenen Strukturen die Rede (die allerdings 14 1 Einleitung und Übersicht nicht gleichermaßen ausgearbeitet wurden): einer intentionalen, einer aufmerksamkeitssteuernden (attentional) und einer linguistischen Struktur. Ähnlich unterscheidet Nussbaumer (1991) eine funktional-illokutive Ebene (Handlungsstruktur), eine inhaltlich-propositionale Ebene, sowie eine sprachlich-ausdrucksseitige Ebene. Sehr reichhaltig ist das Programm der Untersuchung dieser Vielfalt in dem Band Ebenen der Textstruktur (Motsch, 1996) artikuliert. Auch Brinker (2005) betont, dass künftige Forschung die einzelnen Ebenen zunächst isolieren und dann systematisch miteinander verbinden müsse. Allein fehlt bis heute eine Theorie, die auf der Grundlage sorgfältig ausgearbeiteter Einzelebenen dann genau das Zusammenwirken dieser Ebenen erklären könnte. Dieses Ziel wurde vor einiger Zeit bereits sehr eingängig von Brandt u. Rosengren (1992, S. 9, Hervorh. durch MS ) formuliert: Einigkeit besteht heute darüber, dass Texte multidimensionale Gebilde sind-(…) In (Motsch 1990a) liegt ein Versuch vor, die einzelnen Ebenen zu identifizieren. Diese kurze Übersicht zeigt, dass die vielen theoretischen Ansätze, die oft neben- und unabhängig voneinander konzipiert wurden und häufig auch nur einen Aspekt des Textes beleuchten, in einem generellen Modell zueinander in Bezug gesetzt und an authentischem Material überprüft werden müssen. Ein solches Modell kann nicht auf Anhieb ausgearbeitet werden. Auch heute ist dieses Modell noch nicht in Sicht; bei der Feststellung, dass es „nicht auf Anhieb“ entwickelt werden kann, dürfte es sich mithin um eine milde Formulierung handeln. Eine andere Untersuchung, die sich ebenfalls diesem Ziel verschreibt, ist die von Schröder (2003), der formuliert (S. 1, Hervorh. im Original): Entscheidend ist, dass die multidimensionale Textstruktur als ein Zusammenspiel aus verschiedenartigen Ebenen begriffen wird. Daraus folgt, dass die unterschiedlichen Ebenen der Textstrukturierung nicht nur getrennt und sozusagen ‚nebeneinander‘ existieren, sondern dass sie sich gegenseitig auch beeinflussen und untereinander in einem Verhältnis wechselseitiger Abhängigkeiten stehen. Für Schröder steht dann speziell die Handlungsstruktur im Mittelpunkt der Betrachtung, während es uns hier darum geht, nicht eine bestimmte Ebene vertieft zu behandeln, sondern mehrere Ebenen gleichermaßen zur Sprache zu bringen, und die Aufmerksamkeit auf die besagten wechselseitigen Abhängigkeiten zu richten. Um einen Beitrag zu dem eher langfristigen Ziel der Modellierung des Zusammenwirkens zu leisten, schlagen wir zwei, ihrerseits miteinander verwobene, Wege ein: ▶ Wir versuchen, für eine Reihe interessanter Beschreibungsebenen den jeweiligen „Stand der Kunst“ darzustellen, also Material zusammen zu tragen, das für die Ebene grundlegend ist und auf dessen Basis die Entwicklung präziserer Modelle möglich sein sollte. ▶ Wir betonen die wichtige Rolle von Daten als Grundlage der Erkenntnissuche und der Theoriebildung. Für die Untersuchung des linguistischen Objekts Satz sind Korpora und insbesondere mit syntaktischer Information angereicherte (sog. ‚annotierte‘) Daten in Gestalt von ‚Baumbanken‘ heute bereits zu einer sehr wichtigen Informationsquelle für viele Syntaktiker geworden. Für den Text ist dieser Perspektivenwechsel bisher-- zumindest was die Arbeit mit annotierten Daten betrifft-- noch weniger vorangeschritten. 15 1.2 Arbeit mit Textkorpora: Software-Werkzeuge für Annotation und Recherche So wie bestimmte Satz-Baumbanken für Computerlinguisten, aber auch für weniger Computer-orientierte Syntaktiker, die gemeinsame Datenbasis darstellen, anhand derer Hypothesen geprüft, weiterentwickelt und miteinander verglichen werden können, kann auch die Untersuchung von Texten erheblich von annotierten Korpora profitieren, anhand derer sich Phänomene aufzeigen lassen, die dann eben auch von Dritten nachvollzogen und weiter intepretiert werden können. Voraussetzung dafür ist freilich, dass die Annotationen einerseits nachvollziehbar und andererseits nützlich sind. Für die Textanalyse bedeutet das-- und damit schließt sich unser Kreis-- gut motivierte, voneinander getrennte Analyse-Ebenen, die einerseits in sich selbst schlüssig begründet sein müssen und andererseits dann das Auffinden von Korrelationen zwischen diesen Ebenen ermöglichen. Wenn, wie von den oben zitierten (und weiteren) Autoren richtigerweise betont, das Wechselspiel zwischen verschiedenen Ebenen letztlich die Textualität hervorbringt, dann setzt eine systematische Untersuchung dieser Phänomene eine geeignete Datengrundlage voraus: Texte, die gleichzeitig auf unterschiedlichen Ebenen annotiert sind. Dass die Arbeit mit solchen Text-Daten heute möglich ist, verdanken wir den korpus- und computerlinguistischen Entwicklungen der letzten Jahre. Die technische Seite wird in diesem Buch öfters zur Sprache kommen, sie ist aber auch kein zwingender Bestandteil der Lektüre: Die zentrale Diskussion der einzelnen Beschreibungsebenen wird rein inhaltlicher Natur sein. Unser Untersuchungsgegenstand sind allein geschriebene Texte, und wir treffen hier auch die oft übliche Einschränkung auf sog. Gebrauchstexte. Um dem komplexen „Funktionieren“ von Texten auf die Spur zu kommen, sollte man einerseits mit „richtigen“ Texten arbeiten und nicht allein mit handgefertigten Beispielen, andererseits aber die Komplexität auch begrenzen: Wie etwa Dichtung oder spielerische Werbetexte funktionieren, werden wir hier nicht untersuchen. Sämtliche multimedialen Aspekte bleiben ebenfalls von der Betrachtung ausgeschlossen. Bedingt durch das unseren eigenen Untersuchungen meist zugrunde liegende Korpus, das Potsdamer Kommentarkorpus, gibt es darüber hinaus einen gewissen Schwerpunkt auf Phänomenen in argumentativen Texten; doch die meisten Kapitel und Abschnitte sind unabhängig von dieser Wahl und gleichermaßen für andere Texttypen gültig. 1.2 Arbeit mit Textkorpora: Software-Werkzeuge für Annotation und Recherche Im Folgenden gehen wir kurz auf die technische Seite einer korpusgestützen Textanalyse ein. Eine Reihe der Übungsaufgaben in den folgenden Kapiteln basieren auf den hier besprochenen Software-Werkzeugen. Es sei aber noch einmal betont, dass das Buch ggf. auch vollständig ohne die Komponente der Korpus-Recherche gelesen und bearbeitet werden kann. Die Arbeit mit Textkorpora kann im Prinzip beginnen, sobald eine Sammlung von Textmaterial, das nach bestimmten Kriterien ausgewählt wurde, zusammengestellt ist. 1 Mit geeigneten Software-Werkzeugen lassen sich dann Untersuchungen der Wortfrequenz, von 1 Wir geben hier nur einen äußerst knappen Überblick; eine fundierte Einführung in die allgemeine Herangehensweise der Korpuslinguistik vermttelt beispielsweise der Band von Lemnitzer u. Zinsmeister (2015). 16 1 Einleitung und Übersicht Kollokationen etc. durchführen (Hinweise auf solche Werkzeuge finden sich auf der Homepage zum Buch). Für viele Zwecke entsteht allerdings ein eherblicher Mehrwert, wenn die Texte nicht nur „roh“ vorliegen, sonden mit linguistischer Information annotiert sind. Unter Annotation verstehen wir die Anreicherung von „Primärdaten“ (in unserem Fall: Texten) mit Informationen, die aus linguistischer Interpretation hervorgehen. Dabei kann es sich um ganz unterschiedliche Arten von Information handeln: part-of-speech tags, Syntax-Bäume, Sprechakte uvm. Der eigentliche Annotationsvorgang geschieht für manche Informationsarten vollautomatisch, wie üblicherweise bei der morphologischen Analyse und dem part-of-speech tagging (der Annotation mit Wortart-Information). Diese automatische Bearbeitung ermöglicht es den großen deutschsprachigen online-Korpussammlungen cosmas 2 ( IDS Mannheim) und DWDS 3 ( BBAW ), Abfragemöglichkeiten anzubieten, die verschiedene Flexionsformen zum eingegebenen Wort finden, typische Wortkookkurrenzen berechnen, oder Wortsuche bei zusätzlicher Angabe der Wortart (zur Desambiguierung) ausführen. Wenn eine Annotationsaufgabe so schwierig ist, dass sie einstweilen nicht oder nur mit ungenügender Ergebnisqualität automatisierbar ist, dann muss sie manuell durch geschulte Annotatoren ausgeführt werden. Dies ist bei allen in diesem Buch besprochenen Ebenen der Fall, auch wenn für einige davon bereits automatische Lösungen mit durchaus beachtlicher-- aber eben nicht perfekter-- Qualität existieren. Auch für die manuelle Annotation sind aber geeignete Software-Werkzeuge erforderlich, die vor allem diese zwei Zwecke erfüllen: ▶ Das Werkzeug kann den jeweiligen Typus der Annotation durch eine geeignete Visualisierung und ein zugeschnittenes Bedienungskonzept optimal unterstützen und dadurch hohe Effizienz ermöglichen. ▶ Die entstehenden Daten können in geeigneten Formaten abgespeichert werden, die eine einfache Weiterverarbeitung erlauben. Mit anderen Worten: Linguistische Annotation sollte in aller Regel nicht mit dem gebräuchlichen Textverarbeitungs- oder Tabellenkalkulationsprogramm erfolgen. In den späteren Kapiteln gehen wir jeweils am Ende auf die konkrete Annotationsaufgabenstellung ein, nennen geeignete Werkzeuge, und geben weitere Hinweise auf der Homepage. Aufwändige Annotationen entfalten ihre Wirkung freilich erst, wenn man nach ihnen auch recherchieren kann. Für die Syntax bedeutet dies vor allem die Suche in Datenbanken, die speziell auf Baumstrukturen zugeschnitten sind. Ebenso gibt es aber auch Korpora, die auf der Text-Ebene annotiert sind, beispielsweise für die Koreferenz zwischen Nominalphrasen (siehe Kap. 4). Auch dafür benötigt man dann spezielle Abfrage- und Auswertungswerkzeuge, um aus den Daten Erkenntnisse zu ziehen. (In manchen Fällen gestattet bereits das Annotationswerkzeug auch die Recherche, oft ist das aber nicht der Fall.) Von besonderem Interesse ist es nun, wenn dieselben Primärdaten mit einer Reihe von ganz unterschiedlichen Annotationen versehen sind, aus deren Kombination sich dann-- sei 2 http: / / www.ids-mannheim.de/ cosmas2 (Zugriff 30. 10. 17). 3 http: / / www.dwds.de (Zugriff 30. 10. 17). 17 1.2 Arbeit mit Textkorpora: Software-Werkzeuge für Annotation und Recherche es durch manuelle Recherche oder durch statistische Auswertung-- neue Erkenntnisse gewinnen lassen. Dies entspricht dem oben (S. 14) wiedergegebenen Zitat von Brandt u. Rosengren (1992), wonach Ebenen zueinander in Beziehung gesetzt werden, indem man sie an authentischem Material prüft. Möchte man dies an einigermaßen umfangreichem Textmaterial tun, so ist eine Automatisierung mittels einer Datenbank unerlässlich. Damit dieses Szenario der Mehrebenenannotation (engl. multi-level annotation) funktioniert, muss eine gewisse Systematik eingehalten werden, damit diese Ebenen einerseits separat recherchiert und ggf. auch verändert werden können. Um andererseits Korrelationen zwischen einzelnen Annotationsebenen aufdecken zu können, müssen alle Annotationen technisch mit den Primärdaten in derselben Weise verbunden sein. Dies wird durch eine sogenannte standoff-Annotation erreicht, bei der sowohl der Primärtext als auch jede Analyse-Ebene jeweils in einer einzelnen Datei gespeichert und die Verbindungen zwischen den Ebenen durch „Zeiger“ realisiert werden. Eine technische Grundlage dafür ist XML (‚eXtensible Markup Language‘) als standardisiertes Austauschformat für Daten zwischen verschiedenen Software-Systemen. Der große Vorteil ist, dass man für die verschiedenen Analyse-Ebenen jeweils spezielle Werkzeuge benutzen kann, die auf die zugrunde liegenden Strukturen zugeschnitten sind und damit ein möglichst effektives Arbeiten erlauben. Abbildung 1.1: Architektur der Daten-Annotation mit ANNIS Annotiert man nun jeweils denselben Text mit verschiedenen Werkzeugen auf verschiedenen inhaltlichen Ebenen, müssen anschließend alle resultierenden Annotationen wieder 18 1 Einleitung und Übersicht zusammengefügt werden. Dies geschieht in einer linguistischen Datenbank, die dann die Recherche erlaubt. Abb. 1.1 illustriert diese Konzeption: Die Annotationswerkzeuge auf der linken Seite (die dort genannten werden im Verlauf des Buches kurz angesprochen werden) erzeugen jeweils eigene XML -Dateien, die dann in einem geeigneten Austauschformat (wie zum Beispiel PAULA , Dipper (2005)) zusammengeführt und in die Datenbank (wie zum Beispiel ANNIS ; siehe unten) eingespeist werden. Zusätzlich können weitere Werkzeuge für die statistische Auswertung der Daten benutzt werden; dieses Thema werden wir in diesem Buch aber nicht weiter besprechen. Eine Alternative besteht darin, ein universelleres Annotationswerkzeug zu benutzen, mit dem sich unterschiedliche Typen von Information annotieren lassen; in diesem Fall entfällt die Zusammenführung der verschiedenen Annotationsformate. Es sollte aber stets abgewogen werden, ob dieser Vorteil nicht dadurch gemindert wird, dass das Werkzeug für einige der Annotationsschritte möglicherweise nur bedingt geeignet ist oder eine umständliche Handhabung mit sich bringt. ANNIS Weil die Datenbank in der Lage sein muss, für dieselben Primärtexte ganz unterschiedliche Annotationsschemata recherchierbar bereitzustellen und die Suchergebnisse angemessen zu visualisieren, sind Standard-Textdatenbanken für unseren Zweck nicht verwendbar. Die für dieses spezielle Szenario konzipierte linguistische Datenbank ANNIS entstand in einer ersten Version in den frühen 00er Jahren an der Universität Potsdam 4 (Dipper u. a., 2004) und wurde später an der Humboldt Universität zu Berlin ausgiebig weiterentwickelt (Krause u. Zeldes, 2016). Es handelt sich um eine open-source software, die in der aktuellen Version ANNIS 3 von der Webseite ‚corpus-tools.org‘ bezogen werden kann. 5 4 Die Entwicklung erfolgte im Rahmen des Projekts ‚Linguistische Datenbank‘ im DFG -geförderten Sonderforschungsbereich 632 (www.sfb632.uni-potsdam.de, Zugriff 30. 10. 17). 5 http: / / corpus-tools.org (Zugriff 30. 10. 17). ANNIS zeigt die verschiedenen Annotationsebenen zu einem Text jeweils in einer Form, die dem Annotationstyp entspricht. In dem Bildschirmabzug in Abbildung 1.2 (der nur einen Ausschnitt der Benutzeroberfläche zeigt) sind für denselben Textausschnitt die morphosyntaktischen Informationen, Syntax-Bäume, sowie die Koreferenz-Markierungen (vgl. Kap. 4) angezeigt. Weitere Annotationsebenen können nach Wunsch aufgeklappt werden. Die Suchfunktion von ANNIS gestattet die Formulierung von Anfragen, die mehrere Annotationsebenen miteinander verbinden. Angenommen, zu den gespeicherten Texten liegen Annotationen zur Syntax, zum Informationsstatus der Diskursgegenstände und zur rhetorischen Struktur vor, so ist es beispielsweise möglich, alle Textstellen zu finden, in denen 1. eine Präpositionalphrase am Satzanfang steht, 2. der in der dort eingebetteten NP denotierte Diskursgegenstand brand-new ist, und 3. die PP als Satellit der Kohärenzrelation Concession verwendet wird. 19 1.2 Arbeit mit Textkorpora: Software-Werkzeuge für Annotation und Recherche Abbildung 1.2: Bildschirmabzug von ANNIS 3 (Ausschnitt) Ein entsprechender Satz könnte lauten: Trotz einer Verwarnung durch die Schiedsrichterin ging Leonie weiter mit großem Elan in die Zweikämpfe. Wie die Suchsprache AQL (‚ ANNIS Query Language‘) benutzt wird, ist in den Hilfeseiten beschrieben, die in ANNIS integriert sind. Einführende Hinweise für den Start finden sich auch auf der Homepage zu diesem Buch (unter www.narr-studienbuecher.de), wo auch die URL einer öffentlich nutzbaren ANNIS -Installation angegeben ist, mit der das Potsdamer Kommentarkorpus bearbeitet werden kann. 1.3 Das Potsdamer Kommentarkorpus In der Entstehungszeit von ANNIS wurde auch das ‚Potsdamer Kommentarkorpus‘ ( PCC ) als exemplarisches Korpus für die Mehrebenen-Annotation entwickelt (Stede, 2004). Es besteht aus 174 Texten aus der Märkischen Allgemeinen Zeitung ( MAZ ), die ursprünglich auf den Ebenen Satzsyntax, nomnale Koreferenz und Rhetorische Struktur annotiert wurden. In der aktuellen Version PCC 2.0 6 (Stede u. Neumann, 2014) sind Konnektoren und ihre Argumente hinzugekommen. Die der Annotation zugrunde liegenden Richtlinien sind in dem online frei 6 http: / / angcl.ling.uni-potsdam.de/ resources/ pcc.html (Zugriff 30. 10. 17). 20 1 Einleitung und Übersicht zugänglichen Band (Stede, 2016a) zusammengefasst. Alle Texte stammen von den Kommentarseiten der MAZ aus den frühen 00er Jahren und sind etwa 12-14 Sätze lang. Das PCC ist in ANNIS 3 online verfügbar und kann für Korpusabfragen zu den meisten der in Teil II des Buches diskutierten Annotationsebenen verwendet werden. Eine ausführlichere Darstellung der Hintergründe des Korpus und der zugrunde liegenden Design-Entscheidungen beim PCC findet sich in (Stede, 2016b). 1.4 Übersicht über das Buch Der Teil I ‚Einführung und Grundbegriffe‘ wird im folgenden Kapitel mit einer Diskussion der Schlüsselbegriffe Kohäsion und Kohärenz fortgesetzt, die üblicherweise als die zentralen Merkmale der Textualität verstanden werden. Anschließend stellen wir Konzeptionen zu den miteinander verwandten Begriffen Textfunktion, Textsorte und Texttyp vor und betonen hier auch die wichtige Rolle von Korpora für den Erkenntnisgewinn (Kap. 3). Teil II des Buches widmet sich den verschiedenen Ebenen der Textanalyse. Zunächst geht es um die Referenzielle Struktur (Kap. 4), dann um die Thematische Struktur und die Verbindung zur Informationsstruktur von Sätzen (Kap. 5). Nach einem Blick auf Temporale Struktur (Kap. 6) wenden wir uns den Sprechakten und der daraus hervorgehenden Konzeption einer Illokutionsstruktur zu (Kap. 7). Den Abschluss bildet eine genauere Betrachtung des Typus der argumentativen Texte und ihrer Struktur (Kap. 8). Teil III untersucht exemplarisch einen Ansatz, der sich nicht nahtlos in die Ebenen-Darstellung integrieren lässt, weil er einen umfassenderen Anspruch auf „die“ linguistisch motivierte Textstrukur erhebt. Hiernach kann ein Text in seine strukturell-relevanten minimalen Einheiten zerlegt werden (Kap. 9), die dann durch sogenannte Kohärenzrelationen zu einer Rhetorischen Struktur zusammengefügt werden (Kap. 10). Am Schluss fasst Kapitel 11 dann das zentrale Anliegen noch einmal zusammen, weist exemplarisch auf Wechselwirkungen zwischen einzelnen Ebenen hin, und nimmt im Lichte der in Teil II und III diskutierten Fragen abermals die Frage nach der Kohäsion, der Kohärenz und der Textstruktur(en) unter die Lupe. Die einzelnen Kapitel sind so konzipiert, dass sie zwar nach einer gewissen Logik aufeinander folgen, doch sie lassen sich recht problemlos auch einzeln bearbeiten, wenn sich das Lese- Interesse auf ausgewählte Themen richtet. Abschließend zwei Hinweise zur Terminologie: (i) Die Frage der Verwendung geschlechts / un / spezifischer Bezeichnungen behandeln wir in diesem Buch durch zufälligen Wechsel zwischen maskuliner und femininer Form. (ii) Die „handelnden Personen“ rund um den Text bezeichnen wir meistens als ‚Autorin‘ oder ‚Verfasser‘ und ‚Leser‘, doch mitunter (etwa bei der Diskussion von Sprechhandlungen) verwenden wir auch andere Begriffe wie ‚Sprecher‘, ‚Hörerin‘, ‚Adressat‘ oder ‚Rezipientin‘, ohne damit jeweils wichtige theoretische Unterscheidungen zu verbinden. 21 1.5 Übungsaufgabe 1.5 Übungsaufgabe Wählen Sie aus dem Online-Angebot einer Tageszeitung einen nicht zu langen Kommentar (10-15 Sätze) aus und speichern Sie ihn in einer „plain text“ Datei. Der Kommentar sollte nicht allzu schwierig sein in dem Sinne, dass er eher arm an komplexen syntaktischen Konstruktionen sein und möglichst keine wiedergegebene wörtliche Rede enthalten sollte. Dieser Text wird die Arbeitsgrundlage für viele der Übungsaufgaben der nachfolgenden Kapitel sein. Falls Sie planen, den technischen Anregungen zu folgen und spezielle Software-Werkzeuge für die Annotation Ihres Kommentars einzusetzen, können Sie in Ihrem Text Umlaute und Sonderzeichen ersetzen, um etwaige ärgerliche und zeitraubende Zeichensatz- und Konvertierungs-Probleme von vornherein zu vermeiden. Aber auch, wenn Sie sich mit spezieller Software nicht befassen wollen, werden Sie vielleicht die verschiedenen Anmerkungen zu Ihrem Kommentar speichern und wiederfinden wollen. In diesem Fall brauchen Sie eine Datei und nicht nur einen Papier-Ausschnitt. 23 2.1 Die Anfänge der Textlinguistik 2 Kohäsion, Kohärenz und Textualität Dieses Kapitel wirft zunächst einen Blick auf die Wurzeln der Textlinguistik und beleuchtet dann in Kürze die wesentlichen Phänomene der Kohäsion und Kohärenz. (Diese werden in den nachfolgenden Kapiteln dann vertieft dargestellt.) Weitere Phänomene der Textualität werden angesprochen und Beispiele für die Untersuchung annotierter Korpora genannt. 2.1 Die Anfänge der Textlinguistik In den 1960er Jahren, einer durch die bahnbrechenden Entwicklungen von Chomskys Generativer Transformationsgrammatik ausgelösten „Blütezeit der Syntax“, waren die Untersuchungsgegenstände der Linguistik das Morphem, das Wort, die systematischen Wortgruppen bzw. Konstituenten und der Satz. Nur wenige Sprachwissenschaftler zeigten sich von dieser Konzentration auf die Satz-Beschreibung unbefriedigt und meldeten Interesse an, auch satzübergreifende Phänomene zum Ziel linguistischer Untersuchung und Theoriebildung zu machen, mithin den Text als linguistische Einheit zu begreifen. Einer der wesentlichen Auslöser der Beschäftigung mit Texten war der Wunsch, die Funktion und Bedeutung von Pronomina linguistisch zu erklären. Pronomina sind die augenfälligsten sprachlichen Mittel, die Bezüge zwischen Sätzen herstellen. Hier ein auch von Linke u. a. (1994) zitiertes Textbeispiel aus einem Roman: (2.1) Ich glaube, dann war Nadja dran. Sie hatte sich für Jura beworben und wußte längst, daß sie zugelassen war. Sie hatte es telefonisch erfahren, und sie hatte mittlerweile auch einen Förderungsvertrag mit Patenschaft und so unterschrieben. Sie kriegte dann aber irgendwie Kontakt mit einer frustrierten Richterin, die den Laden von innen kannte. Von da an wollte Nadja nicht mehr. (Thomas Brussig: Wasserfarben) Mit Ausnahme eines einzelnen Teilsatzes ist kontinuierlich die Rede von Nadja, auf die nach der ersten Erwähnung durchgehend mit dem Personalpronomen sie verwiesen wird- - bis zum letzten Satz, wo wieder ihr Name genannt wird, entweder um der drohenden Monotonie zu begegnen, oder um einer möglichen Verwechslung mit der Richterin vorzubeugen. Der Autor hat bei der Wahl seiner referierenden Ausdrücke (auch ‚referenzielle Ausdrücke‘ genannt) viele Freiheiten: Er kann Eigennamen, Pronomen, umschreibende Nominalphrasen ( NP ) verwenden. Gleichzeitig unterliegt er aber auch Beschränkungen, denn das intendierte Bezugsobjekt muss von der Leserin auch ohne allzu viel Mühe rekonstruiert werden können. Solcherlei Beobachtungen zum Wechselspiel zwischen Wahlfreiheit und Einschränkung bei der Textproduktion weckten das Interesse derjenigen, die den Blick über den sprichwörtlichen Tellerrand des Satzes hinaus richteten. Eine der „Pionierarbeiten“ der Textlinguistik war die Dissertation von Roland Harweg (1968), in der er die unterschiedlichen Arten von Pronomina klassifizierte und ihre Rolle im Text untersuchte. Da er einen sehr weiten Begriff verwendete und auch einige definite NP s unter ‚Pronomina‘ subsumiert, definierte er dann auch ‚Text‘ als „ein durch ununterbrochene 24 2 Kohäsion, Kohärenz und Textualität pronominale Verkettung konstituiertes Nacheinander sprachlicher Einheiten.“ Als weiteren Wegbereiter der Textlinguistik nennt Adamzik (2004) vor allem Peter Hartmann (s. etwa Hartmann, 1968), der u. a. das Augenmerk auf die Funktion von Texten (im Gegensatz zu ihrer strukturellen Beschreibung) richtete und deutlich machte, dass Sprecher nicht in Worten, auch nicht in Sätzen, sondern mit Sätzen aus Worten in Texten sprechen, mithin der Text der primäre Untersuchungsgegenstand der Sprachwissenschaft sei. Ähnlich hatte auch Harald Weinrich mit seiner vielbeachteten Arbeit Tempus (Weinrich, 1964) dem Satz den Status als Haupt-Gegenstand der Linguistik abgesprochen; später legte er konsequenterweise dann auch eine Textgrammatik der deutschen Sprache vor (Weinrich, 2005, 3. Aufl.). „Phasen“ der Textlinguistik Nach Adamzik (2004) lässt sich die bis zur Jahrtausendwende durchgeführte Textlinguistik- Forschung (im deutschsprachigen Raum) grob in drei Phasen einteilen: 1. die transphrastische Phase, die Phänomene der Satzverknüpfung untersucht; 2. die kommunikativ-pragmatische Phase, die Texte als komplexe sprachliche Handlungen auffasst und analysiert; 3. die kognitivistische Phase, die die kognitiven Prozesse der Produktion und Rezeption bei Sprachbenutzern in den Mittelpunkt stellt. In den letzten etwa zehn Jahren wurde die Linguistik dan insgesamt stark von der Hinwendung zu authentischen Sprachdaten beeinflusst, wodurch eine empirisch fundierte Theoriebildung befördert wurde. Im vorliegenden Buch nehmen wir ebenfalls diese Perspektive ein und richten den Blick auf die Arbeit mit Korpora, die für die Beschreibungsebene Text vielfältig annotiert sind. Um Sätze oder Teilsätze miteinander zu verbinden, sind die oben genannten Pronomina ein prominentes, aber keineswegs das einzige sprachliche Mittel. Solche Verbindungen kommen immer dann zum Tragen, wenn die Interpretation einer sprachlichen Einheit die Interpretation einer anderen zur Voraussetzung hat. Wir sprechen dann von Kohäsion zwischen solchen Einheiten und nennen die entsprechenden Signale an der sprachlichen Oberfläche kohäsionsstiftende Mittel. 2.2 Kohäsion Zur Motivation dieses Themas zitieren Halliday u. Hasan (1989) das Beispiel eines stand-up comedian, der auf die Bühne trat und seinen Vortrag mit den Worten begann: So we pushed him under the other one. Dies ist (zumindest bis unmittelbar nach der Äußerung des Satzes) ein Exemplar eines rundum misslungenen Textes, der eine Anzahl unauflösbarer Verweise enthält-- sozusagen ein vorgetäuschter Text, der Kohäsionsmittel einsetzt, aber dabei keinen 25 2.2 Kohäsion Sinn vermittelt. Kohäsion ist also allein ein Aspekt der sprachlichen Oberfläche. In gewöhnlichen Texten geht sie mit Sinnhaftigkeit (der im nächsten Abschnitt zu besprechenden Kohärenz) einher, doch ist diese Verbindung eben nicht zwangsläufig gegeben. 2.2.1 Kohäsionsmittel Welche sprachlichen Mittel gibt es, um solcherlei Kohäsion herzustellen? Nach Bußmann (2002) handelt es sich „im Wesentlichen um Erscheinungen der Wiederholung, Ersetzung und Verknüpfung.“ Die nachfolgende Liste ist eine Kombination und Ergänzung aus ähnlichen Listen von Halliday u. Hasan (1989), Linke u. a. (1994) und Bußmann (2002). Die Phänomene werden hier nur kurz erwähnt, und die meisten werden in späteren Kapiteln dann ausführlicher behandelt. Rekurrenz bezeichnet nach Linke u. a. (1994) die „materielle Wiederaufnahme eines einmal eingeführten Textelements im nachfolgenden Text.“ Dies kann durchgehende Koreferenz (Bezugnahme auf denselben Gegenstand; s. u.) einschließen wie in Beispiel 2.2 mit Vogel oder auch nicht, wie in Beispiel 2.3 (Mutter); der letztgenannte Fall wird häufig als weniger kohäsiv angesehen als der erste. (2.2) Gestern habe ich einen Vogel beim Nestbau beobachtet. Der Vogel war ganz klein, hat aber trotzdem ziemlich große Zweige angeschleppt. Als Nistplatz hatte sich der Vogel ausgerechnet die Nische über unserem Rollladenkasten ausgesucht. (2.3) Meine Mutter ist sehr ängstlich und denkt immer gleich das Schlimmste. Annas Mutter ist da viel pflegeleichter: Die lässt ihre Tochter abends auch allein weggehen. So eine Mutter wäre mir ja auch lieber. Rekurrenz liegt auch vor, wenn zwei Wörter in unterschiedlichen Flexionsformen gebraucht werden, also zum Beispiel zwischen Mutter und Mütter. Substitution ist die Wiederaufnahme eines Textelements mit identischem Referenzobjekt, aber unterschiedlicher lexikalischer Realisierung. Typisch für Substitution sind die lexikalischen Relationen der (Quasi-) Synonymie, Hyponomie (Unterbegriff) und Hyperonymie (Oberbegriff). Typischerweise wird bei der späteren Wiederaufnahme ein Hyperonym gewählt: Gegen 19 Uhr trat ein Damhirsch aus dem Wald. Nachdem er die Hasen verscheucht hatte, knabberte der Hirsch genüsslich an den Kleeblättern. Ausnahmen von dieser Tendenz gibt es aber beispielsweise in Nachrichtentexten, wo mit referierenden Ausdrücken bei der Wiederaufnahme auch noch neue Information übermittelt wird, wodurch sich insgesamt kurze, verdichtete Texte erstellen lassen: Ein 43 Jahre alter Mann überfiel die Sparkasse. Der Facharbeiter war mit einer Schreckschusspistole-… (In-)Definite Artikel werden benutzt, um die ‚Zugänglichkeit‘ (engl. accessibility) eines Referenzobjekts zu markieren. Eine Faustregel lautet, dass mit indefiniten Artikeln neue Gegenstände in den Diskurs eingebracht werden, während definite Artikel Anweisungen 26 2 Kohäsion, Kohärenz und Textualität darstellen, im Kontext nach einem bereits eingeführten Gegenstand zu suchen: Ein Auto kurvte um unser Haus. Nach drei Metern fuhr das Auto gegen eine Ampel. Eine ganz ähnliche Situation, jedoch ohne exakte Referenzidentität, liegt vor, wenn der Gegenstand unmittelbar aus einem im Text bereits eingeführten Gegenstand abgeleitet werden kann, z. B. durch Meronymie (Teil-Ganzes-Relation): Ich habe ein neues Auto. Das Dach ist undicht. Außerdem ist der definite Artikel angemessen, wenn der Gegenstand im Hörerwissen als eindeutig identifizierbar vorausgesetzt werden kann, wie der Papst oder die Bundesregierung. Auch hier handelt es sich um eine Such-Anweisung, allerdings ist der Suchraum nicht der Text, sondern das Weltwissen des Rezipienten. Ähnlich kann der definite Artikel, verbunden mit einer Zeigegeste, im Gespräch auf einen „real“ vorhandenen Gegenstand verweisen: DEN Vogel habe ich gestern schon mal gesehen! Nun ist der Suchraum die außersprachliche Situation.-- Diese beiden Fälle werden mitunter bei der Diskussion von Kohäsion mit behandelt, was aber nicht recht angemessen scheint, eben weil die Verbindung nicht im Text besteht, sondern ein Verweis aus dem Text heraus erfolgt. Den Begriff ‚Kohäsion‘ wollen wir hier allein auf textinterne Verweise beschränken. Pro-Formen sind die verschiedenen Arten der eingangs bereits genannten Pronomina (Personal-, Demonstrativ-, Possessiv-), dazu Pronominaladverbien und einige andere Adverbien wie dort oder da. Die Bezugselemente (oder ‚Antezedenten‘) können einzelne Wörter, Konstituenten, ganze Sätze oder auch Satzgruppen sein: Das war eine kurze Beschreibung des Phänomens ‚Pro-Formen‘. Wir unterscheiden zwischen anaphorischem Gebrauch, bei dem die Pro-Form dem Bezugselement im Text nachfolgt, und kataphorischem Gebrauch, in dem die Pro-Form dem Bezugselement vorausgeht: Bevor sie ins Seminar ging, putzte Maria sich noch einmal die Nase. Ellipsen ähneln den Pro-Formen, wobei aber das anaphorische Element hier eine „Leerstelle“ ist. Soll eine Ellipse zu Analysezwecken im Text markiert werden, ist dafür das Symbol ∅ gebräuchlich. Zu unterscheiden sind Substantiv-Ellipsen (Maria trinkt Kaffee mit Milch. Mir schmeckt schwarzer ∅ besser.) und Verb-Ellipsen (Maria trinkt Kaffee mit Milch, und ich ∅ einen Tee.). Im Deutschen ersetzt Elision auch die im Englischen gebräuchliche ‚one-anaphora‘, wobei dann keine Referenzidentität zwischen den Objekten besteht: Diese Kekse sind hart. Wir brauchen frische ∅ . Bußmann (2002) weist darauf hin, dass nicht alle Ellipsen kohäsionsstiftend sind, weil bestimmte Typen syntaktisch motiviert sind. Dazu zählen lexikalische Ellipsen, in denen ein Argument des Verbs qua Weltwissen vom Rezipienten ergänzt wird (Er isst gerade / Die Hühner legen gerade), Infinitivkonstruktionen (Luise hat aufgehört zu rauchen) und Subjekt- Elision in Imperativsätzen (Geh nach Hause! ). Referenzunabhängige lexikalische Assoziation: Die zuletzt besprochenen Phänomene beruhen auf Koreferenz, also auf identischem Bezug der kohäsiv verbundenen Ausdrücke zur „Welt“. Zwischen Lexemen können aber auch referenzunabhängige Assoziationen bestehen, wie oben mit Beispiel 2.3 für den Fall identischer Wörter illustriert. Dies lässt sich zunächst 27 2.2 Kohäsion ausdehnen auf Wörter unterschiedlicher Wortart, die aber morphologisch und semantisch eng verwandt sind, wie Mensch und menschlich. Ein nächster Schritt der Ausweitung führt zu den Synonymen, also nahezu bedeutungsgleichen Wörtern oder Phrasen wie etwa sehr groß / riesig. Synonym-Verwendung kann mit Koreferenz einhergehen (s. o. Substitution), muss es aber nicht tun. Kohäsion entsteht des Weiteren auch durch den Gebrauch von Wörtern mit gegensätzlicher Bedeutung, die sog. Antonyme. Diese können einander morphologisch ähnlich sein (gesund / ungesund), müssen es aber nicht (laut / leise). Der am schwierigsten abgrenzbare Bereich lexikalischer Assoziation umfasst schließlich eine Verwandtschaft, wie sie manchmal mit dem Begriff Wortfeld umschrieben wird. Es lässt sich etwa argumentieren, dass zwischen Lehrer und Klasse eine kohäsive Verbindung geschaffen wird, oder zwischen Konzert und Dirigent, ohne dass eine der bisher genannten (klarer zu bestimmenden) lexikalischen Relationen vorliegt. Für die Zugehörigkeit zu einem Wortfeld lassen sich kaum präzise Kriterien angeben; hier ist man auf subjektive Beurteilung angewiesen. Metakommunikative Verknüpfung besteht dort, wo der Produzent im Text über den Text spricht, z. B. in Überschriften, Gliederungshinweisen und formelhaften Rückverweisen: im Folgenden; vgl. Abschnitt 3; wie oben bereits angedeutet; wie soeben dargelegt; -… Tempus und Modus werden von Zifonun (2000, S. 315) so charakterisiert: „Die Tempora situieren oder lokalisieren die Proposition im Zeitablauf-[…]. Die Modi tragen dazu bei, die Proposition in einer ‚Welt‘ zu lokalisieren; sie signalisieren also, ob die Proposition bezogen auf die-[…] wirkliche Welt interpretiert werden soll oder nur auf eine ‚mögliche Welt‘, wie wir sie zum Beispiel in unseren Hoffnungen, Befürchtungen, Wünschen und Plänen konzipieren.“ Gemeinhin wird diesen Merkmalen nur eine geringe kohäsive Kraft zugeschrieben, doch ist die Einhaltung der Regeln der zeitlichen Abfolge (als Ausweitung der consecutio temporum im komplexen Satz) durchaus ein auf der Textebene angesiedeltes, die Kohärenz sicherndes Instrument. Konnektoren gelten neben Pro-Formen als Kohäsionsmittel „par excellence“, da sie ganz explizit eine Verbindung zwischen Texteinheiten herstellen. Die Art der Verbindung kann dabei recht klar (obwohl) oder auch nur vage (und) sein. Syntaktisch sind Konnektoren keine homogene Klasse, sondern teilen sich in subordinierende und koordinierende Konjunktionen, einige Präpositionen (trotz, wegen), Konjunktional- und andere Adverbien. Auch die Abgrenzung der Gruppe der Konnektoren ist nicht immer ganz einfach, etwa zur metakommunikativen Verknüpfung in Fällen, wo ein Konnektor nicht textexterne Sachverhalte verknüpft, sondern textinterne Objekte. Halliday u. Hasan (1989) nennen das Beispiel He is really a good fellow. First, he‘s honest; next, he‘s generous. Formgebende strukturelle Mittel sind verschiedene rhetorische Figuren im Satzbau, die kohäsiv wirken; ein bekanntes Beispiel ist die bewusste Wahl paralleler Satzstrukturen, z. B. 28 2 Kohäsion, Kohärenz und Textualität um Gegensätze herauszustellen: Vor zwei Wochen hat Susanne aufgehört zu rauchen. Und in vier Monaten wird sie wohl anfangen zu joggen. Zu beachten ist, dass die aufgelisteten kohäsiven Mittel nicht alle im gleichen Sinne ‚Mittel‘ sind, d. h. von der Autorin bewusst eingesetzte ‚Mittel zum Zweck‘. Auf der einen Seite wird beispielsweise eine parallele Satzstruktur oder eine andere rhetorische Figur bei der Textproduktion im besten Sinne des Wortes gewählt, denn es gäbe auch alternative Formulierungsmöglichkeiten, die auf einen solchen rhetorischen Effekt verzichten. Auf der anderen Seite sind Phänomene wie die Koreferenz oder die lexikalische Assoziation quasi unvermeidliche Resultate, sobald ein thematisch zusammenhängender Text bearbeitet wird: Die Sätze des Textes behandeln verwandte Gegenstände, und dazu verwenden sie zwangsläufig Wörter, die in bestimmten semantischen Relationen zueinander stehen. In dieser Weise wären die verschiedenen genannten Kategorien noch einmal daraufhin zu überprüfen, inwieweit sie jeweils aus einer Auswahlentscheidung der Autorin hervorgehen oder nicht. Diese Auswahl betrifft häufig auch die Frage, inwieweit eine bestimmte semantische Relation durch lexikalische Wahl (aus den offenen Wortklassen) oder durch kohäsive Mittel markiert ist. Das Spektrum der Möglichkeiten wird von (Kunz u. a., 2017, S. 275) mit diesen englischen Beispielen für den Ausdruck einer temporalen Abfolge zweier Ereignisse illustriert: (2.4) The performance was followed by a round of applause. (2.5) After the performance, there was a round of applause. (2.6) After the performance ended, there was a round of applause. (2.7) The performance ended. Afterwards, there was a round of applause. (2.8) [There was the performance.] After the event, there was a round of applause. 2.2.2 Der Wirkungsbereich der Kohäsion Das Wort ‚Kohäsion‘ legt es bereits nahe, aber wir wollen noch einmal betonen, dass es sich um ein relationales Phänomen handelt: Kohäsion wirkt nicht dadurch, dass an bestimmten Stellen des Textes ein bestimmtes Merkmal auftritt, sondern dadurch, dass dieses Merkmal eine Verbindung zu einer früheren Textstelle schafft. Ganz offensichtlich ist dies bei Pronomen und Ellipsen, aber ebenso gilt es für die anderen besprochenen Phänomene. In den Worten von Halliday u. Hasan (1989, S. 11): „Where the interpretation of any item in the discourse requires making reference to some other item in the discourse, there is cohesion.“ Dieses sehr allgemeine „making reference“ haben wir im vorigen Abschnitt in eine Reihe von Kategorien aufgegliedert und damit bereits etwas genauer beschrieben. Neben dieser Sortierung der unterschiedlichen Mittel wird sich unser Interesse später darauf richten, was genau mit all diesen Mitteln im Text erreicht wird, d. h. welche Effekte Kohäsionsmittel für die Wahrnehmung des Textes als strukturiertes Gebilde haben. Dazu müssen wir vorab noch die Frage stellen, wo genau die Kohäsion zu verorten ist, beziehungsweise: in welchen strukturellen Einheiten die beiden kohäsiv verbundenen Elemente angesiedelt sind. Gelegentlich war hier bereits die Rede von der Satzverknüpfung, die 29 2.2 Kohäsion fraglos auch im Zentrum des Interesses steht: Sätze als abgeschlossene Informationseinheiten werden miteinander kohäsiv verbunden, wodurch ein Text dann am Ende eben mehr als nur eine Menge von isolierten Sätzen ist. Natürlich können Sätze aber komplex sein, und dann können die oben besprochenen kohäsiven Verbindungen ebenso zwischen den Einheiten von Teilsätzen auftreten: Wenn im Herbst die Beeren geerntet werden, müssen diese umgehend gekühlt werden, damit sie nicht verderben. Konnektoren verbinden hier die Teilsätze, die zusätzlich auch durch pronominale Koreferenz verbunden sind. Nun ließe sich das Argument zwar fortsetzen und konstatieren, dass (zum Beispiel) pronominale Beziehungen auch innerhalb einer Verbalphrase auftreten können; hier macht es allerdings keinen Sinn mehr, von einem kohäsiven Mittel zu sprechen, denn das Verb und seine Mitspieler sind strukturell so eng verbunden, dass ein textstiftender, kohäsiver Zusammenhalt nicht erforderlich ist. Wir halten daher den Teilsatz als die relevante Einheit für das Etablieren kohäsiver Relationen fest (und werden die Frage nach seiner Definition später in Abschnitt 9.1 noch genauer beleuchten). Neben der Entscheidung für die kleinste Untersuchungseinheit muss für eine präzise Analyse von Kohäsion (wie sie bei der Korpus-Annotation erforderlich ist) auch festgelegt werden, wie groß die Distanz zwischen den beiden Elementen sein darf, die in einer kohäsiven Verbindung stehen sollen. Die Antwort lässt sich kaum allgemeingültig für alle Kategorien kohäsiver Mittel geben. Unterstellen wir einen verständlich formulierten Text, so wird etwa die Verbindung zwischen Pronomen und Antezedens gelingen, auch wenn einmal eine Reihe von Sätzen „überbrückt“ werden muss. Für eine Ellipse ist der Spielraum aber deutlich geringer. Und von einer parallelen Satzstruktur wird man nicht sprechen wollen, wenn zufällig zwei Sätze, die weit voneinander entfernt sind, analog aufgebaut sind. Umgekehrt kann es aber durchaus bedeutsam (und vom Autor beabsichtigt) sein, wenn zum Beispiel der erste und der letzte Satz eines Textes dieselbe womöglich etwas ungewöhnliche Form tragen. Eine präzise Anweisung zur Kohäsionsanalyse muss für all diese Fälle Festlegungen treffen, wenn reproduzierbare Ergebnisse erzielt werden sollen. Abbildung 2.1: Skizzierung lexikalischer / referenzieller Ketten in einem Text 30 2 Kohäsion, Kohärenz und Textualität Sind diese Festlegungen getroffen, kann schließlich beobachtet werden, dass durch kohäsionsstiftende Mittel nicht immer nur jeweils zwei Textstellen miteinander in Verbindung gebracht werden, sondern oft auch mehr-- in diesem Fall sprechen wir von Kohäsionsketten. Dies kann durch Rekurrenz geschehen, durch bestimmte formgebende strukturelle Mittel, vor allem aber durch Koreferenzbeziehungen und durch referenzunabhängige lexikalische Assoziation. Eine Illustration liefert (für einen früheren Absatz dieses Buches) Abbildung 2.1. Koreferenz untersuchen wir in Kapitel 4 im Detail, und die Hinweise, die uns sowohl referenzielle als auch lexikalische Ketten auf die thematische Gliederung des Textes geben können, werden in Kapitel 5 in den Blick genommen. Die Kohäsion ist ohne Frage ein zentrales Merkmal von Texten, doch es erweist sich bei näherer Betrachtung als nicht hinreichend. Das eingangs genannte Beispiel des stand-up commedian hat bereits illustriert, dass ein Text zwar kohäsiv klingen, aber dennoch nicht funktionieren kann. Linke u. a. (1994, S. 224) geben für dieses Argument folgenden Beispieltext an: (2.9) Wir haben sehr gute Sängerinnen und Sänger an unserer Oper. Die Sopranistin ist besonders umschwärmt. Mozart liegt ihr sehr. Mir ist von den Mozart-Opern die Zauberflöte am liebsten. Diese neuen plump-deutlichen Ausdeutungen der Tempelgemeinschaft als männerbündische Freimaurerloge scheinen mir allerdings eine sehr fragwürdige Interpretation des Werkes. Aber die heutigen Opernleute schrecken ja vor nichts zurück. Bei Wagner-Inszenierungen ist das oft noch schlimmer, obwohl ich ja für solche pathetische Musik sowieso nicht viel übrig habe. In diesem Text finden sich vielfältige kohäsionsstiftende Mittel, doch bleiben wir nach der Lektüre unzufrieden: Der Text ergibt keinen rechten Sinn- - er reiht Sätze aneinander, die paarweise irgendwie auch zueinander passen, doch sie fügen sich nicht zu einem stimmigen Gesamtbild. Dem Text mangelt es an Kohärenz. 2.3 Kohärenz (2.10) Donald Trump war immer an der Gunst der Wirtschaftskapitäne interessiert. Kürzlich schlug der Präsident eine deutliche Senkung der Unternehmenssteuern vor. In diesem Beispiel (angelehnt an eines von Kehler (2004)) sind die beiden Sätze unabhängig voneinander interpretierbar-- jeder Satz könnte auch für sich allein stehen. Rezipieren wir sie jedoch nacheinander, d. h. als Teile desselben Texts, tritt eine weitere Information hinzu: Wir sind geneigt, entweder die Aussage des ersten Satzes als Grund für die des zweiten zu interpretieren, oder die des zweiten als Evidenz für die Behauptung im ersten Satz. Damit etablieren wir eine inhaltliche Relation zwischen den Sätzen bzw. ihren Aussagen, die gewissermaßen einen „Mehrwert“ gegenüber der Interpretation der jeweils einzelnen Sätze darstellt. Solche inhaltlichen Relationen gelten gemeinhin als das geeignete Beschreibungsmittel für (lokale) Kohärenz, was sich auch in der Definition von Bußmann (2002) zeigt: 31 2.3 Kohärenz Semantisch-kognitiver Sinnzusammenhang eines Textes, darstellbar z. B. in Form semantischer Netze aus Konzepten und Relationen. Lokale K. besteht satzintern und zwischen benachbarten Äußerungen, globale K. konstituiert das Textthema bzw. die Textfunktion aus semantisch-pragmatischen Makrostrukturen.-(…) Ist die grundsätzliche Eignung des Relations-Begriffs weitgehend unumstritten, so scheiden sich die Autoren freilich bei der konkreten Ausgestaltung, d. h. bei der Angabe eines konkreten Inventars von Kohärenzrelationen, die in Texten auftreten können, und ihrer jeweiligen Definitionen. Auf einen recht einflussreichen Vorschlag, die Rhetorical Structure Theory (Mann u. Thompson, 1988), werden wir in Kapitel 10 genauer eingehen. Verbindungen zwischen Gedanken Ein interessanter Ansatz zur Festlegung einer Menge von Kohärenzrelationen stammt von Kehler (2002), der sich auf den Philosophen David Hume beruft, welcher drei Gruppen möglicher „connections among ideas“ vorgeschlagen hatte: ▶ Resemblance: Es werden die Gemeinsamkeiten, Unterschiede oder das Verhältnis der Generalisierung / Spezialisierung zwischen zwei Aussagen herausgestellt. Beispiel: (2.11) Meine Freundin Mona hat sich ein neues Mountainbike gekauft. So eins fährt auch ihr Bruder schon seit zwei Jahren. ▶ Cause-Effect: Eine Aussage wird als Grund, die andere als Folge interpretiert. Beispiel: (2.12) Meine Freundin Mona hat sich ein neues Mountainbike gekauft. Jetzt ist sie total glücklich. ▶ Contiguity: Teile derselben Situation werden beschrieben und als zusammengehörig interpretiert, z. B. als temporal aufeinanderfolgend. Beispiel: (2.13) Meine Freundin Mona hat sich ein neues Mountainbike gekauft. Sie hat sofort eine Tour durch das Sauerland unternommen. Die Dreiteilung nach Hume und Kehler ist durchaus abbildbar auf andere in der Literatur vorgeschlagene Klassifikationen in vier Gruppen, wie die von Halliday u. Hasan (1989) (additive, temporal, causal, adversative) oder von Martin (1992) (addition, temporal, consequential, comparison)-- man kann additive und temporal als Varianten von contiguity auffassen; adversative sowie comparison als spezielle Formen von resemblance; und causal / consequential als äquivalent zu cause-effect. Welche konkreten Relationen zur Ausgestaltung dieser Gruppen vorgeschlagen wurden, wird uns wie gesagt in Kapitel 10 beschäftigen. Hier sei lediglich festgehalten, dass lokale Kohärenz zwischen benachbarten Sätzen genau dann entsteht, wenn die Interpretation des Ganzen mehr als die Summe der Interpretationen der Teile darstellt-- wobei dieses „mehr“ unterschiedlich ausgeprägt sein kann: In den obigen Beispielen 2.10 und 2.12, wo kein expli- 32 2 Kohäsion, Kohärenz und Textualität ziter Konnektor die kausale Interpretation nahelegt, leisten wir die entsprechende Interpretations-„Mehrarbeit“ unter dem Einfluss unseres Weltwissens; in einem Fall von contiguity wie dem nachfolgenden konstruieren wir hingegen eine gemeinsame Einordnungsinstanz („Person unterstützt Partei“) für die beiden Aussagen, ohne einen Kausalbezug zu postulieren. (2.14) Marianne verteilte Flugblätter für die Grünen. Sebastian organisierte die lokalen Sonntagsstammtische für die Partei. Die Zweckmäßigkeit der Unterscheidung zwischen lokaler und globaler Kohärenz (die wie gesehen u. a. von Bussmann, aber nicht von allen Autoren getroffen wird) lässt sich am weiter oben gezeigten Beispieltext 2.9 gut erkennen: Benachbarte Sätze sind dort nicht allein „pseudo-kohäsiv“ verbunden, sondern in der Tat auch inhaltlich verknüpfbar- - die lokale Kohärenz ist jeweils gewährleistet. Das Manko des Textes ist die mangelnde globale Kohärenz, denn der Text reiht Aussage an Aussage, ohne aber letzten Endes zu einem klaren Ziel zu führen. Globale Kohärenz werden wir im nächsten Kapitel zum Begriff der Textfunktion in Beziehung setzen. Für die lokale Kohärenz stellt neben der besprochenen Rolle der Kohärenzrelation die Koreferenz die wesentliche zweite Säule dar. Dass benachbarte Sätze nicht abrupt das Thema wechseln, sondern dass zumindest ein Gegenstand wieder aufgenommen wird (vgl. die Kohäsionsmerkmale Rekurrenz, Substitution, Pro-Form, Ellipse), trägt zentral zur Wahrnehmung des Textes als miteinander verwobenes Ganzes bei. Hier sind Kohäsion und Kohärenz also eng aufeinander bezogen: Koreferenz (als Baustein der Kohärenz) kann ohne Kohäsion nicht bestehen. Dass dies für die Kohärenzrelation (als den anderen Baustein) nicht gilt, haben einige unserer oben gezeigten Beispiele illustriert; die Relation kann von der Leserin auch dann erschlossen werden, wenn sie nicht durch einen Konnektor wie deshalb oder danach explizit angezeigt wird. 2.4 Textualität 2.4.1 Kohäsion und Kohärenz im Zusammenhang Den oben gezeigten, recht „künstlichen“ Beispielen kohäsiver, aber nicht kohärenter Texte zum Trotz: In der Praxis ist die große Mehrzahl der Texte sowohl kohäsiv als auch kohärent, schon allein aufgrund des Kohärenzkriteriums der Beibehaltung von Diskursgegenständen, die dementsprechend auch wiederholt im Text sprachlich bezeichnet werden und somit Kohäsion erzeugen. Wir betrachten daher die Kohäsion (an der Textoberfläche sichtbare Verknüpfung) allgemein als die linguistische Reflexion von Kohärenz-- der unter der Textoberfläche liegenden, vom Rezipienten zu rekonstruierenden, inhaltlichen Verknüpfung. Damit ergibt sich als wichtiger Unterschied zwischen beiden, dass die Wahrnehmung der Kohärenz das (zwangsläufig subjektive) Interpretieren des Textes voraussetzt, während die Kohäsion als Eigenschaft des Textes von allen Sprachbenutzern gleichermaßen beobachtet werden kann, auch wenn sie sich nicht wirklich mit dem Textinhalt auseinandersetzen. 33 2.4 Textualität Die Verbindung zwischen Kohäsion und Kohärenz ist eng, aber nicht zwingend, denn Texte können durchaus auch kohärent sein, ohne dabei auf kohäsive Mittel zurückzugreifen. Dafür nennt Redeker (1990) diese zwei kurzen Beispiele: (2.15) Sally is crying. Nanny has thrown out the time-worn teddy bear. The holes were getting too large to fix. (2.16) Take those dirty shoes off. There‘s a brand-new carpet in the hallway. Mom‘s ALREADY mad at me. Zu 2.15 ist anzumerken, dass die definiten NP s the teddy bear und insbesondere the holes durchaus als kohäsionsstiftend betrachtet werden können (bei the holes handelt es sich um einen ‚indirekten Verweis‘ 7 auf teddy bear); dennoch ist nicht zu leugnen, dass beide Texte sicherlich nur minimal kohäsiv, dabei aber durchaus kohärent sind-- wir haben bei der Lektüre keine Schwierigkeiten, naheliegende inhaltliche Verknüpfungen zwischen den Sätzen zu konstruieren. Die Leichtigkeit dieser Aufgabe hängt dabei durchaus von der jeweiligen Kohärenzrelation ab. Eine Kausalrelation kann, wie gesehen, per Weltwissen oft problemlos inferiert, also erschlossen, werden. Für die Relation Concession hingegen scheint die explizite Signalisierung durch einen Konnektor (also durch ein kohäsionsstiftendes Mittel) schlicht unumgänglich: 8 (2.17) Die Sonne schien uns schon seit Stunden bei der Arbeit auf den Kopf. Dennoch verging uns die gute Laune nicht. (2.18) Die Sonne schien uns schon seit Stunden bei der Arbeit auf den Kopf. Die gute Laune verging uns nicht. Die unverknüpfte Satzfolge (die sog. ‚asyndetische Verknüpfung‘) in 2.18 wird mit hoher Wahrscheinlichkeit völlig anders interpretiert als 2.17. Weil die Konzessionsbeziehung eine recht komplexe ist, benötigen wir als Leser ein explizites sprachliches Signal, um sie zwischen zwei Aussagen herzustellen. Für Beispiel 2.17 lässt sich der Zusammenhang so umschreiben: „Eigentlich gilt, wem die Sonne bei der Arbeit auf den Kopf scheint, der wird schlecht gelaunt; in der aktuellen Situation gilt die Regel aber ausnahmsweise nicht; wir sind bei Arbeit und Sonnenschein gut gelaunt.“ Kohäsion und Kohärenz stellen die wichtigsten Charakteristika von Texten dar, doch sie sind nicht die einzigen. 7 Siehe dazu Abschnitt 4.1. 8 In gesprochener Sprache kann der konzessive Zusammenhang mitunter auch mit prosodischen Mitteln angezeigt werden. 34 2 Kohäsion, Kohärenz und Textualität 2.4.2 Merkmale der Textualität Vielfach wird bei der Charakterisierung der Merkmale von Texten auf die Liste von de Beaugrande u. Dressler (1981) zurückgegriffen. Zu den oben besprochenen textinternen Merkmalen Kohäsion und Kohärenz treten bei diesen Autoren noch fünf textexterne Merkmale hinzu, die auf die Kommunikationssituation bezogen sind. Textexterne Textualitätsmerkmale nach de Beaugrande / Dressler ▶ Intentionalität: Der Textproduzent hat den Text nicht zufällig, sondern mit einer Absicht verfasst, er möchte eine bestimmte Wirkung erzielen. ▶ Akzeptabilität: Der Text ist so beschaffen, dass die Rezipienten ihn auch als solchen einstufen und verstehen können. Mit anderen Worten, der Produzent hat seine Intention in einer Weise umgesetzt, die auf die Rezipienten und ihre Gewohnheiten zugeschnitten ist - die Intention ist ohne große Mühe rekonstruierbar. ▶ Informativität: Der Text ist für den Rezipienten nicht nur formal akzeptabel, sondern auch inhaltlich nicht „leer“; er teilt etwas mit. Dies bedeutet einerseits, dass der Rezipient neue Information vorfindet (die aber in „alte“ Information eingebettet ist, um Anknüpfungspunkte zu schaffen), und andererseits eine angemessene Mischung aus „erwarteter“ und „unerwarteter“ Information. Wir können Informativität in einen Gegensatz zum Kohäsionsmittel ‚Rekurrenz‘ stellen: Ein Text kann sehr kohäsiv sein, indem er unablässig dasselbe wiederholt, dabei vielleicht immer etwas reformuliert - dann mangelt es jedoch an Informativität. ▶ Situationalität: Der Text ist für die jeweils vorliegende Kommunikationssituation angemessen. Er trifft die konventionell übliche Stilebene (u. a. den Grad der Höflichkeit) und deckt den in der Situation bestehenden Informationsbedarf. ▶ Intertextualität: Der Text steht im Zusammenhang mit anderen Texten, etwa mit Texten der gleichen Sorte (siehe Kap. 3) oder mit Texten, aus denen er wörtlich oder sinngemäß zitiert. Für das Verständnis des Textes ist der Bezug zu anderen, bereits bekannten, Texten von Bedeutung. 9 Wir sollten nicht in die Versuchung geraten, eine solche Liste wiederum als ‚Definition‘ zu betrachten. Die Merkmale sind nicht alle gleichermaßen notwendig, damit ein komplexes sprachliches Zeichen als ‚Text‘ aufzufassen ist (allerdings lässt sich wohl sagen, dass sie in der Summe durchaus als hinreichend gelten dürften). Stattdessen können wir sie als Merkmale ansehen, nach denen ein Text mehr oder weniger prototypisch ist: Je mehr Abweichungen, desto „ungewöhnlicher“ ist ein vorliegendes Text-Exemplar. Auf der anderen Seite muss sich eine solche Merkmal-Liste der Prüfung aussetzen lassen, ob die einzelnen Merkmale hinlänglich unabhängig voneinander sind. Für Kohäsion und 9 Eine ausführliche Diskussion des Kriteriums der Intertextualität liefert beispielsweise Adamzik (2004). 35 2.5 Korpusuntersuchungen zu Kohäsion und Kohärenz Kohärenz hatten wir dies bereits anhand von Beispielen gezeigt. Auch für die anderen sollte idealerweise gelten, dass jeweils ein Merkmal von einem Text verletzt werden kann, ohne dass andere Merkmale dabei zwangsläufig ebenfalls Schaden nehmen. Für die oben aufgeführten Merkmale gelingt dies allerdings nur bedingt; eine Wechselwirkung ist beispielsweise zwischen den Kriterien ‚Akzeptabilität‘ und ‚Situationalität‘ zu vermuten: Ein Text, der für die Äußerungssituation unangemessen ist, wird sicherlich auch als nicht-akzeptabel einzuordnen sein. Umgekehrt allerdings kann Nicht-Akzeptabilität auch auf die Verletzung eines anderen Kriteriums zurückzuführen sein als dem der Situationalität, so dass die beiden Kriterien sicherlich nicht einander äquivalent sind. Das Merkmal ‚Intentionalität‘ ist in der Praxis ausgesprochen schwierig zu untersuchen: Woher nehmen wir die Gewissheit, dass der Autor nicht eher wahl- und ziellos seine, immerhin vielleicht kohärent wirkenden, Sätze aneinandergereiht hat? Wir haben diese Gewissheit nicht, entscheidend ist aber, dass wir als Leser diese Intentionalität dem Autor nahezu automatisch unterstellen: Sobald wir uns mit der Lektüre eines Textes beschäftigen, nehmen wir an, dass er mit einer bestimmten Absicht erstellt wurde, und ein zentraler Aspekt des Verstehens ist genau die Rekonstruktion dieser Absicht. (Dieser Punkt wird uns im nächsten Kapitel und später in den Kapiteln 7 und 10 noch genauer beschäftigen.) Zusammenfassend stellen wir fest, dass Textualität ein graduelles Maß ist, dem Texte mehr oder weniger Genüge tun; sie lässt sich durch eine Reihe von Merkmalen charakterisieren-- und sie entbindet uns von der müßigen Aufgabe, nach einer vorgeblich klaren, „binären“ Unterscheidung zwischen Texten und Nicht-Texten zu suchen. Die Merkmale sind dabei nicht gleichrangig; darauf weist auch Sandig (2000) in ihrer Untersuchung der Prototypikalität von Texten hin. Sie rückt die Textfunktion in den Mittelpunkt und nennt dann Kohäsion, Kohärenz, Situationalität und Thematizität als nachgeordnete Merkmale, anschließend eine ganze Reihe weiterer Aspekte, die dann allerdings als peripher gelten, so zum Beispiel die Zweidimensionalität des Textes, seine Gliederung etc. 2.5 Korpusuntersuchungen zu Kohäsion und Kohärenz Einige der in Abschnitt 2.2.1 genannten kohäsiven Mittel lassen sich auch in nicht oder nur geringfügig annotierten Korpora unmittelbar recherchieren. Hierzu zählen Pronomina und Konnektoren, denn bei ihnen handelt es sich um geschlossene Wortklassen von relativ überschaubarem Umfang. 10 Eine zweite Gruppe, repräsentiert durch die Ellipsen, ist prinzipiell zunächst nicht suchbar, weil das Phänomen eben durch die Abwesenheit einer eigentlich erwarteten lexikalischen Form charakterisiert ist. Um hierzu Korpusuntersuchungen anzustellen, bedarf es daher zuvor einer manuellen Annotation. Die dritte Gruppe schließlich bilden Kohäsionsmittel, die für den Menschen leicht beobachtbar, für die Maschine aber schwer erkennbar sind. Dazu zählt die Substitution: Um die kohäsive Relation in Weil Paul die Buche 10 Bei den Konnektoren ist allerdings auf Mehrdeutigkeit zu achten, denn viele Konnektoren des Deutschen haben weitere Lesarten. Beispiele für dabei sind: Karin bekam den Aufsatz mit einer Fünf zurück; dabei hatte sie so gut gelernt. (Konnektor)-- Wir hatten alle unsere Ausweise dabei. (kein Konnektor) 36 2 Kohäsion, Kohärenz und Textualität im sumpfigen Boden pflanzte, gedieh der Baum nur schlecht zu identifizieren, ist lexikalisches Wissen erforderlich; genauer: eine Ressource, die Hypo- und Hyperonyme sowie Synonyme zu einem gegebenen Wort liefert. Für viele Sprachen sind diese, mit unterschiedlichem Umfang, in maschinenlesbarer Form verfügbar, vor allem WordNet 11 für Englisch (Miller, 1995), sowie GermaNet 12 für Deutsch (Hamp u. Feldweg, 1997, Henrich u. Hinrichs, 2010). Mit ihrer Hilfe lassen sich Programme schreiben, die versuchen, die genannten lexikalischen Relationen in Texten zu identifizieren und damit Substitutionen zu erfassen. Textkorpora, in denen gezielt die kohäsionsstiftenen Mittel annotiert wurden, sind bisher rar. Eine interessante Ausnahme bildet das GECC o Projekt (Kunz u. a., 2017), das sich einerseits für eine translationswissenschaftliche Fragestellung (wie unterscheiden sich Kohäsionsphänomene im Deutschen und Englischen) und andererseits für Unterschiede zwischen verschiedenen Arten von Texten interessiert hat. Dazu wurde ein Korpus aus deutschen und englischen Dokumenten zusammengestellt: Transkriptionen von Interviews und akademischen Vorträgen sowie eine Reihe schriftlicher Textklassen wie etwa fiktionale Texte, politische Essays oder Bedienungsanweisungen. Eingebettet in die Software der Corpus Workbench 13 wurden die Texte automatisch mit morphosyntaktischer Information versehen und dann teilautomatisch mit den folgenden Kohäsionsmerkmalen annotiert: ▶ Koreferenz (Verweis auf denselben Diskursgegenstand); ▶ One-anaphora und Ellipsen (Verweis auf dieselbe Klasse von Diskursgegenständen); ▶ komparative Verweise, z. B.: Wir können einen Spaziergang machen. Eine noch bessere Möglichkeit wäre ein Fußballspiel; ▶ Konnektoren; ▶ einige lexikalische Relationen wie Hyperonymie oder Meronymie (allerdings nur teilweise behandelt). Durch statistische Analysen auf den annotierten Daten konnten Kunz u. a. (2017) beispielsweise herausfinden, dass die deutschen gesprochensprachlichen Texte signifikant mehr Kohäsionsmittel einsetzen als die englischen, während der Unterschied bei geschriebenen Texten nur gering ist. Die häufigsten Mittel sind generell die Koreferenz und Konnektoren. Innerhalb der deutschen Texte variiert der Anteil von Kohäsionsmitteln (gemessen an der Zahl der token des Texts) zwischen 4,84 % (Bedienungsanweisungen) und 15,25 % (Interviews), und es lässt sich im Deutschen auch eine größere Differenzierung der kohäsiven Mittel zwischen den Textklassen nachweisen als im Englischen. Dadurch ist es mit recht guter Zuverlässigkeit möglich, für einen gegebenen Text seine Klasse nur anhand der Verteilung der Kohäsionsmittel automatisch zu ermitteln (für die Unterscheidung zwischen gesprochen und geschrieben sogar sehr zuverlässig). 11 https: / / wordnet.princeton.edu/ (Zugriff 30. 10. 17). 12 http: / / www.sfs.uni-tuebingen.de/ GermaNet/ (Zugriff 30. 10. 17). 13 http: / / cwb.sourceforge.net/ (Zugriff 18. 12. 17). 37 2.6 Übungsaufgaben Ein durchaus häufig in Korpora annotiertes Phänomen ist die Koreferenz, die wir in Kapitel 4 vertieft behandeln werden. Auch für den Phänomenereich der durch Diskursrelationen gestifteten Kohärenz gibt es eine Reihe verfügbarer Datensätze; darauf gehen wir später in Kapitel 10 ein. Weiterführende Literatur Die hier nur sehr kurz angedeutete geschichtliche Entwicklung der Textlinguistik im deutschsprachigen Raum wird ausführlicher dargestellt im ersten Kapitel von (Adamzik, 2004). Der auch heute noch sehr lesenswerte „Klassiker“ zu den Themen Kohäsion und Kohärenz ist das ursprünglich 1976 erschienene Cohesion in English (Halliday u. Hasan, 1989). Dieses Buch bespricht die Themen Referenz, Substitution, Ellipse, Konjunktion und lexikalische Kohäsion am Beispiel des Englischen mit bemerkenswerter Gründlichkeit. Zu beachten ist, dass die Untersuchungen der englischen Phänomene sich nicht ganz einfach auf das Deutsche übertragen lassen; zudem ist wichtig, dass Halliday und Hasan - anders als wir es hier getan haben - terminologisch nicht zwischen ‚Kohäsion‘ und ‚Kohärenz‘ unterscheiden; sie verwenden den Begriff cohesion in einem allumfassenden Sinn. Die oben nur angerissenen Schwierigkeiten der Kategorisierung von lexikalischen Assoziationen werden von (Hoey, 1991) gründlich anhand von Beispieltexten besprochen; der Autor schlägt u. a. Flussdiagramme vor, die die Einordnung von Wortpaaren zur Kategorien der lexikalischen Kohäsion erleichtern. Stärker auf den auch von uns verwendeten Kohärenz-Begriff zugeschnitten ist die Untersuchung Coherence, Reference, and the Theory of Grammar (Kehler, 2002), die eine Theorie der Kohärenzrelationen entwirft und damit einige linguistische Phänomene der Referenz und Elision behandelt. Eine kurze Zusammenfassung der zentralen Aspekte dieser Arbeit liefert Kehler (2004). 2.6 Übungsaufgaben 1. Markieren Sie in Ihrem Kommentar (s. Übung 1 auf S. 21) alle kohäsiven Mittel mit einer fortlaufenden Nummerierung und erläutern Sie jedes gefundene Mittel kurz. 2. Versuchen Sie, Ihren Kommentar dergestalt umzuformulieren, dass er möglichst unkohäsiv wird-- wobei seine inhaltliche Kohärenz allerdings nicht oder möglichst wenig leiden sollte. 3. Lesen Sie noch einmal den Absatz nach der Auflistung der kohäsiven Mittel auf Seite 2.2.1 und folgen Sie dem dort unterbreiteten Vorschlag: Gehen Sie die Liste der vorgestellten Mittel durch und entscheiden Sie jeweils, zu welchem Grad es auf einer Auswahlentscheidung bei der Textherstellung beruht oder nicht. 39 3.1 Textfunktion 3 Textfunktion, Textsorte und Texttyp Texte fallen nicht vom Himmel. Sie werden vom Verfasser geschrieben und an bestimmte Adressaten gerichtet, weil er damit ein Ziel erreichen möchte, und dementsprechend soll der Text eine Funktion erfüllen. In der Regel nehmen die Rezipienten diese Funktion nicht allein durch das sprachliche Material des Texts wahr, sondern im Zusammenspiel mit einer aktiven, erwartungsgesteuerten Kategorisierung: Der Text wird nicht als „irgendein“ Text gelesen, sondern als Exemplar einer bestimmten Textsorte- - was unter anderem auch eng mit der Funktion des Texts zusammenhängt. Nach Besprechung dieser beiden textglobalen Merkmale werden wir uns der sprachlichen Realisierung einzelner Abschnitte zuwenden und Texttyp als ebenfalls funktionalen Begriff definieren, der jedoch enger mit Merkmalen der Sprachoberfläche verknüpft ist. 3.1 Textfunktion Die Frage nach der Funktion eines Textes gründet letztlich in der abstrakteren Frage nach den Funktionen von Sprache allgemein, denn der Text ist ja nichts anderes als eine-- potenziell komplexe und sorgfältig geplante-- sprachliche Äußerung. Als Rahmen für die Untersuchung der Sprachfunktion hat sich das von Bühler (1982, orig. 1934) entworfene Organon-Modell bewährt, demzufolge sprachliche Zeichen (gleichzeitig) drei Funktionen erfüllen können: ▶ Funktion der Darstellung von Gegenständen, Sachverhalten und Ereignissen ▶ Funktion des Ausdrucks der inneren Befindlichkeit, der Emotionen und der Einstellungen des Zeichenbenutzers ▶ Funktion des Appells, mit dem ein Zeichenbenutzer den Adressaten zu bestimmten Reaktionen veranlassen möchte Der parenthetische Verweis auf die potenzielle Parallelität dieser drei Ebenen bedeutet für den Text und seine Autorin, dass es die Funktion mitunter nicht gibt, sondern die Autorin mehrere Ziele gleichzeitig verfolgen kann. In einem Meinungstext beispielsweise kann sie Sachverhalte darstellen, auch ihre innere Einstellung zu diesen Sachverhalten kundtun, und möglicherweise auch an die Leserschaft appellieren, eine bestimmte Haltung dazu einzunehmen. Brinker (2005) geht daher davon aus, dass die Funktionsanalyse darauf zielt, jeweils die dominierende Textfunktion zu ermitteln, der die möglichen anderen nur nachgeordnet sind. In unserem Beispiel des Meinungstexts könnten wir davon ausgehen, dass sowohl die Sachverhaltsdarstellung als auch die Einstellungskundgabe der Autorin letztlich zu dem Ziel beitragen sollen, die Haltung der Leser zu verändern; dann wäre die Appellfunktion die dominierende. Im Anschluss an Grosse (1976) charakterisiert Brinker (2005, S. 95) die Textfunktion als die „im Text mit bestimmten, konventionell geltenden, d. h. in der Kommunikationsgemeinschaft verbindlich festgelegten Mitteln ausgedrückte Kommunikationsabsicht“ des Textproduzenten. Es handelt sich also nicht um das möglicherweise im Hintergrund bleibende verborgene Ziel der Autorin, sondern um dasjenige, welches die Leser dem Text entnehmen können, 40 3 Textfunktion, Textsorte und Texttyp weil es durch konventionalisierte Mittel-- vielleicht auch mit Hilfe des konventionalisierten Kontexts-- erkennbar ist. 14 Brinkers Inventar der Textfunktionen Brinker (2005, Abschn. 4.4) knüpft mit seinem Vorschlag eines Inventars möglicher Textfunktionen an die Sprechakttheorie nach Austin und Searle an, auf die wir erst in Abschnitt 7.1 eingehen werden. An dieser Stelle seien daher Brinkers Funktionstypen ohne weitere historische Einordnung lediglich genannt: ▶ Informationsfunktion: Der Produzent gibt der Adressatin zu verstehen, dass er sie über etwas informieren, Wissen vermitteln möchte. ▶ Appellfunktion: Der Produzent gibt der Adressatin zu verstehen, dass er sie dazu bewegen will, die Einstellung X einzunehmen oder die Handlung Y zu vollziehen. ▶ Obligationsfunktion: Der Produzent gibt der Adressatin zu verstehen, dass er sich ihr gegenüber dazu verpflichtet, Handlung X auszuführen. ▶ Kontaktfunktion: Der Produzent gibt der Adressatin zu verstehen, dass es ihm um die personale Beziehung zur Adressatin geht (um Herstellung, Erhaltung, Beendigung des persönlichen Kontakts). ▶ Deklarationsfunktion: Der Produzent gibt der Adressatin zu verstehen, dass der Text eine neue Realität schafft, d. h. dass die Äußerung des Texts die Einführung eines bestimmten Faktums bedeutet. Innerhalb dieser Kategorien lassen sich dann je nach Zweck der Untersuchung feinere Einteilungen vornehmen. Wichtige Subtypen des Informierens beispielsweise sind das Instruieren (wie sollte man eine Handlung ausführen) und das Erklären, das weiter gegliedert werden kann in Erklären-warum (warum ist etwas der Fall) und Erklären-wie (wie funktioniert etwas) etc. Wie ermittelt ein Leser nun die Textfunktion oder das, was er dafür hält? Die Frage hat zwei Aspekte: Zum einen ergibt sich die Textfunktion durch das Zusammenspiel der einzelnen Teile des Textes; um dies zu untersuchen, benötigen wir eine Begrifflichkeit für die Beschreibung dieser „Einzelteile“ und ihres (funktionalen) Zusammenwirkens; damit werden wir uns in den Kapiteln 7 bis 10 beschäftigen. Zum anderen müssen wir nach den sprachlichen Signalen fragen, die die Funktion kleinerer Einheiten- - eines Satzes oder Textabschnitts- - anzeigen können und damit auch Hinweise auf die Gesamtfunktion des Textes liefern. Damit befassen wir uns in den Abschnitten 7.3 (Inventar von Sprechhandlungstypen) und 9.2 (sprachliche Signale für Sprechhandlungen). Auf den nächsten Seiten soll aber zunächst ein weiterer wichtiger Einflussfaktor zur Sprache kommen: die Sorte des Textes. 14 Eine vergleichende Diskussion der Ansätze von Bühler, Searle, Brinker und auch Jakobson findet sich bei Adamzik (2004). 41 3.2 Textsorte 3.2 Textsorte Abbildung 3.1: Zwei Beispieltexte unterschiedlicher Sorten 42 3 Textfunktion, Textsorte und Texttyp 3.2.1 Textsorte und Register Dass wir Texte unterschiedlichen Sorten zuordnen, leuchtet intuitiv sehr schnell ein, denn die Alltagssprache hält eine Vielzahl von Bezeichnungen bereit, mit denen wir Texte sortieren. Nicht das einzige, aber ein wichtiges Kriterium dafür ist bereits ihre äußere Gestalt: Schon ein flüchtiger Blick auf die beiden Texte in Abb. 3.1 15 macht deutlich, dass Nachrichtenmeldung und Kochrezept zwei sehr unterschiedliche und jeweils schnell identifizierbare Textsorten darstellen. Neben den sichtbaren Unterschieden erfüllen unsere Beispiele auch verschiedene Textfunktionen: Der eine informiert uns über einen politischen Vorschlag; der andere versetzt uns in die Lage, ein bestimmtes Gericht zuzubereiten. In der klassischen Textlinguistik ist der Begriff der Textsorte intensiv untersucht worden, und entsprechend vielfältig ist die Menge entsprechender Publikationen. Und doch scheint der Begriff sich einer klaren (und auch breiter akzeptierten) Definition beharrlich zu widersetzen. So kam Heinemann (2000) in einem Übersichtsbeitrag im ‚Handbuch Text- und Gesprächslinguistik‘ zu diesem Schluss: Versucht man aber, aus der Vielzahl textsortenspezifischer Einzeldarstellungen- (…) und aus den drei Kolloquien zu dieser Thematik-(…) ein Resümee abzuleiten, dann zeigt sich, daß sich das Maß an GEMEINSAMKEITEN IN DEN ARBEITEN [Hervorh. d. Verf.] zur Textsortenproblematik eher bescheiden ausnimmt.- (…) So bleibt im Grunde nur die alte Formel von Peter Hartmann- (…): Textsorten sind ‚Mengen von Texten mit bestimmten gemeinsamen Eigenschaften‘. Dies klingt für eine gründliche wissenschaftliche Untersuchung der Thematik zunächst nicht sehr vielversprechend. Um zu verstehen, von welcher Art die „gemeinsamen Eigenschaften“ sein können, betrachten wir zunächst ein häufig zitiertes Beispiel aus einer frühen Arbeit von Sandig (1972). In Abb. 3.2 16 vergleicht die Autorin 18 Textsorten miteinander und stellt die Abgrenzung durch die in den Spalten angegebenen Merkmale her. + und-- geben an, ob das Merkmal für die Textsorte zutrifft oder nicht; bei ± trifft es nur auf manche Exemplare der Sorte zu. Das Ziel einer solchen Analyse besteht also darin, eine Menge von Merkmalen zu definieren, die einerseits geeignet ist, eine Textsorte hinlänglich zu charakterisieren, andererseits die jeweils untersuchten Sorten voneinander abgrenzt, also auch ihre Unterschiede benennt. Insofern Sandigs Zuordnungen stimmen, ist das zweite Ziel erreicht, denn es gibt in der Tabelle keine zwei identischen Zeilen. Dass sich auf diesem Weg allerdings keine wirklich umfassende Klassifikation vieler Textsorten erstellen lässt, hat auch Sandig (1972) selbst bereits festgestellt; sie weist darauf hin, dass es nur ein fragmentarischer Vorschlag sei und dass viel zu viele Merkmale untersucht werden müssten, um eine größere Zahl von Textsorten erschöpfend zu behandeln. 15 Quellen: www.tagesspiegel.de und www.maggi.de (Zugriff 18. 3. 07). 16 Mit freundlicher Genehmigung des Autors entnommen aus (Rehm, 2007). gesprochen spontan monologisch dialogische Textform räumlicher Kontakt zeitlicher Kontakt akustischer Kontakt Form des Textanfangs Form des Textendes festgelegter Textaufbau Thema festgelegt 1. Person 2. Person 3. Person Imperativformen Tempusformen ökonomische Formen Redundanz Ausschließlich Sprachliches Gleichber. Kommunikationsp. Interview + ± - - ± + + ± ± - + + + + ± ± ± ± + - Brief - ± ± - - - - + + - ± + + + ± ± ± ± + ± Telefongespräch + ± - - - + + + + - ± + + + ± ± ± ± ± ± Gesetzestext - - + - - - - + + - + - - + - - - - + - Arztrezept - - + - - - - + + + + - - - - - + - + - Kochrezept ± - + - ± ± ± + - + + - - + ± - ± - + - Wetterbericht ± - + - - + ± + - + + - - + - - ± - + - Traueranzeige - - + - - - - + + + + ± - + - - ± - ± ± Vorlesung(sstunde) + ± + - + + + + ± - + ± ± + ± ± - ± ± - Vorlesungsmitschrift - - + - - - - ± - - + - - + - - + - ± + Reklame ± ± ± ± ± ± ± ± ± - ± ± ± ± ± ± ± ± ± - Stelleninserat - - + - - - - + + + + ± ± + ± - ± - + - Rundfunknachrichten + - + - - + + + + - - - - + - + - ± + - Zeitungsnachricht - - + - - - - + - - + - - + - + - - + - Telegramm - - + - - - - + + - + ± ± + ± - + - + ± Gebrauchsanweisung - - + - - - - ± - - + - ± + ± - ± ± ± - Diskussion + ± - - ± + + + + - + + + + ± + - ± + ± familiäres Gespräch + + - ± + + + ± - - - + + + ± ± ± + ± + Abbildung 3.2: Merkmalbasierte Klassifikation von Gebrauchstextsorten (nach Sandig (1972, S. 118); Spaltenköpfe teilweise nach Heinemann u. Viehweger (1991, S. 136)) 44 3 Textfunktion, Textsorte und Texttyp Dennoch lohnt es sich, auf diesem Weg etwas weiter zu gehen und einmal zu versuchen, die Arten solcher Merkmale zu systematisieren und in Kategorien zu fassen. Listen solcher Merkmalsgruppen wurden in der Literatur in der Tat mehrfach vorgeschlagen; die folgende ist eine Kombination aus denen von Linke u. a. (1994), Brinker (2005) und Gansel u. Jürgens (2002). Im allgemeinen wird unterschieden zwischen textinternen Faktoren: ▶ Graphische Ebene: Layout ▶ Textlänge ▶ Textstrukturmuster: Abfolge der Teiltexte ▶ Signale der Textgliederung ▶ Eröffnungs- und Schlussformeln ▶ Wortwahl: typische Lexeme und Kollokationen ▶ Art und Häufigkeit von Satzbaumustern und gramm. Kategorien (Tempus, Modus) ▶ Thema und Themenverlauf ▶ Thema-Rhema Gliederung und textexternen Faktoren: ▶ Textfunktion ▶ Kommunikationsmedium: face-to-face, Telefon, Rundfunk, Fernsehen, Brief, Zeitungsartikel / Buch (abgrenzbar durch die Merkmale Kommunikationsrichtung, unmittelbarer Kontakt, Sprache / Schrift) ▶ Kommunikationssituation, Handlungsbereich: privat / offiziell (Geschäftspartner o. ä.) / öffentlich (Massenmedien) Damit lassen sich die in Abb. 3.2 ungeordnet nebeneinander stehenden Merkmale schon einmal sinnvoll gruppieren. Eine weiter gehende nützliche Unterscheidung ist die zwischen Textsorte und Register, die wir mit Biber u. Conrad (2009) wie folgt vornehmen. Register versus Textsorte ▶ Register: (engl.: register) Klasse von sprachlichen Daten, die in einem gemeinsamen situativen Kontext entstehen und durch linguistische Merkmale charakterisiert sind, welche sich kommunikativen Funktionen zuordnen lassen. ▶ Textsorte: (engl.: genre) Klasse von Texten, die durch Gemeinsamkeiten im strukturellen Aufbau und durch konventionalisierte linguistische Formen entstehen. Ein Beispiel für ein gut untersuchtes Register ist die gesprochene Konversation, von der man u. a. weiß, dass sie im Vergleich zu anderen durch einen hohen Anteil an Personalpronomen und Fragen gekennzeichnet ist. Weitere sind die wissenschaftliche Vorlesung oder „die Zeitungssprache“. Durch Untersuchung der Verteilung linguistischer Merkmale (Anteil Nomen, Satzlänge u.v.m.) lassen sich Profile solcher Register erstellen, wodurch sie voneinander 45 3.2 Textsorte unterscheidbar werden. Bei der Beschreibung einer Textsorte steht hingegen der Aufbau des Gesamttexts im Vordergrund: Das Gerichtsurteil beispielsweise ist üblicherweise gegliedert in Bestandteile wie Rubrum, Tenor, und Urteilsbegründung, die sich ihrerseits in Bestandteile zerlegen lassen. Zwar ist auch die verwendete Sprache meist in verschiedener Hinsicht „typisch“- - dabei handelt es sich aber weniger um Merkmale der Textsorte Gerichtsurteil, sondern vielmehr um solche des Registers der juristischen Sprache: Die Merkmale werden sich in anderen juristischen Textsorten ebenso finden. Dies gilt aber wiederum nicht für konventionalisierte Formeln wie das einleitende Im Namen des Volkes, welches ein definierendes Merkmal des Urteils ist. Auch wenn die Unterscheidung sich nicht ganz vollständig durchhalten lässt (oft lassen sich Textsorten auch durch linguistische Merkmale wie den Pronomengebrauch nützlich charakterisieren), ist es doch sinnvoll festzuhalten, dass Register primär über Merkmale beschrieben werden, denen eine Funktion im situativen Kontext zukommt, während Textsorten aus Konventionen resultieren, die in erster Linie den Textaufbau betreffen. Wenn es typische Merkmale gibt, sind sie nur selten funktional begründet. So ist etwa die Formel man nehme-… per Konvention eng mit der Textsorte Kochrezept assoziiert, es lässt sich aber kein Motiv, kein funktionaler Grund für die Verwendung dieses Ausdrucks finden. Biber u. Conrad (2009) schlagen außerdem vor, zwischen features und markers zu unterscheiden. Erstere werden durch relative Frequenz (Distribution) informativ für die Beschreibung von Registern oder Textsorten, letztere allein durch die Tatsache ihres (Nicht-) Auftretens, also unabhängig von der Anzahl. In diesem Sinne ist Im Namen des Volkes ein marker: Die, wenn auch nur einmalige, Verwendung der Formel an einer bestimmten Stelle des Urteils ist von zentraler Bedeutung. Demgegenüber ist die gehäufte Verwendung von Paragraphenzeichen (§) ein im Vergleich zu anderen Textsorten quantitativ zu bewertendes feature, so wie die relative Häufigkeit bestimmter Wortarten etc. Die Unterscheidung zwischen Textsorte und Register bildet unsere oben genannte Liste von textinternen (Textsorte) und textexternen (Register) Merkmalen recht gut ab, mit der Ausnahme, dass ‚Art und Häufigkeit von Satzbaumustern und gramm. Kategorien‘ auch für die Register-Beschreibung von zentraler Bedeutung sind. Zusammenfassend sind wir über den ersten Versuch der Textsortendifferenzierung in Abbildung 3.2 nun also in zweierlei Hinsicht hinausgegangen: Die verwendeten Merkmalsbezeichner sind nun unterschieden in textinterne und texterne bzw. in Registerversus Textsortenmerkmale. Und für die Füllung der Matrix, also die Ausprägung der Merkmale, unterscheiden wir zwischen binären Merkmalen (+ oder--; auch marker genannt) und solchen, die durch ihre Frequenz (Anzahl des Auftretens, normalisiert durch Länge des Textes) beschrieben werden (auch features genannt). 46 3 Textfunktion, Textsorte und Texttyp 3.2.2 Typologie der Textsorten? Wir kehren zurück zu einer Frage, mit der sich die Textlinguistik bereits in ihrer Anfangszeit intensiv beschäftigt hat: Lässt sich die Menge der Textsorten „erschöpfend“ untersuchen, somit eine Typologie aller Textsorten entwickeln? Insgesamt umfasst das hypothetische „Maximalziel“ einer Behandlung des Textsortenbegriffs wohl die folgenden drei Schritte: ▶ Schlüssige und präzise Definition des Begriffs ‚Textsorte‘ ▶ Beschreibung der Beziehungen zwischen verschiedenen Textsorten, Aufstellung einer möglichst vollständigen Typologie ▶ Angabe der Merkmale, die jeweils eine Textsorte auszeichnen (Layout, Struktur- und Formulierungsbesonderheiten, inhaltlich-thematische Aspekte, die kommunikativen Funktionen etc.) und sie von allen anderen Sorten abgrenzen Mit diesem Anspruch auf Vollständigkeit ist das Ziel wohl nicht erreichbar. Bereits Adamzik (1995) hatte denn auch dazu geraten, die Perspektive der Textsortenforschung und die der Texttypologie auseinanderzuhalten: Erstere befasse sich mit der Beschreibung einzelner oder einer Menge verwandter Textsorten, während letztere das Ziel eines Gesamtüberblicks, einer schlüssigen Klassifikation im Prinzip aller Exemplare von Texten verfolge. Dies aber ist ein anspruchsvolles Unterfangen. Für die Umsetzung hatte schon Isenberg (1974) eine einheitliche Typologisierungsbasis gefordert-- eine wohlbegründete Menge von Kriterien, anhand derer alle Texte beurteilt werden müssten. Dem fügte Steger (1983) zwei Forderungen hinzu, nämlich die der Monotypie (die Kriterien sollen so gewählt sein, dass jeder Text genau einer Sorte zugeordnet wird) und die der Reproduzierbarkeit (die Auswertung der Kriterien für ein Textexemplar muss intersubjektiv nachvollziehbar sein). Die Schwierigkeit dieser Zielvorstellung wurde im vorigen Abschnitt deutlich, als wir uns mit der Bandbreite der zu untersuchenden Merkmale beschäftigt haben, die die Definition einer „einheitlichen Typologisierungsbasis“ (welche obendrein zur Monotypie führt) für jedwede Art von Text sehr schwer gestaltet. Ein weiteres Problem der Texttypologie haben wir eingangs bereits angedeutet: Die Alltagssprache hält durchaus Fragmente von Klassifikationen bereit, die von Sprachbenutzern problemlos verwendet werden; 17 eine wissenschaftliche Typologie müsste sich nun entscheiden, diese entweder zu integrieren, oder davon losgelöst zu operieren. Wie viele andere Autoren mahnt Heinemann (2000) an, dass eine Texttypologie zu Alltagsklassifikationen zumindest kompatibel sein sollte, um überhaupt aussagekräftig zu sein. In diesem Zusammenhang ist eine Untersuchung von Dimter (1981) interessant, der nach Durchsicht des Duden Wörterbuchs 1642 Textsortenbezeichner identifiziert hat, wovon 480 ‚grundlegend‘ und die übrigen ‚abgeleitet‘ waren, z. B.: Bericht-- Reisebericht, Arbeitsbericht, Ergebnisbericht usw. Wäre es realistisch, diese Menge von Sorten einer vollständigen Merkmalsanalyse zu unterziehen? 17 Im Englischen ist dafür der Ausdruck folk taxonomies gebräuchlich. 47 3.2 Textsorte 48 3 Textfunktion, Textsorte und Texttyp Textsorten in Zeitungen Publizistische Textsorten informationsbetont vorrangig gewichtet rein faktenorientiert: BEKANNTGABE primär informierend: KURZNACHRICHT zusammenhangsorientiert: NACHRICHT chronologisch geschehensorientiert: BERICHT erlebnisorientiert: REPORTAGE beiläufig redaktionell: HINWEIS / MELDUNG amtlich: BEKANNTMACHUNG kommerziell: ANZEIGEN meinungsbetont stellvertretend argumentativ: KOMMENTAR polemisch: GLOSSE kritisch: BESPRECHUNG analytisch. DIAGNOSE direkt: INTERVIEW / LESERBRIEF / ZITAT Annektierte Textsorten literarisch: ROMAN / KURZGESCHICHTE / WITZ / ANEKDOTE / SPRUCH instruierend handlungsorientierend praktisch: ANLEITUNG / KOCHREZEPT lebenspraktisch: RATSCHLAG / HOROSKOP lektüreorientierend: IMPRESSUM / INHALTSVERZEICHNIS / BEILAGENHINWEIS Abbildung 3.3: Sorten von Pressetexten nach Hundsnurscher (1984) Die Schwierigkeit dieser Zielvorstellung wurde im vorigen Abschnitt deutlich, als wir uns mit der Bandbreite der zu untersuchenden Merkmale beschäftigt haben, die die Definition einer “einheitlichen Typologisierungsbasis” (welche obendrein zur Monotypie führt) für jedwede Art von Text sehr schwer gestaltet. Ein weiteres Problem der Texttypologie haben wir eingangs bereits angedeutet: Die Alltagssprache hält durchaus Fragmente von Klassifikationen bereit, die von Sprachbenutzern problemlos verwendet werden; 4 eine wissenschaftliche Typologie müsste sich nun entscheiden, diese entweder zu integrieren, oder davon losgelöst zu operieren. Wie viele andere Autoren mahnt Heinemann (2000) an, dass eine Texttypologie zu Alltagsklassifikationen zumindest kompatibel sein sollte, um überhaupt aussagekräftig zu sein. In diesem Zusammenhang ist eine Untersuchung von Dimter (1981) interessant, der nach Durchsicht des Duden Wörterbuchs 1642 Textsortenbezeichner identifiziert hat, wovon 480 ‘grundlegend’ und die übrigen ‘abgeleitet’ waren, z. B.: Bericht - Reisebericht, Arbeitsbericht, Ergebnisbericht usw. Wäre es realistisch, diese Menge von Sorten einer vollständigen Merkmalsanalyse zu unterziehen? Der zweite und sicherlich vielversprechendere Zugang zur Textsortenfrage besteht - wie oben dargestellt - in der Konzentration auf einzelne verwandte Sorten, die man möglichst gründlich zu charakterisieren und voneinander abzugrenzen versucht. Auch hier kommt man freilich nicht umhin, die existierenden alltagssprachlichen Begriffe zur Kenntnis zu nehmen. Zur Illustration zeigt Abb. 3.3 ei- 4 Im Englischen ist dafür der Ausdruck folk taxonomies gebräuchlich. Abbildung 3.3: Sorten von Pressetexten nach Hundsnurscher (1984) Der zweite und sicherlich vielversprechendere Zugang zur Textsortenfrage besteht- - wie oben dargestellt-- in der Konzentration auf einzelne verwandte Sorten, die man möglichst gründlich zu charakterisieren und voneinander abzugrenzen versucht. Auch hier kommt man freilich nicht umhin, die existierenden alltagssprachlichen Begriffe zur Kenntnis zu nehmen. Zur Illustration zeigt Abb. 3.3 eine von Hundsnurscher (1984) vorgeschlagene Taxonomie der Textsorten in Zeitungen. 18 Das primäre Auswahlkriterium ist hier also die Zugehörigkeit zu einem „Alltagsgegenstand“, während die Merkmale zur Differenzierung der einzelnen Sorten dann aus ganz unterschiedlichen Domänen stammen. 18 Eine ebenfalls interessante Untersuchung des Bereichs ‚Pressekommunikation‘ liefert Bucher (1986). 48 3 Textfunktion, Textsorte und Texttyp 3.2.3 Die Rolle linguistischer Merkmale Wir kehren zurück zu der Frage, anhand welcher Merkmale sich Texte verschiedener Sorten systematisch unterscheiden lassen. Wie ausgeführt sind oftmals das Thema, das Layout und der Textaufbau bedeutsam, aber auch die Rolle im engeren Sinne linguistischer Merkmale haben wir angedeutet. Um deren Beitrag genauer herauszuarbeiten, sind die Ergebnisse eines Experiments von Dimter (1981) von Interesse. Er stellte sich die Frage, ob Leser in der Lage sind, Texte unabhängig vom behandelten Thema bestimmten Sorten zuzuordnen. Dazu sammelte er Texte aus zehn verschiedenen Sorten (Bedienungsanleitung, Todesanzeige, Geschäftsbrief, Kommentar etc.) und ersetzte die Inhaltswörter durch Zeichenfolgen, die keine deutschen Wörter darstellen, jedoch prosodisch „deutsch klingen“ und die Flexionsendungen beibehalten. Jegliches Layout wurde entfernt. Im Text verblieben unverändert die originalen Pronomen, Artikel, Konjunktionen, Zahlwörter, sowie die Formen von haben, werden und sein. Zwei Beispiele für diese Text-Gebilde: (3.1) Berrung Ihres Salex SSQ Duren und ablauffen des abrungenden Kattes-- as belasen Argen und Besinden. Beise Ergen sind kur einen Oppelund gefannt. Duren und anflaffen des abrungenden Kattes-- as belasen Argen und Besinden und seich sugen rellen Sie die langenden Veronden, ange Sie den Katt angedurkt woren. Duren Sie den abrungenden Katt enel ark anunder und laffen Sie ihm em al, belasen Kanot und Fat on der Munne. (3.2) Lestingers erwestete Rodenberk Der Lac Lestinger hat zwei Belickte- - das Belagen Lestingers als Bugatebreswüger wegelbrat und das Belagen des Gewoderkaribenten hale. Der Bugatebreswüger wenkte nebe behle einem begarren Vorwelbris magnen, wenn nicht der Gewosterkaribent herres winn grens lennem lechte. Wie wenk man ein solches Rabigernel emarst ertetene vermorren und sodann herre Boneter der Liwastik woten? Wie werk man sich erfenlas sum einen Granz rud lesenmasiges Kargbrienkei erhohren und sich ogenlas als eine Berg Lesenmaler betahnen? -(…) Den Versuchspersonen wurden zunächst zur Orientierung beispielhaft drei Textsorten genannt, doch die Bezeichnungen der anderen zugrunde gelegten Sorten blieben unbekannt. Das Ergebnis: Todesanzeigen, Testamente, Kochrezepte wurden von den Versuchspersonen zu mehr als 90 % als solche identifiziert, am Ende der Skala steht der Kommentar, der immerhin noch zu 42 % richtig erkannt wurde. 19 In einem studentischen Semesterprojekt an der Universität Potsdam wurde Dimters Experiment in etwas veränderter Form nachgestellt, wobei seine Ergebnisse im Wesentlichen bestätigt wurden. Es scheint also für Leser durchaus nachvollziehbare Zusammenhänge zwischen Merkmalen der Textoberfläche und der unterstellten Textsorte zu geben-- auch wenn der Inhalt des Textes komplett unkenntlich gemacht wurde und damit keine Rückschlüsse auf behandelte Themen möglich sind. Damit liegt es im nächsten Schritt nahe, Textsorten auch aus korpuslinguistischer Perspektive zu 19 Die ausführliche Dokumentation findet sich im Anhang des Buches von Dimter (1981). 49 3.2 Textsorte analysieren, also automatische Merkmalsanalysen auf größeren Textmengen durchzuführen, um empirisch valide Modelle von Textsorten zu gewinnen. 3.2.4 Quantitative Merkmalsanalyse von Textsorten In seinem Buch Linguistische Textanalyse beschließt Brinker (2005) den Abschnitt zu Textsorten mit der Beobachtung, dass in einzelnen Textsorten „gewisse Präferenzen für bestimmte lexikalische und / oder syntaktische Mittel“ vorliegen, die mit quantitativ-statistischen Methoden zu erfassen seien. Diesen wichtigen Hinweis wollen wir hier aufnehmen und einen Schritt weiterführen, indem wir Überlegungen zur statistischen Analyse von Textsorten kurz vorstellen. Insbesondere wenn man sich der Sortenfrage aus linguistisch-grammatischer Perspektive nähert, benötigt man nachprüfbare quantitative Informationen, um Aussagen über das Vorkommen sprachlicher Phänomene in Texten bestimmter Sorten zu treffen; und die Frage, ob die Sorten sich hinsichtlich des Auftretens dieser Phänomene auch wirklich signifikant unterscheiden, kann nur durch statistische Auswertung von Korpora ermittelt werden. Als wegweisend für diese Untersuchungsrichtung gelten die Arbeiten von Douglas Biber, der sich insbesondere mit Unterschieden zwischen gesprochener und geschriebener Sprache (also mit Registern), aber auch mit der Differenzierung von Textsorten befasst hat. Im Folgenden beziehen wir uns auf die Darstellungen in (Biber, 1993, Biber u. Conrad, 2009). Biber arbeitete mit zwei recht bekannten Korpora des gesprochenen und geschriebenen English (‚Lancaster-Oslo / Bergen‘ sowie ‚London-Lund‘), die er zunächst mit 67 linguistischen Merkmalen annotierte- - weitgehend automatisch, jedoch mit manueller Nachkorrektur. Zu den Merkmalen zählen beispielsweise Tempus, Aspekt, Zeit- und Ortsadverbiale, die Wortarten, Modalverben, lexikalische Spezifizität, stilistisch-lexikalische Klassen (ausweichende oder emphatische Wörter etc.), Elision, diskontinuierliche Strukturen, Passiv, subordinierte Sätze, Koordination, und Fragesätze. Nach dieser Vorverarbeitung zählte er zunächst die Häufigkeit der Merkmale in den einzelnen Texten, die er dann normalisierte zur Zahl des Auftretens je 1.000 Wörter. Der zentrale statistische Analyseschritt ist nun die Faktorenanalyse, die errechnet, welche der Merkmale überdurchschnittlich häufig miteinander auftreten- - wie dies im Detail geschieht, ist in (Biber, 1993) nachzulesen. Aus der Faktorenanalyse resultieren Merkmalsbündel, die Biber Dimensionen nennt. Die grundlegende These seiner Arbeit ist, dass die Merkmalsbündel sich nicht rein zufällig ergeben, sondern dass die Dimensionen funktional interpretiert werden können. In seiner Studie gelangte Biber zu folgenden fünf Dimensionen, die wir hier mit einigen der Merkmale illustrieren. Ebenfalls sind Textsorten angegeben, die sich anhand der Dimensionen gut unterscheiden lassen. 50 3 Textfunktion, Textsorte und Texttyp 1. Informational versus involved production Die beiden Pole dieser Skala werden durch sorgfältig produzierte monologische Texte („offizielle“ Dokumente, akademische Aufsätze etc.) auf der einen, und persönliche Interaktion (Gespräche, private Briefe etc.) auf der anderen Seite gebildet. Für erstere steht die Informationsvermittlung im Vordergrund, es werden viele Substantive, Adjektive, Präpositionalphrasen verwendet; lange Wörter sind häufig. Bei der Interaktion treten demgegenüber viele Pronomina und Elisionen, Fragen und stilistisch markierte Wörter auf. 2. Narrative versus nonnarrative concerns Die erzählenden Texte (Sorte: fiktional) zeichnen sich durch Vergangenheitsformen, perfektiven Aspekt und Pronomina der 3. Person aus. In nicht-erzählenden Texten (u. a. Geschäftsbriefe, Telefongespräche, darstellende Texte) findet sich eher das Präsens, attribuierende Adjektive sind häufig. 3. Elaborated versus situation-dependent reference Texte mit situationsbezogener Referenz (Rundfunkmeldungen, Gespräche, fiktionale Texte und private Briefe) verwenden Zeit- und Ortsadverbiale überdurchschnittlich häufig; abstraktere Texte mit situationsunabhängiger Referenz (u. a. offizielle Dokumente, Geschäftsbriefe) sind demgegenüber reich an WH -Relativsätzen, phrasaler Koordination und pied-piping constructions. 4. Overt expression of persuasion Offen argumentierende Texte (Meinungsartikel, Geschäftsbriefe) verwenden auffallend viele Modalausdrücke, illokutive Verben und konditionale Unterordnung (z. B. wenndann Sätze). Am anderen Ende der Skala stehen nicht-argumentierende Rundfunkmeldungen und Presseberichte, die nicht durch besonders häufige Merkmale gekennzeichnet sind. 5. Abstract versus nonabstract style Auch hier nennt Biber Merkmale nur für die Textsorten an einem Ende der Skala, den abstrakten Stil: Technische und akademische Texte sowie Geschäftsbriefe verwenden gern Passivkonstruktionen verschiedener Art; dies gilt nicht für Gespräche, fiktionale Texte, private Briefe u. a. Im nächsten Schritt werden für die Dimensionen numerische Skalen definiert, auf der sich die Textsorten dann auftragen lassen. Beschränkt man sich auf zwei Dimensionen, lässt sich das Ergebnis im Koordinatensystem anschaulich darstellen; ein Beispiel gibt Abb. 3.4 mit den o. g. Dimensionen 1 und 3. Fügt man die weiteren Dimensionen hinzu, so erhält man einen höherdimensionalen Vektorraum, in dem jede Textsorte verortet ist, und es lassen sich beispielsweise die Abstände zwischen ihnen berechnen. Biber zeigt, dass die von ihm untersuchten Sorten entlang der genannten fünf Dimensionen in der Tat klar voneinander unterschieden werden können. Verfahren dieser und ähnlicher Art haben dann auch in der Computerlinguistik zu erfolgreichen Systemen zur automatischen Klassifikation von Texten anhand eines vorgegebenen Sorteninventars oder zum clustering (Gruppierung von Texten gemäß Ähnlichkeit, ohne vorgegebenes Inventar) geführt. 51 3.2 Textsorte Abbildung 3.4: Textsorten und funktionale Dimensionen (Biber, 1993, S. 230) 52 3 Textfunktion, Textsorte und Texttyp 3.2.5 Fallbeispiele computerlinguistischer Modellierung Die eben skizzierte Herangehensweise wird in der Computerlinguistik genutzt, um Klassifikationsprogramme zu entwickeln, die einen gegebenen Text anhand vorgefundener Merkmale automatisch einer Textsorte zuordnen oder ihn in funktionale Bestandteile zerlegen, die wir Inhaltszonen nennen. Dazu ist es nötig, dem Programm Modelle der jeweils zu unterscheidenden Textsorten bzw. Inhaltszonen zur Verfügung zu stellen, die wiederum aus Korpora erlernt werden. Im Folgenden verweisen wir auf einige solcher Arbeiten, um den „Stand der Kunst“ zu illustrieren. Wissenschaftlicher Aufsatz Weil es eine Reihe relevanter praktischer Anwendungen gibt, sind wissenschaftliche Aufsätze gut untersuchte Textsorten: Beispielsweise ist es von großem Interesse, in biomedizinischen Texten automatisch die Ergebnisse der dort (oft recht schematisch) berichteten Experimente aufzufinden, da die Menge der publizierten Texte heute kaum noch manuell zu bewältigen ist. Aus Sicht der Textsortenforschung ist zunächst der in vielen Disziplinen stark konventionalisierte Aufbau von papers zu nennen, die sich an Mustern wie „Einführung-- Bisherige Forschungen- - Methode- - Experiment und Resultate- - Diskussion“ orientieren. Für eine automatische Extraktion von Resultaten ist es also nötig, zunächst den jeweils relevanten Abschnitt zu identifizieren. Eine feinkörnigere Untersuchung des Aufbaus von papers wurde ursprünglich von Swales (1990) vorgeschlagen. Sein Ansatz interpretiert Sätze oder Folgen von Sätzen als textsortenspezifische Inhaltszonen, die er moves nannte, und die jeweils den Beitrag des Satzes zur übergeordneten Textfunktion benennen. Diese Idee wurde später von Teufel u. a. (2009) in einer empirischen Korpusstudie umgesetzt: Annotatoren haben Aufsätze der beiden Disziplinen Chemie und Computerlinguistik segmentiert und jedem Segment eine von 15 verschiedenen Inhaltszonen zugeordnet, dazu gehörten Aim (adressierte Forschungsfrage), OwnMethod (angewandte Methodik) oder CoDi (Unterschiede zu anderen Arbeiten). Anschließend wurden die Texte automatisch mit linguistischen Merkmalen annotiert, ähnlich zu den im vorigen Abschnitt genannten. Dann konnte ein automatisches Lernverfahren anhand des Korpus die Assoziation zwischen Merkmalen und Inhaltszonen errechnen, und dieses Modell diente dann einem Klassifikator, der in der Lage war, „neue“ Texte mit einer akzeptablen Korrektheit automatisch mit den Inhaltszonen zu annotieren. Filmrezension Im Internet finden sich eine ganze Reihe deutschsprachiger Seiten, die regelmäßig Rezensionen zu aktuellen Filmen anbieten. Die Texte folgen seitenspezifischen Format-Vorgaben und lassen sich ähnlich wie die wissenschaftlichen Aufsätze mit einem Inventar von Inhaltszonen beschreiben. Die Arbeit von Bieler u. a. (2007) basiert auf einem Korpus von 210 solcher Rezensionen von sieben verschiedenen Webseiten. Alle Texte wurden zunächst manuell segmentiert und annotiert. Die Einheit für die Zuweisung einer Zone ist diesmal der Absatz, weil die Texte des Korpus sehr häufig Absatzgrenzen zur Trennung unterschied- 53 3.2 Textsorte licher Informationen verwendeten. Es wurden 26 Kategorien benutzt, darunter Filmtitel, Länge, Darstellerliste, Autor der Rezension etc. Für diese Zonen lassen sich Tendenzen finden, dass sie entweder zu Anfang oder gegen Ende der Rezension auftreten, und auch die Reihenfolge folgt zum Teil bestimmten Konventionen, wenn auch mit Abweichungen zwischen den einzelnen Webseiten. Für die längeren Textabschnitte wurden die Kategorien ‚Beschreibung‘ und ‚Meinung‘ vewendet, weil sich bei einer Vorstudie gezeigt hatte, dass die Absätze der Rezensionen nur selten die Beschreibung des Filminhalts mit der Beurteilung vermischen. Für die automatische Analyse wurden die eher „formalen“ und kurzen Zonen von den beiden Text-Zonen getrennt behandelt. Erstere erzielte eine Korrektheit von etwa 66 %. Die Klassifikation von Textabschnitten nach ‚Beschreibung‘ oder ‚Meinung‘ wurde vom Programm zu 80 % richtig gelöst. Dies ist ein interessantes Ergebnis, weil die fragliche Unterscheidung auch für andere Textsorten bedeutsam ist, etwa für die nachfolgend besprochene. Zeitungskommentar In der Tagespresse zählen die Kommentare neben den Leserbriefen zu den meinungsorientierten und häufig argumentativen Texten (vgl. Abb. 3.3). Kommentare stellen aber keine homogene Textsorte dar, sondern lassen sich hinsichtlich ihrer Vorgehensweise in Untergruppen gliedern. So schlagen Schneider u. Raue (1996) folgende Kategorien vor: ▶ Einerseits-andererseits: Der Autor wägt Für und Wider ab, kommt möglicherweise zu einem Fazit; typisch sind Andeutungen und bedächtige Urteile; oft bleibt der Kommentar im Entweder-Oder stecken. ▶ Pro und Kontra: Es gibt eine nachvollziehbare und spannende Argumentation und am Ende eine eindeutige Schlussfolgerung. ▶ Meinungsartikel: Der Autor geht langsam vor, die Leser sollen vor allem nachdenklich gestimmt werden. ▶ Kurzkommentar: Es gibt kaum Raum für eigene Argumente, stattdessen wird mit Zitaten gearbeitet und zu einem kräftigen Urteil zugespitzt. ▶ Pamphlet: Die „gröbste“ Form des Kommentars kommt auch ohne Argumente aus und „wirkt wie ein Keulenschlag“. In einem Teil des Potsdamer Kommentarkorpus (Stede, 2016b) sind kurze Artikel aus der Rubrik ‚Pro & Contra‘ des Berliner Tagesspiegel am Sonntag zusammengestellt, die sich recht eindeutig der o. g. gleichnamigen Kategorie zuordnen lassen: Es gibt eine aktuelle Streitfrage der Lokalpolitik, zu denen jeweils zwei konträre Meinungen ausgeführt werden. (Zwei Beispieltexte finden sich auf den Seiten 136 und 143.) Weisen diese Texte Gemeinsamkeiten im Aufbau auf, die als charakteristisch für die Textsorte gelten können? Nach Untersuchung von 30 zufällig ausgewählten Kommentaren aus dem Korpus hat sich gezeigt, dass die folgenden Inhaltszonen geeignet sind, die Zusammensetzung der Kommentare zu beschreiben: 54 3 Textfunktion, Textsorte und Texttyp ▶ Einführung / Problemdarstellung ▶ Hintergrundinformation ▶ Beispiel ▶ These bzw. Forderung des Autors ▶ Argumentation für die Meinung des Autors ▶ Argumentation gegen die Meinung des Autors ▶ Fakt zur Stützung einer Argumentation ▶ Abschwächung / Widerlegung einer Argumentation ▶ Schlussfolgerung / Fazit Nicht jeder Kommentar weist alle Zonen auf, und es gibt natürlich keine feste Abfolge der Zonen. Doch lassen sich klare Tendenzen ermitteln, welche Zonen häufiger oder seltener benachbart auftreten, und welche besonders häufig am Anfang bzw. Ende des Kommentars auftreten. Diese Analyse führt dann zu einer abstrakten Darstellung der typischen Argumentationsmuster in solchen ‚Pro & Contra‘ Texten. Eine andere Analyseaufgabe für Zeitungstexte betrifft die automatische Unterscheidung zwischen Meinungstexten und Nachrichtentexten. Eine frühe (manuelle) Korpusuntersuchung von Morgenthaler (1980, S. 117) hat die Textsorten Nachricht und Kommentar im Hinblick auf die von den „kleinsten kommunikativen Einheiten“ ausgeführten pragmatischen Funktionen ausgewertet. In den Nachrichten fanden sich unter den insgesamt 945 minimalen Einheiten 926 ‚Mitteilungen‘, 19 ‚Wertungen‘ und 18 ‚Behauptungen‘. Die Kommentare hingegen setzten sich anders zusammen: Von insgesamt 713 Einheiten im Korpus waren 503 ‚Wertungen‘, 112 ‚Behauptungen‘, 62 ‚Mitteilungen‘, 27 ‚Aufforderungen‘ und 11 ‚Äußerungen von Emotionen‘. Diese klaren Unterschiede zwischen „objektiver“ Beschreibung und „subjektiver“ Einschätzung haben Krüger u. a. (2017) motiviert, einen Klassifikator zu erstellen, der die Nachricht / Meinung-Unterscheidung durch Analyse oberflächennaher linguistischer Merkmale treffen kann. Das zugrunde liegende Modell wurde aus großen Mengen von englischsprachigen Texten aus der New York Times, dem Wall Street Journal und anderen Zeitungen gewonnen, wobei die Gruppe ‚Meinung‘ durch Kommentare und Leserbriefe gebildet wurde. Die Texte wurden jeweils mit einem part-of-speech tagger (vgl. Abschnitt 1.2) bearbeitet, so dass alle Wörter mit ihrer Wortart „etikettiert“ waren. Die technischen Aspekte sind hier nicht von Interesse, doch haben Krüger et al. im Rahmen der Arbeit auch ermittelt, welche der von ihnen untersuchten Merkmale statistisch enger mit einer der beiden Textsorten verbunden sind. Dabei stellte sich beispielsweise heraus, dass Personalpronomen der 1. und 2. Person, das Tempus Präsens, das Auftreten von Negationen, oder auch bestimmte Wörter wie fact auf Meinungstexte hindeuten, ebenso die Verwendung von evaluativen (eine positive oder negative Bewertung ausdrückenden) Wörtern. Charakteristisch für Nachrichtentexte sind demgegenüber die Klasse der Kommunikationsverben (sagen, behaupten, berichten usw.), die Tempora Futur und Imperfekt, oder die Verwendung von kontrastiven Konnektoren. In verschiedenen Evaluationen zeigte sich, dass das Programm in ca. 90 % der Fälle die richtige Entscheidung trifft. 55 3.2 Textsorte 3.2.6 Fazit: Textsortenwissen Sehen wir uns zum Abschluss dieses Themas zunächst die Charakterisierung des Textsortenbegriffs von Gansel u. Jürgens (2002, S. 78) an: Textsorten konstituieren sich durch ein prototypisches Aufeinander-Bezogen-Sein kontextueller und struktureller Merkmale. Sie bilden den Rahmen für prototypische, auf Konventionen der Sprachteilhaber beruhende sprachliche Muster mit charakteristischen funktionalen, medial-situativen und thematischen Merkmalen sowie einer diesen Merkmalen entsprechenden formalen Struktur. Sowohl bei der Textproduktion als auch bei der Textrezeption spielen also konventionalisierte Muster eine zentrale Rolle: Sie geben uns bei der Textproduktion (flexible) Schablonen vor und lösen bei der Rezeption eine Erwartungshaltung zu Form und Inhalt aus, die die Verarbeitung des Textes steuert und effizienter gestaltet. Damit steht solcherlei Wissen über Textsorten in unmittelbarer Nachbarschaft zu anderem Wissen über sonstige konventionalisierte, nichttextgebundene Handlungsmuster: Wie bestelle ich ein Menü im Schnellrestaurant versus im gehobenen Restaurant; wie führe ich ein Bewerbungsgespräch; wie befrage ich als Ärztin meinen Patienten, um die Quelle des Unwohlseins einzukreisen; etc. Unser Textsortenwissen befähigt uns also bei der Rezeption, einen Text als Exemplar einer bestimmten Textsorte zu identifizieren, und bei der Produktion, einen-- in bezug auf Layout und sprachliche Form-- angemessenen Text zu erstellen. Entsprechende Merkmale haben wir in den vorangegangenen Abschnitten besprochen und fassen sie im Folgenden noch einmal zusammen. Textsorten: Zentrale Merkmale Die Textfunktion und das Thema (siehe auch Kapitel 5) sind häufig mit der Textsorte eng verbunden: Eine Nachricht soll informieren, ein Kommentar zur Meinungsbildung anregen und eine Bedienungsanweisung instruieren - um welchen Gegenstand es sich dabei jeweils handelt, ist normalerweise sehr schnell ersichtlich. Das globale Layout des Textes ist oftmals Konventionen unterworfen, die den Gebrauch von Bildern, Tabellen und Diagrammen, die optische Anordnung der Textbausteine, oder auch die Gestaltung von Überschriften, Aufzählungen, Textboxen etc. regeln. Die inhaltlichen Zonen sind für manche Textsorten relativ klar vorgegeben, wie unsere Beispiele gezeigt haben. Neben der Angabe, welche Zonen vorkommen können und ob sie obligatorisch bzw. fakultativ sind, zählen Beschränkungen oder Präferenzen zur Abfolge der Zonen zu unserem Textsortenwissen, ebenso aber auch Erwartungen zur typischen Länge solcher Zonen. Weiterhin kann es für jede Zone wiederum einzelne Layout-Konventionen geben, oder der Gebrauch bestimmter Formulierungen ist standardisiert (Eröffnungs-, Schluss-, Grußformeln usw.). Syntaktische und lexikalische Merkmale können sowohl für den gesamten Text als auch für einzelne Zonen charakteristisch sein. Sie betreffen einerseits die Verwendung von fachgebundenem und nicht-fachgebundenem Vokabular (Lexeme, Kollokationen), andererseits von syntaktischen Konstruktionen (Extraposition, Passiv etc.) und Merkmalen (Modus, Tempus etc.). 56 3 Textfunktion, Textsorte und Texttyp Um hinsichtlich der sprachlichen Mittel zu interessanten Aussagen über Textsorten zu gelangen, sind quantitative Untersuchungen zu betreiben: Mit methodisch sorgfältiger Analyse der relativen Häufigkeiten von geeigneten Merkmalen und der Zusammenhänge zwischen Merkmalen gelangt man zu nachvollziehbaren und überprüfbaren Modellen dessen, was eine Textsorte an der sprachlichen Oberfläche auszeichnet. Damit erfasst man keineswegs alles, was die Textsorte bestimmt, aber doch einen sehr wesentlichen Teil, wie nicht zuletzt das Experiment von Dimter (1981, siehe S. 48) gezeigt hat, demzufolge wir viele Textsorten allein aufgrund ihrer sprachlichen Merkmale-- ohne Beachtung der Inhaltswörter-- identifizieren können. Wie können wir uns schließlich die Form unseres Textsortenwissens vorstellen? Dazu greifen wir hier den Vorschlag von Sandig (2000) auf, die Kategorie-Zugehörigkeit mittels der Prototyptheorie (Rosch u. Mervis, 1975) zu beschreiben. Dem liegt die Erkenntnis zugrunde, dass sich Kategorien (und eben auch Textsorten) nicht durch Angabe notwendiger und hinreichender Merkmale im engen Sinne definieren lassen. Das heißt, man kann z. B. für die Sorte ‚Bedienungsanleitung‘ weder eine Menge von Mindest-Merkmalen aufzählen, die immer vorliegen müssen, damit ein Text eine Bedienungsanleitung sein kann (notwendige Merkmale), noch eine Menge von Merkmalen, bei deren Vorliegen ein Text auf jeden Fall eine Bedienungsanleitung ist (hinreichende Merkmale). Weil die Verhältnisse so einfach nicht sind, sind auch die Grenzen zwischen vielen Kategorien (Textsorten) nicht klar festgelegt, sondern durchaus fließend. Das bedeutet aber keineswegs, dass die Arbeit mit Merkmalen zwecklos wäre- - es muss eben um die Zielsetzung gehen, statistische Tendenzen zu ermitteln. Dann können die Vertreter einer Kategorie mehr oder weniger (un-)typisch sein, und die „besten“ Vertreter werden als prototypisch bezeichnet-- was man sich entweder als nur mentales „Idealbild“ der Kategorie, oder als einen real existierenden Vetreter vorstellen kann, der diesem Idealbild am nächsten kommt: Beim Wort Vogel denken viele Menschen unmittelbar an einen Spatz, nur wenige an einen Buntspecht, und kaum jemand an den sehr untypischen Vogel Pinguin. Wenden wir diese Konzeption auf das Textsortenwissen an, 20 so dürften die Merkmale Textfunktion und -thema für die meisten Sorten zentral sein, während beispielsweise Gliederungs- und Layout-Merkmale mehr oder weniger wichtig sein können. Für die Sorte ‚wissenschaftlicher Aufsatz‘ wären die Gliederungsmerkmale sehr zentral (weil stark konventionalisiert), für den Feuilleton-Artikel weit weniger. Bei der Filmrezension sind bestimmte Inhaltszonen obligatorisch, andere fakultativ (wenn auch typisch), und es gibt bestimmte Präferenzen für die absolute und relative lineare Anordnung der Zonen. Dass nicht alle Textexemplare einer Sorte gleichermaßen schnell als solche erkennbar sind, spricht für die Bandbreite der Prototypikalität der Vertreter: Eine schlecht gestaltete Bedienungsanleitung mag erst nach Lektüre der ersten Sätze als Vertreterin ihrer Art identifizierbar sein, ein verunglückter Kommentar, bei dem die Meinung der Autorin nicht recht klar wird, womöglich überhaupt nicht. 20 Siehe dazu auch Rehm (2007, Abschn. 2.2.9). 57 3.3 Texttyp 3.3 Texttyp Während wir für die Charakterisierung von Textsorten eine ganze Reihe unterschiedlicher Arten von Merkmalen zugelassen haben, wollen wir den Begriff des Texttyps im Anschluss an Werlich (1975) oder auch Virtanen (1992) sehr eng mit sprachlichen Merkmalen verknüpfen. Werlich spricht davon, dass den Texttypen jeweils ein „Vertextungsmuster“ sowie ein bestimmter „kontextueller Fokus“ (unten in Klammern) und damit verbunden dann auch bestimmte Oberflächenmerkmale zugrunde liegen. Er unterscheidet fünf Texttypen. 21 Texttypen nach Werlich (1975) ▶ deskriptiv (spatial / Raum): phänomenregistrierende Sätze Thousands of glasses were on the table. ▶ narrativ (temporal / Zeit): handlungsaufzeichnende Sätze The passengers landed in New York in the middle of the night. ▶ expositorisch (Zerlegung / Zusammensetzung von Konzepten): phänomenidentifzierende oder -verknüpfende Sätze One part of the brain is the cortex. When unfolded, it measures 1.800 cm 2 . ▶ argumentativ (Beziehungen zu Konzepten oder Aussagen der Sprecher): qualitätsattribuierende Sätze The current obsession with durability in the arts is not permanent. ▶ instruktiv (künftiges Verhalten von Sprecher / Hörer betreffend): handlungsfordernde Sätze Be reasonable for a moment! Für den deskriptiven Typ folgen wir Brinker (2005, S. 69) und unterscheiden noch einmal das Berichten (eines Geschehens) vom Beschreiben (eines Lebewesens, Objekts oder Geschehens als Instanz einer bestimmten Klasse). Typisch für den deskriptiven Typ sind nach Werlich etwa lokale Verknüpfungen über räumliche Beziehungen sowie Präpositionalphrasen in Thema-Position. Narrative Texte unterscheiden sich vom Berichten dadurch, dass es sich nicht um eine eher kurze, neutrale Schilderung handelt, sondern um eine Erzählung aus einer spezifischen Perspektive. Diese Texte bevorzugen nach Werlich eine temporale Verknüpfung über die zeitliche Folge, entsprechend seien temporale Konnektoren und Aktionsverben häufig, die Tempus-Folge spiele eine wichtige Rolle.-- Für expositorische Texte sei eine „analytische Verknüpfung“ über Differenzierung oder Synthese charakteristisch, ebenso partikularisierende Relationen, die durch Wörter wie namely, incidentally, for example, in other words angezeigt sind. In der Terminologie von Brinker (2005) dürfte dieser Typ weitgehend der Kategorie 21 Mit dreien der fünf Kategorien assoziiert Brinker (2005) spezifische Formen der ‚Themen-Entfaltung‘, worauf wir in Kapitel 5 eingehen werden. 58 3 Textfunktion, Textsorte und Texttyp ‚explikativ‘ entsprechen, er sieht hier als sprachliches Merkmal eine Dominanz von Konnektoren, Adverbien und Präpositionen, die Kausalbeziehungen signalisieren. In argumentativen Texten herrscht nach Werlich eine kontrastive Verknüpfung mit entsprechend frequenten kontrastiven Konnektoren und lexikalischen Kontrasten vor. Brinker sieht außerdem eine Tendenz zu subordinierten Sätzen, die nicht nur kontrastiv, sondern auch kausal, konditional und konsekutiv verknüpft sind. Instruktive Texte schließlich seien reich an Enumerationen und aufzählenden, sequenzialisierenden Konnektoren. Der Terminus Texttyp wird gelgentlich im Sinne einer „Großklasse“ von Textsorten verwendet. Wir möchten ihn hier jedoch nur in dem genannten engeren Sinne benutzen, nach dem er ein funktional interpretierbares Bündel linguistischer Merkmale bezeichnet. Das hat zur Folge, dass Texttyp keineswegs immer eine Eigenschaft eines vollständigen Textes ist, sondern sich oft nur auf mehr oder weniger lange Textabschnitte bezieht. Viele Texte vermengen ja erzählende, beschreibende oder andere Passagen miteinander, um ihr Gesamtziel zu erreichen. Um nur drei Beispiele zu nennen: Erzählende Prosa, etwa eine Kurzgeschichte, wird oftmals zum großen Teil vom Typ narrativ sein, kann aber problemlos deskriptive Passagen enthalten, wenn eine Person, ein Ort o. ä. beschrieben wird. Ein persönlicher Brief kann zunächst Erlebnisse der Schreibenden berichten (narrativ), um daraus dann konkrete Handlungsvorschläge (instruktiv) für den Adressaten abzuleiten. Eine Bedienungsanleitung kann vorwiegend instruktiven Charakter haben, an bestimmten Stellen aber auch bestimmte Schritte durch Erklärung der Funktionsweise eines Geräts (expositorisch) begleiten. Dies bedeutet, dass es zwar Tendenzen für die Korrelation zwischen Textsorten und Texttypen gibt, aber keine festen Zuordnungen, und dass insbesondere-- in unserer Verwendung des Begriffs-- die Texttypen nicht Bestandteil einer Hierarchie von Textsorten sein sollten, sondern sich „orthogonal“ dazu verhalten: Textsorten können individuell mit einem oder mehreren Texttypen in Beziehung gesetzt werden, die jeweils den Passagen von Texten dieser Sorte zukommen. Damit haben wir en passant auch die Abgrenzung zum Begriff der Textfunktion vorgenommen: Letztere ist eine Eigenschaft des gesamten Textes, die sicherlich von den im Text anzutreffenden Texttypen beeinflusst, aber nur in einigen Fällen mit ihr identisch ist (etwa in rein narrativen Texten). Hinzu kommt noch, dass beispielsweise ein Text vom narrativen Typ durchaus ein persuasives Ziel verfolgen kann-- die Autorin mag lediglich ein Erlebnis schildern, es dabei aber in einer Weise darstellen, dass sie damit einen mehr oder weniger klar durchschaubaren Appell an den Leser richtet. Wir reservieren also Texttyp für die Charakterisierung der sprachlichen Oberfläche von einzelnen Passagen des Textes und Textfunktion für das (vom Leser nachvollziehbare) Ziel des Gesamttexts. Eine weitere Begründung für die Nützlichkeit dieser Auffassung vom Texttyp liefert die Frage nach einem Kriterium für Textverstehen. Wann haben wir einen Text(abschnitt) erfolgreich gelesen? Der idealtypische deskriptive Text ist verstanden, wenn wir eine mentale Repräsentation des fraglichen Objekts oder Sachverhalts aufgebaut haben. Gleiches gilt für die Exposition, bei der Objekt oder Sachverhalt häufig allerdings komplizierter sein werden. Die idealtypische Narration ist verstanden, wenn wir die Abfolge von Ereignissen in ihrem zeitlichen Zusammenhang rekonstruiert haben (was ja nicht immer trivial ist). Ähnlich 59 3.3 Texttyp besteht das Verstehenskriterium für die Instruktion darin, die Sequenz der auszuführenden Handlungen korrekt zu identifizieren. Der argumentative Text schließlich ist verstanden, wenn wir die Kernthese des Textes gefunden haben und zuordnen können, von welchen Textelementen sie argumentativ gestützt wird, direkt oder indirekt. Korpusbasierte, empirische Untersuchungen der geschilderten Konzeption des Texttyps sind bisher rar. Eine Ausnahme bildet die Arbeit von Mavridou u. a. (2015) (sowie einige weitere Veröffentlichungen dieser Autorengruppe). Hier wurden elf Texte verschiedener Sorten (Parlamentsreden, Kommentare, Prosa, Nachrichten) auf Ebene der Absätze mit Texttyp-Kategorien annotiert, die dem Ansatz von Smith (2003) folgen, den oben genannten Typen aber recht ähnlich sind: narrativ, informativ, argumentativ, berichtend, beschreibend sowie sonstige. 490 Absätze wurden bearbeitet, so dass nun beispielsweise Korrelationen zwischen den Textsorten und den Frequenzen der Texttypen der Absätze beobachtet werden können. Im Zentrum des Interesses steht in dieser Arbeit jedoch die Korrelation der Texttypen mit einem semantischen Merkmal, das von Smith (2003) situation entity ( SE ) type genannt wurde. Man kann die von Smith vorgeschlagenen SE Typen als feinkörnige Form des Satztyps und damit als eine (wiederum gar nicht sehr verschiedene) Alternative zu den von Werlich vorgeschlagenen Satz-Kategorien auffassen: ▶ Zustand (Aussagen über Eigenschaften oder perfektive Handlungen): Tim hat gute Laune. ▶ Ereignis (Aussagen über dynamische Verläufe in der Zeit): Brigitte ging am Mittag zum Schwimmen. ▶ Generalisierender Satz (Aussagen über Gewohnheiten von Individuen): Leonie fährt mit dem Fahrrad zur Schule. ▶ Generischer Satz (Aussagen über Arten): Affen mögen Bananen. ▶ Frage: Benötigt jemand ein Beispiel? ▶ Imperativ: Gib mir den Stift! Die Verteilung der SE Typen sah Smith als ein zentrales Merkmal für die Bestimmung des Texttyps zu einem Absatz und postulierte, dass narrative und beschreibende Passagen viele Sätze des SE -Typs Zustand und Ereignis enthalten; dasselbe gelte für berichtende Passagen, die aber zusätzlich auch mit generalisierenden und generischen Sätzen korrelieren. Die beiden letztgenannten SE -Typen wiederum seien Hauptmerkmale von informierenden und argumentativen Passagen. In der Studie von Mavridou u. a. (2015) wurden SE Typen und Texttypen unabhängig voneinander im Korpus annotiert, so dass im Nachhinein die Korrelation bestimmt werden kann. Es zeigte sich, dass die Vorhersagen von Smith im Wesentlichen bestätigt wurden, aber mit gelegentlichen Ausnahmen: beispielsweise korrelieren die generalisierenden und generischen Sätze im Korpus wesentlich häufiger mit den Texttypen informativ, beschreibend, und argumentativ als mit narrativ und berichtend. Aufbauend auf Erkenntnissen dieser Art ließe 60 3 Textfunktion, Textsorte und Texttyp sich nun im Prinzip (analog zur Klassifikation von Textsorten in Abschnitt 3.2.5) eine automatische Erkennung des Texttyps von Absätzen entwickeln-- was aber deutlich schwieriger sein dürfte, weil Absätze infolge ihrer Kürze sehr viel weniger Merkmale tragen, als ganze Texte es tun. Weiterführende Literatur Bei der Besprechung von Textfunktion, Textsorte und Texttyp haben wir uns hier nur auf einen Ausschnitt der in der Textlinguistik untersuchten Terminologie beschränkt, die überdies verschiedene weitere Begriffe wie Textklasse, Textmuster, Textexemplar etc. verwendet. Zu diesen Themen gibt es eine Reihe von Beiträgen im ‚Handbuch Text- und Gesprächslinguistik‘ (u. a. Heinemann, 2000). Um aber zuvor einen guten Überblick über den breiteren Rahmen der Textsortenforschung „aus einem Guß“ zu bekommen, ist das zweite Kapitel von Rehm (2007) sehr empfehlenswert. Nach Entstehen der Textlinguistik war die Forschungsliteratur gerade zu Textsorten außerordentlich reichhaltig, wie auch die kommentierte Bibliographie von Adamzik (1995) zeigt. Zum ersten Einstieg in eine quantitativ orientierte Herangehensweise an die Frage der Bestimmung von Textsorten und Register empfiehlt sich das Lehrbuch von Biber u. Conrad (2009). Als eine sehr interessante Untersuchung der sprachlichen Merkmale in unterschiedlichen Texttypen sei das Buch von Smith (2003) genannt, das deutlich jünger ist als das oben genannte Werk von Werlich (1975). Die Autorin verwendet zur Abgrenzung von den englischsprachigen Begriffen genre und register den Begriff discourse mode für das, was wir hier als Texttyp eingeführt haben. 3.4 Übungsaufgaben 1. Untersuchen Sie Ihren Kommentar und andere (Tagespresse! ) auf typische Merkmale. Lassen sich Attribute (beliebiger Art) angeben, die für diese Textsorte charakteristisch erscheinen? Woran ist ein Kommentar als Kommentar erkennbar, unabhängig von seiner Thematik? 2. Beschreiben Sie informell, wie Ihr Kommentar inhaltlich „funktioniert“. Wie erreicht er seine Wirkung? Ist der Verlauf des Arguments erkennbar? Gibt es sprachliche Phänomene, die in direktem Zusammenhang mit der Argumentation stehen? 3. Überprüfen Sie, ob sich die einzelnen (Teil-)Sätze Ihres Kommentars durch das auf Seite 54 vorgeschlagene Inventar von ‚Inhaltszonen‘ vollständig beschreiben lassen, oder ob noch weitere Zonen-Bezeichner benötigt werden. Teil II Strukturstiftende Phänomene 63 3.4 Übungsaufgaben 4 Referenzielle Struktur (4.1) Meine Katze hat ein neues Lieblingsspielzeug. Sie tobt jetzt ständig mit einem grünen Wollknäuel herum. Es ist schon ein bisschen zerfetzt. Erfüllt diese Satzfolge die in Abschnitt 2.4 genannten Textualitätskriterien? Sicherlich. Sie wirkt schon allein deshalb als Text, weil die drei Sätze von denselben zwei Objekten berichten. In der Tat wird das ‚Prinzip der Wiederaufnahme‘ oftmals als das zentrale Kriterium für Kohärenz in Texten genannt: Ein Text sei demnach eine Folge von Sätzen, in denen wiederholt über dieselben Diskursgegenstände gesprochen wird. So fasste bereits eine der Pionier-Arbeiten der Textlinguistik, (Harweg, 1968), die Verwendung von Pronomen als konstitutiv für das Objekt ‚Text‘ auf, und viele nachfolgende Autoren haben bei der Untersuchung von Texten ebenfalls die Wiederaufnahme in den Mittelpunkt ihrer Betrachtungen gerückt. Somit ist es nur naheliegend, unsere Behandlung verschiedener Ebenen der Textstruktur mit der referenziellen Ebene zu beginnen. Die Wiederaufnahme allein ist jedoch nicht hinreichend für Kohärenz. Das lässt sich durch konstruierte Beispiele illustrieren: (4.2) Auf der A10 besteht bei Leest Gefahr durch Radfahrer auf der Fahrbahn. Die Radfahrer sind überwiegend evangelisch. Leest wurde im Jahr 1268 von Kurfürst Friedrich gegründet. Viele Menschen schauen samstags von Brücken auf die A10. Auch der Samstag hat 24 Stunden. Hier bestehen zwischen den einzelnen Sätzen durchaus Beziehungen der Art, dass Aussagen über dieselben Gegenstände getroffen werden, doch ergeben diese Aussagen damit keineswegs auch einen zusammenhängenden Sinn. Wir fassen die in diesem Kapitel untersuchte, durch Wiederaufnahmen entstehende referenzielle Struktur somit als nur eine unter mehreren Strukturebenen auf, die in den Folgekapiteln durch weitere zu ergänzen sein wird. Zunächst wenden wir uns in Abschnitt 4.1 der Frage zu, welche sprachlichen Ausdrücke eigentlich ‚referenziell‘ interpretiert werden können oder müssen, wobei wir unterscheiden zwischen solchen, die neue Gegenstände in den Diskurs einführen, und denen, die bereits bekannte Gegenstände wieder aufnehmen, vor allem die sog. Anaphern. Abschnitt 4.2 untersucht dann zunächst die globalen Wechselwirkungen zwischen Referenzbeziehungen und der inhaltlichen Strukturierung des Textes. Bei den lokalen Effekten (Abschnitt 4.3) geht es hingegen um die Wahl der Form eines referenziellen Ausdrucks in einem konkreten Kontext-- die davon abhängt, ob, wann und in welcher Form auf denselben Gegenstand bereits Bezug genommen wurde. Dass wir bei der Textproduktion in der Wahl dieser Ausdrücke keineswegs frei sind, hat unter anderem die Centering Theorie (4.3.1) untersucht und dabei speziell das Wechselspiel zwischen Pronominalisierung und grammatischen Funktionen im Satz in den Blickpunkt gerückt. Dass aber in einem noch allgemeineren Sinne die Distanz (in näher zu bestimmender Form) zwischen anaphorischem Ausdruck und Bezugsausdruck eine wichtige Rolle spielt, wird von Ansätzen berücksichtigt, die eine Skala des Aktivierungsgrads von Diskursgegenständen zugrunde legen (4.3.2). Eine Möglichkeit, daraus wiederum Modelle für die Produktion (beim Schreiben) bzw. Auflösung (beim Lesen) anaphorischer 64 4 Referenzielle Struktur Bezüge zu gewinnen, besteht darin, numerische Aktivierungsfunktionen zu definieren, die den Verlauf der Aktivierung von Diskursgegenständen über den Text hinweg darstellen. Am Ende des Kapitels wenden wir uns in 4.4 dann der Erstellung und Nutzung von Textkorpora zu, die mit Referenz-Information annotiert sind. 4.1 Referenz und Koreferenz In der Sprachphilosophie und in der Semantik spielt die Frage der Referenz seit langer Zeit eine zentrale Rolle: Welche sprachlichen Ausdrücke können auf außersprachliche Gegenstände (im weitesten Sinne) verweisen, und welche sinnvollen Gruppierungen lassen sich hier vornehmen? Unstrittig ist, dass Substantive, die Gegenstände der realen Welt bezeichnen, also etwa die Teetasse auf meinem Schreibtisch oder den Kölner Dom, referenziell sind. Es sind diese einfachen Fälle, die insbesondere die „Abbild-Theorie“ der Sprache motiviert haben, nach der ein Satz der natürlichen Sprache einen Sachverhalt der realen Welt beschreibt, oder eben nicht, und über dessen Wahrheit dementsprechend geurteilt werden kann. Das Bild wird sukzessive komplizierter, wenn wir zunächst weitere Substantive betrachten, die zum Beispiel Abstrakta bezeichen (wie Interesse) oder Gegenstände, die es in der derzeitigen „realen“ Welt nicht gibt, wohl aber in der Vergangenheit (wie König Friedrich II . von Preußen), oder solche, die es nur in unserer Vorstellungswelt gibt, etwa Aschenputtel. Bilder von der Vergangenheit und Vorstellungswelten teilen die Sprecher einer Sprache zu einem gewissen Grad, aber natürlich nicht vollständig, so dass die Frage nach der Referenz schwieriger wird. Semantiker arbeiten mit dem Konstrukt „möglicher Welten“, in denen bestimmte Sachverhalte jeweils wahr oder falsch sind, und sie untersuchen dann die Zusammenhänge zwischen solchen möglichen Welten, um die Bedeutung von Sätzen möglichst präzise angeben zu können. Verlassen wir die Substantive, so kann ein Adjektiv wie blau unter einer ‚extensionalen‘ Sicht genau die Menge der blauen Gegenstände in einer (möglichen) Welt bezeichnen und damit referenziell sein-- aber für ein Adjektiv wie großartig ist die Angabe seiner ‚Extension‘ in weitaus höherem Maße subjektiv. Auch Verben können unter der Perspektive der Extensionalität als referenziell aufgefasst werden: Sie bezeichnen freilich keine Gegenstände, sondern Zustände und Ereignisse, die stattfinden, stattgefunden haben oder vielleicht stattfinden werden. Analog wäre dann die Extension von herunterfallen die Menge aller Ereignisse, in denen irgendetwas irgendwo herunterfällt, in der realen oder in möglichen Welten. Welche Wörter verbleiben dann letzten Endes als definitiv nicht referenziell? Zu diesen gehört die Mehrzahl der geschlossenen Wortklassen, also die Funktionswörter wie Konjunktionen, Artikel, Präpositionen. Für unsere Zwecke der Textanalyse können wir all diese Fragen glücklicherweise umschiffen und ein relativ klares Kriterium angeben, anhand dessen die Referenz-Frage zu entscheiden ist. Wir konzentrieren uns ja auf die „Wiederaufnahme“ von Gegenständen im Text, also auf eine Relation zwischen zwei (oder mitunter mehreren) sprachlichen Ausdrücken innerhalb eines Texts: Der eine verweist auf einen anderen, im Spiel sind also immer ein verweisender Ausdruck und zumindest ein Bezugsausdruck. Mehrere Bezugsausdrücke 65 4.1 Referenz und Koreferenz werden dann gebraucht, wenn der verweisende Ausdruck eine Menge von Gegenständen des Textes gleichzeitig wieder aufnimmt, wie in diesem Beispiel: 22 (4.3) Gestern hat [Susanne] i ihr Pausenbrot mit [Marco] j geteilt. [Die beiden] i,j verstehen sich sehr gut. Damit ein sprachlicher Ausdruck im Text aus Sicht der referenziellen Struktur relevant sein kann, muss es also möglich sein, ihn wiederaufzunehmen. Dies lässt sich, zumindest für die Nominalphrasen, durch einen Fragetest gut überprüfen: Wenn wir eine NP eines Satzes später wiederaufnehmen möchten, muss es möglich sein, an den Satz eine sinnvolle Frage anzuschließen, die genau auf diese NP als Antwort zielt. Im folgenden Beispiel zeigt die erste Frage, dass insbesondere solche Phrasen herausfallen, die idiomatisch verwendet werden. Zudem weist der Test darauf hin, dass in einer komplexen Nominalphrase auch einzelne Bestandteile wiederaufnahmefähig sein können: (4.4) Peters Bruder hat in jeder Hinsicht zum Erfolg der Mannschaft beigetragen. ▶ ? ? Worin hat Peters Bruder zum Erfolg der Mannschaft beigetragen? - In jeder Hinsicht. ▶ Wer hat zum Erfolg der Mannschaft beigetragen? -- Peters Bruder. ▶ Wessen Bruder hat zum Erfolg der Mannschaft beigetragen? -- Peters. ▶ Wozu hat Peters Bruder beigetragen? -- Zum Erfolg der Mannschaft. ▶ Zu wessen Erfolg hat Peters Bruder beigetragen? -- Zu dem der Mannschaft. Terminologisch unterscheiden wir zwischen dem anaphorischen Bezug, der im Text einen Rückwärtsverweis herstellt (z. B. 4.3), und dem weitaus selteneren kataphorischen Verweis, der seinen Bezugsausdruck im Text erst ankündigt: Bevor [sie] i die Bühne betrat, trank [die Schauspielerin] i noch ein Glas Wasser. Im anaphorischen Fall wird der Bezugsausdruck auch als Antezedens bezeichnet. Die Beziehung zwischen anaphorischem / kataphorischem Ausdruck und Bezugsausdruck nennen wir Koreferenz. Im Folgenden werden wir die Kataphorik nicht genauer untersuchen, sondern uns weitgehend auf die Anaphorik beschränken. Was also „gewinnen“ wir für die Untersuchung der Koreferenz, wenn wir uns hier auf die Text-Perspektive beschränken? Wir können viele, wenn auch nicht alle, Fragen nach dem Zusammenhang zwischen Sprache und Welt beiseite lassen. Wir klammern damit auch zunächst die Frage aus, ob Referenz nicht besser als Beziehung zwischen sprachlichen Ausdrücken und mentalen Konzepten verstanden werden sollte, die dann ihrerseits für Gegenstände der Welt stehen können (eine kognitiv orientierte Sicht würde diesen Aspekt in den Mittelpunkt rücken). Konkret müssen wir nicht für jedes Wort des Textes entscheiden, ob es referenziell zu lesen ist, sondern lediglich die verweisenden Ausdrücke identifizieren, deren Verständnis voraussetzt, dass wir einen anderen Ausdruck im Text verstanden haben, nämlich den Bezugsausdruck-- auch diesen gilt es also zu identifizieren, womit dann die Koreferenz-Bezie- 22 Hier und in den folgenden Beispielen setzen wir referenzielle Ausdrücke in eckige Klammern und markieren solche, die sich auf denselben Diskursgegenstand beziehen sollen, mit identischen Buchstaben-Indizes. 66 4 Referenzielle Struktur hung bzw. die Wiederaufnahme aufgedeckt ist. „Lediglich“ soll hier nicht suggerieren, dass dies in jedem Fall ganz einfach ist, allein im Vergleich zum allgemeinen, oben kurz skizzierten, Referenzproblem haben wir es hier durchaus leichter. Sind alle Koreferenz-Beziehungen im Text identifiziert, so fassen wir die Summe dieser Beziehungen dann als die referenzielle Struktur des Textes auf. Fragen wir jetzt nach möglichen Arten der Koreferenz, können wir uns also von den Arten anaphorischer Ausdrücke leiten lassen, die die Sprache zur Verfügung stellt. Für eine grobe Gliederung orientieren wir uns im Folgenden an Vater (1991) und ergänzen die einzelnen Bereiche um Beobachtungen zu den möglichen Anaphern und deren Bezugsausdrücken-- allerdings ohne hier eine vollständige Katalogisierung anzustreben. Vorab eine letzte terminologische Klärung: Solche anaphorischen Ausdrücke, die für sich bedeutungsleer sind, also ausschließlich die Funktion erfüllen, auf einen Bezugsausdruck zu verweisen, fassen wir unter dem Begriff Pro-Form zusammen: Es handelt sich um Pronomina und Pronominaladverbien, die für etwas anderes als sich selbst stehen. Sie sind zu unterscheiden von Ausdrücken, die zwar auch einen Diskursgegenstand wieder aufnehmen, dabei aber zusätzlich noch Information über ihn vermitteln, etwa eine subjektive Einschätzung des Sprechers, wie in Gestern vergaß ich, [meinen Kater] i zu füttern. [Das arme Tier] i war ganz verstört. Gegenstandsreferenz Mit dem Begriff Gegenstand bezeichnen wir hier sowohl „greifbare“ als auch abstrakte Objekte der „realen Welt“ oder einer Vorstellungswelt-- das Spektrum reicht also (beispielsweise) von Pferd über Glück zu Einhorn und Atlantis. Ein Gegenstand in diesem weiten Sinne kann durch seinen Eigennamen, durch eine indefinite Kennzeichung (Gegen neun betrat [ein Mann] das Lokal) oder auch durch eine definite Kennzeichnung erstmals in den Diskurs eingeführt werden. Die definite Kennzeichnung ist bei der Ersterwähnung allerdings nur eingeschränkt verwendbar, nämlich ▶ bei generischen Lesarten (Wir wissen, dass [der Wal] ein Säugetier ist), ▶ wenn der Gegenstand in der Welt „einzigartig“ ist (Wir haben [den Papst] gesehen), oder ▶ wenn der Gegenstand im situativen Kontext eindeutig identifizierbar ist, etwa wenn in einer Stadtzeitung berichtet wird: [Die Bürgermeisterin] gab ein Interview. Für die Wiederaufnahme kommt die indefinite Kennzeichnung nicht in Frage, dafür treten als eine wichtige Kategorie die verschiedenen Pronomina hinzu (Personal-, Demonstrativ-, Relativ-, Possessivpronomina). Eigennamen können wiederholt werden, oft geschieht dies allerdings in abgekürzter Form (z. B. bei Ersterwähnung Vor- und Nachname einer Person, bei Wiederaufnahme nur Nachname). Auch definite Kennzeichnungen sind natürlich möglich, wobei das Substantiv wiederholt oder stattdessen ein Synonym oder Hyperonym verwendet werden kann (die Zeitung-- das Blatt / das Druckerzeugnis). Für diese wie auch die drei folgenden Kategorien gilt, dass die Wiederaufnahme sich auf den gesamten Gegenstand beziehen kann oder, wenn der „Gegenstand“ eine Menge von Objekten bezeichnet, nur auf einen Teil davon: [Die Klasse 2b] i hatte gestern Wandertag. [Die Jungs] i haben viel gesungen. Des weiteren kann sich die Wiederaufnahme auf einen Teilge- 67 4.1 Referenz und Koreferenz genstand oder einen bestimmten Aspekt desselben beziehen; oder die Verbindung zwischen den beiden referenziellen Ausdrücken kann noch lockerer sein. Die folgenden Beispiele illustrieren das Spektrum: (4.5) a Ich habe mir mal wieder [einen neuen Computer] i gekauft. [Die Maus] i ist kabellos. b Ich habe mir mal wieder [einen neuen Computer] i gekauft. [Die Prozessorgeschwindigkeit] i haut mich wirklich um. c Ich habe mir mal wieder [einen neuen Computer] i gekauft. Man muss [diese freundliche Herstellerfirma] i ja gelegentlich unterstützen. Phänomene dieser Art werden oft als ‚indirekte Wiederaufnahme‘, in der englischsprachigen Literatur (und oft entlehnt auch in der deutschsprachigen) als ‚bridging anaphora‘ bezeichnet. Vielfach liegen die Relationen Objekt-- Teilobjekt (Meronymie, vgl. 4.5[a]), Menge-- Teilmenge oder Objekt-- Attribut (4.5[b]) zugrunde, doch ist der Spielraum groß und in Grenzfällen ist die Entscheidung, ob eine definite Kennzeichnung einen bereits eingeführten Gegenstand indirekt wieder aufnimmt oder ob ein neuer Gegenstand eingeführt wird, schwierig. Verschiedene Arten der indirekten Wiederaufnahme wurden bereits von Harweg (1968) unterschieden, zu den häufigsten zählen der logisch-begriffliche Zusammenhang wie bei Anfang- - Ende oder öffnen- - schließen; der ontologische, naturgesetzliche Zusammenhang wie bei Blitz-- Donner oder Vater-- Mutter; und der kulturell geprägte Zusammenhang wie bei Universität-- Rektor oder Nation-- Flagge. Eine weitere Komplikation betrifft den Umfang der angenommenen Bezugseinheit. Insbesondere wenn präzise Richtlinien für die Annotation von Daten erstellt werden sollen (siehe Abschnitt 4.4), muss man sich festlegen, ob man (die in unseren Beispielen mit [ ] markierten) Bezugseinheiten möglichst eng oder weit wählen möchte. Im folgenden Beispiel wird also eine Konvention benötigt, ob Er sich allein auf das Substantiv Kater bezieht, ob man das Adjektiv hinzunimmt, oder auch den indefiniten Artikel, oder auch die Präpositionalphrase, oder zudem den Relativsatz. Dies ist keine Frage der richtigen oder falschen Entscheidung, aber es muss festgelegt und bei der Daten-Annotation einheitlich gehandhabt werden. (4.6) Auf der Straße begegnete ich einem grauen Kater mit weißen Ohren, die lustig in verschiedene Richtungen zeigten. Er lief leider schnell weg. Die Gegenstandsreferenz steht im Mittelpunkt der folgenden Abschnitte, doch zuvor seien drei andere Arten kurz erwähnt. Ereignisreferenz Neben Gegenständen sind es vor allem Ereignisse, die in Texten durch anaphorische Verweise wieder aufgenommen werden können. Die Verweise können verblose, elliptische Sätze sein, in denen die Anapher also nicht lexikalisch realisiert ist: (4.7) Ich habe mal wieder einen neuen Computer gekauft. Und meine Frau eine neue Stereo- Anlage. 68 4 Referenzielle Struktur Hier ist die Ermittlung des Antezedens entsprechend unproblematisch. Die Elision kann neben dem Verb auch weitere Mitspieler umfassen, etwa wenn im zweiten Satz des Beispiels meine durch meiner ersetzt wird, womit die Frau zum grammatischen indirekten Objekt und das Subjekt nun auch durch eine „leere“ Anapher dargestellt ist. Die Bezugsobjekte sind oftmals, wie hier im Beispiel, Sätze mit finitem Verb, können aber auch infinite Sätze oder Nominalphrasen sein, die ein Ereignis ausdrücken. In diesem Fall sind als Anaphern dann auch Personalpronomen möglich: (4.8) Zum Glück fand [der Kauf des Computers] i am Sonnabend statt. [Er] i dauerte nur eine halbe Stunde. An der Stelle des Personalpronomens kann ebenso ein Demonstrativpronomen stehen: Dies dauerte nur eine halbe Stunde. In diesem Fall allerdings kann die Bestimmung des Antezedens erheblich schwieriger werden, da sich ein solches Pronomen nicht nur auf einen Verbalkomplex, sondern auf mehrere Sätze oder gar ganze Textabschnitte beziehen kann. Es kann dann durchaus eine Frage der subjektiven Interpretation sein, welchen Umfang das referenzierte Textmaterial hat, wenn in einem Text etwa der Satz auftritt Das gefällt mir nicht. Wie oben bereits erwähnt, lassen sich die verschiedenen Formen des ‚bridging‘ natürlich auch mit Ereignisreferenzen vornehmen: (4.9) Ich habe mir mal wieder, in einem Anfall von Leichtsinn, einen neuen Computer gekauft. [Das Bankkonto] ? ist jetzt ganz schön leer. Wir verstehen gut, welches Bankkonto hier gemeint ist, es darf also problemlos mit definitem Artikel bezeichnet sein. Was aber ist das Bezugsobjekt im Text? Es könnte ich sein, als vermutlicher Inhaber des Kontos, aber auch das Kaufereignis, von dem wir über das Konzept des Bezahlens die Brücke zum Konto assoziieren. Aber zählt dann auch der auslösende Leichtsinnsanfall noch zum Bezugsobjekt? Fälle wie dieser verdeutlichen das Problem, das entsteht, wenn Referenz auf relativ komplexe Sachverhalte an den Elementen des Textes genau festgemacht werden soll: Es ist für viele der oben genannten Demonstrativpronomina oder für bridging-Anaphern oft schwierig, ganz exakt dasjenige sprachliche Material zu benennen, das als Antezedens fungiert. Der Grund ist, dass die Diskursgegenstände vielfach abstrakte Objekte sind, die wir beim Lesen aus unterschiedlichen Teilen des Textes zusammensetzen-- es sind Objekte, die zeitweilig in unserer mentalen Repräsentation des Textes eine Rolle spielen, die aufgrund ihrer komplexen Konstruktionsbedingungen aber nur indirekt an der Sprachoberfläche festgemacht werden können. In solchen Fällen müssen wir im Auge behalten, dass eine Annotation von Anaphern und Bezugsausdrücken an der Sprachoberfläche des Textes nur eine „Idealisierung“, eine Annäherung an das gemeinte abstrakte Objekt, sein kann. Ortsreferenz Mit Adverbialen wie hier, dort können Ortsangaben aus dem Text wieder aufgenommen werden und mit den abgeleiteten hierhin, dorthin entsprechend die Zielorte einer Bewegung. 69 4.1 Referenz und Koreferenz Zeitreferenz Ähnlich nehmen Adverbiale wie dann, später Bezug auf zuvor genannte Zeitpunkte, oder auf Ereignisse und stellen zu diesen eine temporale Relation her. Von den genannten Kategorien genießt die Gegenstandsreferenz mit Abstand die größte Aufmerksamkeit. In der Linguistik dürfte der Hauptgrund darin bestehen, dass bei satzinternen anaphorischen Relationen auch syntaktische Kriterien zum Zuge kommen. In der Computerlinguistik spielen die ‚Gegenstände‘ aus Anwendungssicht die zentrale Rolle, weil für jede Art der Informationsextraktion von Interesse ist, wer oder was die Beteiligten an einem ausgedrückten Sachverhalt sind. In der folgenden Box fassen wir die wichtigsten der bisher eingeführten Begriffe noch einmal zusammen. Referenz: Wichtige Begriffe ▶ Diskursgegenstand: Ein ‚Objekt‘ (im weitesten Sinne), auf das man sich mit einem sprachlichen Ausdruck beziehen kann. ▶ Referenzieller Ausdruck: Ein sprachlicher Ausdruck, mit dem eine Sprecherin einen Bezug auf einen Diskursgegenstand herstellt. ▶ Referenz: Die Beziehung zwischen referenziellem Ausdruck und Diskursgegenstand. ▶ Koreferenz (auch ‚Wiederaufnahme‘): Die Beziehung zwischen zwei referenziellen Ausdrücken, die sich in einem Text auf denselben Diskursgegenstand beziehen. ▶ Anapher: Ein referenzieller Ausdruck, der nicht aus sich selbst heraus verständlich ist, sondern nur indirekt (auf dem Umweg über einen im Text voranstehenden referenziellen Ausdruck) einen Diskursgegenstand bezeichnet. (Vorwiegend Pronomina, aber auch bestimmte definite Nominalphrasen.) ▶ Antezedens: Der referenzielle Ausdruck, auf den eine Anapher verweist. ▶ Indirekte Wiederaufnahme (auch ‚bridging‘): Wiederaufnahme, die nicht auf Koreferenz (also identischem Diskursgegenstand) beruht, sondern auf einer lexikalischen Relation zwischen den referenziellen Ausdrücken (wie Hyperonymie, Meronymie) oder zwischen einem anderen semantischen Zusammenhang zwischen den beiden Diskursgegenständen. Die Relation der Koreferenz und die Anaphorizität gehen oft miteinander einher, sind gemäß der obigen Charakterisierung aber im Prinzip unabhängig. In Beispiel 4.10 liegt zwischen den geklammerten Ausdrücken ein anaphorischer Bezug ohne Koreferenz vor, denn es handelt sich nur um indirekte Wiederaufnahme. in Beispiel 4.11 ist es umgekehrt: Die Ausdrücke sind koreferent, aber es gibt keine Anapher. 70 4 Referenzielle Struktur (4.10) [Die Universität Potsdam] hat umfangreiche Neubaupläne vorgestellt. [Der Präsident] stellte sie in einer Pressekonferenz vor. (4.11) [Marta Schmidt] gewann den diesjährigen Literaturpreis. Verschiedene Autoren hatten ihn zweimal gewonnen, doch [Marta Schmidt] ist die bisher einzige drittmalige Preisträgerin. 4.2 Referenzielle Ketten: Globale Effekte Der erste Schritt der Referenzanalyse besteht darin, die koreferenten Ausdrücke zu identifizieren und jeweils einer gemeinsamen Klasse zuzuordnen. Für den Beispieltext in Abb. 4.1 ist dies durch eckige Klammern und Indizes markiert, die jeweils ein Kürzel für den zugrunde liegenden Gegenstand bilden. Zu beachten ist, dass der gesamte erste Teilsatz von Der Sudan bis gegeben ebenfalls einen Diskursgegenstand darstellt, da später mit der definiten NP die Grundsatzeinigung darauf Bezug genommen wird (Ereignisanapher). Außerdem gibt es zwei Fälle geschachtelter Bezugsausdrücke, weil auf Bestandteile einer komplexen NP Bezug genommen wird; diese Möglichkeit hatten wir oben in Beispiel 4.4 bereits illustriert. Im zweiten Schritt sind auf dieser Grundlage die Relationen zwischen Anapher und Antezedens festzulegen. Dabei haben wir die Wahl, als Antezedens durchgängig die Ersterwähnung des Diskursgegenstands zu verwenden (als Repräsentanten der Äquivalenzklasse), oder aber seine jeweils letzte Erwähnung. Letzteres ist für die Untersuchung der Textstruktur praktischer, da wir dann nicht nur die Information erhalten, wie oft ein Gegenstand erwähnt wurde, sondern auch unmittelbar die Abstände zwischen den einzelnen Erwähnungen sowie die Form der letzten Erwähnung ablesen können-- beides hat Einfluss auf die Form des jeweils aktuell gewählten referenziellen Ausdrucks und ist ein wichtiger Untersuchungsgegenstand, wie wir im nächsten Abschnitt sehen werden. Internationaler Einsatz in Darfur scheint möglich ADDIS ABEBA - [Der [Sudan] Sud hat [ UN ] UN -Generalsekretär [Kofi Annan] KA zu Folge erstmals grünes Licht für den [Einsatz] Ein von [[UN] UN -Truppen] Tru in der [[Bürgerkriegsprovinz] Bk Darfur] Sud,Dar gegeben] GE , streitet aber über [dessen] Ein Ausmaß. [Annan] KA erreichte offenbar bei einem Krisentreffen in Addis Abeba die [Grundsatzeinigung] GE . Allerdings machte die [Führung] Sud,SF in [Khartum] Sud,Kha klar, dass [sie] SF unter anderem bei der Stärke der [Truppe] Tru andere Vorstellungen als die [ UN ] UN hat, sowie bei der Frage, wer den [Einsatz] Ein führt. Der seit drei Jahren andauernde [Bürgerkrieg] Bk , bei [dem] Bk nach [ UN ] UN -Angaben mehr als 200 000 Menschen starben und [der] Bk Auswirkungen auf die Nachbarländer [Tschad] Tsch und Zentralafrikanische Republik hat, führte am Freitag dazu, dass der [Tschad] Tsch die Generalmobilmachung anordnete. Derzeit sind [7000 Mann] 7M der Afrikanischen Union in [Darfur] Dar im Einsatz, [deren] 7M Mandat Ende des Jahres ausläuft. (Potsdamer Neueste Nachrichten, 18. 11. 06) Abbildung 4.1: Beispieltext Darfur 71 4.2 Referenzielle Ketten: Globale Effekte Abbildung 4.2: Referenzielle Kette Sudan für den Beispieltext Darfur Folgen wir diesem Prinzip, ergibt sich für jeden Diskursgegenstand eine referenzielle Kette. 23 In Diagrammform notiert sie jedes Auftreten des Gegenstands in Gestalt des jeweiligen referenziellen Ausdrucks und verknüpft ihn durch einen Pfeil mit seinem „Vorgänger“ im Text. Die Art der Verknüpfung ist dabei nicht immer dieselbe; verschiedene Varianten wie Mengen- und Teilmengenbildung oder die indirekte Wiederaufnahme haben wir im vorigen Abschnitt genannt. Wenn wir eine Menge möglicher Verknüpfungsrelationen definieren, können wir jeden Pfeil in der referenziellen Kette mit einer solchen Relation bezeichnen. Da ‚Identität‘ in der Regel die häufigste Relation ist, kann diese Bezeichnung der Übersichtlichkeit halber weggelassen werden, der Pfeil also unbeschriftet bleiben. Falls aus einem Diskursgegenstand weitere abgeleitet werden (durch indirekte Wiederaufnahme), können dafür jeweils separate Ketten erstellt oder aber ein zusammenfassender Graph gezeichnet werden, in dem der „Wurzel“-Gegenstand dann nur einmal vorkommt. Für den Beispieltext Darfur aus Bild 4.1 gibt Abbildung 4.2 den Graph an, der sich für Sudan aus den dort verzeichneten Koreferenz-Indizes ergibt. Das Land wird nur einmal zu Textbeginn erwähnt, doch seine Provinz Darfur tritt anschließend zweimal auf (Relation ‚Meronymie‘), ebenso die Führung des Landes; hier ist die Relation ‚indirekt‘, im Bild als ‚ind‘ abgekürzt. Auch die Hauptstadt wird später genannt; ob sie wirklich ein Fall von indirekter Wiederaufnahme von Sudan ist oder aber einen neuen Gegenstand einführt, könnte diskutiert werden; für die Wiederaufnahme-Relation spricht, dass ein Nachrichtentext vermutlich nicht Karthum als Ersterwähnung der sudanesischen Hauptstadt verwenden würde, da deren Name vielen deutschen Lesern nicht geläufig sein dürfte. Im vorliegenden Text kann der Name ohne weitere Beschreibung verwendet werden, da unmittelbar zuvor bereits vom Sudan und seiner Führung die Rede war. Für die meisten Texte dürfte das Bild einer Menge einzelner „Ketten“ (im Sinne des einfachen Aufeinanderfolgens von referenziellen Ausdrücken) zur Beschreibung der referenziellen Struktur nicht ausreichend sein. Abbildung 4.2 illustriert eine der möglichen Komplikationen (verschiedene Ketten mit gemeinsamer Wurzel). Weitere ergeben sich durch die Bildung von Mengen und Teilmengen der Diskursgegenstände. Betrachten wir eine mögliche Fortsetzung des bereits genannten Pausenbrot-Beispiels: (4.12) Gestern hat Susanne ihr Pausenbrot mit Marco geteilt. Die beiden verstehen sich sehr gut. Susanne besucht ihn oft, und die beiden musizieren dann. 23 Unsere Darstellung der Ketten orientiert sich an der von Martin (1992), Abschnitt 3.5. 72 4 Referenzielle Struktur Die zweite Erwähnung von Susanne hat als unmittelbaren Vorgänger nicht etwa ihre Ersterwähnung, sondern den Ausdruck die beiden im zweiten Satz. Gleiches gilt für Marco, und am Ende wird dann wiederum auf beide gleichzeitig referiert. Unter Verwendung der Relationen menge und teilmenge ergibt sich die in Bild 4.3 gezeigte Struktur. Das Beispiel illustriert das Problem, dass man für die Kette einerseits die „logische“ Letzterwähnung wählen kann, oder die linguistische: Das Pronomen ihn bezeichnet ja lediglich Marco und kongruiert hinsichtlich Numerus und Genus auch mit diesem Bezeichner. Um auch die Zuordnung der individuellen Diskursgegenstände zu ermöglichen, sind im Bild für Susanne und ihn jeweils beide Antezedenten angegeben. Abbildung 4.3: Referenzielle Kette Pausenbrot für Beispiel 4.12 Eine andere Facette der Problematik, Koreferenz entweder an der sprachlichen Bezeichnung oder aber an der logischen Identität der Gegenstände festzumachen, illustriert die folgende Abwandlung eines Beispiels von Martin (1992): (4.13) Mathias suchte seinen Frosch. Schließlich fand er auch einen. Aber er war sich nicht sicher, ob das Tierchen nun wirklich sein Frosch war. Wollen wir uns an logischer Referenzidentität orientieren, müssten wir uns im Graph entscheiden, ob einen (Satz 2) identisch mit seinem Frosch (Satz 1) ist; abhängig von dieser Entscheidung ist dann sein Frosch im dritten Satz anzuknüpfen, während das Tierchen in jedem Fall auf einen verweist. In unseren Beispielen scheint es überflüssig zu sein, jeweils die Pfeilrichtung anzugeben, da sie stets von rechts nach links verläuft. Die Pfeilrichtung kann jedoch genutzt werden, um anaphorische von kataphorischen Verweisen zu unterscheiden: Tritt die Pro-Form vor dem Bezugsausdruck auf, so zeigt der Pfeil in der entsprechenden referenziellen Kette von links nach rechts. Fasst man alle referenziellen Ketten bzw. Graphen eines Textes zusammen, so resultiert eine recht gut lesbare Darstellungsform der referenziellen Textstruktur. Eine Information, die dabei aber verloren geht, ist die absolute Position der einzelnen referenziellen Ausdrücke im Text. Wenn wir diese berücksichtigen, gibt die referenzielle Struktur Auskunft darüber, an welchen Stellen des Textes in welchen Formen über welche Diskursgegenstände gesprochen wird. Es lässt sich ablesen, welche Gegenstände im gesamten Text immer wieder aufgegriffen werden und welche nur in begrenzten Abschnitten auftreten. Dies wiederum lässt Rück- 73 4.2 Referenzielle Ketten: Globale Effekte schlüsse auf die thematische Gliederung des Textes zu: Die Positionen, an denen referenzielle Ketten beginnen und andere enden, können auf eine Themenverschiebung im Text hindeuten. Bei kurzen Texten ist dies naturgemäß weniger augenfällig als bei längeren, doch lässt sich die Idee auch beim Darfur-Text aus Abb. 4.1 nachvollziehen. Als Darstellungsform wählen wir hier eine Matrix, in der eine Spalte jeweils drei aufeinanderfolgende Wörter des Textes und eine Zeile einen Diskursgegenstand repräsentiert- - siehe Abbildung 4.4 24 . Wir füllen ein Kästchen der Matrix schwarz aus, wenn der der Zeile entsprechende Diskursgegenstand innerhalb der der Spalte entsprechenden drei Wörter durch einen referenziellen Ausdruck bezeichnet wird. Zwischen der erstmaligen und der letztmaligen Erwähnung färben wir die Kästchen der Zeile grau, um anzuzeigen, dass der Gegenstand im Text „aktuell“ ist (eine Verfeinerung dieser Idee wird unten in Abschnitt 4.3.2 eingeführt). Ebenso führen indirekte Wiederaufnahmen zur Graufärbung: Sudan bleibt auch nach der einzigen expliziten Erwähnung „grau“, weil der Gegenstand (wie auch in Abb. 4.2 dargestellt) durch Führung, Khartum, Darfur jeweils indirekt wieder aufgenommen wird. Die Matrix zeigt einerseits, dass Darfur und die UN durchgängig eine Rolle spielen, und deutet andererseits eine gewisse Teilung des Textes etwa im Verhältnis ⅔ zu ⅓ an. Dies entspricht in der Tat der thematischen Gliederung, denn der erste Teil des Textes berichtet über das aktuelle Ereignis, während das letzte Drittel Hintergrundinformation über den schon lange andauernden Konflikt liefert. Tagesaktuelle Gegenstände verschwinden deshalb, während die Nachbarländer und deren Armeen neu ins Spiel kommen. Abbildung 4.4: Referenz-Matrix zum Beispieltext Darfur In längeren Texten kann also die referenzielle Struktur Hinweise auf die zentralen, durchgehend behandelten Gegenstände liefern (in einer Kurzgeschichte z. B. kann die zentrale Protagonistin am häufigsten und nahezu im gesamten Text „aktuell“ sein) und daneben die Gliederung in inhaltliche Abschnitte anzeigen. Konzeptionen wie die „Hauptversus Nebenstruktur“ von Texten, denen wir uns im nächsten Kapitel zuwenden werden, lassen sich durch die Analyse der referenziellen Struktur recht genau erkennen, worauf auch bereits Figge (1971) verwiesen hat. 24 Die Ereigniskoreferenz zwischen Grundsatzeinigung und Satz 1 ist hier nicht berücksichtigt. 74 4 Referenzielle Struktur 4.3 Koreferenz: Lokale Effekte Im letzten Abschnitt haben wir uns dafür interessiert, wie häufig im Text auf bestimmte Gegenstände Bezug genommen wird, und daraus Schlüsse für die Strukturierung des Gesamttextes gezogen. Ebenso interessant ist es nun, die Form der referenziellen Ausdrücke genauer zu untersuchen, die ja nicht völlig beliebig ist, sondern bestimmten Regeln folgt-- welche aber freilich immer noch großen Spielraum für die stilistische Wahl zwischen Alternativen lassen. Es ergeben sich daraus Erkenntnisse zu eher lokalen Phänomenen der Bestimmung referenzieller Ausdrücke. Um uns dies zu verdeutlichen, nehmen wir vorübergehend einmal die Perspektive der Textproduktion ein. Als Textproduzenten wissen wir, über welche Dinge wir schreiben wollen und was wir über sie sagen wollen; wir ordnen das Material und bringen es in eine geeignete Reihenfolge (Linearisierung), die zu einem insgesamt kohärenten Text führt. Eine wichtige Produktionsentscheidung ist dann jeweils die Auswahl eines sprachlichen Ausdrucks, um einen Diskursgegenstand zu bezeichnen-- dies müssen wir dergestalt tun, dass unsere Leser den intendierten Gegenstand mit möglichst geringem Aufwand identifizieren können, was unter anderem bedeutet, dass eine Verwechslung mit „ähnlichen“ Gegenständen möglichst ausgeschlossen sein soll. Darüber hinaus wollen wir womöglich nicht allein referieren, sondern (durch definite Kennzeichnungen) auch weitere Informationen über den Gegenstand kommunizieren. Und schließlich gibt es stilistische Gepflogenheiten, die es zu beachten gilt. Etwa: Wenn in einer Kurzgeschichte eine Person namens Sabine häufig auftritt und sie die einzige Sabine, mithin unverwechselbar ist, so wird sie dennoch höchstwahrscheinlich nicht durchgehend als Sabine bezeichnet, sondern die Autorin wird sich verschiedener Varianten bedienen. Wann also ist welcher referenzielle Ausdruck, auszuwählen aus dem in Abschnitt 4.1 genannten Inventar, richtig oder angemessen? 4.3.1 Aufmerksamkeitsfokus und Centering Die Centering-Theorie (Grosz u. a., 1995) entstand in den 1980er Jahren als Modell für die lokale Kohärenz zwischen Sätzen. Diese wurde vor allem als gelungene Wahl von referenziellen Ausdrücken und ihrer syntaktischen Einbettung (einschließlich der Konstituentenfolge) verstanden. Die zugrunde liegende These ist, dass Texte leichter zu verstehen sind, wenn es zu jedem Zeitpunkt einen klar identifizierbaren „zentralen“ Diskursgegenstand gibt, auf den sich die Aufmerksamkeit der Leserin richten kann, und mit dem die übrigen Gegenstände jeweils verbunden sind. Die Autorin sollte in jedem Satz des Textes die Realisierungsformen der referenziellen Ausdrücke und die syntaktische Struktur so wählen, dass der Leserin die Identifikation des zentalen Gegenstands möglichst leicht gemacht wird. Denn Eigennamen, definite Kennzeichnungen und Pronomen signalisieren ganz unterschiedliche Gewichtungen der Diskursgegenstände in unserer Aufmerksamkeit und müssen daher so gewählt werden, dass der Leser jeweils auf das intendierte Zentrum des Diskurses orientiert wird. 75 4.3 Koreferenz: Lokale Effekte Psycholinguistische Experimente, die die These vom Zentrum stützen, wurden etwa von Hudson u. a. (1986) vorgestellt. Durch Messung von Lesezeiten stellten sie fest, dass Texte am schnellsten verstanden werden können, wenn im aktuellen Satz der jeweils zentrale Diskursgegenstand durch ein Pronomen realisiert ist; zudem bestätigten sie die seit längerem bekannte Hypothese, dass (insbesondere für das Englische) die Subjektposition im Satz für die Steuerung des Aufmerksamkeits-Fokus eine besonders wichtige Rolle spielt. Soll die Aufmerksamkeit auf einen neuen Diskursgegenstand übergeleitet werden, so seien dafür volle Nominalphrasen, auch in Subjektposition, ein wesentlich geeigneteres Mittel als Pronomen. Wenn ein kurzer Text sich vor allem mit einem einzelnen Diskursgegenstand beschäftigt, so wird dieser kontinuierlich im Zentrum stehen, und die Wahl der genannten linguistischen Mittel ist vor allem eine Frage der Abwechslung, also des Stils. Im Normalfall aber bewegt sich ein Text über mehrere Themen und Sub-Themen, und dann wird es wichtig, die jeweilige Verschiebung des Zentrums für die Leser geeignet anzuzeigen. Wir verdeutlichen uns dies an einer konstruierten Variation des Anfangs des Darfur-Beispieltexts aus Abb. 4.1: (4.14) (1) UN -Generalsekretär Annan berichtete, dass die Sudanesische Regierung einem UN -Truppeneinsatz in Darfur zugestimmt hat. (2) Die Regierung streitet ihm zufolge aber noch über das Ausmaß des Einsatzes. (3) Das Zugeständnis machte die Regierung bei einem Krisentreffen in Addis Abeba. (4) Er teilte mit, dass sie vor allem hinsichtlich der Truppenstärke andere Auffassungen hat als die UN . Die Informationen, die hier vermittelt werden, sind im Wesentlichen die gleichen, die der Anfang des Originaltexts mitteilt. Doch ist die Lesbarkeit der Variation merklich schlechter; die vier Sätze folgen zwar „logisch“ aufeinander, aber sie sind nicht „flüssig“ formuliert. Genauer besehen liegt das Problem darin, dass Text 4.14 sich nicht recht entscheiden mag, um welchen Protagonisten es eigentlich geht-- der Text schwankt hin und her zwischen der Sudanesischen Regierung und dem Generalsekretär Annan. Beide spielen kontinuierlich eine Rolle, doch keiner von beiden steht anhaltend im Zentrum der Aufmerksamkeit. Mit kleinen Umformungen lässt sich dies jedoch verbessern: (4.15) (1) Die Sudanesische Regierung hat laut UN -Generalsekretär Annan einem UN - Truppeneinsatz in Darfur zugestimmt. (2) Sie streite aber noch über das Ausmaß des Einsatzes, wie er berichtete. (3) Die Regierung machte das Zugeständnis bei einem Krisentreffen in Addis Abeba. (4) Annan teilte mit, dass sie vor allem hinsichtlich der Truppenstärke andere Auffassungen hat als die UN . In der ersten Variante wird zunächst Annan in den Vordergrund gestellt, während der Anfang des zweiten Texts bereits die Sudanesische Regierung ins Zentrum der Aufmerksamkeit rückt. Im letzten Satz ist jeweils Generalsekretär Annan das handelnde Subjekt; wichtig ist, wie häufig gewechselt wird, und wie sich dann auch in Satz 4 der Unterschied zwischen Pronomen und Eigennamen im Lichte der vorangehenden Sätze darstellt. An dieser Stelle verdeutlichen wir uns noch einmal den Zusammenhang zwischen Kohäsion und Kohärenz: Sowohl 4.14 als auch 4.15 sind kohäsiv, sie setzen in ganz ähnlicher Weise 76 4 Referenzielle Struktur kohäsionsstiftende Mittel ein, wie wir sie in Kapitel 2 kennengelernt haben. In 4.15 führt dieser Einsatz jedoch zu einem besseren Ergebnis: Beim Übergang von Satz zu Satz erschließt sich der inhaltliche Zusammenhang leichter, die lokale Kohärenz ist verbessert. Wir sehen, dass kohäsive Mittel nicht per se den Text verbessern, sondern auch mit Bedacht eingesetzt werden müssen. Für die Centering-Theorie 25 sind die beiden entscheidenden Gestaltungsfaktoren die Zuordnung der Diskursgegenstände zu den grammatischen Funktionen des Satzes und die Pronominalisierung. Sie beeinflussen die lokale Kohärenz, die in diesem Modell durch die Verbindungen zwischen den Diskursgegenständen eines Satzes und denen der benachbarten Sätze dargestellt ist. Zur Bezeichnung der Sätze verwenden wir S n für den n-ten Satz des Textes und entsprechend S n-1 und S n+1 für dessen Vorgänger und Nachfolger. Die über die Sätze verbundenen Diskursgegenstände werden centers genannt, von denen es die folgenden drei Ausprägungen gibt: Centering Theorie: Modellierte Diskursgegenstände ▶ Die Liste der forward-looking centers des Satzes S n , abgekürzt C f (S n ), ist die partiell geordnete Menge der in S n vorkommenden Diskursgegenstände, wobei die Ordnung durch die grammatischen Funktionen gegeben ist. An der Spitze steht das Subjekt, gefolgt vom direkten Objekt, gefolgt von anderen (indirektes Objekt, sonstige). Die Ordnung ist damit nur partiell, denn die „anderen“ sind untereinander nicht geordnet. ▶ Das preferred center des Satzes S n , abgekürzt C p (S n ), ist derjenige Diskursgegenstand, der an der Spitze der Liste der forward-looking centers steht. ▶ Das backward-looking center des Satzes S n , abgekürzt C b (S n ), ist der ranghöchste Diskursgegenstand des vorangehenden Satzes (also von den C f (S n-1 )), der auch im aktuellen Satz S n realisiert ist. Die C f sind somit für die mögliche Anbindung des Satzes an seinen Folgesatz zuständig, während das C b die Verknüpfung zum Vorgänger darstellt-- dies repräsentiert die eingangs genannte These, dass es eben stets genau einen „zentralen“ Diskursgegenstand geben soll, der sich im Laufe des Textes verschieben kann. Wir verdeutlichen uns die Zuordnungen an den kurzen Beispieltexten 4.14 und 4.15. C f bildet eine geordnete Liste, die jedoch an einigen Positionen auch ungeordnete Elemente enthalten kann (wegen des gleichen Ranges von indirektem Objekt und Adverbialen); diese notieren wir in runden Klammern. 25 Wir stellen hier im Wesentlichen die Form der Theorie nach Grosz u. a. (1995) dar. Das bedingt auch einen vereinfachten Umgang mit eingebetteten Sätzen, die wir hier nicht vom Matrixsatz getrennt analysieren. Zu vorgeschlagenen Erweiterungen und Variationen finden sich Literaturhinweise am Ende des Kapitels. 77 4.3 Koreferenz: Lokale Effekte ▶ Center-Zuweisungen für (4.14): Satz 1 C f : Annan-- (Sud.Reg. / Truppeneinsatz) C p : Annan / C b = ∅ Satz 2 C f : Sud.Reg.-- (Annan / Einsatz-Ausmaß) C p : Sud.Reg. / C b = Annan Satz 3 C f : Sud.Reg.-- Zugeständnis-- (Krisengespräch / Addis Abeba) C p : Sud.Reg. / C b = Sud.Reg. Satz 4 C f : Annan-- (Sud.Reg. / Truppeneinsatz / UN ) C p : Annan / C b = Sud.Reg. ▶ Center-Zuweisungen für (4.15): Satz 1 C f : Sud.Reg.-- Truppeneinsatz-- Annan C p : Sud.Reg. / C b = ∅ Satz 2 C f : Sud.Reg.-- (Einsatz-Ausmaß / Annan) C p : Sud.Reg. / C b = Sud.Reg. Satz 3 C f : Sud.Reg.-- Zugeständnis-- (Krisengespräch / Addis Abeba) C p : Sud.Reg. / C b = Sud.Reg. Satz 4 C f : Annan-- (Sud.Reg. / Truppeneinsatz / UN ) C p : Annan / C b = Sud.Reg. C b (S n ) = C b (S n-1 ) C b (S n ) ≠ C b (S n-1 ) C b (S n ) = C p (S n ) CONTINUE SMOOTH SHIFT C b (S n ) ≠ C p (S n ) RETAIN ROUGH SHIFT Abbildung 4.5: Center-Übergänge nach Brennan u. a. (1987) In den Blickpunkt rückt nun die Art und Weise, in der sich das center von einem Satz zum nächsten entwickelt. Nach Brennan u. a. (1987) gibt es dafür vier Möglichkeiten, die in Abb. 4.5 dargestellt sind. Der Übergang zwischen zwei Sätzen hängt einerseits davon ab, ob das backward-looking center identisch bleibt oder nicht (die beiden Spalten der Tabelle), und andererseits davon, ob im aktuellen Satz das backward-looking center gleich dem preferred center ist oder nicht (die beiden Zeilen). Welche Arten von Übergängen in einem Text vorliegen, sei nun entscheidend für dessen lokale Kohärenz; Brennan u. a. legen dafür die folgende Präferenz-Hierarchie fest: 78 4 Referenzielle Struktur Centering Theorie: Hierarchie der Übergänge Rangfolge nach Brennan u. a. (1987): CONTINUE > RETAIN > SMOOTH SHIFT > ROUGH SHIFT Wir können nun die Benennung der Übergänge für unsere Beispieltexte vornehmen. Zwischen Satz 1 und Satz 2 lässt sich der Übergang nur unvollständig berechnen, weil Satz 1 naturgemäß noch kein backward-looking center besitzt. Legen wir aber einen Wechsel des C b zugrunde, erhalten wir gemäß der oben dargestellten center-Übergänge für Text 4.14 einen ROUGH SHIFT und für 4.15 einen SMOOTH SHIFT . Zwischen den Sätzen 2 und 3 ergibt sich für Text 4.14 ein SMOOTH SHIFT und für 4.15 ein CONTINUE . Zwischen den Sätzen drei und vier besteht in beiden Beispieltexten ein RETAIN . Da in der Präferenz-Hierarchie einerseits SMOOTH SHIFT vor ROUGH SHIFT und andererseits CONTINUE deutlich vor SMOOTH SHIFT rangiert, hätte die Centering Theorie in der hier geschilderten Form den intuitiv erkennbaren Unterschied zwischen den beiden Beispieltexten also in der Tat erklärt. Dabei ist aber zu beachten, dass der Unterschied zwischen den dritten Sätzen der Beispieltexte (Topikalisierung versus Standard-Wortstellung) auf die Center-Berechnung keinen Einfluss hat; entscheidend dafür sind ja (in der oben vorgestellten Version) allein die grammatischen Funktionen. Spätere Arbeiten haben den Zusammenhang zwischen Centering und Wortstellung beleuchtet; gerade für das Deutsche ist dies relevant, weil die Bindung zwischen grammatischem Subjekt und satzinitialer Position lockerer ist als im Englischen. 26 Das zweite wesentliche Anliegen von Centering besteht wie gesagt darin, Vorhersagen zur Pronominalisierung zu machen. Dazu formulierten Grosz u. a. (1995) die Regel: Centering Theorie: Pronominalisierung Pronominalisierungsregel nach Grosz u. a. (1995): Wenn ein Element aus C f (S n ) in S n+1 als Pronomen realisiert ist, dann muss auch der C b des Satzes S n+1 dort als Pronomen realisiert sein. Mit dieser Regel wird die Intuition erfasst, dass die Benutzung eines Pronomens der Leserin signalisieren soll, dass der zentrale Diskursgegenstand beibehalten wird. Eine Verletzung der Regel würde bedeuten, dass der zentrale Gegenstand nicht pronominalisiert wird, irgendein anderer, nicht im Zentrum stehender, Gegenstand hingegen pronominalisiert ist-- was für das mentale Verfolgen des centers recht irritierend wäre. Wir können uns leicht davon über- 26 Dies wurde u. a. von Rambow (1993) untersucht, und Strube u. Hahn (1996) haben vorgeschlagen, für das Deutsche anstatt der Hierarchie der grammatischen Rollen zur Bemessung der relativen Salienz informationsstrukturelle Kategorien wie das Topik (vgl. Abschnitt 5.4) zu verwenden. 79 4.3 Koreferenz: Lokale Effekte zeugen, dass diese Regel in beiden Beispieltexten 4.14 und 4.15 eingehalten wurde, wobei 4.14 allerdings eine Pronominalisierung enthält, die ihr Antezedens erst in S n-2 findet, wozu die hier erläuterte Version von Centering keine Aussage trifft. Eine ganze Reihe weiterer (englischer) Beispiele zur Unterstützung der Voraussagen der Centering-Theorie sind in (Grosz u. a., 1995) zu finden. Wir halten abschließend ihre grundlegende These fest, nach der Pronominalisierungsentscheidungen in der Sprachproduktion des Englischen maßgeblich von der Zuordnung von Diskursgegenständen zu grammatischen Funktionen bestimmt werden. Dies ist sicher nicht falsch, in der Praxis treten aber eine Reihe weiterer Einflussfaktoren hinzu. Beispielsweise schlagen Kehler u. Rohde (2013) nach der Auswertung verschiedener Perzeptions- und Produktionsexperimente ein probabilistisches Modell vor, das auch die jeweils vorliegende Kohärenzrelation (vgl. Abschnitt 10.1) mit in Betracht zieht. Die Markierung von Salienz resultiert mithin aus einem Wechselspiel zwischen verschiedenen Beschreibungsebenen, das dementsprechend auch Ebenen-übergreifend modelliert und erklärt werden muss. 4.3.2 Aktivierungsgrad von Diskursgegenständen Wir haben mehrfach darauf hingewiesen, dass das auch im Centering untersuchte Phänomen der Pronominalisierung in der Linguistik (einschließlich der Textlinguistik und der Computerlinguistik) viel Aufmerksamkeit bekommen hat. Interessieren wir uns für die Form referenzieller Ausdrücke und deren Rolle im Text, so finden sich neben den Personalpronomen aber noch eine ganze Reihe anderer Varianten-- in Kapitel 2 und zu Beginn dieses Kapitels haben wir das bereits kurz skizziert. Derselbe Diskursgegenstand kann in einem Text also mit sehr unterschiedlichen Ausdrücken bezeichnet werden. Die einfachste Unterscheidung, die man in diesem Spektrum treffen kann, ist die zwischen alt und neu (englisch given / new): Wurde über den Gegenstand schon einmal gesprochen oder nicht? Davon hängt dann etwa, nach einer bekannten „Faustregel“, die Wahl eines indefiniten Artikels für die Ersterwähnung und einer definiten Kennzeichnung für spätere Erwähnungen ab. Dass eine bloße Zweiteilung dem Spektrum sprachlicher Ausdrücke aber nicht gerecht wird, liegt auf der Hand. Wegweisend waren in diesem Zusammenhang Arbeiten von Givón (1983) und von Prince (1981), die jeweils feinkörnigere Einteilungen vorschlugen. Wichtig ist, dass damit aber auch ein Wechsel der Perspektive einhergeht, nämlich von einer rein „textzentrierten“ Betrachtung zu einer, die die kognitiven Prozesse der Leserin des Textes mit einbezieht. Entscheidend ist dann nicht mehr, ob ein bestimmter Gegenstand „im Text vorerwähnt“ ist, sondern ob er „im mentalen Modell der Leserin zugänglich“ ist. Dies hat zwei entscheidende Vorteile: ▶ Der Blick auf das mentale Modell legt nahe, dass Gegenstände „mehr oder weniger“ zugänglich sind (wie zugänglich, sollte das Modell erklären). ▶ Unter Rückgriff auf das mentale Modell lässt sich auch erklären, warum Gegenstände, die nicht im Text, sondern in „der Welt“, u. a. in der aktuellen Äußerungssituation, eine Rolle spielen, sprachlich durch bestimmte referenzielle Ausdrücke bezeichnet werden. 80 4 Referenzielle Struktur Für unser Ziel der Textanalyse ist der zweite Punkt hier weniger relevant, der erste jedoch ist sehr bedeutsam. So bestimmt die Unterscheidung zwischen der Text-Welt und der Hörer-Welt die Ausgestaltung der Terminologie von Prince (1981), nach der wir jetzt den Gegenstand aus der „Welt“ (einschließlich der Text-Welt) trennen müssen vom Diskursreferenten, dem Objekt im mentalen Modell, das den Gegenstand repräsentiert. Prince schlägt auf dieser Grundlage die folgende Taxonomie der Zugänglichkeit vor: Zugänglichkeit von Diskursreferenten nach Prince (1981) 1. Brand-new: neuer Diskursreferent für bisher unbekannten Gegenstand. Eine Variante davon ist ‚brand-new anchored‘, wo der Diskursreferent an einen bereits bekannten Gegenstand anknüpft: a guy I work with 2. Inferrable: neuer Diskursreferent für inferierbaren Gegenstand. Es gibt zwei Varianten, ‚containing‘ (one of those eggs) und ‚non-containing‘ (I hopped on a bus. The driver stopped me.) 3. Unused: neuer Diskursreferent für bekannten Gegenstand. Ein als bekannt vorausgesetzter Gegenstand erscheint erstmals im Text, wie in I wanted to meet the Pope. 4. Evoked: Zugriff auf verfügbaren, weil im Text bereits erwähnten Diskursreferenten. Jeder Vorschlag einer solchen Skala muss sich daran messen lassen, wie gut er die möglichen Variationen von referenziellen Ausdrücken in bestimmten Kontexten erklären kann. Dazu gab es konkrete Vorschläge, beispielsweise den von Gundel u. a. (1993), wonach für die unterschiedlichen Grade von ‚Identifizierbarkeit‘ und ihre linguistischen Signale im Englischen die folgende Skala gelte, geordnet wiederum von ‚wenig zugänglich‘ bis ‚leicht zugänglich‘: Zugänglichkeit von Diskursreferenten nach Gundel u. a. (1993) 1. Unidentifiable: „a N“ 2. Referential: indefinite „this N“ (Gemeint sind hier Verwendungen wie in You know, I met this man on the bus today. He …) 3. Identifiable: „the N“ 4. Familiar: „this N“ / „that N“ 5. Activated: „this“ / „that“ 6. Focus: „it“ Die ersten beiden Gruppen realisieren die Kategorie brand-new von Prince, identifiable entspricht sowohl inferrable als auch unused. Die übrigen Gruppen verfeinern Princes Kategorie evoked; dabei entspricht focus dem, was wir im vorigen Abschnitt als center diskutiert haben, 81 4.3 Koreferenz: Lokale Effekte es handelt sich also um den ‚Aufmerksamkeitsfokus‘ (im Gegensatz zu dem informationsstrukturellen Begriff). In einer solchen Skala findet sich einerseits die genannte einfache Faustregel wieder, nach der ein nicht-identifizierbarer Gegenstand indefinit eingeführt wird; darüber hinaus liefert sie eine feinere Gliederung der möglichen sprachlichen Realisierungsformen und postuliert, dass mit ihrer Verwendung ein jeweils unterschiedlicher Grad an Zugänglichkeit im mentalen Modell einhergeht. Wie angemessen eine solche Skala ist, kann an Texten überprüft werden, indem festgestellt wird, ob eine Nominalphrase der entsprechenden Form mit dem jeweiligen Aktivierungsstatus des Diskursreferenten übereinstimmt-- was natürlich voraussetzt, dass eine Metrik für die Bestimmung des Aktivierungsstatus zur Verfügung steht. Nach Givón (1983) sollten in eine solche Metrik zumindest drei Faktoren eingehen: ▶ die Distanz zur letzten Erwähnung des Gegenstandes (Givón misst sie in clauses), ▶ die Anzahl möglicher Verwechslungskandidaten in der näheren Umgebung (die Wahl einer einfachen definiten NP wie der Hund hängt davon ab, ob es im mentalen Modell noch andere, ähnlich leicht zugängliche Gegenstände vom Typ Hund gibt), ▶ die Fortführung des Gegenstandes im nachfolgenden Diskurs, gemessen als Zahl der aufeinanderfolgenden clauses, in denen der Gegenstand kontinuierlich erwähnt wird. Die Situation bleibt allerdings nicht so übersichtlich. Zum einen ist die Bandbreite möglicher referenzieller Ausdrücke-- zwischen denen also eine Abstufung hinsichtlich ihrer Zugänglichkeit gefunden werden müsste-- durchaus noch größer als die o. g. Liste von Gundel u. a. Wir betrachten dazu die von Ariel (2001) vorgeschlagene Skala, die sich wieder von niedriger zu hoher Zugänglichkeit bewegt: 1. Vor- und Nachname 2. lange definite Beschreibung 3. kurze definite Beschreibung 4. Nachname 5. Vorname 6. distales Demonstrativpronomen („jener“) 7. proximales Demonstrativpronomen („dieser“) 8. betontes Pronomen mit Sprachgeste 9. betontes Pronomen 10. klitisches Pronomen 11. referenzielle Flexionsendung 12. Ellipse Zum anderen genügt es, wie oben besprochen, für die Untersuchung der Korrelation zwischen Aktivierung und Realisierung nicht, allein die Nominalphrase zu betrachten; es müssen auch die syntaktische Struktur und weitere Aspekte des Kontexts berücksichtigt werden. So führt etwa Givón (1983) in seiner entsprechenden Skala rechtsversetzte und linksversetzte NP s („Er ist clever, der Peter“ / „Peter, der ist clever“) als unterschiedlich zugänglich auf, was sinnvoll 82 4 Referenzielle Struktur ist, da solche Konstruktionen gerade dazu dienen, den Grad der ‚Topikalität‘ eines Gegenstandes anzuzeigen (mehr dazu im nächsten Kapitel). 27 Abbildung 4.6: Numerische Aktivierungsverläufe für Diskursreferenten eines Textes (Chiarcos, 2010, S. 335) Eine Methode, um das Zusammenwirken verschiedenartiger Einflussfaktoren zu modellieren, stellen numerische Aktivierungsfunktionen dar. Für jeden im Text erwähnten Diskursgegenstand wird eine solche Funktion berechnet, die den Aktivierungsgrad über den Textverlauf hinweg repräsentiert. Wird der Gegenstand erwähnt, steigt die Aktivierung; anschließend fällt sie kontinuierlich ab, bis zu einer etwaigen neuerlichen Erwähnung. Konkret müssen also zwei Festlegungen getroffen werden: ▶ Wie stark steigt die Aktivierung eines Gegenstands bei seiner Erwähnung, abhängig von der Form der NP und weiteren (oben besprochenen) Faktoren? ▶ Wie stark sinkt die Aktivierung, solange ein Gegenstand nicht erwähnt wird? Ein Modell dieser Art, das diskrete Kategorien (wie etwa die oben genannten von Prince) durch kontinuierliche Werte ersetzt, wurde als ‚mental salience model‘ von Chiarcos (2011) vorgeschlagen. Es integriert eine Reihe von Vorarbeiten wie die Centering Theorie oder die angesprochenen Vorschläge von Givón (1983) und bietet entsprechende Formulierungen von Aktivierungsfunktionen an. Zur Illustration zeigt Abb. 4.6 die Verläufe für die drei in einem kurzen Text auftretenden Diskursgegenstände. Das Ergebnis bietet eine ganz ähnliche Information über einen Textverlauf wie die in Abb. 4.4 (S. 73) gezeigte Matrix-Darstellung, 27 Weitere Untersuchungen zum Zusammenhang zwischen speziell der syntaktischen Form und der Aktivierung von Diskursreferenten, auf die wir hier nicht weiter eingehen können, finden sich zum Beispiel in (Birner u. Ward, 1998). 83 4.4 Annotation von Koreferenz in Korpora geht aber natürlich darüber hinaus, indem sie nicht nur die aktiv / inaktiv-Entscheidung trifft, sondern numerische Werte angibt. Ein solches Modell kann nun überprüft werden, inwieweit es gute Voraussagen darüber macht, welche Art von referenziellem Ausdruck ein Autor benutzen sollte, um an einer bestimmten Textstelle einen bestimmten Diskursgegenstand zu verbalisieren. Voraussetzung dafür sind entsprechende Daten: ein mit Koreferenz-Relationen annotiertes Korpus. 4.4 Annotation von Koreferenz in Korpora Diagramme von Wiederaufnahmestrukturen in Texten, wie in Abschnitt 4.2 an kleinen Beispielen illustriert (Abb. 4.2 und 4.3), veranschaulichen, was unter einer solchen Struktur zu verstehen ist, und analysieren exemplarisch einen oder einige wenige Texte. Doch auf diesem Weg ist es naturgemäß nicht möglich, nach bestimmten Analyse-Phänomenen gezielt zu suchen, ähnliche miteinander zu vergleichen, Hypothesen zu prüfen, Schlüsse zu ziehen. Dafür werden annotierte Daten benötigt. Im Folgenden besprechen wir die Aufgabe des manuellen Annotierens von Koreferenz und dadurch entstandene Korpora, nennen die Möglichkeit einer automatischen Annotation, werfen einen Blick auf Software zur Recherche in annotierten Korpora, und geben Beispiele für Erkenntnisse, die Korpusstudien zur Koreferenz zutage fördern können. Manuelle Annotation Für die manuelle Annotation von Texten benötigt man zunächst Richtlinien, die zu den in den vorigen Abschnitten genannten Aspekten klare Vorgaben machen: Wie ist ein referenzieller Ausdruck definiert und was ist seine Ausdehnung (zählen vorangehende oder nachfolgende Modifikatoren dazu oder nicht)? Welche Arten von Relationen sollen annotiert werden (Referenzidentität, indirekte Wiederaufnahme)? Sind weitere Attribute der referenziellen Ausdrücke mit anzugeben? Welches Antezedens soll markiert werden? Beispiele für solche Richtlinien, die auf nominale Gegenstandsreferenz zugeschnitten sind, sind die des Tü- Ba-D / Z Korpus (erreichbar über die Projekt-Homepage 28 ), die des Potsdamer Kommentarkorpus (Stede, 2016a, Kap. 5 u. 6) und die RefLex Richtlinien (Riester u. Baumann, 2017), die für die Annotation des Stuttgarter Radionachrichtenkorpus verwendet wurden. Alle behandeln lediglich nominale Gegenstandsreferenz und berücksichtigen dabei teilweise auch die indirekte Wiederaufnahme. Die manuelle Erstellung von Koreferenz-Annotation ist eine komplexe Aufgabe, die durch gut geeignete Software unterstützt werden sollte. Ein speziell für die Annotation von Koreferenz erstelltes Werkzeug ist MMAX 2 29 (Müller u. Strube, 2006). Es gestattet das komfortable Markieren von referenziellen Ausdrücken und das Verbinden von koreferenten Ausdrücken per Mausklick. Entstehende Relationen können mit einer Bezeichnung versehen werden, um verschiedene Arten zu unterscheiden. Zur Illustration zeigt Abb. 4.7 einen Bildschirmabzug. MMAX 2 ist in Java implementiert und damit auf allen gängigen Betriebssystemen lauffähig. Bevor ein Text in MMAX 2 geladen werden kann, muss 28 http: / / www.sfs.uni-tuebingen.de/ ascl/ ressourcen/ corpora/ tueba-dz.html (Zugriff 4. 1. 18). 29 https: / / sourceforge.net/ projects/ mmax2/ (Zugriff 4. 1. 18). 84 4 Referenzielle Struktur er zunächst in das spezielle Eingabeformat der Software umgewandelt werden. Dafür werden entsprechende Konvertierungsskripte mitgeliefert. Abbildung 4.7: Koreferenz-Annotation mit MMAX 2 Das größte manuell annotierte Korpus für nominale Koreferenz ist Ontonotes (Pradhan u. a., 2013). Es enthält Texte aus verschiedenen Textsorten in drei Sprachen (Englisch, Chinesisch, Arabisch), und ist noch auf weiteren, allerdings satzbezogenen, Analyse-Ebenen annotiert. Für das Deutsche stellt das umfangreiche TüBa-D / Z Korpus (Homepage: s. o.) neben der Koreferenz ebenfalls weitere Informationen, vor allem Satzsyntax, zur Verfügung. Automatische Annotation Mit der Verfügbarkeit annotierter Daten ist es möglich, Systeme zu entwickeln, die durch maschinelles Lernen aus Korpora die Annotation von Koreferenz automatisch bewältigen. Für das Deutsche sei hier als Beispiel die Arbeit von Tuggener (2016) genannt, die TüBa-D / Z als Trainingskorpus nutzt. Insgesamt bleibt die Qualität automatischer Koreferenz-Annotation heute allerdings noch deutlich hinter der von manuellen Annotationen zurück, da es sich einerseits um eine sehr schwierige Aufgabe handelt und andererseits nur begrenzte Mengen an Trainingsdaten verfügbar sind. Recherche-Werkzeuge Annotierte Korpora werden in aller Regel als Datensätze zur Verfügung gestellt, für deren Auswertung die Nutzer dann jeweils ihre eigenen Programme schreiben müssen. Das Potsdamer Kommentarkorpus ( PCC ) steht hingegen, wie in Abschnitt 1.2 erklärt, auch frei zugänglich zur Recherche in der linguistischen Datenbank ANNIS zur Verfügung (Link auf der Homepage zu diesem Buch). Damit ist es z. B. möglich, referenzielle Ketten aus den Daten zu extrahieren, die Resultate zu exportieren und dann weiter zu analysieren. So lassen sich statis- 85 4.4 Annotation von Koreferenz in Korpora tische Auswertungen zur Form referenzieller Ausdrücke in Abhängigkeit einfacher Parameter der Vorerwähntheit durchführen, etc. Zur Illustration zeigt Abb. 4.8 einen Bildschirmabzug mit dem Resultat einer Abfrage (kleines Fenster oben links) kataphorischer Relationen; der erste Treffer ist im großen Fenster dargestellt. In Verbindung mit der (für das PCC ebenfalls verfügbaren) Satzsyntax kann die Realisierungsform referenzieller Ausdrücke zu vielen der in diesem Kapitel besprochenen Parameter in Beziehung gesetzt werden. Zum Beispiel wird in Chiarcos u. a. (2011) die Abfrage von pronominalen Anaphern mit Antezedenten, die als grammatisches Subjekt fungieren, vorgestellt. Mit komplexeren Abfragen lassen sich dann auch Voraussagen der Centering Theorie empirisch überprüfen, indem aus der Kombination von Syntax und Koreferenz die C f , C p und C b automatisch errechnet werden. Abbildung 4.8: Abfrage kataphorischer Relationen in ANNIS Korpusstudien Zu vielen Aspekten der Koreferenz wurden in den letzten Jahren Korpusstudien durchgeführt; wir erwähnen hier nur zwei Beispiele, die an die Darstellungen in früheren Abschnitten des Buches anknüpfen. So haben Friedrich u. Palmer (2014) anhand des o. g. Ontonotes Korpus eine umfangreiche Studie zur Centering Theorie vorgelegt, die unter anderem starke empirische Evidenz für die Pronominalisierungsregel („ist ein Element von C f (S n-1 ) pronominalisiert, muss auch C b pronominalisiert sein“) liefert. Hingegen konnte die von Brennan u. a. (1987) postulierte Präferenz-Hierarchie für Center-Übergänge (s. S. 78) durch die Daten nicht bestätigt werden. In ihrer im vorigen Kapitel bereits angesprochenen Untersuchung des GECC o Korpus fanden Kunz u. a. (2017) eine Reihe interessanter Unterschiede zwischen den referenziellen Ketten auf der deutschen und der englischen Seite ihres Parallelkorpus. Zum Beispiel wird Koreferenz in den deutschen Daten häufiger durch Demonstrativals durch Personalpronomen ausgedrückt; im Englischen trifft das Gegenteil zu. 86 4 Referenzielle Struktur Weiterführende Literatur Die Literatur zum Thema Referenz ist, insbesondere aus philosophischer und formal-semantischer Sicht, ausgesprochen reichhaltig; darauf können wir hier nicht eingehen. Als nächsten Schritt zur Vertiefung der in diesem Kapitel skizzierten Phänomene ist das Übersichtskapitel in (Braunmüller, 1977) geeignet; einen stärkeren Textbezug bietet die Untersuchung von Schwarz (2000). Zum Thema Centering bietet das Buch (Walker u. a., 1998) einen umfassenden Überblick über verschiedene Facetten der Theorie. Eine Bestandsaufnahme aus computerlinguistischer Sicht findet sich in (Poesio u. a., 2004). Die Modellierung der Salienz von Diskursgegenständen durch Aktivierungsfunktionen wird gründlich von Chiarcos (2010) untersucht; diese Arbeit bietet außerdem tiefgehende Hintergrundinformationen über die betrachteten Einflussfaktoren. 4.5 Übungsaufgaben 1. Analysieren Sie Ihren Kommentar im Hinblick auf seine referenziellen Ausdrücke: Welche Phrasen führen einen neuen Gegenstand in den Diskurs ein, welche Phrasen verweisen anaphorisch auf bereits eingeführte Gegenstände? Stellen Sie das Ergebnis analog zu Bild 4.4 als Matrix dar, in der jeweils in Drei-Wort-Schritten die Diskursgegenstände markiert sind, die neu eingeführt oder wieder aufgenommen werden. Vermutlich wird es dabei Zweifelsfälle und problematische Entscheidungen geben. Benennen Sie diese stichwortartig. 2. Konstruieren Sie einige weitere, auch nicht „flüssige“, Varianten unserer Beispieltexte 4.14 und 4.15. Überprüfen Sie dann anhand der Centering Theorie, ob die Art der Übergänge zwischen den Sätzen ( CONTINUE etc.) die Unterschiede in der Verständlichkeit erklärt oder nicht. Prüfen Sie auch, ob die Pronominalisierungsregel jeweils erfüllt ist. Wäre es sinnvoll, die partielle Ordnung der C f oder die Hierarchie der Übergänge (Abb. 4.5) für unsere deutschen Beispiele anders zu definieren als es die besprochenen Autoren für das Englische taten? 3. Wenn Sie sich dafür entschieden haben, auch die „technische“ Seite der Daten-Annotation zu bearbeiten, verschaffen Sie sich Zugang zu dem Programm MMAX 2 (Quelle: s. o.), konvertieren Sie die Textdatei Ihres Kommentars in das MMAX 2-Inputformat und erstellen Sie eine Annotation der in Übung 1 ausgeführten referenziellen Struktur. 87 4.5 Übungsaufgaben 5 Thematische Struktur (5.1) Gestern lief alles großartig. Mein Lieblingsverein hat den DFB -Pokal gewonnen, und vor der Schule lagen doch tatsächlich 10 Euro auf dem Gehsteig! Befragen wir diese Satzfolge nach ihrer Textualität, besteht wohl wenig Zweifel daran, dass sie „funktioniert“. Anders als in Beispiel 4.1 zu Beginn des letzten Kapitels kann dafür allerdings nicht die Kontinuität der Diskursgegenstände verantwortlich sein, denn die referenzielle Struktur zeigt zwischen den drei Sätzen nicht eine einzige Koreferenz an. Die Verbindung muss also tiefer liegen und wird gemeinhin als ‚thematisch‘ bezeichnet. ‚Thema‘ ist allerdings ein Begriff, der sich in der Alltagssprache durch bemerkenswerte Vagheit und dann in der linguistischen Fachliteratur obendrein durch verwirrende Mehrdeutigkeit auszeichnet. Befragen wir aber zunächst ein Lexikon 30 nach dem Begriff ‚Thema‘, so finden wir die Erläuterung: Thema [griech., eigtl. „das Gesetzte“], Hauptgedanke; Aufgabe, zu behandelnder Gegenstand; Leitmotiv; Gesprächsstoff. Einen solchen alltagssprachlichen Begriff legen wir in Abschnitt 5.1 zugrunde, wenn wir das Thema als den Textgegenstand untersuchen, der salopp gesagt die Antwort auf die Frage „worum geht es? “ darstellt. In 5.2 weiten wir die Frage aus zu „wie geht es darum? “ und stellen fest, dass sich Themen im Textverlauf unterschiedlich verschieben können, dass es dafür aber gewisse Regularitäten gibt, die an die Diskussion von Textsorte und Texttyp in Kapitel 3 anknüpfen. Im folgenden Abschnitt 5.3 verlegt sich der Schwerpunkt auf die lokale Rolle von Themen bei der Gestaltung der „Nahtstellen“ von benachbarten Sätzen. Wir werden feststellen, dass die Formulierung der einzelnen Sätze sowohl von globalen Vorgaben als auch von den zuletzt gewählten Formulierungen der Vorgängersätze beeinflusst wird. Eine spezifische Ausprägung dieser Fragestellung ist die in der Linguistik untersuchte Informationsstruktur, und Abschnitt 5.4 skizziert zwei Modellierungsansätze aus diesem Bereich, die für die thematische Entwicklung des Textes relevant sind. Am Ende werfen wir dann in 5.5 noch einen Blick auf Aktivitäten der Korpus-Annotation. Insgesamt stehen sich textbezogene und satzbezogene Thema-Begriffe heute aber noch weitgehend unvermittelt gegenüber (vgl. Hoffmann, 2000), und dementsprechend liefert dieses Kapitel keineswegs eine geschlossene Konzeption, sondern nurmehr eine „Landkarte“, anhand derer sich die sehr reichhaltige Literatur zu den verschiedenen Spielarten von ‚Thema‘ einsortieren lässt. 30 Meyers Großes Taschenlexikon in 24 Bänden, B. I. Taschenbuchverlag Mannheim / Wien / Zürich, 1987, Band 22, S. 69. 88 5 Thematische Struktur 5.1 Thema als Textgegenstand Wenn wir nach der Lektüre eines Textes eine kurze und treffende Antwort auf die Frage formulieren, wovon der Text denn handele, haben wir im o. g. alltagssprachlichen Sinn sein Thema benannt. Eine angemessene Benennung kann allerdings von unterschiedlichem Typ sein, sie kann aus einem einzigen Wort (meist wohl ein Substantiv), einer Phrase, einem oder mehreren Sätzen bestehen-- oder aber auch als Fragestellung formuliert sein. Verschiedene Autoren (z. B. Lötscher, 1987) haben darauf hingewiesen, dass die Form des Themas im Zusammenhang zum Texttyp und zur Textfunktion steht. So wird ein instruktiver Text meistens gut durch eine Phrase beschrieben sein, die den auszuführenden Vorgang bezeichnet („Wechseln der Zündkerzen“). Das Thema eines deskriptiven oder eines expositorischen Texts lässt sich häufig durch den Gegenstand angeben, der erläutert wird („Die Solarzelle“). Für den argumentativen Text kommt tendenziell eine Fragestellung („Soll die Legehennenverordnung novelliert werden? “) oder aber die vom Autor vertretene These („Die Legehennenverordnung sollte novelliert werden! “) in Frage. Für den narrativen Text sind die Möglichkeiten vielfältiger, da eine Erzählung sich mit den unterschiedlichsten Arten von Dingen befassen kann („Ein Tag im Leben des jungen Friedrich“). Wenn ein möglicher Thema-Typ hier ‚Gegenstand‘ heißt, impliziert das nicht zwangsläufig, dass es sich im Sinne des letzten Kapitels auch um einen ‚Diskursgegenstand‘ handelt; der Thema-Gegenstand muss nicht unbedingt als solcher auch explizit im Text vorkommen. Denn die Bildung des Themas ist immer ein Abstraktionsprozess, was bedeutet, dass einerseits weggelassen, andererseits verallgemeinert wird. Relevantes wird von weniger Relevantem unterschieden, am Ende können dann die relevantesten Gegenstände zu einem einzelnen Begriff zusammengefasst werden. Einfaches Beispiel: Ein kurzer Text berichtet über Silvias Pony, ihren Hamster und ihren Wellensittich; das Thema wäre dann durchaus treffend als „Silvias Haustiere“ bezeichnet. Da der Textgegenstand zudem wie gesagt keineswegs immer ein Gegenstand im engeren Sinne ist, sondern auch ein Sachverhalt bzw. eine Proposition sein kann, wird deutlich, dass der Prozess seiner Identifikation nicht allein auf der Ebene der Textoberfläche verlaufen kann, sondern vielmehr eine semantische Operation sein muss. Ein bekannter Vorschlag, auf diesem Weg durch formale Regeln das Textthema aus den Bedeutungen der Sätze abzuleiten, stammt von van Dijk (1980). Er motiviert seinen Ansatz auch mit dem Ziel der kognitiven Modellierung und schreibt (S. 45): Wir müssen uns Einsicht verschaffen in das sehr wesentliche Vermögen des Sprachgebrauchers, das ihm ermöglicht, auch bei sehr langen und komplizierten Texten Fragen zu beantworten wie ‚Wovon war die Rede? ‘, ‚Was war der Gegenstand des Gesprächs? ‘ u. a. Ein Sprachgebraucher kann das auch dann, wenn Thema oder Gegenstand selbst als Ganzes nicht explizit im Text erwähnt werden. Er muss also das Thema aus dem Text ableiten. Sein Ansatz beruht auf der gängigen Vorstellung, dass die Satzbedeutung als Prädikat-Argument-Struktur darstellbar ist, die Teilhandlungen des Satzinhalts das Referieren und das Prädizieren sind, und die Prädikation dann als Proposition bezeichnet wird (mehr dazu 89 5.1 Thema als Textgegenstand in Abschnitt 7.1). Interpretiert eine Rezipientin einen Satz, steht sie vor der Aufgabe, alle Propositionen offenzulegen, auch die nicht expliziten, jedoch „mitzuverstehenden“ (Präsuppositionen, Konnotationen). Die Ausweitung dieses Bildes auf den Text ergibt nach van Dijk dann einen „Propositionenkomplex“, wobei diese Propositionen nicht unverbunden nebeneinander stehen, sondern durch additive, kausale, konditionale und andere Relationen zueinander in Beziehung gesetzt werden (siehe dazu Kapitel 10). Abbildung 5.1: Makrostruktur eines Textes nach van Dijk (1980) Für van Dijk besteht Textverstehen darin, die „semantische Tiefenstruktur“ des Texts zu rekonstruieren, indem die einzelnen Propositionen aufgedeckt und darüber hinaus komplexere Propositionen, sog. ‚Makropropositionen‘ aktiv gebildet werden. Diese abstrahieren auf jeweils unterschiedliche Weise von den beteiligten Propositionen, stellen also das Ergebnis einer Informationsreduktion dar. Indem dieser Vorgang zunächst für die einzelnen Propositionen und dann auch weiter über die Makropropositionen, also rekursiv für den gesamten Text abläuft, entsteht die ‚Makrostruktur‘ des Textes als Baum mit einem ausgezeichneten Wurzelknoten, nämlich derjenigen Proposition, die das Textthema repräsentiert. Abbildung 5.1 illustriert diese Strukturbildung. An den Blättern des Baums stehen die P für Propositionen, die Textsegmenten k i entsprechen. Die M sind Makropropositionen, bezeichnet mit einem Superskript für die Abstraktionsebene (von 1, dem ersten Schritt über dem Text, bis n, dem Gesamttext) und einem Subskript zur laufenden Nummerierung auf derselben Ebene. Die Regeln für die Verknüpfung von Propositionen sind: ... M 1 i M n−1 1 M 2 n−1 M 3 n−1 M 1 n P k1 P k2 P k3 ... ... ... ... ... ... 1 90 5 Thematische Struktur Verknüpfung von Propositionen nach van Dijk (1980) ▶ Selektion: Weglassen irrelevanter Propositionen, oder solcher, die Bestandteile, Präsuppositionen, Folgen einer nicht weggelassenen Proposition sind. Peter lief zu seinem Auto. Er stieg ein. Peter fuhr nach Frankfurt. → Peter fuhr nach Frankfurt. ▶ Generalisierung: Zusammenfassen von Begriffen durch Hyperonym. Eine Puppe lag auf dem Boden. Bausteine lagen auf dem Boden. → Spielzeug lag auf dem Boden. ▶ Konstruktion: Aus expliziten und impliziten Propositionen des Textes wird eine rahmenbildende Proposition, die ihrerseits das Thema enthält. Ich ging zum Bahnhof. Ich kaufte eine Fahrkarte. (…) Ich stieg in den Zug ein. Er fuhr ab. → Ich nahm den Zug. Während in einfachen Fällen also lexikalisches Wissen (Hyperonymie) für die Ausführung der Regeln ausreicht, kann im Allgemeinen allerdings beliebiges Weltwissen im Spiel sein, wenn ein Leser diese Abstraktionen vollzieht. Aufgefasst als Modell menschlichen Leseverhaltens, postuliert van Dijks Vorschlag, dass die Bildung der Makrostruktur bei der Textverarbeitung linear abläuft, es sich also um einen bottom-up Prozess handelt, der ausgehend von der seriellen Rezeption einzelner Propositionen die Struktur konstruiert. Kritiker, unter ihnen auch Brinker (2005), haben hingegen darauf hingewiesen, dass die textanalytische Bestimmung des Themas auf durchaus komplexeren interpretativen Verfahren beruhe und es dafür keine „mechanische“ Prozedur geben könne. Vielmehr sei ein Gesamtverständnis des Textes die Voraussetzung für die Angabe des Textthemas - dieses könne also erst nach der Verarbeitung des gesamten Textes im Nachhinein konstruiert werden, mithin als Mischung aus top-down und bottom-up Verarbeitung. Dieser kritischen Sicht ist für hinreichend komplexe Texte sicherlich zuzustimmen, während van Dijks Verfahren für sehr einfache Textbeispiele durchaus nachvollziehbar ist. Die von van Dijk vorgeschlagene Makrostruktur gibt den wichtigen Hinweis, dass die Bestimmung des Textthemas eine rekursive Prozedur ist, die zu einer hierarchischen Darstellung führt: Ein thematisch zusammenhängender Textabschnitt kann sich seinerseits in kleinere Teile gliedern, die thematisch zwar voneinander unterscheidbar sind, von denen aber jeder für sich wiederum mit dem Thema des gesamten Abschnitts eng verbunden ist. Betrachten wir die 5 Sätze des Beispieltexts Darfur (ohne die Überschrift) aus Bild 4.1 (S. 70) aus diesem Blickwinkel, können wir den Sätzen 1-3 das Thema „Sudan stimmt UN -Einsatz in Darfur zu“ zuschreiben und darin dem Satz 3 das Sub-Thema „noch bestehender Dissens“. Die Sätze 4 und 5 können durch das Thema „Involvierung der Nachbarländer“ charakterisiert werden, und darin wiederum 5 durch das Sub-Thema „Laufender Truppeneinsatz der Afrikanischen Union“. Die Original-Überschrift des Textes fasst lediglich die Sätze 1-3 zusammen, die offenbar als die zentrale aktuelle Nachricht bewertet werden. Wollten wir ein umfassenderes 91 5.2 Textglobale thematische Strategien Thema für die Sätze 1-5 benennen, müssten wir von der Überschrift abstrahieren, etwa zu „Aktuelle Entwicklungen im Bürgerkrieg in Darfur“. 5.2 Textglobale thematische Strategien Wenn die soeben besprochene, erste Frage zum Thema Thema lautet „Worum geht es? “, so schließt sich als zweite Frage an, auf welche Weise der Text dieses Thema behandelt und wie der Text durch eine thematische Gliederung strukturiert wird. In Kapitel 3 haben wir bereits gesehen, dass es für viele Textsorten globale Vorgaben für die Abfolge von sog. Inhaltszonen geben kann, entweder hinsichtlich ihrer absoluten Position oder aber hinsichtlich ihrer Nachbarschaft zu anderen Zonen. Die Abfolge der Inhaltszonen kann somit konventionalisierten Beschränkungen unterliegen, die einen Teil unseres Textsortenwissens (s. Abschnitt 3.2.6) bilden. Neben den in Kapitel 3 besprochenen wissenschaftlichen Aufsätzen, Filmrezensionen und Kommentaren gilt dies beispielsweise auch für Geschäftsbriefe und in Grenzen auch für Nachrichtentexte: Sie sollen sich an den bekannten „journalistischen Ws“ orientieren (wer, wann, wo, was, wie), können aber die Reihenfolge der Informationen verändern, wenn die relative Wichtigkeit der Beteiligten es nahelegt.-- Wie aber geht eine Autorin vor, wenn die Textsorte ihr Freiheiten in der linearen Abfolge gewährt? 5.2.1 Linearisierung der Textinformationen Von Fall zu Fall kann mit einer textsortenspezifischen, konventionalisierten Abfolge auch ein Vorteil für die kognitive Verarbeitung einhergehen-- wenn diese Abfolge nicht nur willkürlich festgelegt ist, sondern auch einer „inneren Logik“ folgt. Interessanter sind in diesem Zusammenhang allerdings die von der Textsorte eher unabhängigen Linearisierungsstrategien, nach denen Autoren vorgehen, wenn Anordnungskonventionen eben keine Rolle spielen. Nach Lötscher (1991) gibt es zwei Motive für eine nicht wahllose Anordnung der Informationen bzw. der Themen des Textes: ▶ Kognitives Motiv: den Rezipienten soll die Verarbeitbarkeit, die Einordnung in die bisher aufgebaute Textrepräsentation, erleichtert werden. ▶ Rhetorisches Motiv: der Produzent möchte möglichst wirkungsvoll ein Ziel erreichen, die Rezipienten in bestimmter Weise zu beeinflussen. Diese beiden Motive werden oft gleichermaßen verfolgt, allerdings spielen sie je nach Text unterschiedliche Rollen- - wofür sich wieder der in Abschnitt 3.3 eingeführte Begriff des Texttyps als nützlich erweist. Im argumentativen Text, der uns in Kapitel 8 näher beschäftigen wird, gibt es verschiedene, mehr oder weniger wirkungsvolle Muster der Reihung von (wichtigen versus weniger wichtigen) Argumenten, möglichen Gegenargumenten und deren Entkräftung-- hier steht offenkundig das rhetorische Motiv im Vordergrund. Im instruktiven Text bildet trivialerweise die Reihenfolge der zu erledigenden Teil-Schritte die Vorgabe für die Abfolge im Text, und dies folgt primär dem kognitiven, ggf. aber auch dem rhetorischen Motiv: Ein Kochrezept ist sehr viel einfacher zu befolgen, wenn die Schritte 92 5 Thematische Struktur klar und in der „richtigen“ Reihenfolge beschrieben sind (getreu dem Ikonizitätsprinzip der Übereinstimmung von Wirklichkeit und ihrer Beschreibung). In der Narration gibt es eine ähnliche Ausgangslage: Wenn Ereignisse ohne explizite Angabe ihrer temporalen Verankerung geschildert sind, werden Rezipienten in aller Regel eine chronologische Reihenfolge unterstellen. Interessante Erzählungen weichen davon allerdings vielfach ab- - wobei dann aber linguistische Markierungen (vor allem: Tempus-Wechsel, bestimmte Konnektoren) erforderlich sind, die es dem Rezipienten erlauben, den tatsächlichen Gang der Ereignisse zu rekonstruieren. Für den deskriptiven Text schlägt Lötscher (1991, S. 84 ff.) folgende Linearisierungsregeln vor, die zum guten Teil auch für expositorische Texte anwendbar sind: 1. „Das Nächste ist das Nächste“-- Der Text soll nicht zwischen den Gegenständen springen, sondern sich, soweit möglich, immer zunächst einem Nachbargegenstand bzw. ‚Nachfolger‘ zuwenden. Zu jedem Zeitpunkt sollte dasjenige Wissen thematisiert werden, das bei den gegebenen Interessen vom gegebenen Kontext aus inferenziell / assoziativ am direktesten zugänglich ist. 2. Die Teile einer gerichteten linearen Struktur sollen im Text so thematisiert werden, dass in der Abfolge der Thematisierung der einzelnen Elemente die (gerichtete lineare) zeitliche Struktur des Textes analog zur gerichteten linearen Struktur des Beschreibungsobjekts ist. 3. Wenn ein Element zwei direkte Nachfolger hat, thematisiere wenn möglich zuerst jenes, welches in Bezug auf die Hauptrichtung in einer sekundären Richtung liegt. 4. Wenn eine (Teil-) Struktur fertig beschrieben ist, thematisiere als nächstes den letzten (d. h. „nächst-zurückliegenden“) noch unthematisiert gebliebenen direkten Nachfolger eines früher thematisierten Elementes. 5. Thematisiere und benenne erst das Ganze, dann die Teile. 6. Thematisiere zuerst das Wichtigere, dann das weniger Wichtige. 7. Thematisiere Situationselemente in der Reihenfolge, in der sie aufgrund von Relevanz- oder Empathiefaktoren die Aufmerksamkeit auf sich ziehen. Für den von Brinker (2005, S. 70) behandelten explikativen Text (eine Variante des Typs expositorisch; Brinker fasst darunter etwa wissenschaftliche Erklärungen) schlägt der Autor folgendes zugrunde liegendes Schema vor, das insbesondere die zentralen Bestandteile Explanans (das zu Erklärende) und Explanandum (die Erklärung) unterscheidet: A 1 , A 2 ,-…, A n (singuläre Aussagen, die die Anfangsbedingungen beschreiben) G 1 , G 2 ,-…, G m (Gesetzesaussagen) Explanans E (Aussage, die das zu erklärende Explanandum Phänomen beschreibt) Brinker illustriert dies mit folgendem Textbeispiel; wir setzen die Abkürzungen gemäß dem obigen Schema direkt in den Text ein, er beginnt also mit dem Explanandum, bietet dann die Beobachtungen dar, und schließt mit einer generellen Aussage: 93 5.2 Textglobale thematische Strategien (5.2) Die Heizungsrohre im Keller sind geplatzt (E), weil es heute Nacht Frost gegeben hat (A 1 ) und die Glaswatteverkleidung für die Heizungsanlage nicht geliefert worden ist (A 2 ); denn Frost lässt das Wasser in den Heizungsrohren gefrieren, wenn sie nicht durch eine isolierende Verkleidung gegen Temperatureinflüsse geschützt sind (G 1 ). 5.2.2 Haupt- und Nebenstruktur Werden Texte komplexer, so genügen die eher „idealen“ Modelle der Art von van Dijk oder die Linearisierungsstrategien von Lötscher und Brinker nicht mehr allein zur Strukturbeschreibung. Eine Komplikation besteht darin, dass Texte neben ihrer „hauptsächlichen“ Argumentation, Narration, Exposition o. ä. auch Abschweifungen enthalten können, die bestimmte Aspekte vertiefend behandeln; dabei kann wie oben bereits erwähnt insbesondere der Texttyp wechseln. Für den Fall der Narration hat von Stutterheim (1994) dies mit folgendem kurzen Text illustriert, der eine Antwort auf die Frage „Wie sah denn Deine alte Wohnung aus? “ darstellt: (5.3) Sie hatte vier Zimmer und eine relativ große Küche. Die Räume waren sehr hoch und hell, zwei gingen zur Straße und drei auf einen grünen Hof. Dort haben die Kinder immer gespielt. So etwas fehlt uns jetzt… Im Modell von von Stutterheim bildet die (hier explizite) Fragestellung die Quaestio, die das Thema für den Text setzt und darüber hinaus auch Vorgaben für die Linearisierung der einzelnen Sätze macht. Von Stutterheim nennt diejenigen Sätze, die unmittelbar zur Antwort auf die Quaestio beitragen, die Hauptinformation und alle anderen die Nebeninformation des Textes. Eine weitere Untergliederung schlägt Konerding (2000) vor, indem er zunächst die Hauptinformation von der Restinformation unterscheidet und letztere dann einteilt in subsidiäre Information (restriktive Modifikatoren und Adverbiale zur Identifikation von Diskursgegenständen und zur Situierung des Sachverhalts in Zeit und Raum) und Nebeninformation mit weiterführendem Charakter (vor allem nichtrestriktive Nebensätze). Im Fall der Narration wird die Hauptinformation durch das „Skelett“ der Erzählung gebildet (was geschah zum Zeitpunkt X am Ort Y), während im Hintergrund als Nebeninformation zusätzlich deskriptives, kommentierendes, oder interaktionsbezogenes Material geliefert werden kann. In einer früheren Arbeit hatte Hartmann (1984) anschaulich von der Reliefgebung gesprochen- - bestimmte Teile des Textes rücken nach vorn, andere treten dahinter zurück. Die Trennung zwischen Haupt- und Nebeninformation sollte nicht vermischt werden mit dem Phänomen der kommunikativen Gewichtung, mit der ein Autor Teile des Textes als besonders wichtig ausweisen kann. Eine solche Gewichtung kann lokal an beliebigen Stellen-- sowohl innerhalb der Hauptals auch der Nebeninformation-- vorgenommen werden (vgl. dazu auch Klein u. von Stutterheim, 1992). Zur Illustration hier eine fiktive Bedienungsanweisung: 94 5 Thematische Struktur (5.4) 1. Öffnen Sie das Gehäuse. 2. Nehmen Sie langsam die Tonerkassette (A) aus der Verankerung (B) und halten Sie dabei unbedingt den Entriegelungshebel (C) gedrückt! 3. Befreien Sie die nun frei liegenden Laufschienen (D) der Tonerkassette von etwaigem Tonerstaub. Bei längerem Betrieb des Druckers können sich feine Tonerreste rund um die Kassette ablagern und auf den Laufschienen die Bewegung der Kassette behindern, was dringend vermieden werden sollte. 4. Setzen Sie die neue Tonerkassette ein, wiederum mit hinuntergedrücktem Entriegelungshebel. 5. Schließen Sie das Gehäuse. Hier wird die Hauptinformation durch die Schritte 1-5 gegeben, und lediglich in (3) findet sich nach dem Anweisungssatz eine Nebeninformation, die für die Quaestio „Wie wechsele ich die Tonerkassette“ weniger relevant ist. Markierungen für unterschiedliche ‚Wichtigkeit‘ finden sich jedoch gleichermaßen in der Hauptinformation (zweiter Satz von (2), unbedingt) und in der Nebeninformation (Erläuterung zu (3), dringend). Um im Hartmann‘schen Bild des Reliefs zu bleiben: Wenn die Unterscheidung zwischen Haupt- und Nebeninformation durch unterschiedliche Tiefe beim Blick auf den Text symbolisiert ist, so wäre die kommunikative Gewichtung orthogonal dazu etwa durch eine zweite Farbe (bzw. im graduellen Fall durch unterschiedliche Helligkeitsstufen dieser Farbe) anzuzeigen. Auch Brandt (1994) betont die unterschiedlichen Rollen der Trennung zwischen Haupt-/ Nebeninformation einerseits und der kommunikativen Gewichtung andererseits. Erstere zählt sie zur inhaltlichen Informationsstrukturierung und weist darauf hin, dass etwaige lexikalische Indikatoren typischerweise der Nebeninformation beigegeben werden: Nebenbei gesagt, übrigens etc. Die kommunikative Gewichtung hingegen betreffe die formale globale Informationsstrukturierung, eine durch formale Mittel bewirkte Hervorhebung bzw. Herunterstufung von Informationen, die der Produzentin wichtig oder eben weniger wichtig sind, unabhängig von ihrer Zugehörigkeit zur Hauptinformation. Lexikalische, metakommunikative Ausdrücke werden hier besonders häufig zur Hervorhebung (und nicht zur Herabstufung) eingesetzt: ich möchte betonen, dass-…; wichtig ist in diesem Zusammenhang-…, etc. Auch typographische Mittel (Unterstreichung, Fettdruck, Kursivschrift) verfolgen stets das Ziel der Hervorhebung, nicht der Herabstufung. 95 5.2 Textglobale thematische Strategien 5.2.3 Referenzielle und lexikalische Hinweise auf die thematische Struktur Im Allgemeinen sind Leser in der Lage, auch lange Texte, deren thematische Gliederung nicht oder nur zu einem Teil durch sortenspezifische Konventionen motiviert ist, als kohärent und „gegliedert“ wahrzunehmen. Dass Informationen nicht wahllos, sondern in geordneter Weise aufeinander folgen, ist auch an den referenziellen Ketten und ihren untereinander bestehenden Beziehungen abzulesen, wie wir in Abschnitt 4.2 erläutert haben. Im Folgenden beschäftigen wir uns mit den eng verwandten lexikalischen Ketten, deren Formung besonders ausführlich von Hoey (1991) untersucht wurde. 31 Abb. 5.2 zeigt einen Beispieltext, in dem die vom ersten Satz ausgehenden lexikalischen Relationen markiert sind. Abbildung 5.2: Beispiel für die Bildung lexikalischer Ketten (Hoey, 1991, S. 37) Eine Konzeption lexikalischer Ketten muss zunächst festlegen, welche Arten von paarweisen lexikalischen Bezügen zu annotieren ist und kann dann aus der Summe aller gebildeten Relationen Folgerungen für die thematische Gliederung des Textes ableiten. Für den ersten Schritt schlägt Hoey diese (hier etwas vereinfachten) Kategorien vor, die jeweils nur für offene Wortklassen intendiert sind (es werden also keine lexikalischen Relationen zwischen Präpositionen, Konjunktionen usw. gebildet): 31 Das Phänomen lexikalischer Ketten haben wir bereits bei der Betrachtung der Kohäsionsmittel in Abschnitt 2.2.1 angesprochen. 96 5 Thematische Struktur ▶ Einfache Wiederholung: dasselbe Lexem in der gleichen syntaktischen Funktion. Maria grüßte Klaus. Er grüßte zurück. ▶ Komplexe Wiederholung: ▷ Unterschiedliche Lexeme tragen ein identisches Morphem. Dazu gehören auch Antonyme mit identischem Morphem. Dies ist eine schöne Herberge. Sie beherbergt auch viele Gäste. Während die eine Aufgabe klar ist, erscheint mir die andere eher unklar. ▷ Identische Lexeme mit unterschiedlicher syntaktischer Funktion. Geiz ist heutzutage häufig. Selbst kleine Kinder geizen schon. ▶ Einfache Paraphrase: (Quasi-) Synonymie zwischen Lexemen. Die Rede rief Widerspruch hervor. Das führte zu diplomatischen Verwicklungen. ▶ Komplexe Paraphrase: ▷ Antonyme ohne gemeinsames Morphem. Paul spielt laut und Susi ist eher leise. ▷ Assoziationen, die durch Bildung einer einfachen Paraphrase hergestellt werden: Die Lehrerin verwarnte Marie, und die nahm die Ermahung regungslos hin. Nach Bildung der einfachen Paraphrase verwarnen / ermahnen stellt Ermahnung eine komplexe Wiederholung dar. ▷ Lexeme in Hyperonymie-Relation. Der Löwe erschien in der Dämmerung. Es war ein recht kleines Tier. Abbildung 5.3: Graphstruktur der lexikalischen Kohäsion zwischen Sätzen eines Textes (Hoey, 1991, S. 93) 97 5.3 Lokale thematische Verknüpfung Sind alle Verbindungen dieser Art im Text hergestellt, erfolgt nach Hoey (1991) eine Reduktion auf die Verknüpfung von Sätzen: Wir ermitteln zunächst über den Text hinweg die durchschnittliche Zahl von lexikalischen Relationen, die zwischen den Wörtern von zwei Sätzen bestehen, und erstellen dann eine neue Struktur, in der zwei Sätze genau dann verbunden werden, wenn sie eine überdurchschnittlich hohe Zahl von individuellen lexikalischen Relationen aufweisen. Dabei entsteht eine Graphstruktur wie die in Abb. 5.3 gezeigte. Der zugrunde liegende kurze Text besteht aus 16 Sätzen, die von oben nach unten angeordnet sind. Eine durchgezogene Linie signalisiert eine enge lexikalisch-kohäsive Verbindung zwischen den Sätzen; bei einer gestrichelten Linie ist die Verbindung etwas schwächer ausgeprägt. Bei authentischen längeren Texten wird die Situation unübersichtlicher, folgt aber demselben Prinzip. Die Idee von Hoey ist nun, aus den im Graph enthaltenen Informationen über die Sätze Schlüsse der folgenden Art zu ziehen: ▶ Sätze, die keine Verbindung zu anderen haben (in Abb. 5.3: 5, 9, 10, 13) spielen im Text nur eine untergeordnete Rolle, was der im letzten Abschnitt besprochenen ‚Nebeninformation‘ entspricht. ▶ Sätze, die insgesamt viele Verbindungen aufweisen, spielen eine zentrale Rolle. Würde man eine Zusammenfassung des Textes erstellen, müssten Sie auf jeden Fall berücksichtigt werden. ▶ Sätze, die relativ viele Verbindungen zu später folgenden Sätzen aufweisen (in Abb. 5.3: 1, 3, 4) können einen thematischen Abschnitt eröffnen. ▶ Sätze, die relativ viele Verbindungen zu früheren Sätzen aufweisen, aber keine oder sehr wenige zu späteren Sätzen (in Abb. 5.3: 7, 8, 12, 16) können einen thematischen Abschnitt beenden. Um solche Deutungen abzusichern, müssen viele Details genauer beleuchtet werden, was Hoey (1991) anhand der Analyse eines konkreten Textes ausführt. Zudem ist Abb. 5.3 hier nur als Illustration aufzufassen-- in der Praxis ist die Zahl der Sätze und Verbindungen wie gesagt höher. Der Gedanke aber, durch Auswertung der einzelnen lexikalischen Relationen zunächst auf Verbindungen zwischen Sätzen zu schließen, und dann aus den Eigenschaften des Graphen Eigenschaften der thematischen Textstruktur abzulesen, ist sehr interessant, weil er einen rein intuitiven Eindruck von thematischer Gliederung, wie wir ihn beim Lesen eines Textes bekommen, durch eine regelgeleitete und nachvollziehbare Analyse ersetzt. Sicherlich funktioniert der Ansatz auf verschiedenen Textsorten unterschiedlich gut; Hoey selbst weist darauf hin, dass narrativer Text im Allgemeinen nicht gut geeignet sei. 5.3 Lokale thematische Verknüpfung Begeben wir uns nun von der Gliederung des Textes in thematische Abschnitte auf die Ebene der einzelnen Sätze, so stellt sich-- wenn wir bei unserer „top-down“ Richtung bleiben-- zunächst die Frage nach der Verknüpfung zwischen Sätzen, die dem Leser anzeigen muss, ob das aktuelle Thema beibehalten, spezialisiert oder gewechselt wird. Dies wird in der Literatur (mit recht unterschiedlichen Terminologien und Konzeptionen! ) unter der Überschrift thematische Entwicklung bzw. thematic development diskutiert. Wir verdeutlichen uns die Rolle 98 5 Thematische Struktur dieser Entwicklung an einem (etwas gekürzten) Textbeispiel von Fries (1981), siehe Abbildung 5.4. Es handelt sich um zwei Versionen desselben Texts, wobei die erste dargestellte Version eine bewusst veränderte, die zweite die „originale“ Version ist. Although the United States participated heavily in World War I, the nature of that participation was fundamentally different from what it became in World War II . For the Navy, the earlier conflict was a one-ocean war and for the Army a one-theater war; the latter was a two-ocean war for the Navy and one of five major theaters for the Army. A vital responsibility of the Navy was escort-of-convoy and anti-submarine work in both wars, but it never clashed with the enemy on the surface in the 1917-1918 conflict; whilst some twenty major and countless minor engagements were fought with the Japanese Navy between 1941 and 1945. Although the United States participated heavily in World War I, the nature of that participation was fundamentally different from what it became in World War II . The earlier conflict, was a one-ocean war for the Navy and a one-theater war for the Army; the latter was a two-ocean war for the Navy and one of five major theaters for the Army. In both wars, a vital responsibility of the Navy was escort-of-convoy and anti-submarine work, but in the 1917-1918 conflict it never clashed with the enemy on the surface; whilst between 1941 and 1945 some twenty major and countless minor engagements were fought with the Japanese Navy. Abbildung 5.4: Beispieltext-Varianten World Wars (Fries, 1981) Fries möchte mit diesen unterschiedlich gut lesbaren Textvarianten deutlich machen, wie wichtig die Gestaltung der jeweiligen Satzanfänge für den „Fluss“ des Textes und damit für seine lokale Kohärenz ist. Als Erklärungsmodell wählt Fries die theme / rheme-Konzeption der systemisch-funktionalen Grammatik ( SFG ; Halliday, 2004). Für Halliday ist das theme durch die Position im Satz bestimmt, und zwar handelt es sich um das Material, das dem finiten Verb vorausgeht; der Rest bildet das korrespondierende rheme des Satzes. Halliday untersucht das Englische und macht keine Angaben zur Übertragbarkeit auf andere Sprachen, insbesondere solche mit freierer Wortstellung- - doch seine Frage der theme choice dürfte weitgehend mit der für das Deutsche relevanten Fragestellung der Vorfeldbesetzung übereinstimmen (mit der Ausnahme, dass die Halliday-Schule themes auch für eingebettete clauses sowie groups definiert). Fries und Halliday knüpfen dabei bewusst an die traditionelle Definition von Mathesius (1939) an: „The theme is that which is known or at least obvious in the given situation and from which the speaker proceeds.“ 32 In authentischen Texten sind nun die Satzanfänge keineswegs immer mit referierenden-- also im engeren Sinne „themafähigen“-- Ausdrücken besetzt, sondern auch mit Adverbien oder Konjunktionen. Fries legt daher fest, dass es verschiedene Typen von themes gibt, gemäß den metafunctions der SFG , bezüglich derer ein Satz im Stil einer Partitur jeweils gleichermaßen analysiert wird: 32 Allerdings nimmt Halliday dann eine Trennung zwischen positionsbestimmtem theme und der informationellen given / new Unterscheidung vor-- siehe den nächsten Abschnitt. 99 5.3 Lokale thematische Verknüpfung Beschreibungsebenen der systemisch-funktionalen Grammatik: ▶ Ideational: Prozess und Partizipanten (Agens, Instrument, etc.) ▶ Interpersonal: Beziehung zwischen Produzentin und Adressatin, ausgedrückt durch Satzmodus, Modalität, etc. ▶ Textual: Text-interne Verknüpfung, ausgedrückt durch Konnektoren, etc. Ein Satz wie Frankly, however, yesterday he was obusive hat für Fries mithin drei themes: Das interpersonale frankly zeigt die Einstellung des Sprechers zum Sachverhalt, das textuelle however verbindet den Satz mit dem vorangehenden, und das ideationale yesterday verankert den Sachverhalt zeitlich. Die auf solche Weise von Fries deklarierten themes sind im Beispieltext World Wars jeweils kursiv gesetzt. Fries betont nun, dass die themes vom Autor bei der Textproduktion weitgehend frei gewählt werden (außer bei sehr einfachen, „kanonisch“ geformten Sätzen), somit funktional zu interpretieren sind. In der unteren Version des Beispiels ist diese Wahl gelungener, denn es wird kontinuierlich der Kontrast zwischen den beiden Kriegen thematisiert, anstatt zwischen verschiedenen Gesichtspunkten hin und her zu springen. Die Summe der theme choices des Autors in den einzelnen Sätzen ergibt dann die thematische Entwicklung des Textes, wie sie beispielsweise in der häufig zitierten Arbeit von Daneš (1974) beschrieben wurde. So kann das Thema von einem Satz zum anderen konstant bleiben (Klaus öffnete die Tür. Er erstarrte vor Schreck.), oder ein Element aus dem Rhema des vorangehenden Satzes kann zum Thema werden (Klaus öffnete die Tür. Sie knarrte beträchtlich.). Weiterhin nannte Daneš die Möglichkeit, ein Thema aus einem anderen abzuleiten, was dem in Abschnitt 4.1 beschriebenen bridging entspricht, außerdem die Aufspaltung eines Themas in mehrere Subthemen in den Folgesätzen. Fries und andere Autoren (etwa von Stutterheim, 1994) weisen nun darauf hin, dass die Form der thematischen Entwicklung von der Textsorte und dem Texttyp mitbestimmt wird. So sei es für die Narration typisch, dass das Thema von handelnden Personen oder von Zeit- und Ortsbestimmungen gebildet wird. Im argumentativen Text hingegen sei die inhaltliche Struktur (der Argumentationsverlauf) potenziell kompliziert, weshalb die Linearisierung es dem Leser möglichst einfach machen solle, diese Struktur nachzuvollziehen-- und so findet sich vorwiegend der verkettende Verlauf, bei dem das Thema jeweils aus dem Rhema des Vorgängersatzes hervorgeht. Einen anschaulichen Beleg für die These der Textsorten- und Texttypabhängigkeit der theme choice geben Ramm u. Villiger (1995, S. 10). Die Autorinnen untersuchten u. a. Reiseführer unter thematischen Gesichtspunkten und fanden in Stadtbeschreibungen eine deutliche Tendenz daür, das Satzthema jeweils mit Ortsangaben zu belegen, wie in diesem (etwas gekürzten) Beispiel, wiederum mit kursiv gesetzten Themen: (5.5) Sevillas Zentrum liegt östlich eines Seitenkanals des Rio Guadalquivir, der die Stadt in Nord-Süd-Richtung durchzieht. Hauptstraße ist die Avenida de la Constitucion; in ihrer unmittelbaren Umgebung liegen-… die bedeutendsten Sehenswürdigkeiten der 100 5 Thematische Struktur Stadt. Östlich schließt sich das Barrio de Santa Cruz an. Die Avenida de la Constitucion beginnt im Süden-… Hier liegt auch das Geschäftsviertel um die Haupteinkaufsstraße Calle Sierpes. Südlich des engeren Zentrums erstrecken sich-… Wir können diese Tendenz als textsortenabhängig-konventionalisiert deuten, aber auch als im Einklang mit der Textfunktion: Der Text soll ja die Leserin orientieren, die (vor Ort oder vorbereitend bei der Anreise) sich ein mentales Modell von den örtlichen Gegebenheiten schaffen möchte. Eine einheitliche Verkettungsstrategie ist dabei ebenso nützlich wie im World Wars Text (Abb.5.4), der zwei Ereignisse unter verschiedenen Gesichtspunkten vergleichend gegenüberstellt. Entscheidend ist, was auch von Stutterheim (1994, S. 260; Hervorh. d. Verf.) betont: „Kohärente Texte sind dadurch gekennzeichnet, dass sie einem einheitlichen Linearisierungskriterium folgen“-- und dass dies sich auch in der Wahl der themes niederschlägt. 5.4 Die Sicht der Informationsstruktur Auf der Ebene des Satzes wird der Thema-Begriff in der Linguistik im Rahmen der Informationsstruktur behandelt. Dies beruht auf der Erkenntnis, dass die Struktur eines Satzes nicht allein von grammatischen Bedingungen bestimmt wird, sondern darüber hinaus von dem Ziel einer gelingenden Informationsübermittlung im Text oder im Gespräch. Zu den Pionieren dieser Untersuchungen zählte etwa Hermann Paul (1975, orig. 1880), der im Anschluss an v. d. Gabelentz zur Abgrenzung vom grammatischen auch vom psychologischen Subjekt und Prädikat sprach. Das psychologische Subjekt sei „das, worüber der Sprechende den Hörenden denken lassen, worauf er seine Aufmerksamkeit hinleiten will, das psychologische Prädikat dasjenige, was er darüber denken soll.“ Im letzten Abschnitt haben wir mit der theme / rheme Dichotomie bereits eine (im Rahmen der systemisch-funktionalen Grammatik entwickelte) Konzeption der Informationsstruktur kennengelernt; im Folgenden werden wir zwei weitere ansehen, die von Relevanz für eine thematische Textstruktur sind. Aboutness Topik Die Gliederung eines Satzes in Topik und Kommentar folgt der Unterscheidung zwischen Satzgegenstand und Satzaussage, also dem Objekt, über das gesprochen wird, und der Aussage, die über dieses Objekt getroffen wird. Zur Abgrenzung von anderen in der Linguistik verwendeten Topik-Begriffen (siehe dazu Jacobs, 2001) wird es häufig als aboutness-Topik (im Folgenden: ab-Topik) bezeichnet. Es kann zwar nicht völlig trennscharf (etwa durch formale Kriterien) definiert werden, doch Jacobs nennt drei Kriterien, die prototypische ab-Topiks erfüllen: 101 5.4 Die Sicht der Informationsstruktur Kriterien für aboutness-Topiks nach Jacobs (2001) ▶ Informationelle Trennung: Das prototypische ab-Topik steht vor der Prädikation, die über es getroffen wird. Beim Lesen oder Hören vollzieht sich die semantische Verarbeitung des Satzes in zwei Schritten: einer für das Topik, einer für den Rest des Satzes. ▶ Prädikation: Das prototypische ab-Topik füllt eine Position im Valenzrahmen des Prädikats (d. h. es ist nicht nur ein Adjunkt). ▶ Adressierung: Das prototypische ab-Topik referiert auf eine Entität, die als „Adresse“ für die Speicherung von Informationen in der gemeinsamen Wissensbasis (common ground) von Autor und Leser fungiert, und die während der inkrementellen Diskursverarbeitung ständig aktualisiert wird. Als einfaches aber illustratives Beispiel (von Reinhart, 1983) betrachten wir die Unterscheidung zwischen Aristotle Onassis married Jacqueline Kennedy und Jacqueline Kennedy married Aristotle Onassis. Beide Sätze berichten über denselben Sachverhalt, doch die mentale „Adresse“ ist im ersten Fall A. Onassis und im zweiten J. Kennedy. So wie in diesen Sätzen korreliert das ab-Topik häufig mit Subjekt und / oder Satzanfang, jedoch ist beides keineswegs obligatorisch. Abbildung 5.5: Topik-Annotation eines Textes (Ausschnitt) (Mamprin u. Stede, 2016, S. 108) 102 5 Thematische Struktur Die Annotationsrichtlinien von Mamprin u. Stede (2016) versuchen die Identifikation von aboutness- und zwei anderen Topik-Arten in authentischen Texten zu operationalisieren. Der erste Schritt besteht darin, die syntaktischen Bereiche zu markieren, in denen jeweils ein ab-Topik zu verorten ist. In einfachen Fällen handelt es sich um vollständige Sätze, so wie im Textbeispiel in Abb. 5.5 (Markierung der Bereiche durch-[…] TD ). Komplexe Sätze sind in mehrere Bereiche aufzuteilen; diese Aufgabe diskutieren wir später in Kapitel 9. Ab-topiks sind durch den Index ‚ab‘ gekennzeichnet. Die Richtlinien unterscheiden darüber hinaus zwei weitere Arten von Topiks: Das frame-setting Topik (Index ‚fs‘) setzt einen zeitlichen, örtlichen oder manchmal anderweitig abstrakten Rahmen für die Gültigkeit der Satzaussage. Eine Konstellation kontrastiver Topiks (Index ‚co‘) verknüpft unterschiedliche Spezialisierungen eines gemeinsamen Oberbegriffs; im Beispiel ist es neue, sinnvolle Verkehrsabläufe (numerischer Index; hier ‚1‘), das durch die Entlastungsstaße und die autofreie Stadt in den beiden Folgesätzen jeweils in verschiedene Richtungen ausgeführt wird. Sätze, die weder ein abnoch ein co-Topik haben, werden als ‚thetisch‘ bezeichnet und erhalten den Index ‚th‘; sie beschreiben entweder einen neuen, nicht topikal anknüpfenden Sachverhalt (‚event‘) oder führen eine neue Entität in den Text ein (‚entity‘). Die durch die Topiks der Einzelsätze entstehende Konstellation liefert dann Hinweise auf das Textthema beziehungsweise den Verlauf von Unterthemen über den Text hinweg. Im Beispieltext ist die Folge der ab-Topiks nach der Auflösung von Pronomen: Wittstock-- die Innenstadt-- die Wittstocker-- die Wittstocker. Die Sequenz zeigt an, dass im Text zuerst der Ort thematisiert wird und dann seine Bewohner in ihrer Rolle als Gestalter der Verkehrsinfrastruktur des Ortes. Dies wird durch die sich im Text dann anschließenden kontrastiven Topiks deutlich: neue, sinnvolle Verkehrsabläufe-- die Entlastungsstraße für Lkw-- eine autofreie Stadt. Question under Discussion Eine zweite in der Informationsstruktur angenommene Dichotomie im Satz ist die zwischen Fokus und Hintergrund. Das Fokuselement ist die Information, die innerhalb der Äußerung den größten Mitteilungswert besitzt. Es wird vor allem (aber nicht ausschließlich) prosodisch markiert und lässt sich am einfachsten in Frage / Antwort-Paaren herauspräparieren: (5.6) A: Hast Du gestern Kommilitonen getroffen? B: Ja, ich bin nachmittags MAR tin begegnet. Die durch Kapitälchen als akzenttragend markierte Silbe zeigt an, dass Martin das Fokuselement ist, während die durch die Antwort ebenfalls neu übermittelte Information nachmittags nur eine Nebenrolle spielt. Eine Modellierung, die eine Verbindung zwischen diesem Phänomen und der Diskursstruktur herstellt, ist der Question under Discussion ( QUD ) Ansatz. Der Gedanke ist, dass jeder Satz im Text auf eine in der Regel implizit bleibende Frage antwortet: Die inkrementelle, satzweise Verarbeitung des Textes werfe jeweils eine solche Frage auf, und der nachfolgende Satz gehe dann auf sie ein. Dem entspricht recht genau die Idee der Quaestio (Hellwig, 1984, von Stutterheim, 1994), die wir oben in Abschnitt 5.2.2 als Instrument zur Bestimmung von 103 5.4 Die Sicht der Informationsstruktur Haupt- und Nebenstruktur kennengelernt haben. In der Tat gilt die Quaestio als Ursprung der QUD Idee, die heute allerdings großenteils in der formalen Pragmatik für die Erklärung bestimmter Phänomene auf Satzebene genutzt wird. Für die Textebene besteht das hauptsächliche Interesse an einer Vorhersage der Fokus / Hintergrund Gliederung von Sätzen, doch anhand des folgenden (hier etwas ergänzten) Beispiels weisen Benz u. Jasinskaja (2017) auch auf eine wichtige Beziehung zur Textstruktur hin: (5.7) a I did two things on my seventy-fifth birthday. b I visited my wife‘s grave. c Then I joined the army. c‘ On the seventy-sixth I will do the same thing. Der aus (a-b-c) bestehende Text ist kohärent, doch eine Variante, die nach (b) endet oder mit (c‘) fortfährt, wäre problematisch. Benz und Jasinskaja stellen heraus, dass dies von keinem der heute gängigen Ansätze zur Modellierung der Textstruktur durch Kohärenzrelationen (siehe Kap. 10) erfasst wird. Eine durch (a) aufgeworfene Frage „Welche zwei Dinge tat der Autor“ würde nun aber genau die Erwartung formulieren, dass zwei verschiedene Antworten folgen müssen, und die Einlösung dieser Erwartung wäre durch den QUD -Mechanismus sicherzustellen. Eine Herausforderung besteht nun offensichtlich darin, hinreichend präzise anzugeben, wie in einem bestimmten Kontext eine bestimmte QUD hervorgebracht wird (und warum diese und nicht eine andere). Meist wird dies an handgefertigten Beispielen diskutiert, doch Riester u. a. (2018) haben sich der Aufgabe gestellt, die QUD -Generierung in Form von Annotationsrichtlinien für authentische Texte zu formulieren. Die Analyse eines Textes besteht hier in der Konstruktion einer Baumstruktur, die dann die thematische Textstruktur repräsentiert: Die internen Knoten des Baums werden durch die (explizit zu machenden) Fragen gebildet, während die den Diskurssegmenten entsprechenden Aussagen in der linearen Abfolge die Blattknoten bilden. Der zentrale Annotationsschritt besteht also darin, nach jedem Segment eine geeignete Frage zu formulieren und diese an geeigneter Stelle in die Baumstruktur zu integrieren. Als Beispiel zeigt Abb. 5.6 die Baumstruktur für den folgenden Textausschnitt (A3-A4-A5), in den die zu bildenden Fragen (Q4, Q5) bereits eingetragen sind: Abbildung 5.6: QUD -Baum für einen Textausschnitt (Riester u. a., 2018) 104 5 Thematische Struktur (5.8) A3: Wir haben ja nun alle von Konflikten gehört, Q4: What about conflicts? A4: aber es gibt immer Konflikte Q5: What follows from the fact that there are always conflicts? A5: und das bedeutet nicht automatisch, dass dann Tausende von Flüchtlingen bis nach Deutschland kommen. Um den Spielraum für die Konstruktion der Fragen zu einem hinreichenden Grad einzuschränken, erläutern Riester u. a. (2018) eine Reihe von Prinzipien, darunter das grundlegende Prinzip der Q-A-Congruence („ QUD s must be answerable by the assertion(s) that they immediately dominate“) sowie eines zur Nutzung des Informationsstatus der Diskursgegenstände: Maximize-Q-Anaphoricity („Implicit QUD s should contain as much given material as possible.“) 5.5 Annotation thematischer Information in Korpora Nur wenige Ansätze zur Annotation von ‚Thema‘ sind bisher vorgeschlagen und in Korpora realisiert worden. Für die lexikalische Kohäsion besteht das Problem darin, dass (wie Hoey, 1991, gezeigt hat) sehr viele Verbindungen bestehen, die sich auf etwas längeren Texten kaum noch manuell annotieren lassen. Ein Ausschnitt der von Hoey vorgeschlagenen Relationen wurde für Substantive im GECC o Korpus (siehe Abschnitt 2.5) annotiert. Eine Studie zur von Annotatoren erzielten Übereinstimmung bei der Markierung von lexikalischen Ketten in wissenschaftlichen Aufsätzen haben Hollingsworth u. Teufel (2005) vorgelegt. Auch ein Ansatz zur automatischen Erstellung der Ketten wird dort kurz beschrieben, der an die „klassische“ Arbeit zu diesem Thema von Morris u. Hirst (1991) anschließt. Dort wurden lexikalische Relationen mit Hilfe eines Thesaurus annotiert und gezeigt, dass sich daraus wertvolle Hinweise auf die thematische Textstruktur gewinnen lassen. Abbildung 5.7: Schichten-orientierte Annotation mit EXMAR a LDA 105 5.6 Übungsaufgaben Auch Aboutness-Topiks wurden bisher nur selten mit Korpora bearbeitet. Cook u. Bildhauer (2013) haben eine sorgfältige Annotationsstudie durchgeführt, die zu einem eher skeptischen Resultat hinsichtlich der zu erreichenden Annotator-Übereinstimmung gelangte. Im PCC wurde eine Topik-Annotation erstellt, sie ist aber noch nicht Teil der zuletzt publizierten Version des Korpus. Als Werkzeug wurde der ‚Partitur-Editor‘ EXMAR a LDA 33 genutzt, der eine schichtenbasierte Annotation von jeweils individuell zu definierenden Segmenten erlaubt, siehe Abb. 5.7. Der Editor wurde primär als Transkriptionswerkzeug für gesprochene Sprache entwickelt, kann jedoch auch für die Bearbeitung geschriebener Texte verwendet werden. Die Benutzerin kann beliebig viele Annotationsebenen einführen und benennen, und (wichtig) die Segmente für die Annotationen müssen nicht übereinstimmen, sondern können einander überlappen, wie auch Abb. 5.7 zeigt. Exmaralda eignet sich damit sehr gut für eine „tiefe“ Annotation von Sätzen oder kurzen Textspannen. Die im Bildschirmabzug zu sehende Topik-Annotation (im unteren Bereich) wurde auf der Grundlage von automatisch vormarkierter syntaktischer Information und referierenden Ausdrücken erstellt, um Kompatibilität zur referenziellen Struktur sicherzustellen. Weiterführende Literatur Um in der recht unüberschaubaren Literatur zu verschiedenen Aspekten von Thema einen „roten Faden“ zu gewinnen, ist der Beitrag von Hoffmann (2000) nützlich. Die meisten der in diesem Kapitel behandelten Aspekte versucht von Stutterheim (1994) im Quaestio-Modell einheitlich zu behandeln; die Arbeit bezieht sich auf gesprochene Sprache, gibt aber einen gut verständlichen Überblick über die einzelnen Fragestellungen. Zur Vertiefung der Abschnitte 5.1 und 5.2 sei die Monographie von Lötscher (1987) empfohlen. Für Fragen zum Zusammenhang zwischen Informationsstruktur und Diskursphänomenen schließlich ist als Einstieg neben Hoffmann (2000) auch der Überblick von Kruijff-Korbayová u. Steedman (2003) gut geeignet, und speziell zum Topik-Begriff die Arbeit von Jacobs (2001). 5.6 Übungsaufgaben 1. Prüfen Sie, inwieweit Ihr Kommentar sich durch Anwendung der von van Dijk (1980) vorgeschlagenen ‚Makroregeln‘ (s. S. 90) zusammenfassen lässt. Können Sie weitere Regeln angeben, die man dafür benötigen würde? 2. Untersuchen Sie Ihren Kommentar und zusätzlich einen längeren Zeitungstext auf thematische Gliederungssignale: Mit welchen lexikalischen oder syntaktischen Mitteln wird angezeigt, wenn sich das Thema verschiebt? 3. Versuchen Sie, in den Sätzen Ihres Kommentars einerseits themes im Sinne von Halliday / Fries, andererseits aboutness topics (Satzgegenstände) zu identifizieren. Prüfen 33 http: / / exmaralda.org/ de/ (Zugriff 8. 1. 18). 106 5 Thematische Struktur Sie dann, wie die Satzverkettung mit diesen themes und topics arbeitet. Machen Sie Experimente mit Umstellungen von Konstituenten (vor allem Topikalisierung): Wie wird die Satzverkettung dadurch beeinträchtigt? 4. Versuchen Sie, auch die Idee der Question under Discussion auf Ihren Kommentar anzuwenden. Lässt sich nach einem Satz jeweils eine Frage einfügen, die den Anschluss des Folgesatzes motiviert? Lassen sich diese Fragen systematisch formulieren? Für eine genauere Beschäftigung mit diesem Thema lesen Sie die Annotationsrichtlinien von Riester u. a. (2018). 107 6.1 Ereignisse in der temporalen Struktur 6 Temporale Struktur (6.1) Heute morgen bin ich schon um halb sieben aufgestanden. Es regnete in Strömen. Als ich in der Schule ankam, läutete gerade die Glocke zur ersten Stunde. Die Lehrerin erschien mit einer dicken Plastiktüte unterm Arm. In dieser Satzfolge, ebenso wie im einleitenden Beispiel des letzten Kapitels, kann die referenzielle Struktur nicht die „Hauptverantwortung“ für die Textualität tragen. Abgesehen vom zweimaligen Auftreten von ich und einigen bridging-Relationen zwischen den Diskursgegenständen des Bereichs Schule gibt es keine referenziellen Verbindungen. Eine thematische Kontinuität scheint gegeben, aber im Vergleich zum Kurztext aus 5.1 tritt diesmal ein wichtiges Merkmal hinzu: Wir sind geneigt, die benannten Ereignisse dahingehend zu interpretieren, dass sie sich in einer ganz bestimmten zeitlichen Reihenfolge abgespielt haben- - und eine solche Interpretation nehmen wir auch dann vor, wenn sie nicht durch eindeutige sprachliche Signale (wie aufeinanderfolgende Uhrzeitangaben oder durchgehende Verwendung temporaler Konnektoren) erzwungen wird. Wir wenden uns damit einer dritten Ebene der Textkohärenz zu und runden damit das Spektrum ab, das Givón (1983) als drei Typen der Kontinuität in Texten beschrieben hat: die Gegenstandskontinuität, die thematische Kontinuität und die Ereigniskontinuität. 6.1 Ereignisse in der temporalen Struktur In Abschnitt 3.3 haben wir herausgestellt, dass die zentrale Aufgabe bei der Rezeption von Texten des Typs narrativ darin besteht, die geschilderten Ereignisse soweit wie möglich in ihrer zeitlichen Abfolge zu rekonstruieren. Dabei verwenden wir den Begriff ‚Ereignis‘ in diesem Kapitel etwas vereinfachend so, dass er Zustände mit einschließt, also anders als es in der Regel in der Literatur zu Aspektualität geschieht. Dort wird gemeinhin unterschieden zwischen ▶ Ereignis (engl. event): Geschehnis, bei dem jemand aktiv handelt und / oder das eine Veränderung mit sich bringt, z. B. trinken, aufbauen, einsehen ▶ Zustand (engl. state): anhaltendes inaktives Geschehen, z. B. besitzen, rot sein, in Köln sein Wenn wir nun einem Text entnommen haben, in welcher Reihenfolge die Ereignisse verlaufen, so haben wir einen wesentlichen Aspekt der Narration verstanden; die nicht minder bedeutenden Aspekte der Charaktere, ihrer Motivationen und tieferer Interpretationsebenen lassen wir hier einmal beiseite. Eine weitere Vereinfachung: Wir ignorieren hier die Aufgabe, etwaige unterschiedliche Handlungsstränge einer Narration voneinander zu unterscheiden; stattdessen beschränken wir uns auf relativ einfache Fälle einer einzelnen Ereignisfolge. Wenn über den „minimalen Fall“ von genau zwei Ereignissen berichtet wird, so können diese prinzipiell in drei verschiedenen temporalen Beziehungen zueinander stehen (Allen, 1984), siehe die schematische Darstellung in Abbildung 6.1. Zum einen können sie aufeinanderfolgen, und zwar entweder unmittelbar angrenzend, oder mit zeitlichem Abstand. Die Unterscheidung kann durch temporale Adverbien markiert werden, wie in diesen Beispielen: 108 6 Temporale Struktur (6.2) Gerade als der Bus die Haltestelle erreicht hatte, sprang die Katze auf die Straße. (6.3) Der Bus erreichte die Haltestelle. Kurz darauf sprang die Katze auf die Straße. Die Reihenfolge kann natürlich auch die umgekehrte sein, also das im zweiten Satz beschriebene Ereignis dem des ersten zeitlich vorausgehen. (Abb. 6.1 macht keinen Unterschied hinsichtlich der Reihenfolge der Ereignisse.) Die zweite Möglichkeit besteht darin, dass ein Ereignis das andere zeitlich einschließt: Während ich den ‚Tatort‘ sah, rief mich Max an. Theoretisch sind hier vier Varianten zu unterscheiden, nämlich kann das eingeschlossene Ereignis seinen Anfang oder sein Ende mit dem einschließenden gemeinsam haben; oder auch beides, womit der Spezialfall der Identität der Zeiträume vorliegt; oder auch keines, womit im engen Sinn vollständige Eingeschlossenheit vorliegt. Diese Varianten in der sprachlichen Formulierung voneinander abzugrenzen, ist jedoch umständlich, und so lassen sich die Varianten in Texten nur selten sicher identifizieren. Die dritte Möglichkeit ist die der Überlappung beider Ereignisse, bei der also ein Endpunkt des einen innerhalb des anderen Ereignisses liegt. Ein Beispiel wäre Während wir nach Glienicke radelten, begann ein vierstündiges Gewitter, sofern wir unterstellen, dass die Radfahrt nicht das gesamte Gewitter überdauert hat. Abbildung 6.1: Temporale Relationen zwischen Ereignissen nach Allen (1984) Die linguistische Markierung des temporalen Zusammenhangs erfolgt einerseits durch lexikalische Einheiten, vor allem durch geeignete Konnektoren (während, daraufhin, zuvor uvm.); dies ist im eingangs genannten Beispiel (6.1) zwischen den mit als verbundenen Teilsätzen des dritten Satzes der Fall. Dort findet sich mit gerade auch ein Beispiel für ein temporales Adverb, das nicht als Konnektor fungiert (da es nicht semantisch zweistellig ist- - siehe zu Konnektoren den Abschnitt 9.3.1). Die zweite Informationsquelle sind die syntaktischen Merkmale Tempus und Aspekt (etwa: ist das Ereignis abgeschlossen oder nicht- - perfektiver Aspekt). Ergänzen wir das Beispiel (6.1) um den Satz Sie hatte die Klassenarbeiten also bereits korrigiert, so ist dieses Ereignis nicht nur als abgeschlossen, sondern überdies als „vorzeitig“ markiert: Wir erfahren, dass es sich vor allen anderen zuvor erwähnten abgespielt hat. Eine dritte Komponente für das Zusammenspiel der temporalen Signale ist die dem Verb inhärente Aktionsart; zwei dieser Klassen sind beispielsweise durative (z. B. regnen) und punktuelle Verben (z. B. platzen). Oft 109 6.1 Ereignisse in der temporalen Struktur ist diese freilich nicht lexikalisch eindeutig fixiert, sondern erst im Kontext interpretierbar: Mit Läuten kann das einmalige Anschlagen der Türglocke gemeint sein, oder aber ein länger anhaltendes Ereignis- - wie in besagtem drittem Satz von (6.1), den wir wohl so verstehen, dass das Ereignis des Ankommens zeitlich innerhalb des Läutens liegt. Zwischen Verb, Argumenten und auch Adjunkten kann es zu recht komplexen kompositionalen Beziehungen kommen, die insgesamt zur Spezifizierung der temporalen Ausdehnung des Ereignisses, und damit auch zu den möglichen Relationen zu den im Text benachbarten Ereignissen beitragen; dies können wir hier nur in Andeutungen skizzieren. Ein bekanntes Phänomen ist beispielsweise das der bare plurals, die die vom Verb stammende Aktionsart im Satz ändern können: (6.4) a Melissa überquerte die Straße. b Ameisen überquerten die Staße. Die Aktionsart in 6.4[a] ist accomplishment: das beschriebene Ereignis erreicht seinen Endpunkt. Demgegenüber beschreibt 6.4[b] eine activity: Das Ereignis hält für unbestimmte Zeit an. Ein gebräuchlicher Test für diese Unterscheidung ist die Einfügung eines temporalen Adverbials in den Satz, hier eines, das eine Dauer bezeichnet, wie eine halbe Stunde lang. Ergänzen wir diese Phrase in 6.4[b], ergibt sich keine Änderung der Akzeptabilität und der Bedeutung (abgesehen von der hinzukommenden Zeitdauer natürlich); in 6.4[a] hingegen würden wir den Satz dann vermutlich so verstehen, dass Melissa kontinuierlich die Straßenseite wechselt, was eine Änderung gegenüber dem Originalsatz darstellt. Ein weiteres vielfach untersuchtes Phänomen besteht darin, dass die zeitliche Ausdehnung von beschriebenen Zuständen eine andere ist als die von anderen Ereignistypen. Ein Beispiel von Dowty (1986): (6.5) 1 John entered the president‘s office. 2 The president walked over to him. 2‘ The clock on the wall ticked loudly. Während wir 6.5[2] als auf 6.5[1] folgend interpretieren, gehen wir davon aus, dass der in 6.5[2‘] beschriebene Zustand auch vor und nach dem Ereignis von 6.5[1] besteht. Eine häufig genannte „Faustregel“ besagt dementsprechend, dass Zustandsbeschreibungen die Ereignisse der Narration nicht vorantreiben; dies ist allein anderen Ereignistypen vorbehalten.-- Allerdings ist Dowtys Beispiel nicht ganz unabhängig von unserem Weltwissen (hier: über Uhren und ihre Geräusche); dessen Rolle wird noch klarer bei dem folgenden Beispiel von Webber (1988), mit dem wir diese sehr kurze Exkursion in die Fragestellungen von Aspekt und Aktionsart beenden wollen. (6.6) a John bought Mary some flowers. He picked out three red roses, two white ones and one pale pink. 110 6 Temporale Struktur b John went into the florist shop. He picked out three red roses, two white ones and one pale pink. Im Text ist die temporale Relation also sehr oft nicht vollständig expliziert, vielmehr muss der Leser sie sich selbst erschließen. Dabei liegt gewöhnlich das Prinzip der Ikonizität zugrunde: In Abwesenheit expliziter Signale, die eine gegenläufige Orientierung anzeigen, gehen wir davon aus, dass der Text Ereignisse in der Reihenfolge schildert, in der sie sich auch zugetragen haben (vgl. 6.6[b]). Das Prinzip ist auch dann noch erfüllt, wenn wir das Ereignis des zweiten Satzes nicht als dem ersten nachfolgend, sondern als Teil-Ereignis des ersten interpretieren (vgl. 6.6[a]). Falls aber unser Weltwissen es nahelegt, so gelangen wir auch zu einer zum Ikonizitätsprinzip widersprüchlichen Interpretation. Typische Fälle davon sind schematische kausale Verbindungen, die wir bei der Rezeption eines Satzpaars unterstellen, wie in diesem Beispiel von Asher u. Lascarides (2003): John fell. Max pushed him. Die Versuchung, das Ereignis des zweiten Satzes als Ursache des im ersten beschriebenen, und damit als temporal vorangehend, zu begreifen, ist in der Tat groß. Gehen wir nun von der isolierten Betrachtung zweier Ereignisse zur Analyse der temporalen Struktur ganzer (wenn auch einfacher) Texte über, so besteht die Aufgabe darin, zunächst einmal die Ereignisse zu identifizieren, die für die zeitliche Einordnung des berichteten Geschehens relevant sind. In unserem Beispiel (6.1) gilt das für alle dort genannten Ereignisse; sie können jeweils zeitlich aufeinander bezogen werden. Die Abweichungen von solchen „idealen“ Narrationen sind aber natürlich vielfältig, und insbesondere müssen vier Punkte berücksichtigt werden: ▶ Nicht-Ereignisse: Sätze, die kein Ereignis zum Ausdruck bringen, sondern beispielsweise generische Zustandsbeschreibungen (z. B. Mein Hund ist wirklich dumm) darstellen, werden in der temporalen Struktur nicht berücksichtigt. Im Beispieltext Findus (Abb. 6.2) gilt dies für die Segmente 9 und 10. ▶ Pseudo-Ereignisse: Manche Sätze scheinen über Ereignisse zu berichten, doch handelt es sich nicht um ein konkretes, temporal zu verankerndes Ereignis, sondern um allgemeine Aussagen über das Auftreten solcher Ereignisse. Dazu zählen im Findus-Text die Segmente 1 bis 4. Sie tragen ebenfalls nicht zur temporalen Struktur bei. ▶ Negation und Modaloperatoren: Wenn über ein Ereignis berichet wird, dass es nicht stattgefunden hat (Sie hatte die Klassenarbeiten noch nicht korrigiert), kann dieses Ereignis nicht Teil der temporalen Struktur sein, sondern muss entweder ignoriert oder besonders markiert werden. Gleiches gilt für Ereignisse im Skopus von Modaloperatoren: Sie hätte eigentlich die Klassenarbeiten korrigieren wollen. ▶ Eingebettete Ereignisse: Ebenfalls eine Sonderrolle spielen Ereignisse, die in Komplementsätzen zu kognitiven Verben auftreten oder die als direkte oder indirekte Rede gekennzeichnet sind. Im Text Findus gilt das für Segment 13. Solche Segmente können nicht ignoriert werden, weil sonst das einbettende Segment unvollständig in der Struktur verbliebe; sie müssen aber gesondert markiert werden, da sie selbst nicht den Ereignisfluss vorantreiben. 111 6.1 Ereignisse in der temporalen Struktur [1] Findus hat dreimal im Jahr Geburtstag, [2] einfach, weil das so lustiger ist. [3] Jedes Mal, wenn der Kater Geburtstag hatte, [4] backte Pettersson ihm eine Pfannkuchentorte. [5] Wie gewöhnlich war Pettersson an jenem Morgen im Hühnerstall gewesen [6] und hatte die Eier in den Korb gesammelt. [7] Und jetzt saß er auf der Bank vor der Küchentür [8] und putzte die Eier. [9] Hübsch sauber sollten sie sein, [10] denn Pettersson war schließlich ein ordentlicher alter Mann. [11] Findus lief ungeduldig auf der Bank hin und her [12] und wartete darauf, [13] dass es mit der Pfannkuchenbäckerei endlich losging. Aus: Sven Nordqvist: Eine Geburtstagstorte für die Katze Abbildung 6.2: Beispieltext Findus Abbildung 6.3: Temporale Struktur des Beispieltexts Findus Nach einem Vorschlag von Mani u. Pustejovsky (2004) wird die temporale Struktur eines Textes als Baum dargestellt, in dem zunächst jedes Ereignis bzw. das von ihm ausgefüllte Zeitintervall einen Knoten bildet. 34 Die Kanten des Baums, also die Beziehungen zwischen Mutter- und Töchterknoten, repräsentieren die Inklusion von Ereignissen: Liegt die zeitliche Ausdehnung eines Ereignisses innerhalb der eines anderen, so bildet ersteres einen Tochterknoten. 35 Weitere Knoten können durch abstrakte Ereignisse gebildet werden, denen kein Segment des Texts entspricht, sondern die für die Analyse eine Reihe von Ereignissen zusammenfassen können. Auf diese Weise entsteht auch der Wurzelknoten des Baums, der als übergreifendes „story“-Ereignis alle geschilderten Geschehnisse zusammenfasst. Abbildung 6.3 zeigt die so konstruierte Struktur für den Beispieltext Findus, wobei wir zusätzlich die Relation emb für ‚embedded‘ in das Schema aufgenommen haben; sie besteht hier zwischen den Knoten 12 und 13. Das abstrakte Ereignis A1 repräsentiert die Geschichte als Ganzes, und 34 Dies ist nicht der erste Vorschlag seiner Art; beispielsweise benutzt auch Eberle (1991) eine solche Baumstruktur, die noch mit verschiedenen Relationen angereichert ist. 35 Die Autoren erwähnen nicht den Grenzfall der Identität der Zeitintervalle-- dann muss man sich entscheiden, welches Ereignis den Mutterknoten bildet. 112 6 Temporale Struktur die beiden unmittelbar darin eingeschlossenen Ereignisse sind der morgendliche Aufenthalt im Hühnerstall (5) und das „jetzige“ Sitzen auf der Bank (7). Das Sammeln (6) und Putzen (8) der Eier sind ihrerseits wiederum jeweils darin eingeschlossen. Segment 11 (Findus läuft auf der Bank) muss man nicht zwangsläufig als in 8 eingeschlossen interpretieren, das Adverb ungeduldig legt aber nahe, dass sein Umherlaufen während des Eierputzens stattfindet, und nicht im Anschluss daran. Analog interpretieren wir, dass Findus wartet (12), während er läuft, und nicht danach. Zu beachten ist nun, dass es in solchen Strukturen unter den Töchterknoten jeweils keine inhärente Ordnung gibt- - sie sind hier zwar gemäß der im Text auftretenden Reihenfolge eingezeichnet, damit ist jedoch in der Struktur keine Aussage über ihre temporale Relation verbunden. Mani und Pustejovsky stellen diese Information getrennt vom Baum als Menge von Beschränkungen dar, die für jeweils zwei Ereignisse die temporale Präzedenz angeben, dafür wird das Symbol < verwendet. Im Beispiel liegt nur eine Präzedenzrelation vor, die dem Text wegen der Zeitangaben am Morgen und jetzt direkt zu entnehmen ist: {(5 < 7)}. Ein Vorteil dieser Darstellung ist, dass man zunächst nur die Beschränkungen angeben kann, die explizit im Text genannt sind (etwa durch temporale Konnektoren); implizite Präzedenzen gemäß des o. g. Ikonizitätsprinzips können dann hinzugefügt werden. Es ist aber ebenso gut möglich, für bestimmte Relationspaare die Präzedenz nicht zu notieren, wenn dem Text keine Aussage darüber zu entnehmen ist. Auf diese Weise kann textimmanente von textexterner, interpretierter Präzedenz-Information getrennt werden. Freilich erlaubt die Darstellung diese Unterspezifikation allerdings nicht für die Inklusionsbeziehung: Der Baum wird in dieser Hinsicht als vollständig vorausgesetzt. 6.2 Zeitausdrücke Die Repräsentation der temporalen Textstruktur, die wir bislang eingeführt haben, stellt lediglich die Abfolge der Ereignisse des Textes relativ zueinander dar. Für viele Texte ist jedoch auch die Verankerung von Ereignissen in ihren konkreten Zeitpunkten (seien sie real oder fiktiv) bedeutsam; zudem erschließt sich mitunter auch die richtige Ereignisfolge nur unter Berücksichtigung der konkreten Zeitangaben. Solche sprachlichen Formen, die auf Zeitpunkte oder -intervalle verweisen, nennen wir Zeitausdrücke. Sie sind also von den o. g. Konnektoren zu unterscheiden, die jeweils zwei Ereignisse relativ zueinander anordnen können. (6.7) (1) Letzten Dienstag fuhren wir nach Toulouse (2) und besuchten zwei interessante Galerien. (3) Tags darauf flogen wir schon nach San Francisco, (4) wo wir aber wegen diverser Probleme erst Donnerstag nachmittag ankamen. (5) Das Hotel erreichten wir um fünf, (6) und weil die Museen lang geöffnet sind, (7) stürmten wir bis 22 Uhr noch einmal schnell durch das SF - MOMA . Zeitausdrücke in Texten sind gelegentlich vollständig spezifiziert (Ich wurde am 3. 5. 1972 um 14.42 Uhr geboren), oft aber nur relativ zum Äußerungszeitpunkt interpretierbar, wie etwa letzten Dienstag im ersten Satz des obigen Beispiels (6.7). Ebenso ist ein Zeitausdruck häufig 113 6.2 Zeitausdrücke auch relativ zu einem im Text zuvor genannten Referenzzeitpunkt zu interpretieren-- wie tags darauf im zweiten Satz von (6.7). Die temporale Textstruktur sollte aus diesen Gründen die im Text genannten temporalen „Anker“ mit repräsentieren, was dadurch geschehen kann, dass die nicht-abstrakten Knoten des Baumes optional um einen (mehr oder weniger spezifischen) „Zeitstempel“ ergänzt werden. Dazu müssen die Zeitausdrücke im Text identifiziert, Ereignissen zugeordnet, und soweit möglich vervollständigt werden. Da Zeitausdrücke nur sehr selten präzise Zeitpunkte bezeichnen, bietet es sich an, als Darstellungsform Intervalle vorzusehen, deren Grenzen manchmal genau angegeben werden, häufig aber auch vage sind, wie etwa im Sommer. Abbildung 6.4: Temporale Struktur des Beispieltexts 6.7 Ein Vorschlag für ein Inventar von Zeitausdrücken des Deutschen wurde von Endriss u. a. (1998) vorgelegt. Die Autoren definierten auch eine Repräsentationssprache (Temporal Expression Language, TEL ), welche von der Vielzahl der natürlichsprachlichen Mittel zu einem gewissen Grad abstrahiert und damit ähnliche Ausdrücke zu einer gemeinsamen Darstellungsform zusammenfasst. Aus dieser abstrahierten Form können dann optional mit Hilfe von Kalender-Wissen konkrete Zeitintervalle errechnet werden. Dieser zweite Schritt soll uns hier nicht beschäftigen, doch geben wir kurz einige der von Endriss u. a. untersuchten Kategorien an, um das Spektrum der sprachlichen Formen zu illustrieren. Die Autoren treffen eine Unterscheidung zwischen ‚einfachen‘ und ‚komplexen‘ Zeitausdrücken, welche auf den einfachen aufbauen. Zu den einfachen zählen die Angabe von Uhrzeit, Tageszeit, Wochentag, Datum, Jahr; hinzu kommen Feiertage und deiktische Ausdrücke wie jetzt oder vorgestern. Die Beschreibungssprache TEL sieht dafür eine Reihe von Elementen vor. Tageszeiten werden nach dem Schema tod: hh : min (tod-= time of day) dargestellt. Der Ausdruck tod: 11: 45 beispielsweise abstrahiert über die Zeitausdrücke viertel vor zwölf, dreiviertel zwölf, fünfzehn Minuten vor zwölf, elf Uhr fündundvierzig. Für Tageszeiten wie am Morgen oder nachts werden jeweils Primitiva ( morning, night ) verwendet, die ebenfalls hinter tod: stehen. 114 6 Temporale Struktur Ganz ähnlich werden Wochentagsangaben wie montags, am Montag mit dow: mon (day of week) dargestellt. Die verschiedenen deiktischen Tagesangaben wie heute, gestern, übermorgen sind in dem Primitiv deictic-day: zusammengefasst, an das eine Zahl zwischen -2 und 2 angeschlossen wird, im Falle von heute die 0, für vorgestern die -2, usw. Dies sind Angaben, die relativ zum Äußerungszeitpunkt ausgewertet werden müssen. Andere sind relativ zu einem im Text zuvor genannten Referenzzeitpunkt, wie etwa zwei Wochen später oder am nächsten Tag. Dafür sieht TEL andere Operatoren vor, für das letztgenannte Beispiel etwa next(day) . Einige weitere Primitive sind dom: für die Tage des Monats (1 bis 31), moy: für die Monate jan , feb etc., und year: für Jahreszahlen. Der Ausdruck Januar 2007 würde beispielsweise als [moy: jan, year: 2007] dargestellt. Zu den komplexen Zeitausdrücken zählen zunächst die Intervalle, wie etwa von drei bis fünf Uhr morgens oder zwischen dem 12. und 16. Mai. Die beiden Endpunkte werden durch die oben beschriebenen einfachen Ausdrücke gebildet und dann mit dem Konstruktor between zusammengefasst. Unser erstes Beispiel wird also so dargestellt: between(tod: 03: 00,tod: 05: 00) . Demgegenüber geben offene Intervalle nur eine Grenze an, entsprechend nehmen die Operatoren before und after nur einen Zeitpunkt als Argument. Zu den weiteren komplexen Ausdrücken zählen relationale Angaben wie die Woche vom ersten bis zum fünften oder Angaben mit Abzählungen wie die dritte Woche nach Ostern. Außerdem sind Operatoren für die Markierung von Vagheit vorgesehen, um Ausdrücke wie gegen elf Uhr von um elf Uhr zu unterscheiden. Reichern wir nun, wie oben bereits vorgeschlagen, die von Mani u. Pustejovsky (2004) benutzte Baumdarstellung mit TEL -Ausdrücken an, so ergibt sich für den Text aus Beispiel 6.7 die in Abbildung 6.4 gezeigte Repräsentation. Hinzu kommen die Präzedenz-Beschränkungen {(1 < 2), (3 < 4), (4 < 7)}. Die Berechnung der „wirklichen“ Zeitpunkte würde den Baum in Übereinstimmung mit den Beschränkungen in chronologischer Reihenfolge durchlaufen und müsste zunächst anhand eines Kalenders das Datum für letzten Dienstag am Knoten A1 bestimmen. Dies ist der Referenzzeitpunkt für die Berechnung des nächsten Tages an Knoten 3 und des darauffolgenden Donnerstags an Knoten 4; relativ zu diesem sind dann die Tageszeiten an 4, 5 und 7 zu bestimmen. 6.3 Annotation von temporaler Struktur in Korpora In den USA hat sich eine reichhaltige Infrastruktur für die Annotation temporaler Information in Texten entwickelt. Unter dem Oberbegriff Time ML (Time Markup Language) werden über die zugehörige Webseite 36 Spezifikationen des Annotationsschemas und gezielt für diesen Zweck entwickelte Annotationswerkzeuge verfügbar gemacht. Time ML umfasst sowohl die Annotation von Ereignissen als auch die von Zeitausdrücken; für letzteres wurde ein entsprechender ISO -Standard geschaffen. Es gibt einige nach Time ML annotierte Korpora, die teilweise über die genannte Webseite direkt erhältlich sind und teilweise über das Linguistic Data Consortium 37 erworben werden müssen. 36 http: / / www.timeml.org (Zugriff 12. 12. 17). 37 http: / / www.ldc.upenn.edu (Zugriff 12. 12. 17). 115 6.4 Übungsaufgaben Das für Time ML verwendete Annotationswerkzeug Callisto 38 ist mittlerweile zu einer umfangreichen, allgemein verwendbaren- - aber damit auch nicht ganz unkomplizierten- - Annotationswerkbank entwickelt worden. Die Software ist in Java implementiert und damit auf allen gängigen Betriebssystemen lauffähig. Beschränkt man sich auf die Annotation von TEL (o. ä.) Ausdrücken an natürlichsprachlichen Zeitausdrücken im Text, so ist dafür ein Schicht-orientiertes Werkzeug gut geeignet, etwa das im letzten Kapitel vorgestellte EXMAR a LDA . Kommen Relationen hinzu, empfiehlt sich MMAX 2 (s. Kap. 4) oder auch Webanno. 39 Weiterführende Literatur Als Einstieg in die hier nur sehr kurz erwähnte Thematik von Tempus, Aspekt und Aktionsart sei der Beitrag von Zifonun (2000) im Handbuch ‚Text- und Gesprächslinguistik‘ empfohlen. Detallierte semantische Studien zur Verknüpfung von Ereignissen entstanden im Rahmen der Diskursrepräsentationstheorie ( DRT ) (Kamp u. Reyle, 1993), hier sei mit der Arbeit von Eberle (1991) nur eine erwähnt, die auch explizit den Zusammenhang zu Kohärenzrelationen herstellt, wie wir sie in Kapitel 10 besprechen. Die Rolle temporaler Information für den Aufbau der Diskursstruktur ist auch ein zentrales Thema in der Segmented Discourse Representation Theory (Asher u. Lascarides, 2003). Ein Sammelband, der verschiedene Beiträge, auch zum Annotationsschema Time ML und dessen Anwendungen, zusammenfasst, ist (Mani u. a., 2005). 6.4 Übungsaufgaben 1. Stellen Sie fest, ob Ihr Kommentar auch narrative Passagen enthält, also über zeitlich lokalisierte Ereignisse berichtet. Wenn nicht, suchen Sie für die folgenden Aufgaben ersatzweise eine (kurze) Kurzgeschichte. 2. Markieren Sie in Ihrem Text alle Zeitausdrücke. 3. Markieren Sie im Texte alle zeitlich verankerten Ereignisse. 4. Zeichnen Sie jetzt einen Baum für die temporale Struktur und geben Sie Präzedenz-Beschränkungen an, gemäß Abschnitt 6.1. Stellen Sie fest, ob sich die Abfolge der Ereignisse vollständig rekonstruieren lässt. Ist die oben vorgestellte Darstellungsform der Baumstruktur mächtig genug? Soweit im Text Zeitausdrücke vorhanden sind, ergänzen Sie die enstprechenden Knoten des Baums damit. 38 https: / / github.com/ mitre/ callisto (Zugriff 12. 12. 17). 39 https: / / webanno.github.io/ webanno/ (Zugriff 12. 12. 17). 117 7.1 Hintergrund: Sprechhandlungen 7 Sprechhandlungen und Illokutionsstruktur (7.1) Wir sollten jetzt bald einen neuen Computer kaufen. In sechs Wochen wird die Mehrwertsteuer erhöht. Auch dieser kurze Text lässt keine Zweifel an seiner Kohärenz. Dafür kann in diesem Fall nicht primär das Mittel der Koreferenz verantwortlich sein, denn es gibt hier keine direkte Wiederaufnahme. Ein thematischer Zusammenhang lässt sich als ‚bridging‘ zwischen kaufen und Mehrwertsteuer herstellen, doch erfassen wir damit den inneren Zusammenhalt des Textes noch nicht wirklich. Entscheidend ist hier vielmehr der Bezug zwischen den Zielen der Sätze: Der erste fordert zu einer Handlung auf und der zweite liefert zu dieser Aufforderung eine Begründung. Wenn der erste Satz allein seinen Zweck nicht erfüllt, weil die Hörerin fragen würde „weshalb? “, so soll der zweite Satz das Motiv liefern, damit die Aufforderung möglichst in die Tat umgesetzt wird. In Abschnitt 7.1 geben wir einen (sehr kurzen) Abriss der Sprechakttheorie, und zeigen in 7.2 eine Reihe von Ansätzen, aus einer sprechakttheoretischen Perspektive Aspekte der Textstruktur zu erklären. Abschnitt 7.3 schließlich präsentiert Überlegungen zur Definition von Sprechakt-Typen und ihrer Organisation in Taxonomien. Weil Sprechakt-annotierte Korpora bisher nur für Dialoge (mit sog. Dialogakten) verfügbar sind, aber nicht für monologische Texte, entfällt in diesem Kapitel der Abschnitt zu Annotation und Korpora. 7.1 Hintergrund: Sprechhandlungen Textbeispiele wie 7.1 führen uns in diesem Kapitel zu einem grundlegenden Perspektivenwechsel. Bei der Betrachtung von referenzieller, thematischer und temporaler Struktur haben wir uns fast ausschließlich „im Inneren“ des Textes bewegt (Ausnahmen waren der gelegentliche Rückgriff auf Weltwissen beim Herstellen von ‚bridging‘-Bezügen und der Ableitung thematischer und temporaler Zusammenhänge). Dass wir damit dem Spektrum der Funktionen von Sprache nicht gerecht werden, wissen wir (spätestens) seit der Diskussion der Textualitätskriterien von de Beaugrande u. Dressler (1981) in Kapitel 2, wo wir auch Merkmale wie Intentionalität oder Situationalität genannt haben. Die textinternen Merkmale bilden insgesamt den Schwerpunkt dieses Buches, doch dieses und das folgende Kapitel befassen sich mit einigen wesentlichen Aspekten der Intentionalität, die dann vor allem für Texte des Typs argumentativ relevant sind (aber auch für instruktive Texte, denen wir allerdings hier nicht viel Raum widmen). Ganz neu ist diese Sicht für uns natürlich nicht, denn wir haben in Kapitel 3 bereits von der Rolle der Textfunktion gesprochen. Diesen Blickwinkel erweitern wir jetzt vom Gesamttext zu seinen einzelnen Bestandteilen und ihrer Rolle für das Erfüllen der Textfunktion. In der Textlinguistik fand dieser Perspektivenwechsel als wichtige Verschiebung des Interessenschwerpunkts um 1970 statt; diese Phase wird heute als „pragmatische Wende“ bezeichnet. Wir gehen auf diese disziplininternen Entwicklungen hier nicht weiter ein, eine gute Darstellung liefert beispielsweise Feilke (2000). 118 7 Sprechhandlungen und Illokutionsstruktur Während die Semantik traditionell die Bedeutung eines Satzes beschreibt als diejenige Aussage, die er über die Welt macht, also die Abbildungsfunktion der Sprache in den Mittelpunkt stellt, weist die Pragmatik darauf hin, dass Sprecher mit Äußerungen und Schreiber mit Texten nicht nur über die Welt berichten, sondern unmittelbar auch in der Welt agieren: Die Produktion einer sprachlichen Äußerung wirkt selbst verändernd auf die Welt ein-- eine Sprecherin handelt, indem sie sich äußert. Zwar verändert sich die Welt nicht unmittelbar materiell, doch häufig verändern sich die Dispositionen der Hörer bzw. Leser. Oder zumindest mag die Sprecherin solche Veränderungen beabsichtigen. In Beispiel 7.1 ist die Absicht allem Anschein nach direkt ausgedrückt („Lass uns kaufen“), dies muss allerdings nicht immer der Fall sein, die Absicht kann auch indirekt formuliert sein oder sich gar hinter einer anderen, in der Äußerung ausgedrückten „Nebenabsicht“ verstecken. Eine Pionier-Rolle für die Hinwendung zu einer solchen Sprachauffassung spielte der Philosoph John Austin. In seiner Schrift „How to do things with words“ (Austin, 1975) richtete er die Aufmerksamkeit auf Sätze wie Ich verurteile Sie zu einer Geldbuße von 7000 Euro oder Ich wette zehn Euro, dass die Bayern morgen verlieren, die-- geäußert von jeweils „befugten“ Personen in adäquaten Situationen-- eben nicht einen Aspekt der Welt beschreiben, sondern steuernd in die Welt eingreifen. Austin nannte solche Sätze performativ. Das Äußern der Sätze stellt eine eigenständige Handlung dar, die erheblich über das reine Äußern hinaus reicht: Nach Äußerung des ersten Beispielsatzes ist der Angeklagte verurteilt; mit Äußerung des zweiten Beispiels hat sich der Sprecher zu einer Zahlung verpflichtet, falls ein bestimmter Fall in der Welt nicht eintritt. Solche performativen Äußerungen sind für die Textsorten, die uns in diesem Buch vorrangig interessieren, allerdings kaum von Bedeutung; auch in der Alltagssprache sind sie eher selten anzutreffen. Damit unterscheiden sie sich von unserem Beispiel 7.1, das keinen solchen unmittelbaren Eingriff in die Zustände der Welt darstellt, sondern „lediglich“ versucht, die Zuhörer oder Leserinnen zu einer Handlung zu bewegen. Ein zentraler Beitrag von Austin bestand darin, herauszustreichen, dass eine sprachliche Äußerung aus pragmatischer Sicht auf drei verschiedenen Ebenen betrachtet werden kann. Austin charakterisiert es so, dass die Äußerung eines Satzes gleichzeitig drei verschiedene Akte vollziehen kann, die dann zusammen den komplexen Sprechakt bilden: Bestandteile des Sprachakts nach Austin ▶ Lokutionärer Akt: das Äußern selbst, d. h. das Hervorbringen einer Zeichenkette; Beispiel: Ich finde Deine Zeichnung sehr gelungen. ▶ Illokutionärer Akt: die mit der Äußerung intendierte Funktion: fragen, informieren, beurteilen, usw.; Illokution des obigen Beispiels: beurteilen ▶ Perlokutionärer Akt: die von der Äußerung hervorgerufene Wirkung bei Leser oder Hörerin, auf ihre Gefühle, Gedanken oder Handlungen: erfreut, beleidigt, erschrocken, getröstet, veranlasst zu X, überzeugt von X, usw. Mögliche Perlokution des obigen Beispiels: geschmeichelt 119 7.1 Hintergrund: Sprechhandlungen Oft entspricht der perlokutionäre Akt der Intention der Sprecherin, doch muss das keineswegs immer der Fall sein: Während die Sprecherin meint, beiläufig eine belanglose Feststellung zu treffen, kann der Hörer sie aufgrund bestimmter Umstände beispielsweise als Beleidigung (miss-)verstehen. Für das Verhältnis zwischen Äußerung und Perlokution gilt, dass es eines der Kausalität ist: Die Äußerung ruft eine bestimmte Wirkung hervor bzw. löst sie aus. Das gilt jedoch nicht für das Verhältnis zwischen Äußerung und Illokution. Das Äußern eines Feststellungssatzes löst keineswegs ein Informieren unmittelbar aus, vielmehr ist die Illokution von der Sprecherin intendiert-- was der Hörer aber daraus macht, steht noch auf einem anderen Blatt. Dass Illokutionen in der Mehrzahl der Fälle aber durchaus richtig verstanden werden, liegt daran, dass sie konventionalisiert sind: Bestimmte Arten von Äußerungen werden in bestimmten Situationen von Hörern gewohnheitsmäßig mit bestimmten Illokutionen in Verbindung gebracht, wie im viel zitierten hier zieht es, das oftmals intepretiert wird als Aufforderung, das Fenster zu schließen. Für den Zusammenhang zwischen Lokution und Illokution können wir auch den von Heringer (1974) diskutierten Begriff der „indem-Beziehung“ verwenden: Der Sprecher führt den illokutionären Akt aus, indem er die entsprechende Äußerung tätigt (den lokutionären Akt ausführt). Wir werden uns mit dem Verhältnis zwischen Lokution und Illokution im Abschnitt 9.2 noch etwas ausführlicher beschäftigen. Austins Arbeit wurde fortgeführt von seinem Schüler John Searle, der in (Searle, 1971) einige wichtige Weiterentwicklungen der Austin‘schen Theorie vornahm. Eine bestand darin, den lokutionären Akt zu ersetzen durch eine Kombination aus Äußerungsakt und propositionalem Akt. Die durch einen Satz ausgedrückte Proposition besteht demnach aus zwei wesentlichen Bestandteilen: ▶ Referenz: Verweis auf außersprachliche Gegenstände (vgl. Kap. 4) ▶ Prädikation: Die Aussage über die benannten Gegenstände Searle wies dann darauf hin, dass es möglich ist, eine gegebene Kombination aus Referenz und Prädikation mit ganz unterschiedlichen Illokutionen zu verknüpfen, was dann zu verschiedenen Äußerungen führt, wie zum Beispiel: Du gibst mir vier Euro. / Gibst Du mir vier Euro? / Gib mir vier Euro! Searle schlägt damit erstmals eine konkrete Form für die Illokution vor: In dem Ausdruck ‚F( RP )‘ steht F für die sog. ‚illokutive Rolle‘ (z. B.: Feststellung, Aufforderung, etc.-- siehe Abschnitt 7.3), die als Funktion auf die beiden Argumente Referenz (R) und Prädikation (P) anzuwenden ist. Mit dem Begriff ‚Pragmatik‘ werden in der Linguistik oft zwei verwandte, aber doch verschiedene Dinge verbunden: einerseits die Beschäftigung mit der Sprechakttheorie, andererseits die Konzentration auf Phänomene jenseits der Satzebene, also solche des Diskurses (geschriebene Texte und mündliche Dialoge). Ironischerweise wurde die oben erwähnte „pragmatische Wende“ in der Textlinguistik seinerzeit von den Sprechakt-Arbeiten angestoßen, die aber ihrerseits keinen Bezug zur Textebene herstellen: Austin und Searle hatten sich eindeutig dem Satz verschrieben und diesen unter innovativer Perspektive betrachtet-- nicht jedoch den Text. 40 Die Verknüpfung von Sprechakttheorie und Textuntersuchung ließ 40 Feilke (2000) schildert diese historische Entwicklung genauer. 120 7 Sprechhandlungen und Illokutionsstruktur noch einige Jahre auf sich warten (s. etwa Viehweger, 1989) und ist laut Schröder (2003, S. 2) auch heute nicht befriedigend gelöst: „Obwohl die Auffassung, dass mit Texten sprachliche Handlungen vollzogen werden, alles andere als neu ist, wurde der Frage nach einem textspezifischen (auf die Besonderheiten von monologischen Texten zugeschnittenen) Handlungsbegriff bislang überraschend wenig Aufmerksamkeit gewidmet.“ 7.2 Sprechhandlungen in Texten Die im vorigen Abschnitt dargestellten „Pioniere“ Austin und Searle sind der Disziplin Sprachphilosophie zuzurechnen, nicht der Linguistik. Damit wir den Sprechaktbegriff für unsere Zwecke nutzbar machen können, also Texte hinsichtlich ihrer Illokutionsstruktur eines Textes analysieren können, ist noch eine gewisse Wegstrecke zurückzulegen. Zu untersuchen ist allgemein das Verhältnis zwischen Grammatik und Pragmatik, und speziell die Abbildung zwischen den Intentionen eines Sprechers und bestimmten Merkmalen der entsprechend produzierten sprachlichen Äußerungen-- respektive deren Rekonstruktion aus der Perspektive des Hörers. Unstrittig ist, dass diese Abbildung keine einfache 1: 1 Abbildung ist: Linguistische Merkmale schränken die Menge der möglichen zugrunde liegenden Illokutionen ein, determinieren sie aber nicht vollständig. Liedtke (1998) illustriert dies an dem Beispiel der Äußerung Ich bitte Dich, zu gehen, deren illokutive Rolle 41 aufgrund des Satzmodus zunächst als ASSERTION einzustufen ist, die in bestimmten Kontexten aufgrund des performativen Verbs aber dann eben auch als DIREKTIVUM aufgefasst werden kann. Wir können uns hier nicht (wie in der Sprachphilosophie legitim) auf die Ebene einer „idealen“ Grammatik-Pragmatik Beziehung beschränken, sondern müssen überdies in das kalte Wasser „echter“ Texte springen, was die Verhältnisse abermals verkompliziert. Insgesamt sind folgende Teilaufgaben zu betrachten: 1. Festlegen eines Inventars von Illokutionen 2. Festlegen von Kriterien zur Segmentierung von Texten in eine Folge von Illokutionen 3. Festlegen von Kriterien zur Identifikation konkreter Illokutionen: Welche Illokution(en) können einem gegebenen Textsegment unter welchen Bedingungen zugeschrieben werden? 4. Definieren von Regeln zur Komposition von Illokutionen zu einer Illokutionsstruktur All diese Fragen sind bisher empirisch, also an konkreten Texten, nur in Ansätzen untersucht (siehe Liedtke, 1998; Schmitt, 2000), wir betreten also ein noch keineswegs systematisiertes Terrain. Der Übersichtlichkeit halber konzentrieren wir uns in diesem Kapitel allein auf die textstrukturellen Phänomene und verschieben die Diskussion der sprachlichen Merkmale für Aufgaben 2 und 3 in das Kapitel 9. Im Folgenden besprechen wir zunächst die Komposition von Illokutionen im Text und gehen dann in Abschnitt 7.3 auf Vorschläge zu konkreten Inventaren von Illokutionstypen ein. 41 Wir verwenden im Folgenden ‚Illokution‘ sowohl für die illokutive Rolle als auch im ursprünglichen Sinn für den kompletten Ausdruck der Form F( RP ). 121 7.2 Sprechhandlungen in Texten 7.2.1 Illokutionen von Textsegmenten Ein früher und besonders in der Computerlinguistik einflussreicher Vorschlag für eine Konzeption der Illokutionsstruktur stammt von Grosz u. Sidner (1986). 42 Ihr Modell war primär, aber nicht ausschließlich, für Dialoge konzipiert und schlägt als eine zentrale Beschreibungsebene eine intentional structure vor (neben linguistic structure, der Gruppierung von Äußerungen zu zusammenhängenden ‚Diskurssegmenten‘, und attentional structure, einem Vorläufer des in Abschnitt 4.3.1 vorgestellten Centering-Modells). Ausgangspunkt ist der Gedanke, dass der Autor mit dem Text als Ganzem ein bestimmtes Ziel verfolgt (‚discourse purpose‘, DP ), wie zum Beispiel den Leser zu einer bestimmten Tätigkeit zu ermuntern, ihm nahezulegen, eine Einstellung zu einem Sachverhalt zu übernehmen, oder auch ein bestimmtes Produkt zu kaufen. Das Ziel wird verfolgt, indem Teile des Textes (Segmente) ihrerseits einen bestimmten Zweck erfüllen sollen (‚discourse segment purpose‘, DSP ), und die DSP s der ersten Zerlegungsebene dann kollektiv dem DP dienen. Segmente können sich ihrerseits in kleinere Segmente aufgliedern, die jeweils das übergeordnete DSP mit unterstützen, bis hinunter zur Ebene der einzelnen Sätze oder Teilsätze. Für diese minimalen Einheiten der Analyse, die kleinsten Textsegmente, die einer Illokution entsprechen, verwenden wir fortan das in der englischsprachigen Literatur weit verbreitete Akronym ‚ EDU ‘ (elementary discourse unit). Ein Segment, das größer als eine EDU ist, kann sowohl aus EDU s als auch aus weiteren Segmenten bestehen, die Anordnung der Ebenen ist also nicht streng hierarchisch. Ein weiteres Charakteristikum ist die Möglichkeit zur Einbettung von Segmenten in der Mitte des übergeordneten Segments- - ein Textabschnitt kann also kurzzeitig ein Segment unterbrechen, diesem ein unterstützendes Ziel „zuliefern“, bevor das übergeordnete Segment fortgesetzt wird. Auf diese Weise entsteht eine Baumstruktur aus Segmenten, deren DSP s jeweils in einer Relation der ‚dominance‘ oder, umgekehrt betrachtet, der ‚contribution‘ stehen. Wir illustrieren dies an einer leicht gekürzten Fassung des von Grosz und Sidner verwendeten Beispieltexts aus der Stummfilmzeit (der seinerseits bereits von Cohen (1983) verwendet wurde) mit der von Cohen vorgenommenen Gliederung in (Teil-) Sätze. Der Text ist in Abb. 7.1 angegeben, die Gliederung in Segmente in Abb. 7.2. 42 Es handelt sich jedoch nicht um den ersten Vorschlag dieser Art; erwähnt sei hier nur, dass auch van Dijk (1977) eine Erweiterung seiner thematischen Makrostrukturen um Sprechakte und Makro-Sprechakte vornahm. 122 7 Sprechhandlungen und Illokutionsstruktur [1] The „movies“ are so attractive to the great American public, [2] especially to young people, [3] that it is time to take careful thought about their effect on mind and morals. [4] Ought any parent to permit his children to attend a moving picture show often or without being quite certain of the show he permits them to see? [5] No one can deny, of course, that great educational and ethical gains may be made through the movies [6] because of their astonishing vividness. [7] But the important fact to be determined is the total result of continuous and indiscriminate attendance on shows of this kind. [8] Can it be other than harmful? (…) [12] Without spoken words, facial expression and gesture must carry the meaning; [13] but only strong emotion, or buffoonery can be represented through facial expression and gesture. [14] The more reasonable and quiet aspects of life are necessarily neglected. [15] How can our young people drink in through their eyes a continuous spectacle of intense and strained activity and feeling without harmful effects? [16] Parents and teachers will do well to guard the young against overindulgence in the taste for the „movie“. Abbildung 7.1: Beispieltext Movie (Grosz u. Sidner, 1986) Abbildung 7.2: Segmentierung des Beispieltexts Movie Wie bestimmen wir nun bei der Textanalyse die DSP s sowie das DP ? Nach Grosz und Sidner gibt es vier Varianten: 1. explizit: Die Illokution wird mit performativem Verb unmissverständlich angezeigt, z. B. Ich erwarte, dass Sie mir umgehend antworten; 2. direkt, in einem Satz / Teilsatz ablesbar; 3. direkt, aber auf mehrere Sätze / Teilsätze verteilt; 4. indirekt, durch Ableitung aus einem oder mehreren Sätzen / Teilsätzen im Kontext. Beispiele für Varianten 2-4 finden sich in unserem Beispieltext. Hier stellt nach Grosz und Sidner (16) die zentrale Aussage (also das DP ) dar, und die damit verbundene Intention ist, dass die Rezipientin des Textes die zum Ausdruck gebrachte Proposition glaubt. 43 (16) repräsentiert damit die zentrale Intention des größten Diskurssegments (1-16), dem zwei Segmente unmittelbar untergeordnet sind. Das eine davon ist (1-3) mit der in (3) zum Ausdruck gebrachten Intention, das andere ist (4-15) mit seiner Haupt-Intention in (15). Damit 43 Im Folgenden nennen wir lediglich das jeweils zentrale Textsegment; die vollständige Intention besteht für dieses Textbeispiel jeweils darin, dass die Leser die jeweilige Proposition glauben. 123 7.2 Sprechhandlungen in Texten sind (16), (3) und (15) Beispiele für den o. g. Fall 2 der DSP -Bestimmung (direkt in einem Satz ablesbar). Segment (4-15) enthält seinerseits zwei Subsegmente, nämlich (5-6) mit der Intention in (5), sowie (7-14) 44 , dessen zentrale Intention in (13-14) ausgedrückt ist-- mithin ein Beispiel für den Fall 3. Parallel zur Einbettung der Segmente wird jeweils eine ‚dominance‘-Relation zwischen den zugrunde liegenden Intentionen postuliert, woraus eine Hierarchisierung resultiert, die als Wechselspiel zwischen linguistischer Struktur (Einbettung von Segmenten) und intentionaler Struktur (Intentionen, die sich gegenseitig unterstützen können) aufgefasst wird. Die Abbildung 7.2 zeigt diese Hierarchie, wobei die jeweils „zentralen“ Sub-Segmente (aus denen mehr oder weniger direkt die Intention des Segments abgelesen wird) unterstrichen dargestellt sind. Im Klartext lauten die Dominanzbeziehungen: ▶ I(7-8) dominiert I(13-14): Weil nur starke Gefühle im Gesichtsausdruck ablesbar sind und vernünftigere Einstellungen vernachlässigt werden, kann lang anhaltendes Filmschauen nur schadhaft sein. ▶ I(15) dominiert I(5) und I(7-8): Weil einerseits zwar Weiterbildungseffekte erzielbar sind, aber andererseits lang anhaltendes Filmschauen nur schadhaft sein kann, können junge Leute bei anhaltender intensiver und anstrengender Augenaktivität nur Schaden nehmen.-- Dies ist ein Beispiel für die Ableitung der intendierten Proposition (Fall 4 in obiger Liste) aus der rhetorischen Frage in (15), die ja ihre Intention nur indirekt vermittelt. ▶ I(16) dominiert I(3) und I(15): Weil es an der Zeit ist, die Effekte von Filmen auf Geist und Moral zu untersuchen, und weil junge Leute durch stetige visuelle Belastung nur Schaden nehmen können, sollten Eltern und Lehrer junge Leute davor schützen, sich allzu sehr in den Konsum von Filmen zu stürzen. Neben ‚dominance‘ postulieren Grosz und Sidner eine zweite Relation, die zwischen DSP s bestehen kann. Wenn die Reihenfolge der Verarbeitung von DSP s wichtig ist, nämlich das eine Ziel erst erreicht sein muss, bevor das nächste angegangen werden kann, wird dafür die Relation ‚satisfaction-precedence‘ verwendet. Im hier gezeigten Beispieltext tritt sie nicht auf; typische Verwendungen sind Anweisungstexte, in denen die Reihenfolge einzelner Handlungen bedeutsam ist, aber auch komplexe Erläuterungen oder Argumentationen, in denen die Glaubwürdigkeit einer These davon abhängt, dass zuvor bereits eine andere These vermittelt wurde. 44 Um die Darstellung abzukürzen, lassen wir (9-11) beiseite. 124 7 Sprechhandlungen und Illokutionsstruktur Abbildung 7.3: Textstruktur und Handlungsstruktur nach Schröder (2003) Die ‚intentional structure‘ von Grosz und Sidner ist ein erster, recht „grobkörniger“ Vorschlag, der auf den Zusammenhang zwischen linguistischer Segmentierung von Texten (und Dialogen) und Dominanz-Beziehungen zwischen den zugehörigen Intentionen verweist, ohne hier eine detailliertere Klassifikation anzustreben. In die gleiche Richtung geht auch Schröder (2003), der zu einem ganz ähnlichen Modell gelangt wie Grosz / Sidner. In Schröders Modell der Handlungsstruktur von Texten zerfällt der Text in Teiltexte, diese zerfallen abermals in Teiltexte und schließlich in die einzelnen Sätze (die Schröder hier mit EDU s gleichsetzt). All diesen Einheiten entsprechen Handlungen: die Texthandlung (bei Grosz / Sidner: DP ), die Teiltexthandlungen ( DSP s) und schließlich die Satzhandlungen. Die Einbettung einer Handlung geschieht zunächst durch die ‚indem‘-Beziehung, weitere Teilhandlungen können daran mit der ‚und dann‘-Beziehung angeschlossen werden. Abb. 7.3 illustriert das Schema für die so entstehenden Strukturen. Die Relation ‚und dann‘ ist nicht so eng gefasst wie die ‚satisfaction-precedence‘ bei Grosz / Sidner, sondern dient immer zur Verknüpfung von nebengeordneten Teilhandlungen, auch wenn die Reihenfolge für das Erreichen des Handlungsziels nicht strikt erforderlich ist. 125 7.2 Sprechhandlungen in Texten Eine Analyse des Movie-Beispieltexts aus Abb. 7.1 nach Schröders Schema könnte wie folgt aussehen (A-= Autor): [1 - 16] A kritisiert die Gefahr des Filmkonsums bei Jugendlichen INDEM [1 - 3] A darauf hinweist, dass die Filme so populär geworden sind, dass man sich über sie Gedanken machen muss UND DANN [4 - 15] A das Für und Wider des Filmkonsums abwägt INDEM [4] A fragt, ob Eltern ihre Kinder oft ins Kino lassen sollen UND DANN [5 - 6] A die Lebhaftigkeit des bewegten Bildes einräumt UND DANN [7 - 14] A die negativen Aspekte des Kinos betont INDEM [7 - 8] A den anhaltenden und wahllosen Filmkonsum als schadhaft einstuft UND DANN [12 - 14] A darauf hinweist, dass wegen des fehlenden Tons nur starke Emotionen und Possen dargestellt werden können UND DANN [15] A feststellt, dass Filmkonsum anstrengt und Schaden hervorrufen muss UND DANN [16] A fordert, dass Eltern und Lehrer die Jugend vor übertriebenem Filmkonsum schützen sollen Kommen wir auf die oben genannten vier Möglichkeiten der Bestimmung von DSP s zurück, so weist der Grosz / Sidner-Ansatz eine Neigung zur Beibehaltung von Satz-Illokutionen als DSP s auf (Fälle 1-3), während Schröder eher die Ableitung von DSP s (Fall 4) als Normalfall betrachtet. Er betont den konzeptuellen Unterschied zwischen ‚Satzhandlung‘ auf der einen und ‚Texthandlung‘ auf der anderen Seite-- wobei letztere dann auch die ‚Teiltexthandlung‘ subsumiert. Zu den strukturbildenden Beziehungen ‚indem‘ sowie ‚und dann‘ treten in Schröders Ansatz noch funktionale Beziehungen als zweites Beschreibungsmittel. Funktionale Beziehungen können die Stützungsbeziehung ergänzen; sie gliedern sich in zwei Gruppen: 126 7 Sprechhandlungen und Illokutionsstruktur ▶ Funktionale Unterordnung / Abhängigkeit: Das übergeordnete Segment wird vom untergeordneten konkretisiert oder präzisert, näher erläutert, mit einer Quelle belegt etc. Das untergeordnete Element allein könnte die Rolle des übergeordneten für den Text nicht erfüllen. ▶ Funktionale Nebenordnung: Kein Segment ist „wichtiger“ als das andere, sie agieren gemeinsam auf derselben Ebene. Schröder unterscheidet drei Fälle: ▷ Funktionale Ergänzung: Es wird eine Information nachgetragen, ein Detail ergänzt. Die ergänzende Mitteilung dient der gleichen Funktion wie die ergänzte Mitteilung. ▷ Funktionale Reihung: Aufzählungen von Informationen; die entsprechenden Teilhandlungen sind nicht voneinander abhängig. ▷ Funktionale Fortsetzung: Die Teilhandlungen haben die stützende Funktion nicht einzeln inne, sondern erfüllen sie nur gemeinsam. 7.2.2 Dependenzen zwischen Satzillokutionen Die Zuweisung von Illokutionen zu Textsegmenten (im Sinne der DSP s) stellt einen Interpretationsschritt dar, der bewusst über die Analyse der Funktion einzelner Sätze hinaus geht- - Illokutionen werden ja für jedes Segment von der Annotatorin selbst formuliert. Dementsprechend groß ist der Spielraum, den ein solcher Ansatz eröffnet: Allein das Festlegen der Grenzen von Diskurssegmenten kann unter verschiedenen Annotatoren recht unterschiedlich ausfallen. Ein etwas „vorsichtigeres“ Analyseschema beschränkt sich darauf, allein die EDU s und ihre Illokutionen sowie die Zusammenhänge der minimalen Illokutionen untereinander zu betrachten. Diesen Weg haben etwa Brandt u. Rosengren (1992) beschritten und eine Hierarchisierung der einzelnen Illokutionen vorgeschlagen. Gleichzeitig treffen sie eine Reihe feinerer Unterscheidungen als es Grosz / Sidner und Schröder taten. Ihre Untersuchung entstand an einem Textkorpus aus Geschäftsbriefen, und die Autoren weisen darauf hin, dass die Ergebnisse speziell für diese Textsorte gültig und möglicherweise nicht in allen Einzelheiten verallgemeinerbar sind. Das der Hierarchisierung zugrunde liegende allgemeine Prinzip ist für Brandt und Rosengren (im Folgenden ‚ BR ‘) das „Erfolgsprinzip“, nach dem die Sprecherin weiß, dass es oft nicht reicht, eine bestimmte sprachliche Handlung zu vollziehen, sondern dass sie für den Erfolg der Handlung arbeiten muss, indem sie die Illokution abstützt-- so wie in den oben bereits gezeigten Beispielen. BR bezeichnen die Grosz / Sidner‘sche Dominanzbeziehung als Stützungsbeziehung, was einfach einer Umkehrung der Blickrichtung gleichkommt. Im Modell der Illokutionsstruktur werden (nach der Terminologie von Schmitt, 2000) zwei Typen stützender Illokutionen unterschieden: unmittelbar und mittelbar stützende. Mittelbar stützende Illokutionen sind die schwächeren, sie tragen nur mehr indirekt zum Ziel der dominierenden Illokution bei, und von ihnen gibt es wiederum zwei Arten. ‚Sachverhaltsklärende‘ Segmente liefern Hintergrundinformationen oder orientierende Ergänzungen, wie zum Beispiel Wir nehmen mit diesem Brief Bezug auf unser heutiges Telefonat. ‚Kooperationssichernde‘ Segmente dienen dazu, die persönliche Beziehung zwischen den Kommuni- 127 7.2 Sprechhandlungen in Texten kationspartnern aufrecht zu erhalten, es handelt sich überwiegend um konventionalisierte Ausdrücke wie Wir stehen Ihnen jederzeit wieder zur Verfügung. Wichtiger sind die unmittelbar stützenden Beziehungen. Dies sind Hilfshandlungen, die den Erfolg der übergeordneten Handlung sicherstellen sollen. Diese lassen sich je nach Art der Handlungen in unterschiedliche Kategorien gruppieren; hier der Vorschlag von Schmitt (2000), der den von BR etwas weiterentwickelt: Illokutionskategorien nach Schmitt (2000) ▶ Verstehenssichernde Illokutionen: Sprecher gibt Zusatzinformationen, die geeignet sind, das Verstehen der übergeordneten Illokution zu erleichtern: Ich schlage vor, dass wir uns am Stachus treffen. Das ist ein anderer Name für den Karlsplatz. ▶ Glaubensstützende Illokutionen: Sprecher begründet eine Illokution, macht deutlich, weshalb auch Hörer die in der übergeordneten Illokution ausgedrückte These glauben sollte: Der Stachus ist ein guter Treffpunkt für eine Unterredung. Es gibt eine ganze Reihe hübscher Lokale. ▶ Motivationsstützende Illokutionen: Sprecher möchte Hörer zu einer Handlung motivieren, und die stützende Illokution soll Verständnis für die übergeordnete schaffen: Schneide doch bitte das Gras. Morgen wird es zu lang sein, als dass wir es mit dem alten Rasenmäher schaffen. ▶ Ausführungssichernde Illokutionen: Sprecher möchte dem Hörer das Ausführen einer Handlung erleichtern: Mäh doch mal schnell den Rasen. Der Mäher steht in der Garage. Zur Verdeutlichung des Ansatzes zitieren wir eine Beispiel-Analyse aus Brandt u. Rosengren (1992, S. 36). Der zugrunde liegende Text, mit markierten Segmenten, ist: (1.1a) Mit unserem Schreiben vom 18. 12. 79 haben wir Ihnen die Rückzahlung Ihrer Anzahlung-…garantiert, falls unsere Konzernfirma-…nicht erfüllen sollte. (1.1b) Gleichzeitig wurde unser Werkshaftbrief mit dem Zeitpunkt befristet, an dem sämtliche Lieferungen und Leistungen laut Ihrer Bestellung durchgeführt sind. (1.2) Da in der Zwischenzeit alle vertraglichen Verpflichtungen von unserer Konzernfirma erfüllt wurden (1.2.1) - die Abnahme des Kranes erfolgte am 17. 10. 79-- (1.) ersuchen wir Sie, uns den eingangs erwähnten Garantiebrief zurück zu senden. (1.3) Wir danken für eine baldige Erledigung im voraus. Abbildung 7.4 zeigt die grafische Darstellung der Illokutionsstruktur nach BR . Neben den Segmentbezeichnern erscheinen Kürzel für die Illokution der EDU : ASS - - ASSERTION ; 128 7 Sprechhandlungen und Illokutionsstruktur Info- - INFORMATION ; DIR - - DIREKTIVUM . Die Wurzel der Illokutionshierarchie bildet stets ein Direktivum, das von den anderen Segmenten direkt oder indirekt abgestützt wird. Die horizontale Linie über 1.1a und 1.1b zeigt an, dass diese beiden Segmente zu einem Block zusammengefasst sind, der nicht weiter in Illokutionen zu gliedern ist; stattdessen besteht ein rein semantischer Zusammenhang. Gemeinsam bilden die Segmente eine sachverhaltserklärende (also nur mittelbare) Stützung für das zentrale Direktivum, das Segment 1. Es wird in ähnlicher Weise von 1.3 gestützt, wobei die Entscheidung zwischen den beiden möglichen mittelbaren Beziehungen (sachverhaltserklärend oder kooperationssichernd) offen gelassen wird. Schließlich gibt es eine unmittelbare Sützung, nämlich von der Informationsübermittlung in 1.2; diese wird ihrerseits durch 1.2.1 sachverhaltserklärend gestützt. Abbildung 7.4: Illokutionsstruktur-Analyse aus Brandt u. Rosengren (1992) Neben der Illokutionshierarchie ist für die Beschreibung des Textes nach BR noch eine zweite Ebene anzunehmen, nämlich die der Sequenzierung. Die Illokutionshierarchie selbst nehmen BR als prinzipiell ungeordnet an: Stützungsbeziehungen sind in der Regel nicht daran gebunden, in welcher Reihenfolge die Segmente im Text erscheinen. Davon kann man sich für EDU s leicht überzeugen: (7.2) a Mähe doch bitte das Gras. Morgen wird es zu lang sein, als dass wir es mit dem alten Rasenmäher schaffen. b Morgen wird das Gras zu lang sein, als dass wir es mit dem alten Rasenmäher schaffen. Mähe es doch bitte. Bezogen auf den gesamten Text sind die Entscheidungen über die Anordnung aber natürlich nicht beliebig. Die Sequenzierung unterliegt ebenso wie die Hierarchisierung dem allgemeinen Erfolgsprinzip (s. o.), folgt darüber hinaus aber auch spezielleren Prinzipien, die den Raum der möglichen Anordnungen einschränken (vgl. auch Abschnitt 5.2). BR vertiefen diesen Punkt nicht weiter, doch die vorgeschlagenen Prinzipien seien hier kurz genannt: 129 7.3 Inventar von Illokutionen ▶ Hierarchieprinzip: Illokutionen, die zusammen eine andere Illokution stützen, können nicht unkontrolliert auseinander gerissen werden. ▶ Ikonizitätsprinzip: Die zeitliche und kausale Abfolge der Inhalte des Textes bestimmen die Sequenzierung mit. ▶ Situationsprinzip: Textsorte, Kontext der Einbettung, mitunter auch das Ziel des Sprechers bestimmen die Sequenzierung mit. Wenn minimale Segmente durch Stützungsbeziehungen verbunden werden und eine Sequenzierung vorgenommen wird, entsteht eine Strukturbeschreibung des Textes. Welche Bedingungen sind an eine solche Struktur geknüpft? BR machen dazu keine sehr engen Vorgaben. Während der „ideale“ Text durch eine einzelne Illokutionshierarchie gekennzeichnet ist (wie im obigen Beispiel), kann es in einem Text durchaus auch mehrere Hierarchien geben, falls er mehr als eine Funktion erfüllt. Überdies ist es möglich, dass ein Segment mehr als eine dominierende Illokution stützt. Als ein Zugeständnis an die Bildung von Textsegmenten (wie bei Grosz / Sidner und Schröder) gehen wie gesehen auch BR davon aus, dass es im Text inhaltlich zusammenhängende Blöcke geben kann, die nicht in eine Illokutionshierarchie zu zergliedern sind, sondern als Ganzes eine Funktion erfüllen; innerhalb des Blocks bestehen dann Beziehungen nicht zwischen Illokutionen, sondern allein auf der inhaltlichen Ebene (mehr dazu in den folgenden Kapiteln). Befragen wir nun die hier geschilderten Modelle nach ihrem Bezug zur Textfunktion, so finden wir, dass bei BR die Funktion des Textes gleichgesetzt wird mit der „Wurzel“ der Illokutionshierarchie, also der insgesamt dominierenden Illokution. Das bedeutet, dass die Gesamtfunktion jeweils an einer konkreten Stelle des Textes identifiziert werden kann, also mit dem Sprechakt einer EDU gleichzusetzen ist. Dies ist ein wichtiger Unterschied zu den Ansätzen von Grosz / Sidner und Schröder, die davon ausgehen, dass sich Sätze zu Textsegmenten zusammenfügen und entsprechend aus einzelnen Satzhandlungen jeweils Segmenthandlungen abgeleitet werden. Wie auch Schröder (2003) bemerkt, entspricht dies recht genau der Unterscheidung zwischen Konstituentenstruktur und Dependenzstruktur in der linguistischen Analyse von Sätzen: Im einen Fall spielt die Bildung größerer Segmente eine konstitutive Rolle für die Gesamtstruktur, im anderen Fall sind es allein die Dependenzbeziehungen zwischen elementaren Einheiten, die die Struktur ergeben. 7.3 Inventar von Illokutionen Nachdem wir uns mit der Verknüpfung von Illokutionen zu übergeordneten Strukturen beschäftigt haben, bleibt noch die Frage nach den elementaren „Bausteinen“ einer Illokutionsstruktur zu behandeln. Gemäß dem zu Anfang des Kapitels diskutierten Leitsatz „Sprechen ist Handeln“ definieren wir mit Motsch (1987, S. 45 f.) unsere Bausteine als illokutive Handlungen ( IH ), die sich prinzipiell als 4-Tupel darstellen lassen: IH -= <ä, int, kond, kons> 130 7 Sprechhandlungen und Illokutionsstruktur Hier bezeichnet ä die Äußerung eines sprachlichen Ausdrucks; int die Absicht des Sprechers, mit ä ein bestimmtes Ziel z zu erreichen; kond eine Menge von Bedingungen, die in der Äußerungssituation erfüllt sein müssen, damit IH erfolgreich sein kann; und kons eine Menge von Konsequenzen, die mit dem Vollzug von IH verbunden sein kann. Um dies systematisch untersuchen zu können, müssen wir (ebenfalls mit Motsch) voraussetzen, dass die IH sich bestimmten Typen zuordnen lassen, die ihrerseits durch Typen der vier Bestandteile charakterisiert sind. Wir gehen davon aus, dass diese Handlungstypen konventionalisierte Muster sind, die von den Mitgliedern der Sprachgemeinschaft ebenso erworben werden wie das grammatische Wissen. Dieses „Sprachhandlungswissen“ beschreibt also, wie eine Sprecherin in bestimmten Situationen unter Rückgriff auf bestimmte sprachliche Formen bestimmte Ziele erreichen kann. Die Suche nach einem für die Textanalyse (insbesondere die Untersuchung der Illokutionsstruktur) geeigneten Inventar solcher Typen steht im Mittelpunkt dieses Abschnitts- - wir verwenden dafür weiterhin den Begriff der Illokution. Die Korrelation zwischen Typen von Illokutionen und Typen von Äußerungen (ä im 4-Tupel) wird uns später in Abschnitt 9.2 beschäftigen. Es sei jedoch hier bereits (mit einem Beispiel von Schmitt, 2000) illustriert, dass identische sprachliche Formen sehr unterschiedliche Illokutionen tragen können. (7.3) a Stefan fehlte heute im Sportunterricht. Er war krank. b Stefan fehlte heute im Sportunterricht. Auch Patrick kann das bezeugen. Die oberflächliche Identität des ersten Satzes kann nicht darüber hinwegtäuschen, dass er jeweils eine andere Rolle spielt, und dass dementsprechend die Gesamtintention der beiden Satzpaare unterschiedlich ist: [a] informiert die Leserin über Stefans Fehlen und den Grund dafür, während [b] Vorsorge dafür trifft, dass die Leserin vielleicht nicht glaubt, dass Stefan gefehlt hat (womöglich weil ihr zuvor etwas Gegenteiliges mitgeteilt wurde). In [b] stützt der zweite Satz die Illokution des ersten, während der zweite Satz in [a] die Begründung für die im ersten Satz ausgedrückte Proposition liefert-- nicht für die Illokution (wir erinnern uns an das Repräsentationsschema ‚F( RP )‘). Damit geht einher, dass der erste Satz in der Kommunikationssituation jeweils einen unterschiedlichen Status hat, ihm also verschiedene Illokutionen zukommen. Ein ganz ähnliches Motiv für die Beschäftigung mit Illokutionen von EDU s liefern die vier in Abschnitt 7.2.2 genannten Typen von unmittelbaren Stützungsbeziehungen (verstehenssichernd, glaubensstützend, motivationsstützend, ausführungssichernd). Sie lassen sich zum Teil durch Attribute der beteiligten Illokutionen unterscheiden: Bei motivationsstützenden und ausführungssicherenden Stützungen muss die dominierende Illokution eine Handlung des Adressaten zum Inhalt haben (ihn zu einer Handlung auffordern, sie empfehlen etc.). Bei der glaubensstützenden Beziehung steht stattdessen eine These im Vordergrund, eine Proposition, die sich „behaupten“ lässt. Die Verstehenssicherung schließlich bezieht sich nicht auf den Status einer Proposition als These, sondern als Aussage über die Welt, die zunächst einmal nicht zu bezweifeln sein soll, aber eben möglicherweise nicht ohne weiteres inhaltlich verstanden wird. 131 7.3 Inventar von Illokutionen Wenn wir uns also jetzt damit befassen, ob sich ein überschaubares Inventar von elementaren Illokutionen angeben lässt, müssen wir zunächst auf die ‚discourse segment purposes‘ von Grosz u. Sidner (1986) (Abschnitt 7.2.1) zurückkommen. Die Autorinnen hatten die Positionen vertreten, dass die Menge möglicher Intentionen von Sprechern (Leser glaube eine Aussage; Leser sei in der Lage, ein Objekt zu identifizieren; Leser kenne eine Eigenschaft eines Objekts; etc.) im Prinzip offen sei, da wir mit einem Text oder einem Teiltext sehr viele verschiedene Ziele verfolgen können. Dagegen lässt sich wenig einwenden, doch es macht womöglich einen Unterschied, ob wir die Funktion ganzer Textsegmente untersuchen oder lediglich die von minimalen Segmenten, also maximal die von Sätzen. Dann geht es nicht darum, das Spektrum möglicher inhaltlicher Ziele von Sprechern zu klassifizieren, sondern lediglich die Typen von Zielen einzelner Äußerungen zu benennen, die mit einer Äußerung erreicht werden sollen. Dass wir dazu von den Phänomenen der sprachlichen Oberfläche erheblich abstrahieren müssen, stellte bereits Austin (1975) fest, der eine Zählung der performativen Verben des Englischen vornahm und daraus ableitete, man müsse ca. 1.000 verschiedene Sprechakte annehmen. Eine solchermaßen „feinkörnige“ Differenzierung wäre freilich wenig hilfreich. Im Gegensatz dazu machte Searle (1980) einen Vorschlag für eine kleine (weil abstrakte) und gleichzeitig aussagekräftige Menge von Illokutionen. Zunächst benannte er 12 Kriterien für die Klassifikation von Illokutionen, von denen er drei als besonders wichtig ansah und die er dann auch seiner Taxonomie zugrunde legte: Kriterien zur Illokutionsklassifikation nach Searle (Ausschnitt) ▶ Illokutionszweck: Was ist das Ziel, das die Sprecherin verfolgt; was möchte sie erreichen? Searle verwendet dafür Symbole wie ⊢ (Behauptung), ! (Aufforderung zu Handlung), K (Absichtserklärung zu einer Handlung der Sprecherin), E (Ausdruck einer Einstellung), D (Deklaration einer Handlung). ▶ Entsprechungsrichtung: Soll durch die Äußerung die Welt in Einklang mit den Worten gebracht werden, oder sind die Worte im Einklang mit der Welt? Der zweite Fall liegt vor, wenn ich etwas darstelle, die Entsprechungsrichtung verläuft von der Äußerung zur Welt (Symbol: ↓ ); beim Auffordern (Symbol: ↑ ) ist es umgekehrt. ▶ Psychische Einstellung: Was ist die Haltung des Sprechers zur ausgedrückten Proposition - ist es der Wunsch, dass X der Fall sein möge (Symbol: W); der Glaube daran, dass X der Fall ist (G); die Absicht, X zu tun (A); das Bedauern über X; etc.? Eines der übrigen Kriterien, das hier erwähnt sei, ist die Illokutionsintensität, quasi die Vehemenz, mit der das Ziel verfolgt wird (z. B. ich denke eigentlich nicht, dass X versus ich bestreite entschieden, dass X). Die weithin bekannte Typologie von Illokutionen, zu der Searle (wiederum im Anschluss an Austins Arbeiten) gelangte, unterscheidet fünf Kategorien, die sich durch die o. g. drei Merkmale (und ihre Symbole) charakterisieren lassen, sowie durch den propositionalen Gehalt, hier jeweils zum Schluss genannt: 132 7 Sprechhandlungen und Illokutionsstruktur Illokutionstypen nach Searle 1. Repräsentativa: ⊢↓ G (p) Illokutionszweck ist die Behauptung, die Richtung verläuft von den Worten zur Welt, die psychische Einstellung ist ‚Glauben‘. Dies ist die in Texten am häufigsten anzutreffende Kategorie, zuständig für Feststellungen, Beschreibungen, Behauptungen etc. der für wahr gehaltenen Proposition p. 2. Direktiva: ! ↑ W (H vollzieht A) Neben Aufforderungen, Bitten etc. zu einer Aktion A rechnet Searle auch Fragen zu den Direktiva; er fasst sie auf als Aufforderungen an den Hörer H, dem Sprecher eine Antwort zu geben. Die Welt soll im Einklang mit den Worten sein, daher die im Vergleich zu Repräsentativa umgekehrte Entsprechungsrichtung. 3. Kommissiva: K ↑ A (S vollzieht A) Sprecher erklärt die Absicht, die Handlung A auszuführen, und damit die Welt im Einklang mit den Worten zu gestalten. 4. Expressiva: E ∅ (P) (S / H + Attribut) Sprecher drückt seine Einstellung zu einer Proposition aus, die dem Sprecher oder Hörer ein bestimmtes Attribut zuschreibt. Die Zahl möglicher psychologischer Einstellungen ist sehr hoch, daher steht (P) hier für eine Variable. Eine Entsprechungsrichtung gibt es bei Expressiva nicht (daher ∅ ), da die „Welt“ nicht involviert ist. 5. Deklarationen: D ↕ ∅ (p) Der in der Proposition ausgedrückte Zustand wird durch die Äußerung verwirklicht (z. B. Hiermit taufe ich …). Hier ist die Entsprechung zwischen Worten und Welt in beiden Richtungen gegeben, während es keine psychische Einstellung gibt. Für unsere Aufgabe der Analyse authentischer Texte ist Searles Taxonomie (die ja aus einer sprachphilosophischen Perspektive entstand) allerdings nicht unmittelbar geeignet. Zum einen enthält sie Kategorien, die für unseren Zweck nur wenig relevant sind: Kommissiva und Deklarationen spielen in Texten der Art, wie sie uns hier interessieren, kaum eine Rolle. Zum anderen sind bestimmte feinere Unterscheidungen für die Textanalyse mit Searles Merkmalen nicht zu erhalten. Wir benötigen eine Verschiebung der Perspektive: Searles Untersuchung von Sprechakten interessiert sich für Formen des Handelns (mit Sprache). Unser Augenmerk hingegen richtet sich primär auf Funktionen der Sprache, und diese sollten dementsprechend die taxonomischen Unterscheidungen motivieren. Eine Ausdifferenzierung, die explizit auf die Untersuchung authentischer Texte zielt, hat Schmitt (2000) vorgeschlagen. Grundlegend ist hier die Unterscheidung zwischen primären und sekundären Illokutionen. Erstere stellen im engeren Sinne eigenständige Handlungen dar und können daher problemlos isoliert auftreten. Schmitts Kategorien knüpfen an die von Searle an: 133 7.3 Inventar von Illokutionen ▶ Reportiva entsprechen Verben wie berichten, bekanntmachen, ankündigen uvm. Ihr propositionaler Gehalt p ist meistens (aber nicht zwingend) ein in der Vergangenheit liegendes Ereignis. Die Sprecherin hat p in der Regel selbst erlebt, erfahren oder herausgefunden, und das wesentliche Merkmal der Illokution ist die Weitergabe der Information p. ▶ Estimativa (einschätzen, behaupten, vermuten uvm.) tragen einen propositionalen Gehalt, dessen Wahrheit die Sprecherin annimmt, ohne darüber aber letzte Gewissheit zu haben. Wesentliches Merkmal ist die Weitergabe einer solchen mit Ungewissheit behafteten Information. ▶ Evaluativa sind Bewertungen und Werturteile, die die Sprecherin ausdrückt. Hinsichtlich des möglichen propositionalen Gehalts gibt es kaum Beschränkungen. ▶ Identifikativa sind Äußerungen von Gefühlen, Hoffnungen, Wünschen oder Grundwerten der Sprecherin etc. Es geht um innere Zustände, jedoch nicht um Kenntnisse oder Überzeugungen der Sprecherin. Wesentlich ist, dass die Sprecherin einen Aspekt ihrer eigenen Persönlichkeit mitteilt. ▶ Relationata werden von der Sprecherin verwendet, um die persönliche Beziehung zur Adressatin zu etablieren, modifizieren etc. Zugrunde liegt hier in der Regel keine Proposition mit Bestandteilen R und P; stattdessen werden konventionalisierte Formeln verwendet, um zu danken, begrüßen, der Adressatin etwas zu wünschen, zu verabschieden, zu beleidigen, uvm. ▶ Direktiva sind Aufforderungen zu einer künftigen Handlung der Adressatin. Der propositionale Gehalt besteht aus dem, wozu aufgefordert wird. Je nach gewählter Emphase können Direktiva ‚obligatorisch‘ oder ‚fakultativ‘ sein. Erstere (bestimmen, anordnen, beauftragen etc.) setzen ein entsprechendes Verhältnis zwischen Sprecher und Adressat voraus, letztere (bitten, Rat geben, vorschlagen, etc.) dürften in Texten die häufigeren sein. Das Anliegen der sekundären Illokutionen ist demgegenüber, andere Äußerungsteile verständlich zu machen. Sie sind daher niemals in Isolation anzutreffen und stellen keine eigenständigen Handlungen dar, sondern erfüllen eine innertextuelle Funktion, indem sie einen bestimmten Teil des Texts (ihren Skopus) erklären, kommentieren, gliedern, etc. Sie zu systematisieren, erweist sich als schwierig. Schmitt fasst darunter zum Beispiel ‚bekanntheitsreportierende‘ (wie Sie wissen; so haben wir gesehen; etc.) und ‚quellenreportierende‘ wie Das gab die Deutsche Bundespost heute bekannt. Hier erscheint einerseits die Abgrenzung zu den Reportiva schwierig, andererseits die Begrenzung der Menge möglicher sekundärer Illokutionstypen. Unstrittig dürfte aber die Rolle von ‚Textillokutionen‘ sein, oft auch als ‚metakommunikative Akte‘ bezeichnet: Sie geben den Lesern Signale zur Gliederung des Textes, können ihn eröffnen oder abschließen. Beispiele: Wie wir im Folgenden sehen werden; wir beenden diesen Abschnitt mit X; später wird zu zeigen sein, dass X. Kehren wir zu den (interessanteren) primären Illokutionen zurück und konzentrieren uns jetzt auf Textsorten, die uns in den vergangenen Kapiteln besonders beschäftigt haben, so erweisen sich die bislang getroffenen Unterscheidungen als noch nicht aussagekräftig genug, wenn wir etwa das zu Beginn des Abschnitts genannte Beispiel 7.3 erklären wollen. In [a] wie in [b] müssten wir wohl beide Sätze als Reportiva einstufen und hätten damit keinen Hinweis 134 7 Sprechhandlungen und Illokutionsstruktur auf die zugrunde liegende Differenz. Der Grund dafür ist, dass sowohl Searle als auch Schmitt sich in ihren Definitionen auf die Perspektive der Sprecherin konzentrieren und keine weiteren Unterscheidungen bzgl. der Annahmen über den Hörer treffen. Schmitt differenziert zwischen einigen Einstellungen, die die Sprecherin zur Proposition haben kann, aber nicht zwischen den Rollen, die die Proposition für den Hörer spielen kann oder soll. Und wie die Diskussion des Beispiels 7.3 gezeigt hatte, ist dies ein sehr wesentlicher Gesichtspunkt. Abbildung 7.5: Taxonomie des Illokutionstyps Feststellung nach Motsch (1987) Um an dieser Stelle noch einen Schritt voran zu gehen, greifen wir zum Abschluss den Vorschlag von Motsch (1987) auf, der speziell für die von ihm so genannten „Feststellungstexte“ eine detailliertere Taxonomie von Illokutionstypen vorschlug. 45 Sie ist in Abb. 7.5 gezeigt und tritt im Schmitt‘schen Inventar an die Stelle der drei Gruppen Reportiva, Estimativa und Evaluativa. Motsch nimmt die Grundunterscheidung in vier Typen von Feststellungen anhand des Kriteriums der Präsenz verschiedener Adverbiale vor, weist aber darauf hin, dass bestimmte Verben die Markierung ebenfalls vornehmen können. So seien die Val-Aussagen durch valuative Adverbien gekennzeichnet, die eine Bewertung des Sachverhalts anzeigen, entsprechend den Schmitt‘schen Evaluativa. In Vol-Aussagen liegen voluntative Adverbien vor, mit denen die Sprecherin den Wunsch ausdrückt, dass ein Sachverhalt (nicht) eintrete, so wie in Hoffentlich wird der Opposition etwas Schlagkräftiges dazu einfallen. Im Zentrum des Interesses stehen für Motsch die W-Aussagen, die den Bereich der Repräsentativa bzw. Reportiva auffächern. Sie werden durch eine Reihe von konstitutiven Bedingungen charakterisiert, die dann auch die Unterschiede zwischen den einzelnen Typen beschreiben. Allen W-Aussagen sind zwei Bedingungen 46 gemeinsam, nämlich die Aufrichtigkeit des Sprechers und sein Glaube an die Relevanz der übermittelten Proposition p (B1 und B2). Die anderen Bedingungen unterscheiden die Subtypen voneinander. 45 Ähnliche Unterscheidungen wie Motsch trifft beispielsweise auch Morgenthaler (1980). 46 Die Bedingungen weisen Ähnlichkeiten zu den von Grice (1975) formulierten Konversationsmaximen auf, worauf Motsch allerdings keinen Bezug nimmt. 135 7.3 Inventar von Illokutionen ▶ (B1) Sprecher ist davon überzeugt, dass p. ▶ (B2) Sprecher glaubt, dass der Zustand „Hörer glaubt, dass p“ in der Äußerungssituation relevant ist. ▶ (B2‘) Sprecher glaubt, dass „Sagen, dass p, obwohl Hörer glaubt, dass p“ in der Äußerungssituation besondere Relevanz hat. ▶ (B3) Sprecher glaubt, dass Hörer nicht glaubt, dass p (p ist für Hörer nicht bereits bekannt). ▶ (B3‘) Sprecher glaubt, dass Hörer glaubt, dass p. ▶ (B4) Sprecher glaubt, dass Hörer keinen Grund hat, zu bezweifeln, dass p. ▶ (B4‘) Sprecher glaubt, dass Hörer nicht ohne weiteres glauben wird, dass p. ▶ (B5) Der Inhalt der Mitteilung hat eine besondere Relevanz. Für Informationen und Behauptungen gilt B3- - die Information ist für den Hörer neu. Konstatierungen hingegen sind durch B3‘ und B2‘ charakterisiert, der Hörer weiß also über p bereits Bescheid, doch gibt es einen guten Grund, p nochmals herauszustellen. Beispiele für solche Konstatierungen sind Wie Du weißt, trinke ich keinen Kaffee und Der neue Tenor hat ja einen Bart. Informationen und Behauptungen wiederum unterscheiden sich durch B4 / B4‘. Die Information kann ohne weitere Umstände übermittelt werden, weil der Sprecher voraussetzt, dass sie vom Hörer nicht in Zweifel gezogen werden wird (B4). Anders bei der Behauptung (B4‘), die genau dadurch gekennzeichnet ist, dass der Sprecher sich darüber klar ist, etwas möglicherweise Kontroverses zu äußern, das in der einen oder anderen Form der Untermauerung bedarf. Alle drei Typen von W-Aussagen lassen sich weiter untergliedern, was Motsch allerdings nur für die Informationen ansatzweise ausführt. Der häufigste Fall ist die Mitteilung, für die die Bedingungen B1-B4 gelten; andere sind dann durch zusätzliche Bedingungen gekennzeichnet. So gilt für das Bekannt geben etwa B5-- eine Bedingung, die allerdings interpretationsbedürftiger ist als die anderen. Beispiele sind die Bekanntgabe von Entscheidungen, wichtigen Daten oder Regelungen. Für die übrigen Subtypen von Informationen gelten ähnliche spezifische Bedingungen, auf die wir hier nicht weiter eingehen. Die sprachliche Form gibt häufig kein explizites Signal für den vorliegenden Typ von W- Aussage, vielmehr muss die Hörerin ihn erschließen. Dies setzt voraus, dass der Sprecher zutreffende Annahmen über das von beiden Kommunikationspartnern geteilte Wissen macht. In der gesprochenen Sprache können die Unterschiede zum Teil durch die Prosodie angedeutet werden, in der geschriebenen Sprache stehen andere Mittel zur Verfügung, wie die Benutzung von Partikeln: Das ja im o. g. Beispiel einer Konstatierung zeigt an, dass der Sprecher die Proposition als bereits bekannt ansieht. Die epistemischen Aussagen (Ep-Aussagen) werden von Motsch in vier Gruppen geteilt. Mit einer Vorhersage äußert sich der Sprecher zu einem zukünftigen Sachverhalt, der nicht bereits evident ist. Wenn der Sprecher nicht erwartet, dass sich die Hörerin der Vorhersage sogleich anschließt, liegt der Sonderfall der Prognose vor, für die wieder eine Relevanzbedingung (analog zu B2) und eine „Überzeugungsbedingung“ (analog zu B4‘) gelten. Die Aufrichtigkeitsbedingung lautet hier „Sprecher hält p für wahrscheinlich.“ Diese drei Bedingungen 136 7 Sprechhandlungen und Illokutionsstruktur haben die Prognosen mit den Hypothesen gemeinsam, die sich allerdings nicht auf künftige Sachverhalte, sondern die Wahrscheinlichkeit eines bereits stattgefundenen (oder zeitlosen) Sachverhalts beziehen. Sie ähneln den oben besprochenen Behauptungen. Motsch nennt das Beispiel Es gibt nur zwei Wortarten, Verben und Nomen, das den Status einer Hypothese hat und vom Sprecher sicherlich begründet werden müsste. Bei Vermutungen geht der Sprecher davon aus, dass die Hörerin keine Einwände gegen die vorgebrachte Wahrscheinlichkeitsbewertung von p haben wird. Sie weisen damit Ähnlichkeit zum o. g. Typ der Informationen auf. Annahmen schließlich ähneln den Konstatierungen und betrachten Sachverhaltsbeschreibungen als wahre Aussagen, um auf dieser Grundlage eine Hypothese zu überprüfen. Beispiel: Angenommen, dass es heute nacht regnet. Dann wird unser neues Zelt ja sofort nass! Soll Berlin sich um Olympia 2016 bewerben? [1] Hamburg hat es längst begriffen: Olympia ist Gold wert. [2] Wer die Spiele in die Stadt holt, steht im weltweiten Wettstreit um Aufmerksamkeit auf dem Siegertreppchen. [3] Darum darf Berlin die Chance auf Olympia 2016 jetzt nicht verspielen. [4] Die Hauptstadt muss den Staffelstab von Leipzig übernehmen und sich als Austragungsort bewerben. [5] Barcelona hat gezeigt, dass der olympische Effekt unbezahlbar ist. [6] Mit den Spielen 1992 hat sich die Stadt neu erfunden - [7] und macht bis heute Gewinn. [8] Die Zahl der Übernachtungen hat sich verdoppelt, [9] die Wirtschaft profitiert noch immer. [10] Wenn sich Berlin nun im zweiten Anlauf bewirbt, zeigen wir der Welt, dass wir es besser können als einst. [11] Schließlich bringt die Stadt heute mit, was ein Kandidat braucht: Metropolenflair, Hotelbetten, Infrastruktur. [12] Die für Olympia 2000 konzipierten Sportstätten wie das Velodrom und die Max-Schmeling-Halle stehen, das Olympiastadion ist so gut wie neu, die Anschutz-Arena kommt. [13] Schon durch die erneute Bewerbung würde sich Berlin modernisieren und international profilieren. [14] Staatliche und private Gelder könnten fließen, Millionenzuschüsse vom IOC würden folgen. [15] Und selbst, wenn schon 2012 eine europäische Metropole Ausrichter werden sollte: [16] Man muss die Muskeln früh spielen lassen, um die Spiele, wenn nicht mit der zweiten, dann eben mit der dritten Bewerbung in die Stadt zu holen. [17] Berlin an die Startblöcke: Achtung, fertig, los! (Der Tagesspiegel, 23.5.2004) Abbildung 7.6: Beispieltext Olympia Die Festlegung der Illokutionen von EDU s stellt die erste Stufe einer handlungsorientierten Textanalyse dar: Haben wir jeweils identifiziert, welche Funktion die einzelnen EDU s innehaben, so können wir anschließend über ihr Zusammenspiel entscheiden, also die Rolle der einzelnen EDU s für den Text betrachten. Diesen Schritt hatten wir in Abschnitt 7.2 begonnen und werden ihn in den nachfolgenden Kapiteln fortsetzen. An dieser Stelle aber wollen wir die Analyse der einzelnen EDU -Illokutionen anhand eines Beispieltexts illustrieren, gezeigt in Abb. 7.6. Als Kategorien legen wir dabei einerseits die von Motsch (1987) vorgeschlagenen Typen von Feststellungen, andererseits die von Schmitt (2000) genannten Direktiva, Relationata und Identifikativa zugrunde. 137 7.4 Übungsaufgaben Der Text beginnt mit zwei Bewertungen (also Val-Aussagen) in [1-2], die der Autor als unkontrovers voraussetzt, denn aus ihnen gewinnt er in [3-4] die zentrale These des Kommentars. Auch diese beiden sind Meinungsäußerungen, doch steht hier wohl der Aufforderungscharakter im Vordergrund, wie sich in den verwendeten Modalverben darf und muss zeigt; daher scheint eine Analyse als fakultative Direktiva angemessen. [5] ist eine weitere Val-Aussage, die von [6-9] abgestützt wird. Dabei sind [6] und [7] Behauptungen- - die erste relativ vage, die zweite so konkret, dass sie ihrerseits abgestützt wird, nämlich mit den Mitteilungen in [8-9] (dies sind „objektive“, überprüfbare Angaben). Von [10] an geht der Autor auf das mögliche Gegenargument der gescheiterten Berliner Bewerbung im Jahr 2000 ein. Den Anfang macht die Val-Aussage [10] (wir können es heute besser), welche durch die Behauptung [11] gestützt wird (wir haben, was man braucht). Sie wird ihrerseits durch die Mitteilung [12] ergänzt und gestützt. Dass sich die Stadt modernisieren und profilieren würde [13], kann als Behauptung gedeutet werden, die durch eine konkretere Vorhersage [14] gestützt wird. Zum Abschluss knüpfen [15-17] mit ihrem Appellcharakter (fakultative Direktiva) noch einmal an die zentrale These [3-4] an. Das mögliche Gegenargument [15] wird von [16] beiseite gewischt, und [17] liefert einen olympisch-rhetorisch angemessenen Ausklang. Weiterführende Literatur Wer einen etwas ausführlicheren Einblick in die Entwicklungen der Sprechakttheorie sucht, ohne direkt die Originalliteratur von Austin und Searle zu lesen, findet beispielsweise bei Saddock (2005) eine gut lesbare Darstellung. Für die Behandlung von Illokutionen auf der Textebene empfiehlt sich die im Kapitel genannte Originalliteratur, etwa die sorgfältige empirische Unteruschung von Zeitungstexten von Schmitt (2000) oder die stärker auf die Strukturbildung fokussierte Theorie der Handlungsstruktur von Texten von Schröder (2003). 7.4 Übungsaufgaben 1. Zerlegen Sie Ihren Kommentar, analog zu der Analyse in Abb. 7.6, in EDU s. Folgen Sie dabei Ihrer Intuition, illokutionswertige Segmente zu bilden. (Wir werden die Aufgabe der Segmentierung erst in Kapitel 9 genauer erörtern.) Dann versuchen Sie, ebenfalls unserem Beispieltext folgend, jedem Segment eine Illokution aus dem hier verwendeten Inventar zuzuordnen. 2. An welchen Stellen im Text sehen Sie Hinweise auf eine Stützungsbeziehung zwischen benachbarten (oder auch nicht benachbarten) EDU s und ihren Illokutionen? Versuchen Sie auch die Art der Beziehung anzugeben, unter Rückgriff auf die von Schmitt (2000) vorgeschlagenen Kategorien (siehe oben, S. 127). 3. Erstellen Sie abschließend eine Analyse nach dem Ansatz von Schröder (2003), also mit ‚Teiltexthandlungen‘, die möglicherweise nicht direkt mit Illokutionen von EDU s übereinstimmen. Dann beurteilen Sie, welche der Analysen Ihrem Kommentar am besten gerecht wird. 139 8.1 Argumentieren 8 Argumentationsstruktur (8.1) Der Kandidat hat einen intelligenten Eindruck gemacht, ber sein Benehmen war reichlich unangemessen. Wir sollten ihn nicht einstellen. Für den Texttyp argumentativ entwickeln wir in diesem Kapitel die vorangegangenen Überlegungen zu Illokutionsstrukturen weiter in Richtung einer Repräsentation der Struktur von Argumentationen. Im obigen Beispiel sehen wir einerseits eine Stützungsbeziehung zwischen der Beobachtung, dass das Benehmen des Kandidaten unpassend war, und der Folgerung, ihn nicht einzustellen. Doch auch der Hinweis auf die Intelligenz ist Teil der Argumentation, nämlich ein möglicher Einwand gegen die Folgerung- - der aber in diesem Fall von der Autorin als nicht stark genug eingeschätzt wird. Die gesamte Konstellation ergibt dank der Verknüpfung durch aber ein kohärentes Ganzes. In Abschnitt 8.1 beschäftigen wir uns zunächst mit dem Wesen von Argumenten und ihrer sprachlichen Realisierung, bevor 8.2 einen Vorschlag zur Darstellung von Argumentationsstrukturen macht. Danach gehen wir noch auf die Annotation solcher und ähnlicher Strukturen in verschiedenen Korpora ein. 8.1 Argumentieren Damit wir eine Äußerung als ‚argumentativ‘ bezeichnen können, muss sie aus zumindest zwei Segmenten (die wir auch in diesem Kapitel ‚elementary discourse units‘ nennen und als EDU abkürzen) bestehen, denn ohne eine illokutive Stützung entsteht kein Argument. Umgekehrt allerdings ist das Vorliegen einer solchen Stützungsbeziehung noch nicht hinreichend; m. a. W., es gibt auch Stützungsbeziehungen, die wir nicht als argumentativ einstufen würden. (8.2) a Ich werde mir morgen ein neues Smartphone kaufen, denn mein altes ist einfach zu langsam. b Der Motor springt nicht an, weil eine Zündkerze defekt ist. c Stimmen Sie für Frau Meier, denn nur sie kann als Bürgermeisterin die Stadt voranbringen! Nur der letzte Fall stellt eine typische Argumentation dar, weil die Leser zu einer Handlung aufgefordert werden, und der Autor ein aus seiner Sicht geeignetes Motiv für diese Handlung anführt. Im Fall [a] gibt der Sprecher eine zukünftige Handlung bekannt und begründet diese; für solche Fälle passt der Begriff des Argumentierens aber ebenso wenig wie für das Erklären im Fall [b], sofern der Kontext so beschaffen ist, dass zwei Gesprächspartner das Motorproblem kennen, aber zunächst nur einer von beiden die Ursache. Zu einem guten Teil können die relevanten Unterschiede durch Angabe der Illokutionstypen benannt werden, wie wir sie z. B. in Abb. 7.5 gesehen haben: Wenn das, was gestützt wird, eine reine Informationsaussage (Mitteilen, Bekannt geben, Melden etc.) ist, dann gibt es keine echte Möglichkeit zur Argumentation. Der Grund dafür ist, dass dem Argumentieren etwas ‚Strittiges‘ zugrunde liegen muss: Nur wenn die Sprecherin damit rechnen muss, dass 140 8 Argumentationsstruktur der Hörer gegen eine Äußerung Widerspruch einlegen könnte, ist sie in der Position, ein Argument zu liefern. Dieser und weitere relevante Aspekte werden in der Definition von van Eemeren u. Grootendorst (2004, p. 1) kompakt zusammengefasst: Argumentation is a verbal, social, and rational activity aimed at convincing a reasonable critic of the acceptability of a standpoint by putting forward a constellation of propositions justifying or refuting the proposition expressed in the standpoint. Es wird also ein Standpunkt verteidigt, indem eine ‚Konstellation von Propositionen‘ vorgebracht wird-- und im einfachsten Fall kann diese auch nur aus einer einzigen Stützungsbeziehung bestehen, wie in Beispiel 8.2 [c]. Als weiteres wichtiges Merkmal wollen wir hier das Adjektiv ‚rational‘ herausstellen: Beim Argumentieren geht es um vernunftorientiertes Überzeugen, nicht um bloßes „Überreden“ mit anderen Mitteln, wie zum Beispiel in Sie sollten den Befehl befolgen, denn anderenfalls melde ich Sie dem Major. Fragen wir dann, wofür man argumentieren kann, also nach dem Thema des argumentativen Texts, so scheint zunächst keine sinnvolle Antwort möglich, weil-- siehe Kapitel 5 - die Menge möglicher Text-Themen kaum eingrenzbar ist. Aber durch die Einschränkung auf den strittigen Gegenstand lässt sich doch eine Kategorisierung vornehmen, die von den möglichen Gegenständen in interessanter Weise abstrahiert: Argumentationstypen nach (Eggs, 2000) ▶ Das epistemische Argument belegt oder bestreitet einen bestimmten Sachverhalt. Beispiel: Der Präsident der USA ist der mächstigste Mann der Welt. ▶ Das deontische Argument rät für oder gegen eine bestimmte Handlung. Beispiel: Wir sollten das deutsche Bildungssystem reformieren. ▶ Das ethisch / ästhethische Argument bewertet etwas als gut vs. schlecht bzw. schön vs. unschön. Beispiel: Theodor Heuss war ein hervorragender Bundespräsident. Nach Eggs bestimmt dieser Typ des Arguments dann zu einem gewissen Grad auch die sprachliche Realisierung der Argumentation; so finden sich beispielsweise im ethisch / ästehtischen Argument häufig evaluative Adjektive, die hingegen im epistemischen Argument nur seltener eine Rolle spielen, da es hier um das Nicht-/ Zutreffen eines Sachverhalts geht. Bei der Besprechung des eingangs zitierten Beispiels 8.1 haben wir auf die Präsenz eines Gegenarguments hingewiesen, das die Autorin mit anführt, dann aber wieder entkräftet, um letztlich ihre These zu untermauern. Solche Erwähnungen von Gegenargumenten dienen dazu, etwaige Einwände der Leser vorwegzunehmen, um damit insgesamt die Argumentation zu verstärken: Die Perspektive der Gegenseite wurde mitgedacht-- aber nicht für stichhaltig befunden. Daraus ergibt sich, dass Argumentieren eine inhärent dialogische Aktivität ist: Das Einbeziehen der Leser ist wichtiger als in anderen Texttypen, die „nur“ Informationen 141 8.1 Argumentieren vermitteln oder eine Geschichte erzählen. Es ist wichtiger, weil die gesamte Zielsetzung ja darin besteht, die Einstellung der Leser zu verändern; und um dies möglich zu machen, muss die Autorin Annahmen über die Disposition der Leser anstellen, was genau das Antizipieren von etwaigen Einwänden einschließt. Die einfache Beschreibung des Argumentierens als das „Aufstellen einer Behauptung und Anführen von Gründen“ muss also weiter gefasst werden. Oder anders gesagt, die in der Definition von van Eemeren genannte Konstellation von Propositionen kann durchaus eine komplexere sein. Wir können uns die Aufgabe auch an dem im vorigen Kapitel behandelten Beispieltext Movie (Bild 7.1 auf S. 122) verdeutlichen. Dort gibt der Autor im Segment (5-6) zu, dass der Kinofilm positive Aspekte hat, wischt dies aber dann mit stärkeren Gegenargumenten wieder vom Tisch. In unserer Analyse in Abschnitt 7.2.1 (sowohl nach Grosz u. Sidner, 1986 als auch Schröder, 2003) konnten wir dieses „Einräumen“ aber lediglich verbal in den Umschreibungen ausdrücken- - es gab kein formelles Instrument, um das für die Struktur der Argumentation sehr wichtige Vorgehen explizit zu kennzeichnen. Wir benötigen dafür also geeignetere Beschreibungsmittel. Abbildung 8.1: Schema einer Argumentation nach Toulmin (1958) Ein viel zitierter Vorschlag zur allgemeinen Darstellung eines Arguments ist der von Toulmin (1958), der sich als Diagramm wie in Abb. 8.1 darstellen lässt. Ziel des Sprechers ist, den Hörer von der These C zu überzeugen, die er auf der Grundlage einer Beobachtung D aufstellt-- zum Beispiel: Morgen wird es regnen, denn die Schwalben fliegen sehr tief. Mit einem Modaloperator Q ist es möglich, die These einzuschränken, zu betonen etc., wie in Morgen wird es bestimmt regnen. Damit D wirklich als Stütze für C fungieren kann, muss es eine allgemein akzeptierte (und auch dem Hörer bekannte) Regel W geben, in unserem Beispiel „Wenn die Schwalben tief fliegen, wird es Regen geben.“ Die Aussagekraft von W oder die Anwendbarkeit im konkreten Fall kann wiederum abgestützt werden, etwa durch eine dahinter stehende Autorität: So besagt es eine alte Bauernregel. Und schließlich ist es möglich, die Folgerungsbeziehung für den konkreten Fall mit einem Gegenargument anzugreifen, dies besagt der Bestandteil ‚Unless R‘. Im Beispiel könnte ein R vielleicht darin bestehen, dass die Schwalben sich von der großen Hitze 142 8 Argumentationsstruktur täuschen lassen.- - In dieser Weise können Argumentationen in ihre typischen Bestandteile aufgeschlüsselt werden, wobei mitunter auch zutage treten kann, dass sie zwar oberflächlich zu „funktionieren“ scheinen, letztlich aber auf nicht gedeckten Prämissen beruhen. Die Aufgabe des Toulmin-Schemas ist, die Struktur eines „Arguments-an-sich“ vorzugeben. Es ist eine statische Schablone, in die Bestandteile eines konkreten Arguments gefüllt werden können. Zur Beschreibung der in einem Text vorgefundenen argumentativen Züge ist es aber noch nicht unmittelbar verwendbar, da es dort zu komplexeren, verschachtelten Konstellationen kommen kann. 8.2 Argumentation im Text Um den Aufbau der in einem Text vorgefundenen Argumentation wiederzugeben, benötigen wir einen kompositionalen Ansatz, der es erlaubt, für jeden Satz seine Rolle im Gefüge der Argumentation anzugeben- - ähnlich zur in Kapitel 7 besprochenen Illokutionsstruktur, jedoch mit weiter gehenden Möglichkeiten zur Komposition von Elementen. Von welcher Art diese Elemente und Bezüge sein sollten, lässt sich dem Toulmin-Schema entnehmen. Abbildung 8.2: Bausteine einer Argumentation nach Freeman (2011) Abbildung 8.3: Analyse des Kreisel-Textes nach Freeman (2011) 143 8.2 Argumentation im Text Soll der Steglitzer Kreisel abgerissen werden? [1] Alles spricht gegen den Steglitzer Kreisel. [2] Selbst wenn man vergisst, dass der olle Schuhkarton in bester Lage einst ein privates Prestigeobjekt war, [3] das der öffentlichen Hand für teures Geld aufgenötigt wurde. [4] Ein Symbol der West-Berliner Filzwirtschaft in den späten sechziger Jahren. [5] Aber lassen wir das ruhig beiseite. [6] Der Kreisel ist Asbest verseucht. [7] Nicht nur hier und da, sondern durch und durch. [8] Zwar könnte man, wie beim Palast der Republik, den Bau bis aufs wackelige Stahlskelett entkleiden und neu aufbauen. [9] Aber das würde mindestens 84 Millionen Euro, vielleicht auch das Doppelte kosten. [10] Was für ein Preis für die Restaurierung eines städtebaulichen Schandflecks, [11] der seit mehr als dreißig Jahren Schatten auf die nette, gutbürgerliche Umgebung wirft. [12] Von allen Seiten versperrt der Kreisel die Sicht. [13] Er ist keine Sehenswürdigkeit. [14] Und für die Mitarbeiter des Bezirks Steglitz, die im Hochhaus arbeiten, kann die Lebensqualität bei einem Umzug in ein anderes Dienstgebäude nur steigen. [15] Der Kreisel ist auch innen hässlich, [16] zudem zugig und Energie verschleudernd. [17] Einzig brauchbar ist die gute Verkehrsanbindung und [18] der Blick aus dem 24. Stock auf den Süden Berlins. [19] Aber beides rechtfertigt es nicht, das marode Gebäude zu sanieren. [20] Für das viele Geld kann man fast zwei neue, wirklich schöne Häuser bauen. (Der Tagesspiegel, 23.5.2004) Einen Vorschlag dazu unterbreitete Freeman (2011), der zwar insofern in der Toulmin‘schen Tradition steht, als er ebenfalls philosophisch motiviert ist, der aber gut für eine Textanalyse verwendet werden kann. Freeman schlägt eine Reihe von Kompositionsschemata vor, von denen wir die wesentlichen hier vorstellen und anhand eines Beispieltextes illustrieren. Abb. 8.2 zeigt die vier Grundbausteine. (K1) ist der einfache Fall, in dem Beobachtung D unmittelbar die These C stützt, analog zur Beziehung zwischen D und C im Toulmin-Schema. In (K2) wird C von zwei Beobachtungen D1 und D2 gestützt, die unabhängig voneinander sind; hier könnten auch mehr als zwei Ds stehen. Ein ähnlicher Fall ist (K3), allerdings sind hier die stützenden Beobachtungen nicht unabhängig voneinander, sondern sie bedingen sich gegenseitig: Die eine könnte ohne die andere nicht als Stützung fungieren. (K4) entspricht zunächst dem „unless rebuttal“ von Toulmin: Die Stützung von C durch B wird von R außer Kraft gesetzt, was auch die fett gezeichnete Durchstreichung andeuten soll. In der Regel sind aber im argumentativen Text die Gegenargumente nur potenziell gültig-- sie werden ihrerseits abgeschwächt oder außer Kraft gesetzt, damit die These des Autors abermals gestützt wird. Dazu dient das „counter rebuttal“ CR , das die Wirkung von R abschwächt oder eliminiert. Hier jeweils ein Beispiel für jedes Baustein-Schema: (1) Die Bayern sind dieses Jahr in Topform. Darum werden sie sicher Deutscher Meister. (2) Die Bayern sind dieses Jahr in Topform, und Dortmund muss den Weggang von Reus verkraften. Darum werden die Bayern sicher Deutscher Meister. (3) Die Bayern sind dieses Jahr in Topform, und die Form ist letztlich für den Saisonverlauf entscheidend. Darum werden sie sicher Deutscher Meister. (4) Borussia Dortmund hätte wegen seines starken Sturms gute Chancen auf die Meisterschaft, aber der Torwart ist in einer Dauerkrise. Darum werden sicher die Bayern Meister, denn die sind in Topform. 144 8 Argumentationsstruktur Entscheidend ist nun, dass die Freeman‘schen Konstruktionen (K1)-(K4) miteinander kombiniert werden können, um komplexere Argumentationen abzubilden. So lassen sich Ketten von Stützungsbeziehungen bilden, aber auch ein Gegenargument sowie seine Entkräftung können sich aus mehreren Elementen zusammensetzen und eine eigene Sub-Argumentation bilden. Im obigen Beispiel (4) beispielsweise entspricht dem Element R aus Konstruktion K4 selbst eine Stützungsbeziehung, nämlich die zwischen Dortmund hat einen starken Sturm und Dortmund hat gute Chancen auf die Meisterschaft. Zur Illustration zeigt Abb. 8.3 eine komplette Analyse für den aufgeführten Beispieltext Kreisel 47 , bei dem die zentrale These recht plakativ gleich zu Beginn des Textes erscheint, und dann verschiedene Pfade der Abstützung eingeschlagen werden, zweimal auch mit Entkräftung potenzieller Gegenargumente. Zu beachten ist, dass die Analyse recht freimütig von der Reihenfolge der EDU s im Text abweicht. Dies ist beabsichtigt, denn die hier eingeführte Argumentationsstruktur soll allein die inhaltlichen Stützungs- und Angriffszusammenhänge abbilden, die durchaus nicht immer linear im Text aufeinander folgen müssen. Ein zweiter Aspekt der Abstraktion ist das Auslassen von EDU s, die für die Argumentation keine wirkliche Rolle spielen; hier betrifft es das Segment (5), das eine rhetorische Formel darstellt, die natürlich nicht wörtlich gemeint ist: (2-4) soll keineswegs „beiseite gelassen“ werden, vielmehr sind die auf (5) folgenden Argumente im Sinne eines „obendrein“ zu verstehen. Damit trägt (5) aber sachlich nichts zu den Stützungsbeziehungen bei, findet also in dieser Struktur keinen Platz. Eine in dieser Weise von Freeman (2011) inspirierte Argumentationsstruktur soll also in erster Linie die Form des Arguments abzubilden, und nur sekundär die Form des Textes-- das Argumentationsgerüst wird gewissermaßen „herausgeschält“. Da, wie wir gesehen haben, auch Einheiten des Textes beiseite gelassen werden können, ist dies in einem engen Sinn also eigentlich nicht mehr eine Ebene der Textstruktur, sondern ein Ergebnis von inhaltlicher Interpretation und Abstraktion. Die lineare Abfolge von Argumentationssträngen und auch einzelnen EDU s ist natürlich in der Regel nicht gleichgültig, sondern bestimmten Beschränkungen unterworfen, wie sie etwa von der Rhetorik untersucht werden. Die hier vorgestellte Struktur wäre also für ein vollständiges Bild der Textstruktur durch eine kohärenzorientierte Analyse zu ergänzen; wir werden einen möglichen Ansatz dafür in Kapitel 10 besprechen. 8.3 Annotation von Argumentationsstrukturen in Korpora Da die Aufgabe der automatischen Erkennung von Argumentationen in Texten in der Computerlinguistik einige Popularität erlangt hat, sind in den letzten Jahren eine Reihe von annotierten Korpora der unterschiedlichsten Art entstanden. Viele bestehen aus Web-Texten, denn es gibt, gerade für das Englische, eine Reihe von Webseiten, die sich speziell dem Austausch von Argumenten zu aktuellen strittigen Fragen widmen. 47 Der Steglitzer Kreisel ist ein lange umstrittenes Hochhaus, das die Bezirksverwaltung von Berlin-Steglitz beherbergt. 145 8.3 Annotation von Argumentationsstrukturen in Korpora In solchen Korpora sind vielfach lediglich die Thesen und die stützenden Argumente annotiert, doch gelegentlich werden auch komplette Strukturen in der oben besprochenen Form annotiert. Das an Freeman (2011) orientierte Schema wurde von Peldszus u. Stede (2016b) zu Annotationsrichtlinien weiter entwickelt, die den mehrschrittigen Bearbeitungsprozess darstellen. Hier werden einige weitere Unterscheidungen getroffen, vor allem die zwischen zwei Formen der Widerlegung eines Gegenarguments: ▶ Beim Rebuttal bestreitet der Autor, dass ein genanntes Gegenargument tatsächlich gültig ist bzw. die dort getroffene Aussage der Wahrheit entspricht. ▶ Beim Undercut wird nicht die Gültigkeit des Gegenarguments in Frage gestellt, sondern seine Relevanz für die These des Autors. M. a. W., eine Aussage wird konzediert, ihre Folgen für die These des Autors werden aber bestritten. Das Annotationsschema wurde einerseits auf Zeitungskommentare angewandt, andererseits auf eine Sammlung von kurzen „Mikrotexten“, die für den Zweck der Argumentationsuntersuchung erhoben wurden (Peldszus u. Stede, 2016a). Die Texte sind nur etwa 5 Sätze lang und geben eine konzise, begründete Antwort auf eine strittige Frage. Für die Annotation der Graphen wurde eine spezielle Software namens Gra PAT 48 entwickelt, Abb. 8.4 zeigt zur Illustration einen Bildschirmabzug. Abbildung 8.4: Annotation eines kurzen Textes mit Gra PAT (Bildschirmabzug) Das Korpus der argumentativen Mikrotexte ist frei verfügbar. 49 Die Texte liegen sowohl in Deutsch als auch in Englisch vor, und sie wurden neben der Argumentationsstrutur auch mit Diskursstruktur-Annotationen versehen; dazu mehr in Kapitel 10. 48 http: / / angcl.ling.uni-potsdam.de/ resources/ grapat.html (Zugriff 7. 1. 18). 49 https: / / github.com/ peldszus/ arg-microtexts (Zugriff 7. 1. 18). 146 8 Argumentationsstruktur Ein größeres Korpus längerer Texte, die nach einem ähnlichen, aber weniger feinkörnigen, Schema der Argumentationsstruktur bearbeitet wurden, ist das persuasive essay corpus von Stab u. Gurevych (2014). Es handelt sich um 400 Aufsätze in englischer Sprache. Die Annotation orientiert sich an Absätzen, die jeweils als eine vollständige Argumentation betrachtet werden. Auch dieses Korpus ist frei verfügbar. 50 Weiterführende Literatur Während die Literatur zur Argumentationstheorie - wenig überraschend - äußerst umfangreich ist, sind textlinguistisch orientierte Studien zu Argumentationsverläufen in authentischen Texten eher rar. Wir weisen hier aber auf die sehr ausführliche und aufschlussreiche Untersuchung von Zeitungskommentaren zum Golfkrieg 1991 hin, die Eggler (2006) vorgelegt hat. Aus der Perspektive der Sprechakttheorie untersucht Klein (2011) sorgfältig die Unterschiede zwischen einer Reihe von ‚konklusiven‘ Sprechhandlungen, wie sie u. a. auch für die Argumentationsbeschreibung wichtig sind. Unter anderem unterbreitet er den Vorschlag, auch komplexe Sprechhandlungen zu definieren, die mehrere Einzelakte systematisch verknüpfen (was wiederum für die Argumentation zentral ist, wie wir gesehen haben). Als eine textsortenspezifische Untersuchung für das Englische sei die Arbeit von McElholm (2002) genannt, die argumentative und rhetorische Muster in wissenschaftlichen Texten unter die Lupe nimmt. 8.4 Übungsaufgabe 1. Falls Ihr Kommentar keine klar erkennbare Argumentation für eine bestimmte These enthält, suchen Sie sich ggf. für diese Aufgabe einen geeigneteren Text. Teilen Sie den Text in Sätze auf und geben Sie analog zu dem in Abb. 8.3 gezeigten Beispiel eine Analyse der Argumentationsstruktur an. 50 https: / / www.ukp.tu-darmstadt.de/ data/ argumentation-mining/ argument-annotated-essays/ (Zugriff 7. 1. 18). Teil III Phänomenübergreifende Textstruktur 149 9.1 Segmentierung von Texten 9 Minimale Texteinheiten und ihre Verknüpfung Nachdem sich Teil II des Buches mit einer Reihe von Phänomenen beschäftigt hat, die-- je nach Textsorte und Texttyp unterschiedlichen-- Einfluss auf die Textstuktur ausüben, nehmen wir nun in Teil III eine andere, phänomenübergreifende Perspektive ein: Was lässt sich allgemein über den Aufbau von Texten sagen? In vielen der bisherigen acht Kapitel war von den kleinsten Einheiten oder EDU s die Rede, die u. a. für eine Untersuchung von Illokutionen, Themen oder Argumentationen eine Rolle spielen. Diese EDU s unterziehen wir im vorliegenden Kapitel nun einer genaueren Analyse. Zunächst geht Abschnitt 9.1 der Frage nach, ob sich Kriterien für die Individuation und Abgrenzung von EDU s finden lassen. Eine daran anschließende und ebenfalls für viele Analysezwecke relevante Aufgabe ist die der Verknüpfung der EDU s mit einem Illokutionstyp (vgl. Abschnitt 7.3); der Abschnitt 9.2 untersucht eine Reihe von sprachlichen Merkmalen, die Hinweise dafür liefern. Haben wir in dieser Weise einen Text in eine Sequenz von EDU s (mit Illokutionen) überführt, ist noch ein genauerer Blick auf die Schnittstellen zwischen den EDU s zu werfen: Wie verbinden sie sich miteinander zu größeren Einheiten? Abschnitt 9.3 widmet sich dem pragmatischen Konzept der Kohärenzrelation und dem damit eng verbundenen linguistischen Instrument des Konnektors. 9.1 Segmentierung von Texten Die Aufgabe, Kriterien für eine Textsegmentierung zu definieren, stellt sich letzten Endes für alle in Teil II diskutierten Beschreibungsebenen, und ebenso für die im nächsten Kapitel folgende Ebene. Wir werden uns im Folgenden auf die Identifikation von EDU s beschränken und den speziellen Aspekt der Markierung größerer Texteinheiten beiseite lassen; zu diesem Thema sei auf die Untersuchung von Gliederungssignalen in deutschsprachigen (vor allem narrativen) Texten von Gülich u. Raible (1977) sowie, mit engerem Bezug zu Zeitungstexten, auf den Abschnitt 3.2 von (Schröder, 2003) verwiesen. Was also ist die minimale Einheit der Textanalyse? Die erste Antwort ist natürlich: der Satz. Gemäß der im letzten Kapitel behandelten Sprechakttheorie ist er die „ideale“ Einheit, die eine eigenständige Illokution verkörpert, und damit bildet der Satz auch eine EDU für die Textanalyse; dies ist beispielsweise auch die Ausgangsposition von Motsch (1987, S. 48). Sobald wir uns allerdings mit authentischen Texten und ihrer Vielzahl von mitunter komplex strukturierten Satztypen beschäftigen, kann die Aufgabe, „satzwertige Einheiten“ zu identifizieren, recht schwierig werden. Eine korpusorientierte Arbeitsweise benötigt Segmentierungskriterien, die einerseits soweit möglich die Merkmale der sprachlichen Oberfläche ausschöpfen, damit Annotatoren nicht instruiert werden, lediglich intuitiv „illokutionswertige Einheiten“ zu markieren. Andererseits hat es sich als sehr kompliziert erwiesen, eine vollständige und eindeutige Definition allein anhand von Oberflächenmerkmalen und Syntax festzulegen, so dass in der Praxis ein gewisser Entscheidungsspielraum für die „Illokutionswertigkeit“ verbleibt. Die Aufgabenstellung muss in Form von Annotationsrichtlinien möglichst präzise festgelegt werden, und diese lassen sich dementsprechend nicht in wenigen Absätzen formulieren. 150 9 Minimale Texteinheiten und ihre Verknüpfung Die Richtlinien von Carlson u. Marcu (2001) für das Englische und die von Stede u. a. (2016b) für das deutsche PCC zum Beispiel umfassen allein für die Segmentierung jeweils 20-30 Seiten (freilich unter Einschluss vieler Beispiele). Im Folgenden beziehen wir uns zum großen Teil auf diese beiden Dokumente und fassen die wesentlichen Kriterien zusammen, die dort behandelt werden. Allgemein gilt, dass dies die beiden zentralen Problemquellen für eine Diskurssegmentierung sind: ▶ Zusammengesetzte Sätze: Wenn mehrere Hauptsätze nebenordnend verbunden sind oder wenn zum Hauptsatz noch Nebensätze hinzutreten, dann muss entschieden werden, welche dieser Teile jeweils eigene Diskurssegmente bilden. ▶ Fragmentarische Einheiten: Fragmente unterschiedlicher Komplexität (einzelne Worte, Phrasen etc.) können im Text die Position von Sätzen einnehmen, oder auch als Parenthesen bzw. Appositionen in Sätze eingefügt sein. Ihre Behandlung muss für die unterschiedlichen Auftretensweisen geklärt werden. Im Folgenden besprechen wir die beiden Phänomene in Kürze. Fragmente Eine für die Textstrukturierung wichtige Unterscheidung ist die zwischen einleitenden und beendenden Fragmenten. Beide übermitteln keine vollständige Information und stellen keinen eigenständigen Sprechakt dar, sondern modifizieren jeweils ein benachbartes Segment. Ein einleitendes Fragment kann das nachfolgende ankündigen oder vorbereiten und ist nur in Verbindung mit diesem interpretierbar. Beispiele sind: [Es gilt: ], [Darum sagen wir: ], oder eben auch [Beispiele sind: ]-- Analog ist ein beendendes Fragment nur im Verbund mit dem vorangehenden Segment interpretierbar, weil es eine Information oder eine Bewertung hinzufügt und damit quasi eine Leerstelle auffüllt: [Dann hat Meier sich endlich gemeldet.] [Am Montag.] Es verbleibt dann eine dritte Gruppe von Fragmenten, die zwar auch Elision aufweisen, welche durch den vorangehenden Kontext gefüllt werden muss, die jedoch einen neuen Sachverhalt ausdrücken bzw. einen eigenen Sprechakt darstellen: [Dann hat Meier sich endlich gemeldet.] [Und einen Vorschlag gemacht.] Zur Abgrenzung von vollständigen Sätzen werden sie in den PCC -Richtlinien als ‚Hauptsatzfragmente‘ bezeichnet. Bei einer Illokutionsanalyse werden sie wie Sätze behandelt, während die einleitenden und beendenden Fragmente nur gemeinsam mit ihrem Nachbarfragment eine illokutionswertige Einheit bilden. Komplexe Sätze Für zusammengesetzte Sätze müssen die Annotationsrichtlinien festlegen, unter welchen Bedingungen sie in mehrere EDU s zu teilen sind. In der Literatur wird dieses Problem gelegentlich unter Verweis auf den Begriff der ‚clause‘ bzw. des ‚Teilsatzes‘ stark vereinfachend umschifft. Hier jedoch steckt der Teufel im Detail: Wie sich eine clause definiert und welche Typen von clauses als EDU s fungieren sollen, ist in authentischen Texten oft schwierig zu entscheiden. Auch die eingangs genannten Annotationsrichtlinien erscheinen an einigen Stellen etwas willkürlich; so findet sich etwa bei Carlson u. Marcu (2001) neben vielen konkreten Vorgaben auch der Hinweis, dass eine clause als EDU aufzufassen ist, wenn sie offenbar in einer Kohärenzrelation zu einem benachbarten Segment steht, weil „strong discourse cues“ 151 9.1 Segmentierung von Texten vorliegen, wie in despite-Präpositionalphrasen, die eine Concession Relation ausdrücken: [We ignored the book] [despite the teacher‘s recommendation.] 51 Dies mag ein wenig den Eindruck einer zirkulären Vorgehensweise hervorrufen, ist aber nurmehr ein Indiz für unsere eingangs genannte Beobachtung, dass eine vollständig formgeleitete Segmentierungsanweisung kaum erreichbar ist. Ein erster Schritt zur Annäherung an möglichst präzise Segmentierungsvorgaben besteht in der Unterscheidung zwischen Nebenordnung und Unterordnung. Ein einfacher Fall liegt vor, wenn ein Satz eine Verbindung (mit oder ohne Konjunktion) aus mehreren vollständigen Hauptsätzen darstellt; diese sind dann jeweils separate EDU s: [Die Sonne schien vier Stunden lang,] [und der Wald erwärmte sich kräftig.] [Der Buntspecht arbeitete an seiner Höhle,] [der Eichelhäher ließ unablässig seinen Warnruf vernehmen.] Nebenordnende Konjunktionen können aber natürlich auch andere syntaktische Einheiten verbinden, und für unsere Aufgabe entsteht eine Komplikation insbesondere bei konjugierten Verbalphrasen: Leonie kam früh nach hause und bereitete sich auf den Spieleabend vor. In den PCC Richtlinien würde dies als Sequenz eines Hauptsatzes und eines Hauptsatzfragments analysiert, die beide als eine eigenständige EDU aufgefasst werden. Im Beispiel liegen offenkundig zwei verschiedene Ereignisse vor, was einen EDU -Status nahelegt; andere Fälle können jedoch schwieriger zu entscheiden sein. Für eine korpusbasierte Untersuchung zur diskursorientierten Annotation von VP -Konjunktion im Englischen sei hier auf Webber u. a. (2016) verwiesen. Bei syntaktisch untergeordneten Nebensätzen hängt es vom Typ des Nebensatzes ab, ob er als selbstständige EDU anzusehen ist oder nicht. Satzkomplemente des Matrixverbs beispielsweise erfüllen die Bedingung nicht, weil sie eine Leerstelle im Hauptsatz füllen, anstatt einen separaten Sachverhalt auszudrücken: [Sarah schrieb, dass es ihr gut gehe.] Partizipialkonstruktionen, wie sie im Englischen besonders häufig sind, werden meistens als eigenständige EDU s betrachtet: [Scratching his head,] [he entered the room quietly.] / [Getragen von einer Welle der Euphorie] [lief die Mannschaft ins Stadion ein.] Anders wiederum, wenn die Partizipialphrase ein Komplement des Verbs darstellt: [Jill joined Mark in selecting the photographs for the presentation.] Infinitivphrasen können satzwertig sein oder auch nicht. Aus der Sicht der Kohärenzrelationen sind erweiterte Infinitive eigene EDU s, weil sie in einer Purpose Beziehung zum Hauptsatz stehen: [Sie beeilte sich,] [um den Zug noch zu erreichen.] Demgegenüber bilden Subjekt- oder Objektsätze keine EDU , weil ansonsten der Hauptsatz semantisch unvollständig bliebe (wie bei den oben genannten Komplementen): [Den Artikel erst am letzten Tag zu schreiben erwies sich als keine gute Idee.] 51 Grabski u. Stede (2006) haben am Beispiel der deutschen Präposition bei darauf hingewiesen, dass man konsequenterweise auch vielen Präpositionalphrasen den Status einer EDU zuschreiben muss, wenn sie als Adjunkt fungieren und mit dem Verb eine Beziehung eingehen, die aus Diskursperspektive als Kohärenzrelation gedeutet werden würde. Eine notwendige Bedingung dafür ist, dass das interne Argument der Präpositionalphrase ein Ereignis oder einen Zustand bezeichnet. So stellt etwa Bei schlechtem Wetter sollten Sie den Berg sofort verlassen eine Formulierung der Relation Condition dar, die sich paraphrasieren lässt als Wenn das Wetter schlecht ist / wird, sollten Sie den Berg sofort verlassen. 152 9 Minimale Texteinheiten und ihre Verknüpfung Als letztes Beispiel betrachten wir den Relativsatz, der wiederum nicht allein nach syntaktischen Kriterien beurteilt werden kann. Wird er nicht restriktiv verwendet, sondern als „weiterführend“, kann man dafür argumentieren, ihn als separate EDU s aufzufassen. Ein Beispiel aus dem Kreisel-Text von S. 143: [Was für ein Preis für die Restaurierung eines städtebaulichen Schandflecks,] [der seit mehr als dreißig Jahren Schatten auf die nette, gutbürgerliche Umgebung wirft.] Dieser Relativsatz dient nicht dazu, aus der Menge aller städtebaulichen Schandflecke einen konkreten herauszugreifen (restriktive Funktion), sondern über den bereits identifizierbaren Gegenstand neue Information zu übermitteln. Ein klar restriktiver Relativsatz hingegen wird als Teil der übergeordneten EDU zu behandeln sein: [Ich nehme das Brötchen, das ganz links liegt.] Da wir die Phänomene hier jeweils einzeln mit kurzen Beispielen illustriert haben, wurden in allen Fällen Sequenzen von zwei EDU s gebildet. In komplexen Sätzen kann es jedoch zu mehrfachen Einbettungen kommen, und man muss dann Festlegungen treffen, unter welchen Umständen EDU s als verschachtelt bzw. als sequenziell zu repräsentieren sind. Dieses Problem soll uns hier nicht beschäftigen; ein Vorschlag findet sich in den entsprechenden PCC -Richtlinien (Stede, 2016a). 9.2 Identifikation von Illokutionen Abbildung 9.1: Hierarchie von Illokutionstypen (Kombination aus (Motsch, 1987) und (Schmitt, 2000)) Für eine Analyse der Illokutionsstruktur folgt auf die Segmentierung die Aufgabe, den EDU s jeweils eine Illokution zuzuweisen. Im Abschnitt 7.3 hatten wir mit Searle (1980) und Schmitt (2000) zunächst ein grobes Raster von Illokutionstypen genannt und es anschließend für die uns interessierenden Textsorten angepasst, was einerseits zur Auslassung einiger Typen, andererseits zur feineren Untergliederung des Bereichs der ‚Feststellungen‘ anhand der Arbeit 153 9.2 Identifikation von Illokutionen von Motsch (1987) führte. Abb. 9.1 zeigt eine Synthese der beiden Ansätze, wobei allerdings die von Motsch vorgenommene letzte Stufe der Verfeinerung weggelassen ist, da wir auf diese Unterscheidungen hier nicht mehr eingehen werden. Des weiteren sind zum Zweck der Vereinheitlichung die von Motsch unter Feststellungen subsumierten Vol-Aussagen (Sätze, die Wünsche der Sprecherin ausdrücken) hier den Schmitt‘schen Identifikativa zugeordnet (Aussagen, mit denen der Sprecher etwas über seine inneren Zustände mitteilt: Gefühle, Hoffnungen, Wünsche etc.). Die von Schmitt verwendeten Begriffe sind in der Abbildung kursiv gesetzt. Im Folgenden stellen wir die wesentlichen Typen von Kriterien zusammen, die Hinweise auf die einer EDU zugrunde liegende Illokution geben können. In der Mehrzahl der Fälle sind diese Hinweise keineswegs eindeutig: Ähnlich wie die Zuweisung einer Kohärenzrelation ist auch die Entscheidung für die Illokution einer EDU ein Interpretationsschritt, der erheblich vom sprachlichen und situativen Kontext beeinflusst ist, mitunter auch vom Weltwissen der Annotatorin. Ein gerade für die Textsorte Kommentar häufig schwieriger Fall ist die Unterscheidung zwischen Information und Behauptung (im Sinne der Motsch-Klassifikation): Betrachtet die Autorin die in der EDU enthaltene Proposition als potenziell strittig oder als unstrittig? Signale an der Sprachoberfläche können allgemein die Interpretationsentscheidung unterstützen, weil sie mit bestimmten Illokutionstypen korrelieren oder bestimmte Typen aus der Menge der Möglichkeiten ausschließen. In der Literatur werden diese Signale häufig als illocutionary force indicating devices, oder kurz IFID s, bezeichnet; wir werden diese Abkürzung im Folgenden auch verwenden. Das wohl bekannteste Problem im Zusammenhang mit IFID s und Illokutionstypen ist das der sog. indirekten Sprechakte. Hier besteht zwischen den in der EDU verwendeten IFID s und dem Illokutionstyp keine Korrespondenz, sondern ein Konflikt. In der linguistischen Pragmatik wurde dies ausführlich untersucht, wir geben unten im Abschnitt zum Satzmodus ein Beispiel, gehen auf diese Diskussion aber nicht weiter ein. Stattdessen konzentrieren wir uns hier allein auf die sprachliche Oberfläche und die dort ablesbare „vordergründige“ Illokution. Liedtke (1998) unterscheidet in diesem Zusammenhang systematisch zwischen zwei Verwendungsmodi für IFID s: Sind die Kommunikationspartner miteinander vertraut und liefert der Äußerungskontext deutliche Hinweise auf die jeweils intendierten Sprechhandlungen, so ist die Bindung zwischen IFID -Verwendung und Illokution nicht sonderlich eng; Liedtke nennt dies den resultativen Modus, weil das Resultat der Kommunikation im Zentrum steht und nicht die eigentlich „korrekte“ Form. Anders im instrumentalen Modus, wo Sprecher und Adressat sich weniger auf Kontextinformation verlassen. Stattdessen muss die Äußerungsform „illokutiv stimmig“ sein. Das ist in den in diesem Buch vorzugsweise besprochenen Zeitungstexten fast durchgängig der Fall. Eine andere Textsorte, die den instrumentalen Modus nahelegt, sind Behördenbriefe; Liedtke illustriert dies mit der offenkundig fehlformulierten Aufforderung Kommen Sie am Donnerstag doch mal beim Amtsgericht vorbei. Insgesamt ist der Zusammenhang zwischen Illokutionstypen und sprachlichen Merkmalen (und deren Zusammenwirken) bislang nur unzureichend untersucht. Gerade für dieses Thema kann die Bereitstellung von annotierten Daten, die auch von Dritten beurteilt und die 154 9 Minimale Texteinheiten und ihre Verknüpfung quantitativ ausgewertet werden können, Fortschritte ermöglichen. Bisher sind solche Daten allerdings kaum verfügbar. 9.2.1 Performative Formeln Das wohl klarste Signal, das ein Sprecher zur Anzeige des Illokutionstyps verwenden kann, ist die explizite performative Formel. Darauf sind wir in Kapitel 7 bereits kurz eingegangen und haben auch auf Austins Zählung der performativen Verben des Englischen (ca. 1.000) hingewiesen. Verwende ich also ein solches Verb, lasse ich der Leserin kaum eine Wahl bei der Identifikation der Illokution (zumindest der vordergründigen-- siehe oben). (9.1) Ich bitte Dich, mir das Buch morgen zurückzugeben. (9.2) Wir fordern Sie auf, am Donnerstag, dem 12. Juli, im Amtsgericht zu erscheinen. (9.3) Für den Vorfall entschuldige ich mich in aller Form. In der Literatur wird der Begriff ‚performatives Verb‘ nicht ganz einheitlich verwendet. Eine enge Lesart beschränkt ihn auf diejenigen Verben, deren korrelierte Sprechakte im engeren Sinn zu den Performativa (im Unterschied zu Konstativa) zählen: Die Äußerung verwirklicht die ausgedrückte Proposition und ändert damit einen Zustand in der Welt (vgl. Searles Deklarationen auf S. 132: Hiermit taufe ich-…). Diese eingeschränkte Verwendung schlägt auch Bußmann (2002) vor und bezeichnet die übrigen, den Sprechakt unmittelbar anzeigenden Verben als ‚illokutionäre Verben‘-- womit wir uns unter dem Aspekt der IFID -Kategorisierung verwirrenderweise aber immer noch im Bereich der gemeinhin so genannten ‚performativen Formeln‘ befinden. Ein Verwendungsbeispiel für ein illokutionäres Verb ist Ich meine, wir sollten jetzt gehen. Bussmann gibt als Diagnose die Einfügung des Adverbs hiermit an, die bei performativen Verben problemlos akzeptabel sei, bei illokutiven jedoch nicht: ? Ich vermute hiermit, dass Du recht hast. Die Kategorie ist nicht auf die Verwendung einzelner Verben beschränkt, sondern schließt auch komplexere, formelhafte Ausdrücke ein, wie etwa Es ist zu bezweifeln, dass X oder Wir müssen darauf achten, dass X. Sie drücken ebenfalls eine Sprechereinstellung aus, die in einem entsprechend „feinkörnigen“ Inventar jeweils mit einem Illokutionstyp in Beziehung zu setzen ist. Als letzte Beispiele sei auf die jeweils ersten Sätze der Texte Kreisel (S. 143) und Olympia (S. 136) verwiesen. Sie lauten Alles spricht gegen den Steglitzer Kreisel und Olympia ist Gold wert, und beiden liegen Mehrwortausdrücke zugrunde, die den Sätzen den Illokutionstyp Val-Aussage zukommen lassen. 9.2.2 Satzart In der Linguistik sowie in Standard-Grammatiken werden die Begriffe für die Unterscheidung unterschiedlicher Klassen von Sätzen nicht einheitlich gebraucht. Es gibt das Bestreben, die rein syntaktisch begründete Klassenbildung zu trennen von semantisch und pragmatisch motivierten Gruppierungen; unklar ist allerdings, ob sich die beiden letztgenannten auseinander halten lassen. Betrachten wir aber zunächst die Syntax, die häufig den Ausdruck Satztyp 155 9.2 Identifikation von Illokutionen nutzt, um strukturelle Unterscheidungen im Aufbau von Sätzen zu benennen (die auch mit prosodischen Merkmalen einhergehen). Dies kann man eher oberflächennah anhand der Verbstellung tun und für das Deutsche dann Verberst-, Verbzweit- und Verbletztsätze unterscheiden (z. B. Eisenberg, 1989), oder im Rahmen einer spezifischen syntaktischen Theorie anhand entsprechender Untersuchung auch der ‚Tiefenstruktur‘, wie es etwa Brandt u. a. (1992) für die Government and Binding Theorie taten (und darüber hinaus auch den Bezug zu Satzmodus und zur Illokution herstellen). Ob die Unterscheidung zwischen einer semantischen und einer pragmatischen Beschreibungsebene systematisierbar ist, soll uns hier nicht beschäftigen. Statt dessen folgen wir Bußmann (2002) und einer Reihe von Grammatiken (z. B. Helbig u. Buscha, 2001) in ihrer Gruppierung von Satzarten: Satzarten nach Helbig u. Buscha (2001) ▶ Aussagesätze gelten mit ihrer Verbzweitstellung als Vertreter der „prototypischen“ Satzart, die die vielfältigsten Verwendungsmöglichkeiten bietet. ▶ Fragesätze lassen sich weiter einteilen, üblicherweise in Entscheidungsfragen mit Verberststellung (Liest Du das Buch? ) und Ergänzungsfragen mit Verbzweitstellung (Welches Buch liest Du? ); weitere Klassen schlägt z. B. Liedtke (1998) vor. ▶ Aufforderungssätze sind an der Verberststellung und (im Falle vertraulicher Anrede) dem Verbmodus Imperativ erkennbar (Bring mir das Buch! ), es gibt aber eine Reihe von Sonderformen, auf die wir nicht eingehen. ▶ Wunschsätze beziehen sich ebenso wie Aufforderungen auf noch nicht realisierte Sachverhalte, sprechen aber den Adressaten nicht direkt an. Beispiele: Würde es doch endlich mal regnen! / Wenn ich doch noch mal jung sein könnte. ▶ Ausrufesätze sind nach Helbig u. Buscha strukturell entweder den Aussage- oder den Fragesätzen ähnlich, erfüllen jedoch die Funktion, eine Emotion auszudrücken: Du hast das aber schön gemacht! / Wie froh ich bin! Eisenberg (1989) nennt als weitere Satzart den subordinierten Satz, der aber keine semantische oder pragmatische, sondern lediglich eine syntaktische Funktion erfülle; wir erinnern hier aber an die Diskussion der weiterführenden Nebensätze im vorigen Abschnitt, denen man oft durchaus auch den Status einer eigenständigen Illokution zubilligen kann. Die Erläuterungen der Satzarten, etwa bei Helbig u. Buscha (2001), verwenden fallweise sowohl strukturelle (morphologische, syntaktische, prosodische) Merkmale als auch Sprechhandlungskriterien. Daher sind Überlappungen und „Grauzonen“ zwischen den Arten keineswegs ausgeschlossen; beispielsweise könnte man unser erstes Beispiel für den Wunschsatz auch dem Ausrufesatz zuordnen. Für die uns hier letzlich interessierende Beschreibungsebene der Illokution gilt naheliegenderweise eine recht enge Korrelation zwischen der Satzart Aufforderung und der Illokution Direktivum, und analog zwischen dem Fragesatz und einer 156 9 Minimale Texteinheiten und ihre Verknüpfung Illokution, die man als Quaesitiv bezeichnen kann-- mit diesen beiden hat sich die Pragmatik ausführlich beschäftigt. Dies sollte jedoch keinesfalls zur Annahme einer unmittelbaren Korrespondenz zwischen Satzart und Illokutionstyp führen-- die anderen hier besprochenen Arten von IFID s spielen ihrerseits eine Rolle, und auf die wesentliche Rolle der Interpretation im Kontext haben wir bereits hingewiesen. Gerade für Aufforderungen und Fragen gilt ja, dass die vordergründige und die „hintergründige“ Illokution häufig nicht übereinstimmen. Um aufzufordern, können wir anstelle des imperativischen Gib mir doch mal die Fernbedienung ein ganzes Spektrum indirekter Formulierungen verwenden, auch solche, die dann in Nachbarschaft zur Satzart Wunschsatz stehen: Es wäre zu schön, wenn ich die Fernbedienung hätte.-- Andererseits besteht aber auch keine Beliebigkeit; gerade beim letztgenannten Beispiel sind das Modalverb, der konditionale Konnektor und der Verbmodus in dieser Kombination ein sehr klares Signal für die zumindest vordergündige Illokution Identifikativum, die man in einer angemessenen Äußerungssituation (ein Kommunikationspartner ist im Raum und hat die Fernbedienung) als Direktivum interpretieren kann. Es bestehen also zwischen Satzart und Illokutionstyp tendenzielle Korrelationen, doch die Interpretationsentscheidung fällt stets im Zusammenhang mit weiteren IFID s und im Kontext. Die Tendenzen sind: Aussagesatz- - Feststellung; Fragesatz- - Quaesitivum; Aufforderungssatz-- Direktivum; Wunschsatz-- Identifikativum; Ausrufesatz-- Identifikativum. Im Hinblick auf die uns besonders interessierenden Textsorten können verschiedene Verfeinerungen vorgenommen werden, und wir werfen auf drei Satzarten noch kurz einen weiteren Blick. Zum Fragesatz ist festzustellen, dass der Illokutionstyp Quaesitiv für publizierte Texte fast immer nur vordergründig sein kann (wenn wir einmal von Quizfragen absehen). Gerade in Kommentaren werden Fragen gern „rhetorisch“ verwendet; ein Beispiel sahen wir im Text Movie auf Seite 122: How can our young people drink in through their eyes a continuous spectacle of intense and strained activity and feeling without harmful effects? Die Leser sind hier natürlich nicht aufgefordert, über die erfragte Art und Weise eines ungefährlichen visuellen Konsums nachzudenken, sondern sie sollen sich der bereits gegebenen Antwort anschließen-- die harmful effects sind unvermeidbar, mithin ist der zugrunde liegende Illokutionstyp hier die Val-Aussage. Auch Aufforderungssätze sind in Meinungstexten nur selten als Direktiva gemeint, nämlich dann, wenn Entscheidungssträger (z. B. Politiker) unmittelbar zu einer bestimmten Handlung ermuntert werden. Ansonsten sind die Aufforderungen als Appelle an die Einstellung der Leser zu verstehen. Einer der Subtypen von Aufforderungssätzen ist der Adhortativsatz, der nicht den Verbmodus Imperativ verwendet, sondern beispielsweise lassen-Konstruktionen. Ein Beispiel findet sich im Text Kreisel auf S. 143: Lassen wir das ruhig beiseite. Den Aussagesatz haben wir oben als die flexibelste Satzart bezeichnet, und eine Durchsicht unserer Beispieltexte im Kapitel 7 bestätigt diese These leicht. Der Aussagesatz deckt das gesamte Spektrum der von Motsch ausdifferenzierten Feststellungen ab (Abb. 9.1): Mit ihm kann der Autor informieren, behaupten, vorhersagen, bewerten uvm. Darüber hinaus können auch Identifikativa (Mir geht es gut), Relationata (Ich begrüße unsere neuen Leser) und Direktiva (Du gehst sofort ins Bett) die Form von Aussagesätzen aufweisen. Besonders 157 9.2 Identifikation von Illokutionen zur Unterscheidung zwischen den Typen von Feststellungen sind daher die nächsten beiden IFID -Arten sehr wichtig: Modalverben und Adverbien. 9.2.3 Modalverben Die Modalverben des Deutschen 52 (müssen, sollen, dürfen, können, mögen, wollen; mitunter werden noch einige andere dazu gezählt) können in zwei verschiedenen Lesarten gebraucht werden: In epistemischer Verwendung modulieren sie den Grad der Möglichkeit oder Wahrscheinlichkeit, mit der der beschriebene Sachverhalt nach Meinung des Sprechers eintritt-- er formuliert also einen Aspekt seiner Einstellung (Gewissheit) zum Sachverhalt. Beispiele: (9.4) Er kommt um 9 am Bahnhof an. / Er dürfte um 9 am Bahnhof ankommen. / Er müsste um 9 am Bahnhof ankommen. / Er mag um 9 am Bahnhof ankommen. Während die Variante ohne Modalverb als Information gelesen werden kann (jedoch nicht zwangsläufig so gelesen werden muss), verschiebt das Modalverb die Illokution in Richtung eines Estimativums (zu den Unterschieden zwischen den Typen von Estimativa siehe Abschnitt 7.3). In deontischer Verwendung formuliert die Sprecherin hingegen, dass sie den Sachverhalt für notwendig oder erlaubt hält, hier geht es also häufig auch um das Verhältnis des Adressaten zum Sachverhalt. So lässt sich mit müssen die Notwendigkeit ausdrücken, wobei dann allerdings anders als im obigen Beispiel nicht der Konjunktiv zu wählen ist, sondern: Er muss um 9 am Bahnhof ankommen. (Der Satz kann freilich auch in dieser Form epistemisch gelesen werden! ) Mit dürfen und können lässt sich Erlaubnis zu einer Handlung signalisieren, mit letzterem aber natürlich auch die Fähigkeit zu einer Handlung (Sie kann Autos reparieren). Besonders vielfältig sind die Gebrauchsweisen von sollen, mit dem ein Sachverhalt als gefordert, beabsichtigt oder behauptet markiert werden kann. Der Illokutionstyp ist bei deontisch verwendeten Modalverben häufig Direktivum, aber es wären auch weitere Sub-Typen von W-Aussagen anzusetzen (etwa: Erlaubnis geben), die in Abb. 9.1 nicht berücksichtigt sind. Anhand von Verbmodus (u. a. Konjunktiv, wie illustriert) und Tempus kann die intendierte Lesart für die Adressatin mitunter expliziert oder zumindest eingeschränkt werden (z. B. lässt sich mit einer Vergangenheitsform offensichtlich kein Direktivum vollziehen). Auch die grammatische ‚Person‘ spielt oft eine Rolle, vgl. den engen Zusammenhang zwischen Identifikativa und der 1. Pers. sg./ pl. Doch häufig sind die sprachlichen Signale auch in der Summe nicht eindeutig, und die Entscheidung der Adressatin fällt per Interpretation im Kontext. 52 Wir geben hier nur einen äußerst groben Überblick über ein komplexes Thema; für eine exemplarische tiefergehende Untersuchung des Illokutionspotenzials eines einzelnen Modalverbs (können) sei auf Liedtke (1998, S. 227 ff.) verwiesen. 158 9 Minimale Texteinheiten und ihre Verknüpfung 9.2.4 Adverbien Einige der Funktionen der Modalverben können auch von Satzadverbien übernommen werden, die es aber durch die Vielzahl der lexikalischen Möglichkeiten gestatten, erheblich feinere Abstufungen vorzunehmen. So kann man die Einschätzung der Un-/ Gewissheit über das Eintreten eines Sachverhalts mit Wörtern wie zweifellos, höchstwahrscheinlich, möglicherweise etc. markieren. Für den Ausdruck innerer Zustände (also für Identifikativa) stehen dem Sprecher Adverbiale wie leider, glücklicherweise, endlich zur Verfügung, mit denen er seine emotionale Einstellung gegenüber dem beschriebenen Sachverhalt signalisieren kann. Die Abgrenzung zu den Evaluativa ist hier nicht ganz einfach. Wir hatten in Abschnitt 7.3 darauf hingewiesen, dass für das Identifikativum die Beschreibung des inneren Zustands des Sprechers im Vordergrund steht, für das Evaluativum die Bewertung eines externen Gegenstands oder Sachverhalts. Er ist ein kluger Kopf fällt damit in die Kategorie Evaluativum, während Ich freue mich, dass er so ein kluger Kopf ist ein Identifikativum darstellt. In der „Grauzone“ liegt Glücklicherweise ist er ein kluger Kopf, doch spricht die Voranstellung des Adverbs hier ebenfalls für die Einordnung als Identifikativum. Bei den Evaluativa lassen sich die Bewertungen natürlich nicht nur mit Adverbien, sondern vor allem mit Adjektiven vornehmen, aber auch mit Substantiven (Mein Klavierlehrer ist ein Gentleman) oder Verben (Mein Klavierlehrer hat versagt). Für die meisten der hier verhandelten Adverbien gilt, dass ihre Verwendung weitgehend auf den Aussagesatz beschränkt ist, sie dienen also in der Tat dazu, Differenzierungen innerhalb des Bereichs des Illokutionstyps Feststellung zu treffen. Vergleiche: ? Kommst Du höchstwahrscheinlich zum Abendessen? / ? Gib mir zweifellos das Buch! 9.3 Verknüpfung von Textsegmenten Nach der Segmentierung des Texts in EDU s und der Identifikation von einzelnen Illokutionen soll uns nun die Frage der Verknüpfung von Segmenten beschäftigen: Wie werden benachbarte Segmente zueinander in Beziehung gesetzt? Dies betrifft sowohl EDU s als auch größere Segmente; wir werden uns im Folgenden wiederum auf die Verknüpfung von EDU s konzentrieren, doch gilt vieles auch für den rekursiven Fall der Verbindung zwischen größeren Segmenten. Um die Bandbreite der sprachlichen Formen zu illustrieren, die für die Aufgabe der Verknüpfung zur Verfügung stehen, betrachten wir die folgenden Textvarianten: (9.5) a Gestern tobte ein heftiger Sturm. Ein Baum wurde entwurzelt. b Gestern tobte ein heftiger Sturm. Dadurch wurde ein Baum entwurzelt. c Gestern tobte ein heftiger Sturm, sodass ein Baum entwurzelt wurde. d Gestern wurde ein Baum entwurzelt, weil ein heftiger Sturm tobte. e Der gestrige heftige Sturm führte dazu, dass ein Baum entwurzelt wurde. f Durch den gestrigen heftigen Sturm wurde ein Baum entwurzelt. g Der gestrige heftige Sturm verursachte einen entwurzelten Baum. 159 9.3 Verknüpfung von Textsegmenten h Der gestrige heftige Sturm entwurzelte einen Baum. i Der Grund für den entwurzelten Baum ist der gestrige heftige Sturm. Wenn wir akzeptieren, dass [a]-[i] grosso modo die gleiche Bedeutung haben (die Wahrheitsbedingungen immerhin dürften identisch sein), so sind wir mit einem breiten Spektrum von Möglichkeiten, den kausalen Zusammenhang zweier Ereignisse auszudrücken, konfrontiert. Eine Entscheidung besteht darin, einen oder zwei Sätze zu verwenden. Des weiteren ist die Reihenfolge der Konnekte festzulegen, also entweder die Ursache oder die Folge zuerst zu benennen, vgl. den Unterschied zwischen [c] und [d]. Schließlich kann man für die Verknüpfung explizit ein lexikalisches Element verwenden oder nicht. Und für diesen Zweck stehen unterschiedliche verknüpfende Elemente zur Verfügung: Adverbiale, verschiedene Arten von Konjunktionen, Präpositionen, Nominale, Verben. Bei Abwesenheit eines lexikalischen Signals ([a]) spricht man von asyndetischer Verknüpfung: Die beiden (Teil-) Sätze sind nur durch ein Interpunktionszeichen miteinander verbunden. Dies ist in Texten die häufigste Form der Verknüpfung, wie sich auch anhand von Korpora belegen lässt. 53 Damit hat die Leserin entsprechend viel Freiheit bei der inhaltlichen Deutung des Zusammenhangs-- oder anders gesagt: Ihr wird dementsprechend viel Interpretationsarbeit auferlegt. Jedoch lässt sich die Interpretation nicht nur mit lexikalischen, sondern auch mit syntaktischen Mitteln steuern. Ein klares Beispiel sind Konstruktionen wie Hättest Du mir das früher gesagt, wäre ich gekommen, in denen die Kombination aus Verberststellung und Modus der beiden Teilsätze den konditionalen Zusammenhang (wie er mit wenn-… dann auch lexikalisch markiert werden könnte) eindeutig herstellt. Weitere Beispiele für syntaktische Merkmale in asyndetischen Verknüpfungen, die den Interpretationsspielraum zumindest einengen, geben Breindl u. Wassner (2006). Liegt für die Verknüpfung hingegen ein explizites lexikalisches Signal vor, so kann dies ein Konnektor sein, aber auch ein Verb (s. 9.5[e,g,h]) oder ein Substantiv [i]. Gerade der letzte Punkt führt uns wieder zu der im ersten Abschnitt diskutierten Frage der Abgrenzung von EDU s: Wenn ein Verb oder ein Substantiv die Funktion übernimmt, den inhaltlichen Zusammenhang zwischen zwei Sachverhalten zu übermitteln, wie entscheiden wir dann die Frage, ob es sich um eine oder um zwei EDU s handelt? -- Dies sind weitgehend ungelöste und bislang auch nur relativ wenig diskutierte Fragen der Diskursstrukturierung, genauer: der Schnittstelle zwischen Satzbedeutung und Textbedeutung. Zum Problem der relationsanzeigenden Verben und Substantive tritt noch das der vielfältigen phrasalen Verknüpfungssignale wie zum Beispiel aus all diesen Gründen (s. auch 9.5[e]), und darüber hinaus das der Interpunktion: Satzzeichen wie Gedankenstrich, Parenthese, Doppelpunkt oder Semikolon können ebenfalls Hinweise auf die Natur des Zusammenhangs zwischen den EDU s liefern. Auch dazu gibt es bisher jedoch nur wenige Untersuchungen. Besser sieht es aus, wenn wir uns im Folgenden auf die Konnektoren beschränken-- die glücklicherweise auch die Mehrzahl der in Texten verwendeten Verknüpfungssignale bilden. 53 Beispielsweise berichten Schauer u. Hahn (2001), dass in ihrem Korpus von Artikeln aus Computerzeitschriften etwa 30 % der Satzverbindungen lexikalisch markiert sind. 160 9 Minimale Texteinheiten und ihre Verknüpfung Auch sie sind nicht ganz einfach abzugrenzen und zu definieren, doch gehören sie geschlossenen Wortklassen an und bilden damit eine noch relativ überschaubare Menge von Einheiten. 9.3.1 Begriffsbestimmung: Konnektor Ein Konnektor 54 verknüpft zwei Textsegmente und zeigt dabei mehr oder weniger klar die Natur des inhaltlichen Zusammenhangs zwischen diesen Segmenten an. Wir nennen das Segment, zu dessen syntaktischer Einheit der Konnektor gehört, das Trägerkonnekt; das damit verbundene ist das Bezugskonnekt. Da es sich bei den Konnektoren nicht um eine in syntaktischer Hinsicht homogene Gruppe handelt, ist es nicht ganz einfach, eine hinlänglich präzise Definition des Begriffs zu geben. Einige Beispiele sahen wir oben in 9.5: die Subjunktoren (unterordnenden Konjunktionen) sodass und weil, die Präposition durch und das Adverb dadurch. Damit ist bereits klar, dass ‚Konnektor‘ keine syntaktische Kategorie sein kann, sondern Lexeme zusammenfasst, welche die funktionale Gemeinsamkeit aufweisen, eine inhaltliche Verknüpfung zwischen Textsegmenten herzustellen, die in aller Regel benachbart sind (auf diesen Punkt kommen wir noch zurück). Die mit Abstand umfangreichste Informationsquelle zu diesem Thema ist das Handbuch der deutschen Konnektoren (Pasch u. a., 2003), im Folgenden HdK, in dem ca. 350 Konnektoren vorwiegend aus syntaktischer Perspektive klassifiziert und ausführlich beschrieben werden. Um ihren Gegenstandsbereich abzugrenzen, haben die Autor / innen fünf Merkmale (morphologisch, syntaktisch, semantisch) zusammengestellt, anhand derer sich ein Wort x als Konnektor identifizieren lässt (S. 331): Merkmale von Konnektoren nach Pasch u. a. (2003) (M1) x ist nicht flektierbar. (M2) x vergibt keine Kasusmerkmale an seine syntaktische Umgebung. (M3) Die Bedeutung von x ist eine zweistellige Relation. (M4) Die Argumente der Bedeutung von x sind propositionale Strukturen. (M5) Die Ausdrücke für die Argumente der Bedeutung von x müssen Satzstrukturen sein können. Die obige Definition schließt wegen des Merkmals M2 Präpositionen aus, die aus funktionaler Sicht aber durchaus als Konnektor fungieren können (und dies im Deutschen wegen der Tendenz zu Nominalisierungen auch deutlich häufiger tun als etwa im Englischen); wir sahen oben bereits das Beispiel durch, weitere sind trotz, wegen, aufgrund oder auch das ausgesprochen mehrdeutige bei. Wir zählen daher im Folgenden auch Präpositionen zu den Konnektoren, sofern ihre Verwendung jeweils auch M3-M5 erfüllt; mehr dazu in den nächsten Abschnitten. 54 Mitunter auch: Konnektiv; englisch: connective. 161 9.3 Verknüpfung von Textsegmenten Entscheidend ist also vor allem die semantische Zweistelligkeit, die Konnektoren insbesondere von anderen Adverbialen abgrenzt, deren Bedeutung in der Modifikation eines einzelnen Arguments besteht (wie zum Beispiel vorwiegend oder auf jeden Fall). Die semantische Zweistelligkeit zu erkennen, ist bereits ein Interpretationsschritt, und wegen der doch recht großen Zahl möglicher Verknüpfungsoperatoren in Texten schlug Knott (1996, S. 78) einen oberflächenorientierten Test für das Englische vor, um die von ihm ‚cue phrases‘ genannten Signale für eine Verknüpfung zu erkennen. Er stellt eine Prozedur dar, mit der im Text kompakt formulierte Sachverhalte sukzessive expliziert werden (u. a.: setze Antezedenten für Anaphern und Ellipsen ein; Anpassungen der Wortstellung), bis am Ende eine klar erkennbare Verbindung zweier vollwertiger clauses vorliegt. Wenn dies gelingt, war die ursprüngliche Formulierung tatsächlich eine Kombination aus ‚cue phrase‘ und zwei potenziell satzwertigen Elementen. Später hat Grote (2003, S. 85 f.) diesen Test für das Deutsche modifiziert und ergänzt, u. a. um die richtige Behandlung von Präpositionalphrasen sicherzustellen. 9.3.2 Syntaktische Charakterisierung Da Konnektoren eine so heterogene Gruppe bilden, ist ihre syntaktische Beschreibung, vor allem im Hinblick auf ihre Wortstellungspräferenzen und -restriktionen, ein sehr komplexes Unterfangen, wie beispielsweise die Beschäftigung mit dem HdK schnell verdeutlicht. Wir beschränken uns hier darauf, in Kürze ein grobes Raster von Kategorien anzugeben und jeweils Beispiele dazu zu nennen. Die vergleichsweise noch am einfachsten zu beschreibende Gruppe sind die Konjunktionen, die in der Satzgrammatik die Aufgabe der Konnexion erfüllen und dementsprechend gründlich untersucht sind. Unterschieden werden hier gemeinhin die nebenordnenden (und, oder) von den unterordnenden Konjunktionen bzw. Subjunktoren (z. B. wenn, weil). Das HdK verwendet für beide den Oberbegriff des nichtkonnektintegrierbaren Konnektors: Er kann allein keine Konstituente eines der beiden Konnekte bilden, in diesem Sinne nicht in ein Konnekt integriert werden. Es ist allerdings für die unterordnende Konjunktion durchaus möglich, zusammen mit dem Trägerkonnekt in den Matrixsatz und damit in das Bezugskonnekt eingebettet zu werden: Wir gehen, weil die Sonne so schön scheint, für eine Stunde in den Park. Zu diesen nichtkonnektintegrierbaren Konnektoren zählt HdK noch zwei weitere Kategorien. Postponierer (z. B. sodass) haben die eingeschränkte Funktion, Verbletztsätze einzuleiten, die dem Hauptsatz nachgestellt sein müssen: Die Sonne verschwand, sodass wir wieder umkehrten. Demgegenüber kann der von einem Subjunktor eingeleitete Teilsatz sowohl voranals auch nachgestellt sein. Dies gilt auch für die Verbzweitsatzeinbetter (z. B. vorausgesetzt), die aber nicht mit der gewöhnlichen Nebensatzstellung einhergehen: Wir gehen nachher noch in den Park, vorausgesetzt Du kommst pünktlich. Für die als Konnektor fungierenden Adverbiale (z. B. also, hingegen) gilt, dass ihre semantische Zweistelligkeit (im Gegensatz zu den Konjunktionen) nicht mit einer syntaktischen Zweistelligkeit einhergeht. Weil sie eine Konstituente innerhalb des Konnekts bilden können, nennt HdK sie zur Abgrenzung von den oben besprochenen vier Kategorien integrierbar. Eine prominente Gruppe bilden die Pronominaladverbien (z. B. dadurch und deswegen), die 162 9 Minimale Texteinheiten und ihre Verknüpfung morphologisch eine deiktische Komponente (da-, dar-, desetc.) enthalten. Diese Adverbien scheinen auf den ersten Blick auch semantisch einstellig zu sein, doch verweist eben die deiktische (in Texten: anaphorische) Komponente genau auf das Bezugskonnekt, so dass mit dem Schritt der Anaphernauflösung die Bedingung der Zweistelligkeit wieder erfüllt ist. Aufgrund dieser anaphorischen Funktion von Pronominaladverbien ist es durchaus möglich, dass ein solcher Konnektor gemeinsam mit einer Konjunktion auftritt: Jetzt regnet es schon wieder, aber trotzdem machen wir unseren Spaziergang. Dass dies Folgen für die Beschreibung der Textstruktur hat, werden wir am Ende des Kapitels verdeutlichen. Die Präpositionen sind hinsichtlich der oben genannten Kriterien M3-M5 daraufhin zu untersuchen, ob sie in ihrer jeweiligen Verwendung als Konnektor fungieren. Da in der Präpositionalphrase kein finites Verb auftritt, fällt die Entscheidung, ob es sich um eine „potenzielle Satzstruktur“ (im Sinne von Merkmal M5 im letzten Abschnitt) handelt, mitunter nicht leicht. Entscheidend ist, ob die eingebettete Nominalphrase eine Proposition oder einen Gegenstand bezeichnet; dies haben wir in Abschnitt 9.1 angesprochen. Das Problem der Ambiguität „Konnektor oder nicht“ stellt sich nicht nur bei Präpositionen, sondern auch bei vielen Adverbien; es trägt seinerseits zur Unübersichtlichkeit der „Landschaft“ der Konnektoren bei. So wird allerdings meist als Signal für einen Kontrast (genauer: einer Einschränkung) verwendet, kann aber auch mit Betonung auf der letzten Silbe eine einstellige, affirmative Partikel sein: Du meinst, ich schaffe das nicht? Aller DINGS kriege ich das hin! Besonders augenfällig ist die Ambiguität bei der Gruppe der Pronominaladverbien, was wir hier anhand der Beispiele danach und dabei illustrieren: (9.6) 1 Die Partei veröffentlichte ihr neues Programm. 2 Danach wird es in der nahen Zukunft keine Steuererhöhungen geben. 2‘ Danach meldeten sich sofort die Gewerkschaften zu Wort. 3 Das Programm wurde weitgehend von der Vorsitzenden verfasst. 4 Dabei half ihr der Generalsekretär. 4‘ Dabei hatte sie die Sache eigentlich dem Präsidium überlassen wollen. Syntaktische Ambiguität besteht auch innerhalb der Gruppe der Konnektoren; als Beispiel sei sowie genannt, das als additive Konjunktion (Sie hat ein ganzes Glas Wein getrunken, sowie die Nudeln verspeist) oder als temporaler Subjunktor auftreten kann (Sowie der Briefträger klingelte, sprang er auf und lief zur Tür). Dieser kurze Blick auf syntaktische Merkmale von Konnektoren soll mit dem Hinweis auf eine weitere Komplikation beschlossen werden, die sich durch mehrteilige Konnektoren ergibt. Zu ihnen zählen entweder-oder und weder-noch, von denen jeweils der zweite Bestandteil auch isoliert auftreten kann, während die Verwendung des ersten die des zweiten erzwingt. Wir bewegen uns hier an der Grenze zu den eingangs erwähnten phrasalen Einheiten, wie insbesondere das Beispiel einerseits-- andererseits deutlich macht, von dem diverse Mehrwortvarianten wie auf der einen / anderen Seite gebräuchlich sind. 163 9.3 Verknüpfung von Textsegmenten 9.3.3 Semantik: Relationen, Ambiguität und Vagheit Fragen wir nun nach der Bedeutung eines Konnektors, so richtet sich das Interesse vor allem (aber auch nicht ausschließlich-- siehe die ausführliche Zusammenstellung von Breindl u. a., 2015) auf die Art des von ihm signalisierten Zusammenhangs zwischen den Konnekten. Vorschläge für Kategorisierungen finden sich in traditionellen Grammatiken, allerdings verstreut über mehrere Kapitel, da für die Grammatik ja die syntaktische Gruppierung das primäre Ordnungsmerkmal ist; dementsprechend werden Konnektoren an unterschiedlichen Stellen behandelt. Zur Illustration nennen wir die „semantischen Klassen der Adverbialsätze“ nach Kap. 19 von Helbig u. Buscha (2001); in den Abschnitt 4.4 und 8.3 schlagen die Autoren ganz ähnliche semantische Klassen der Adverbien bzw. Konjunktionen vor. ▶ Temporalsatz (Gleichzeitigkeit / Vorzeitigkeit / Nachzeitigkeit): Seit ich in Potsdam wohne, hat es nicht mehr geschneit. ▶ Lokalsatz: Ich wohne in Potsdam, wo es selten schneit. ▶ Modalsatz ▷ Instrumentalsatz: Sie arrangierte sich mit Potsdam, indem sie sich mit dem lauen Winter abfand. ▷ M. des fehlenden Begleitumstandes: Er verbrachte einen Winter in Potsdam, ohne dass es jemals schneite. ▷ Komparativsatz: Es hat in Potsdam so wenig geschneit, wie ich erwartet habe. ▷ M. der Spezifizierung: Ein Potsdamer Winter ist insofern eigenartig, als es so gut wie nie schneit. ▷ Restriktivsatz (Einschränkung des Geltungsbereichs): Soweit ich es sehe, schneit es in Potsdam nie. ▶ Kausalsatz ▷ K. im engeren Sinne: In Potsdam schneit es nie. Darum ziehen wir nach Ulm. ▷ Konditionalsatz: Wenn es diesen Winter wieder nicht schneit, ziehen wir nach Ulm. ▷ Konzessivsatz: Obwohl es letzten Winter geschneit hat, ziehen wir jetzt nach Ulm. ▷ Konsekutivsatz: Es schneit heute in Potsdam sehr stark, so dass die Parks geschlossen sind. ▷ Finalsatz: Ich ziehe nach Potsdam, damit ich mal wieder Schnee erlebe. ▶ Substitutivsatz: Anstatt dass ich sofort nach Potsdam ziehe, erkundige ich mich erst einmal nach dem Winterwetter. ▶ Adversativsatz: Während es in Potsdam kaum schneit, gibt es in Ulm regelrechte Dachlawinen. 164 9 Minimale Texteinheiten und ihre Verknüpfung Abbildung 9.2: Hierarchie der Konnektor-Lesarten (Kohärenzrelationen) nach (Webber u. a., 2016, S. 27) Spätestens bei Durchsicht dieser Liste erinnern wir uns an den in früheren Kapiteln verschiedentlich angesprochenen Begriff der Kohärenzrelation (den wir in Abschnitt 10.1 dann noch ausführlich besprechen werden). Sie bezeichnen Beziehungen zwischen Textteilen, die den oben aus grammatischer Sicht genannten Klassen ähneln. Der Konnektor steht an der Schnittstelle zwischen zwei Segmenten, die nach Relation-basierten Kohärenztheorien die Argumente einer solchen Relation bilden; dann ist der Konnektor ein mehr oder weniger deutliches Signal dafür, um welche Relation es sich handelt. In dem Korpusprojekt Penn Discourse Treebank ( PDTB ), das wir in Abschnitt 9.4 etwas genauer vorstellen, wurde ausgehend von den in Zeitungstexten vorgefundenen Konnektoren des Englischen eine Taxonomie der Konnektor-Lesarten erstellt, die auch als Kohärenzrelationen aufgefasst werden können. Abb. 9.2 zeigt, dass zunächst vier Gruppen angenommen werden: Temporale Relationen gliedern sich nach der Un-/ Gleichzeitigkeit der Ereignisse weiter auf; unter ‚Contingency‘ sind Typen der Kausalität zusammengefasst; ‚Comparison‘ umfasst Vergleiche; ‚Expansion‘ schließlich sind relativ informationsarme Relationen, die weitere Information an das erste Segment anfügen. Dies ähnelt in Teilen den o. g. Gruppen von Helbig und Buscha, die allerdings mit den semantischen Klassen von Sätzen auch ein etwas anderes Phänomen modellieren. 165 9.3 Verknüpfung von Textsegmenten Dieser Aufgabe der Ableitung von Kohärenzrelationen aus Typen von Konnektoren (und Korpusbelegen) hatten sich früher bereits Knott u. Dale (1994) gestellt. Aus den vorgefundenen Konnektoren in konkreten Verwendungskontexten werden also abstraktere Prinzipien abgeleitet. Dazu muss eine Systematik entwickelt werden, anhand welcher Kriterien diese Abstraktion zu Relationen geschehen soll, m. a. W., welche Gruppe von Konnektoren als Signale derselben Relation zusammengefasst werden sollen. Dafür nutzten die Autoren das Instrument des Ersetzungstests, den wir oben im Beispiel 9.5 (S. 158) bereits in sehr allgemeiner Form illustriert haben. Nach Knott (1996, S. 85) gibt es vier mögliche Ergebnisse einer Ersetzungsprüfung zwischen Konnektoren A und B: ▶ A ist synonym mit B, wenn in jedem Kontext, in dem A benutzt werden kann, auch B benutzt werden kann. Beispiel: {Obwohl / obschon} es regnet, gehen wir in den Park. ▶ A und B sind exklusiv, wenn sie sich in keinem Kontext gegenseitig ersetzen können. Beispiel: trotz / wegen ▶ A ist Hyperonym von B (und damit B Hyponym von A), wenn B in jedem Kontext durch A ersetzt werden kann, A aber nicht in jedem Kontext durch B ersetzt werden kann. Beispiel: aber / allerdings ▶ A und B sind bedingt substituierbar, wenn es Kontexte gibt, in denen A und B sich gegenseitig ersetzen können, aber auch Kontexte, in denen jeweils nur A und nur B verwendet werden können. Beispiel: allerdings / dennoch (1) Die Bayern haben eigentlich ein ganz gutes Spiel gemacht. (2) {Allerdings / Dennoch} sind wir nicht so richtig begeistert. (2‘) {Allerdings / ? Dennoch} war die Abwehr ein bisschen angeschlagen. (2“) {Dennoch / ? Allerdings} haben sie danach den Trainer entlassen. Wenn wir uns die syntaktische Vielfalt der Konnektoren in Erinnerung rufen, wird rasch deutlich, dass ein Ersetzungstest allerdings nicht so unkompliziert verläuft wie beispielsweise einer für Substantive. Da wir uns für die funktionalen Gemeinsamkeiten der Konnektoren interessieren, muss erlaubt sein, dass die Konnektorenersetzung mit syntaktischen Umstellungen einhergeht. Dementsprechend sieht Knott (1996, S. 71) nach dem Austauschen eines Konnektors etwaig notwendige Anpassungen in der Interpunktion sowie bei vom Konnektor abhängigen Wörtern im Satz vor. Die Ersetzung stuft er dann als geglückt ein, wenn der neue Text dieselben Sachverhalte beschreibt und die gleichen Ziele erreicht wie der alte; es sei nicht relevant, wenn sich stilistische Unterschiede einstellen, die Konnektoren eigentlich für Textspannen unterschiedlicher Größe funktionieren, oder unterschiedliches Hintergrundwissen für die Interpretation der beiden Texte vorausgesetzt wird. Eine Anwendung des Ersetzungstests für kontrastive Konnektoren des Deutschen zeigt Stede (2004) und weist darauf hin, dass für die Beurteilung des „identischen Sachverhalts“ insbesondere der Skopus des jeweiligen Konnektors eine zentrale Rolle spielt. Die Untersuchung zeigt eine sehr hohe Ähnlichkeit zwischen aber, doch und jedoch, und jeweils Überlappungen zwischen dieser Gruppe und den einzelnen Konnektoren hingegen, allerdings und dennoch. Zwischen hingegen 166 9 Minimale Texteinheiten und ihre Verknüpfung und dennoch ergibt sich jedoch keine Überlappung, d. h., in keinem der untersuchten Korpusbeispiele waren diese Konnektoren bedeutungserhaltend austauschbar. Auf Basis solcher Tests schlägt Stede (2004) dann eine Untergliederung von im weiten Sinne ‚adversativen‘ Relationen vor. Eine solche bottom-up-Herangehensweise, die Relationen aus Konnektoren gewinnt, fasst die zu einer Relation zählenden Konnektoren als Wortfeld auf (siehe dazu Lutzeier, 1981). Sie ergibt für relativ klar abgrenzbare Relationen wie etwa die Concession eine zuverlässige Menge von sie ausdrückenden Konnektoren (obwohl, dennoch, trotzdem, trotz und andere) mit nur wenigen an der Peripherie des Feldes liegenden Vertretern-- für die Concession ist es aber, das mitunter ein konzessives Verhältnis, darüber hinaus aber auch andere kontrastive Verhältnisse signalisieren kann. Das bottom-up-Vorgehen führt (ähnlich zu den von Grammatiken vorgeschlagenen semantischen Gruppen) in aller Regel zu feineren Aufteilungen und damit zu mehr Kohärenzrelationen als sie von top-down-Ansätzen vorgeschlagen werden. Die zentrale Forschungsfrage besteht also darin, einen Brückenschlag zwischen beiden Perspektiven vorzunehmen und die „Korngröße“ der Ebene zu motivieren, auf der Kohärenzrelationen einerseits diskurstheoretisch (oder kognitiv oder philosophisch) begründet werden können und sie andererseits sinnvolle Abstraktionen der in der Sprache vorgefundenen Konnektoren vornehmen. Wie auch in „klassischen“ Wortfeldern (die Theorie wurde ursprünglich für Inhaltswörter und nicht für Funktionswörter vorgeschlagen) kann man im nächsten Schritt durch vergleichende Analyse der Konnektoren innerhalb eines Feldes nach Merkmalen suchen, anhand derer sich die Wörter jenseits der gemeinsamen Grundbedeutung weiter differenzieren lassen. Dazu zählen einzelne semantische Merkmale wie im Falle kausaler Konnektoren etwa das der Volitionalität: Bei Verwendung von durch ist die Verursachung in aller Regel nicht von einer handelnden Person willentlich herbeigeführt, vielmehr sind die Verursacher Naturgewalten oder unbeabsichtigt eingetretene Ereignisse. Der Konnektor damit (in der Lesart als finaler Subjunktor) hingegen kann nur eine intendierte, zielgerichtete Verursachung anzeigen: Durch das Gewitter wurden drei Telefonmasten beschädigt. / Ich gebe Dir heute zwei Butterbrote, damit Du in der Pause nicht wieder hungrig bist. Ein anderes Differenzierungsmerkmal für Konnektoren betrifft die Möglichkeit, informationsstrukturelle Gliederungen anzuzeigen. So unterscheiden sich zum Beispiel die ansonsten sehr bedeutungsähnlichen Konnektoren hingegen und demgegenüber: (9.7) 1 Die älteren Kinder liefen über die Straße. 2 Sabine {hingegen / ? demgegenüber} wartete, bis die Ampel grün wurde. 2‘ {Hingegen / Demgegenüber} wartete Sabine, bis die Ampel grün wurde. Darüber hinaus betritt man mit der Wortfeldanalyse auch die Gebiete der regionalen und der medialen Variation (etwa zur Differenzierung zwischen obwohl, obschon, obzwar), sowie das der Stilistik, das die Unterschiede zwischen dem sehr gebräuchlichen trotzdem und den selteneren nichtsdestotrotz / nichtsdestoweniger / dessenungeachtet durch Angabe von Merk- 167 9.3 Verknüpfung von Textsegmenten malen wie ‚Formalität‘, wohl auch durch die Unterscheidung zwischen gesprochener und geschriebener Sprache, deuten müsste. Eine weitere, wenig überraschende Parallele zu „klassischen“ lexikalischen Untersuchungen besteht darin, dass die Aufteilung in Felder keineswegs durch einfach erkennbare, klare Grenzen gekennzeichnet ist. Vielmehr treffen wir auf die gewohnten Probleme der Ambiguität und der Vagheit. Beide lassen sich nur relativ zu einem Kategorisierungsraster beschreiben, das wir hier wie gesagt in Gestalt von Kohärenzrelationen zugrundelegen. ▶ Ambiguität: Die Bedeutung eines Konnektors ist ambig, wenn er mehr als eine Relation signalisieren kann, die nicht in einem Verhältnis unterschiedlicher Spezifizität zueinander stehen. Beispiel: während ▷ Während mein Bruder rote Haare hat, ist meine Schwester blond. (Contrast) ▷ Während ich schlief, kam mir eine gute Idee. (Temporal-Simultaneity) ▶ Vagheit: Die Bedeutung eines Konnektors ist vage, wenn er mehrere Interpretationen zulässt, die auch unterschiedlich spezifisch sein können; seine eher unspezifische Grundbedeutung ist im Kontext genauer interpretierbar. Beispiel: und ▷ Ich lief zur Schule und kam gerade noch pünktlich an. (Temporal-Sequence) ▷ Mein Bruder hat rote Haare und meine Schwester ist blond. (Contrast? List? ) ▷ Ich lief zur Schule und Marianne lief zum Kindergarten. (Contrast? List? Temporal- Sequence? Temporal-Simultaneity? ) Unsere obigen Beispiele für das ambige während sind eindeutig, doch fällt die Interpretation nicht immer so leicht, denn temporale Gleichzeitigkeit und Kontrastivität schließen sich ja keineswegs aus: Während ich schlief, hat meine Schwester noch gelesen. Mitunter kann aufgrund von Parallelität der Strukturen, Tempus, Aspekt und anderen Merkmalen eine eindeutige Interpretation gewonnen werden, doch ist dies nicht immer möglich. Exemplarisch geben Breindl u. Wassner (2006) für den Konnektor schließlich entsprechende Desambiguierungsmerkmale an, um zwischen der temporalen und der folgernden Lesart zu unterscheiden; vgl. dieses Beispiel: (9.8) 1 Einer nach dem anderen traf auf dem Sportplatz ein. 2 Schließlich trottete auch Freddi heran. 2‘ Schließlich hatte der Trainer um pünktliches Erscheinen gebeten. Die Vagheit eines Konnektors kann in einer dekompositionellen Bedeutungsanalyse so aufgefasst werden, dass sie hinsichtlich bestimmter Merkmale nicht spezifiziert ist, also die Werte offen lässt. Im jeweiligen Kontext können diese dann durch die Interpretation der Konnekte belegt werden-- oder auch nicht. Im ersten Fall resultiert eine spezifische Kohärenzrelation (analog zu den obigen während-Beispielen); im zweiten Fall verbleibt die Relation unspezifisch. Dieser Ansatz impliziert, dass die Kohärenzrelationen nicht alle auf der gleichen Abstraktionsebene angesiedelt, sondern in einer Taxonomie organisiert sind. Dann kann man und eine abstrakte Relation wie Additive zuordnen und zulassen, dass der Konnektor in bestimmten Kontexten zu einer spezielleren Relation „überinterpretiert“ werden kann, bei- 168 9 Minimale Texteinheiten und ihre Verknüpfung spielsweise zu Contrast. Ähnliches gilt für aber, das die Art des kontrastiven Zusammenhangs mehr oder weniger spezifisch signalisieren kann (siehe dazu Umbach, 2001). 9.3.4 Pragmatik: Verknüpfungsebenen und Präsuppositionen Am Ende unserer Betrachtung der Konnektoren schlagen wir wieder den Bogen zum ersten Abschnitt des Kapitels zurück und fragen, von welcher Art die von Konnektoren verknüpften Objekte eigentlich sind bzw. sein können. 55 Dazu streifen wir eine in der deutschsprachigen Forschungsliteratur sehr intensiv geführte Diskussion 56 um drei im weiten Sinne kausale Konnektoren. Beginnen wir mit dem Unterschied zwischen denn und weil, den Wunderlich (1980, S. 113) mit folgendem Beispiel illustriert: (9.9) a Draußen ist es so nass, weil es die ganze Nacht geregnet hat. b ? Draußen ist es so nass, denn es hat die ganze Nacht geregnet. c Er muss zuhause sein, denn in der Uni habe ich ihn nicht gesehen. d Er muss zuhause sein, weil ich ihn in der Uni nicht gesehen habe. Wunderlich (und andere) nennen denn einen ‚argumentativen‘ Konnektor und weil einen ‚nicht-argumentativen‘ bzw. ‚propositionalen‘. Anders ausgedrückt, denn liefert eine Begründung für den vorangegangenen Satz-- weshalb dieser zunächst einmal prinzipiell „begründbar“ sein muss. In [c] ist dies der Fall, da die Sprecherin offenkundig eine These aufstellt. In [b] hingegen ist die Situation anders, weil die Information „draußen ist es so nass“ eher nicht als neue, in den Raum gestellte Hypothese interpretiert wird. 57 Damit können wir den Bogen zu den im letzten Abschnitt behandelten Illokutionstypen schlagen. Angewandt auf die Beschreibung von denn: Der vorangehende Satz muss ein Estimativum oder ein Evaluativum sein, um „begründbar“ zu sein-- aber jedenfalls keine Feststellung. Die Konjunktion weil ist in dieser Hinsicht flexibler und kann neben ihrer hauptsächlichen Verwendung (Verknüpfung von Propositionen) mitunter auch in eigentlich argumentativen Situationen gebraucht werden. 58 In [d] wird das Zuhause-Sein ja keineswegs vom Nicht-gesehen-Haben verursacht, sondern letzteres ist wiederum nur ein „Symptom“, das auf ersteres hindeutet. Nehmen wir die Darstellung der Satzbedeutung als F( RP ) aus Abschnitt 7.1 wieder auf, so lässt sich die Beobachtung so formulieren, dass denn eine Verknüpfung auf der Ebene der illokutiven Rolle, also F leistet, während weil primär auf der Propositionebene RP verknüpft, 55 Wir subsumieren diese Diskussion unter ‚Pragmatik‘, ohne die oft schwierige Frage der Abgrenzung zwischen Semantik und Pragmatik hier zu erörten. 56 Zahlreiche Verweise auf Quellen und Terminologievorschläge finden sich beispielsweise in (Nussbaumer, 1991, S. 190 ff.). 57 Verantwortlich dafür ist neben dem „beschreibenden“ Inhalt der Aussage hier auch die Modalpartikel so. 58 Damit verbunden ist die in der Literatur ebenfalls ausgiebig diskutierte Beobachtung, dass in der gesprochenen Sprache weil zunehmend auch Verbzweitsätzen vorangestellt wird, wo traditionell eigentlich denn seinen Platz hat. 169 9.3 Verknüpfung von Textsegmenten aber auch auf F ausgedehnt werden kann. An dieser Stelle schließt sich dann auch der Kreis zur Aufgabe der Bestimmung von EDU s: Wenn weil „klassisch“ Propositionen verknüpft, können wir (mit Nussbaumer (1991) und anderen) insgesamt nur eine Illokution für den komplexen Satz annehmen; schematisch: F(weil(R1P1, R2P2)). Wohingegen denn auf jeden Fall zwei separate Illokutionen verbindet: denn(F1(R1P1), F2(R2P2)). Zur Ergänzung werfen wir noch einen Blick auf die Konjunktion da. Sie wird in der Literatur häufig in die Nähe von denn gerückt, da sie ebenfalls argumentativ orientiert sei. Dafür spricht, dass wir in Beispiel 9.9[d] für weil durchaus da einsetzen können und einen akzeptablen Satz erhalten. Demgegenüber ist in Beispiel 9.10[b] (von Pasch, 1989) ein da nicht möglich, weil eben nicht für die Gültigkeit des voranstehenden Satzes er schläft argumentiert wird-- dass dies der Fall ist, davon sind ja beide Gesprächspartner bereits überzeugt. (9.10) a Hans schläft wieder.-- Ja, aber er schläft, weil er zuviel arbeitet. b Hans schläft wieder.-- Ja, aber er schläft, *da er zuviel arbeitet. c Hans schläft schon wieder, und er wird Ärger bekommen, weil er schon wieder schläft. d Hans schläft schon wieder, und er wird Ärger bekommen, *da er schon wieder schläft. Ganz ähnlich zu der Differenzierung zwischen den englischen Konnektoren because und since (in kausaler Verwendung) ist da dadurch gekennzeichnet, dass es eine Präsupposition trägt, wonach die damit eingeleitete Information der Hörerin bereits bekannt sein sollte, sie wird als „unterstellt“ markiert. Sowohl weil als auch denn hingegen liefern entweder eine neue Information (z. B. in 9.9[a]) oder stellen heraus, dass die folgende Information als Grund für etwas fungiert (was dann der „neue“ Informationsanteil ist), wie in 9.10[c]. Ein Hinweis auf diesen „unterstellenden“ Bedeutungsanteil von da liegt auch in seiner auffällig häufigen Kollokation mit der Partikel ja, die dieselbe Präsupposition übermitteln kann: Da Sie unsere Zahlungsbedingungen ja kennen, gehen wir von einer unverzüglichen Überweisung des Betrages aus. Zu dem propositionsverknüpfenden und dem illokutionsverknüpfenden Gebrauch (mancher) kausaler Konnektoren tritt noch ein sprechaktverknüpfender hinzu, auf den u. a. Küper (1984) hingewiesen hat. 59 Er nennt zur Illustration eine bekannte Zeile der Rolling Stones: I can‘t get no satisfaction, ‘cause I try and I try and I try. Die zahllosen Versuche werden kaum die Ursache des Misserfolgs sein (was der propositionalen Lesart entspräche), vielmehr ist die Schilderung der Versuche der Grund für die Schilderung des Misserfolgs. Weitere Beispiele für die Verknüpfung von Sprechakten sind diese: (9.11) Falls Du durstig bist, im Kühlschrank ist ein Bier. (9.12) Wollen wir den zweiten Zahn auch heute gleich ziehen, da Sie so eine weite Anfahrt haben? Um die Lesarten transparent zu machen, hilft das, was bereits Austin (1975) vorgeschlagen hatte (vgl. Abschnitt 7.1): das „Ausbuchstabieren“, die Umformung zum expliziten Sprechakt. 59 Küper nennt dafür zwei Kategorien, den „parenthetisch-explikativen“ und den „sprechaktbezogenen“ Gebrauch, doch der Unterschied erscheint nur marginal. 170 9 Minimale Texteinheiten und ihre Verknüpfung Daraus resultieren diese beide Varianten: Im Kühlschrank ist ein Bier. Ich weise darauf hin für den Fall, dass Du durstig bist. / Wollen wir den zweiten Zahn auch gleich ziehen? Ich schlage das vor, weil Sie so eine weite Anfahrt haben. Diese Beobachtungen hat Sweetser (1990) verallgemeinert und die These aufgestellt, dass zumindest kausale und adversative 60 Konnektoren auf drei verschiedenen Ebenen operieren können. Damit ersetzt sie die individuelle Polysemie von einzelnen Konnektoren durch die These einer generellen systematischen Pragmatik-basierten Ambiguität. Verknüpfungsebenen für Konnektoren nach Sweetser (1990) ▶ Propositional: verknüpft werden Aussagen über die Welt, und auch der behauptete Zusammenhang besteht in der Welt. (Beispiele 9.9[a], 9.10[a]) ▶ Epistemisch: verknüpft werden Überzeugungen des Sprechers (im kausalen Fall: eine auch für den Hörer bereits akzeptable Proposition mit einer Folgerung, die zunächst nur die Sprecherin akzeptiert) (Beispiel 9.9[c]; oben bezeichnet als Verknüpfung auf der Ebene der illokutiven Rolle) ▶ Sprechakt: verknüpft werden komplette Sprechhandlungen (Beispiele 9.11, 9.12) Eine vierte Ebene der Verknüpfung ist die mitunter als textuell, häufiger als metakommunikativ bezeichnete. Allgemein werden auf dieser Ebene Gliederungshinweise angesiedelt, die die Autorin der Leserin an die Hand gibt (im Folgenden besprechen wir zunächst X und dann Y), sowie anderweitige Referenzen auf den Text selbst (Dies hatten wir im letzten Abschnitt bereits gezeigt). In der Literatur werden gelegentlich auch Umschreibungen und Verdeutlichungen als metakommunikative Elemente betrachtet: Wir sollten dringend mit der Befragung beginnen, also den Klienten herein bitten und unsere Fragen stellen. Brandt u. Rosengren (1992) beispielsweise würden den zweiten Satz nicht als eigenständige Illokution auffassen (in ihrer Sichtweise, wonach eine Illokution eine Rolle in der Struktur aus Stützungsbeziehungen spielt; vgl. Abschnitt 7.2.2). Das also im letzten Beispiel verdeutlicht, dass die Fragestellung auch für die Untersuchung der Konnektoren relevant ist: Es operiert auf keiner der von Sweetser unterschiedenen Ebenen, sondern auf der textuellen. Auch temporale Konnektoren werden häufig textuell gebraucht. So kann man mit zunächst und schließlich einerseits die Reihenfolge von Ereignissen in der Welt beschreiben, andererseits aber auch eine Anordnung der Elemente eines Textes vornehmen: Wir können Frau Müller nun wirklich nicht länger beschäftigen. Zunächst, sie kommt fast jeden Tag zu spät. Die Kolleginnen beschweren sich schon über ihre vielen Krankheitszeiten. Und schließlich, sie verstößt immer wieder gegen unser Rauchverbot. 60 Eine Replik auf Sweetser‘s Vorschlag, speziell für den Bereich der adversativen Konnektoren, gibt Lang (2000). 171 9.4 Annotation von Konnektoren und Segmenten in Korpora Zum Abschluss dieser Darstellung der Konnektoren-Problematik soll illustriert werden, dass gerade für argumentative Texte die „Konnektorenstruktur“ wichtige, an der Textoberfläche unmittelbar ablesbare, Hinweise auf die Textstruktur liefern kann. Als Beispiel wählen wir den Kreisel Text aus Abb. 8.3 von Seite 143. Wenn wir die einzelnen Segmente durch Zahlen ersetzen und lediglich Konnektoren und die segmentverbindenden Interpunktionszeichen darstellen, so erhalten wir: (1). Selbst wenn (2). (3). Aber (4). (5). Nicht nur (6), sondern (7). Zwar (8). Aber (9). (10), (11). (12). (13). Und (14). (15), zudem (16). (17). Aber (18). (19). 9.4 Annotation von Konnektoren und Segmenten in Korpora Abbildung 9.3: Bildschirmabzug: Browser der Penn Discourse Treebank Das mit Abstand größte Korpus, in dem Konnektoren und ihre Argumente, aber auch nicht-signalisierte Kohärenzrelationen zwischen benachbarten Segmenten annotiert sind, ist die englischsprachige Penn Discourse Treebank, kurz PDTB (Prasad u. a., 2008). Sie umfasst Zeitungstexte aus dem Wall Street Journal, die von anderen Forschern auch noch mit verschiedenen weiteren linguistischen Annotationen versehen wurden. Den Ausgangspunkt 172 9 Minimale Texteinheiten und ihre Verknüpfung dieser Projekte bildete (bereits in den 1990er Jahren) die syntaktische Beschreibung der einzelnen Sätze. Über die Webseite des Projekts 61 sind u. a. die Annotationsrichtlinien sowie ein Software-Werkzeug verfügbar, das die Recherche im Korpus erlaubt und in separaten Fenstern sowohl die Satzsyntax als auch die Konnektoren und ihre Argumente im Text anzeigt. Zur Illustration zeigt Abb. 9.3 einen Bildschirmabzug. Der Nachteil für Interessenten ist allerdings, dass die Annotationen und die zugrunde liegenden Textdaten nicht kostenfrei verfügbar sind, sondern vom Linguistic Data Consortium 62 bezogen werden müssen. PDTB -ähnliche Ressourcen wurden zwischenzeitlich auch für eine Reihe anderer Sprachen entwickelt. Für das Deutsche bietet das Potsdamer Kommentarkorpus ( PCC ) ebenfalls eine Annotationsebene mit Konnektoren und Argumenten an, die jedoch nicht das gesamte Schema der PDTB abdeckt. Beispielsweise enthält die PDTB auch Relationen, die nicht durch Konnektoren, sondern durch ganz unterschiedliche phrasale Ausdrücke wie „einige Jahre später“ markiert sind, sowie solche ohne jede lexikalische Realisierung. Diese werden im PCC , das überdies sehr viel kleiner ist, nicht bzw. anders behandelt-- es gibt dort eine Ebene mit rhetorischer Textstruktur, die wir im nächsten Kapitel vorstellen werden. Für die Annotation der Konnektoren im PCC wurde das halbautomatisch arbeitende Werkzeug ConnAnno implementiert (Stede u. Heintze, 2004). Es verfügt über ein Lexikon deutscher Konnektoren, so dass es potenzielle Vorkommen im zu bearbeitenden Text selbstständig markieren kann. Der Nutzer muss dann entscheiden, ob das Wort tatsächlich als Konnektor fungiert; wenn ja, schlägt ConnAnno aufgrund einfacher Regeln auch die Ausdehnung der Konnekte vor, die der Nutzer entweder per Mausklick bestätigen oder manuell korrigieren kann. ConnAnno ist frei zum Download verfügbar, 63 und die Annotationsrichtlinien sind im ebenfalls frei verfügbaren Sammelband (Stede, 2016a) enthalten. Derselbe Sammelband enthält auch die Richtlinien für die Diskurssegmentierung deutscher Texte, wie sie im PCC angewandt wurde. Für das Englische waren die in den RST -Richtlinien (siehe nächstes Kapitel) von Carlson u. Marcu (2001) einflussreich. Insgesamt ist das Thema der Segmentierung vor allem für Annotationsvorhaben untersucht worden, die eine textüberspannende Diskursstruktur anstreben; dies ist der Gegenstand des nächsten Kapitels. 61 https: / / www.seas.upenn.edu/ ~pdtb/ (Zugriff 7. 1. 18). 62 http: / / www.ldc.org (Zugriff 7. 1. 18). 63 http: / / angcl.ling.uni-potsdam.de/ resources/ connanno.html (Zugriff 7. 1. 18). 173 9.5 Übungsaufgaben Weiterführende Literatur Die Identifikation von Illokutionen wird in den korpus-(aber papier-)basierten Studien von Morgenthaler (1980) und Schmitt (2000) behandelt; eine ausführliche Verbindung zur Diskussion in der linguistischen Pragmatik bietet Liedtke (1998). Einen ausführlicheren Überblick über die verschiedenen Spielarten der Satzverknüpfung vermittelt Fabricius-Hansen (2000). Zu den deutschen Konnektoren ist die wichtigste und umfangreichste Quelle das zweibändige Handbuch von Pasch u. a. (2003) bzw. Breindl u. a. (2015). Einträge zu den einzelnen Konnektoren finden sich auch in dem vom Institut für deutsche Sprache online zur Verfügung gestellten ‚Grammatischen Wörterbuch‘, das Teil des Informationssystems grammis 64 ist. Die Menge der Untersuchungen zu einzelnen Konnektoren oder Gruppen ist kaum überschaubar, doch für die Recherche bietet grammis auch eine sehr umfangreiche online-Bibliografie, erreichbar über die genannte URL unter „Grammatische Bibliografie“. 9.5 Übungsaufgaben 1. Überprüfen Sie im Lichte der Ausführungen der ersten Abschnitte dieses Kapitels noch einmal die Segmentierung Ihres Kommentars in EDU s, die Sie in Übung 1 von Kapitel 7 (S. 137) zunächst rein intuitiv vorgenommen hatten. 2. In derselben Übung auf S. 137 hatten Sie den EDU s Illokutionstypen zugewiesen. Untersuchen Sie jetzt, wie diese Typen mit Oberflächenmerkmalen der in Abschnitt 9.2 besprochenen Art korrelieren. 3. Identifizieren Sie in Ihrem Kommentar alle Konnektoren und legen Sie ihren Skopus fest: Welche Textabschnitte werden jeweils verknüpft? 4. Untersuchen Sie jeden Konnektor daraufhin, auf welcher Ebene (propositional / epistemisch / Sprechakt; vgl. Abschnitt 9.3.4) die Verknüpfung erfolgt. 5. Betrachten Sie jetzt jede Verbindung zwischen Textsegmenten, die nicht durch einen Konnektor markiert ist, sondern nur durch Interpunktionszeichen. Welcher Konnektor könnte hier stehen, ohne dass sich die Textbedeutung ändern würde? Machen Sie sich jeweils klar, warum dieser hypothetische Konnektor an der entsprechenden Stelle redundant ist. 64 http: / / hypermedia.ids-mannheim.de (Zugriff 7. 1. 18) 175 10.1 Lokale Kohärenz durch Relationen zwischen Textsegmenten 10 Rhetorische Struktur (10.1) Mein Bruder wollte sich heute ein neues Skateboard kaufen, doch meine Eltern waren dagegen. Nachdem der Streit sich beruhigt hatte, gingen wir alle ins Kino, und jetzt ist die gute Laune wiederhergestellt. Es war also ein interessanter Tag! Dieser Text bezieht seine Kohärenz einerseits aus den Koreferenzbeziehungen, andererseits aus den inhaltlichen Bezügen zwischen den (Teil-)Sätzen: Ein Kontrast zwischen den Wünschen von Bruder und Eltern, eine temporale Folge von Ereignissen, die auch kausal verknüpft sein können (gute Laune wegen Kinobesuch), und eine abschließende Bewertung, die die vorangehenden Schilderungen zusammenfasst.-- Aus den beiden Beobachtungen, dass EDU s auf ganz unterschiedliche Art verknüpft sein können, und dass EDU s nicht nur mit EDU s, sondern auch mit größeren Textteilen verbunden sein können, entsteht folgender Gedanke: Lässt sich eine Textstruktur postulieren, die nicht „nur“ temporale Verhältnisse abbildet (wie in Kap. 6) und nicht „nur“ die Stützung von Illokutionen darstellt (wie in Kap. 7), sondern das Spektrum der kohärenzstiftenden Relationen möglichst vollständig erfasst und aus wiederholter Anwendung solcher Relationen rekursiv eine einzige übergeordnete Struktur ableitet? Eine der darauf abzielenden Theorien spricht von der ‚rhetorischen Struktur‘ eines Textes (siehe Abschnitt 10.2), und wir übernehmen diese Bezeichnung als Kapitelüberschrift, gehen aber auch auf einige andere Ansätze ein, die jeweils etwas unterschiedliche Zielsetzungen verfolgen. 10.1 Lokale Kohärenz durch Relationen zwischen Textsegmenten Wenn Kohärenz, wie von einigen Autoren formuliert, den „inneren Sinnzusammenhang“ eines Textes bezeichnet, dann sollte eine Explizierung dieses Begriffs den Unterschied zwischen den folgenden Variationen von Beispiel 7.3 beschreiben können: (10.2) a Stefan fehlte heute im Sportunterricht. Er war krank. b Stefan fehlte heute im Sportunterricht. Er trägt am liebsten rote Pullover. Intuitiv stellen wir fest, dass in Text [a] der zweite Satz eine Erläuterung oder Begründung des ersten Satzes liefert, weshalb wir beide Sätze problemlos als kohärent wahrnehmen. Für Text [b] ist dies sehr viel schwieriger; wir stutzen und lehnen dann den „Text“ entweder ab oder konstruieren mit Mühe einen Kontext, in dem beide Sätze in der Tat nebeneinander stehen können und einen bestimmten inhaltlichen Zusammenhang aufweisen. Die dafür nötige Mühe zeigt uns auch noch einmal, dass Koreferenz eben nicht ausreichend ist, um einen Text kohärent zu machen-- in [b] liegt es zwar sehr nahe, das Pronomen des zweiten Satzes auf Stefan zu beziehen, doch ist damit die Kohärenz noch keineswegs hergestellt. Wichtig ist an Beispiel 10.2 außerdem, dass die Information über die Art des Zusammenhangs weder in [a] noch in [b] explizit (durch Konnektoren o. ä.) im Text gegeben wird; vielmehr ist es Aufgabe der Leserin, sich diesen Zusammenhang zu erschließen. Grundlage dafür ist unser Weltwissen, das uns für [a] die genannte Interpretation des Zusammenhangs-- 176 10 Rhetorische Struktur Erläuterung, Begründung- - unmittelbar nahelegt. Dass Textverstehen in dieser Weise als Wechselspiel zwischen der Aufnahme von Information aus dem Text und dem Herantragen von Vorwissen an den Text aufzufassen ist, dürfte weitgehend unbestritten sein; die weiter gehende und durchaus strittige Frage ist dann jedoch die nach dem Inventar möglicher Sinnzusammenhänge, die zwischen EDU s (oder Textabschnitten) bestehen können. Lässt es sich vollständig, und dabei möglichst systematisch, beschreiben? Grosz und Sidner (s. Abschnitt 7.2.1) hatten diese Frage explizit mit „nein“ beantwortet-- die Menge möglicher Sinnzusammenhänge sei prinzipiell unendlich und der Versuch einer Aufzählung mithin zum Scheitern verurteilt. Auf der anderen Seite stehen Versuche, diese Menge sehr wohl systematisch zu konstruieren, wovon wir die Relationshierarchie der Penn Discourse Treebank bereits gesehen haben (Abb. 9.2 auf S. 164). Ein früher Vertreter dieser Gegenposition war Grimes (1975), der eine Reihe von „rhetorischen Prädikaten“ vorschlug, die die Rolle eines Segmentes für den gesamten Text benennen; dazu zählten beispielsweise ‚Analogy‘ oder ‚Example‘. Diese Idee wurde in etlichen späteren Arbeiten zu systematischeren Konzeptionen von zweistelligen Relationen ausgebaut, die wir hier Kohärenzrelationen nennen. 65 Dem liegt die These zugrunde, dass ein Satz-- genauer: eine minimale Einheit der Textstruktur ( EDU )-- im allgemeinen Fall nicht eine ausgezeichnete Rolle relativ zum gesamten Text spielt (wie im Fall der einstelligen Relation bzw. des rhetorischen Prädikats), sondern relativ zu einer benachbarten EDU oder zu einem längeren Textabschnitt. EDU s tragen danach nicht einfach individuell zur Gesamtheit der Textinformation bei, sondern gehen eine Verbindung mit ihren Nachbarn ein. Damit wird lokale Kohärenz, in Gestalt solcher Relationen, zum Pendant der Kohäsion: Während kohäsive Mittel die Textsegmente an der Oberfläche miteinander verbinden (siehe Kapitel 2), bezeichnet die Kohärenzrelation die Art des „tieferen“ bzw. „inneren“ Zusammenhangs zwischen den ausgedrückten Propositionen. In Weil die Vase vom Tisch fiel, zerbrach sie in hundert Stücke stiften das Pronomen und der Konnektor weil die Kohäsion, und letzterer zeigt den kausalen Zusammenhang zwischen beiden EDU s an. In einem Beispiel wie diesem kann der Konnektor jedoch auch implizit bleiben, weil die Leser die zugrunde liegende Kohärenzrelation unmittelbar erschließen können: Die Vase fiel vom Tisch. Sie zersprang in hundert Stücke. Um über einen rein intuitiven Begriff hinaus zu gelangen, muss eine Konzeption von Kohärenzrelationen drei (eng zusammenhängende) Fragen beantworten: 1. In welcher Weise, auf welcher Beschreibungsebene, mit welchem Erklärungsziel sollen solche Relationen definiert werden? 2. Welche Menge von Relationen kann die Arten von Zusammenhängen in Texten erschöpfend beschreiben? 3. Welche Art von Struktur ergibt sich durch Zuweisung der einzelnen Relationen insgesamt für den Text? 65 Andere Termini in der Literatur sind discourse relation, rhetorical relation und die deutschen Entsprechungen dazu. 177 10.1 Lokale Kohärenz durch Relationen zwischen Textsegmenten 10.1.1 Definitionsgrundlage Die Tatsache, dass es in der Literatur eine Vielzahl unterschiedlicher Vorschläge für Inventare von Kohärenzrelationen gibt, belegt das methodische Problem, ein solches Inventar theoretisch zu rechtfertigen. Einige Autoren entwickeln es primär durch Introspektion: Eine bestimmte Menge von Sinnzusammenhängen erscheint intuitiv plausibel und lässt sich jeweils durch sprachliche Beispiele illustrieren. Ein zweiter, systematischerer Weg besteht darin, sich gezielt von sprachlichen Phänomenen leiten zu lassen, eine Kohärenzrelation also dann zu definieren, wenn das Sprachsystem Evidenz für sie liefert. Dabei handelt es sich zum einen um lexikalische Einheiten, vor allem um die Konnektoren einer Sprache, wie in Abschnitt 9.3 besprochen. Dieses Vorgehen erscheint zunächst besser motiviert, birgt jedoch das Problem, dass die Mehrzahl der Sätze eines Textes keinen Konnektor enthält-- ohne dass der Text dadurch weniger kohärent würde. Ein Inventar von Relationen sollte also auch Sinnzusammenhänge berücksichtigen, die nicht zwingend von Konnektoren angezeigt werden (es sei denn, man arbeitet mit der Hypothese, dass im Prinzip jede Satzverbindung durch einen Konnektor markiert werden könnte, sie lediglich oft überflüssig sind). Das Sprachsystem liefert Evidenz aber nicht nur unmittelbar durch Lexeme, sondern auch indirekt durch Oberflächenmerkmale, die Hinweise auf die semantische Struktur des Gesagten geben. Für einen Ansatz wie die Segmented Discourse Representation Theory ( SDRT ) (Asher u. Lascarides, 2003) sind es denn auch semantische Objekte, die die Argumente der Kohärenzrelationen bilden, und nicht die Zeichenketten an der Textoberfläche. Es gilt dann, für diese Objekte logisch fundierte Repräsentationen zu entwerfen und Inferenzregeln anzugeben, nach denen der Beitrag der Kohärenzrelation formal abgeleitet werden kann- - einerseits durch Analyse syntaktischer Merkmale der zugrunde liegenden Sätze (etwa Tempus und Aspekt), andererseits durch Rückgriff auf axiomatisch repräsentiertes Weltwissen. Eine weitere Möglichkeit, Relationen zu begründen, besteht im Rückgriff auf psycholinguistische Experimente oder Modelle. So argumentieren Sanders u. a. (1992), dass Kohärenz-- weil sie eben nicht zwangsläufig mit kohäsiven Mitteln an der Textoberfläche einhergeht-- letztlich „jenseits“ des Textes erklärt werden muss und dass als Beschreibungsebene dafür nur die mentale Repräsentation des Textinhalts in Frage komme. Die These ist dann, dass Kohärenzrelationen eine Rolle in diesen Repräsentationen spielen, also kognitiv relevant sind; und um dies zu belegen, seien psycholinguistische Experimente das probate Mittel. Der Grundgedanke ist also ähnlich wie beim formal-semantischen Vorgehen- - man muss mit abstrakten Objekten arbeiten, nicht mit dem Text selbst--, doch besteht der Unterschied in der Art der Begründung dieser Objekte: Für die Semantik ist es die Rolle des Objekts im größeren Zusammenhang eines Inferenzsystems auf der Basis formaler Logik, während die Psycholinguistik ihre experimentellen Methoden heranzieht, um Hypothesen über Existenz und Gestalt solcher abstrakter Objekte in unseren mentalen Repräsentationen zu stützen. Verbunden mit der Wahl der „Inspirationsquelle“ für Kohärenzrelationen ist der zu wählende Rahmen für die Definitionen, der eher der Perspektive der (formalen) Semantik oder der Pragmatik entsprechen kann. Die semantische Sichtweise betont, dass durch einen Satz 178 10 Rhetorische Struktur (bzw. eine EDU ) eine Proposition vermittelt wird. Die interessante Eigenschaft des Textes ist aus dieser Sicht, dass er nicht allein die Summe der Propositionen der Sätze kommuniziert, sondern weitere Propositionen hinzutreten, die die Leserin durch Inferenzprozesse aktiv konstruiert-- und dieser Vorgang, den wir oben in Beispiel 10.2 mit dem impliziten kausalen Bezug illustriert hatten, entspricht der Identifikation einer Kohärenzrelation und stellt gewissermaßen ihren „Mehrwert“ dar, weil sie zur expliziten Information des Textes weiteres hinzufügt. Vertreter dieser Sicht sind beispielsweise Hobbs (1979), Kehler (2002) und Asher u. Lascarides (2003). Als Beispiel sei hier die Definition der Relation ‚Explanation‘ von (Kehler, 2002, S. 21) genannt. S 1 und S 2 sind die beiden EDU s, P und Q sind Propositionen, der Pfeil steht für eine Implikation. Explanation: Infer P from the assertion of S 1 and Q from the assertion of S 2 , where normally Q → P . Kehler nennt dafür die Textbeispiele George is dishonest because he‘s a politican und George is dishonest. He‘s a politician. ‚Explanation‘ zählt damit zu den Relationen, die durch einen Konnektor angezeigt werden können, aber nicht müssen. Eine primär pragmatische Orientierung rückt dagegen die Intention der Sprecherin in den Vordergrund, die jeder EDU zugeschrieben werden kann und die vom Leser identifiziert werden muss. Es geht mithin um den beim Leser zu erzielenden Effekt: Er soll nach Lektüre der EDU etwas Neues glauben, etwas gut oder schlecht finden etc. Hier ist dann die These, dass diese Intentionen in hierarchischen Beziehungen zueinander stehen, es also auch eine Gesamtintention des Textes gibt. Die ‚Rhetorical Structure Theory‘ (Mann u. Thompson, 1988) mit ihrem konkreten Vorschlag solcher Intentionen und Relationen, die wir in Abschnitt 10.2 ausführlicher vorstellen, ist primär vor diesem Hintergrund entstanden. Eine methodische Frage, die von der Wahl zwischen Semantik- oder Pragmatik-Perspektive unabhängig ist, betrifft den Grad der Verzahnung der Relationen miteinander. In den meisten Ansätzen wird jede Relation einzeln definiert, so dass sich letztlich kein klares Kriterium für die Abgeschlossenheit der Relationsmenge ergibt. Die Alternative besteht darin, die Defintionen in eine Menge von geeigneten Attribut / Wert-Paaren zu dekomponieren. Die Menge der möglichen Kombinationen dieser Paare bestimmt dann, was als Kohärenzrelation überhaupt auftreten kann, insofern ist dieser Ansatz methodisch eleganter und macht stärkere Vorhersagen. Diesen Weg gingen Sanders u. a. (1992) und Bateman u. Rondhuis (1997). Sanders u. a. begründen ihr Vorgehen mit dem Ziel der psychologischen Plausibilität: Es müsse eine überschaubare Menge kognitiver Primitive geben, aus denen sich Relationen zusammensetzen, und die aber auch unabhängig von ihrer Verwendung in Kohärenzrelationen eine Rolle in der Kognition spielen. Sie schlugen diese vier Primitive vor: ▶ Basisoperation: additiv / kausal Die zugrunde liegende prätheoretische Intuition ist, dass EDU s entweder nur locker (additiv) oder eng (kausal) verbunden sind; im ersten Fall kann der Leser lediglich die Propositionen p und q der EDU s ableiten, im zweiten Fall darüber hinaus eine Implikation p → q (dies ist aber nicht im engeren Sinn konditional gemeint, sondern Relevanz-orientiert). 179 10.1 Lokale Kohärenz durch Relationen zwischen Textsegmenten ▶ Quelle der Kohärenz: semantisch / pragmatisch Bei einer semantischen Relation besteht der Zusammenhang zwischen den Propositionen der EDU s, bei einer pragmatischen Relation zwischen ihren Intentionen bzw. Illokutionen. Ein Beispiel für eine pragmatische Relation ist: Das Bier ist im Kühlschrank. Ich habe viel zu tun. Es kann paraphrasiert werden als Das Bier ist im Kühlschrank. Ich sage das, weil ich viel zu tun habe. (=-Bitte hole es dir selbst.) ▶ Lineare Anordnung der EDU s: elementar / nicht-elementar Dieses Merkmal ist nur in Verbindung mit kausalen Relationen möglich und bezeichnet die Unterscheidung, ob die EDU , die das p aus p → q ausdrückt, im Text der q- EDU vorangeht (elementar) oder umgekehrt (nicht-elementar). ▶ Polarität: positiv / negativ Dieses Merkmal wird von Sanders et al. nicht sehr gründlich definiert, kann aber so umschrieben werden, dass in der Definition der Relation entweder eine Negation enthalten ist oder nicht; zudem gehe die Unterscheidung mit verschiedenen Konnektoren einher: and, because signalisierten positive, although, but hingegen negative Relationen. Eine der möglichen Kombinationen dieser Merkmale ist dann beispielsweise causal + pragmatic + basic order + positive, was nach Sanders et al. der Relation ‚Argument-Claim‘ entspricht: Zunächst wird eine Aussage getroffen, dann eine Behauptung aufgestellt, welche von der Aussage gestützt wird. Die Autoren nennen folgendes Beispiel: Nests or dead birds may clog up chimneys. Therefore, have your chimney checked once a year and swept when necessary. Die Dekomposition in Primitive ist ein attraktiver, aber auch sehr ambitionierter Ansatz, denn es gilt, die richtige Zahl von Primitiven zu finden, diese jeweils individuell zu motivieren (sie sollen eine belegbare kognitive Relevanz haben) und dann zu zeigen, dass die Kombinationen der Attribut / Wert-Paare Kohärenzrelationen entsprechen- - was wiederum zwei Aspekte hat: Einerseits sollte jede Relation, die aus „externen“ Gründen sinnvoll erscheint (zum Beispiel, weil die Sprache Konnektoren bereitstellt, die sie signalisieren), auch als Attribut / Wert-Paar darstellbar sein. Zum anderen sollte zumindest theoretisch jeder möglichen Kombination von Werten auch eine Relation entsprechen; falls dies für eine bestimmte Kombination nicht zutrifft, so müsste das gut begründbar sein. 10.1.2 Inventar Die Frage nach der Motivation des Inventars von Kohärenzrelationen hängt natürlich von der gewählten Antwort auf die Frage nach der Definitionsgrundlage ab. Wenn man sich auf das schwierige Problem der Dekomposition von Definitionen in eine überschaubare Merkmalsmenge nicht einlassen möchte, so kann man sich mit der Angabe einer jeweils „nützlichen“ Menge von Relationen bescheiden, ohne dabei unbedingt einen Anspruch auf Vollständigkeit zu erheben. Diesen Weg geht etwa die im nächsten Abschnitt zu beschreibende Rhetorical Structure Theory ( RST ) (Mann u. Thompson, 1988), deren Entwickler eine recht große Zahl verschiedener Texte analysiert haben und deren Relations-Inventar sich für eben diese Texte als hinreichend herausgestellt hat, was freilich nicht bedeutet, dass künftige 180 10 Rhetorische Struktur Untersuchungen weiterer Texte nicht das Postulieren weiterer Relationen nahelegen können. Interessanterweise ist das von Mann und Thompson vorgeschlagene Inventar in der seither sehr regen Diskussion um RST nur sehr geringfügig erweitert worden, hat sich also als recht aussagekräftig erwiesen. Ein zweiter Weg besteht im systematischen Rückgriff auf die sprachlichen Kohäsionsmittel: Knott u. Dale (1994) erstellen zunächst ein Inventar der Konnektoren des Englischen und führen dann (wie in Abschnitt 9.3.3 beschrieben) systematische Ersetzungsproben durch, um festzustellen, welche Konnektoren unter welchen Umständen, also in welchen Kontexten, wechselseitig ausgetauscht werden können, ohne dass sich die Bedeutung des Satzes wesentlich verändert. Auf diesem Weg lässt sich beispielsweise zeigen, dass obwohl und obschon immer austauschbar sind, mithin die gleiche Relation signalisieren. Demgegenüber scheint das Verhältnis zwischen aber und obwohl eines der Subsumtion zu sein: Mit obwohl ausgedrückte konzessive Zusammenhänge können in aller Regel auch mit aber ausgedrückt werden, doch kann aber auch noch andere Rollen spielen, etwa die der kontrastiven Gegenüberstellung. 66 Aus der so entstehenden Taxonomie von Konnektoren kann dann eine Menge von Relationen abgeleitet werden-- die aber eben nur solche Relationen enthält, die auch durch sprachliche Konnektoren realisiert werden können. Das Bild bleibt daher unvollständig, doch hat dieser Ansatz den Vorteil der Reproduzierbarkeit, zumindest insoweit die Ersetzungsproben intersubjektiv nachvollziehbar sind (Knott und Dale haben dies nicht experimentell überprüft, sondern vertrauten ihrer eigenen Intuition). 67 Die stärker empirisch motivierte Fortführung dieses Ansatzes findet sich im korpusbasierten Vorgehen der Penn Discourse Treebank (s. Abschnitt 9.3.3), wo über mehrere Jahre hinweg große Mengen von Text annotiert wurden. Ausgehend von den vorgefundenen Konnektoren und ihrer jeweiligen Funktion im Text hat sich im Lauf der Zeit ein Inventar von Relationen entwickelt und stabilisiert, das von den Annotatoren zuverlässig verwendet werden kann, wie durch Messung der Übereinstimmung zwischen ihren Entscheidungen festgestellt wurde. Neben der Sprache kann aber auch das Forschungsparadigma bzw. der zugrunde liegende Formalismus die Wahl eines Relationsinventars beeinflussen. So liegen die Wurzeln der SDRT (Asher u. Lascarides, 2003) in der formalen Semantik, genauer in dem Bestreben, die semantischen Satzanalysen der Diskursrepräsentationstheorie (Kamp u. Reyle, 1993) auf der Diskursebene auch unter Einsatz von Kohärenzrelationen fortzuführen. Der Vorzug ist, dass die Relationen relativ präzise definiert werden, da auch ein Kalkül für ihre Ableitung in Repräsentationen des Kontexts vorgeschlagen wird. Das bedeutet aber auch, dass man sich auf solche Relationen konzentriert, für die eine solch präzise Definition überhaupt möglich ist. So spielen beispielsweise Erwägungen über Sprecherziele (die im Zentrum der Illokutionsstrukturen des letzten Kapitels stehen) in der SDRT nur eine untergeordnete Rolle, da deren Formalisierung erheblich schwieriger ist. 66 Zur Methodik der Ersetzungstests zur Motivation von Kohärenzrelationen siehe Abschnitt 9.3.3. 67 Einen interessanten Schritt in die Richtung plausiblerer Begründung von Kohärenzrelationen gingen Knott u. Sanders (1998) mit ihrer Arbeit, in der die Idee der Dekomposition (Sanders) mit der Konnektor-basierten Herangehensweise (Knott) verknüpft wird zu einer sprachübergreifenden Betrachtung englischer und niederländischer Konnektoren. 181 10.2 Von lokalen Relationen zu globalen Strukturen Ein letzter Weg schließlich ist der Rückgriff auf benachbarte Forschungsdiziplinen, die für die Untersuchung der Fragestellung möglicherweise schon auf eine längere Tradition zurückblicken können. So beruft sich Kehler (2002) beim Vorschlag seiner insgesamt 14 Relationen auf die von dem schottischen Philosophen David Hume vorgeschlagenen Arten von „connections among ideas“ und sortiert sie in diese Kategorien: ▶ Resemblance: Es werden die Gemeinsamkeiten, Unterschiede oder das Verhältnis der Generalisierung / Spezialisierung zwischen zwei Aussagen herausgestellt. ▶ Cause-Effect: Eine Aussage wird als Grund, die andere als Folge interpretiert. ▶ Contiguity: Teile derselben Situation werden beschrieben und als zusammengehörig interpretiert, z. B. als temporal aufeinanderfolgend. Für die Unterteilung einer Liste von Relationen spielen neben diesem inhaltlichen Kriterium weitere Faktoren eine Rolle. Die Einteilung in semantische versus pragmatische Relationen, die wir oben bei der Besprechung von Sanders et al. sahen, gibt es in ganz ähnlicher Form, wenn auch unter verschiedenen Bezeichnungen, bei den meisten Ansätzen, die die Aufgabe primär aus der pragmatischen Perspektive angehen. Bei eher linguistisch / semantischen Ansätzen ist eine andere Unterscheidung relevanter, nämlich die zwischen unterordnenden und nebenordnenden Relationen, so wie unten in 10.3 beschrieben. 10.2 Von lokalen Relationen zu globalen Strukturen Die Idee der Kohärenzrelation wächst mit unserem Thema der Textstruktur zusammen, wenn man davon ausgeht, dass solche Relationen nicht nur lokal zwischen EDU s, sondern dann auch rekursiv zwischen immer größeren Textabschnitten bestehen-- womit sich eine Hierarchisierung des Texts ergibt. Von den Vorschlägen, die dies umsetzen, stellen wir nun die Rhetorical Structure Theory ( RST ) (Mann u. Thompson, 1988, Matthiessen u. Thompson, 1988) etwas ausführlicher vor, weil sie explizit aus einer empirischen, korpusbasierten Perspektive heraus entwickelt wurde und im Prinzip für beliebige Texte verwendbar sein soll. Nach ausgedehnten Analysen unterschiedlicher englischsprachiger Texte schlugen Mann, Matthiessen und Thompson Relationen und Konstruktionsprinzipien vor, mit denen einem Text eine Baumstruktur zugewiesen wird, die dann als Indiz seiner Kohärenz zu betrachten ist. Die Konstruktionsprinzipien sind als eine Reihe von Anwendungsschemata für die Relationen beschrieben, und besagen vor allem, dass Relationen immer nur zwischen unmittelbar benachbarten Segmenten ( EDU s oder größeren Textabschnitten) bestehen. Die dem zugrunde liegende These besteht darin, dass (global) kohärente Texte keine inhaltlichen „Lücken“ (‚non-sequiturs‘) aufweisen: Jede EDU spielt ihre Rolle im Text, indem sie zu einer benachbarten EDU oder einem benachbarten größeren Segment in einer Kohärenzrelation steht. Am Ende wird die Wurzel des RST -Baums von einer überspannenden Relation gebildet, die dann auch die grobe Gliederung des Textes angibt. Kreuzende Kanten sind in diesem Baum nicht erlaubt. Dies sind also recht enge formale Vorgaben für die erlaubten Strukturen (was ein Grund für die Popularität von RST in der Computerlinguistik ist). 182 10 Rhetorische Struktur Eine RST -Struktur unterscheidet sich also hinsichtlich ihres Status fundamental von allen anderen, die wir in den früheren Kapiteln besprochen haben: Die früheren waren klar auf eine unter vielen Ebenen beschränkt und erhoben zum Teil auch nicht den Anspruch, für den gesamten Text relevant zu sein. Theorien der Diskursstruktur wie RST hingegen treten an, um „die“ Textstruktur zu erfassen-- Kohärenzrelationen werden als das ganz zentrale Merkmal von Textualität angesehen, und einige andere Phänomene aus früheren Kapiteln werden auch durch Kohärenzrelationen modelliert, was wir später noch bewerten werden. Eine wichtige Annahme der RST ist die der Nuklearität: Nahezu alle Relationen verbinden nicht zwei „gleichgewichtige“ Segmente, sondern ein für die Relation zentrales Segment, den ‚Nukleus‘, mit einem weniger wichtigen, unterstützenden Segment, dem ‚Satelliten‘. Beispiele sind in Abb. 10.1 zu sehen, aus der auch das Muster der Relationsdefinitionen ersichtlich ist: Teile der Definition von RST -Relationen nach Mann / Thompson ▶ Effekt, der beim Leser durch die Verwendung der Relation erzielt werden soll ▶ Beschränkungen für Nukleus und Satellit, d. h., Bedingungen, die für diese Einheiten erfüllt sein müssen, damit die Relation verwendet werden kann ▶ Beschränkungen für die Kombination von Nukleus und Satellit (die ja letztlich den „Mehrwert“, also den Kern der Kohärenzrelation ausmacht) Als Kriterium für die Nuklearitätsentscheidung bei einer Textanalyse geben Mann u. Thompson (1988) an, der Nukleus sei für die Ziele der Autorin von größerer Bedeutung („more central to the writer‘s purposes“). Bezogen auf den Gesamttext wird als Indiz vorgeschlagen, dass die Satellit- EDU s eines Textes im Prinzip ausgelassen werden könnten, ohne dass er seinen wesentlichen Sinn verliere-- der Text sollte im wesentlichen noch verständlich bleiben. Nuklei hingegen können nicht aus dem Text entfernt werden, ohne dass der Text inkohärent wird. Contrast constraints on N: multi-nuclear constraints on the combination of nuclei: no more than two nuclei; the situations presented in these two nuclei are (a) comprehended as the same in many respects, (b) comprehended as differing in a few respects and (c) compared with respect to one or more of these differences the effect: reader recognizes the comparability and the difference(s) yielded by the comparison being made locus of the effect: multiple nuclei Antithesis constraints on N: writer has positive regard for the situation presented in N constraints on S: none 183 10.2 Von lokalen Relationen zu globalen Strukturen constraints on the N+S combination: the situations presented in N and S are in contrast (cf. Contrast definition); because of an incompatibility that arises from the contrast, one cannot have positive regard for both the situations presented in N and S; comprehending S and the incompatibility between the situations presented in N and S increases reader‘s positive regard for the situation presented in N the effect: reader‘s positive regard for N is increased locus of the effect: N Evidence constraints on N: reader might not believe N to a degree satisfactory to writer constraints on S: reader believes S or will find it credible constraints on the N+S combination: reader‘s comprehending S increases reader‘s belief of N the effect: reader‘s belief of N is increased locus of the effect: N Abbildung 10.1: Beispiele für RST -Definitionen nach Mann u. Thompson (1988) In Mann u. Thompson (1988) werden zwei Dutzend Kohärenzrelationen definiert, deren Namen sich in Abb. 10.2 finden. 68 Dort ist zu sehen, dass einige Relationen als ‚multinuklear‘ verstanden werden: Für sie gilt die Nukleus / Satellit-Unterscheidung nicht, sondern sie verbinden in der Tat gleichgewichtige Segmente. Der Unterschied lässt sich beispielsweise am Paar der Relationen Antithesis / Contrast identifizieren (Abb. 10.1), die einander recht ähnlich sind. Contrast stellt zwei Segmente gegenüber, um die Leserin auf Gemeinsamkeiten und vor allem Unterschiede aufmerksam zu machen, während Antithesis darüber hinaus eines der Segmente in den Vordergrund rückt, weil die Leserin dem Inhalt dieses Segments größere Wertschätzung beimessen soll. Für die Kausalrelation gilt, dass sie sich systematisch in vier Varianten aufteilt. Dafür ist einerseits das Merkmal ‚volitional‘ verantwortlich, das prüft, ob das Resultat der Handlung absichtsvoll herbeigeführt wurde (Mensch betätigt Lichtschalter) oder nicht (Sturm entwurzelt Baum). Parallel dazu kann die Nuklearitätsentscheidung frei getroffen werden: Stuft man in der dargestellten Kausalbeziehung den Grund als für den Text (oder das Ziel der Autorin) „wichtiger“ ein, wählt man eine Result Relation; ist hingegen die Folge wichtiger, wählt man eine Cause Relation. Ansonsten sind die Definitionen von Cause und Result identisch. Kausalität ist der einzige Fall, bei dem Nuklearität unabhängig von der Relationswahl entschieden werden kann; für alle anderen Relationen ist die Nukleus / Satellit-Verteilung fest vorgegeben. Die Relationen sind also in der RST primär über die Intentionen des Textproduzenten und die beabsichtigten Effekte beim Leser definiert. Mann und Thompson verwenden dafür ein Vokabular, das Ziele wie „increase positive regard for X“ oder „increase hearer‘s belief in X“ verwendet. Freilich verfolgt nicht jede einzelne EDU ein solches Ziel-- die Sprache hat oft ja auch 68 Die Autoren haben diese Menge ausdrücklich als „offen“ bezeichnet. In der Literatur wurden dann auch gelegentlich neue Relationen vorgeschlagen, von denen wahrscheinlich die Relation ‚List‘ am häufigsten wieder aufgegriffen wurde, weil sie in der Tat eine Lücke schließt (Verbindung mehrerer gleichwertiger Elemente zu einer Aufzählung). 184 10 Rhetorische Struktur eine reine Darstellungsfunktion. In diesem Fall lautet die Formulierung des Effekts der Relation „reader recognizes that X“. Hier geht es also nicht darum, Einstellungen des Lesers zu verändern, sondern ihm lediglich Informationen zu übermitteln. Dieser Unterschied in den Effekten der Relationen motiviert die Aufteilung in ‚presentational‘ und ‚subject matter‘-Relationen, wie sie in Abb. 10.2 zu sehen ist. Prominente ‚subject matter‘ Relationen, bei denen die Darstellung eines Sachverhalts „in der Welt“ im Zentrum steht, sind die verschiedenen Kausalrelationen. Beim Erstellen einer RST -Struktur muss man jede EDU sowohl in Bezug auf ihre Nachbarschaft untersuchen als auch ihren Beitrag für den Gesamttext beurteilen, denn davon hängt ab, an welchen Stellen im Text die Grenzen für größere Segmente zu ziehen sind, die in etwa den „Teiltexten“ im Sinne von Schröder (2003) entsprechen (vgl. Abschnitt 7.2.1). Die Entscheidung für die Zuweisung einer Relation ähnelt der Auswahl einer Stützungsbeziehung zwischen Illokutionen (Abschnitt 7.2.2), ist aber schwieriger, weil wir ein deutlich größeres Spektrum von Relationen zur Auswahl haben, mit denen wir der Textkohärenz insgesamt Rechnung tragen. 69 So ist eine Relation wie ‚Elaboration‘, bei der es, knapp formuliert, darum geht, dass auf eine allgemeinere Aussage eine speziellere folgt (z. B. Ich mag das Frühjahr am liebsten. Im April gefällt mir die Krokusblüte,-…), von ihrer Definition her betrachtet wohl in recht vielen Fällen verwendbar, aber nur selten wird sie die einzige sein, deren Definition für eine bestimmte Textstelle „passt“. Ähnlich wie bei der Zuweisung von Illokutionen geht es also darum, die im Vordergrund stehende Relation zu identifizieren. Wie diese Entscheidung zu treffen ist, darüber machen Mann, Matthiessen und Thompson nur wenige Aussagen, so wie sie auch insgesamt der Beziehung zur linguistischen Realisierung der Relation eher wenig Aufmerksamkeit widmen. Diese Fragen werden ausführlicher in den später entstandenen Annotationsrichtlinien von Carlson u. Marcu (2001) behandelt (die allerdings eine sehr viel größere Relationsmenge verwenden). Subject matter Presentational Nucleus and Satellite Elaboration Circumstance Solutionhood (Non-)Volitional Cause (Non-)Volitional Result Purpose Condition Otherwise Interpretation Evaluation Restatement Summary Motivation Antithesis Background Enablement Evidence Justify Concession Multinuclear Sequence Contrast Joint Abbildung 10.2: Liste der RST -Relationen nach Mann u. Thompson (1988) 69 Die Definitionen aller Relationen finden sich in Mann u. Thompson (1988), in etwas abgewandelter Form auch auf www.sfu.ca/ rst (Zugriff 8. 1. 18). 185 10.2 Von lokalen Relationen zu globalen Strukturen Zur Illustration zeigt Abb. 10.3 eine Analyse eines kurzen Textes 70 ; die Abbildung enstand mit dem RSTT ool (s. Abschnitt 10.6). Die von Mann und Thompson vorgeschlagene Notation zieht einen gebogenen Pfeil vom Satellit-Segment zum Nukleus und benennt diesen Pfeil mit der Relation; vom Nukleus geht ein senkrechter Strich nach oben. Über das so entstehende größere Segment wird ein waagerechter Strich gezogen, der dann seinerseits für die ihm übergeordnete Relation verwendet wird. Bei multinuklearen Relationen entfällt der Pfeil, stattdessen werden die Nuklei einfach durch eine Linie mit dem Mittelpunkt der Linie des übergeordneten Segments verbunden. Unser Beispieltext folgt einem recht einfachen Muster. Zunächst wird das Thema ‚elektronischer Gesundheitspass‘ in positives Licht gestellt (wenn auch bereits mit der „Vorwarnung“ auf den ersten Blick), und zwar mit einer allgemein wertenden Aussage, die von zwei konkreteren Thesen gefolgt wird. Damit ist die Definition für Elaboration erfüllt; man könnte aber an dieser Stelle alternativ wohl auch mit Evidence (vgl. Abb. 10.1) arbeiten. Sätze 2 und 3 sind lediglich mit List verbunden, da sie in keinem Zusammenhang zueinander stehen, außer dass sie beide in derselben Beziehung zu Satz 1 stehen. Dieselbe Struktur wiederholt sich dann in 4-6, allerdings mit umgekehrtem Vorzeichen: allgemeine Warnung, gefolgt von zwei konkreten Gefahren (oder was der Autor dafür hält). Satz 7 liefert keine neue Information, sondern reformuliert noch einmal 5, wofür RST die Relation Restatement bereitstellt. Zwischen den Blöcken 1-3 und 4-7 ist die Relation Antithese gegeben, deren Definition wir in Bild 10.1 gezeigt hatten. 8 liefert mit dem gläsernen Patienten eine subjektiv gefärbte Umschreibung, die von 9 sehr explizit bewertet wird (Relation Evaluation). Die Analyse fasst dann 8 und 9 gemeinsam wiederum als Bewertung der vorangegangenen Gegenüberstellung der positiven und negativen Sicht auf. Die Erstellung einer RST -Analyse zu einem Text ist eine komplexe Aufgabe, die wie gesehen vier verschiedene, aber miteinander eng verbundene Aspekte beinhaltet: ▶ Teilung des Textes in EDU s, ▶ Festlegung der Hierarchie (Baumstruktur), ▶ Zuweisung des Nuklearitätsstatus an Segmente, ▶ Zuweisung von Relationen zu Segmenten. In der Praxis fallen diese Entscheidungen oft gleichzeitg, u. a. weil RST den Nuklearitätsstatus direkt mit der Relation verknüpft. Man sollte sich jedoch darüber im Klaren sein, dass man bei der Erstellung eines RST -Baums solcherlei unterschiedliche, sich aber gegenseitig beeinflussende Festlegungen trifft. Für die Analyse hat sich folgende Vorgehensweise als nützlich erwiesen: 70 Quelle: BILD Zeitung vom 12. 6. 2002. 186 10 Rhetorische Struktur Schritte einer RST -Analyse: 1. Lesen Sie den gesamten Text. 2. Zerfällt der Text in erkennbare größere (thematische) Einheiten? Markieren Sie etwaige Grenzen zwischen solchen Segmenten. 3. Teilen Sie den Text in seine EDU s auf (vgl. Abschnitt 9.1). 4. Untersuchen Sie der Reihe nach jede EDU und ihre unmittelbaren Nachbarn. Gibt es eine klar erkennbare (z. B. durch einen Konnektor signalisierte) Relation zwischen der EDU und einem Nachbarn? ▷ Wenn ja, entscheiden Sie sich ggf. für einen Nukleus und markieren Sie diesen. ▷ Wenn nein, kann diese EDU sich an der Grenze einer in der Struktur übergeordneten Relation befinden. Suchen Sie nach Relationen zwischen größeren Segmenten. Nuklearität hängt hier stärker von der Rolle des Segments für den Gesamttext ab! 5. Führen Sie diese Prozedur fort, bis eine komplette Baumstruktur entstanden ist. Wichtig ist, jeweils alle vier Komponenten der Relationsdefinitionen in Betracht zu ziehen und die Entscheidungen nicht allein vom intendierten Effekt leiten zu lassen; beachtet man die anderen Felder nicht, entsteht erheblich größere Mehrdeutigkeit bei der Analyse. Nur in den seltensten Fällen allerdings wird sich Mehrdeutigkeit ganz vermeiden lassen. Auch Mann und Thompson haben betont, dass es ganz natürlich sei, wenn sich für einen Text mehrere Analysen angeben lassen. Dies wird der RST mitunter zum Vorwurf gemacht, doch sollte man stets den Zweck einer RST -Analyse nicht aus den Augen verlieren: Es geht nicht um die Angabe der einzigen richtigen Baumstruktur, sondern eher darum, das Ergebnis der Interpretation des Texts systematisch abzubilden; Interpretation jedoch ist naturgemäß ein subjektiver Vorgang und so sollte es nicht verwundern, wenn verschiedene Annotatoren zu verschiedenen Ergebnissen gelangen. Problematisch allerdings scheint es, wenn ein und derselbe Annotator sich an bestimmten Textstellen zwischen konkurrierenden, gleichermaßen „passenden“ Relationsdefinitionen schlechterdings nicht entscheiden kann; auf diesen Punkt kommen wir am Ende des Kapitels zurück. Der in RST prominente Aspekt der Nuklearität wurde von anderen Autoren weiterentwickelt zur sog. „strong nuclearity hypothesis“ (Marcu, 2000). Danach findet man die wichtigsten EDU s eines Textes, indem man beginnend an der Wurzel des Baumes der Linie des Nukleus nach unten folgt, bis man bei einem Blatt des Baumes, also bei einer EDU landet. Falls auf dem Weg multinukleare Relationen angetroffen werden, wird jede der Linien weiter verfolgt. So entsteht eine Menge aus EDU s, die nach der Hypothese den zentralen Gehalt des Texts ausmachen. In der Beispiel-Analyse in Bild 10.3 bildet nach diesem Kriterium Segment 4 allein die „zentrale“ Aussage des Textes; naturgemäß ist die Idee allerdings bei längeren Texten fruchtbarer als bei kurzen. Diese „strong hypothesis“ kann noch weiter fortentwickelt werden zu einer Skala der EDU -Wichtigkeit, indem man z. B. für jede nukleare EDU auszählt, wie viele Nukleus-Verbindungen auf dem Weg von ihr aufwärts liegen, bis man erstmals 187 10.3 Inkrementelles Textverstehen eine Satellit-Verbindung erreicht. So lassen sich am Ende alle EDU -Nuklei in eine (partielle) Ordung der „Wichtigkeit für den Text“ bringen. Abbildung 10.3: Beispiel für die RST -Analyse eines kurzen Textes 10.3 Inkrementelles Textverstehen Wir haben RST als Analyse-Werkzeug vorgestellt, mit dem man durch Kombination der Blickrichtungen auf die rein lokale Verknüpfung und auf die Rolle von EDU s und größeren Segmenten im Gesamttext zu einer insgesamt plausiblen Analyse gelangen kann. Diese Analyse wird im Lichte der Beschaffenheit des gesamten Texts erstellt, also erst nach Abschluss des Verstehensprozesses. Damit stellt der Analyseprozess kein Modell für die kognitive Verarbeitung beim Lesen dar; das entspräche auch nicht der Absicht von Mann, Matthiessen und Thompson. Andere Modelle rücken demgegenüber die Verbindung von kognitiver Adäquatheit und linguistischer Verarbeitung in den Vordergrund. Hier wird dann der Begriff ‚Textstruktur‘ in einem engeren und sehr spezifischen Sinn, nämlich für die systematische Erweiterung der Analyse von Satzstrukturen verwendet: Analog zum Aufbau der syntaktischen und semantischen Struktur für Sätze wird eine Baumstruktur für Texte aufgebaut, die jeweils inkrementell um die Repräsentation des aktuell verarbeiteten Satzes angereichert wird. Dabei kann man entweder syntaktische Konstituenten zugrunde legen, wie im D- LTAG 71 Modell von Webber u. a. (2003), oder semantische Repräsentationen wie in der SDRT (Asher u. Lascarides, 2003). Solchen Ansätzen ist gemeinsam, dass sie versuchen, Textverstehen als Fortsetzung des Satzverstehens zu erklären, und dabei homogene Strukturen zugrunde legen. Für Webber u. a. (2003) etwa spielen die Konnektoren (siehe Abschnitt 9.3) auf der Text-Ebene die analoge Rolle zu der der Verben auf der Satz-Ebene bei der Projektion von Prädikat-Argument-Strukturen. Nach Polanyi (1988, S. 608) kann Textstruktur als rekursive Nebeneinanderstellung und Einbettung von Diskurssegmenten verschiedener Typen aufgefasst werden. Polanyi unterscheidet in ihrem Modell, ganz ähnlich wie Grosz und Sidner mit satisfaction-precedence und dominance (s. Abschnitt 7.2.1), grundsätzlich zwischen Nebenordnung und Unterord- 71 Discourse Lexicalized Tree Adjoining Grammar. 188 10 Rhetorische Struktur nung. Im Fall der Nebenordnung folgen im Text eine Reihe von Segmenten aufeinander, die alle thematisch miteinander verbunden und Spezifikationen einer gemeinsamen Proposition sind, die nicht im Text selbst ausgedrückt, sondern auf einer höheren Ebene angesiedelt ist. Wir illustrieren dies mit der deutschen Übersetzung von Polanyis Beispiel nach Sassen (2005): (10.3) Peter hat blondes Haar. Er wiegt 75 kg. Er hat eine nette Freundin. Er arbeitet als Berater in einer Bank. Alle Sätze spezifizieren eine allgemeine Aussage oder ein Thema, das wir „Eigenschaften von Peter“ nennen können, und das in der Baumstruktur als Knoten vom Typ C (für coordination, also Nebenordnung) die Sätze des Textes zusammenfügt, wie im oberen Baum in Abbildung 10.4 72 gezeigt. Eine Relation der Unterordnung hingegen besteht dann, wenn ein Textsegment durch die Propositionen der unmittelbar nachfolgenden Segmente semantisch weitergeführt wird, wie im Beispiel (10.4), ebenfalls aus Sassen (2005). Im Baum erhält der entsprechende Knoten den Typ S (für subordination) und ist mit dem übergeordneten Segment bestückt; siehe den unteren Baum in Abb. 10.4. (10.4) Peter kennt sich gut mit Film aus. Er hat die einschlägige Literatur gelesen. Er war jahrelang Filmvorführer in einem Programmkino. Er hilft Archiven bei der Identifizierung von Filmen. Abbildung 10.4: Neben- und und Unterordnung in Baumstruktur nach Polanyi (1988) Für den inkrementellen, also das lineare Textverstehen modellierenden Aufbau einer solchen Baumstruktur stellen sich zwei zentrale Fragen. Die eine ist die Entscheidung zwischen Neben- und Unterordnung; sie wird dem Weltwissen des Rezipienten zugeschrieben, ist also keine primär linguistische oder strukturell bedingte Entscheidung. Die andere Frage betrifft die Anknüpfungsstelle für das jeweils nächste Segment: Gegeben die für die bisherigen n Segmente des Textes aufgebaute Baumstruktur, wo ist die Satzstruktur des Segments n+1 72 Quelle: (Sassen, 2005). 189 10.3 Inkrementelles Textverstehen anzuknüpfen? Da nicht einfach alle Sätze gleichberechtigt nebeneinander stehen, sondern die hierarchische Struktur des Textes abbilden, lassen sich dafür nun strukturelle Beschränkungen formulieren. Im Modell von Grosz u. Sidner (1986) geschieht dies über den Mechanismus des focus stack, eine Datenstruktur, die abbildet, auf welche Diskursgegenstände sich jeweils die Aufmerksamkeit der Rezipientin richtet. Die Repräsentanten liegen auf einem Stapel, und bei der Verarbeitung eines Diskurssegments können neue Diskursgegenstände auf diesen Stapel gelegt werden (etwa wenn ein neues Thema begonnen wird) oder „abgearbeitete“ können davon entfernt werden (etwa wenn nach Ende einer Abschweifung zu einem alten Thema zurückgekehrt wird). Das gleiche Ziel, jedoch mit einem engeren Bezug zur linguistischen Struktur, verfolgt das right-frontier constraint ( RFC ), das von Polanyi (1988) vorgeschlagen und von den oben genannten weiteren Ansätzen (D- LTAG , SDRT ) aufgegriffen wurde. Es besagt, dass für die Anbindung des aktuell verarbeiteten Satzes lediglich die Segmente in Frage kommen, deren Wurzelknoten den rechten Rand des bisher aufgebauten Diskurs-Baumes bilden-- also das aktuell letzte Segment des Textes sowie diejenigen, die dieses Segment dominieren. Diese Beschränkung sei für die Interpretation des Segments relevant und schlage sich dann insbesondere in der Zugänglichkeit für anaphorische Pronomen nieder. Zur Illustration ziehen wir folgendes Beispiel von Asher u. Lascarides (2003) heran: (10.5) (1) Max had a great evening last night. (2) He had a great meal. (3) He ate salmon. (4) He devoured lots of cheese. (5) He then won a dancing competition. Erzählt wird eine kurze Geschichte, die aus einigen Ereignissen besteht; doch folgen diese Ereignisse keineswegs unabhängig aufeinander. Sätze (3) und (4) werden wir kaum so verstehen, dass sie Ereignisse schildern, die auf das Ereignis in (2) folgen- - vielmehr charakterisieren sie das (2)-Ereignis genauer. (5) wechselt dann das Thema vom Essen zu einer anderweitigen Beschäftigung, die wir anhand unseres Weltwissens aber immer noch als Bestandteil eines great evening ansehen würden; d. h. Ereignis (5) folgt nicht auf das von (1), sondern auf das von (2). (2-4) und (5) liefern damit gemeinsam eine Erläuterung der abstrakteren Aussage in (1). Daraus ergibt sich eine hierarchische Struktur des Textes, wie in Abb. 10.5 dargestellt. 73 Abbildung 10.5: Hierarchische Struktur des Textes Max‘s evening 73 In diesem Fall besteht ein enger Zusammenhang zwischen dieser ‚rhetorischen‘ Struktur und der temporalen Struktur, die wir in Kapitel 6 behandelt haben; dies ist jedoch nicht immer so. 190 10 Rhetorische Struktur Im Beispieltext haben wir es auf den ersten Blick mit einer sehr einfachen referenziellen Struktur zu tun, da nach seiner Ersterwähnung durchgängig pronominal, und jeweils in Subjektfunktion, auf Max verwiesen wird. Satz (5) enthält jedoch auch die temporale Anapher then, die hier eine wichtige Rolle spielt, wie sich zeigt, wenn wir den Satz einmal ohne dieses then lesen. Der Text würde dann eine monotone Fortführung der Schilderung von Ereignissen liefern (he ate X, he devoured Y, he won Z), die oberflächlich betrachtet als temporal aufeinander folgend geschildert sind. Was ja im Einzelnen auch stimmt, aber eben der oben diskutierten Strukturierung nicht gerecht wird. Then signalisiert uns die Möglichkeit, dass der Satz einen Themenwechsel oder eine Rückkehr zu einem bereits besprochenen Thema mit sich bringt; unser Weltwissen bestätigt uns dann diese Vermutung, da Tanzen keine spezielle Form des Essens ist. Ohne then hätte der Text die gleiche Bedeutung, wäre aber schwieriger zu verarbeiten. Der Text könnte nun durch den Satz It was run by a charity organization fortgesetzt werden, wobei sich it dann höchstwahrscheinlich auf dancing competition bezieht, der Satz mithin an (5) anknüpft. Ebenso wäre eine Fortsetzung wie It really was one of the most memorable nights of the year for him denkbar, die dann jedoch an (1) anknüpft. Die, wie in Abb. 10.5 zu sehen, gemäß RFC nicht zugänglichen Sätze (2), (3) und (4) wären jedoch für ein Pronomen nicht erreichbar; so ist es beispielsweise nicht möglich, mit einem Satz wie It was red auf salmon zurückzukommen, also an (3) anzuknüpfen. Ein Nebenneffekt des inkrementellen Vorgehens besteht darin, dass viele Relationen zweifach definiert werden müssen, nämlich in Abhängigkeit von der linearen Abfolge der Segmente. So wie Sanders u. a. (1992) das Merkmal ‚order‘ in ihr Raster zur Relationsdefinition aufgenommen hatten, finden sich beispielsweise in SDRT die Relationen Result und Explanation, die denselben semantischen Zusammenhang bezeichnen, sich jedoch in der Segmentreihenfolge unterscheiden. Für die im letzten Abschnitt besprochene RST hingegen ist dies nicht relevant, da wie beschrieben insgesamt der Bezug zur sprachlichen Oberfläche nicht so eng ist; Mann u. a. haben sich darauf beschränkt, die Art des „inneren Zusammenhangs“ zwischen den Segmenten anzugeben, unabhängig von der im Text gewählten Linearisierung. 10.4 Baumstruktur oder Graphstruktur? Das (u. a.) von der RST vertretene Postulat, dass die Textstruktur als Baum dargestellt werden kann, besagt, dass immer nur aneinander grenzende (adjazente) Segmente miteinander verbunden werden und es keine „kreuzenden Kanten“ in der Analyse-Struktur gibt. Die Frage, ob dies als Darstellungsinstrument ausreichend mächtig ist oder ob man allgemeinere Graph-Strukturen benötigt, kann wiederum aus verschiedenen Perspektiven betrachtet werden. Aus kognitiver Sicht geht es darum, wie die mentale Verarbeitung von Diskurssegmenten funktioniert und ob beispielsweise ein „Stapel“-Modell wie das von Grosz u. Sidner (1986) für die Repräsentation und Verwaltung der Diskursgegenstände plausibel ist, also durch experimentelle Befunde gestützt werden kann. Aus computerlinguistischer Sicht hat ein Baum Vorteile für die Verarbeitungsstrategie: Die Algorithmen für die Automatische Textanalyse vereinfachen sich gegenüber allgemeiner Graph-Verarbeitung erheblich. Aus lin- 191 10.5 Fazit guistisch-deskriptiver Sicht schließlich ist die Frage, ob die im Text beobachteten sprachlichen Phänomene der Annahme einer Baumstruktur entgegenstehen oder nicht. So argumentieren Webber u. a. (2003) dafür, dass die Menge der sprachlichen Konnektoren sich in zwei sehr unterschiedliche Gruppen teilt: ▶ Strukturelle Konnektoren (im wesentlichen Konjunktionen) verbinden in der Tat immer adjazente Segmente. ▶ Anaphorische Konnektoren (im wesentlichen Adverbiale) können analog zu anaphorischen Pronomen ein Antezedens anbinden, das nicht unbedingt adjazent zum Bezugssegment sein muss. Diese These lässt sich zunächst durch die Beobachtung stützen, dass ein Textsegment durchaus zwei verschiedene Konnektoren enthalten kann, womit das „einfache“ Bild der RST - - jeweils eine Verbindung zwischen zwei benachbarten Segmenten- - ins Wanken gerät. Ein Beispiel: (10.6) (1) Das Spiel wurde wegen heftiger Ausschreitungen auf den Rängen in der 77. Minute abgebrochen. (2) Die meisten Zuschauer verließen das Stadion umgehend und ruhig. (3) Aber der Verein wird deshalb wohl eine heftige Geldstrafe zahlen müssen. Während die Konjunktion aber den Satz 3 mit Satz 2 (oder der Spanne 1-2) verbindet, bezieht sich deshalb nicht auf 2, sondern ausschließlich auf 1. Auf solche (und ähnliche) Beobachtungen kann man unterschiedlich reagieren: SDRT (Asher u. Lascarides, 2003) sowie der Ansatz von Wolf u. Gibson (2005) halten (wenn auch aus unterschiedlichen Gründen) Baumstrukturen für prinzipiell unzureichend; hingegen machen Webber u. a. (2003) für die Textstruktur im engeren Sinne allein die ‚strukturellen‘ Konnektoren verantwortlich, womit die Baumstruktur erhalten bleibt, und verlagern Fälle wie das obige deshalb in den Bereich der Sachverhaltsanaphern (siehe Kapitel 4), die per Definition keine Adjazenz-Beschränkungen kennt-- dann aber eben nicht Teil der Textstruktur „im engeren Sinne“ ist. 10.5 Fazit Die in diesem Kapitel beschriebene „Familie“ von Modellierungsansätzen versucht, die Kohärenz von Texten mit einer Strukturbeschreibung zu erklären, die sich auf Relationen zwischen benachbarten Segmenten gründet. Unterschiede zwischen den Familienmitgliedern ergeben sich durch verschiedene Zielsetzungen; so kann man (wie RST ) den Text als statisches Gebilde begreifen und seinen inneren Zusammenhalt abzubilden versuchen, oder aber (wie LDM , D- LTAG , SDRT ) sich für den Prozess des Textverstehens interessieren und Segment für Segment ein inkrementelles Ableiten einer Diskursrelation und einer „Anknüpfungsstelle“ modellieren. Andere Unterschiede ergeben sich, wie erläutert, beim Vorgehen der Definition von Relationen, die primär kognitiv (wie bei Sanders u. a., 1992) oder empirisch (wie bei RST ) oder philosophisch und linguistisch (wie bei Kehler, 2002) motiviert sein kann, aber auch die Einpassung in einen formal-semantischen Formalismus betonen kann (wie SDRT ). Ebenso kann man geteilter Ansicht darüber sein, ob ein Segment jeweils nur mit einer Relation angebunden sein kann oder 192 10 Rhetorische Struktur mit mehreren, auch dies hatten wir herausgestellt. Die engste Vorgabe für diesen strukturellen Aspekt macht RST mit der Annahme einer Baumstruktur ohne kreuzende Kanten. Neben allen Unterschieden besteht die zentrale Gemeinsamkeit der Ansätze darin, die Kohärenzrelation als alleiniges Instrument der Strukturbeschreibung zu verwenden. Mann u. Thompson (1988) beispielsweise sehen den Beitrag des RST -Baums darin, für jedes Textsegment die inhaltliche Verknüpfung zu seinen Nachbarn anzugeben und damit der Beobachtung Rechnung zu tragen, dass es in kohärenten Texten keine ‚non-sequiturs‘ gebe-- keine Segmente, die unvermittelt und ohne Verbindung zum Rest des Textes im Raum stehen. Der Preis für diese Homogenität ist, dass die Relationen sehr unterschiedliche Arten von Verknüpfungen beschreiben, und dass-- zumindest im Fall von RST -- das Postulat darin besteht, dass jeweils nur eine Verknüpfung möglich sei. Diese Annahme führt zu übersichtlichen Strukturbeschreibungen, wird aber wohl nicht allen Phänomenen der Textkohärenz gerecht. Beispielsweise argumentieren Knott u. a. (2001), dass die Relation Elaboration, zumindest in der Spielart Objekt-- Attribut (erstes Segment handelt von einem Gegenstand, zweites Segment von einer Eigenschaft dieses Gegenstands), nicht als „rhetorische“ Relation aufgefasst werden solle, sondern ein anderes Instrument der Kohärenzsicherung darstelle. Die Autoren schlagen vor, diese Relation aus dem Inventar zu streichen und an ihre Stelle einen Wechsel im Aufmerksamkeitsfokus, einen Übergang von einem Diskursgegenstand zu einem anderen, zu setzen. Damit ergibt sich als Textrepräsentation eine Folge von kleineren RST -Bäumen und deren Verknüpfung durch Fokus-Wechsel, was die Autoren als entity chains bezeichnen. Dieser Vorschlag bewegt sich natürlich in die Richtung unserer in den vergangenen Kapiteln skizzierten Ebenen-Unterscheidung; wir kommen darauf in Kapitel 11 noch einmal zurück. Ein weiterer Aspekt, der in der Literatur bisher allerdings nur wenig Aufmerksamkeit gefunden hat, betrifft die Frage ob ein Relationsinventar tatsächlich gleichermaßen für die Verknüpfung einzelner EDU s und für die von größeren Textabschnitten verwendet werden sollte. Die semantischen und pragmatischen Verknüpfungen, wie sie von Konnektoren zwischen EDU s hergestellt werden können, müssen vielleicht nicht zwangsläufig in derselben Weise auch zwischen längeren Satzfolgen bestehen; umgekehrt gibt es zwischen großen Segmenten vielleicht Relationen, die zwischen EDU s keine Rolle spielen. Dass diese Frage kaum untersucht wurde, hängt sicherlich damit zusammen, dass die hier besprochenen Textstruktur-Theorien empirisch bisher nur auf relativ kurze Texte angewandt wurden. Ein Zusammenspiel beispielsweise mit der in Kapitel 3 besprochenen genrespezifischen Folge von ‚Inhaltszonen‘ müsste noch untersucht werden. 10.6 Annotation von rhetorischer Struktur in Korpora Im Unterschied zu den in Teil II besprochenen Annotationsebenen ist die Definition einer rhetorischen Struktur mit großen Interpretationsspielräumen behaftet, wie wir beim Herausstellen der Unterschiede zwischen verschiedenen Ansätzen gesehen haben. Dementsprechend ist die Annotation von Korpora von besonderer Wichtigkeit: Nur wenn Relationsinventare und strukturelle Vorgaben an vielen authentischen Texten praktisch erprobt werden, stößt 193 10.6 Annotation von rhetorischer Struktur in Korpora man auf potenzielle Schwierigkeiten, die bei der Konzeption von selbsterdachten Beispielsatzfolgen im Dunkeln bleiben. Das PDTB Korpus hatten wir am Ende des letzten Kapitel bereits erwähnt. Es spielt aber auch für die Arbeit mit RST oder SDRT eine Rolle, weil das PDTB -Prinzip, lediglich einzelne Kohärenzrelationen zu annotieren, ohne auf Wechselwirkungen mit anderen Relationen zu achten, dann im Ergebnis eine Überprüfung von strukturellen Annahmen gestattet. So wurde anhand des PDTB -Korpus gezeigt, dass Relationen durchaus häufig nicht-adjazente Segmente verbinden. Die entsprechenden Textstellen kann man nun daraufhin überprüfen, ob sie z. B. mit der RST dennoch adäquat repräsentiert werden können. Gleiches gilt für die Überlappung verschiedener Relations-Segmente, die in der PDTB ebenfalls nicht selten sind, für RST aber ein potenzielles Problem darstellen. Das wichtigste (englischsprachige) RST -Korpus ist die RST Discourse Treebank (Carlson u. a., 2003), die Zeitungstexte aus dem Wall Street Journal umfasst. (Ein Teil der Texte ist auch in der PDTB enthalten.) Es wurde in den letzten Jahren für viele Experimente zur Automatisierung von RST -Analyse verwendet. Eine Anreicherung dieser Daten wurde von Das u. Taboada (2017) mit dem RST Signalling Corpus präsentiert, in dem eine große Zahl von linguistischen Signalen für die Kohärenzrelationen annotiert sind. Beide Korpora sind über das Linguistic Data Consortium 74 zu beziehen. Für das Deutsche stellt das Potsdamer Kommentarkorpus die größte RST -annotierte Textquelle dar. Die Annotationsrichtlinien sind in (Stede, 2016a) enthalten, und die RST -Strukturen sind Teil der freien Distribution des Korpus. Speziell für die Annotation von Texten nach RST hat Mick O‘Donnell ein frei verfügbares Werkzeug implementiert, das ‚ RSTT ool‘. 75 Mit RSTT ool muss die Benutzerin zunächst im ‚Edit‘-Modus die Grenzen der EDU s markieren (siehe Abb. 10.6, oben) und kann dann im ‚Structurer‘-Modus sukzessive per Mausklick Relationen zwischen EDU s markieren und dadurch größere Segmente bilden, die ihrerseits durch Relationen verbunden werden, wobei die von Mann und Thompson vorgeschlagene grafische Darstellungsweise erzeugt wird. Die Menge der Kohärenzrelationen ist nicht durch RSTT ool festgelegt, sondern kann von den Nutzern selbst bestimmt werden. 74 http: / / www.ldc.upenn.edu (Zugriff 8. 1. 18). 75 Siehe: http: / / www.wagsoft.com. Eine Variation des RSTT ool wurde von Daniel Marcu entwickelt und ist unter http: / / www.isi.edu/ ~marcu verfügbar (Zugriffe 8. 1. 18). 194 10 Rhetorische Struktur 195 10.6 Annotation von rhetorischer Struktur in Korpora Abbildung 10.6: Segmentierung und Relations-Markierung mit RSTT ool Auch für die SDRT gibt es Annotationsprojekte, bisher für englisch- und französischsprachige Texte. Entsprechende Richtlinien wurden im Projekt ANNODIS entworfen (Muller u. a., 2012). Ebenfalls wurde ein speziell für diesen Zweck geeignetes Annotationswerkzeug namens glozz entwickelt. Das bislang einzige Korpus, das sowohl mit RST als auch SDRT Strukturen annotiert ist und dementsprechend konkrete Vergleiche gestattet, sind die in Kapitel 8 vorgestellten argumentative microtexts, die als dritte Ebene auch hinsichtlich der Argumentationsstrukturen annotiert sind. Diese Daten sind frei verfügbar (Stede u. a., 2016a). 196 10 Rhetorische Struktur Weiterführende Literatur Eine empfehlenswerte, umfangreichere Darstellung der Problematik von Kohärenzrelationen, mit engem Bezug zu Phänomenen der linguistischen Realisierung, liefert Kehler (2002). Zur Rhetorical Structure Theory sind neben den in 8.2 bereits genannten Original-Artikeln (Mann u. Thompson, 1988, Matthiessen u. Thompson, 1988) für den Einstieg zwei Überblicksbeiträge von Taboada und Mann empfehlenswert (Taboada u. Mann, 2006a,b). Daneben bietet die RST -Webseite 76 umfassende und aktuelle Informationen. Eine kritische Besprechung der RST gibt Fritz (2017) in seinem Lehrbuch zu einer Dynamischen Texttheorie. Einen guten Einblick in das hierarchische Linguistic Discourse Model von Polanyi bietet (Polanyi, 1988) und für die Segmented Discourse Representation Theory gibt das Buch von Asher u. Lascarides (2003) eine umfassende Einführung. Die Debatte um Baum- oder Graphstrukturen wird von Egg u. Redeker (2010) kompakt zusammengefasst; diese Autor / Innen bewerten die pro-Graph-Argumente aus der in Abschnitt 10.4 zitierten Literatur kritisch. 10.7 Übungsaufgaben 1. Machen Sie sich mit den Definitionen der Kohärenzrelationen nach RST vertraut, z. B. anhand der oben genannten RST -Webseite. Prüfen Sie dann zunächst lokal zwischen benachbarten EDU s Ihres Kommentars, welche Relation(en) in Frage kommen. 2. Erstellen Sie eine umfassende RST -Analyse, indem Sie für Ihre Nuklearitäts- und Relations-Entscheidungen auch den Bezug zum Gesamttext herstellen. Welche größeren Textsegmente ergeben sich? Sind sie identisch mit denen, die Sie in Übung 3 von Kapitel 7 ermittelt hatten? 3. Vergleichen Sie Ihre RST -Analyse mit den nur lokal ermittelten Relationskandidaten aus Übung 1 und stellen Sie fest, ob es für Ihren Text sinnvoller wäre, mehr als eine Relation zwischen Segmenten, oder auch Relationen zwischen nicht benachbarten Segmenten zuzulassen. 76 http: / / www.sfu.ca/ rst (Zugriff: 8. 1. 18) 197 11.1 Die Ebenen 11 Schluss: Entstehung von Kohärenz „Divide et explana“ Die Fragen, wie Texte „funktionieren“, wie ihre Autoren mit ihrer Hilfe Ziele verfolgen, und was diese Texte im Innersten zusammenhält, sind trotz vieler seit dem Aufkommen der Textlinguistik gewonnener Einzelerkenntnisse bis heute nur unvollständig zu beantworten. Dieses Buch hat nicht den Versuch unternommen, dazu eine geschlossene Theorie vorzulegen, sondern hat ein Programm vorgeschlagen, um die Suche nach umfassenderen und aussagekräftigeren Antworten zu befördern: das der korpusgestützen Entwicklung eines Ebenen-Modells. Dabei haben wir nicht nur Lösungsvorschläge gesammelt, sondern an vielen Stellen auch offen bleibende Fragen genannt. Um die zusammengetragenen Bausteine jetzt noch einmal abschließend zu beleuchten, wenden wir uns in diesem Kapitel drei Aspekten zu: den behandelten Ebenen, der Rolle von annotierten Daten für die Mehr-Ebenen-Analyse von Texten, und der Bedeutung dieses Vorgehens für den Begriff der Kohärenz. 11.1 Die Ebenen In Teil II haben wir eine Reihe einzelner Beschreibungsebenen für Texte untersucht, und im Folgenden stellen wir die jeweils zentralen Anliegen der fünf behandelten Ebenen noch einmal in Kürze zusammen. Die ersten zwei sind weitgehend unabhängig von der Textsorte relevant, während die übrigen je nach Textsorte eine unterschiedlich wichtige Rolle spielen. (Die Idee der in Teil III besprochenen rhetorischen Struktur auf Basis einer EDU -Segmentierung nehmen wir dann in den folgenden Abschnitten wieder auf.) Referenzielle Struktur Eine zentrale Säule der Kohärenz von Texten ist die Koreferenz: Sprachliche Ausdrücke verweisen aufeinander (mit Pro-Formen) bzw. auf dieselben Diskursgegenstände. Die referenzielle Struktur haben wir als Menge referenzieller Ketten beschrieben, die für jeden Diskursgegenstand anzeigen, wann und wie im Text auf ihn verwiesen wird. Im einfachen Fall sind dies direkte Wiederaufnahmen, während es bei indirekten Wiederaufnahmen (oder bridging Anaphern) oft schwierig zu entscheiden ist, ob ein neuer Gegenstand eingeführt wird oder auf einen bereits eingeführten Bezug genommen wird, und in welcher Weise. Zur Modellierung der Produktions- und Rezeptionsentscheidung bei der Koreferenzauflösung kann man wie in der Centering-Theorie eine Ordnung über den Antezedens-Kandidaten definieren, vorwiegend aufgrund syntaktischer Eigenschaften. Oder man kann jedes Glied der referenziellen Kette in Abhängigkeit vom jeweils letzten Auftreten des Gegenstands und der syntaktischen Realisierung mit einem numerischen Aktivierungsgrad versehen und damit die Verschiebung der relativen Salienz von Diskursgegenständen modellieren. Eine Komplikation bringen Ereignisanaphern mit sich, die nicht auf Gegenstände im engeren Sinne, sondern auf Sachverhalte / Ereignisse verweisen, denn hier können Antezedenten komplex und von sehr unterschiedlicher Form sein. 198 11 Schluss: Entstehung von Kohärenz Thematische Struktur Die für den Text bzw. einen Textabschnitt längsten referenziellen Ketten liefern Hinweise auf das Thema des Texts bzw. Textabschnitts. Ein Thema kann durch den prominentesten Diskursgegenstand angemessen benannt sein; je nach Textsorte und Texttyp können jedoch auch Aussagen oder Fragestellungen eine adäquate Themenbeschreibung darstellen. Die thematische Struktur macht dies explizit; sie geht davon aus, dass ein Abschnitt jeweils ein zentrales Thema behandelt, das aber in einer Teil-von-Beziehung zum Thema eines längeren Abschnitts stehen kann, in den der kürzere eingebettet ist. Aus der thematischen Textstruktur ist also zu entnehmen, wann sich ein Thema ändert, wann von einem allgemeinen zu einem speziellen Thema gewechselt und ggf. wieder zurückgekehrt wird. Temporale Struktur Wenn Texte über mehrere, möglicherweise komplexe, Ereignisse berichten, kann es für den Leser mehr oder minder schwierig sein, die beschriebene Abfolge von Ereignissen und Teilereignissen zu rekonstruieren. Dies ist besonders im narrativen Text ein wesentlicher Aspekt des Textverstehens. Die temporale Struktur macht die dem Text zu entnehmende Information über zeitliche Abfolge- und Inklusionsbeziehungen zwischen beschriebenen Ereignissen explizit. Darüber hinaus kann sie die im Text genannten temporalen Referenzpunkte (im Jahr 1962; am Sonntag) festhalten und zueinander in Beziehung setzen (zwei Tage später), womit auch die Ausdehnung bzw. der Abstand zwischen Ereignissen repräsentiert werden kann. Illokutionsstruktur Ist die primäre Textfunktion appellativ, möchte die Autorin also aktiv Einfluss auf die Einstellung oder das Handeln des Lesers nehmen, so ist die Illokutionsstruktur eine zentrale Beschreibungsebene. Sie legt zunächst die illokutiven Rollen der minimalen Diskurseinheiten fest und setzt dann diejenigen Einheiten zueinander in Beziehung, deren Illokutionen sich gegenseitig stützen-- wo also die eine zum Gelingen der anderen beiträgt (Dependenzmodell). Alternativ kann man sich von den minimalen Einheiten lösen und jeweils Textabschnitten eine ‚Teiltexthandlung‘ zuweisen und diese dann zueinander in Beziehung setzen (Konstituentenmodell). Argumentationsstruktur Für den argumentativen Text geht die Argumentationsstruktur einen Schritt weiter und stellt auf einer abstrakteren Ebene (d. h. unabhängiger von der Textoberfläche) dar, wie der Autor seine zentrale These abstützt und dabei möglicherweise auch Gegenargumente in Betracht zieht und diese entkräftet. Dabei können recht komplexe Strukturen mit separaten Argumentationssträngen entstehen. Ist ein solches „chirurgisches“ Vorgehen-- Zerteilen des Textes in Beschreibungsebenen-- angemessen? Wird man dem Text und seiner Funktion damit gerecht? Zunächst einmal erlaubt diese Vorgehensweise, dass man jede Einzelebene allein sorgältig untersucht und durch diese Fokussierung die Einflüsse der vielen anderen Faktoren (neben den hier besprochenen Ebe- 199 11.2 Mehr-Ebenen-Analyse und Korpora nen wird Textverstehen ja noch von allerlei weiteren Phänomenen mitbestimmt) weitgehend ausblendet. Im nächsten Schritt können dann bestimmte Ebenen gemeinsam betrachtet und ihre wechselseitigen Einflüsse untersucht werden: Wir vertreten hier keineswegs die These, dass die fünf Ebenen unabhängig voneinander operieren. 11.2 Mehr-Ebenen-Analyse und Korpora Um die Analyseebenen eines Textes auszuwerten und zu vergleichen, müssen sie zunächst systematisch erzeugt werden. Dies wird in der Regel nicht auf Papier, sondern elektronisch geschehen. Die verschiedenen weit verbreiteten Textverarbeitungs- und Tabellenkalkulationsprogramme sind dafür nicht grundsätzlich ungeeignet, doch wird die Korpusarbeit effektiver, wenn die Daten mit spezieller Annotationssoftware erstellt werden, die jeweils auf die Eigenheiten der Ebene zugeschnitten ist. Entsprechende Hinweise haben wir in den einzelnen Kapiteln gegeben. Unter methodischen Gesichtspunkten ist es ebenso wichtig, Textannotation nicht intuitiv, sondern auf der Grundlage schriftlicher Richtlinien zu betreiben, die das behandelte Phänomen ausleuchten und das Annotationsvorgehen dokumentieren. Nur so wird sichergestellt, dass über die Zeit hinweg diejenigen Textstellen, die sich bezüglich des Phänomens äquivalent verhalten, auch äquivalent annotiert werden, also ein konsistent annotiertes Korpus entsteht. Auch zu solchen Richtlinien haben wir Hinweise gegeben; für das Potsdamer Kommentarkorpus beispielsweise sind sie für alle Ebenen in dem Band (Stede, 2016a) zusammengefasst. Konsistent annotierte Daten und die zugehörigen Richtlinien erlauben dann auch die Zusammenarbeit unter dem Stichwort shared corpora: Annotierte Daten nützen nicht nur denjenigen, die sie annotiert haben, sondern stellen eine wichtige Ressource für die Forschung dar, und es gibt verschiedene Modelle, solche Ressourcen allgemein verfügbar zu machen (siehe dazu Lemnitzer u. Zinsmeister, 2015). Gerade der Ansatz der Mehrebenen-Annotation bietet sich überdies für eine aufgabenverteilte Entwicklung an: Dieselben Daten können auf verschiedenen Ebenen annotiert werden-- und dies durchaus von verschiedenen Annotatoren an verschiedenen Orten und zu verschiedenen Zeiten; das Gesamtergebnis ist dann für alle nützlich. Damit dies funktioniert, ist die Arbeit mit präzisen, verständlichen und evaluierten Annotationsrichtlinien allerdings unerlässlich, denn für die Auswertung sind Daten, die man nicht selbst annotiert hat, nur in Verbindung mit den zugrunde liegenden Annotationsrichtlinien vertrauenswürdig und nutzbar. Eine durch Person X vorgenommene Annotation sollte durch Person Y klar nachvollziebar sein-- auch wenn Y dann nicht mit allen inhaltlichen Entscheidungen von X ganz einverstanden ist, ist eine Arbeit mit den Daten dennoch möglich. Eine potenzielle Komplikation bei der Auswertung von Mehrebenen-Korpora (vor allem wenn sie von Dritten annotiert wurden) und bei der Ermittlung von Korrelationen zwischen Ebenen besteht in möglichen Abhängigkeiten zwischen den einzelnen Annotationsebenen. Ein einfaches Beispiel: Möchten wir eine Aussage darüber gewinnen, wie häufig eine Kohärenzrelation durch einen bestimmten Konnektor signalisiert wird, so setzt dies voraus, dass die Annotationsrichtlinien für die Relationen (soweit möglich) unabhängig von Konnektoren formuliert sind-- ansonsten lesen wir aus den Daten ja nur das heraus, was wir vorher auch 200 11 Schluss: Entstehung von Kohärenz hinein gelegt haben. Ähnliches passiert, wenn die Annotation von Koreferenz auf zuvor automatisch ermittelten Nominalphrasen geschieht, und dann später in den Daten nach syntaktischen Mustern der referierenden Ausdrücke gesucht wird. Dafür muss natürlich bekannt sein, wie deren automatische Erkennung funktioniert hat. Anknüpfend an diesen Punkt sei darauf hingewiesen, dass es für viele Zwecke sinnvoll ist, auch automatisch erstellte Annotationen (die ja per se auch reproduzierbar sind) mit einzubeziehen. Für die Textebene (etwa für die Koreferenz oder die rhetorische Struktur) arbeiten diese bis heute nur mit überschaubarer Qualität, doch die automatische Annotation von Wortarten und Syntax kann sehr hilfreich sein, wenn sie dann mit den manuellen Text- Annotationen kombiniert wird. Als traditionell wichtiges Korpus für das Englische haben wir an verschiedener Stelle auf die ursprünglich nur syntaktisch bearbeitete Penn Treebank hingewiesen, die über einen langen Zeitraum hinweg die mit vielen weiteren linguistischen Annotationen versehen wurde, so dass Ebenen-Korrelationen untersucht werden können. Ein kleineres Projekt, das aber den großen Vorzug hat, frei einsehbar zu sein, ist das Georgetown University Multilayer Corpus (Zeldes, 2017b). Es kombiniert eine Reihe verschiedener Textsorten sowie eine Reihe von Annotationsebenen. Über die Webseite des Projekts 77 ist neben der Download-Information auch der Online-Zugang zum Korpus in der linguistischen Datenbank ANNIS zu finden. Für das Deutsche ist das PCC ebenso zum Download und in ANNIS für die Recherche verfügbar, die entsprechenden URL s finden sich auf der Homepage zu diesem Buch. Ein größeres Korpus deutscher Zeitungstexte, allerdings mit weniger diskursbezogenen Annotationsebenen ist die auf Seite 83 kurz beschriebene TüBa-D / Z. Die Erstellung eines Korpus gesprochensprachlicher Dialoge nach dem Mehrebenen-Paradigma, einschließlich der zu lösenden technischen Fragen, beschreiben Sauer u. Lüdeling (2016). 11.3 Textkohärenz: Beziehungen zwischen Ebenen In den Kapiteln 9 und 10 haben wir Ansätze vorgestellt, die die Kohärenz eines Texts als Menge von Relationen über einer zunächst gebildeten Sequenz von minimalen Diskurseinheiten ( EDU s) erklären. Am Beispiel der RST wollen wir im Folgenden hinterfragen, inwieweit mit einer solchen Baumstruktur aus Relationen (zwischen EDU s und größeren Einheiten) eine angemessene Modellierung der Textkohärenz erfolgt. Wie in Abb. 10.2 (S. 184) gezeigt, ist ein wichtiges Element der RST nach Mann u. Thompson (1988) die Teilung der Relationsmenge in die Gruppen subject-matter (eher semantisch) und presentational (eher pragmatisch, sprechaktorientiert). Da zwischen zwei Segmenten eines Texts jeweils nur eine Relation bestehen darf, kann man bei der Analyse also entweder einen inhaltlich-semantischen oder einen illokutiven Zusammenhang herausstellen. Wenn aber zwei Segmente nur durch eine Relation verbunden sein können, dann sollten sich die Definitionen der Relationen idealerweise gegenseitig ausschließen, damit keine Mehrdeutigkeiten entstehen. Dies ist infolge der (kaum vermeidbaren) Vagheit in der Defini- 77 https: / / corpling.uis.georgetown.edu/ gum/ (Zugriff 8. 1. 18). 201 11.3 Textkohärenz: Beziehungen zwischen Ebenen tion von Kohärenzrelationen aber nicht gegeben. So fällt es nicht schwer, Beispiele zu finden, in denen sowohl eine illokutive Stützung als auch ein inhaltlich-semantischer Zusammenhang annotiert werden können. Das folgende Beispiel lehnt sich an ein von Moore u. Pollack (1992) diskutiertes an: (11.1) (1) Komm doch vor sieben Uhr nach Hause! (2) Dann können wir noch wegen der Schrauben zum Baumarkt fahren und (3) Dein Bücherregal wird heute abend noch fertig. Durch eine semantische Brille betrachtet, stellt der Inhalt von (1) eine Vorbedingung für (2) und dies wiederum eine Vorbedingung für (3) dar. Richten wir die Aufmerksamkeit allerdings auf die Illokutionen, so dürfte die Aufforderung von (1) die zentrale Handlung des Textes sein, die unmittelbar von (3) gestützt wird (unterstellt, dass dem Adressat an einer Fertigstellung des Regals gelegen ist). Beide Analysen lassen sich nun aber nicht in einer einzigen RST -artigen Darstellung unterbringen, sondern ergeben zwei alternative Strukturen. Die RST -Analyse müsste sich für eine der beiden entscheiden, während die Mehrebenen-Analyse eine Illokutionsstruktur und eine semantisch orientierte relationale Struktur parallel darstellen kann. In ähnlicher Weise können Textbeispiele auch eine Illokutionsstützung mit unterschiedlichen thematischen Verhältnissen kombinieren: (11.2) a Die SPÖ wird sicherlich die Wahl gewinnen. Sie hat einen fehlerfreien Wahlkampf geführt. b Die SPÖ wird sicherlich die Wahl gewinnen. Die Leute sind so enorm unzufrieden mit der derzeitigen Wirtschaftspolitik. In beiden Fällen kann der zweite Satz Evidenz für die Voraussage des ersten liefern, doch bleibt [a] beim Thema SPÖ , während [b] das Thema wechselt. Ein für [a] und [b] identischer RST -Baum mit Evidence Relation kann diesen-- für den weiteren Textverlauf möglicherweise bedeutsamen-- Unterschied nicht darstellen. Analog ließe sich zeigen, dass auch die Rekonstruktion der temporalen Struktur eines Textes keineswegs in einer 1: 1 Beziehung zur thematischen oder der Illokutionsstruktur stehen muss, so dass verschiedene Ebenen erforderlich sind, wenn man der Komplexität gerecht werden müsste. Die Problematik der Beschränkung auf eine einzelne Baumstruktur lässt sich ebenfalls erkennen, wenn wir einen zweiten zentralen Aspekt der RST betrachten, nämlich die von Mann und Thompson als zentrales Prinzip der Textorganisation postulierte Nuklearität (s. Abb. 10.2 auf S. 184). Die Beobachtung, dass unterschiedliche Segmente eines Textes von der Autorin für unterschiedlich „wichtig“ erachtet und auch als solche markiert werden können, ist wohl unstrittig. Doch liegt das wirklich daran, dass die jeweilige Kohärenzrelation die Zuweisung von Nukleus und Satellit an die beiden Segmente fest vorschreibt? Auch hier scheint es uns 202 11 Schluss: Entstehung von Kohärenz angemessener, die Beschreibungsebenen auseinanderzuhalten und verschiedene Dimensionen der relativen „Wichtigkeit“ eines Segments S n zu unterscheiden, wie etwa: 78 ▶ S n trägt unmittelbar zur Funktion des Textes bei.-- (wichtig) ▶ S n stützt die Illokution eines benachbarten Segments S n-1 oder S n+1 .-- (wichtig) ▶ S n ist mit lexikalischen Emphase-Signalen markiert, wie es ist bedeutsam, dass oder ich betone hiermit.-- (wichtig) ▶ Das Thema von S n wird im späteren Textverlauf fortgesetzt.-- (wichtig) ▶ S n stellt eine kurze Abschweifung vom Hauptthema des Textes dar.-- (unwichtig) ▶ S n wiederholt lediglich (vielleicht aus rhetorischen Gründen), was schon einmal gesagt wurde.-- (unwichtig) ▶ S n hat nur textinterne Funktion, sagt z. B. etwas über die Textgliederung.-- (unwichtig) ▶ S n ist seinem Nachbarsegment S n-1 oder S n+1 syntaktisch untergeordnet.-- (unwichtig) Faktoren dieser Art können natürlich miteinander korrelieren, sie müssen es aber nicht-- im Prinzip sind sie unabhängig voneinander und verweisen wiederum auf unterschiedliche Beschreibungsebenen. Ein Nuklearitätsprinzip, das alle Faktoren auf ein gemeinsames Merkmal reduziert, kann dies nicht angemessen darstellen. Unser Plädoyer ist daher, dass sich die Textkohärenz umfassender erklären lässt, wenn man nicht von einer einzelnen Beschreibungsebene mit unsystematischer Vermengung verschiedener Phänomene ausgeht, sondern die Phänomene einzeln behandelt und dann zueinander in Beziehung setzt. Bei diesem Vorhaben spielen Kohärenzrelationen selbstverständlich auch eine tragende Rolle-- sollten aber nicht vorbehaltlos als das einzige Repräsentationsinstrument aufgefasst werden. Wir beschließen diese Zusammenfassung und das Buch mit einigen Beispielen für die Untersuchungen konkreter Interaktionen zwischen verschiedenen Annotationsebenen. Dabei lässt sich das Spektrum erweitern, wenn neben den textbezogenen Ebenen zuätzlich die syntaktische Struktur der einzelnen Sätze zur Verfügung steht, wie es etwa im PCC der Fall ist. So kann man beispielsweise durch Kombination von Syntax- und RST -Annotationen den von Matthiessen u. Thompson (1988) postulierten engen Zusammenhang zwischen dem Satelliten-Status von Diskurssegmenten und syntaktischer Subordination überprüfen. Können subordinierte Sätze tatsächlich keine Nuklei sein, oder unter welchen Bedingungen ist dies doch möglich? Denkt man hier etwa an weiterführende Nebensätze, so kann man als dritte Ebene die thematische Struktur hinzuziehen und den Einfluss von Themenwechseln prüfen. Ein anderer Vorschlag aus der RST -nahen Forschung besagt, dass die anaphorische Zugänglichkeit von potenziellen Antezedenten mit dem Nukleus-Status des jeweiligen Diskurssgments korreliert, dass nämlich Antezedenten für Anaphern bevorzugt in Nukleus-Segmenten zu finden sind. Dies kann an Daten, die mit referenzieller und rhetorischer Struktur annotiert sind, 78 Eine ausführlichere Diskussion dieses Problems findet sich in Stede (2008). 203 11.3 Textkohärenz: Beziehungen zwischen Ebenen empirisch überprüft werden. 79 Bei der Besprechung der verschiedenen Facetten thematischer Struktur in Kapitel 5 hatten wir auf eine Reihe offene Fragen hingewiesen; in Verbindung mit der syntaktischen Struktur ist beispielsweise die Untersuchung der Bedingungen für die Verwendung syntaktisch auffälliger Topik-markierender Konstruktionen interessant; dazu ist eine gründlich annotierte referenzielle Struktur- - einschließlich indirekter Wiederaufnahmen bzw. bridging-- nötig. Zuletzt seien die Verwendungsbedingungen und -präferenzen von bedeutungsähnlichen Konnektoren genannt, über die ebenfalls noch viele Unklarheiten bestehen. In einem entsprechenden Mehrebenen-Korpus können die syntaktischen Umgebungen der Konnektoren ausgewertet werden, sowie die Korrelation mit semantischen und pragmatischen Merkmalen wie in der Korpusstudie von Frohning (2007). 79 Entsprechende Untersuchungen wurden u. a. von Krasavina u. a. (2007) und von Zeldes (2017a) vorgenommen. 205 Literaturverzeichnis Literaturverzeichnis [Adamzik 1995] ADAMZIK , Kirsten: Aspekte und Perspektiven der Textsortenlinguistik. In: ADAM- ZIK , Kirsten (Hrsg.): Textsorten-- Texttypologie. Eine kommentierte Bibliographie. Münster : Nodus, 1995, S. 11-40 [Adamzik 2004] ADAMZIK , Kirsten: Textlinguistik. Eine einführende Darstellung. Tübingen : Niemeyer, 2004.-- Inzwischen Neuauflage 2016, De Gruyter [Allen 1984] ALLEN , James: Towards a general theory of action and time. In: Artificial Intelligence 23 (1984), S. 67-90 [Ariel 2001] ARIEL , Mira: Accessibility theory: an overview. In: SANDERS , Ted (Hrsg.) ; SPOOREN , Wilbert (Hrsg.): Text representation: linguistic and psycholinguistic aspects. Amsterdam : John Benjamins, 2001, S. 29-88 [Asher u. Lascarides 2003] ASHER , Nicholas ; LASCARIDES , Alex: Logics of Conversation. Cambridge : Cambridge University Press, 2003 [Austin 1975] AUSTIN , John L.: How to do things with words. Cambridge / MA : Harvard University Press, 1975 [Bateman u. Rondhuis 1997] BATEMAN , John ; RONDHUIS , Klaas J.: „Coherence relations“: towards a general specification. In: Discourse Processes 24 (1997), Nr. 1, S. 3-50 [de Beaugrande u. Dressler 1981] BEAUGRANDE , Robert de ; DRESSLER , Wolfgang: Einführung in die Textlinguistik. Tübingen : Niemeyer, 1981 [Benz u. Jasinskaja 2017] BENZ , Anton ; JASINSKAJA , Katja: Questions Under Discussion: From Sentence to Discourse (Introdcution to the special issue). In: Discourse Processes 54 (2017), Nr. 3, S. 177-186 [Biber 1993] BIBER , Douglas: Using register-diversified corpora for general language studies. In: Computational Linguistics 19 (1993), Nr. 2, S. 219-241 [Biber u. Conrad 2009] BIBER , Douglas ; CONRAD , Susan: Register, Genre and Style. Cambridge : Cambridge University Press, 2009 [Bieler u. a. 2007] BIELER , Heike ; DIPPER , Stefanie ; STEDE , Manfred: Identifying formal and functional zones in film reviews. In: Proc. of the 8th SIGDIAL Workshop. Antwerpen, 2007 [Birner u. Ward 1998] BIRNER , B. ; WARD , G.: Information status and noncanonical word order in English. Philadelphia / Amsterdam : John Benjamins, 1998 [Brandt u. a. 1992] BRANDT , Margareta ; REIS , Marga ; ROSENGREN , Inger ; ZIMMERMANN , Ilse: Satztyp, Satzmodus und lllokution. In: ROSENGREN , Inger (Hrsg.): Satz und Illokution. Tübingen : Niemeyer, 1992, S. 1-90 [Brandt u. Rosengren 1992] BRANDT , Margareta ; ROSENGREN , Inger: Zur Illokutionsstruktur von Texten. In: Zeitschrift für Literaturwissenschaft und Linguistik 86 (1992), S. 9-51 [Brandt 1994] BRANDT , Margaretha: Subordination und Parenthese als Mittel der Informationsstrukturierung in Texten / Universität Lundt. 1994 (Arbeitsberichte Sprache und Pragmatik 32).-- Forschungsbericht [Braunmüller 1977] BRAUNMÜLLER , Kurt: Referenz und Pronominalisierung: zu den Deiktika und Proformen des Deutschen. Tübingen : Niemeyer, 1977 [Breindl u. a. 2015] BREINDL , Eva ; VOLODINA , Anna ; WASSNER , Ulrich H.: Handbuch der deutschen Konnektoren 2. Berlin / New York : Walter de Gruyter, 2015 [Breindl u. Wassner 2006] BREINDL , Eva ; WASSNER , Ulrich H.: Syndese vs. Asyndese. Konnektoren und andere Wegweiser für die Interpretation semantischer Relationen in Texten. In: BLÜHDORN , 206 Literaturverzeichnis Hardarik (Hrsg.) ; BREINDL , Eva (Hrsg.) ; WASSNER , Ulrich H. (Hrsg.): Text-Verstehen. Grammatik und darüber hinaus. Berlin / New York : Walter de Gruyter, 2006, S. 46-70 [Brennan u. a. 1987] BRENNAN , Susan ; FRIEDMAN , M. ; POLLARD , Carl: A centering approach to pronouns. In: Proceedings of the 25th Annual Meeting of the Assoc. for Computational Linguistics, Assoc. for Computational Linguistics, 1987, S. 155-162 [Brinker 2005] BRINKER , Klaus: Linguistische Textanalyse. 6. Auflage. Berlin : Erich Schmidt Verlag, 2005.-- Inzwischen 9. Auflage, 2018 [Bucher 1986] BUCHER , Hans-Jürgen: Pressekommunikation. Tübingen : Niemeyer, 1986 [Bühler 1982] BÜHLER , Karl: Sprachtheorie: Die Darstellungsfunktion der Sprache. Stuttgart : Fischer, 1982.-- (Originalausgabe: 1934) [Bußmann 2002] BUSSMANN , Hadumod: Lexikon der Sprachwissenschaft. Stuttgart : Kröner, 2002 [Carlson u. Marcu 2001] CARLSON , Lynn ; MARCU , Daniel: Discourse Tagging Reference Manual / Univ. of Southern California / ISI . 2001.-- Forschungsbericht [Carlson u. a. 2003] CARLSON , Lynn ; MARCU , Daniel ; OKUROWSKI , Mary E.: Building a Discourse-Tagged Corpus in the Framework of Rhetorical Structure Theory. In: KUPPEVELT , Jan van (Hrsg.) ; SMITH , Ronnie (Hrsg.): Current Directions in Discourse and Dialogue. Dordrecht : Kluwer, 2003 [Chiarcos 2010] CHIARCOS , Christian: Mental salience and grammatical form, Universität Potsdam, Diss., 2010 [Chiarcos 2011] CHIARCOS , Christian: The mental salience framework. In: CHIARCOS , Christian (Hrsg.) ; CLAUS , Berry (Hrsg.) ; GRABSKI , Michael (Hrsg.): Salience: Multidisciplinary Perspectives on its Function in Discourse. Berlin / New York : De Gruyter Mouton, 2011, S. 105-141 [Chiarcos u. a. 2011] CHIARCOS , Christian ; RITZ , Julia ; STEDE , Manfred: Querying and visualizing coreference annotation in multi-layer corpora. In: Proc. of the Eighth Discourse Anaphora and Anaphor Resolution Colloquium ( DAARC ). Faro / Portugal, 2011 [Cohen 1983] COHEN , Robin: A computational model for the analysis of arguments / Computer Systems Research Group, University of Toronto. Toronto, Canada, 1983.-- Forschungsbericht [Cook u. Bildhauer 2013] COOK , Philippa ; BILDHAUER , Felix: Identifying ‚aboutness topics‘: two annotation experiments. In: Dialogue and Discourse 4 (2013), Nr. 2, S. 118-141 [Daneš 1974] DANEŠ , František: Functional sentence perspective and the organization of the text. In: DANE š, František (Hrsg.): Papers on Functional Sentence Perspective. 1974, S. 106-128 [Das u. Taboada 2017] DAS , Debopam ; TABOADA , Maite: RST Signalling Corpus: A corpus of signals of coherence relations. In: Language Resources and Evaluation (2017). https: / / doi.org/ 10.1007/ s10579-017-9383-x.-- DOI https: / / doi.org/ 10.1007/ s10579-017-9383-x [van Dijk 1977] DIJK , Teun van: Text and Context. Explorations in the Semantics and Pragmatics of Discourse. London, New York : Klett, 1977 [van Dijk 1980] DIJK , Teun van: Textwissenschaft-- eine interdisziplinäre Einführung. Tübingen : Niemeyer, 1980 [Dimter 1981] DIMTER , Mathias: Textklassenkonzepte heutiger Alltagssprache. Tübingen : Niemeyer, 1981 [Dipper 2005] DIPPER , Stefanie: XML -based Stand-off Representation and Exploitation of Multi- Level Linguistic Annotation. In: ECKSTEIN , Rainer (Hrsg.) ; TOLKSDORF , Robert (Hrsg.): Proceedings of Berliner XML Tage, 2005, S. 39-50 [Dipper u. a. 2004] DIPPER , Stefanie ; GÖTZE , Michael ; STEDE , Manfred ; WEGST , Tillmann: ANNIS : A linguistic database for exploring information structure. In: Interdisciplinary Studies on Information Structure. 2004 ( ISIS Working papers of the SFB 632 (1)), S. 245-279 207 Literaturverzeichnis [Dowty 1986] DOWTY , David: The effects of aspectual class on the temporal structure of discourse: semantics or pragmatics? In: Linguistics and Philosophy 9 (1986), Nr. 1, S. 37-62 [Eberle 1991] EBERLE , Kurt: On representing the temporal structure of texts. In: HERZOG , Otthein (Hrsg.) ; ROLLINGER , Claus-Rainer (Hrsg.): Text Understanding in LILOG : Integrating Computational Linguistics and Artificial Intelligence. Berlin / Heidelberg : Springer, 1991, S. 313-341 [van Eemeren u. Grootendorst 2004] EEMEREN , Frans H. ; GROOTENDORST : A Systematic Theory of Argumentation: The Pragma-dialectical Approach. Cambridge : Cambridge University Press, 2004 [Egg u. Redeker 2010] EGG , Markus ; REDEKER , Gisela: How Complex is Discourse Structure? In: Proc. of the 7th Conference on International Language Resources and Evaluation ( LREC ). Malta, 2010 [Eggler 2006] EGGLER , Marcel: Argumentationsanalyse textlinguistisch. Tübingen : Niemeyer, 2006 [Eggs 2000] EGGS , Ekkehard: Vertextungsmuster Argumentation: Logische Grundlagen. In: BRINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 397-414 [Eisenberg 1989] EISENBERG , Peter: Grundriss der deutschen Grammatik. 2. Auflage. Stuttgart : Metzler, 1989.-- Inzwischen Neuauflage 2013 [Endriss u. a. 1998] ENDRISS , Ulrich ; KÜSSNER , Uwe ; STEDE , Manfred: Repräsentation zeitlicher Ausdrücke: die ‚Temporal Expression Language‘ / Technische Universität Berlin. 1998 (Verbmobil Memo 133).-- Forschungsbericht.-- Online verfügbar unter www.ling.uni-potsdam.de/ ~stede/ publications.html [Fabricius-Hansen 2000] FABRICIUS - HANSEN , Cathrine: Formen der Konnexion. In: BRINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 331-343 [Feilke 2000] FEILKE , Klaus: Die pragmatische Wende in der Textlinguistik. In: BRINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 64-82 [Figge 1971] FIGGE , Udo L.: Syntagmatik, Distribution und Text. In: STEMPEL , W.-D. (Hrsg.): Beiträge zur Textlinguistik. München, 1971, S. 161-181 [Freeman 2011] FREEMAN , James B.: Argument Structure: Representation and Theory. Springer, 2011 (Argumentation Library (18)) [Friedrich u. Palmer 2014] FRIEDRICH , Annemarie ; PALMER , Alexis: Centering Theory in natural text: a large-scale corpus study. In: Proceedings of the KONVENS Conference. Hildesheim, 2014 [Fries 1981] FRIES , Peter H.: On the status of theme in English: arguments from discourse. In: Forum Linguisticum 6 (1981), Nr. 1, S. 1-38 [Fritz 2017] FRITZ , Gerd: Dynamische Texttheorie. 2. Auflage. Gießen : Gießener Elektronische Bibliothek, 2017 [Frohning 2007] FROHNING , Dagmar: Kausalmarker zwischen Pragmatik und Kognition. Korpusbasierte Analysen zur Variation im Deutschen. Tübingen : Niemeyer, 2007 [Gansel u. Jürgens 2002] GANSEL , Christina ; JÜRGENS , Frank: Textlinguistik und Textgrammatik. Wiesbaden : Westdeutscher Verlag, 2002 [Givón 1983] GIV óN, T.: Topic continuity in discourse: an introduction. In: GIV óN, T. (Hrsg.): Topic continuity in discourse: A quantitative cross-linguistic study. Amsterdam : John Benjamins, 1983, S. 1-42 [Grabski u. Stede 2006] GRABSKI , Michael ; STEDE , Manfred: ‘bei‘: Intra-clausal coherence relations illustrated with a German preposition. In: Discourse Processes 41 (2006), Nr. 2, S. 195-219 [Grice 1975] GRICE , H. P.: Logic and Conversation. In: COLE , Peter (Hrsg.) ; MORGAN , Jerry L. (Hrsg.): Syntax and Semantics, Vol. 3. New York : Academic Press, 1975, S. 41-58 208 Literaturverzeichnis [Grimes 1975] GRIMES , Joseph: The Thread of Discourse. The Hague : Mouton, 1975 [Grosse 1976] GROSSE , Ernst U.: Text und Kommunikation. Stuttgart : Kohlhammer, 1976 [Grosz u. a. 1995] GROSZ , Barbara ; JOSHI , Aravind ; WEINSTEIN , Scott: Centering: A Framework for Modeling the Local Coherence of Discourse. In: Computational Linguistics 21 (1995), Nr. 2, S. 203-226 [Grosz u. Sidner 1986] GROSZ , Barbara ; SIDNER , Candace: Attention, Intentions, and the Structure of Discourse. In: Computational Linguistics 12 (1986), Nr. 3, S. 175-204 [Grote 2003] GROTE , Brigitte: Signaling coherence relations in text generation: A case study of German temporal discourse markers, Universität Bremen, Diss., 2003.-- Online verfügbar über elib.suub. uni-bremen.de / cocoon / diss / start [Gundel u. a. 1993] GUNDEL , J. ; HEDBERG , N. ; ZACHARSKI , R.: Cognitive status and the form of referring expressions in discourse. In: Language 69 (1993), Nr. 2, S. 274-307 [Gülich u. Raible 1977] GÜLICH , Elisabeth ; RAIBLE , Wolfgang: Überlegungen zu einer makrostrukturellen Textanalyse. In: DIJK , T. A. van (Hrsg.) ; PETÖ fi, J. S. (Hrsg.): Grammars and Descriptions. Berlin / New York : de Gruyter, 1977, S. 132-175 [Halliday 2004] HALLIDAY , M. A. K.: An introduction to functional grammar. 3. Auflage. London : Arnold, 2004 [Halliday u. Hasan 1989] HALLIDAY , M. A. K. ; HASAN , R.: Cohesion in English. London : Longman, 1989 [Hamp u. Feldweg 1997] HAMP , Birgit ; FELDWEG , Helmut: GermaNet-- a Lexical-Semantic Net for Germanc. In: Proceedings of the ACL workshop Automatic Information Extraction and Building of Lexical Semantic Resources for NLP Applications. Madrid, 1997 [Hartmann 1984] HARTMANN , Dietrich: Reliefgebung: Informationsvordergrund und Informationshintergrund in Texten als Problem von Textlinguistik und Stilistik. In: Wirkendes Wort 4 (1984), S. 305-323 [Hartmann 1968] HARTMANN , Peter: Textlinguistik als neue linguistische Teildisziplin. In: Replik 2 (1968), S. 2-7 [Harweg 1968] HARWEG , Roland: Pronomina und Textkonstitution. München : Fink, 1968 [Heinemann 2000] HEINEMANN , Wolfgang: Aspekte der Textsortendifferenzierung. In: BRINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 523-546 [Heinemann u. Viehweger 1991] HEINEMANN , Wolfgang ; VIEHWEGER , Dieter: Textlinguistik-- Eine Einführung. Tübingen : Niemeyer, 1991 [Helbig u. Buscha 2001] HELBIG , Gerhard ; BUSCHA , Joachim: Deutsche Grammatik-- ein Handbuch für den Ausländerunterricht. 16. Auflage. Leipzig : Langenscheidt / Verlag Enzyklopädie, 2001.-- Inzwischen Neuauflage 2013, Klett Verlag [Hellwig 1984] HELLWIG , Peter: Grundzüge einer Theorie des Textzusammenhangs. In: ROTH- KEGEL , A. (Hrsg.) ; SANDIG , B. (Hrsg.): Text-- Textsorten-- Semantik. Hamburg : Buske, 1984, S. 51-79 [Henrich u. Hinrichs 2010] HENRICH , Verena ; HINRICHS , Erhard: GernEdiT-- The GermaNet Editing Tool. In: Proceedings of the International Conference on Language Resources and Evaluation ( LREC ). Valletta, Malta, 2010, S. 2228-2235 [Heringer 1974] HERINGER , Hans J.: Praktische Semantik. Stuttgart : Klett, 1974 [Hobbs 1979] HOBBS , Jerry: Coherence and coreference. In: Cognitive Science 3 (1979), S. 67-90 [Hoey 1991] HOEY , Michael: Patterns of Lexis in Text. Oxford : Oxford University Press, 1991 [Hoffmann 2000] HOFFMANN , Ludger: Thema, Themenentfaltung, Makrostruktur. In: BRINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 344-356 209 Literaturverzeichnis [Hollingsworth u. Teufel 2005] HOLLINGSWORTH , Bill ; TEUFEL , Simone: Human Annotation of Lexical Chains: Coverage and Agreement Measures. In: Proc. of the Workshop ELECTRA : Methodologies and Evaluation of Lexical Cohesion Techniques in Real-world Applications, SIGIR . Salvador, Brasilien, 2005 [Hudson u. a. 1986] HUDSON , Susan ; TANENHAUS , Michael ; DELL , Gary: The effect of the Discourse Center on the local coherence of a discourse. In: Proceedings of the Eighth Annual Conference of the Cognitive Science Society, Lawrence Erlbaum, 1986, S. 96-101 [Hundsnurscher 1984] HUNDSNURSCHER , Franz: Theorie und Praxis der Textklassifikation. In: ROSENGREN , Inger (Hrsg.): Sprache und Pragmatik. Malmö, 1984, S. 75-97 [Isenberg 1974] ISENBERG , Horst: Texttheorie und Gegenstand der Grammatik. Berlin : Akademie der Wissenschaften der DDR , Zentralinstitut für Sprachwissenschaft, 1974 (Linguistische Studien-- Arbeitsberichte) [Jacobs 2001] JACOBS , Joachim: The dimensions of Topic-Comment. In: Linguistics 39 (2001), Nr. 4, S. 641-681 [Kamp u. Reyle 1993] KAMP , Hans ; REYLE , Uwe: From Discourse to Logic. Dordrecht : Kluwer, 1993 [Kehler 2002] KEHLER , Andrew: Coherence, Reference, and the Theory of Grammar. Stanford : CSLI Publications, 2002 [Kehler 2004] KEHLER , Andrew: Discourse Coherence. In: HORN , Laurence R. (Hrsg.) ; WARD , Gregory (Hrsg.): Handbook of Pragmatics. Oxford : Basil Blackwell, 2004 [Kehler u. Rohde 2013] KEHLER , Andrew ; ROHDE , Hannah: A probabilistic reconciliation of coherence-driven and centering-driven theories of pronoun interpretation. In: Theoretical Linguistics 39 (2013), Nr. 1-2, S. 1-37 [Klein 2011] KLEIN , Josef: Die konklusiven Sprechhandlungen. 2. Auflage. Berlin : De Gruyter, 2011 [Klein u. von Stutterheim 1992] KLEIN , Wolfgang ; STUTTERHEIM , Christiane von: Textstruktur und referentielle Bewegung. In: Textlinguistik. Zeitschrift für Literaturwissenschaft und Linguistik. Göttingen : Vandenhoeck & Ruprecht, 1992, S. 67-92 [Knott 1996] KNOTT , Alistair: A Data-Driven Methodology for Motivating a Set of Coherence Relations, University of Edinburgh, Diss., 1996 [Knott u. Dale 1994] KNOTT , Alistair ; DALE , Robert: Using linguistic phenomena to motivate a set of coherence relations. In: Discourse Processes 18 (1994), Nr. 1, S. 35-62 [Knott u. a. 2001] KNOTT , Alistair ; OBERLANDER , Jon ; O‘ DONNELL , Mick ; MELLISH , Chris: Beyond Elaboration: The interaction of relations and focus in coherent text. In: SANDERS , T. (Hrsg.) ; SCHILPEROORD , J. (Hrsg.) ; SPOOREN , W. (Hrsg.): Text representation: linguistic and psycholinguistic aspects. Amsterdam : John Benjamins, 2001, S. 181-196 [Knott u. Sanders 1998] KNOTT , Alistair ; SANDERS , Ted: The Classification of Coherence Relations and their Linguistic Markers: An Exploration of Two Languages. In: Journal of Pragmatics 30 (1998), S. 135-175 [Konerding 2000] KONERDING , Klaus-Peter: Komplemente, Adjunkte und Informationsstruktur. Aspekte der Interdependenz von Lexik und Grammatik bei der thematischen Organisation von Texten. In: WARNKE , Ingo (Hrsg.): Schnittstelle Text-- Diskurs. Frankfurt : Lang, 2000, S. 149-162 [Krasavina u. a. 2007] KRASAVINA , Olga ; CHIARCOS , Christian ; ZALMANOV , Dimitri: Aspects of topicality in the use of demonstrative expressions in German, English and Russian. In: Proc. of the 6th Discourse anaphora and anaphor resolution colloquium ( DAARC ). Lagos, Portugal, 2007, S. 53-58 [Krause u. Zeldes 2016] KRAUSE , Thomas ; ZELDES , Amir: ANNIS 3: A new architecture for generic corpus query and visualization. In: Digital Scholarship in the Humanities 31 (2016), Nr. 1, S. 118-131 210 Literaturverzeichnis [Kruijff-Korbayová u. Steedman 2003] KRUIJFF - KORBAYOV á, Ivana ; STEEDMAN , Mark: Discourse and Information Structure. In: Journal of Logic, Language and Information: Special Issue on Discourse and Information Structure 12 (2003), Nr. 3, S. 249-259 [Krüger u. a. 2017] KRÜGER , Katarina ; LUKOWIAK , Anna ; SONNTAG , Jonathan ; STEDE , Manfred: Classifying News versus Opinions in Newspapers: Linguistic Features for Domain Independence. In: Natural Language Enginnering 23 (2017), Nr. 5, S. 687-707 [Kunz u. a. 2017] KUNZ , Kerstin ; DEGAETANO - ORTLIEB , Stefania ; LAPSHINOVA - KOLTUNSKI , Ekaterina ; MENZEL , Katrin ; STEINER , Erich: English-German contrasts in cohesion and implications for translation. In: SUTTER , Gert D. (Hrsg.) ; LEFER , Marie-Aude (Hrsg.) ; DELAERE , Isabelle (Hrsg.): Empirical Translation Studies: New Methodological and Theoretical Traditions. De Gruyter Mouton, 2017 (Trends in Linguistics. Studies and Monographs [Ti LSM ] 300), S. 265-311 [Küper 1984] KÜPER , Christoph: Zum sprechaktbezogenen Gebrauch der Kausalverknüpfer ‚denn und ‚weil‘. In: Linguistische Berichte 92 (1984), S. 15-30 [Lang 2000] LANG , Ewald: Adversative connectors on distinct levels of discourse: a re-examination of Eve Sweetser‘s three-level approach. In: COUPER - KUHLEN , E. (Hrsg.) ; KORTMANN , B. (Hrsg.): Cause-- Condition-- Concession-- Contrast. Berlin : Mouton de Gruyter, 2000, S. 235-256 [Lemnitzer u. Zinsmeister 2015] LEMNITZER , Lothar ; ZINSMEISTER , Heike: Korpuslinguistik-- Eine Einführung. 3. Auflage. Narr : Tübingen, 2015 [Liedtke 1998] LIEDTKE , Frank: Grammatik der Illokution. Tübingen : Narr, 1998 [Linke u. a. 1994] LINKE , Angelika ; NUSSBAUMER , Markus ; PORTMANN , Paul: Studienbuch Linguistik. Tübingen : Niemeyer, 1994 [Lötscher 1987] LÖTSCHER , Andreas: Text und Thema. Studien zur thematischen Konstituenz von Texten. Tübingen : Niemeyer, 1987 [Lötscher 1991] LÖTSCHER , Andreas: Thematische Textorganisation in deskriptiven Texten als Selektions-/ Linearisierungsproblem. In: BRINKER , Klaus (Hrsg.): Aspekte der Textlinguistik. Hildesheim : Georg Olms, 1991, S. 73-105 [Lutzeier 1981] LUTZEIER , Peter R.: Wort und Feld. Wortsemantische Fragestellungen unter besonderer Berücksichtigung des Wortfeldbegriffs. Tübingen : Niemeyer, 1981 [Mamprin u. Stede 2016] MAMPRIN , Sara ; STEDE , Manfred: Aboutness Topik. In: STEDE , Manfred (Hrsg.): Handbuch Textannotation: Potsdamer Kommentarkorpus 2.0. Universitätsverlag Potsdam, 2016 (Potsdam Cognitive Science Series (8)), S. 23-44 [Mani u. Pustejovsky 2004] MANI , Inderjeet ; PUSTEJOVSKY , James: Temporal discourse models for narrative structure. In: Proceedings of the ACL Workshop on Discourse Annotation. Barcelona, 2004 [Mani u. a. 2005] MANI , Inderjeet ; PUSTEJOVSKY , James ; GAIZAUSKAS , Robert: The Language of Time: A Reader. Oxford : Oxford University Press, 2005 [Mann u. Thompson 1988] MANN , William ; THOMPSON , Sandra: Rhetorical Structure Theory: Towards a Functional Theory of Text Organization. In: TEXT 8 (1988), S. 243-281 [Marcu 2000] MARCU , Daniel: The theory and practice of discourse parsing and summarization. Cambridge / MA : MIT Press, 2000 [Martin 1992] MARTIN , James R.: English text: system and structure. Philadelphia / Amsterdam : John Benjamins, 1992 [Mathesius 1939] MATHESIUS , Vilém: O tak zvaném aktuálním členěni větném. In: Slovo a slovesnost 5 (1939), S. 171-174 [Matthiessen u. Thompson 1988] MATTHIESSEN , Christian ; THOMPSON , Sandra: The structure of discourse and ‚subordination‘. In: HAIMAN , J. (Hrsg.) ; THOMPSON , S. (Hrsg.): Clause combining in grammar and discourse. Amsterdam : John Benjamins, 1988, S. 275-329 211 Literaturverzeichnis [Mavridou u. a. 2015] MAVRIDOU , Kleio-Isidora ; FRIEDRICH , Annemarie ; PEATE SØRENSEN , Melissa ; PALMER , Alexis ; PINKAL , Manfred: Linking discourse modes and situation entity types in a cross-linguistic corpus study. In: Proceedings of the First Workshop on Linking Computational Models of Lexical, Sentential and Discourse-level Semantics. Lisbon, Portugal : Association for Computational Linguistics, September 2015, 12-21 [McElholm 2002] MCELHOLM , Dermot: Text and Argumentation in English for Science and Technology. Frankfurt : Peter Lang, 2002 [Miller 1995] MILLER , George A.: WordNet: A Lexical Database for English. In: Communications of the ACM 38 (1995), Nr. 11, S. 39-41 [Mistrik 1973] MISTRIK , Jozef: Exakte Typologie von Texten. München : Otto Sagner, 1973 [Moore u. Pollack 1992] MOORE , Johanna ; POLLACK , Martha: A Problem for RST : The need for Multi-Level Discourse Analysis. In: Computational Linguistics 18 (1992), Nr. 4, S. 537-544 [Morgenthaler 1980] MORGENTHALER , Erwin: Kommunikationsorientiere Textgrammatik. Düsseldorf : Schwann, 1980 (Schriften des Instituts für deutsche Sprache 51) [Morris u. Hirst 1991] MORRIS , Jane ; HIRST , Graeme: Lexical Cohesion Computed by Thesaural Relations as an Indicator of the Structure of Text. In: Computational Linguistics 17 (1991), Nr. 1, S. 21-48 [Motsch 1987] MOTSCH , Wolfgang: Zur Illokutionsstruktur von Feststellungtexten. In: Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung 40 (1987), Nr. 1, S. 45-67 [Motsch 1996] MOTSCH , Wolfgang: Ebenen der Textstruktur. Tübingen : Niemeyer, 1996 [Müller u. Strube 2006] MÜLLER , Christoph ; STRUBE , Michael: Multi-level Annotation of Linguistic Data with MMAX 2. In: BRAUN , S. (Hrsg.) ; KOHN , K. (Hrsg.) ; MUKHERJEE , J. (Hrsg.): Corpus Technology and Language Pedagogy. Frankfurt : Peter Lang, 2006, S. 197-214 [Muller u. a. 2012] MULLER , P. ; VERGEZ , M. ; PREVOT , L. ; ASHER , N. ; BENAMARA , F. ; BRAS , M. ; LE DRAOULEC , A. ; VIEU , L.: Manuel d‘annotation en relations de discours du projet ANNO- DIS / Carnets de Grammaire, CLLE - ERSS . 2012.-- Forschungsbericht [Nussbaumer 1991] NUSSBAUMER , Markus: Was Texte sind und wie sie sein sollen. Tübingen : Niemeyer, 1991 [Pasch 1989] PASCH , Renate: Adverbialsätze-- Kommentarsätze-- Adjungierte Sätze. Eine Hypothese zu den Typen der Bedeutungen von ‚weil‘, ‚da‘ und ‚denn‘. In: MOTSCH , Wolfgang (Hrsg.): Wortstruktur und Satzstruktur. Berlin : Akademie der Wissenschaften der DDR , 1989 (Linguistische Studien des ZISW : Reihe A-- Arbeitsberichte 194), S. 141-158 [Pasch u. a. 2003] PASCH , Renate ; BRAUSSE , Ursula ; BREINDL , Eva ; WASSNER , Ulrich H.: Handbuch der deutschen Konnektoren. Berlin / New York : Walter de Gruyter, 2003 [Paul 1975] PAUL , Herrmann: Prinzipien der Sprachgeschichte. 8. Auflage; Originalausgabe: 1880. Tübingen : Niemeyer, 1975 [Peldszus u. Stede 2016a] PELDSZUS , Andreas ; STEDE , Manfred: An annotated corpus of argumentative microtexts. In: MOHAMMED , Dima (Hrsg.) ; LEWINSKI , Marcin (Hrsg.): Argumentation and Reasoned Action: Proceedings of the 1st European Conference on Argumentation, Lisbon 2015 / Vol. 2. London : College Publications, 2016, S. 801-816 [Peldszus u. Stede 2016b] PELDSZUS , Andreas ; STEDE , Manfred: Argumentationsstruktur. In: STE- DE , Manfred (Hrsg.): Handbuch Textannotation: Potsdamer Kommentarkorpus 2.0. Universitätsverlag Potsdam, 2016 (Potsdam Cognitive Science Series (8)), 185-207 [Poesio u. a. 2004] POESIO , Massimo ; STEVENSON , Rosemary ; EUGENIO , Barbara di ; HITZE- MAN , Janet: Centering: a parametric theory and its instantiations. In: Computational Linguistics 30 (2004), Nr. 3, S. 309-363 212 Literaturverzeichnis [Polanyi 1988] POLANYI , Livia: A formal model of the structure of discourse. In: Journal of Pragmatics 12 (1988), S. 601-638 [Pradhan u. a. 2013] PRADHAN , Sameer ; MOSCHITTI , Alessandro ; XUE , Nianwen ; NG , Hwee T. ; BJÖRKELUND , Anders ; URYUPINA , Olga ; ZHANG , Yuchen ; ZHONG , Zhi: Towards Robust Linguistic Analysis using OntoNotes. In: Proceedings of the Seventeenth Conference on Computational Natural Language Learning. Sofia, Bulgaria : Association for Computational Linguistics, August 2013, 143-152 [Prasad u. a. 2008] PRASAD , R. ; DINESH , N. ; LEE , A. ; MILTSAKAKI , E. ; ROBALDO , L. ; JOSHI , A. ; WEBBER , B.: The Penn Discourse Treebank 2.0. In: Proc. of the 6th International Conference on Language Resources and Evaluation ( LREC ). Marrakech, Morocco, 2008 [Prince 1981] PRINCE , Ellen F.: Towards a taxonomy of given-new information. In: COLE , P. (Hrsg.): Radical pragmatics. New York : Academic Press, 1981, S. 223-255 [Rambow 1993] RAMBOW , Owen: Pragmatic aspects of scrambling and topicalisation in German. In: Proceedings of the IRCS Workshop on Centering in Discourse. Univ. of Pennsylvania, 1993 [Ramm u. Villiger 1995] RAMM , Wiebke ; VILLIGER , Claudia: Global text organization and sentence-grammatical realization / Universität des Saarlandes. 1995 ( CLAUS Report 61).-- Forschungsbericht [Redeker 1990] REDEKER , Gisela: Ideational and pragmatic markers of discourse structure. In: Journal of Pragmatics 14 (1990), S. 367-381 [Rehm 2007] REHM , Georg: Hypertextsorten: Definition-- Struktur-- Klassifikation. Norderstedt : Books on Demand, 2007.-- Auch: Diss., Justus-Liebig-Universität Gießen, 2005; online verfügbar über geb.uni-giessen.de [Reinhart 1983] REINHART , Tanya: Coreference and bound anaphora: A restatement of the anaphora questions. In: Linguistics and Philosophy 6 (1983), S. 47-88 [Riester u. Baumann 2017] RIESTER , Arndt ; BAUMANN , Stefan: The RefLex scheme-- annotation guidelines / Universität Stuttgart. Version: 2017. http: / / dx.doi.org/ http: / / dx.doi.org/ 10.18419/ opus- 9011. 2017 (SinSpeC-- Working Papers of the SFB 732 Incremental Specification in Context 14).-- Forschungsbericht [Riester u. a. 2018] RIESTER , Arndt ; BRUNETTI , Lisa ; KUTHY , Kordula D.: Annotation guidelines for Questions under Discussion and information structure. In: ADAMOU , Evangelia (Hrsg.) ; HAUDE , Katharina (Hrsg.) ; VANHOVE , Martine (Hrsg.): Information Structure in Lesser-Described Languages: Studies in Syntax and Prosody. Amsterdam : John Benjamins, 2018.-- (Im Erscheinen) [Rosch u. Mervis 1975] ROSCH , Eleanor ; MERVIS , Carolyn: Family resemblances: Studies in the internal structure of categories. In: Cognitive Psychology 7 (1975), S. 573-605 [Saddock 2005] SADDOCK , Jerrold: Speech Acts. In: HORN , Laurence (Hrsg.) ; WARD , Gregory (Hrsg.): The Handbook of Pragmatics. New York : Wiley, 2005 [Sanders u. a. 1992] SANDERS , Ted ; SPOOREN , Wilbert ; NOORDMAN , Leo: Toward a taxonomy of coherence relations. In: Discourse Processes 15 (1992), S. 1-35 [Sandig 1972] SANDIG , Barbara: Zur Differenzierung gebrauchssprachlicher Textsorten im Deutschen. In: GÜLICH , Elisabeth (Hrsg.) ; RAIBLE , Wolfgang (Hrsg.): Textsorten-- Differenzierungskriterien aus linguistischer Sicht. Frankfurt / Main : Athenäum, 1972, S. 113-124 [Sandig 2000] SANDIG , Barbara: Text als protoypisches Konzept. In: MANGASSER - WAHL , Martina (Hrsg.): Prototypentheorie in der Linguistik. Tübingen : Stauffenburg, 2000, S. 93-112 [Sassen 2005] SASSEN , Claudia: Grenzen des Right Frontier Constraint im Chat. In: Chat-Kommunikation in Beruf, Bildung und Medien: Konzepte-- Werkzeuge-- Anwendungsfelder. Stuttgart : ibidem, 2005, S. 303-321 213 Literaturverzeichnis [Sauer u. Lüdeling 2016] SAUER , Simon ; LÜDELING , Anke: Flexible multi-layer spoken dialogue corpora. In: International Journal of Corpus Linguistics 21 (2016), Nr. 3, S. 419-438. http: / / dx.doi. org/ http: / / dx.doi.org/ 10.1075/ ijcl.21.3.06sau.-- DOI http: / / dx.doi.org/ 10.1075/ ijcl.21.3.06sau [Schauer u. Hahn 2001] SCHAUER , Holger ; HAHN , Udo: Anaphoric cues for coherence relations. In: ANGELOVA , Galia (Hrsg.): Proc. of the Conference on Recent Advances in Natural Language Processing ( RANLP ). 2001, S. 228-234 [Schmitt 2000] SCHMITT , Holger: Zur Illokutionsanalyse monologischer Texte. Frankfurt : Peter Lang, 2000 [Schneider u. Raue 1996] SCHNEIDER , W. ; RAUE , P.: Handbuch des Journalismus. Hamburg : Rowohlt, 1996 [Schröder 2003] SCHRÖDER , Thomas: Die Handlungsstruktur von Texten. Tübingen : Narr, 2003 [Schwarz 2000] SCHWARZ , Monika: Indirekte Anaphern in Texten: Studien zur domänengebundenen Referenz und Kohärenz im Deutschen. Tübingen : Niemeyer, 2000 [Searle 1971] SEARLE , John R.: Sprechakte. Frankfurt / Main : Suhrkamp, 1971 [Searle 1980] SEARLE , John R.: Eine Klassifikation der Illokutionsakte. In: KUSSMAUL , Paul (Hrsg.): Sprechakttheorie: Ein Reader. Wiesbaden : Athenaion, 1980, S. 82-108 [Smith 2003] SMITH , Carlota: Modes of discourse. The local structure of texts. Cambridge : Cambridge University Press, 2003 [Stab u. Gurevych 2014] STAB , Christian ; GUREVYCH , Iryna: Annotating Argument Components and Relations in Persuasive Essays. In: TSUJII , Junichi (Hrsg.) ; HAJIC , Jan (Hrsg.): Proceedings of the 25th International Conference on Computational Linguistics ( COLING 2014), Dublin City University and Association for Computational Linguistics, 2014, S. 1501-1510 [Stede 2004] STEDE , Manfred: Kontrast im Diskurs. In: BLÜHDORN , H. (Hrsg.) ; BREINDL , E. (Hrsg.) ; WASSNER , H. U. (Hrsg.): Brücken schlagen. Grundlagen der Konnektorensemantik. Berlin : Walter de Gruyter, 2004, S. 255-286 [Stede 2008] STEDE , Manfred: RST revisited: disentangling nuclearity. In: FABRICIUS - HANSEN , Cathrine (Hrsg.) ; RAMM , Wiebke (Hrsg.): ‚Subordination‘ versus ‚coordination‘ in sentence and text-- from a cross-linguistic perspective. Amsterdam : John Benjamins, 2008 [Stede 2016a] STEDE , Manfred: Handbuch Textannotation: Potsdamer Kommentarkorpus 2.0. Universitätsverlag Potsdam, 2016 (Potsdam Cognitive Science Series (8)). https: / / publishup.uni-potsdam. de/ frontdoor/ index/ index/ docId/ 8276 [Stede 2016b] STEDE , Manfred: Das Potsdamer Kommentarkorpus. In: GIESSEN , Hans W. (Hrsg.) ; LENK , Hartmut E. (Hrsg.): Persuasionsstile in Europa II . Hildesheim : Olms, 2016, S. 177-202 [Stede u. a. 2016a] STEDE , Manfred ; AFANTENOS , Stergos ; PELDSZUS , Andreas ; ASHER , Nicholas ; PERRET , Jérémy: Parallel Discourse Annotations on a Corpus of Short Texts. In: Proceedings of the International Conference on Language Resources and Evaluation ( LREC ). Portoroz, 2016 [Stede u. Heintze 2004] STEDE , Manfred ; HEINTZE , Silvan: Machine-assisted rhetorical structure annotation. In: Proceedings of the 20th International Conference on Computational Linguistics. Geneva, 2004, S. 425-431 [Stede u. a. 2016b] STEDE , Manfred ; MAMPRIN , Sara ; PELDSZUS , Andreas: Diskurssegmentierung. In: STEDE , Manfred (Hrsg.): Handbuch Textannotation: Potsdamer Kommentarkorpus 2.0. Universitätsverlag Potsdam, 2016 (Potsdam Cognitive Science Series (8)), S. 89-109 [Stede u. Neumann 2014] STEDE , Manfred ; NEUMANN , Arne: Potsdam Commentary Corpus 2.0: Annotation for Discourse Research. In: Proceedings of the International Conference on Language Resources and Evaluation ( LREC ). Reikjavik, 2014, S. 925-929 214 Literaturverzeichnis [Steger 1983] STEGER , Hugo: Über Textsorten und andere Textklassen. In: Textsorten und literarische Gattungen. Berlin : E. Schmidt, 1983, S. 25-67.-- (Dokumentation des Germanistentages in Hamburg) [Strube u. Hahn 1996] STRUBE , Michael ; HAHN , Udo: Functional centering. In: Proceedings of the 34th Annual Meeting of the Assoc. for Computational Linguistics, Assoc. for Computational Linguistics, 1996, S. 270-277 [von Stutterheim 1994] STUTTERHEIM , Christiane von: Quaestio und Textaufbau. In: KORNADT , H. (Hrsg.) ; GRABOWSKI , J. (Hrsg.) ; MANGOLD - ALLWINN , R. (Hrsg.): Sprache und Kognition. Heidelberg : Spektrum, 1994, S. 251-272 [Swales 1990] SWALES , John M.: Genre analysis: English in academic and research settings. Cambridge : Cambridge University Press, 1990 [Sweetser 1990] SWEETSER , Eve: From etymology to pragmatics. Cambridge : Cambridge University Press, 1990 [Taboada u. Mann 2006a] TABOADA , Maite ; MANN , William: Applications of Rhetorical Structure Theory. In: Discourse Studies 8 (2006), Nr. 4, S. 567-588 [Taboada u. Mann 2006b] TABOADA , Maite ; MANN , William: Rhetorical Structure Theory: Looking back and moving ahead. In: Discourse Studies 8 (2006), Nr. 4, S. 423-459 [Teufel u. a. 2009] TEUFEL , Simone ; SIDDHARTHAN , Advaith ; BATCHELOR , Colin: Towards discipline-independent argumentative zoning: evidence from chemistry and computational linguistics. In: Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing: Volume 3, Association for Computational Linguistics, 2009, S. 1493-1502 [Toulmin 1958] TOULMIN , Stephen: The Uses of Argument. Cambridge : Cambridge University Press, 1958 [Tuggener 2016] TUGGENER , Don: Incremental Coreference Resolution for German, Universität Zürich, Diss., 2016 [Umbach 2001] UMBACH , Carla: Contrast and contrastive topic. In: Proceedings of the ESSLLI 2001 Workshop on Information Structure, Discourse Structure and Discourse Semantics. Helsinki, 2001 [Vater 1991] VATER , Heinz: Referenzrelationen in Texten. In: BRINKER , Klaus (Hrsg.): Aspekte der Textlinguistik. Hildesheim : Olms, 1991, S. 19-54 [Viehweger 1989] VIEHWEGER , D.: Coherence-- Interaction of Modules. In: HEYDRICH , Wolfgang (Hrsg.) ; NEUBAUER , F. (Hrsg.) ; PETÖFI , János S. (Hrsg.) ; SÖZER , Emel (Hrsg.): Connexity and Coherence. Analysis of Text and Discourse. Berlin / New York : De Gruyter, 1989, S. 257-274 [Virtanen 1992] VIRTANEN , Tuija: Issues of text typology: narrative-- a ‚basic‘ type of text? In: TEXT 12 (1992), Nr. 2, S. 293-310 [Walker u. a. 1998] WALKER , Marilyn ; JOSHI , Aravind ; PRINCE , Ellen: Centering in Discourse. Oxford : Oxford University Press, 1998 [Webber 1988] WEBBER , Bonnie: Tense as discourse anaphora. In: Computational Linguistics 14 (1988), Nr. 2, S. 61-73 [Webber u. a. 2016] WEBBER , Bonnie ; PRASAD , Rashmi ; LEE , Alan ; JOSHI , Aravind: A Discourse-Annotated Corpus of Conjoined VP s. In: Proceedings of the 10th Linguistic Annotation Workshop. Berlin : Association for Computational Linguistics, 2016, 22-31 [Webber u. a. 2003] WEBBER , Bonnie ; STONE , Matthew ; JOSHI , Aravind ; KNOTT , Alistair: Anaphora and Discourse Structure. In: Computational Linguistics 29 (2003), Nr. 4, S. 545-587 [Weinrich 1964] WEINRICH , Harald: Tempus. Besprochene und erzählte Welt. Stuttgart : Kohlhammer, 1964 215 Literaturverzeichnis [Weinrich 2005] WEINRICH , Harald: Textgrammatik der deutschen Sprache. 3. Auflage. Hildesheim : Georg Olms, 2005 [Werlich 1975] WERLICH , Egon: Typologie der Texte. Heidelberg : Quelle und Meyer, 1975 [Wolf u. Gibson 2005] WOLF , Florian ; GIBSON , Edward: Representing discourse coherence: a corpus-based study. In: Computational Linguistics 31 (2005), Nr. 2, S. 249-287 [Wunderlich 1980] WUNDERLICH , Dieter: Arbeitsbuch Semantik. Königstein : Athenäum, 1980 [Zeldes 2017a] ZELDES , Amir: A Distributional View of Discourse Encapsulation: Multifactorial Prediction of Coreference Density in RST . In: Proceedings of the 6th Workshop on Recent Advances in RST and Related Formalisms at INLG . Santiago de Compostela, 2017 [Zeldes 2017b] ZELDES , Amir: The GUM Corpus: Creating Multilayer Resources in the Classroom. In: Language Resources and Evaluation 51 (2017), S. 581-612 [Zifonun 2000] ZIFONUN , Gisela: Textkonstitutive Funktionen von Tempus, Modus und Genus Verbi. In: BRINKER , Klaus (Hrsg.): Text- und Gesprächslinguistik Bd. 16. Berlin : Walter de Gruyter, 2000, S. 315-330 217 Index Index Aboutness-Topik 101 , 105 Aktionsart 108 Akzeptabilität 34 Anapher 65 , 66 , 68 , 69 , 70 , 202 Annotationsrichtlinien 199 Antezedens 69 Argumentation 53 Argumentationsstruktur 141 , 142 , 144 , 198 Freeman-Schema 142 , 144 Toulmin-Schema 141 Artikel 25 Aspekt 108 Asyndetische Verknüpfung 33 BBridging 67 , 68 , 69 CCentering 74 , 75 , 76 , 78 , 85 ConnAnno-Annotationswerkzeug 172 DDefinitheit 25 , 66 , 67 Discourse Lexicalized Tree Adjoin Grammar (D-LTAG) 187 Discourse Segment Purpose (DSP) 121 , 122 , 124 , 131 Diskursgegenstand 32 , 63 , 64 , 66 , 68 , 69 , 70 , 71 , 74 , 88 Aktivierung 81 , 82 , 85 Zugänglichkeit 80 , 81 EElementary Discourse Unit (EDU) 121 , 124 , 126 , 128 , 136 , 149 , 150 , 158 , 159 , 176 , 185 , 186 Ellipse 26 Entity chains 192 Ereignis 67 , 107 , 110 temporale Abfolge 107 , 108 , 110 EXMARaLDA 105 FFaktorenanalyse 49 Filmrezension (Textsorte) 52 Fokus-Hintergrund Gliederung 103 GGECCo Korpus 36 , 105 Given/ New 79 HHauptinformation 93 , 94 IIkonizitätsprinzip 92, 110, 129 Illoc. Force Ind. Device (IFID) 153 , 154 , 156 , 157 Illokution 119 , 120 , 121 , 152 , 156 , 157 , 168 , 169 , 170 Deklaration 132 Direktivum 132 , 133 Estimativum 133 Evaluativum 133 Expressivum 132 Feststellung (Taxonomie) 133 , 134 , 135 Identifikativum 133 Kommissivum 132 Relationatum 133 Reportivum 133 Repräsentativum 132 Segmentierung 129 Sequenzierung 128 Stützung 126 , 127 , 128 , 129 , 201 Typisierung 129 , 130 , 131 , 132 , 133 , 134 , 135 Illokutionsstruktur 126 , 127 , 128 , 129 , 198 Illokutive Handlungen 129 Informationsstruktur 101 Informativität 34 Inhaltszone 52 , 53 Intention 183 Intentionale Struktur 121 , 122 , 124 Intentionalität 34 , 35 Intertextualität 34 KKatapher 65 Kohärenz 30 global 31 , 32 lokal 31 , 175 Kohärenzrelation 30 , 31 , 151 , 164 , 165 , 176 , 177 , 178 , 180 , 183 , 185 , 186 , 187 Antithesis 182 Contrast 182 Dekomposition 178 , 179 Evidence 183 Explanation 178 218 Index nebenordnend 187 , 189 unterordnend 187 , 189 Kohäsion 25 , 26 , 27 Kommentar (Textsorte) 53 , 54 kommunikative Gewichtung 94 Kommunikative Gewichtung 93 Konnektor 27 , 33 , 177 , 187 , 191 Ambiguität 162 , 167 Definition 160 Ersetzungstest 165 , 180 Präsupposition 169 Semant. Klassifikation 163 , 164 , 165 , 166 Synt. Klassifikation 160 , 161 Vagheit 167 Verknüpfungsebene 168 , 169 , 170 Koreferenz 25 , 32 , 65 , 67 , 69 Llexikalische Kette 30 Lexikalische Kette 95 , 105 Linearisierungsstrategie 91 , 92 MMakrostruktur 89 , 90 Mehrebenen-Annotation 17 , 199 Metafunction (syst.-fkt. Gr.) 99 MMAX2 Software 83 Modalverb 157 Modus 27 NNachricht (Textsorte) 54 , 91 Nebeninformation 93 , 94 Nuklearität 182 , 183 , 186 , 202 OOntonotes Korpus 84 Organon-Modell 39 PPenn Discourse Treebank 164 , 171 , 176 , 180 , 193 Performativ 118 Performative Formel 154 performatives Verb 154 Performatives Verb 131 , 154 Potsdamer Kommentarkorpus 15 , 53 , 172 , 193 Prädikation 88 Pragmatik 119 Pro-Form 26 Pronomina 23 , 63 , 75 , 78 Pronominaladverb 161 Proposition 88 , 90 , 178 Prototypikalität eines Textes 34 , 35 , 56 Psychologisches Subjekt 101 QQuaestio 93 , 94 , 103 Quantitative Analyse 49 Question under Discussion (QUD) 103 RReferenz 64 , 66 , 67 , 68 , 88 Referenzielle Kette 70 , 71 , 72 , 73 Referenzieller Ausdruck 23 , 69 Referenzielle Struktur 63 , 66 , 72 , 73 , 197 Referenz-Matrix 73 Register 44 Rekurrenz 25 , 34 Reliefgebung 93 Rhetorical Structure Theory (RST) 31 , 180 , 181 , 183 , 185 , 186 , 187 , 191 , 200 , 202 Rhetorische Struktur 175 Right Frontier Constraint 189 , 190 RST Discourse Treebank 193 RSTTool 193 , 194 SSatzart 154 Segmented Disc. Repres. Theory (SDRT) 177 , 180 , 187 , 190 , 191 Situationalität 34 , 35 Sprechakt Illokution 118 Lokution 118 , 119 Perlokution 118 Sprechhandlung 117 , 120 Standoff-Annotation 17 Substitution 25 Systemisch-Funktionale Grammatik 99 TTemporale Struktur 110 , 112 , 114 , 198 Temporal Expr. Language 112 , 114 Tempus 27 , 108 Text Etymologie 13 Layout 55 Segmentierung 149 , 150 Textfunktion 39 , 40 , 55 , 58 , 88 , 100 , 129 Texthandlung 124 Textsorte 42 , 44 , 46 , 49 , 55 , 58 , 100 219 Index Inhaltszonen 55 , 91 Merkmale 42 , 44 , 46 , 55 , 56 Muster 55 Textsortenwissen 55 , 56 , 91 Textstruktur Baum/ Graph 191 Funktionale Beziehung 125 Texttyp 57 , 58 argumentativ 57 , 58 , 59 , 88 , 91 , 100 , 139 deskriptiv 57 , 58 , 88 , 92 expositorisch 57 , 58 , 88 , 92 instruktiv 57 , 58 , 88 , 91 narrativ 57 , 58 , 88 , 92 , 93 , 100 , 107 Texttypologie 46 Textualität 15 , 32 , 35 Thema 55 , 190 alltagssprachlich 87 , 88 Textgegenstand 88 , 89 , 90 Thema/ Rhema 99 , 100 Thematische Entwicklung 98 , 100 Thematische Struktur 87 , 198 TimeML 114 Topik/ Kommentar 101 TüBa-D/ Z Korpus 83 VVerknüpfung asyndetisch 159 Vorfeldbesetzung 99 WWiederaufnahme 63 , 65 , 66 Wiss. Aufsatz (Textsorte) 52 XXML 17 ZZeitausdruck 112 , 114 Zustand 107 , 109 ISBN 978-3-8233-8204-1 Viele Arbeitsgebiete der Linguisti k haben in den letzten Jahren von einer Hinwendung zu empirischen Daten profiti ert: Allgemein verfügbare Korpora erlauben die nachvollziehbare Prüfung von Hypothesen. Der vorliegende Band geht diesen Weg für die Textlinguisti k. Die wesentlichen Ebenen der Textanalyse werden systemati sch erläutert und ‚Textualität‘ als das Ergebnis der Interakti on dieser Ebenen gedeutet. Anhand einer linguisti schen Datenbank und eines auf mehreren Ebenen annoti erten Textkorpus können prakti sche Recherchen durchgeführt und die Mechanismen der Textkohärenz gründlicher untersucht werden als bisher - sowohl qualitati v als auch quanti tati v. Die 2. Auflage wurde vollständig überarbeitet und an vielen Stellen ergänzt, u.a. um ein eigenständiges Kapitel zur „Argumentati onsstruktur“. Zudem steht jetzt für die Korpusrecherche das „Potsdamer Kommentarkorpus“ online bereit und ist in die Übungsaufgaben des Buches integriert. Sti mmen zum Buch: „... eine uneingeschränkte Empfehlung für alle, die sich mit moderner Textanalyse in prakti scher Hinsicht befassen wollen.“ - Info DaF 36, 2/ 3 (2009) „Studierende der Sprachwissenschaft im allgemeinen und der Textlinguisti k sowie der Computerlinguisti k im besonderen werden dieses Buch als ein gutes Lernmitt el erleben.“ - ZfS 26 (2007) Stede Korpusgestützte Textanalyse Korpusgestützte Textanalyse Manfred Stede Grundzüge der Ebenen-orienti erten Textlinguisti k 2., überarbeitete Auflage 18204_Umschlag.indd 1-3 31.08.2018 17: 33: 02