eBooks

Grammatik im Korpus

2019
978-3-8233-9257-6
Gunter Narr Verlag 
Eric Fuß
Marek Konopka
Angelika Wöllstein

Die Arbeiten in diesem Band zeigen anhand ausgewählter morphosyntaktischer Phänomene exemplarisch auf, wie ein korpuslinguistischer Zugang genutzt werden kann, um die Vielfalt und Variabilität des Sprachgebrauchs in einer größeren Detailschärfe zu beschreiben, als dies bisher möglich war. Ausgangspunkt ist die Überlegung, dass sprachliche Variation als integraler Bestandteil der (Standard-)Sprache anzusehen ist und somit auch deskriptiv erfasst werden muss. Dabeigeht es zunächst um eine möglichst genaue Beschreibung der Verteilung und Häufigkeit verschiedener Ausprägungen ausgewählter Variablen. Eine umfassende Beschreibung eines Variationsphänomens beinhaltet zudem die Ermittlung und Gewichtung der Faktoren, die die Distribution der Variantensteuern. In diesem Zusammenhang werden Hypothesen aus der einschlägigen Forschungsliteratur unter Verwendung moderner statistischer Verfahren überprüft. Darüber hinaus enthalten die vorliegenden Studien eine explorative Komponente, die sich mit der Aufdeckung neuer Muster, Regularitäten und linguistischer Zusammenhänge befasst. Dabei werden verschiedene korpuslinguistische und statistische Ansätze und Verfahren erprobt und evaluiert.

STUDIEN ZUR DEUTSCHEN SPRACHE FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE Korpuslinguistisch-statistische Analysen morphosyntaktischer Variationsphänomene Grammatik im Korpus Eric Fuß / Marek Konopka / Angelika Wöllstein (Hrsg.) STUDIEN ZUR DEUTSCHEN SPRACHE 80 STUDIEN ZUR DEUTSCHEN SPRACHE FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE Herausgegeben von Arnulf Deppermann, Stefan Engelberg und Angelika Wöllstein Band 80 Korpuslinguistisch-statistische Analysen morphosyntaktischer Variationsphänomene Grammatik im Korpus Eric Fuß / Marek Konopka / Angelika Wöllstein (Hrsg.) © 2019 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Internet: www.narr.de E-Mail: info@narr.de Satz: Carolin Häberle und Annett Patzschewitz Printed in Germany ISSN 0949-409X ISBN 978-3-8233-8257-7 Redaktion: Dr. Anja Steinhauer Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http: / / dnb.dnb.de abrufbar. Inhalt Eric Fuß/ Marek Konopka/ Angelika Wöllstein Einleitung ................................................................................................................. 9 1. Die korpusorientierte Untersuchung grammatischer Variation ......... 9 2. Die bisherigen Untersuchungen ............................................................ 15 3. Die Pilotstudien in diesem Band ........................................................... 20 Anna Volodina Variation im Sprachgebrauch - angenommen und vorausgesetzt als einbettende Prädikatsausdrücke ................................................................. 29 1. Einleitung .................................................................................................. 29 1.1 Einführung in die Problematik .............................................................. 29 1.2 Phänomen und theoretischer Rahmen ................................................. 32 1.3 Forschungsstand und Erläuterung der Fragestellung........................ 37 1.4 Ziele, Vorgehensweise und der Aufbau der Studie ............................ 40 2. Datenbasis und Methoden ..................................................................... 41 3. Ergebnisse ................................................................................................. 46 3.1 Syntaktische Variation ............................................................................ 47 3.1.1 Präferenzen bei der Einbettung einer V2- und VL-Struktur ......... 47 3.1.2 Topologische Präferenzen ............................................................. 48 3.1.3 Verbmodus-Präferenzen ............................................................... 55 3.2 Semantische Variation ............................................................................. 64 3.2.1 Präferenzen bei der Wahl vorangestellter bedeutungs- modifizierender Ausdrücke ........................................................... 64 3.2.2 Präferenzen bei der Wahl nachgestellter bedeutungs- modifizierender Ausdrücke ........................................................... 67 3.3 Metasprachliche Variation ...................................................................... 71 3.3.1 Variabilitätsfaktor „Medium“ ............................................................. 72 3.3.2 Variabilitätsfaktor „Domäne“ ............................................................. 75 3.3.3 Variabilitätsfaktor „Register“ .............................................................. 78 4. Abschließende Diskussion ..................................................................... 81 4.1 Zusammenfassung der Ergebnisse ....................................................... 81 4.2 Analyse der Ergebnisse .......................................................................... 83 5. Fazit ........................................................................................................... 85 Inhalt 6 Patrick Brandt/ Eric Fuß Relativpronomenselektion und grammatische Variation: was vs. das in attributiven Relativsätzen ......................................................... 91 1. Einleitung .................................................................................................. 91 2. Stand der Forschung ............................................................................... 95 2.1 Strategien der Relativsatzeinleitung im Standarddeutschen ............ 95 2.2 was in attributiven Relativsätzen ........................................................... 99 3. Anmerkungen zur Methodik ............................................................... 107 4. Korpuslinguistische Befunde ............................................................... 116 4.1 Eigenschaften des Antezedens ............................................................ 117 4.1.1 N → das ....................................................................................... 117 4.1.2 jedes/ eines/ keines → das ................................................................. 118 4.1.3 Taxonomie der NP-Typen ........................................................... 122 4.1.4 Analyse ....................................................................................... 127 5. Weitere Faktoren: abweichende Verteilungen von was/ das ............. 131 5.1 Lexikalisch-semantische Eigenschaften von N ................................. 132 5.2 Substantivierte Adjektive ..................................................................... 139 5.2.1 Positive ........................................................................................ 141 5.2.2 Steigerungsformen ...................................................................... 151 5.3 Deverbale Nomina ................................................................................ 157 5.4 jedes/ keines vs. alles/ nichts ...................................................................... 158 5.5 etwas zwischen Gegenstands - und Prädikats-/ Propositionsbezug ................................................................................. 162 5.6 Zur Pragmatik des „irregulären“ Gebrauchs von das/ was ............... 167 5.7 Relativsatzinterne Eigenschaften ........................................................ 172 5.7.1 Modalität ..................................................................................... 172 5.7.2 Relativsatzinterne oblique Kasus (Dativ und Genitiv) ................ 178 5.8 Metadaten ............................................................................................... 181 6. Ergebnisse und Schlussfolgerungen ................................................... 193 6.1 Methodische Aspekte ............................................................................ 193 6.2 Linguistische Aspekte ........................................................................... 197 6.3 Unklare Fälle, potenzielle Anschlussforschung ................................ 203 Inhalt 7 Patrick Brandt unter Mitwirkung von Felix Bildhauer Alternation von zu- und dass-Komplementen: Kontrolle, Korpus und Grammatik ........................................................... 211 1. Einleitung .............................................................................................. 211 2. Phänomenbereich und theoretischer Rahmen ................................. 213 2.1 Objektsinfinitive, Kontrolle und Verantwortlichkeit ...................... 213 2.2 Verben und Strukturtypen .................................................................. 219 2.3 Kontrollwechsel .................................................................................... 221 2.4 Explizitheit, Eindeutigkeit und Ökonomie des Ausdrucks ............ 224 2.5 Zentrale Hypothese und weitere Fragestellungen .......................... 228 3. Methodische Aspekte ........................................................................... 230 3.1 Extraktion und Annotation ................................................................. 232 3.2 Kontrolltypen und Verbklassen ......................................................... 237 3.3 Alternationen und zu-Index ................................................................ 244 4. Einzeluntersuchungen ......................................................................... 248 4.1 Kontrolle und zu-Komplemente ......................................................... 249 4.2 Logistische Regressionsanalyse (Felix Bildhauer) ........................... 254 4.3 Kontrolle kontextuell begünstigen oder behindern ........................ 263 4.4 Jenseits von Kontrolle: Schwächen und Stärken .............................. 274 4.4.1 zu-Komplemente und modale Interpretationen ......................... 274 4.4.2 dass-Komplemente und verbindliche Selbstverpflichtung ......... 278 4.5 Adjektivische Passive und Korrelate ................................................. 282 5. Zusammenfassung ............................................................................... 289 5.1 Linguistische Aspekte .......................................................................... 289 5.2 Methodische Aspekte ........................................................................... 292 Sandra Hansen-Morath/ Hans-Christian Schmitz/ Roman Schneider/ Sascha Wolfer KoGra-R: Standardisierte statistische Auswertung von Korpusrecherchen ............................................................................................. 299 1. Einleitung ............................................................................................... 299 2. Nutzungsszenarien .............................................................................. 301 2.1 Eingabe von Daten via KoGra-DB ..................................................... 301 2.2 Eingabe von COSMAS-II-Frequenzlisten ......................................... 303 2.3 Freie Eingabe von Nutzer-definierten Tabellen ............................... 304 Inhalt 8 3. Statistische Analysen ........................................................................... 306 3.1 Darstellung der Rohdaten ................................................................... 307 3.2 Darstellung von normierten Daten .................................................... 308 3.3 Darstellung der relativen Werte ......................................................... 309 3.4 Analysen im Rahmen der Chi-Quadrat-Statistik ............................ 313 3.4.1 Der Chi-Quadrat-Test ................................................................ 313 3.4.2 Assoziationsstärke: Phi/ Cramérs V ............................................ 314 3.4.3 Erwartete Häufigkeiten und Residuen ....................................... 314 3.4.4 Assoziationsplot ........................................................................ 316 3.4.5 Mosaikplot ................................................................................. 318 3.5 Konfidenzintervalle .............................................................................. 319 3.6 Dispersion - Verteilung von Phänomenrealisierungen über das Gesamtkorpus ....................................................................................... 321 4. Implementation ..................................................................................... 324 4.1 KoGra-DB............................................................................................... 325 4.2 CGI/ Python ............................................................................................ 327 4.3 R............................................................................................................... 328 5. Evaluation .............................................................................................. 328 6. Zusammenfassung und Ausblick ....................................................... 332 Anhang ................................................................................................................. 338 Eric FuSS / MarEk konopka / angElika WöllStEin EInlEItung Am Institut für Deutsche Sprache in Mannheim (IDS) wird an der Erstellung einer neuen, korpuslinguistisch fundierten Grammatik des Standarddeutschen gearbeitet (für entsprechende Präliminarien vgl. Bubenhofer/ Konopka/ Schneider 2014). Vorbereitend wurden eine Reihe von Pilotstudien durchgeführt, deren Ziel es war, anhand von detaillierten Untersuchungen beispielhafter Variationsphänomene aus verschiedenen Grammatikbereichen korpuslinguistische Fragestellungen und Herangehensweisen exemplarisch herauszuarbeiten. Dabei galt es auch, einen passenden Methodensatz zu entwickeln, der das methodologische Grundgerüst für die Unternehmung der eigentlichen „Korpusgrammatik“ bilden soll. Ein wesentlicher Teil der Erträge dieser Pilotphase ist in Donalies (2011), Konopka/ Fuß (2016) sowie dem vorliegenden Band zusammengetragen. Daneben entstand eine Reihe von kleineren Pilotstudien. Alle Untersuchungen der Pilotphase führen zwei Aspekte linguistischer Forschung zusammen, die in der jüngsten Vergangenheit stärker in den Mittelpunkt des Erkenntnisinteresses gerückt sind. Dabei handelt es sich zum einen um das Bestreben, der modernen Linguistik ein besseres empirisches Fundament zu geben, wobei die Nutzung großer digitalisierter Textkorpora eine zunehmend wichtige Rolle spielt (vgl. z.B. Viana/ Zyngier/ Barnbrook (Hg.) 2011). Zum anderen ist hier das verstärkte Interesse der Grammatikforschung an den Formen, Bedingungen und Ursachen grammatischer Variation zu nennen, einem Phänomenbereich also, der traditionell primär Gegenstand der Soziolinguistik und Sprachwandelforschung ist. Im Rahmen dieses einführenden Kapitels möchten wir zunächst einige Perspektiven, Möglichkeiten und Herausforderungen eines korpusorientierten Zugangs zur Untersuchung grammatischer Variation aufzeigen. Im Weiteren sollen hier die Untersuchungen der Pilotphase vor dem Hintergrund des Projekts „Korpusgrammatik - grammatische Variation im standardsprachlichen und standardnahen Deutsch“, in dessen Rahmen sie entstanden sind, eingeordnet werden. Abschließend geben wir einen genaueren Überblick über die Inhalte des vorliegenden Bandes. 1. Die korpusorientierte untersuchung grammatischer Variation Die Verfügbarkeit großer, elektronisch durchsuchbarer Korpora hat in den letzten Jahren zu einem neuen Interesse an empirischen Studien zur Grammatik natürlicher Sprachen geführt. Ein bedeutender Nebeneffekt der Beschäftigung mit größeren Mengen von Sprachdaten ist, dass die Variabilität der Sprache Eric Fuß / Marek Konopka / Angelika Wöllstein 10 stärker in den Blickwinkel der Grammatikforschung gerückt ist (vgl. Konopka 2018). Zwar ist die Beobachtung, dass die Sprache inhärent variabel ist, keineswegs neu; so erkannte bereits Pāṇini ca. 600 v. Chr., dass das grammatische System des Sanskrit in bestimmten Bereichen anscheinend gleichberechtigte Varianten zuließ (für solche Fälle benutzte er den Begriff anyatarasy-m, vgl. Kiparsky 1979). 1 Allerdings blieb dieser Aspekt von Pāṇinis Lehren ohne größeren Einfluss auf die Ideengeschichte der Linguistik (vgl. Chambers 2002). Die Untersuchung sprachlicher Variation etablierte sich erst in der zweiten Hälfte des 20. Jahrhunderts als Teilbereich der modernen Linguistik. Ausgehend von der Beobachtung, dass abhängig vom Äußerungskontext oder gesellschaftlichen Status des Sprechers eine sog. linguistische Variable, d.h. eine bestimmte Bedeutung oder grammatische Funktion, durch verschiedene sprachliche Varianten realisiert werden kann, konzentrierte sich die wissenschaftliche Untersuchung sprachlicher Variation dabei zunächst vor allem auf die soziale Dimension von Sprache (vgl. Labov 1966, 2008). Traditioneller Gegenstand der Soziolinguistik sind Fälle außergrammatisch determinierter Variation, die sowohl Sprechergruppen (sog. Intersprechervariation) als auch individuelle Sprecher (sog. Intrasprechervariation) betreffen kann. Variationsphänomene, die sich auf grammatische Faktoren zurückführen lassen, fallen hingegen in das Gebiet der allgemeinen Linguistik bzw. der Grammatikforschung. Auch hier kann zwischen Intra- und Intersprechervariation unterschieden werden. Kennzeichnend für die meisten Variationsphänomene ist es dabei generell, dass wir Faktoren identifizieren können, die zwar die Verteilung der Varianten beeinflussen, sie aber nicht vollständig bestimmen. Es sind in der Regel auch mehrere Faktoren im Spiel. Bei der Untersuchung solcher Einflussgrößen können tendenziell verschiedene Typen sprachlicher Variation unterschieden werden, die sich anhand der Verteilung der Varianten und der Natur der relevanten Faktoren (grammatisch vs. außergrammatisch) klassifizieren lassen, vgl. die Übersicht in Tabelle 1. 1 Kiparsky (1979) weist darauf hin, dass Pāṇini zur Beschreibung grammatischer Variation drei unterschiedliche Begriffe verwendet, die mit verschiedenen Stufen der Präferenz für eine Variante assoziiert sind: vā bringt zum Ausdruck, dass es sich um eine eindeutig bevorzugte Variante handelt; vibāși wird für marginale, weniger präferierte Varianten verwendet, während anyatarasy-m Fälle beschreibt, in denen die beiden Varianten mehr oder weniger gleichwertig sind. Einleitung 11 grammatisch bestimmt außergrammatisch bestimmt Intersprechervariation abhängig von phonologischem/ morphosyntaktischem Kontext, Satzprosodie, Diskursfunktion etc. abhängig von Alter, sprachgeografischem Hintergrund, Sozialstatus etc. Intrasprechervaration abhängig von Äußerungskontext, Stilebene, Textsorte, Medium o.Ä. tab. 1: typen sprachlicher Variation (vgl. Fuß 2018) Die typischen außergrammatischen Einflussgrößen gehen bei der Inter- und der Intrasprechervariation deutlich auseinander: Während sie im ersteren Fall primär als Eigenschaften des Sprechers erscheinen, betreffen sie im letzteren Fall Aspekte der Kommunikationssituation. Aber auch die grammatischen Einflussgrößen sind bei den beiden Variationsarten unterschiedlich zu interpretieren: Während sie bei der Intrasprechervariation dafür stehen, dass ein Sprecher je nach grammatischem Kontext zu der einen oder zu der anderen Variante neigt, bedeutet ihre Feststellung in einem Fall der Intersprechervariation erst einmal nur, dass die Sprecher, die die eine Variante verwenden, auch häufiger zu bestimmten grammatischen Konfigurationen im Kontext der Variable greifen als die Sprecher, die die andere Variante verwenden. 2 Dabei ist die Entscheidung, ob es sich um eine Interund/ oder eine Intrasprechervariation handelt, in maschinell gestützten Untersuchungen sehr umfangreicher Korpora oft gar nicht trivial. Als Indikator für die eine oder die andere Variationsart kann allerdings die Beschaffenheit der außergrammatischen Faktoren dienen, worauf wir weiter unten noch genauer eingehen werden. Obige Klassifizierung verschiedener Typen sprachlicher Variation berücksichtigt zunächst nur Phänomene, bei denen die Wahl zwischen zwei oder mehreren Ausprägungen einer Variable von bestimmten, klar identifizierbaren Faktoren beeinflusst wird (dazu Fuß/ Konopka/ Wöllstein 2017). Daher kann man hier von „abhängiger Variation“ sprechen. Darüber hinaus wird in der Literatur die Möglichkeit freier Variation diskutiert. Freie Variation soll dann vorliegen, wenn die Verteilung von Varianten nicht auf bestimmte grammatische oder außergrammatische Einflussgrößen zurückgeführt werden kann. Eine solche Form sprachlicher Variation wird in der Regel mit Sprachwandelprozessen assoziiert (vgl. z.B. Kroch 1989). Dabei liegt die Idee zugrunde, dass Sprachwandel nur dann möglich ist, wenn die Distribution der Varianten so 2 Ob dann die Annahme disparater grammatischer Systeme notwendig ist, sei an dieser Stelle dahingestellt. Eric Fuß / Marek Konopka / Angelika Wöllstein 12 unspezifisch bzw. zufällig geworden ist, dass Sprachlerner nicht mehr in der Lage sind, die Faktoren zu erkennen, die in der Zielgrammatik die Verteilung der entsprechenden Varianten regeln. Im Gegensatz zu früheren, primär kompetenzgestützten Ansätzen in der Grammatikschreibung begreifen wir Variabilität, wie bereits angedeutet, als wesentliche Eigenschaft der Sprache, die sich nicht nur in der Vielfältigkeit des allgemeinen Sprachgebrauchs manifestiert, sondern die auch in der sprachlichen Kompetenz individueller Sprecher verankert ist (Stichwort „Intrasprechervariation“). Daraus folgt zum einen, dass eine adäquate Beschreibung grammatischer Variation nicht nur außergrammatische Aspekte der Distribution einer bestimmten Variante (z.B. ihre Abhängigkeit vom sprachgeografischen Hintergrund oder von der Textsorte) erfassen sollte, sondern auch - soweit vorhanden - die grammatischen Bedingungen herausarbeiten muss, die die Realisierung unterschiedlicher Ausprägungen der relevanten Variable beeinflussen. Eine Gesamtbeschreibung der Grammatik einer Einzelsprache soll ferner, wann immer möglich, Inter- und Intrasprechervariation auseinanderhalten und Letztere zu einem Schwerpunkt der Betrachtung machen. Dementsprechend befassen sich die Beiträge zu diesem Sammelband mit Phänomenen, in denen nicht nur der allgemeine Sprachgebrauch variabel ist, sondern grammatische Variation auch auf der Ebene des einzelnen Sprechers zu erwarten ist. Die Identifikation von genuin grammatischen Einflussfaktoren, die als Eigenschaften des lautlichen oder morphosyntaktischen Kontexts erscheinen, kann im Rahmen eines korpuslinguistischen Zugangs sehr arbeitsintensiv sein, schon weil sie mit einem erheblichen Annotationsaufwand verbunden ist. Ein wesentlicher Beitrag dieses Bandes besteht darin, Wege aufzuzeigen, wie derartigen Herausforderungen mit neuen korpuslinguistischen und statistischen Methoden begegnet wird (vgl. auch Brandt/ Fuß 2014; Bubenhofer/ Hansen-Morath/ Konopka 2014; Konopka/ Fuß 2016; Fuß/ Konopka/ Wöllstein 2017). Im Mittelpunkt stehen Aspekte der morphosyntaktischen Variation, die am IDS in entsprechend annotierten Korpora (auf der Basis des Deutschen Referenzkorpus, DeReKo 3 ) untersucht werden. Die traditionelle monoperspektivische Auffassung, nach der linguistisch interessante Variation dann vorliegt, wenn verschiedene Zeichen oder Zeichenketten zur Realisierung einer bestimmten semantischen oder grammatischen Funktion herangezogen werden können, wird dabei um eine inverse Perspektive erweitert, die von der Form ausgeht und betrachtet, welche unterschiedlichen Funktionen mit einem Zeichen bzw. einer Zeichenkette assoziiert sein können. Die „Variation der Funktion“ eines grammatischen Gebildes wurde in der bisherigen, weitgehend an der Soziolinguistik orientierten Variationsforschung kaum als linguistisch interessant wahr- 3 Vgl. http: / / ids-mannheim.de/ kl/ projekte/ korpora.html (Stand: 5.3.2018). Einleitung 13 genommen bzw. bewusst fokussiert, wozu entscheidend Labovs (1966) frühe Einschränkung des Begriffs „linguistische Variable“ auf funktional definierte Größen mit unterschiedlichen formalen Ausprägungen beigetragen haben mag. Dennoch ist diese Perspektive bereits in den üblichen Forschungspraktiken angelegt. Jetzt soll der wiederkehrende, bewusste Perspektivenwechsel operationalisiert werden, und zwar als systematisch anzuwendende Methode, die die Erkundung der Grammatik weiter voranbringen kann (dazu Fuß/ Konopka/ Wöllstein 2017, S. 229-235). Die von uns hier vertretene Doppelperspektivik - von der Form zur Funktion und von der Funktion zur Form - setzt im Übrigen eine Tradition der Grammatikschreibung am IDS fort, die mit der IDS-Grammatik von Zifonun/ Hoffmann/ Strecker (1997, S. 7-8) begründet wurde. 4 Die Unterscheidung zwischen Intersprechervariation und Intrasprechervariation, die neben der Ermittlung grammatischer Einflussfaktoren als wichtiger Aspekt der adäquaten Beschreibung grammatischer Variation hervorgehoben wurde, ist methodologisch schwierig. Tabelle 1 weiter oben könnte so verstanden werden, dass es bei außergrammatischen Einflussgrößen nur wenig Berührungspunkte zwischen den beiden Variationstypen gibt: Varianten, die mit Faktoren wie Alter, sozialer Hintergrund und regionale Herkunft assoziiert sind, sind typisch für verschiedene Sprechergruppen, während die Wahl unterschiedlicher Ausdrucksweisen im Zusammenhang mit dem außersprachlichen Kontext einer Äußerung ein Charakteristikum der Sprachproduktion einzelner Sprecher ist. 5 Im Gegensatz dazu scheinen bei grammatischen Faktoren die jeweils beteiligten Einflussgrößen an sich nichts über die Unterscheidung zwischen Intersprechervariation und Intrasprechervariation auszusagen: Ist bei einer Korpusuntersuchung die Verteilung einer Variante von einem bestimmten grammatischen Faktor wie der phonologischen Umgebung abhängig, so kann die daraus resultierende Variation mit verschiedenen Sprechergruppen assoziiert sein wie auch in der Sprachproduktion eines einzelnen Individuums auftreten. Eigentlich ist die Situation aber noch wesentlich komplizierter, weil die für verschiedene Sprechergruppen typischen Varianten ebenfalls in der Sprachproduktion eines einzelnen Individuums (nicht zuletzt eines sprachlich versierten) auftreten können, das über das Wissen um die Sprechergruppenabhängigkeit einer Variante verfügt und dieses bewusst einsetzt etwa als Autor eines literarischen Werkes. Die Begriffe Intersprechervariation und Intrasprechervariation stehen also nur für eine prototypische Zuordnung. Dennoch ist es für die grammatische Beschreibung und theoretische 4 Weitergehende Problemstellungen betreffen mögliche (systematische) Zusammenhänge zwischen Form und Funktion (vgl. z.B. Wurzel 1984; Wiese 1999; Brandt 2016) wie die Frage, wann (und warum) eine bestimmte Form überhaupt zur Realisierung einer bestimmten Funktion genutzt werden kann. 5 Allerdings bedeutet das natürlich nicht, dass es keine Unterschiede zwischen Sprechergruppen hinsichtlich stilebenenabhängiger Varianten geben kann. Eric Fuß / Marek Konopka / Angelika Wöllstein 14 Analyse der empirischen Befunde von Bedeutung, dass zwischen den beiden Variationsarten unterschieden wird. Sonst besteht die Gefahr, dass man ein Beschreibungsmodell entwirft, das zwar die Verhältnisse im Korpus korrekt erfasst, aber dennoch an der sprachlichen Realität vorbeigeht, da es suggeriert, dass einzelne Sprecher über die ganze Bandbreite an Varianten (und Einflussgrößen) verfügen, die im Korpus auftreten. 6 Insbesondere bei der Untersuchung großer Korpora, bei denen sich die Datengrundlage aus den sprachlichen Produkten einer Vielzahl verschiedener Sprecher zusammensetzt, wird die Unterscheidung wichtig - sie wirft aber gerade dann besondere Probleme auf. Diesen kann begegnet werden, indem man zunächst solche Einflussgrößen isoliert, die außergrammatischer Natur sind und relativ eindeutig verschiedenen Gruppen von Sprechern (= Intersprechervariation) zugeordnet werden können (z.B. über Einflussfaktoren wie Land oder Region). 7 Für die Hypothese, dass ein bestimmtes Variationsphänomen einen Fall von Intrasprechervariation darstellt, können dann zum einen einschlägige Befunde aus der Forschungsliteratur herangezogen werden; zum anderen kann auch Introspektion als heuristisches Mittel zur Aufdeckung von Intrasprechervariation dienen. In jedem Fall sollten entsprechende Vermutungen durch unabhängige Korpusstudien 8 und andere empirische Untersuchungen validiert werden. Allerdings liegt es in der Natur der Dinge, dass eine Beschreibung grammatischer Variation, die sich an großen Korpora orientiert, insgesamt zwischen einer Beschreibung des im Korpus erfassten allgemeinen Sprachgebrauchs und einer Beschreibung des grammatischen Wissens der Sprachteilhaber oszilliert. Sie soll es aber wann immer möglich anstreben, die beiden Variationsarten auseinanderzuhalten, wie es auch im vorliegenden Band versucht wird. Zuletzt muss noch eine Einschränkung genannt werden, die sich unmittelbar aus der Datengrundlage aller unserer Untersuchungen ergibt. Sie betrifft die Tatsache, dass die in DeReKo enthaltenen, geschriebenen Texte nur einen Teil der Variationsbandbreite zeigen, die die standardnahen Varietäten des Deutschen insgesamt aufweisen. Um ansatzweise Eigenschaften der standardnahen Mündlichkeit in den Blick zu bekommen, kann der Umweg über die Unter- 6 Umgekehrt könnte es auch sein, dass das Sprachverhalten und die Grammatik einzelner Sprecher invariant sind und jede Variante einer bestimmten Gruppe von Sprechern zuzuordnen ist. In diesem Fall würde eine Instanz von Intersprechervariation vorliegen. 7 Bei der Zuordnung von Varianten zu Sprechern bzw. Sprechergruppen sind verschiedene Fälle zu unterscheiden. Zum einen kann es sein, dass eine bestimmte Variante nur in einer bestimmten Varietät/ Sprechergruppe auftritt, wie es im Fall von parkieren für das Schweizerdeutsche gilt (Faktor: „Land“). Zum anderen kann die Sprechergruppe nur einer von mehreren Faktoren sein, der die Wahl einer Variante günstig beeinflusst (vgl. Brandt/ Fuß in diesem Band zur Verteilung des Relativums das nach dem Quantor alles). 8 Es könnte beispielsweise überprüft werden, ob die betreffenden Varianten in ein und demselben Text bzw. Satz auftreten. Einleitung 15 suchung von Textsorten genommen werden, die der konzeptuellen Mündlichkeit nahestehen und in denen stärker mit Abweichungen von der Sprachnorm zu rechnen ist (v.a. Internettexte wie Foren, Chats, Blogs, Wikipedia-Diskussionen, vgl. z.B. Rabanus 1996 für eine frühe Bestandsaufnahme). Eine Einschätzung der Einflussgröße ‘Nähe zur Mündlichkeit’ kann dann geleistet werden, wenn entsprechende Befunde mit Ergebnissen aus Texten verglichen werden, die eindeutig als konzeptionell schriftlich einzuschätzen sind (vgl. dazu Brandt/ Fuß, dieser Band; Fuß 2018 für eine Untersuchung von Kongruenzalternationen mit Subjektreihungen, die primär in Internettexten beobachtet werden können). 2. Die bisherigen untersuchungen Zunächst sollen hier die grammatischen Ergebnisse bisheriger Pilotuntersuchungen skizziert werden. Danach werden die Beiträge zu theoretischen Fragestellungen umrissen. Schließlich werden die bisherigen Ergebnisse im Bereich der korpuslinguistischen Methodik zusammengefasst. Die erste größere Pilotstudie entstand im Bereich Wortbildung und wurde von Donalies (2011) verfasst. Sie untersuchte variierende Wortformen und Fugenelemente von Nomina wie Tagtraum, Tageslicht, Tagedieb. Donalies prüfte das Zusammenwirken von fünf konkurrierenden Regeln für die Wahl der Formen (der Paradigmenregel, der Bedeutungsregel, der Euphonieregel, der Strukturierungsregel und der Gewohnheitsregel). Sie zeigte die Sprachgebrauchstendenzen auf und gab einen fundierten Überblick über die große Materialfülle. Die Problematik der Fugenelemente in nominalen Komposita wurde von Bubenhofer/ Hein/ Brinckmann (2014) wiederaufgenommen, die mithilfe eines Verfahrens des maschinellen Lernens einen Entscheidungsbaum generierten, der die Fugenelemente in 400.000 Komposita mit einer Trefferquote von 95% vorhersagt. Bei 75% der Komposita konnte die Fugenwahl auch mithilfe grammatischer Regeln aus der Forschungsliteratur erklärt werden. Die linguistische Interpretation des Entscheidungsbaums zeigte u.a., dass die Wahl des Fugenelements grundsätzlich vom Charakter des Erstgliedes der Komposition abhängt (wobei zwischen konsonantisch und vokalisch auslautenden Erstgliedern unterschieden werden muss) und dass das Flexionsparadigma des Erstglieds ein sehr ‘mächtiges’ Entscheidungskriterium darstellt. Der Bereich Wortbildung wurde auch in einigen anderen Untersuchungen relevant, etwa bei Konopka und Waßner (2013), die die Frequenz und Varianz der negativ-konditionalen Konnektoren sonst, ansonsten, ansonst, sonsten untersuchten. Die Wahl eines Konnektors aus dieser Gruppe erwies sich einerseits als von den außergrammatischen Faktoren Zeit, Raum und Register (Textsorte) abhängig. Andererseits zeigten einzelne Konnektoren besondere Affinitäten zu unterschiedlichen Verwendungen, so z.B. sonst zu ‘Adverbkonnektor im Mittelfeld’, ansonsten zu ‘Adverbkonnektor Eric Fuß / Marek Konopka / Angelika Wöllstein 16 im Vorfeld’ und ansonst zu ‘phraseninternem Adverbkonnektor’. Variation bei Konnektoren wird schließlich auch von Waßner (2018) thematisiert, der Lücken in Wortbildungsparadigmen konzessiver Konnektoren (obwohl - ? wennwohl - wiewohl, obgleich - wenngleich - ? wiegleich etc.) und Bildungen auf -falls (z.B. ander(e)nfalls) untersucht. Flexionsmorphologische Variation und ihre möglichen Ursachen wurden detailliert am Beispiel der Variation der starken Genitivmarkierung des Nomens von Konopka und Fuß (2016) untersucht. In der großen Doppelstudie wurde einerseits die Alternation zwischen verschiedenen Endungen wie in Hauses, Vaters oder Entwurfes/ Entwurfs und andererseits die Variation zwischen dem Vorhandensein und dem Fehlen einer Genitivmarkierung wie in (des) Iraks/ Irak analysiert. Dabei wurden die zahlreichen lexikalischen, phonologischen, morphologischen, syntaktischen und außersprachlichen Einflussgrößen, die von der Forschung postuliert worden waren, geprüft und hierarchisiert. Die Einzelergebnisse wurden abschließend in einem Gesamtbild auf einen Hintergrund projiziert, in dem als wichtigste Triebfedern der Variation - aus diachroner Perspektive - die Dynamik der wortphonologischen Reduktion im Grundwortschatz (-es → -s) und der flexionsmorphologischen Anpassung im Sonderwortschatz 9 (Nullmarkierung → -s) und - aus synchroner Perspektive - der variierende Integrationsgrad des Sonderwortschatzes erscheinen. Die Entstehung der Studie wurde von einigen Publikationen begleitet, die Sonderfragen vertieften oder anfallende methodische Probleme erörterten. So wurde in einer frühen Untersuchungsphase auch auf die Variation der Genitivmarkierung ein Verfahren des maschinellen Lernens angewendet, das eine Grundlage für die Berechnung eines Entscheidungsbaums bildete, der die Markierungsform vorhersagte. Dabei zeigten die Analysen von Bubenhofer/ Hansen-Morath/ Konopka (2014), dass die Markierungsvariation durch hohe Systematizität gekennzeichnet ist. Die Visualisierung des Entscheidungsbaums machte besonders auf die Faktoren Lexemhäufigkeit, Silbenanzahl, Sonderwortschatzzugehörigkeit und Wortausgang sowie auf die außergrammatischen Einflussgrößen Zeit und Raum aufmerksam. Die Datenbasis, die allen Untersuchungen zur Genitivmarkierung zugrunde lag, wurde der Allgemeinheit in Form einer Genitivdatenbank (GenitivDB) 10 zur Verfügung gestellt (Bubenhofer/ Hansen- Morath/ Konopka/ Schneider 2014, 2015). Die Datenbank umfasst ca. sieben Millionen Satzbelege mit Genitivnomina, die vielfach annotiert und nach Metadaten abfragbar sind. Die Entstehung, Beschreibung und Evaluation dieser Datenbank sind Thema in Hansen/ Schneider (2013) und Schneider (2014). 9 Fremdwörter, Fachwörter, Eigennamen etc. 10 https: / / grammis.ids-mannheim.de/ genitivdb (Stand: 26.2.2018). Einleitung 17 Morphosyntaktische Fragestellungen sind Gegenstand der Studien in diesem Band (die im Abschnitt 3 umrissen werden) sowie einer ganzen Reihe von Beiträgen, die Zwischenetappen dokumentiert haben. So wurden der Gebrauch und das syntaktische Verhalten der konditionalen Konnektoren angenommen und vorausgesetzt, die oft als Varianten betrachtet werden, bereits von Volodina (2018) thematisiert. Sie stellt durch einen Wechsel von der Funktion- Form-Perspektive zu der Form-Funktion-Perspektive entscheidende Unterschiede zwischen den beiden Konnektoren fest, die genau betrachtet gegen deren Auffassung als Varianten sprechen. Die Variation zwischen den Relativpronomina das und was wurde zunächst von Brandt und Fuß (2014) korpuslinguistisch gesichtet, die die zentralen grammatischen Bedingungen der Variation aufarbeiteten und bereits die These aufstellten, dass was den Normalfall darstellt und für alle unterspezifizierten Verwendungen infrage kommt, die keine Identifikation mit einem nominalen Antezedens benötigen, während das auf diese prinzipiell angewiesen ist. Fuß (2017) und Brandt/ Fuß (2017) zeigten dann, dass bei nominalisierten Adjektiven Positive sowohl das als auch was erlauben (das Gute, das/ was), was zum Ausdruck subtiler semantischer Unterschiede genutzt werden kann, wohingegen Superlative was präferieren (das Beste, was), was, wie die Autoren argumentierten, damit zusammenhängt, dass der Quantifizierer alles quasi einen Teil der Superlativstruktur bildet. Die erste Phase der Untersuchungen zur Alternation zwischen dass-Komplementsätzen und gleichwertigen Infinitivkonstruktionen mit zu 11 wurde von Wöllstein (2015) beschrieben. Sie prüfte mögliche Einflussfaktoren der Variation und brachte u.a. empirische Evidenz dafür, dass die Eindeutigkeit hinsichtlich der Interpretation des (impliziten) Subjekts im Komplement das Auftreten der Infinitivkonstruktionen fördert. In einer komparativen Studie verglichen dann Brandt, Trawiński und Wöllstein (2016) Infinitivkonstruktionen in Antikontrollstrukturen 12 im Deutschen mit entsprechenden Konstruktionen im Polnischen, die mit einem overten Komplementierer żeby markiert sind. Sie diskutierten dabei die Frage, ob die Konstruktionen als Satzkomplemente zu analysieren sind. Neben den auch in diesem Band behandelten Variationsphänomenen bildeten sich Probleme der Subjekt-Verb-Kongruenz bei Koordinationsstrukturen zu einem Schwerpunkt der Untersuchungen heraus. Münzberg und Hansen- Morath (2018) behandelten die Variation des Numerus des finiten Verbs bei zwei mit und koordinierten singularischen Nomina als Subjekt. Sie zeigten, dass in Sätzen, in denen beide Nomina mit einem Artikel erscheinen, der Plural signifikant überrepräsentiert ist und in Sätzen, in denen das zweite Nomen 11 Z.B. Alex leugnet/ erzählt/ gibt (es) zu, dass er am Marmeladenglas genascht hat/ am Marmeladenglas genascht zu haben. 12 dass-Sätze bzw. Infinitivkonstruktionen bei sog. obviativen Verben wie anordnen, billigen, gutheißen. Eric Fuß / Marek Konopka / Angelika Wöllstein 18 ohne Artikel erscheint, der Singular überrepräsentiert ist (z.B.: Die Wucht und Strömung war immens). Dieser sog. Ellipseneffekt ist stärker als der Einfluss eines hohen Abstraktionsgrades der Nomina, scheint sich allerdings in schweizerischen Texten abzuschwächen, wodurch ein außergrammatischer Parameter ins Spiel kommt, der tendenziell für Intersprechervariation spricht. Fuß (2018) beschäftigt sich wiederum mit Kongruenz bei koordinierten Pronomina. Er zeigt, dass bei Subjektreihungen aus 2. und 3. Person Sg. (z.B. du und er) am Verb die Endung der 2. Person Sg. (-st) in der Regel nur dann auftritt, wenn das Verb dem komplexen Subjekt vorangeht, während die Benutzung der Endungen der 2. oder der 3. Person Plural von mehreren Faktoren beeinflusst wird. Insgesamt scheint es sich um einen genuinen Fall von Intrasprechervariation zu handeln. Im Weiteren wurden auch AcI-Konstruktionen untersucht und mit V2-, dass- und wie-Sätzen verglichen, die üblicherweise als Varianten der AcI-Konstruktionen erwogen werden. Fuß, Konopka und Wöllstein (2017) fanden dabei Hinweise darauf, dass die Häufigkeit der AcI-Konstruktionen textsortenbzw. registerabhängig ist und zeitlich gesehen insgesamt abnimmt. In theoretischer Hinsicht postulierten sie, dass als Varianten nur AcI-Konstruktionen 13 und wie-Sätze betrachtet werden können. Schließlich lieferten Konopka und Hansen-Morath (2017) einen statistischen Vergleich der beiden Konstruktionen, der nahelegt, dass sie ähnliche außergrammatische Gebrauchsbedingungen haben. Theoretische Fragestellungen der korpuslinguistischen Herangehensweise wurden ausführlich zunächst in Bubenhofer/ Konopka/ Schneider (2014) behandelt. Die Autoren diskutierten darin u.a. verschiedene Verwendungen des Begriffs ‘Standardsprache’, Konzepte wie ‘Variation’ und ‘Varianz’, verschiedene Betrachtungsweisen der Frequenz von Phänomenen, Fragen der Zusammensetzung eines Korpus für die Untersuchungen zu einer wissenschaftlichen Grammatik des Deutschen und die Relevanz von Metadaten, um außergrammatische Bedingungen für den Gebrauch der Phänomene zu untersuchen. Später thematisierten Fuß, Konopka und Wöllstein (2017) detailliert den Ansatz der Doppelperspektivik in der deskriptiven Grammatikforschung. Sie postulierten gleichzeitig die Notwendigkeit der heuristischen Suspendierung des Konzepts der „freien Variation“ und führten die Unterscheidung zwischen Intersprechervariation und Intrasprechervariation ein, die dann von Fuß (2018) ausführlich thematisiert wurde. Zuletzt analysierte Konopka (2018) das Zusammenwirken von Korpuslinguistik, Grammatiktheorie und Grammatikografie. Er argumentierte im Ergebnis, dass die empirische Wende in der Grammatikforschung eine wissenschaftliche Grammatik des Deutschen überfällig 13 Sofern Letztere als propositionsbezeichnende Komplemente aufgefasst werden, die auf direkte Perzeption bzw. zeitliche Überlappung der bezeichneten Proposition mit der durch das Wahrnehmungsverb im Matrixsatz bezeichneten Handlung beschränkt sind. Einleitung 19 macht, die zu einer Theoriebildung beiträgt, die kompetenz- und performanzbezogene Überlegungen zu einer integrativen Gesamttheorie weiterentwickelt. Die genannten theoretischen Gesichtspunkte fanden ihren Niederschlag in Einzeluntersuchungen, die von den grammatischen Inhalten her teilweise schon weiter oben umrissen wurden. So etwa setzten sich Konopka und Waßner (2013) mit den Möglichkeiten auseinander, der Argumentation für die Zugehörigkeit einer Variante zum Standard, einem Teilstandard 14 oder zu einer Nonstandardvarietät korpuslinguistisch-statistische Anhaltspunkte zu geben. In beinahe allen Untersuchungen seit 2013 wurde die Abhängigkeit der Variationsphänomene von in Bubenhofer/ Konopka/ Schneider (2014) theoretisch diskutierten Metadaten geprüft, was etwa bei Konopka/ Waßner (2013), Bubenhofer/ Hansen-Morath/ Konopka (2014) oder Fuß/ Konopka/ Wöllstein (2017) zu einigen überraschenden vor allem sprachhistorischen und sprachgeografischen Zuordnungen führte und des Öfteren einen Hinweis auf Intersprechervariation gab. So war auch die übliche Perspektive der Variationsbetrachtung, von der Funktion zur Form, regelmäßig um den Blick ergänzt worden, der von den Formen ausgeht und ihre funktionale Ausdifferenzierung betrachtet. Dies resultierte häufig in der Feststellung, dass die ursprünglich als Varianten betrachteten Phänomene nach einer eingehenden Analyse nicht mehr als solche zu betrachten sind. Auf eine integrative Betrachtung der kompetenz- und performanzbezogenen Aspekte der Variation schließlich wurde laufend hingearbeitet, indem systematisch sowohl grammatische als auch außergrammatische Faktoren der grammatischen Variation erkundet und in Gesamtbildern (exemplarisch in Konopka/ Fuß 2016, S. 244-264) aufeinander bezogen wurden. Korpuslinguistisch gesehen sind im Projekt „Korpusgrammatik“ zahlreiche Methoden ausprobiert worden, wovon einige jetzt auch zum methodologischen Grundgerüst der Unternehmung zählen dürfen. Zu Beginn des Projekts ging es zunächst um die Zusammenstellung eines Untersuchungskorpus, die Konzeption der Metadaten-Anreicherung der Korpustexte aus den TreeTagger-, Connexor- und früher auch Xerox-annotierten Ressourcen des DeReKo sowie um die Entwicklung eines ersten adäquaten Abfrage- und Analyseportals. Alle diese Schritte wurden in Bubenhofer/ Konopka/ Schneider (2014) beschrieben. 15 Bubenhofer diskutierte darin auch schon die grundlegenden statistischen Verfahren, die dazu dienen, die Verteilung eines Phänomens in den definierten Teilkorpora zu untersuchen und ein Phänomen mit einem oder mehreren anderen Phänomenen zu vergleichen, wie Chi-Quadrat-Tests, Effektstärke-Messungen und Berechnungen der Dispersion von Phänomenen. Danach wurde in Bubenhofer/ Konopka/ Schneider (2014), Bubenhofer/ Hansen-Morath/ Konopka (2014) 14 Z.B. im Sinne eines areal definierten Gebrauchsstandards (vgl. Elspaß/ Dürscheid 2017). 15 Zu aktualisierten Informationen zur Zusammensetzung des Untersuchungskorpus vgl. https: / / grammis.ids-mannheim.de/ korpusgrammatik/ 4755 (Stand: 4.3.2018). Eric Fuß / Marek Konopka / Angelika Wöllstein 20 und Konopka/ Fuß (2016) eine automatische Abfrageroutine für die phonologischen und morphologischen Informationen der Celex-Datenbanken entwickelt. Diese werden bei Korpusrecherchen herangezogen, die grammatische Merkmale betreffen, die in den Korpustexten nicht annotiert sind. Im Weiteren wurden auch avancierte korpuslinguistische bzw. statistische Methoden benutzt und in Einzelstudien beschrieben, so die Modellierung von Entscheidungsbäumen mithilfe maschinellen Lernens in Bubenhofer/ Konopka/ Schneider (2014) und Bubenhofer/ Hansen-Morath/ Konopka (2014), Clusteranalysen in Brandt/ Fuß (2017) und logistische Regressionen in Konopka/ Fuß (2016) sowie Münzberg/ Hansen-Morath (2018). Ein wichtiges Ergebnis - nicht zuletzt im Hinblick auf die Durchführbarkeit des Projekts „Korpusgrammatik“ - war letztendlich der Entschluss, ein Paket an grundlegenden statistischen Methoden zu standardisieren und deren routinemäßige und (soweit nur möglich) automatische Durchführung zu sichern (vgl. weiter unten). Aufwendigere statistische Verfahren, die nicht nur mehr Vorbereitung und Zeitaufwand benötigen, sondern bei denen auch die Interpretation der Ergebnisse mit diffizilen und umfangreichen Erklärungen verbunden ist, sollten dann nur in theoretisch besonders interessanten Fragen hinzukommen. 3. Die Pilotstudien in diesem Band Bei den in diesem Band versammelten Arbeiten handelt es sich um Pilotstudien, die anhand ausgewählter, variationsträchtiger morphosyntaktischer Phänomene exemplarisch aufzeigen, wie ein korpuslinguistischer Zugang genutzt werden kann, um die Vielfalt und Variabilität des Sprachgebrauchs in standardnahen Texten aufzuzeigen und in einer größeren Detailschärfe zu beschreiben, als dies bisher möglich war. Die Erkenntnisse der Studien sollen in die zu verfassende Grammatik einfließen, deren wesentliche Ziele und Gegenstände auch im Mittelpunkt der hier vorgelegten Arbeiten stehen. Ausgangspunkt ist die Überlegung, dass sprachliche Variation im Gegensatz zu früheren normativen Auffassungen als integraler Bestandteil der Sprache (insbesondere auch der Standardsprache) anzusehen ist und somit auch grammatikografisch erfasst werden muss. Dabei geht es zunächst um eine möglichst genaue Beschreibung der Verteilung und Häufigkeit der verschiedenen Ausprägungen ausgewählter Variablen. Eine umfassende Beschreibung eines Variationsphänomens beinhaltet zudem die Ermittlung und Gewichtung der Faktoren, die die Distribution der Varianten steuern. In diesem Zusammenhang werden auch existierende Hypothesen aus der einschlägigen Forschungsliteratur unter Verwendung moderner statistischer Verfahren überprüft und evaluiert. Neben der Beschreibung und Evaluation beinhalten die vorliegenden Studien eine explorative Komponente, die sich mit der Aufdeckung neuer Muster, Regularitäten und linguistischer Zusammenhänge befasst. Aus methodologischer Sicht liefert Einleitung 21 der vorliegende Band ebenfalls wichtige Vorarbeiten zur entstehenden Korpusgrammatik, indem verschiedene korpuslinguistische und statistische Ansätze und Verfahren erprobt und evaluiert werden; besonders hervorzuheben ist dabei, dass innerhalb der Projektarbeit eine Auswahl standardisierter statistischer Instrumente entwickelt wurde, die als KoGra-R auch online 16 zur Verfügung stehen und zur Datenexploration und Validierung linguistischer Hypothesen herangezogen werden können (vgl. das Kapitel von Hansen-Morath/ Schmitz/ Schneider/ Wolfer). Das Kapitel von Anna Volodina („Variation im Sprachgebrauch - angenommen und vorausgesetzt als einbettende Prädikatsausdrücke“) ist befasst mit dem Gebrauch und syntaktischen Verhalten der konditionalen Konnektoren angenommen und vorausgesetzt, die aus den formidentischen Perfektpartizipen hervorgegangen sind. Während bisherige Beschreibungen in der Regel davon ausgegangen sind, dass diese Konnektoren mehr oder weniger identische semantische und syntaktische Eigenschaften aufweisen (vgl. Pasch et al. 2003 und Breindl/ Volodina/ Waßner 2014), wird in der vorliegenden Arbeit gezeigt, dass sich auf der Basis einer umfassenden Korpusstudie deutliche Unterschiede im Gebrauch der beiden Elemente nachweisen lassen. Dabei wurden aus dem Korpus ca. 40.000 einschlägige Belege extrahiert, die anschließend semi-automatisch für Eigenschaften wie Wortstellung, Modus und unmittelbare syntaktische Umgebung annotiert wurden. Mithilfe der statistischen Werkzeuge und Visualisierungsmittel, die von der KoGra-R-Schnittstelle zur Verfügung gestellt werden, konnte eine Reihe von Kontrasten zwischen den beiden Konnektoren herausgearbeitet werden. So unterscheiden sich angenommen und vorausgesetzt hinsichtlich a) ihrer Präferenz für die Einbettung von V2vs. dass-Komplementsätzen, b) Modus (Indikativ vs. Konjunktiv) und Position des eingebetteten Satzes relativ zum Matrixsatz sowie c) der Auswahl der (adverbialen) Elemente, die bevorzugt zur Modifikation des Konnektors herangezogen werden. Die beobachteten Kontraste wurden anschließend im Rahmen eines pragmatisch-funktionalen Ansatzes gedeutet, der auf der Idee aufbaut, dass die beiden Konnektoren die Aufmerksamkeit des Adressaten auf verschiedene Weise lenken: Mit dem angenommen-Konnekt wird in der Regel eine neue, hypothetische Situation eingeführt, in der der Matrixsatz evaluiert wird. Dabei wird die Aufmerksamkeit des Adressaten eher auf die Möglichkeit gerichtet, dass die im angenommen-Konnekt ausgedrückte Proposition wahr ist. Im Gegensatz dazu schränkt vorausgesetzt den Geltungsbereich des Matrixsatzes ein, wobei die Möglichkeit, dass der Sachverhalt des vorausgesetzt-Konnekts falsch sein könnte, in den Mittelpunkt rückt. Eine wichtige Konsequenz dieser Analyse ist, dass angenommen und vorausgesetzt entgegen bisherigen Annahmen bei allen Gemeinsamkeiten keine vollständig identi- 16 http: / / ids-mannheim.de/ kogra-r (Stand: 6.3.2018). Eric Fuß / Marek Konopka / Angelika Wöllstein 22 sche Semantik aufweisen, was die Grundlage für die subtilen Unterschiede beim Sprachgebrauch bildet. Gegenstand des Kapitels von Patrick Brandt und Eric Fuß („Relativpronomenselektion und grammatische Variation: was vs. das in attributiven Relativsätzen“) ist die Verteilung von d- und w-Pronomen in attributiven Relativsätzen. Im Mittelpunkt steht die Beobachtung, dass im Kontext Neutrum Singular anstatt des kanonischen Relativpronomens unter bestimmten Umständen (insbes. nach Indefinita, Demonstrativa sowie substantivierten Adjektiven) auch die w-Form was auftritt. Der Kern der Studie umfasst ca. 18.000 einschlägige Belege, die aus der Korpusgrammatik-Datenbank (KoGra-DB) 17 extrahiert wurden und für Eigenschaften wie Kategorie und Identität des Bezugselements semi-automatisch annotiert wurden. Zusätzlich wurden zu spezifischen Fragestellungen weitere Korpusrecherchen mittels der webbasierten COSMAS-II- Schnittstelle 18 zum DeReKo durchgeführt. Bei den quantitativen Analysen kam zunächst eine Auswahl an deskriptiv- und inferenzstatistischen Verfahren und Visualisierungsmethoden der KoGra-R-Schnittstelle (insbes. Assoziations- und Mosaikplots) zur Anwendung. Ferner wurden Clusteranalysen durchgeführt, die zur Kategorisierung von Kontexten genutzt wurden, die das oder was in ähnlicher Weise präferieren (bzw. dispräferieren). Auf der Basis der auf diese Weise gewonnenen Daten entwickeln die Autoren ein neuartiges Beschreibungsmodell dieses Variationsphänomens, das auf der Idee aufbaut, dass die Form des relativischen Anschlusses (mittels dvs. w-Formen) im Kontext Neutrum Singular wesentlich von der syntaktischen Kategorie des Antezedens bestimmt wird. Handelt es sich bei dem Bezugselement um ein lexikalisches Nomen, wird der Relativsatz durch ein d-Pronomen eingeleitet. In allen anderen Kontexten erscheint was als Default-Relativpronomen. Diese Analyse wird durch Korpusbefunde gestützt, die zeigen, dass die Präsenz eines lexikalischen Bezugsnomens i.d.R. Relativierung durch das auslöst - auch bei Elementen, die ansonsten was als Relativum verlangen (z.B. Quantoren und Indefinita). Diese Perspektive ermöglicht überdies eine einheitliche Erklärung für das Auftreten von w-Pronomina in anderen relativsatzähnlichen Konstruktionen, die ebenfalls kein substantivisches Antezedens aufweisen (freie Relativsätze, weiterführende Relativsätze sowie attributive Relativsätze, die sich auf Zitate beziehen). Im Anschluss diskutieren die Autoren eine Reihe von Fällen, in denen die Distribution von das und was abweichende Eigenschaften aufweist. Darunter fallen (a) Kontexte, die das verlangen, obwohl anscheinend kein substantivisches Bezugselement vorliegt (vor allem individuierende Quantoren und Indefinita wie jedes, eines oder keines), (b) Kontexte, die was als Relativum auslösen, obwohl anscheinend ein substantivisches Bezugselement vorliegt 17 Vgl. Bubenhofer/ Konopka/ Schneider 2014, S. 79ff. 18 http: / / ids-mannheim.de/ cosmas2/ (Stand: 5.3.2018). Einleitung 23 (insbes. substantivierte Superlative), sowie (c) Kontexte, die Variation zwischen das und was zulassen (substantivierte Positive). Zudem stellen sie fest, dass die Alternation zwischen das und was in Kontexten, in denen der starke Faktor „substantivisches Bezugselement“ nicht eindeutig vorliegt, zusätzlich von schwächeren semantisch-pragmatischen und außergrammatischen Faktoren (Region, Nähe zur Mündlichkeit etc.) beeinflusst wird. Generell gilt dabei, dass was-Relative typischerweise mit generalisierenden Lesarten verbunden sind, während das tendenziell eine konkrete/ individuierende Interpretation des Bezugselements auslöst. Gegenstand des Kapitels „Alternation von zu- und dass-Komplementen: Kontrolle, Korpus und Grammatik“ von Patrick Brandt (unter Mitwirkung von Felix Bildhauer) sind die Bedingungen der Wahl der einen oder anderen Realisierung des Komplements. Die Datenextraktionen enthielten knapp über eine Million Satztoken-Belege. Bei den quantitativen Analysen wurde - wie in anderen Pilotstudien ebenso - eine Auswahl an deskriptiv- und inferenzstatistischen Verfahren (logistische Regressionsanalysen) und Visualisierungsmethoden angewendet (insbes. Assoziations-, Effekt- und Mosaikplots der KoGra-R- Schnittstelle). Es wurde bereits beobachtet, dass erstens die Variation zwischen dass- und zu-Komplementen offenbar an semantische Bedingungen geknüpft ist, die zwischen einem Argument des Matrixprädikats und dem Subjekt des eingebetteten Prädikats Koreferenz ermöglichen, und dass zweitens Ähnlichkeiten in Selektion und Verwendung sich dort zeigen, wo vergleichbare Muster bei der Argumentstrukturalternation vorliegen - in diesem Sinne erlaubt die Untersuchung der betrachteten Variation Rückschlüsse auf gemeinsame semantische Eigenschaften von Verben bzw. der sie involvierenden Strukturen und trägt so zu deren empirisch fundierter und streng grammatisch motivierter Taxonomie bei. In diesem Rahmen wird eingehend geprüft, unter welchen Bedingungen dass- und zu-Komplemente konkurrieren bzw. variieren und welche Einflussgrößen für die Ausprägung der jeweilig realisierten Form verantwortlich sind. Die leitende Hypothese der Untersuchung zur Variation in der Realisierung des Komplementtyps ist folgende: Wenn Kontrollbedingungen vorliegen, wird ceteris paribus zu-infinitivisch komplementiert (z.B. Wöllstein 2015; Rapp et al. 2017). Fragen, die sich genau in diesem Zusammenhang stellen und hier auf korpuslinguistischer Basis untersucht werden, betreffen etwaige Unterschiede zwischen einzelnen Kontrolltypen oder aber die Frage, ob prototypische, ideale Fälle für Kontrolle typische Komplementrealisierungen zeigen und umgekehrt - insbesondere wird hier auch Fällen der Anti(subjekt)kontrolle (z.B. mit anordnen, veranlassen) nachgegangen - und ob die zuvs. dass- Alternation für systemgrammatische Fragen fruchtbar gemacht werden kann (z.B. ob mit aus dem Sprachgebrauch erwachsenden pragmatischen Prinzipien wie „Ökonomie des Ausdrucks“ gerechnet werden kann). Die Studie ist hypothesengeleitet ausgerichtet und geht daher vorran- Eric Fuß / Marek Konopka / Angelika Wöllstein 24 gig mit Daten um, die als einschlägig für die entsprechenden Hypothesen gelten können. Dabei bestätigt sich die Hypothese, dass das Vorliegen von Kontrollbedingungen die Wahl eines zu-infinitivischen Komplements in hochsignifikanter Weise begünstigt. Es zeigt sich unter anderem, dass Subjekt- oder Akkusativobjektkontrolle offenbar idealtypische Kontrollmuster darstellen, die auch mit lexikalisch anderweitig spezifizierten Verben vorkommen. In Richtung einer grammatisch begründeten Verbtaxonomie ist ferner bemerkenswert, dass Akkusativobjektkontrollverben (bitten, zwingen) und Antikontrollverben (anordnen, billigen) auf struktureller Ebene starke Gemeinsamkeiten aufweisen. Ein weiteres Ergebnis ist, dass grammatische Operationen wie Passivierung oder Modalisierung signifikant häufiger auftreten, wenn sie zur Herstellung von idealtypischen Kontrollbedingungen führen. Im letzten Kapitel „KoGra-R: Standardisierte statistische Auswertung von Korpusrecherchen“ von Sandra Hansen-Morath, Hans-Christian Schmitz, Roman Schneider und Sascha Wolfer wird das Ergebnis der Bemühungen präsentiert, Techniken und Werkzeuge zu entwickeln, die routinemäßig für die erste statistische Exploration von Variationsphänomenen bei der Erstellung der Grammatik benutzt werden können. Die Autoren bauen dabei auf Erfahrungen auf, die in Pilotuntersuchungen gesammelt wurden. Vorgestellt wird das im Projekt entwickelte webbasierte Werkzeug KoGra-R, mit dessen Hilfe ein vorgegebener Satz an statistischen Analysen und Visualisierungen von Häufigkeitsdaten automatisch ausgeführt werden kann. Er ist in der Programmiersprache R (R Core Team 2016) implementiert und als die Menge derjenigen statistischen Verfahren definiert, die idealerweise auf alle Fragestellungen der geplanten Grammatik angewendet werden können, um den ersten Überblick über die Häufigkeit und Verteilung eines Phänomens zu bekommen. Input für KoGra-R sind Kontingenztabellen, die Häufigkeiten von Einzelphänomenen oder von mehreren Phänomenvarianten in Abhängigkeit von Ausprägungen unabhängiger Variablen (etwa grammatischer oder außergrammatischer Faktoren) enthalten. Die Kontingenztabellen können als Rechercheergebnisse direkt an KoGra-R übergeben werden, aber auch als CSV-Dateien hochgeladen oder manuell in ein Formular eingetragen werden. Die statistischen Verfahren umfassen u.a. Visualisierungen normierter und relativer Häufigkeiten, Chi-Quadrat-Tests, Berechnungen der Assoziationsstärke Phi/ Cramérs V, Visualisierungen von Häufigkeitsverteilungen mithilfe von Assoziationsplots und Mosaikplots sowie Berechnungen zur Verteilung von Phänomenen über das Gesamtkorpus (DP norm , vgl. Gries 2008). KoGra-R wurde zwei Evaluationsprozessen unterzogen. Das Werkzeug wurde dabei als nützlich und in der Bedienung einfach empfunden - einige Kritikpunkte konnten bei seiner Weiterentwicklung berücksichtigt werden. KoGra-R ist im Internet allgemein zugänglich 19 und kann 19 Siehe http: / / ids-mannheim.de/ kogra-r/ (Stand: 6.3.2018). Einleitung 25 auch in anderen Projekten benutzt werden. Das Tool bzw. die darin eingegangenen statistischen Verfahren wurden bei vielen der im Abschnitt 2 beschriebenen Untersuchungen und bei allen Pilotstudien in diesem Band für die ersten Explorationsschritte benutzt. Im weiteren Verlauf der Untersuchungen wurden dann oft avanciertere statistische Methoden (etwa logistische Regressionen) herangezogen, die je nach Beschaffenheit des Phänomens auszuwählen sind und sich nicht in dem Maße standardisieren lassen. Die Herausgeber möchten sich an dieser Stelle bei den Autoren der Beiträge für die fruchtbare Zusammenarbeit bedanken. Sehr verbunden sind wir Frau Dr. Anja Steinhauer für die redaktionelle Arbeit und Frau Carolin Häberle für den Satz und die Betreuung der Veröffentlichung seitens des IDS. literatur Brandt, Patrick (2016): Fehlkonstruktion und Reparatur in der Bedeutungskomposition. In: Linguistische Berichte 248, S. 395-433. Brandt, Patrick/ Fuß, Eric (2014): Most questionable pronouns: Variation between dasvs. was-relatives in German. In: Linguistische Berichte 239, S. 297-329. Brandt, Patrick/ Fuß, Eric (2017): A corpus-based analysis of pronoun choice in German relative clauses. In: De Cuypere, Ludovic/ Vanderschueren, Clara/ De Sutter, Gert (Hg.): Current trends in analyzing syntactic variation. (= Belgian Journal of Linguistics 31). Amsterdam: Benjamins, S. 189-212. Brandt, Patrick/ Trawiński, Beata/ Wöllstein, Angelika (2016): (Anti-)control in German: Evidence from comparative, corpusand psycholinguistic studies. In: Reich, Ingo/ Speyer, Augustin (Hg.): Coand subordination in German and other languages. (= Linguistische Berichte - Sonderheft 21). Hamburg: Buske, S. 77-98. Breindl, Eva/ Volodina, Anna/ Waßner, Ulrich Hermann (2014): Handbuch der deutschen Konnektoren. Bd. 2: Semantik der deutschen Satzverknüpfer. (= Schriften des Instituts für Deutsche Sprache 13). Berlin/ Boston: De Gruyter. Bubenhofer, Noah/ Hansen-Morath, Sandra/ Konopka, Marek (2014): Korpusbasierte Exploration der Variation der nominalen Genitivmarkierung. In: Zeitschrift für Germanistische Linguistik 42, 3, S. 379-419. Bubenhofer, Noah/ Hansen-Morath, Sandra/ Konopka, Marek/ Schneider, Roman (2014): GenitivDB 1.0 - Datenbank zur Genitivmarkierung (Release vom 1.6.2014). Mannheim: Institut für Deutsche Sprache. Bubenhofer, Noah/ Hansen-Morath, Sandra/ Konopka, Marek/ Schneider, Roman (2015): GenitivDB 2.0 - Datenbank zur Genitivmarkierung (Release vom 1.9.2015). Mannheim: Institut für Deutsche Sprache. Bubenhofer, Noah/ Konopka, Marek/ Schneider, Roman (2014), unter Mitwirkung von Carin Brinkmann, Katrin Hein und Bruno Strecker: Präliminarien einer Korpusgrammatik. (= Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache 4). Tübingen: Narr. Eric Fuß / Marek Konopka / Angelika Wöllstein 26 Chambers, Jack K. (2002): Studying language variation: An informal epistemology. In: Chambers, Jack K./ Trudgill, Peter/ Schilling-Estes, Natalie (Hg.): The handbook of language variation and change. (= Blackwell Handbooks in Linguistics 11). Malden, MA u.a.: Blackwell, S. 3-14. Donalies, Elke (2011): Tagtraum, Tageslicht, Tagedieb. Ein korpuslinguistisches Experiment zu variierenden Wortformen und Fugenelementen in zusammengesetzten Substantiven. Mit einem Exkurs und zahlreichen Statistiken von Noah Bubenhofer. (= amades 42). Mannheim: Institut für Deutsche Sprache. Elspaß, Stephan/ Dürscheid, Christa (2017): Areale grammatische Variation in den Gebrauchsstandards des Deutschen. In: Konopka/ Wöllstein (Hg.), S. 85-104. Fuß, Eric (2017): Relativierungsverhalten und syntaktische Kategorie substantivierter Adjektive. In: Döring, Sandra/ Geilfuß-Wolfgang, Jochen (Hg.): Probleme der syntaktischen Kategorisierung: Einzelgänger, Außenseiter und mehr. (= Stauffenburg Linguistik 90). Tübingen: Stauffenburg, S. 43-100. Fuß, Eric (2018): Sprachliche Variation. In: Wöllstein, Angelika/ Gallmann, Peter/ Habermann, Mechthild/ Krifka, Manfred (Hg.): Grammatiktheorie und Empirie in der germanistischen Linguistik. Berlin/ Boston: De Gruyter, S. 185-224. Fuß, Eric/ Konopka, Marek/ Wöllstein, Angelika (2017): Perspektiven auf grammatische Variation. In: Konopka/ Wöllstein (Hg.), S. 229-254. Gries, Stefan T. (2008): Dispersions and adjusted frequencies in corpora. In: International Journal of Corpus Linguistics 13, 4, S. 403-437. Hansen, Sandra/ Schneider, Roman (2013): Decision tree-based evaluation of genitive classification - An empirical study on CMC and text corpora. In: Gurevych, Iryna/ Biemann, Chris/ Zesch, Torsten (Hg.): Proceedings of GSCL 2013: The bi-annual meeting of the German Society for Computational Linguistics and Language Technology. Springer LNAI, S. 83-88. Kiparsky, Paul (1979): Pāṇini as a variationist. (= Centre of Advanced Study in Sanskrit 6). Cambridge, MA: The MIT Press. Konopka, Marek (2018): Korpuslinguistik, Grammatiktheorie und Grammatikografie. Ms. Mannheim: Institut für Deutsche Sprache. Konopka, Marek/ Fuß, Eric (2016): Genitiv im Korpus. Untersuchungen zur starken Flexion des Nomens im Deutschen. (= Studien zur Deutschen Sprache 70). Tübingen: Narr. Konopka, Marek/ Hansen-Morath, Sandra (2017): AcI-Konstruktionen und Wie-Komplementsätze. Dokumentation der Parallelexploration. In: grammis. https: / / grammis. ids-mannheim.de/ korpusgrammatik/ 6302 (Stand: 5.3.2018). Konopka, Marek/ Waßner, Ulrich H., unter Mitwirkung von Sandra Hansen (2013): Standarddeutsch messen? Frequenz und Varianz negativ-konditionaler Konnektoren. In: Korpus - gramatika - axiologie 8, S. 12-35. Konopka, Marek/ Wöllstein, Angelika (Hg.) (2017): Grammatische Variation. Empirische Zugänge und theoretische Modellierung. (= Jahrbuch des Instituts für Deutsche Sprache 2016). Berlin/ Boston: De Gruyter. Einleitung 27 Kroch, Anthony (1989): Reflexes of grammar in patterns of language change. Journal of Language Variation and Change 1, 3, S. 199-244. Labov, William (1966): The linguistic variable as a structural unit. In: Washington Linguistic Review 3, S. 4-22. Labov, William (2008): Quantitative analysis of linguistic variation. Quantitative Analyse sprachlicher Variation. In: Ammon, Ulrich et al. (Hg.): Sociolinguistics. An international handbook of the science of language and society. Soziolinguistik. Ein internationales Handbuch zur Wissenschaft von Sprache und Gesellschaft. Bd. 1. 2., vollst. überarb. u. erw. Aufl. (= Handbücher zur Sprach- und Kommunikationswissenschaft 3). Berlin/ New York: De Gruyter, S. 6-21. Münzberg, Franziska/ Hansen-Morath, Sandra (2018): Die Wucht und Strömung war immens - wie stark ist der Ellipseneffekt? In: Fuß, Eric/ Konopka, Marek/ Trawiński, Beata/ Waßner, Ulrich H. (Hg.): Grammar and Corpora 2016. Heidelberg: Heidelberg University Publishing, S. 73-95. Pasch, Renate et al. (2003): Handbuch der deutschen Konnektoren. Linguistische Grundlagen der Beschreibung und syntaktische Merkmale der deutschen Satzverknüpfer (Konjunktionen, Satzadverbien und Partikeln). (= Schriften des Instituts für Deutsche Sprache 9). Berlin/ New York: De Gruyter. Rabanus, Stefan (1996): Die Sprache der Internetkommunikation. (= Internet im Gardez! 1). Mainz: Gardez! Rapp, Irene et al. (2017): Lexikalisch-semantische Passung und argumentstrukturelle Trägheit - eine korpusbasierte Analyse zur Alternation zwischen dass-Sätzen und zu-Infinitiven in Objektfunktion. In: Deutsche Sprache 45, S. 193-221. Schneider, Roman (2014): GenitivDB - a corpus-generated database for German genitive classification. In: Calzolari, Nicoletta et al. (Hg.): Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC 2014). Reykjavík: European Language Resources Association (ELRA). Viana, Vander/ Zyngier, Sonia/ Barnbrook, Geoff (Hg.) (2011): Perspectives on corpus linguistics. (= Studies in Corpus Linguistics 48). Amsterdam/ Philadelphia: Benjamins. Volodina, Anna (2018): angenommen ist nicht vorausgesetzt - eine korpuslinguistische Analyse. In: Deutsche Sprache 46, Themenheft: Über den Tellerrand hinaus: Konnektorenforschung aus unterschiedlichen Blickwinkeln, S. 67-81. Waßner, Ulrich Hermann (2018): Wortbildung und Variation bei Konnektoren. In: Deutsche Sprache 46, Themenheft: Über den Tellerrand hinaus: Konnektorenforschung aus unterschiedlichen Blickwinkeln, S. 52-66. Wiese, Bernd (1999): Unterspezifizierte Paradigmen. Form und Funktion in der pronominalen Deklination. In: Linguistik Online 4, 3. https: / / www.linguistik-online.net/ 3_99/ wiese.html (Stand: 5.12.2018). Wöllstein, Angelika (2015): Grammatik - explorativ. Hypothesengeleitete und -generierende Exploration variierender Satzkomplementationsmuster im standardnahen Deutsch. In: Eichinger, Ludwig M. (Hg.): Sprachwissenschaft im Fokus. Positionsbestimmungen und Perspektiven. (= Jahrbuch des Instituts für Deutsche Sprache 2014). Berlin/ Boston: De Gruyter, S. 93-120. Eric Fuß / Marek Konopka / Angelika Wöllstein 28 Wurzel, Wolfgang U. (1984). Flexionsmorphologie und Natürlichkeit. Ein Beitrag zur morphologischen Theoriebildung. (= Studia grammatica 21). Berlin: Akademie Verlag. Zifonun, Gisela/ Hoffmann, Ludger/ Strecker, Bruno (1997): Grammatik der deutschen Sprache. (= Schriften des Instituts für Deutsche Sprache 7). Berlin/ New York: De Gruyter. anna Volodina VarIatIon Im SPrachgEBrauch - angenommen unD vorausgesetzt alS EInBEttEnDE PräDIkatSauSDrückE 1 1. Einleitung 1.1 Einführung in die Problematik Propositionale Argumente von Verben werden für gewöhnlich in Form eines eingebetteten dass-Nebensatzes mit VL-Stellung realisiert. V2-Komplementsätze treten (optional) nur bei einer kleinen Gruppe von Verben (wie wissen, glauben, erzählen usw.) auf, die entsprechende V2-Komplementsätze zu sich nehmen können (vgl. Vikner 1995, S. 71; Reis 1997) 2 , wie in (1) illustriert. Bei allen anderen Verben sind V2-Komplementsätze unzulässig. Dies wird durch den Kontrast zwischen (2a) und (2b) gezeigt (vgl. Duden 2009, 2016; IDS- Grammatik (Zifonun/ Hoffmann/ Strecker 1997)): (1) a. Er glaubt, dass die Erde keine Scheibe ist/ sei. VL b. Er glaubt, die Erde ist/ sei keine Scheibe. 3 V2 (2) a. Er bedauert, dass die Erde keine Scheibe ist/ sei. VL b. *Er bedauert, die Erde ist/ sei keine Scheibe. *V2 In gesprächsanalytischen Arbeiten (siehe Günthner 2008, 2011 zum Deutschen; Thompson 2002 zum Englischen) werden auch komplexe Nominalkonstruktionen vom Typ die Sache/ das Ding ist, (dass) im Zusammenhang mit der Möglichkeit, V2-Komplemente zu sich zu nehmen, thematisiert. Die Stukturen mit „dass“ sind sind aufgrund ihrer niedrigen Frequenz im Korpus gesprochener Sprache eher eine Ausnahme im Vergleich zu den Strukturen, deren 1 Mein Dank gilt Felix Bildhauer, Eric Fuß, Sandra Hansen-Morath, Marek Konopka, Edgar Onea, Angelika Wöllstein und Gisela Zifonun für hilfreiche Kommentare zu einer früheren Fassung dieses Beitrags. Bei Anna Bliß, Nagehan Cetin, Maria Fischer und insbesondere bei Luise Morawetz bedanke ich mich für ihre Unterstützung bei Literatur- und Korpusrecherchen. Außerdem bedanke ich mich bei den Herausgebern für die Aufnahme in den Sammelband. Einige Ergebnisse dieser Studie sind zuvor in der Zeitschrift „Deutsche Sprache“ publiziert worden, vgl. Volodina (2018). 2 Die Duden-Grammatik (2009, 2016) spricht in diesen Fällen von uneingeleiteten Verbzweitnebensätzen. 3 Nach gängiger Auffassung lassen sich Einbettungsstrukturen daran erkennen, dass sie mit steigender (progredienter) Intonation realisiert werden. Unter dieser Bedingung ist (2b) nicht grammatisch (vgl. Reis 1997, S. 123/ 139f. zu Einbettungsmerkmalen bei V2-Nebensätzen). Anna Volodina 30 Komplementstelle als V2-Satz realisiert wird, wie an einem konstruierten Beispiel in (3b) verdeutlicht: (3) a. das DING ist aber auch‒ dass ich in der germanIStik promoVIEren will. VL (aus: Günthner 2011, S. 15) b. Das Ding ist, ich will in der Germanistik promovieren. V2 Ein weiterer empirischer Bereich, in dem im Deutschen eine Variation zwischen V2- und VL-Nebensätzen festgestellt wurde, ist der Bereich adverbialer Relationen. In erster Linie trifft dies auf die kausalen und die konzessiven Relationen zu (siehe HDK-1 2003; HDK-2 2014; Antomo/ Steinbach 2010, 2013, sowie den Exkurs zu weil-V2 in Volodina (2011, S. 80-88)). 4 Beispielhaft kann dies für den kausalen Konnektor weil am Beispiel (4) gezeigt werden: (4) a. Er ist zu Hause (/ ) weil das Licht an ist. VL b. Er ist zu Hause (/ ) weil das Licht ist an. V2 Dies bedeutet jedoch nicht, dass stets freie Variation zwischen den V2- und VL-Strukturen vorliegt und jeder eingebettete adverbiale V2-Satz durch die entsprechenden VL-Pendants ohne Bedeutungsverlust zu ersetzen wäre. Bezogen auf diesen konkreten Fall gilt, dass weil-VL- und weil-V2-Sätze nur dann semantisch äquivalent sind, wenn der weil-Satz mit VL-Stellung, wie in (4a) gezeigt, ebenfalls prosodisch desintegriert realisiert wird (/ ) wie der weil-V2-Satz. In diesem Fall erlauben beide Sätze eine epistemische Lesart 5 (Volodina 2009, 2012; Reis 2013; HDK-2 2014, S. 821); vgl. Antomo/ Steinbach (2010) für eine andere Ansicht. Aber auch im konditionalen Bereich findet sich Variation zwischen V2- und VL-Komplementsätzen. Wie man am Beispiel (5) beobachten kann, bettet das ohne Auxiliar verwendete Partizip II (im Weiteren PII) vorausgesetzt sowohl dass-Sätze mit VL-Stellung als auch V2-Sätze ein: (5) a. Vorausgesetzt, dass die Erde eine Scheibe ist, dann kann man aus Mannheim Paris sehen. VL b. Vorausgesetzt, die Erde ist eine Scheibe, dann kann man aus Mannheim Paris sehen. V2 Die Form vorausgesetzt ist semantisch transparent und geht auf das Verb voraussetzen (in der Bedeutung „etw. als gegeben, sicher annehmen“ (WDG 4 Zur Unterscheidung weiterer Subtypen eingeleiteter und uneingeleiteter V2-Sätze siehe auch Freywald (2009, 2018). 5 Epistemische Lesart: Ich nehme an, dass er zu Hause ist, weil (ich sehe, dass) das Licht an ist. Variation im Sprachgebrauch 31 1964-1977)) 6 zurück. Fungiert das Verb voraussetzen als Vollverb, kann es bemerkenswerterweise nur einen VL-Satz einbetten: Eine V2-Variante ist nicht für alle Muttersprachler des Deutschen akzeptabel, vgl. (6): (6) a. Ich setze voraus/ habe vorausgesetzt, dass die Erde eine Scheibe ist/ sei. VL b. ? ? Ich setze voraus/ habe vorausgesetzt, die Erde ist/ sei eine Scheibe. 7 V2 Diesen Kontrast hat man bei den gleichen Minimalpaaren mit dem semantisch ähnlichen annehmen als Vollverb nicht. Sowohl die Variante mit V2als auch mit VL-Stellung ist akzeptabel: (7) a. Ich nehme an/ habe angenommen, dass die Erde eine Scheibe ist/ sei. VL b. Ich nehme an/ habe angenommen, die Erde ist/ sei eine Scheibe. V2 Werden annehmen und voraussetzen wiederum als PII ohne Auxiliar verwendet (siehe z.B. (5)), werden grammatische und semantische Parallelen zwischen den angenommenvs. vorausgesetzt-Strukturen sehr deutlich, 8 worauf auch in der einschlägigen Literatur bereits hingewiesen wurde (vgl. dazu ausführlich IDS-Grammatik 1997; Reis 1997; HDK-1, S. 440ff.; HDK-2, S. 775ff.) Während die syntaktischen Lizenzierungsbedingungen für diese Strukturen relativ gut beschrieben sind, findet die Variation auf der Ebene des tatsächlichen Sprachgebrauchs von partizipialen Strukturen mit angenommen bzw. vorausgesetzt kaum Beachtung. 9 Der Sprachgebrauch scheint aber die ent- 6 https: / / dwds.de/ wb/ wdg/ Voraussetzung (Stand: 24.10.2017). 7 Der Satz (6b) bzw. (7b) ist dann als äquivalente Struktur zu (6a) bzw. (7a) anzusehen, wenn er unter den gleichen prosodischen Bedingungen wie in (6a) bzw. (7a), nämlich mit einer progredienten Intonationskontur, realisiert wird. Unter diesen informationsstrukturellen Bedingungen wurde die Struktur in (6b) mit voraussetzen von vielen Muttersprachlern des Deutschen als nicht wohlgeformt beurteilt, nicht aber (7b) mit annehmen. In Reis (1997, S. 123) findet sich u.a. ein Hinweis darauf, dass auch der nominale Ausdruck Voraussetzung unter denselben prosodischen Bedingungen V2-Sätze nicht einbetten kann (*(unter der) Voraussetzung, er kommt …). 8 So wird der sowohl durch angenommen als auch durch vorausgesetzt eingeführte Sachverhalt als konditional kodiert. Ebenfalls lizenzieren beide Partizipien sowohl V2als auch dass-Strukturen mit VL-Stellung. Die von diesen beiden Perfektpartizipien eingeleiteten Strukturen können sowohl mit Konjunktiv als auch mit Indikativ verwendet werden usw. 9 Nur das HDK-2 (2014, S. 782f.) weist am Rande darauf hin, dass sich diese Subklasse der konditionalen Konnektoren in Bezug auf die einzubettende Struktur nicht homogen verhält: Einige Konnektoren wie vorausgesetzt, gesetzt und angenommen betten bevorzugt V2-Strukturen ein, andere - beispielsweise im Falle, dass - sind im Gegenteil dazu im Korpus (DeReKo) deutlich häufiger belegt als ihre V2-Pendants. Anna Volodina 32 scheidende Rolle bei der Frage nach der (Wort-)Wahl von angenommen bzw. vorausgesetzt im Diskurs zu spielen. Denn gerade auf der Ebene des Sprachgebrauchs zeichnen sich deutlich unterschiedliche Präferenzen in ihrer Verwendung ab, die durch detaillierte korpuslinguistische Arbeit aufgedeckt werden können. Aus den obigen Beobachtungen, die an den Beispielen (1) bis (7) skizziert wurden, ergeben sich also drei Fragen, die für die Grammatik eingebetteter V2- Strukturen des Deutschen von besonderer Wichtigkeit sind, was sich auch in der extensiven Forschungsliteratur zu diesem Thema widerspiegelt (Reis 1997; für weitere Literatur siehe Antomo 2015): 1) Welche grammatischen Lizenzierungsbedingungen lassen sich für V2- Strukturen des Deutschen im Allgemeinen und insbesondere für die Strukturen, die durch partizipiale Ausdrücke eingebettet werden, ermitteln? 2) Welche Unterschiede zeigen sich im Gebrauch dieser Strukturen? 3) Wie lassen sich die Gemeinsamkeiten und (vor allem) die Unterschiede in der Verwendung der beiden bedeutungsähnlichen einbettenden Ausdrücke erklären? Von diesen Fragen geleitet beschäftigt sich die vorliegende Studie mit einer wenig erforschten Klasse von Perfektpartizipien, die in der ‘absoluten’ Verwendung ohne Auxiliar sowohl V2als auch dass-Sätze einbetten können. Dies erfolgt in dieser Studie am Beispiel der beiden bedeutungsähnlichen Partizipien angenommen und vorausgesetzt. Dabei wird versucht, die oben skizzierten Fragen auf der Basis einer groß angelegten korpuslinguistischen Studie zu beantworten und damit zu einer theoretischen Diskussion über das Phänomen aus einer neuen Perspektive beizutragen. Im nächsten Kapitel wird zunächst das Phänomen eingeführt und der Forschungsstand kurz skizziert. Dabei werden die zentralen Fragestellungen der Studie erläutert. Im Anschluss wird ein kurzer Überblick über den Aufbau der Studie und die methodischen Schwerpunkte gegeben. 1.2 Phänomen und theoretischer Rahmen annehmen und voraussetzen sind Ausdrücke, mit denen gewöhnlich der Begriff einer Bedingung verbunden ist. Laut Duden-Bedeutungswörterbuch (2002) können diese Verben als sinnverwandte Wörter angesehen werden: Die Bedeutung von voraussetzen wird „als vorhanden, gegeben annehmen“ umschrieben, darüber hinaus wird annehmen als Synonym für voraussetzen angegeben (ebd., S. 1015). Die Bedeutungen dieser Verben sind zwar in bestimmten Verwendungen sicherlich ähnlich (vgl. (8b) vs. (8c)), sie unterscheiden sich Variation im Sprachgebrauch 33 aber dennoch in mehrfacher Hinsicht: So ist annehmen beispielsweise polysem (vgl. (8a) vs. (8b)), voraussetzen dagegen nicht. (8) a. Das Angebot wurde von den mehr als 200 Teilnehmern gerne angenommen. (Mannheimer Morgen, 8.4.2000) b. Leider muss ich annehmen, dass der materielle Wohlstand die besten Eigenschaften des Menschen vertreibt - wobei ich denke, dass dies nicht nur in Deutschland so ist. (Rhein-Zeitung, 19.11.2002) c. Die meisten Eltern wollen das Beste für ihre Kinder, das kann man voraussetzen. (Süddeutsche Zeitung, 19.6.2006, S. 47) Werden die von diesen Verben abgeleiteten Perfektpartizipien angenommen und vorausgesetzt ohne Auxiliar - wie in (9) gezeigt - verwendet, sind sie beide monosem. Es lassen sich darüber hinaus zumindest hinsichtlich der Wahrheitsbedingungen keine oder jedenfalls keine leicht ersichtlichen semantischen Unterschiede mehr feststellen: (9) a. Angenommen, die Erde ist eine Scheibe, dann kann man aus Mannheim Paris sehen. b. Vorausgesetzt, die Erde ist eine Scheibe, dann kann man aus Mannheim Paris sehen. In der Verwendung wie in (9) (nicht aber wie in (8)! ) werden angenommen und vorausgesetzt im Handbuch der deutschen Konnektoren (HDK-1 2003) als ‘Verbzweitsatzeinbetter’ (Terminus nach HDK-1, S. 439ff.) kategorisiert. Das sind Ausdrücke, die V2-Nebensätze einleiten und die im HDK-2 allesamt einer einzigen semantischen Klasse konditionaler Konnektoren zugeordnet werden (HDK-2, S. 692ff.). 10 In dieser Funktion erzeugen sie eine konditionale Relation zwischen einem Matrixsatz (q) und dem Satz (p), den sie einleiten - KOND (p, q), worauf in HDK-2 (2014, S. 718) verwiesen wird. Nach den Angaben in HDK-1 (2003) zählen zu dieser Klasse Perfektpartizipien wie angenommen und vorausgesetzt, darüber hinaus auch gesetzt und unterstellt sowie komplexe Ausdrücke für den Fall; gesetzt den Fall; im Fall(e). In HDK-2 wird vermerkt, dass auch Ausdrücke mit propositionalen Argumenten wie unter der Annahme, (dass) nicht nur VL-, sondern auch V2-Sätze einbetten können (vgl. die Korpusbelege in (10) aus dem Deutschen Referenzkorpus (DeReKo)). 10 Einer der ersten Hinweise auf konjunktional gebrauchte Partizipien findet sich schon bei Paul (1920, S. 90f.): „Aus der Verbindung mit abhängigem Satze haben sich einige dieser Partizipien zu Konjunktionen entwickelt.“ Rath (1971, S. 14), der Pauls Grammatik zitiert, betont, dass „nur wenige Partizipien in der Art einer Konjunktion verwendet werden. Zu ihnen gehören angenommen (daß), vorausgesetzt (daß). Diese konjunktional gebrauchten Partizipien können durch falls substituiert werden.“ Anna Volodina 34 (10) a. Gesetzt, man entscheidet sich für ein Wohn- und ein Arbeitszimmer, muß man darüber nachdenken, wo dann das Bett stehen sollte. (Die Zeit, 3.9.1998, S. 76; zit. nach HDK-1 (2003, S. 441)) b. Denken wir das mal zu Ende: Gesetzt den Fall, Wulff würde gewählt und die Koalition hielte bis zum Ende der Legislaturperiode durch. Dann hätte Wulff 2013 seine Funktion erfüllt und könnte abtreten. (Braunschweiger Zeitung, 29.6.2010, o. S.; zit. nach HDK-2 (2014, S. 776)) c. Unter der Annahme, ein Brand wäre im Heizraum des Besucherzentrums ausgebrochen, wurde die Feuerwehr Petronell alarmiert, und diese rückte auch umgehend am Einsatzort an. (Niederösterreichische Nachrichten, 29.4.2010, o. S.; zit. nach HDK-2 (2014, S. 774)) Zu allen - auch nicht partizipialen - Verbzweitsatzeinbettern (vgl. (11)) existiert jeweils ein strukturelles Äquivalent mit einem unmittelbar darauf folgenden dass und der entsprechenden Verbletztstellung, wie in (12) an konstruierten Beispielen gezeigt. (11) PII = Verbzweitsatzeinbetter nach HDK-1 a. Angenommen unsere Mannschaft siegt dieses Mal, (dann) muss sie beim nächsten Spiel große Erwartungen erfüllen. b. Der Abstieg aus der Oberliga - vorausgesetzt es kommt dazu - wäre keine Katastrophe für den TC Blau-Weiß Bad Kreuznach. (Rhein-Zeitung, 15.6.2002; Erster Saisonsieg - im Blau-Weiß- Visier) (12) PII + dass = komplexer Subjunktor nach HDK-1 a. Angenommen, dass unsere Mannschaft dieses Mal siegt, (dann) muss sie beim nächsten Spiel große Erwartungen erfüllen. b. Vorausgesetzt, dass er sein Handwerk beherrscht, (dann) sollte er für diese Arbeit eingesetzt werden. Da ich mich jedoch im Rahmen dieses Beitrags ausschließlich auf verbale Ausdrücke konzentriere, vertrete ich hier eine von der wortartenübergreifenden syntaktischen HDK-1-Konzeption, die Ausdrücke unterschiedlicher Wortarten unter ‘Verbzweitsatzeinbetter’ subsumiert, etwas abweichende Position bei der Analyse von Perfektpartizipien: Ich gehe davon aus, dass hier ein einbettender Prädikatsausdruck in Form eines Perfektpartizips vorliegt. Mit anderen Worten, auxiliarlos verwendete Perfektpartizipien wie vorausgesetzt bzw. angenommen - sowie auch andere V2-Sätze einbettende Prädikatsausdrücke (vgl. z.B. in (10a)) - brauchen ein propositionales Argument und dieses kann sowohl in Form eines V2-Nebensatzes als auch in Form eines dass-Satzes mit Variation im Sprachgebrauch 35 VL-Stellung eingebettet werden, 11 vgl. Abbildung 1 und die dazu gehörigen Beispiele unter (13). Hinzu kommt die Möglichkeit, die Argumentstelle mit einer Nominalkonstruktion 12 mit propositionaler Bedeutung zu füllen, diese wird hier aber nicht weiter untersucht. abb. 1: pii als einbettender prädikatsausdruck (13) a. Angenommen/ Vorausgesetzt [unsere Mannschaft siegt dieses Mal], (dann) muss sie beim nächsten Spiel große Erwartungen erfüllen. b. Angenommen/ Vorausgesetzt, [dass [unsere Mannschaft dieses Mal siegt]], (dann) muss sie beim nächsten Spiel große Erwartungen erfüllen. Zwar werden Perfektpartizipien wie angenommen und vorausgesetzt in den Handbüchern der deutschen Konnektoren (HDK-1, HDK-2) gemäß der wortartenübergreifenden Definition als ‘Konnektoren’, genau genommen als ‘konditionale Verbzweitsatz-Einbetter’, behandelt, es wird aber in HDK-1 betont, dass Verbzweitsatz-Einbetter „kategoriale Zwitter“ sind und „sowohl Eigenschaften eines Konnektors als auch Eigenschaften eines Prädikatsausdrucks aufweisen“ (HDK-1 2003, S. 446). Dabei listet HDK-1 sämtliche Phänomene auf, die auf die Verwendung von Perfektpartizipien als Prädikatsausdruck hinweisen. 11 Ähnlich werden Strukturen mit provided, supposing usw. im Englischen in Quirk et al. (1985, S. 998) als „complex subordinators ending with optional that“ analysiert. Der Unterschied zu den äquivalenten Strukturen des Deutschen besteht aber darin, dass die Stellung des finiten Verbs in einem englischen Nebensatz mit oder ohne that natürlich unverändert bleibt. 12 Vgl. dazu diesen Beleg: „Beharrlichkeit im Kampf gegen die zähe Bürokratie vorausgesetzt, ergattern sie irgendwann eine Ausreise in die Bundesrepublik Deutschland […].“ (WKB Rheinischer Merkur, 28.7.1989, S. 4; zit. nach HDK-1 (2003, S. 448)). Anna Volodina 36 Demnach können auch angenommen und vorausgesetzt in der ‘absoluten’ Verwendung als Prädikatsausdrücke - nicht nur V2-, sondern auch „eine konstruktionelle Variante mit folgendem dass, das einen Verbletztsatz subordiniert“ einbetten (HDK-1, S. 447); - durch mal modifiziert werden (ebd., S. 446); - „durch ihnen unmittelbar nachgestellte konnektintegrierbare Konnektoren modifiziert werden“, wie beispielsweise allerdings (ebd., S. 447). Außerdem werden einbettende Ausdrücke im Schriftlichen häufig durch ein Komma vom Verbzweitsatz-Einbetter getrennt (ebd., S. 446). Bei der Voranstellung des einbettenden Ausdrucks ist der nachfolgende Satz, der „als Einbettungsrahmen fungieren könnte“, nicht selten durch einen Punkt getrennt, wobei der einbettende Ausdruck und der nachfolgende Satz jeweils eine Intonationsphrase und - im Sinne der IDS-Grammatik (1997) - jeweils eine kommunikative Minimaleinheit bilden (vgl. ebd., S. 447). Die oben beschriebenen Eigenschaften sind charakteristisch für konditionale Verbzweitsatz-Einbetter, nicht aber für den konditionalen Konnektor wenn, weil für wenn diese Kontexte untypisch sind. Andererseits gibt es sämtliche Strukturen, in denen wenn durch angenommen und/ oder vorausgesetzt substituiert werden kann. Eine wichtige Beobachtung in diesem Zusammenhang, die auch auf HDK-1 zurückgeht, ist die integrierte Verwendung von den durch angenommen und vorausgesetzt eingebetteten Ausdrücken im Vorfeld des nachgestellten Satzes, der als Einbettungsrahmen fungiert, vgl. Beispiele unter (13) und (14): (14) a. Wenn unsere Mannschaft dieses Mal siegt, [muss sie beim nächsten Spiel große Erwartungen erfüllen]. b. Angenommen/ Vorausgesetzt, dass unsere Mannschaft dieses Mal siegt, [muss sie beim nächsten Spiel große Erwartungen erfüllen]. c. Angenommen/ Vorausgesetzt, unsere Mannschaft siegt dieses Mal, [muss sie beim nächsten Spiel große Erwartungen erfüllen]. In der Verwendung, die in (14b) und (14c) illustriert wurde, liegt ein syntaktisch unselbstständiger angenommenbzw. vorausgesetzt-Satz vor, der mit dem darauf folgenden „muss sie beim nächsten Spiel große Erwartungen erfüllen“ eine einzige kommunikative Einheit bildet (vgl. HDK-1, S. 448). In diesem Kontext verhalten sich angenommen und vorausgesetzt wiederum wie grammatikalisierte Konnektoren. Die Frage, wie diese Distribution zu erklären ist, ist in der Forschung offen. Variation im Sprachgebrauch 37 1.3 Forschungsstand und Erläuterung der Fragestellung Bei dem Untersuchungsgegenstand handelt es sich um ein in der Germanistik lange vernachlässigtes und zum Teil einseitig (aus der Perspektive des HDK) behandeltes Phänomen, dessen empirische Evaluierung, sei es experimentell oder korpusbasiert, meines Wissens bisher nicht stattgefunden hat. Im Rahmen dieser Studie werden exemplarisch nur die beiden Perfektpartizipien vorausgesetzt und angenommen korpuslinguistisch untersucht. In 1.1 wurden bereits drei Forschungsfragen hinsichtlich V2-Nebensätze einbettender Ausdrücke festgehalten, nämlich 1) die Frage nach den grammatischen Lizenzierungsbedingungen der Strukturen, die durch partizipiale Ausdrücke wie angenommen und vorausgesetzt eingebettet werden, 2) die Frage nach den Parametern der Variation im Sprachgebrauch dieser Strukturen und 3) die Frage nach dem funktionalen Unterschied zwischen den beiden bedeutungsähnlichen einbettenden Ausdrücken. Hier wird kurz der Forschungsstand zu diesen Fragen erörtert. Hinsichtlich der grammatischen Struktur und der Lizenzierungsbedingungen von V2-Nebensätzen gibt es unterschiedliche Erklärungsansätze in der Literatur, was nicht zuletzt darin begründet ist, dass im Deutschen unterschiedliche Typen von V2-Nebensätzen vorliegen, nämlich V2-Komplementsätze, V2- Relativsätze und V2-Adverbialsätze. Reis (1997) argumentiert, dass V2-Komplementsätze VP-Adjunkte sind und an einer strukturell höheren Position rechts adjungiert werden, wodurch ein eigenes assertives Potenzial von V2- Sätzen begründet wird. Meinunger (2004) und Truckenbrodt (2006) gehen dagegen von der obligatorischen Extraposition aus. Für V2-Relativsätze schlägt Gärtner (2002) vor, diese als DP-Adjunkte mit obligatorischer Extraposition zu analysieren. Für V2-Adverbialsätze argumentieren Antomo/ Steinbach (2010), dass weil-V2-Sätze als Wurzel-Phänomene mit einem eigenen illokutiven Potenzial aufzufassen sind, und erweitern die Analyse auf obwohl-V2- Sätze (Antomo/ Steinbach 2013). Unabhängig von dem jeweiligen theoretischen Ansatz wird für alle Typen von V2-Nebensätzen angenommen, dass eine Art Desintegration auf der syntaktischen Ebene vorhanden und je nach der Art der Einbettung „stärker“ oder „etwas schwächer“ ausgeprägt ist. Zu der grammatischen Struktur und Funktion von Verbzweitsatz-Einbettern und darauf folgenden Nebensätzen speziell liegt wenig Forschung vor. 13 Fest steht jedoch, dass die üblichen Ansätze zur Analyse von V2-Nebensätzen 13 An dieser Stelle sind außer HDK-1 (2003) und HDK-2 (2014) lediglich Reis (1997) und Breindl (2009) zu nennen. Letztere setzt sich mit den konditionalen partizipialen Nebensatzeinleitern ausführlicher auseinander und vergleicht V2-Komplemente von konditionalen partizipialen Nebensatzeinleitern mit anderen V2-Nebensätzen. Anna Volodina 38 nicht ohne Weiteres auf den vorliegenden Untersuchungsgegenstand übertragen werden können: Wenn man die Assertionshypothese nach Hooper/ Thompson (1973), die weitgehend auch in der aktuellen Forschung zum Deutschen Konsens ist (vgl. Antomo 2015), annimmt und davon ausgeht, dass nur assertierte, nicht präsupponierte Nebensätze Wurzelphänomene aufweisen können, kann nicht erklärt werden, warum Verbzweitsatz-Einbetter gerade im konditionalen Bereich überhaupt angesiedelt sind. 14 Auf die Möglichkeit des Vorkommens eines V2-Satzes nach verbalen Ausdrücken weisen auch die IDS-Grammatik (1997) sowie Reis (1997) hin. Allerdings wird in Reis (1997) nur voraussetzen in diesem Zusammenhang besprochen, wenn auch nur als Randphänomen: Das Verb voraussetzen (aufgelistet neben klar sein, feststehen usw.; annehmen wird in dieser Liste nicht geführt, vgl. Reis (1997, S. 123)) wird zur Untergruppe ‘Gewissheitsprädikate’ der V2fähigen Bezugsausdrücke in argumentrealisierender Funktion zugeordnet, die den Status von „vermittelten Assertionen“ haben (ebd., S. 122). Prosodisch integrierte (im Sinne von ‘progredient intonierte’) V2-Sätze einbettende Gewissheitsprädikate seien syntaktisch sehr eingeschränkt. Aus diesem Grund unterbleibt eine weitere Analyse dieses Typs in Reis (1997). Mit Bezug auf Reis (1997) wird das Problem in Breindl (2009) wiederaufgenommen und eine mögliche Analyse dieses Phänomens vorgeschlagen, wonach Verbzweitsatz-Einbetter eine fiktive Realität einführen und den Hörer gleichsam auffordern, sich die beschriebene fiktive Realität als eine alternative Welt vorzustellen: „Nimm mal an/ stell dir vor, p ist der Fall“ (Breindl 2009, S. 290). Dies entspricht der Paraphrase in (15): (15) Angenommen p, q: Paraphrase: Nehmen wir mal an, p. Dann gilt auch q. Deshalb kommt Breindl (2009) zu dem Schluss, dass bei den (partizipialen) Verbzweitsatz-Einbettern eine andere Art von Konditionalität vorliegt als bei vollständig grammatikalisierten Konnektoren wie beispielsweise falls. Bei Verbzweitsatz-Einbettern geht es um die „Setzung“ einer alternativen Welt 14 Gegen die Assertionshypothese argumentiert allerdings Reis (2013). Laut Reis korreliere Assertivität nicht mit V2-Stellung und umgekehrt sei es nicht immer der Fall, dass alle abhängigen V2-Sätze assertiv sein müssen. Antomo (2015) plädiert dafür, dass das Phänomen der V2-Stellung im Deutschen nur bedingt mit dem Konzept ‘Assertion’ erklärt werden kann, und schlägt stattdessen einen anderen, nämlich den (Not-)at-issueness-Ansatz, für die Lizenzierung von V2-Stellung im Deutschen vor. Der Begriff „at issueness“ ist ein in der letzten Zeit recht häufig verwendetes Unterscheidungsmerkmal im Bereich der Bedeutung von Aussagesätzen. „Notat-issue“ oder einfach nicht „at-issue“ sind Präsuppositionen und sogenannte konventionelle Implikaturen (Potts 2005), wohingegen die assertierten Bedeutungskomponenten als „atissue“ gelten. Variation im Sprachgebrauch 39 (eine Art ‘Framesetting-Topik’), in der dann der im externen Konnekt genannte Sachverhalt gilt (vgl. Breindl 2009, S. 290; auch HDK-2, S. 775ff.). Dies leuchtet für die Verwendung von vorausgesetzt und angenommen in einem vorangestellten abhängigen Satz unmittelbar ein. Wie jedoch eine solche Analyse auf nachgestellte Verbzweitsatz-Einbetter-Strukturen ausgedehnt werden kann, ist nicht evident. Außerdem wird die syntaktische Variation zwischen V2- und dass-Strukturen mit Verbzweitsatz-Einbettern durch diesen Ansatz überhaupt nicht erfasst. Vor diesem Hintergrund lässt sich noch eine weitere Forschungsfrage formulieren, nämlich, was genau der Unterschied zwischen der Verwendung von vorausgesetzt und angenommen als einbettender Prädikatsausdruck in syntaktischer und funktionaler Hinsicht sein kann. So argumentiert etwa Rath (1971, S. 14), dass beide mit falls ersetzt werden können, was dafür sprechen mag, dass sie auf dieselbe (konditionale) Semantik bzw. auf dieselbe Funktion zurückzuführen sind (zu diesem Schluss kommt auch das HDK-1 (2003)). Beide Perfektpartizipien angenommen und vorausgesetzt können außerdem in sehr ähnlichen grammatischen Kontexten verwendet werden: So haben die von diesen beiden Perfektpartizipien eingebetteten Strukturen z.B. dieselben topologischen Eigenschaften. Dabei unterliegt die Position des untergeordneten Satzes hinsichtlich des Matrixsatzes bis auf eine Ausnahme keinen weiteren Beschränkungen. Und zwar, anders als wenn-Sätze können die sowohl mit angenommen als auch mit vorausgesetzt eingeleiteten Strukturen ausschließlich mit anaphorischen, nicht aber mit kataphorischen Korrelaten wie dann und so vorkommen 15 (vgl. die Beispiele in (16)): (16) a. Wenn die Erde eine Scheibe ist, dann ANAPH kann man aus Mannheim Paris sehen. b. Man kann dann KATAPH aus Mannheim Paris sehen, wenn die Erde eine Scheibe ist. c. Angenommen, (dass)/ Vorausgesetzt, (dass) die Erde ist eine Scheibe (ist), dann ANAPH kann man aus Mannheim Paris sehen. d. *Man kann dann KATAPH aus Mannheim Paris sehen, angenommen, (dass)/ *vorausgesetzt, (dass) die Erde ist eine Scheibe (ist). So gesehen haben angenommen und vorausgesetzt ähnliche grammatische und semantische Möglichkeiten, diese werden von ihnen aber auf unterschiedliche Art und Weise genutzt. Die Suche nach den Unterschieden im tatsächlichen Gebrauch für Strukturen mit vorausgesetzt vs. angenommen soll eine Antwort 15 Eine ähnliche Beobachtung machen auch Reis/ Wöllstein (2010, S. 145) im Falle von (desintegrierten) V1-Konditionalen, vgl.: Hätte/ Hat er wieder einen Job, dann wäre/ ist er wieder glücklich. vs. Er ist *(dann) glücklich, hat/ hätte er wieder einen Job. Anna Volodina 40 darauf liefern, warum Sprecher bzw. Schreiber beispielsweise in bestimmten Kontexten angenommen und nicht vorausgesetzt verwenden und umgekehrt. Für diese Fragestellungen eignet sich eine korpuslinguistische Methode am besten. Da die untersuchten Strukturen im Korpus geschriebener Standardsprache (DeReKo) ausreichend belegt sind, werden keine zusätzlichen Daten aus dem Korpus für gesprochenes Deutsch in die Analyse einbezogen. 1.4 Ziele, Vorgehensweise und der Aufbau der Studie Das Ziel der vorliegenden Studie ist es, durch eine teils maschinelle, teils annotationsbasierte „manuelle“ korpuslinguistische Methode die Variation im Gebrauch von angenommen- und vorausgesetzt-Strukturen mit V2- und VL- Stellung systematisch zu untersuchen. Diese Variation soll aus drei verschiedenen Perspektiven beleuchtet werden: erstens aus der syntaktischen Perspektive in Bezug auf a) die Präferenz von „angenommen“ bzw. „vorausgesetzt“ für die Einbettung von V2vs. dass-Nebensätzen, b) den präferierenden Verbmodus im angenommenvs. vorausgesetzt-Nebensatz und c) die Position des untergeordneten angenommenvs. vorausgesetzt-Satzes relativ zum Matrixsatz; zweitens aus der semantischen Perspektive in Bezug auf die unmittelbare Kookkurrenz mit den vor- und nachgestellten bedeutungsmodifizierenden Ausdrücken und drittens aus der metasprachlichen Perspektive, indem der mögliche Einfluss von Variabilitätsfaktoren - wie MEDIUM, DOMÄNE und REGISTER - auf die Verteilung von angenommen und vorausgesetzt im Korpus mithilfe von Assoziationsplots analysiert wird. Es wird versucht, die Unterschiede im Gebrauch von angenommen und vorausgesetzt mit einem funktional-pragmatischen Ansatz zu erklären. Um dies zu erreichen, werden große Datenmengen gesichtet, nach bestimmten Kriterien teils maschinell, teils händisch annotiert und nach bestimmten Kriterien statistisch ausgewertet. In Teil 2 dieser Studie werden die allgemeine Datensituation und die Methode der Datengewinnung und Datenbeschreibung besprochen. Thema sind dort auch die automatisch und manuell annotierten Kategorien. In Teil 3 werden Ergebnisse korpuslinguistischer Recherche zu angenommen- und vorausgesetzt- Strukturen gemäß der in 1.3 diskutierten Forschungsfragen präsentiert. Es wird hier eine Reihe von Auffälligkeiten diskutiert, die für die Beantwortung der Frage nach dem funktional-pragmatischen Unterschied zwischen angenommen und vorausgesetzt von Wichtigkeit sind. Teil 4 enthält die wichtigsten Schlussfolgerungen aus den in Teil 3 besprochenen Daten sowie einen funktional-pragmatischen Analyseansatz, mit dem sich einige der beobachteten Unterschiede zwischen angenommen und vorausgesetzt erklären lassen. Die Studie endet mit einem kurzen Fazit. Variation im Sprachgebrauch 41 2. Datenbasis und methoden Die Datenbasis für die empirische Untersuchung bildet die KoGra-Datenbank 16 mit dem Release 2015 17 des Deutschen Referenzkorpus (DeReKo, siehe dazu Kupietz/ Lüngen 2014). Das heißt, dass Daten aus der Zeit von 1955 bis 2014 berücksichtigt wurden. Die aus DeReKo extrahierten Datensätze wurden mithilfe von Connexor tokenisiert und getaggt. Im Rahmen der Studie wurden nicht die Lemmata annehmen und voraussetzen, sondern lediglich deren Partizip-II-Formen angenommen und vorausgesetzt in Groß- und Kleinschreibung ohne weitere Flexion berücksichtigt. Um die Menge der Daten für die Nachbearbeitung von Anfang an zu reduzieren und möglichst die der Forschungsfrage nicht entsprechenden Verwendungen auszuschließen, wurden die Daten nach dem folgenden Suchmuster extrahiert: (17) Finde Strukturen innerhalb eines Satzes, diese sollen enthalten: - eines der Interpunktionszeichen . , : ; ! ? ( - - direkt gefolgt von 0 bis 3 Token, von denen keines ein Verb ist und keines das Wort als oder wie enthält - direkt gefolgt von angenommen oder vorausgesetzt (bzw. den Varianten beginnend mit Majuskel) - direkt gefolgt von einem Token, das kein Verb u. keines der Interpunktionszeichen . ! ? ist. Zusammen mit den das Suchmuster enthaltenden Belegen wurden die folgenden Metadaten auf Dokumentebene erhoben: - Jahr (Jahreszahl: 1955-2014) - Medium • Publikumspresse • Bücher • Internet/ Wikipedia • Gesprochenes (verschriftete Sprechsprache) • Sonstiges - Domäne • Fiktion • Kultur/ Unterhaltung 16 Zur KoGra-Datenbank vgl. die Kapitel 1.4 und 2 aus Bubenhofer/ Konopka/ Scheider (2014), speziell zu den Metadaten außerdem Klosa/ Kupietz/ Lüngen (2012). 17 Eine Vorstudie zu vorausgesetzt und angenommen als Verbzweitsatz-Einbetter wurde in Kollaboration mit Hans-Christian Schmitz unter Mitarbeit von Sandra Hansen-Morath, Roman Schneider und Sascha Wolfer durchgeführt (zu den Einzelheiten siehe die Dokumentation in Hansen-Morath et al. (2015)). Das Teilergebnis dieser Vorstudie wurde in HDK-2 (2014, S. 784f.) veröffentlicht. Anna Volodina 42 • Mensch/ Natur • Politik/ Wirtschaft/ Gesellschaft • Technik/ Wissenschaft - Register • Pressetexte (Zeitungen/ Zeitschriften) • sonstige Gebrauchstexte • literarische Texte - Land • Deutschland • Deutschland, Ost • Deutschland, West • Österreich • Schweiz - Region • überregional • Herkunft unbekannt • Herkunft nicht zuzuordnen • Südwest, einschließlich Schweiz • Mittelost • Mittelsüd • Mittelwest • Nordost • Nordwest • Südost, einschließlich Österreich Das KoGra-Untersuchungskorpus wurde manuell für diese Kategorien ausgezeichnet. Extrahiert wurden die die gesuchten Token enthaltenden Sätze zusammen mit einem Kontext von zwei Sätzen vor und zwei Sätzen nach dem Belegsatz. Das Ergebnis der Extraktion aus der KoGra-Datenbank (mit insgesamt 12.889 Texten und 15.868.578 Connexor-Token) waren 291.729 Belege für A/ angenommen-Token und 41.978 für V/ vorausgesetzt-Token. Das entscheidende Kriterium für brauchbare Belege war, dass das reine Partizip II ohne Auxiliar vorkommen muss und dass das semantische und syntaktische Argument als ein finiter Nebensatz (mit V2- oder auch mit VL-Stellung als eingebetteter dass-Satz) realisiert wird. In (18) sind einige typische Beispiele für Verwendungen zu finden, die bereits mit der Extraktion aus KoGra-DB maschinell nach dem Muster in (17) aussortiert werden konnten: (18) a. Angenommen werden Kinderwinterkleider ab Grösse 56 bis Grösse 164, Sportartikel wie Carving- und Kinderskis, Snowboards, Ski- Variation im Sprachgebrauch 43 schuhe und anderes mehr. (St. Galler Tagblatt, 24.7.2010, S. 43; An den Winter denken) b. Da das Wasser nicht wie angenommen im Boden versickern konnte, gab es dort einen Morast. (St. Galler Tagblatt, 25.9.1998, Ressort: WV-FLA (Abk.); Saisonschluss für den »Bergsee«) c. Inzwischen lautet die Frage, welches Ausmaß diese Verquickung angenommen hat, umgibt sich Westerwelle auf seinen Reisen doch mit FDP-Spendern und Geschäftsleuten, mit denen er oder seine Familie verbunden sind. (Mannheimer Morgen, 12.3.2010, S. 2; Das System Guido Westerwelle) d. Die Tatsache, dass der Standort in Hosenruck auf gut 700 Metern Höhe liegt, habe vorausgesetzt, dass eine frühreife Traubensorte gepflanzt werde. (St. Galler Tagblatt, 26.9.2009, S. 49; »Gute Pflege ist der Grundstock«) e. Da wurde mir gesagt, dass heutzutage bei jedem Patienten gewisse Kenntnisse, wie Risiken bei einer Narkose, vorhanden sein sollten. Darf das wirklich vorausgesetzt werden? (Nordkurier, 4.10.2003; Auskunft nur mit Patienten-Zustimmung) f. Die Außerachtlassung allgemeingültiger Sicherheitsregeln ist nach der Rechtsprechung des Bundesgerichtshofes dann grob fahrlässig, wenn die Kenntnis der Regeln nach dem Grad ihrer Verbreitung allgemein vorausgesetzt werden muss. (Nordkurier, 17.8.2005; Versicherung zahlt nur bei genehmigter Feueranlage) Satzdubletten und Belege, die nicht der in dieser Studie untersuchten Verwendung entsprachen, wurden in einem aufwendigen Verfahren 18 zum größten Teil automatisch aussortiert. Darunter fallen folgende Fälle: (19) a. Diese Abstimmung ist demokratisch legitim, und zwar unabhängig davon, ob eine Regierungsvorlage angenommen oder abgelehnt wird. (Protokoll der Sitzung des Parlaments Bundesrat am 8.11.2002, 782. Sitzung, Plenarprotokoll, Berlin) b. Angenommen und verkauft werden Erstkommunions- und Firmungsbekleidung, Kinderbekleidung, Sportartikel, Spielzeug, Fahrräder, Kinderwagen, Fahrrad- und Autositze usw. (Tiroler Tageszeitung, 21.3.2000, Ressort: Allgemein) c. Manna regnete es in der Wüste vom Himmel, hier und heute sollten wir uns erinnern, dass der Mensch im Schweiße seines Angesichts sein Brot erringen muss, und das ist durchaus keine traurige Zukunftsaussicht. Vorausgesetzt: Freude statt Frust an der Arbeit, 18 Für die automatische Bereinigung der Daten bedanke ich mich bei Felix Bildhauer. Anna Volodina 44 Dankbarkeit für das, was wir haben, statt Neid und Missgunst. (Mannheimer Morgen, 26.7.2008, S. 41; Geisteskraft) d. Dies vorausgesetzt, lässt sich dennoch sagen, dass die Phase der Spätaufklärung diejenigen Autoren, beziehungsweise deren Werke, bezeichnet, die parallel zu und nach der beginnenden Frühromantik - in Deutschland bekannt als Sturm und Drang - entstanden, und in denen philosophische Positionen und ästhetische Formen der Aufklärung noch über die Zeit der Französischen Revolution hinaus und bis in die beginnende Romantik hinein fortgeführt wurden. (Spätaufklärung (Literatur), In: Wikipedia - http: / / de.wikipe dia.org/ wiki/ Spätaufklärung_(Literatur): Wikipedia, 2011) e. Gutes Wetter vorausgesetzt, wird es im kommenden Sommer wieder etliche Konzerte im Renaissancehof geben. (Rhein-Zeitung, 28.12.2015, S. 17) Die Anzahl der brauchbaren Belege für angenommen und vorausgesetzt, die die Datengrundlage für diese Studie bilden, hat sich danach auf 39.827 Belege reduziert: Von den 41.978 vorausgesetzt-Belegen, die über KoGra-DB verfügbar sind, wurden 32.878 Belege in die weitere Analyse einbezogen, von den 291.729 angenommen-Belegen lediglich 6.949 Belege, siehe Tabelle 1. total in KoGra-DB PII in ‘absoluter’ Verwendung a/ Angenommen 291.729 6.949 (17%) v/ Vorausgesetzt 41.978 32.878 (83%) ∑ 333.707 39.827 (100%) tab. 1: absolute Werte für angenommen und vorausgesetzt: Vor und nach der Bereinigung Bemerkenswerterweise ist das Verhältnis zwischen der Anzahl der Belege in der ‘absoluten’ PII-Verwendung von angenommen und vorausgesetzt sehr unterschiedlich. Dies wird in Abbildung 2 visualisiert. Auffällig ist, dass angenommen in ‘absoluter’ Verwendung, die im Rahmen dieser Studie weiter untersucht werden soll, unter 3% aller seiner Vorkommnisse liegt. Dies ist u.a. der hohen Polysemie des Verbs annehmen geschuldet: Im WDG (abgefragt durch DWDS unter https: / / dwds.de/ wb/ wdg/ annehmen) werden annehmen sechs verschiedene Bedeutungen zugeschrieben, 19 voraussetzen ist dagegen monosem: Die meisten Vorkommen von vorausgesetzt (ca. 78%) sind ‘absolute’ PII-Verwendungen. 19 Im Grimm’schen Wörterbuch werden für das Verb annehmen sogar 11 Bedeutungen unterschieden (DWB Bd. 1, Sp. 414 bis 418): Manche von ihnen sind heute nicht mehr gebräuchlich oder gelten als „veraltet“. Variation im Sprachgebrauch 45 abb. 2: Verhältnis zw. pii angenommen bzw. vorausgesetzt in ‘ absoluter ’ und in anderer Verwendung - relative Werte Lediglich 17% aller im Rahmen dieser Studie zu untersuchenden Belege sind angenommen-Belege. D.h., dass vorausgesetzt in der zu berücksichtigenden Verwendung fast fünfmal häufiger ist als angenommen. Im Rahmen dieser Studie wird gezeigt, dass vorausgesetzt im Vergleich zu angenommen sowohl syntaktisch als auch funktional viel variabler ist, was diese Verteilung zumindest zum Teil erklären kann. Aus Abbildung 3 wird ersichtlich, dass dieses Verhältnis (17 zu 83) über die Zeit weitgehend unverändert bleibt, d.h., in jedem der Jahre, in dem im DeReKo eine größere Anzahl von Texten vorliegt, ist das Verhältnis weitgehend konstant. abb. 3: Verteilung von pii angenommen und vorausgesetzt in ‘ absoluter ’ Verwendung auf der Zeitachse Anna Volodina 46 In einem weiteren Schritt wurden die bereinigten Daten zusätzlich in Bezug auf die syntaktische Realisierung des durch angenommen bzw. vorausgesetzt eingebetteten Satzes (V2vs. VL-Satz) hin analysiert und halbautomatisch über die gesamte Datenmenge hinweg annotiert. 20 Da Zeitungsbelege größtenteils zu umfangreich für eine genaue automatische Auswertung sind, meist auch ein weiterer Kontext berücksichtigt werden soll und visuelle Hinweise für eine schnelle Belegbearbeitung nicht vorhanden sind, konnten nicht alle Analysen am gesamten Datenset durchgeführt werden. Feinkörnigere syntaktische Analysen konnten beispielsweise nur an repräsentativen Stichproben vorgenommen werden, dies betrifft die Auswertung von topologischen Präferenzen des angenommenvs. vorausgesetzt-Konnekts sowie Verbmodus-Präferenzen des finiten Verbs im internen Konnekt. Alle Daten wurden auf statistische Validität mithilfe von Chi-Quadrat-Tests geprüft, um feststellen zu können, ob die erwarteten Häufigkeiten signifikant von den tatsächlich beobachteten Häufigkeiten abweichen oder nicht. Visualisiert wurden die Analysen in Assoziationsplots in der Statistik- und Programmiersoftware R (R Core Team 2014) über die webbasierte, frei verfügbare Schnittstelle KoGra-R, die im Projekt „Korpusgrammatik“ des IDS von Hans-Christian Schmitz, Sandra Hansen-Morath und Sascha Wolfer entwickelt und beschrieben wurde (http: / / kograno.ids-mannheim.de/ index. html, Stand: 17.12.2018): Die Nutzerinnen und Nutzer von KoGra-R können sowohl Reintext-Tabellen als auch von COSMAS II exportierte Ergebnisansichten zur Analyse hochladen. Für eine ausführliche Darstellung der Prinzipien und Möglichkeiten der Visualisierung von Analyseergebnissen vgl. den Beitrag von Sandra Hansen et al. in diesem Band, siehe auch Hansen- Morath/ Wolfer (2017). 3. Ergebnisse In diesem Abschnitt werden Ergebnisse einzelner Analysen aus der syntaktischen (3.1), semantischen (3.2) und metasprachlichen (3.3) Perspektive dargestellt, woraus ersichtlich wird, dass angenommen und vorausgesetzt im Sprachgebrauch deutlich unterschiedliche Domänen bedienen. 20 Für die zusätzliche halbautomatische Annotation der Daten bedanke ich mich bei Felix Bildhauer. Variation im Sprachgebrauch 47 3.1 Syntaktische Variation 3.1.1 Präferenzen bei der Einbettung einer V2 - und VL - Struktur Die Kernvariation, die aufgrund der extrahierten Daten untersucht werden soll, ist das Verhältnis zwischen der Realisierung des angenommen- und vorausgesetzt-Konnekts in Form eines V2- oder dass-Satzes mit VL-Stellung. Dabei soll die Frage beantwortet werden, ob - wie in HDK-1 und HDK-2 beschrieben - beide Perfektpartizipien V2-Sätze präferieren und ob sie diese in demselben Maße präferieren. Die Ergebnisse der Korpusrecherche werden mit absoluten und relativen Zahlen in Tabelle 2 festgehalten und die relativen Zahlen graphisch in Abbildung 4 dargestellt: einbettender Ausdruck VL-Satz V2-Satz ∑ angenommen 92 (1,3%) 6.857 (98,7%) 6.949 (100%) vorausgesetzt 3.176 (9,7%) 29.702 (90,3%) 32.878 (100%) tab. 2: absolute und relative Werte für angenommen und vorausgesetzt: Vl vs. V2 - Strukturen abb. 4: Vergleich der relativen Häufigkeiten bei V2 vs. Vl - Strukturen für angenommen und vorausgesetzt Sowohl für angenommenals auch für vorausgesetzt-Strukturen wird eine deutliche Präferenz für V2-Strukturen beobachtet, wobei an dieser Stelle hervorgehoben werden soll, dass angenommen-Strukturen fast ausschließlich (98,7%) als V2-Strukturen im Korpus belegt sind. Vorausgesetzt-Strukturen werden dagegen viel häufiger als VL-Satz (9,7%) realisiert als angenommen-Strukturen (1,3%). Der Chi-Quadrat-Test zeigt einen höchstsignifikanten Zusammen- Anna Volodina 48 hang zwischen dem Verbzweitsatz-Einbetter und der Art des Nebensatzes an: X-squared = 528.1267, df = 1, p-value < 2.2e-16. Außerdem wird in dem Assoziationsplot 21 in Abbildung 5 deutlich, dass V2- Nebensätze bei angenommen signifikant überrepräsentiert und bei vorausgesetzt signifikant unterrepräsentiert sind (mit VL-Nebensätzen verhält es sich umgekehrt). abb. 5: assoziationsplot V2vs. Vl-präferenzen für angenommen und vorausgesetzt Vor diesem Hintergrund stellt sich die Frage, inwieweit syntaktische Auffälligkeiten (wie beispielsweise Satz- und Verbmodus bzw. Topologie) mit diesen Präferenzen korrelieren könnten und eventuell wichtige Hinweise für die Beantwortung der Frage liefern, warum angenommen eine stärkere Präferenz für V2-Sätze hat als vorausgesetzt. 3.1.2 Topologische Präferenzen Für die topologische Analyse von Belegen ist die Position des Nebensatzes hinsichtlich des Matrixsatzes entscheidend. Diese kann aus mehreren Gründen nicht zuverlässig genug automatisch ermittelt werden. Der Hauptgrund, warum die Auswertungen für einige syntaktische Fragestellungen im Rahmen 21 Die Breite der Balken zeigt die erwartete Frequenz der Realisierungsvarianten an. Die Höhe der Balken zeigt den Grad der Abweichung vom erwarteten Wert: Balken oberhalb der gepunkteten Linie bedeuten höhere Werte als erwartet, solche unterhalb der Linie bedeuten, dass die Werte niedriger sind als erwartet (vgl. Hansen-Morath et al. in diesem Band). Variation im Sprachgebrauch 49 dieser Studie nicht am kompletten Datenset vorgenommen werden können, ist, dass visuelle Cues für eine schnelle Belegbearbeitung nicht vorhanden sind, was hier an einem Beispiel mit der initialen Groß- und Kleinschreibung gezeigt wird. Werden einbettende Prädikatsausdrücke großgeschrieben, so ist in den meisten Fällen davon auszugehen, dass der eingebettete Satz vor dem Matrixsatz steht, wie dies am Beispiel von Angenommen (siehe (20a)) gezeigt werden kann. (20) a. Angenommen, die nach eigenen Angaben spätestens seit 2006 fußballbegeisterte Merkel hätte auf den Monitor im Dienstzimmer geschaut, so dürfte die Handlungsfähigkeit einige Male auf schwere Proben gestellt worden sein. (Nürnberger Zeitung, 19.6.2010, S. 2) Dagegen signalisiert ein großgeschriebenes Vorausgesetzt in (20b) nicht unbedingt, dass auf den durch das Partizip II eingeleiteten Satz ein Matrixsatz folgt: (20) b. Merkel wird dann zeigen müssen, dass sie nicht nur Schönwetter- Kanzlerin ist. Es gehört nicht viel Prophetie dazu, um vorherzusagen, dass die Politik versuchen wird, Geschenke zu verteilen. Vorausgesetzt, der Wirtschaftsaufschwung hält im kommenden Jahr durch, die Arbeitslosenzahlen sinken weiter, und die Inflation verdirbt den Wählern nicht die Stimmung. (30.12.2007; Hannoversche Allgemeine Zeitung zu Jahreswechsel) Sätze wie in (20b) können durchaus als Kommentare zum vorherigen Satz fungieren und daher dem Nachtrag (im Sinne der IDS-Grammatik 1997; auch Vinckel 2006 und Averintseva-Klisch 2009 zum Unterschied zw. Nachtrag und Nachfeld) zugeordnet werden. Nur eine manuell annotierte Zufallsstichprobe kann in Fällen wie diesen, wo die visuellen Hinweise nicht zuverlässig sind und ein weiterer Kontext berücksichtigt werden muss, ein zuverlässiges Analyseergebnis liefern. Daher wurde die Entscheidung getroffen, die Position eines angenommenbzw. vorausgesetzt-Nebensatzes hinsichtlich des Matrixsatzes (sowie Moduspräferenzen für angenommen und vorausgesetzt, siehe 3.1.3) anhand einer repräsentativen Zufallsstichprobe händisch zu annotieren und dann auf statistische Validität zu prüfen. In der einschlägigen Literatur wird wiederholt darauf hingewiesen, dass die Position sowohl des mit angenommen als auch des mit vorausgesetzt eingeleiteten Nebensatzes hinsichtlich des Matrixsatzes beinahe in allen Fällen (Strukturen mit kataphorischen Korrelaten ausgenommen, vgl. (16)) syntaktisch uneingeschränkt ist, d.h., der Nebensatz kann hinsichtlich des Matrixsatzes anteponiert, postponiert und auch parenthetisch eingeschoben vorkommen, vgl. exemplarisch die Beispiele in (21)-(24). Für die Untersuchung des Sprach- Anna Volodina 50 gebrauchs von angenommenvs. vorausgesetzt-Strukturen ergeben sich folgende Fragen: - Welche topologischen Präferenzen für vorausgesetztvs. angenommen-Strukturen lassen sich korpuslinguistisch ermitteln? - Gibt es eine Korrelation zwischen der topologischen Position des untergeordneten Satzes bezüglich des übergeordneten Satzes und der syntaktischen Realisierung des untergeordneten Satzes als V2- oder VL-Struktur? Dazu wurden insgesamt 392 Belege erhoben und händisch annotiert. Angestrebt wurde eine gleichmäßige Verteilung der zu überprüfenden Varianten. Die Stichprobe umfasst für vorausgesetzt jeweils 100 Belege mit VL- und V2- Nebensatz; für angenommen wurden 100 Belege mit V2-Nebensatz und alle in der Extraktion enthaltenen Beispiele mit VL-Satz ausgewertet (92 Belege, vgl. Tab. 2). Es wurde nach vier Positionen des untergeordneten Satzes hinsichtlich des übergeordneten Satzes im topologischen Feldermodell unterschieden: Vor- Vorfeld, Vorfeld, parenthetischer Einschub, Nachfeld bzw. Nachtrag (zur Diskussion des erweiterten Feldermodells siehe Wöllstein 2014). Bezogen auf die Behandlung anteponierter Strukturen wird vor der linken Satzklammer generell nach den Positionen ‘Vorfeld’ (VF) und ‘Vor-Vorfeld’ (VVF) unterschieden, wobei die ‘Linksversetzung’ (VVF - LV) hier als ein Spezialfall innerhalb der Position ‘Vor-Vorfeld’ (im Sinne der Duden-Grammatik 2016, S. 895f.) behandelt wird. Eine Linksversetzung im Rahmen des Vor- Vorfeldes wird dann angenommen, wenn auf einen angenommenvs. vorausgesetzt-Satz ein mit einem Resumptivum eingeleiteter Matrixsatz folgt. Für die Analyse postponierter Nebensätze ist es nicht notwendig, eine feinere Unterscheidung vorzunehmen, daher wird im Weiteren nicht zwischen ‘Nachfeld’ (NF) und ‘Nachtrag’ (NT) differenziert. Die Belege werden in diesem Fall zusammengezählt. Parenthetisch eingeschobene Strukturen finden sich nicht nur im Mittelfeld des Matrixsatzes, wie in (23c) gezeigt, sondern auch in den sogenannten ‘Parenthesennischen’ (im Sinne von Altmann 1981, S. 38) zwischen den Feldern an den Konstituentengrenzen, siehe beispielsweise (22c). Für jede Position im topologischen Feldermodell und für jeden prädikativen Ausdruck wird in (21)-(24) jeweils ein Beispiel aus der Stichprobe gegeben. An den Belegen soll gezeigt werden, dass die sowohl von angenommen als auch von vorausgesetzt eingebetteten V2- oder VL-Nebensätze dieselben topologischen Eigenschaften haben, worauf bereits in der Literatur hingewiesen wurde. Die Realisierung von vorausgesetzt-Strukturen als V2-Satz im Vor-Vorfeld ist in der Zufallsstichprobe zwar nicht belegt, prinzipiell aber auch möglich, wie an einem Beleg in der Fußnote 22 illustriert. Variation im Sprachgebrauch 51 I) Für angenommen finden sich in der Stichprobe Korpusbelege für alle unterschiedenen Positionen. In (21) werden angenommen-VL-Belege präsentiert, in (22) Belege für angenommen-V2-Strukturen. (21) angenommen + eingebettete VL-Struktur: Vor-Vorfeld (VVF bzw. Linksversetzung): a. Angenommen, dass dies zu zeigen das Anliegen der Inszenierung ist, dann hat sie schlicht zu kurz gegriffen. (Mannheimer Morgen, 6.4.2002) Vorfeld (VF): b. Angenommen, dass eine mündliche Abrede ausreichte, bleibt nach Aktenlage weiter unerfindlich, wann und wie diese Abrede Rechtskraft erlangt haben soll. (Süddeutsche Zeitung, 18.8.2007, S. 31) parenthetisch eingeschoben: c. Sie verweisen darauf, dass Demjanjuk - angenommen, dass er tatsächlich in Sobibor Dienst leistete - keine andere Wahl gehabt hätte, als den Anweisungen der SS Folge zu leisten. (Süddeutsche Zeitung, 14.1.2010, S. 7) postponiert (Nachfeld oder Nachtrag): d. Am 28. Oktober 1975, dem 41. Verhandlungstag des Prozesses in Stammheim, gab Ulrike Meinhof eine Erklärung ab: „Wie kann ein isolierter Gefangener den Justizbehörden zu erkennen geben, angenommen, daß er es wollte, daß er sein Verhalten geändert hat? “ (Die Zeit, 10.5.1996; „Natürlich kann geschossen werden“, S. 44) (22) angenommen + eingebettete V2-Struktur: Vor-Vorfeld (VVF bzw. Linksversetzung): a. Aber angenommen, Sie planten eine partizipative Ausstellung: Welche Kriterien müsste sie erfüllen? (die tageszeitung, 22.1.2013, S. 23) Vorfeld (VF): b. Angenommen der Bürger hat zehn „Dreier“ (also 30 Stimmen) an Kandidaten anderer Listen vergeben und kreuzt dann Partei A an, erhalten die ersten 40 Kandidaten auf der angekreuzten Liste jeweils eine Stimme. (Nürnberger Zeitung, 8.3.2014, S. 13) parenthetisch eingeschoben: c. Bei der schwierigen Abwägung in dieser Partei zwischen Rot und Blau - einmal angenommen, sie rutscht noch auf Platz zwei -, kommt nun ein neues Argument hinzu […]. (Die Presse, 9.10.1999, Ressort: Seite Zwei; Haiders hitzige Helfer) Anna Volodina 52 postponiert (Nachfeld oder Nachtrag): c. Durch die Festlegung auf ein Referendum (mit sehr unsicherem Ausgang) etwa, das völlig überflüssig ist: Denn wenn seine Partei sich für den Nato-Beitritt entschlösse, wären vier von fünf Parteien dafür (einmal angenommen, die FP fällt nicht schon wieder um und der VP-Provinzialismus fürchtet sich nicht schon wieder vor einem Wahltag) (Die Presse, 17.5.1997, Ressort: Seite Zwei). II) In (23) werden nun vorausgesetzt-VL-Belege aus der Stichprobe präsentiert, in (24) Belege für vorausgesetzt-V2-Strukturen. Anders als bei angenommen findet sich für vorausgesetzt in der Zufallsstichprobe kein einziger Beleg für die Position im VVF für eine V2-Struktur (siehe dazu die Erläuterung in der Fußnote 22): (23) vorausgesetzt + eingebettete VL-Struktur Vor-Vorfeld (VVF bzw. Linksversetzung): a. Vorausgesetzt, daß die institutionellen Reformen mehr Föderalismus hervorbringen - dann wäre es richtig, die Direktwahl des Präsidenten anzusteuern: ein Präsidialsystem, das aber zugleich die Macht der Exekutive und die Möglichkeiten ihrer parlamentarischen Kontrolle stärken würde. (Der Spiegel, 8.8.1994, Ressort: Gespräch; „Ich habe Nerven aus Stahl“, S. 117) Vorfeld (VF): b. Vorausgesetzt, dass diese Prognosen der Parteien stimmen, bleiben nur noch drei Sitze, um welche die Parteien kämpfen können. (St. Galler Tagblatt, 13.8.2008, S. 37) parenthetisch eingeschoben: c. In der Zusammensetzung der Dinge, ihrer Anordnung und zufälligen Auswahl war eine geheime Schrift verborgen, die er - vorausgesetzt, daß er nicht betrunken war - hin und wieder lesen konnte. (Die Presse, 21.2.1998, Ressort: Spectrum/ Literaricum) postponiert (Nachfeld oder Nachtrag): d. Dieser Schritt könnte den Weg ebnen zu neuen Krisengesprächen, vorausgesetzt, dass nicht anderswo neue Kämpfe aufflammen. (Süddeutsche Zeitung, 21.4.2012, S. 10) (24) vorausgesetzt + eingebettete V2-Struktur Vor-Vorfeld (VVF bzw. Linksversetzung): a. (keine Belege in der Stichprobe) 22 22 Die Position des vorausgesetzt-Satzes im Vor-Vorfeld ist zwar im Allgemeinen im Korpus selten, es finden sich dennoch vereinzelt Belege, in denen der Sachverhalt des übergeordneten Satzes Variation im Sprachgebrauch 53 Vorfeld (VF): b. Vorausgesetzt, die Nachfrage ändert sich nicht, rechnet die Kommune mit Mehreinnahmen (vor allem durch die so genannten Langbucher) in Höhe von 470 000 Euro. (Nürnberger Nachrichten, 8.2.2006) parenthetisch eingeschoben: c. Der SV will dem TuS Hackenheim - vorausgesetzt der patzt in Planig - den Spitzenplatz wieder abluchsen. (Rhein-Zeitung, 4.10.2008) postponiert (Nachfeld oder Nachtrag): d. Getauscht werden konnte alles, vorausgesetzt, es war noch funktionstüchtig. (Braunschweiger Zeitung, 24.4.2007) Zur Beantwortung der ersten zum Beginn dieses Abschnittes gestellten Frage, ob und welche Präferenzen die von angenommen und vorausgesetzt eingebetteten V2- oder VL-Strukturen hinsichtlich der Position im übergeordneten Satz haben, wurden 392 Belege ausgewertet. Das Ergebnis der Auswertung ist in der Tabelle 3 abgebildet. Position des eingebetteten Satzes im topologischen Feldermodell angenommen vorausgesetzt VL V2 VL V2 VVF (oder LVS) 51 55% 87 87% 1 1% VF 27 30% 11 11% 12 12% 5 5% parenth. eingeschoben 3 3% 1 1% 6 6% 3 3% NF oder NT 11 12% 1 1% 81 81% 92 92% ∑ 92 100% 100 100% 100 100% 100 100% tab. 3: topologische präferenzen von angenommen vs. vorausgesetzt - Strukturen: Ergebnis der auswertung einer Zufallsstichprobe in absoluten und relativen Zahlen (vgl. Volodina 2018, S. 73) Wie aus Tabelle 3 ersichtlich, weisen angenommen- und vorausgesetzt-Strukturen trotz der gleichen topologischen (grammatischen) Eigenschaften unterschiedliche Präferenzen im tatsächlichen Gebrauch auf: angenommen-Konnekte zeigen eine starke Präferenz für die Anteposition, vor allem kommen sie präferiert im Vor-Vorfeld vor, während vorausgesetzt-Konnekte präferiert nachgestellt vorkommen. im Fragemodus realisiert wird, so wie in dem hier zitierten Beleg gezeigt: Dr. Udo Willi Koegler: Vorausgesetzt der Zukunftsvertrag wird unterschrieben, welche 10 konkreten Themen über organisatorische Neuordnungen werden angegangen und mit welchen Folgen (Vorteile/ Nachteile) für die Bürger? (Braunschweiger Zeitung, 26.11.2012; OB Klaus Mohrs: Die derzeitigen Grenzen werden keinen Bestand haben) Anna Volodina 54 Zur Beantwortung der zweiten Frage nach einer möglichen Korrelation zwischen der topologischen Position und der syntaktischen Realisierung des untergeordneten Satzes als V2- oder VL-Struktur wird der Vergleich zwischen angenommen und vorausgesetzt getrennt nach der syntaktischen Realisierung des von ihnen eingebetteten Satzes vorgenommen. Das Ergebnis ist in Abbildung 6a und in Abbildung 6b zu sehen. Das sind zwei Assoziationsplots: der erste - Abbildung 6a - für VL-Strukturen, der darauf folgende - Abbildung 6b - für V2-Strukturen mit angenommen und vorausgesetzt. abb. 6a: assoziationsplot für die topologischen präferenzen für angenommen - vs. vorausgesetzt - Sätze als Vl - Strukturen (vgl. Volodina 2018, S. 74) abb. 6b: assoziationsplot für die topologischen präferenzen für angenommen - vs. vorausgesetzt - Sätze als V2 - Strukturen (vgl. Volodina 2018, S. 74) Variation im Sprachgebrauch 55 Dieses Ergebnis lässt sich wie folgt interpretieren: Die Assoziationsplots in Abbildung 6a und 6b unterscheiden sich kaum. Das heißt, dass der Unterschied zwischen der Anzahl der Treffer mit VL- und mit V2-Stellung über die zwei PII angenommen und vorausgesetzt hinweg kaum vorhanden ist; mit anderen Worten, die Verbstellung spielt allgemein eine untergeordnete Rolle. Im Vergleich zwischen angenommen und vorausgesetzt zeigt sich zunächst, dass es deutliche Unterschiede gibt: Sowohl VL-Nebensätze (X-squared = 107.9611, df = 3, p < .001) - siehe Abbildung 6a - als auch V2-Nebensätze (X-squared = 177.2909, df = 3, p < .001) mit angenommen - siehe Abbildung 6b - sind im Vor- Vorfeld überrepräsentiert, wohingegen nach den beiden syntaktischen Mustern realisierte vorausgesetzt-Strukturen in der gleichen Position stark unterrepräsentiert sind. Dagegen sind vorausgesetzt-Nebensätze (sowohl in Form eines V2als auch eines VL-Satzes) überrepräsentiert im Nachfeld (ggf. Nach- Nachfeld), angenommen-Strukturen dagegen unterrepräsentiert. In diesen beiden Fällen handelt es sich um ein hochsignifikantes Ergebnis. Im Vorfeld und im Mittelfeld kommen beide Strukturen gelegentlich vor, der Unterschied zwischen ihnen ist aber zumindest in der ausgewerteten Stichprobe nicht signifikant. Zusammenfassend lässt sich festhalten, dass angenommen und vorausgesetzt jeweils zwar identische syntaktische Strukturen lizenzieren, aber jeweils wiederum stark unterschiedliche topologische Präferenzen im Sprachgebrauch (hinsichtlich der Realisierung des Nebensatzes in Bezug auf den Matrixsatz) aufweisen. Während die von angenommen eingebetteten Strukturen in der Anteposition (Vor-Vorfeld und Vorfeld) dominieren, dominieren die von vorausgesetzt eingebetteten Strukturen in der Postposition (Nachfeld und Nachtrag). Dabei konnte kein statistisch signifikanter Zusammenhang zwischen der syntaktischen Realisierung der eingebetteten Struktur als V2- oder VL-Satz und der präferierten topologischen Position bzw. der Wahl des prädikativen Ausdrucks festgestellt werden. 3.1.3 Verbmodus - Präferenzen Die nächste Frage, die von besonderer Relevanz für die funktionalen Unterschiede zwischen angenommen- und vorausgesetzt-Sätzen sein könnte, betrifft die Wahl des Verbmodus im Nebensatz je nach dem einbettenden Ausdruck und je nach der Stellung des finiten Verbs im eingebetteten Satz. In der einschlägigen Literatur wurde der Einfluss des Konjunktivs auf die Einbettung bzw. auf die Unmöglichkeit der Einbettung eines V2-Satzes viel diskutiert (siehe Kaufmann 1972; Fabricius-Hansen 1997; Reis 1997; Fabricius-Hansen/ Sæbø 2004; Haegemann 2012). In Reis (1997) wird am Beispiel des Vollverbs Anna Volodina 56 voraussetzen auf den Zusammenhang zwischen der syntaktischen Realisierung und dem Modus des finiten Verbs im eingebetteten Satz explizit hingewiesen: Demnach zählt Reis (1997) das Vollverb voraussetzen - wie bereits in 1.3 erwähnt - zu den Vertretern der Gruppe „Gewissheitsprädikate“, die u.a. dadurch charakterisiert werden, dass sie keinen Konjunktiv zulassen und nur eingeschränkt V2-Sätze einbetten. Letzteres trifft, wie wir bereits gesehen haben, nur bedingt auf das PII vorausgesetzt in der ‘absoluten’ Verwendung zu; im Vergleich zu dem ähnlich verwendeten PII angenommen bettet vorausgesetzt dennoch signifikant häufiger dass-Strukturen ein als angenommen, das fast ausschließlich V2-Sätze lizenziert. In HDK-2 wurde bereits darauf hingewiesen, dass angenommen- und vorausgesetzt-Strukturen mit vollständig grammatikalisierten PII in allen Verbmodi belegt sind (2014, S. 778), ob und welche Verbmodus-Präferenzen diese PII haben, wurde im HDK-2 allerdings nicht erläutert. 3.1.3.1 Korrelation zwischen Verbmodus, Topologie und der Wahl des einbettenden Ausdrucks Als Nächstes wird der Frage nachgegangen, ob innerhalb der ausgewerteten Stichprobe (vgl. 3.1.2) der Verbmodus im eingebetteten Satz in irgendeiner Weise mit den topologischen Präferenzen zusammenhängt. Da oben bereits gezeigt werden konnte (vgl. Abb. 6a und 6b), dass die Stellung des finiten Verbs im angenommenbzw. vorausgesetzt-Nebensatz keine Rolle für topologische Präferenzen spielt, wird der Frage nach dem Effekt des Verbmodus allgemein ohne die Berücksichtigung der Verbstellung innerhalb des Nebensatzes nachgegangen. Dafür wurde dieselbe Stichprobe (vgl. 3.2.1) für 200 vorausgesetzt-Belege und 192 angenommen-Belege manuell nachannotiert. Dabei wurde annotiert, ob das Verb im V2bzw. VL-Nebensatz mit angenommen bzw. vorausgesetzt im Indikativ oder im Konjunktiv (Konj-I, Konj-II oder als würde-Form) erscheint. Das Ergebnis ist in der Tabelle 4 festgehalten. Es zeigt sich, dass sowohl angenommenals auch vorausgesetzt-Nebensätze - unabhängig von der topologischen Position des von ihnen eingebetteten Satzes im Verhältnis zum übergeordneten Satz - in der Stichprobe bevorzugt mit dem Verbmodus Indikativ verwendet werden. Außerdem sind sowohl parenthetisch eingeschobene angenommenals auch vorausgesetzt-Nebensätze im Konjunktiv in der Stichprobe nicht belegt. Variation im Sprachgebrauch 57 Position des NS im topologischen Feldermodell angenommen vorausgesetzt IND KONJ IND KONJ VVF oder LVS 97 50,5% 41 21,4% 1 0,5% VF 32 16,7% 6 3,1% 16 8,0% 1 0,5% parenth. eingeschoben 4 2,1% 9 4,5% NF oder NT 11 5,7% 1 0,5% 163 81,5% 10 5,0% ∑ 144 75% 48 25% 189 94,5% 11 5,5% 192 Belege = 100% 200 Belege = 100% tab. 4: korrelation zw. Verbmodus, topologie und Semantik (angenommen vs. vorausgesetzt): Ergebnis der auswertung einer Zufallsstichprobe (relative Werte) 23 (vgl. Volodina 2018, S. 75) Auffällig ist, dass angenommen fünfmal häufiger mit Konjunktiv belegt ist als vorausgesetzt. Dieser Kontrast wird noch deutlicher, wenn man bedenkt, dass 2/ 3 der in der Stichprobe vorhandenen vorausgesetzt-Belege mit Konjunktiv im Nebensatz eine indirekte Redewiedergabe mit Konjunktiv I beinhalten, wie in (26d) gezeigt. Im Gegensatz dazu handelt es sich nur bei 1/ 5 aller angenommen-Belege mit Konjunktiv im Nebensatz um Fälle von indirekter Rede, vgl. (25d). Der 3D-Assoziationsplot 24 in Abbildung 7 veranschaulicht den Befund: abb. 7: 3d assoziationsplot: korrelation zw. topologie und Verbmodus für angenommen vs. vorausgesetzt - Sätze 23 Die verwendeten Abkürzungen: Vor-Vorfeld = VVF, Linksversetzung innerhalb des Vor-Vorfeldes = VVF (LV), Vorfeld = VF, Nachfeld bzw. Nachtrag = NF bzw. NT. 24 Für die Erstellung des 3D-Assoziationsplots sowie für die Beratung bei der statistischen Auswertung der Daten bedanke ich mich bei Sandra Hansen-Morath. Anna Volodina 58 Die in dem Assoziationsplot (siehe Abb. 7) präsentierten Ergebnisse zeigen, dass rechtsperiphere vorausgesetzt-Konnekte (Position Nachfeld oder Nachtrag) mit dem Verbmodus Indikativ signifikant 25 überrepräsentiert sind (vgl. dazu einschlägige vorausgesetzt-Belege in (23) und (24)). Linksperipher verwendete angenommen-Konnekte (Position Vor-Vorfeld und Linksversetzung) sind sowohl mit Indikativ als auch mit Konjunktiv signifikant überrepräsentiert. Vorausgesetzt-Konnekte, insbesondere mit Indikativ, sind aber in dieser Position signifikant unterrepräsentiert. Dass vorausgesetzt-Belege im Vor- Vorfeld oder in Linksversetzung mit Konjunktiv nur marginal signifikant unterrepräsentiert sind, bedeutet aber nicht, dass vorausgesetzt mit Strukturen in der linksperipheren Verwendung den Konjunktiv dem Indikativ vorzieht (genau das Gegenteil scheint der Fall zu sein). Vielmehr liegt diese Beobachtung an der Interaktion von zwei Tatsachen: Einerseits sind weniger vorausgesetzt-Belege im Vor-Vorfeld oder linksversetzt, andererseits kommen nur ganz wenige vorausgesetzt-Belege überhaupt im Verbmodus Konjunktiv vor. Zur Illustration des Befunds werden im Weiteren Korpusbelege für die entsprechenden topologischen Positionen angegeben. In (21)-(24) wurden bereits Korpusbelege für unterschiedliche topologische Positionen von angenommen- V2- und -VL-Strukturen mit dem Verbmodus Indikativ im Nebensatz präsentiert. Daher werden in (25) (für angenommen) und (26) (für vorausgesetzt) ausschließlich entsprechende Korpusbelege mit Verbmodus Konjunktiv gezeigt. (25) angenommen + KONJ-I oder KONJ-II: Vor-Vorfeld (VVF bzw. Linksversetzung): a. „Auf viele Fragen von Kindern gibt es keine einfachen Antworten“, sagte sie. Das gelte aber auch für Erwachsene. „Angenommen, man könnte eine Zeitreise machen und den Apostel Paulus selbst fragen, was hätte er wohl geantwortet? “ (Mannheimer Morgen, 25.4.2000; Bläser spielen mit Verstärkung) Vorfeld (VF): b. Angenommen, durch die Verlängerung der Restlaufzeit von AKWs würde sich der Anteil des Atomstroms am in Deutschland verbrauchten Strom zehn Jahre lang um sieben Prozent erhöhen, hätte der Verbraucher davon umgerechnet einen Preisvorteil von 0,175 Cent pro Kilowattstunde. (Hamburger Morgenpost, 8.7.2008, S. 4; Vorteil Nur 50 Cent im Monat) parenthetisch eingeschoben: c. (keine Belege in der Stichprobe) 25 Statistische Signifikanz der Daten wurde nach dem Chi-Quadrat-Test ermittelt: X-squared = 1211.918, df = NA, p-value = 0.0004998. Diese Angaben beziehen sich auf die komplette Verteilung. Variation im Sprachgebrauch 59 postponiert (Nachfeld oder Nachtrag): d. Ich fürchte eher eine wachsende antizentralistische und daher antieuropäische Protestbewegung. In vieler Hinsicht verständlich, solange man nicht einsehen will, dass entweder Europa (einschließlich Italien) authentisch föderalistisch wird oder es kein Europa geben wird. Und dass die gemeinsame Währung allein nicht ausreicht, um eine gemeinsame Zukunft zu planen - immer angenommen, dass für den unterzeichnenden 55-Jährigen die Zukunft ein besserer Ort sein möge. (Süddeutsche Zeitung, 12.5.2014, S. 2; Außenansicht) (26) vorausgesetzt + KONJ-I oder KONJ-II: Vor-Vorfeld (VVF bzw. Linksversetzung): a. (keine Belege in der Stichprobe) Vorfeld (VF): b. Gschwend und Norpoth sind sicher, dass sie auch mit ihrer Wahlprognose für den 18. September ins Schwarze treffen. Die Voraussage: 42 Prozent für Rot-Grün, und vorausgesetzt, dass die Linkspartei auf acht Prozent komme, reiche es für Schwarz-Gelb nicht. (Die Südostschweiz, 8.9.2005; Die SPD ist nach TV-Duell im Aufwind) parenthetisch eingeschoben: c. (keine Belege in der Stichprobe) postponiert (Nachfeld oder Nachtrag): d. Im vergangenen Jahr legte die von Generalsekretär Kofi Annan ernannte „Weltkommission für Internationale Migration“ ihren ersten Bericht vor. Darin wird ein Grundrecht auf Migration proklamiert, vorausgesetzt natürlich, dass sie freiwillig sei . (Süddeutsche Zeitung, 8.11.2006, S. 14) e. Eine anschließende Markteinführung würde mit einem Zuschuß von 20 Millionen Mark gefördert - vorausgesetzt, die Städte (und eventuell die Wirtschaft) würden sich mit einer gleichen Summe beteiligen. (Nürnberger Nachrichten, 27.4.1998, S. 14) Damit lässt sich festhalten, dass die Wahl des Verbmodus und die Wahl der topologischen Position dieser beiden Konstruktionen voneinander abhängen: Im Falle von vorausgesetzt liegt eine viel stärkere Präferenz für Indikativ als für Konjunktiv in fast allen topologischen Positionen gegenüber linksperipher realisierten angenommen-Konnekten vor. Bei den Letzteren spielt der Verbmodus im Nebensatz keine entscheidende Rolle. Sie sind sowohl mit Indikativ als auch mit Konjunktiv signifikant überrepräsentiert. Dies lässt aber Anna Volodina 60 die Frage offen, wie der Verbmodus mit der Realisierung des eingebetteten Satzes als eine V2- oder VL-Struktur bzw. mit angenommen und vorausgesetzt korreliert. 3.1.3.2 Korrelation zw. Verbmodus, syntaktischer Realisierung des angenommen vs. vorausgesetzt - Nebensatzes und der Position im Vorfeld Um die Frage nach dem Zusammenhang zwischen Verbmodus und der syntaktischen Realisierung des angenommen vs. vorausgesetzt-Konnekts beantworten zu können, wurde ebenfalls eine Zufallsstichprobe von insgesamt 327 Belegen (jeweils 100 Belege pro Bedingung - ausgenommen angenommen-VL-Strukturen, da nur 27 Belege im Vorfeld aus insgesamt 92 vorhanden waren) erhoben und manuell ausgewertet. Dabei wurde unterschieden, ob das finite Verb im Nebensatz im Indikativ oder im Konjunktiv I oder II (eventuell als würde-Form) erscheint. Die Annotation beschränkt sich in diesem Fall auf diejenigen Fälle, in denen der angenommenbzw. vorausgesetzt-Satz im Vorfeld des Matrixsatzes vorkommt. Der Grund für diese Beschränkung hängt mit der in 3.1.3.1 gemachten Beobachtung zusammen, dass die Position im Vorfeld des Matrixsatzes möglicherweise wichtige Hinweise bezüglich des Unterschieds zwischen angenommen und vorausgesetzt liefern könnte. Die Anzahl einschlägiger Belege in der Stichprobe (siehe 3.1.3.1) war aber nicht groß genug, um belastbare Schlüsse ziehen zu können. Daher soll diese Arbeitshypothese nun hier anhand der neu erhobenen Zufallsstichprobe überprüft werden. Dafür werden nur diejenigen angenommen- und vorausgesetzt-Belege als V2- und VL-Struktur in die Analyse einbezogen, die dieselbe topologische Position - im Vorfeld des Matrixsatzes - aufweisen. Die absoluten Zahlen für die Annotation für angenommen und vorausgesetzt sind in der Tabelle 5 ersichtlich. Schon ein kurzer Blick auf die Ergebnisse reicht aus, um festzustellen, dass angenommen-Strukturen, die V2-Sätze einbetten, deutlich häufiger mit Konjunktiv verwendet werden als die entsprechenden Strukturen mit vorausgesetzt. Dieses vorläufige Ergebnis wird auf statistische Validität mithilfe von Chi-Quadrat-Tests geprüft und mithilfe eines Assoziationsplots visualisiert. eingebetteter Satz als angenommen vorausgesetzt IND KONJ IND KONJ V2-Satz 62 38 94 6 VL-Satz 26 1 92 8 127 Belege 200 Belege tab. 5: angenommen - und vorausgesetzt - Strukturen im Vorfeld: korrelation zw. Verbmodus, Syntax (V2 - oder Vl - Satz) und Semantik (angenommen vs. vorausgesetzt), absolute Zahlen Variation im Sprachgebrauch 61 Für die jeweiligen Merkmalskombinationen wird im Weiteren jeweils ein Beispiel aus der Stichprobe pro lexikalische Realisierung des Prädikatsausdrucks gegeben: (27) angenommen + IND oder KONJ (V2 + VL): a. Angenommen, dass alle aus dem ehemaligen Jugoslawien stammenden Einwohner der Region Gaster-See diese Geldüberweisungen praktizieren, gehen monatlich rund 1,3 Millionen Franken aus dieser Region ins Ausland. (Die Südostschweiz, 20.12.2005; Zwischen Stuhl und Bank? ) (IND VL) b. Angenommen, BLLV und Bayerischer Elternverband überwinden alle Hürden, muss sich Frau Hohlmeier fragen lassen, warum sie die Situation zusätzlich verschärft hat. (Nürnberger Nachrichten, 29.9.1999, S. 21; Trickreich - Hohlmeier erhöht den Einsatz) (IND V2) c. Angenommen, dass ein paar Deutschsprechende in der Gemeinde zuziehen würden und dann neu 62 Prozent Deutschsprechende und 38 Prozent Romanischsprechende in der Gemeinde wohnen würden, wäre die Gemeinde immer noch einsprachig, bis eine Abstimmung über die Änderung von einer einsprachigen zu einer mehrsprachigen Gemeinde angenommen wäre. (Die Südostschweiz, 31.5.2007; Deutschsprachige diskriminiert? ) (KONJ VL) d. Angenommen, sie würden für eine Abspaltung von Bosnien stimmen, wäre Kroatien gezwungen, für die in Bosnien-Hercegovina lebenden Kroaten das Recht einzufordern, ebenfalls über die eigene Zukunft zu entscheiden, was zur Auflösung dieses zerbrechlichen Staatsgebildes führen könnte. (St. Galler Tagblatt, 5.4.2012, S. 46; Erwischt? ) (KONJ V2) (28) vorausgesetzt + IND oder KONJ (V2 + VL): a. Vorausgesetzt, dass diese Prognosen der Parteien stimmen, bleiben nur noch drei Sitze, um welche die Parteien kämpfen können. (St. Galler Tagblatt, 13.8.2008, S. 37; 12 Personen wollen in den Stadtrat) (IND VL) b. Vorausgesetzt, die Rahmenbedingungen sind für beide gleich, bin ich guten Mutes, dass sich die Altstadt auch in Zukunft gut mausern wird. (Die Südostschweiz, 24.12.2011, S. 7) (IND V2) c. Vorausgesetzt, dass dadurch die Leistung der Hochschulen verbessert und Fördermöglichkeiten für Bedürftige geschaffen würden, kämen nach München nur noch Abiturienten mit gutem finanziellen Hintergrund und mit entsprechend guten Noten. (Süddeutsche Zeitung, 29.1.2005, S. 46) (KONJ VL) Anna Volodina 62 d. Vorausgesetzt die Hamburger Wirtschaft wachse mit zwei Prozent spürbar schneller als in der Vorperiode mit 1,5 Prozent, sei eine Expansion der Bilanzsumme um wiederum sechs Prozent drin. (Frankfurter Rundschau, 26.4.1997, S. 10, Ressort: WIRTSCHAFT; Sparkasse webt Kundenzentren ins Netz / Gewinn steigt) (KONJ V2) Zur Verifikation der Arbeitshypothese werden angenommen- und vorausgesetzt- Strukturen hinsichtlich des Verbmodus im Nebensatz verglichen, und zwar in einem ersten Schritt unabhängig von der syntaktischen Realisierung des Nebensatzes. Der erste Befund ist wie folgt: Die meisten sowohl vorausgesetztals auch angenommen-Strukturen (93% vs. 70%) werden mit dem Verbmodus Indikativ im Nebensatz realisiert. Nur 7% aller analysierten vorausgesetzt-Strukturen im Vorfeld weisen den Verbmodus Konjunktiv im Nebensatz auf. 26 Im Falle von angenommen sind das 30%. Dieses Ergebnis wird mithilfe eines Assoziationsplots in Abbildung 8 visualisiert. abb. 8: assoziationsplot: korrelation zw. prädikatsausdruck und Verbmodus für angenommen vs. vorausgesetzt - Sätze Es wird deutlich, dass der Verbmodus Konjunktiv bei den angenommen-Strukturen signifikant (X-squared = 30.427, df = 1, p-value = 3.467e-08) überrepräsentiert, bei den vorausgesetzt-Strukturen entsprechend unterrepräsentiert ist. angenommen-Strukturen lassen den Konjunktiv leichter zu. 26 Dabei ist zu berücksichtigen, dass die meisten vorausgesetzt-Belege im Konjunktiv eine indirekte Redewiedergabe beinhalten, wie an den Belegen in (28c) und (28d) gezeigt. Variation im Sprachgebrauch 63 Die Frage, die sich hier anschließt, ist, ob es einen Zusammenhang zwischen der Verbstellung im Nebensatz und der Moduswahl gibt. Wir werten dies unabhängig von der Wahl des Konnektors aus, d.h., der einzige Prädiktor des Verbmodus in diesem Fall ist die Wahl der Verbstellung im Nebensatz. Wie erwartet werden die meisten Belege sowohl mit VL- (93%) als auch mit V2- Stellung (78%) indikativisch verwendet. Klare Unterschiede zeigen sich wiederum bei der Realisierung dieser Strukturen im Konjunktiv: V2-Nebensätze werden ca. dreimal häufiger mit Konjunktiv verwendet als VL-Nebensätze (22% vs. 7%). 27 Dieses Ergebnis wird in Abbildung 9 visualisiert. Die in dem Assoziationsplot in Abbildung 9 präsentierten Ergebnisse zeigen, dass V2-Strukturen im Konjunktiv in der Stichprobe signifikant (X-squared = 11.646, df = 1, p-value = 0.0006433) überrepräsentiert sind und VL-Strukturen im Konjunktiv dagegen unterrepräsentiert. V2-Strukturen scheinen daher den Konjunktiv zu begünstigen. abb. 9: assoziationsplot: korrelation zw. der syntaktischen realisierung des angenommen vs. vorausgesetzt nebensatzes und dem Verbmodus im nebensatz Zusammenfassend lässt sich festhalten, dass die zu Beginn dieses Abschnitts aufgestellte Hypothese bestätigt wurde, d.h., dass Verbstellung bzw. Prädikatsausdruck und Moduswahl eine Korrelation aufweisen. Semantisch-funktional deuten diese Befunde in dieselbe Richtung: angenommen hat eine stärkere 27 Eine wichtige Frage ist, inwiefern dieser Zusammenhang zwischen Verbmodus und Verbstellung nur für angenommen und vorausgesetzt gilt oder ob die Verbstellung und Verbmodus auch in anderen Strukturen korrelieren. Anna Volodina 64 Tendenz in Richtung des Hypothetischen, des Nicht-Faktischen, was im Allgemeinen auch für Konjunktiv II bzw. würde-Form festgestellt wurde. Mit anderen Worten, man kann davon ausgehen, dass sich angenommen-VL in etwa so verhält wie vorausgesetzt-VL und vorausgesetzt-V2, wohingegen angenommen- V2 eine eigenständige, dem Hypothetischen, Konjunktivischen viel eher zugewandte Kategorie zu bilden scheint. 3.2 Semantische Variation Die Bedeutung von Perfektpartizipien in der ‘absoluten’ Verwendung kann durch bestimmte Partikeln und Adverbien, die unmittelbar links oder rechts von dem jeweiligen Prädikatsausdruck vorkommen können, modifiziert werden, worauf bereits in HDK-1 (2003, S. 446f.) hingewiesen wurde. angenommen und vorausgesetzt unterscheiden sich qualitativ und quantitativ deutlich in Bezug auf die Wahl bedeutungsmodifizierender Ausdrücke. Die Auswertung wurde am kompletten Datenset durchgeführt. 3.2.1 Präferenzen bei der Wahl vorangestellter bedeutungsmodifizierender Ausdrücke Im Rahmen dieser Korpusstudie wurden die häufigsten bedeutungsmodifizierenden Ausdrücke für angenommen und vorausgesetzt semi-automatisch ermittelt. Wenn man die häufigsten 10 Modifikatoren, die links von dem jeweiligen Perfektpartizip stehen, ansieht, ergibt sich folgender Vergleich zwischen angenommen und vorausgesetzt: Modifikatoren angenommen vorausgesetzt ∑ absolut relativ absolut relativ immer X 5 0,5% 1048 99,5% 1053 mal X 595 97,7% 14 2,3% 609 einmal X 207 87,7% 29 12,3% 236 nur mal X 170 100,0% 170 aber X 102 95,3% 5 4,7% 107 nur einmal X 53 100,0% 53 natürlich X 48 100,0% 48 doch X 37 90,2% 4 9,8% 41 natürlich immer X 33 100,0% 33 allerdings X 11 100,0% 11 tab. 6: 10 häufigste Modifikatoren links von angenommen vs. vorausgesetzt: absolute und relative Werte (vgl. Volodina 2018, S. 76) Variation im Sprachgebrauch 65 Die Modifikatoren geben wichtige Hinweise zur Semantik der untersuchten prädikativen Ausdrücke. Der mit Abstand häufigste Modifikator - das vorangestellte Adverb immer - wird fast ausschließlich mit vorausgesetzt verwendet, vgl. (29a). Es ist auffällig, dass Modifikatoren von vorausgesetzt allquantifizierende Ausdrücke sind, insbesondere was immer und einmal betrifft, wobei einmal mit vorausgesetzt deutlich weniger häufig belegt ist (vgl. (29a) und (29b)): (29) a. Anlieger werden künftig - immer vorausgesetzt, der Stadtrat stimmt all den Vorschlägen bei den Haushaltsberatungen im November zu - beim Straßenausbau stärker zur Kasse gebeten. (Nürnberger Nachrichten, 25.9.2002, S. 11) b. Eine Niederlage mit acht Punkten hätte aufgrund des direkten Vergleichs wohl dem Gast zur Meisterschaft verholfen; einmal vorausgesetzt, daß die beiden überragenden deutschen Teams ihr jeweils letztes Spiel gewinnen. (Süddeutsche Zeitung, 18.3.1996, S. 37) angenommen dagegen wird am häufigsten durch die Partikel mal modifiziert, vgl. (30a). mal findet sich auch als Bestandteil in nur mal und einmal - zwei ebenfalls sehr häufigen Modifikatoren für angenommen, vgl. (30b) und (30c). einmal und aber modifizieren außerdem angenommen ausschließlich in V2- Strukturen, nicht aber in angenommen-VL-Strukturen. (30) a. Mal angenommen, jemand muss für seine Mathe-Abiklausur lernen und findet das Fach einfach ganz furchtbar. Was machen Sie dann? (die tageszeitung, 19.8.2006, S. 29) b. Angenommen, die Bayern hätten 4: 1 verloren, oder die Moskauer hätten gewonnen, nur mal angenommen also, es wäre so gelaufen, daß die Bayern am Mittwochabend ausgeschieden wären - die Stunde nach dem Spiel bei RTL wäre wieder mal zu lang gewesen. (Süddeutsche Zeitung, 9.12.1994, S. 27; Kiew - Bayern 4: 1) c. Einmal angenommen, man lässt die geschwungenen LED-Scheinwerfer weg, dann erscheint einem der neueste Audi wie ein alter Bekannter. (Süddeutsche Zeitung, 8.2.2010, S. 30; Luxus und der pure Schein) Zwar ist einmal angenommen im Vergleich zu einmal vorausgesetzt signifikant überrepräsentiert, was jedoch fast vollständig fehlt, ist die Möglichkeit, die Bedeutung von angenommen durch einen allquantifizierenden Ausdruck wie immer zu modifizieren, man vergleiche einen der seltenen Belege mit immer als Modifikator von angenommen in (31). Bemerkenswert ist, dass in diesem Fall das Konnekt von immer angenommen dem Matrixsatz nachgestellt ist, es befindet sich also in diesem Fall syntaktisch gesehen in einer für angenommen eher untypischen Position (vgl. topologische Präferenzen in 3.1.2). Anna Volodina 66 (31) Rafael van der Vaart traf in der elften Minute zum 1: 0. Dummerweise folgte auf das erste nicht das zweite Tor und nur ein Erfolg mit zwei Toren Unterschied hätte sie weiter gebracht. Immer angenommen, auch Deutschland würde siegen. (Nürnberger Nachrichten, 18.6.2012, S. 13; Der Vize-Weltmeister darf nicht mehr mitspielen) Eine weitere Beobachtung bezieht sich auf das Vorkommen von angenommen- VL-Strukturen, die sehr selten sind und im ganzen Korpus lediglich 92 Belege aufweisen: Bei angenommen-VL-Strukturen gibt es eine unerwartet hohe, wenn auch in absoluten Zahlen immer noch sehr seltene Verwendung mit immer (vgl. für die alternative V2-Struktur mit immer angenommen den Beleg (31)): drei von insgesamt fünf Belegen für immer angenommen sind VL-Strukturen: (32) a. Kreisky hat sich im Gespräch „bedeckt gehalten“. Was heißt „bedeckt halten“? Immer angenommen, daß es nicht das Gegenteil von Exhibitionismus sein soll, meint es - ja, was denn wirklich? (Die Presse, 21.1.1997, Ressort: Ausland/ Seite Drei) b. Und dass die gemeinsame Währung allein nicht ausreicht , um eine gemeinsame Zukunft zu planen - immer angenommen, dass für den unterzeichnenden 55-Jährigen die Zukunft ein besserer Ort sein möge. (Süddeutsche Zeitung, 12.5.2014, S. 2; Außenansicht) Die Kontexte in (31) und (32) sind zwar sehr untypisch für angenommen, aber sehr typisch für vorausgesetzt. Dies lässt den Schluss zu, dass angenommen in solchen Fällen die Bedeutung von vorausgesetzt hat und durch vorausgesetzt substituierbar ist. Der in Abbildung 10 präsentierte Assoziationsplot zeigt ein sehr klares Bild der Verhältnisse zwischen den häufigsten 10 vorangestellten Modifikatoren in vorausgesetzt- und angenommen-Strukturen. Auffällig ist, dass immer als quantifizierender Ausdruck bei der Verwendung mit vorausgesetzt signifikant überrepräsentiert, mit angenommen signifikant unterrepräsentiert ist. Diejenigen Modifikatoren, die bei angenommen besonders häufig vorkommen (wie z.B. mal, nur mal, aber, nur einmal), kommen bei vorausgesetzt eher gar nicht vor und umgekehrt: natürlich, natürlich immer und allerdings sind Modifikatoren für vorausgesetzt, nicht aber für angenommen. Wie in der Abbildung 10 gezeigt, ist dieses Ergebnis hochsignifikant (bezogen auf die komplette Verteilung: X-squared = 2151.112, df = 9, p-value < 2.2e-16). Variation im Sprachgebrauch 67 abb. 10: assoziationsplot: 10 häufigste Modifikatoren links von angenommen vs. vorausgesetzt 3.2.2 Präferenzen bei der Wahl nachgestellter bedeutungsmodifizierender Ausdrücke Die Modifikatoren können nicht nur links vom Prädikatsausdruck, wie in 3.2.1 beschrieben, sondern auch rechts von angenommen und vorausgesetzt realisiert werden. Während die allquantifizierenden Ausdrücke wie immer, einmal usw. ausschließlich und unmittelbar vor dem Prädikatsausdruck verwendet werden (vgl. Belege in 3.2.1), gibt es bemerkenswerterweise einige Modifikatoren, die sowohl links als auch rechts vom Prädikatsausdruck stehen können, z.B. natürlich ((33a) und (33b)) und aber ((33c) und (33d)). (33) a. Auch ökonomisch wäre es für die Reeder verkraftbar. „Zwar kostet Dieselöl rund dreimal so viel wie Schweröl, aber es wäre möglich“, sagt Johns. Vorausgesetzt natürlich, die Mehrkosten werden auf die Fracht umgelegt. (Rhein-Zeitung, 17.7.2007) b. Der Ersatzmann war/ ist sage und schreibe Nummer 19 der WTTF- Meldeliste. Hintergrund: Ramsteins Zweitgarnitur hatte zur selben Zeit ein Spiel, bei dessen Erfolg sie Regionalliga-Neuling würde. Natürlich vorausgesetzt, Ramsteins Erstgarnitur wird Zweitbundesligist. (Rhein-Zeitung, 2.4.2001; Bulgariens Vize zeigte Schwächen) c. Aber angenommen, wir waren zur Kur und es war ein vergnügter Abend, da wurde meine Frau gern mal aufgefordert von einem netten Herrn aus der Kurgesellschaft. (Die Zeit (Online-Ausgabe), 3.4.2003; Fünfzig Jahre Zweisamkeit, S. 50) Anna Volodina 68 d. Wenn der Nationalisten-Günstling zu Recht an Popularität verloren hat, warum dann der große Pfitzner-Schlußblock? Angenommen aber, es gibt Verlorenes wiederzuentdecken, warum daraus Possen machen? (Süddeutsche Zeitung, 12.2.1998, S. 21, Ressort: M; Überflüssige Possen) Die folgende Tabelle zeigt die Verteilung von nachgestellten Modifikatoren im Vergleich zwischen angenommen und vorausgesetzt. Auffällig an der Auflistung von nachgestellten Modifikatoren ist, dass es sich in aller Regel um klassische „Diskursmarker“ handelt, häufig mit einer kontrastiven bzw. einschränkenden Bedeutung (vgl. Blühdorn/ Foolen/ Loureda 2017), die übrigens auch als Adverbkonnektoren in der sogenannten Nacherstposition 28 auftreten können (vgl. HDK-1; Breindl 2008; Onea/ Volodina 2011). Modifikatoren angenommen vorausgesetzt ∑ absolut relativ absolut relativ X natürlich 1 0,1% 792 99,9% 793 X allerdings 205 100% 205 X freilich 78 100% 78 X also 33 82,5% 7 18% 40 X aber 18 56% 14 44% 32 X jedoch 7 23% 24 77% 31 X auch 19 100% 19 X eben 7 100% 7 X nämlich 2 50% 2 50% 4 X hingegen 3 100% 0 0% 3 tab. 7: 10 häufigste Modifikatoren rechts von angenommen vs. vorausgesetzt: absolute und relative Werte (vgl. Volodina 2018, S. 77) Die Kernbeobachtung, die sich aus der Distribution in der obigen Tabelle ergibt, ist, dass vorausgesetzt generell deutlich häufiger durch nachgestellte Marker modifiziert wird als angenommen. Dies ist qualitativ sowie quantitativ der Fall. Der mit Abstand am häufigsten verwendete nachgestellte Marker ist natürlich (vgl. (33a)): Bis auf eine Ausnahme ist natürlich ausschließlich als Modifikator von vorausgesetzt 792 mal im Korpus belegt. 28 Mit dem im Sinne von HDK-1 verwendeten Terminus „Nacherstposition“ bezeichnet man eine Position unmittelbar nach einem das Vorfeld eines Verbzweitsatzes besetzenden Ausdruck (HDK-1, S. 486). Variation im Sprachgebrauch 69 Der Ausnahmefall, wie in (34) gezeigt, ist ein einziger angenommen-Beleg mit gleich zwei (eher für vorausgesetzt als für angenommen typischen) Modifikatoren - dem vorangestellten immer und nachgestellten natürlich. Auch das angenommen-Konnekt tritt in einer eher für vorausgesetzt typischeren grammatischen Umgebung auf, nämlich als Nachtrag zum vorausgehenden Matrixsatz. Daher liegt die Vermutung nahe, dass angenommen im Kontext von (34) synonym zu vorausgesetzt verwendet wurde. (34) a. Eckhard nickte ihm kurz zu und wandte sich dann wieder an die Frau. Möglicherweise ist der Mörder hier eingedrungen. Immer angenommen natürlich, er ist nicht einfach durch die Haupttür spaziert. (Erwin, Birgit/ Buchhorn, Ulrich: Die Herren von Buchhorn, [Roman]. - Meßkirch, 25.3.2011) b. Eckhard nickte ihm kurz zu und wandte sich dann wieder an die Frau. Möglicherweise ist der Mörder hier eingedrungen. Immer vorausgesetzt natürlich, er ist nicht einfach durch die Haupttür spaziert. Obwohl angenommen präferiert durch vorangestellte Marker modifiziert wird, können wir beobachten, dass also und aber (vgl. (35a) und (35b)) signifikant häufiger mit angenommen als mit vorausgesetzt vorkommen. Diese beiden Konnektoren können eine wichtige Funktion in dem pragmatischen Aufbau von Argumenten haben, daher wird diese Beobachtung bei der Analyse eine wichtige Rolle spielen. (35) a. Angenommen also, Schnee und Müll bleiben liegen und die BVG stellt ihren Betrieb ein. Was soll daran schlimm sein in Zeiten der Ich-AG? (die tageszeitung, 8.1.2003, S. 21) b. Wenn der Nationalisten-Günstling zu Recht an Popularität verloren hat, warum dann der große Pfitzner-Schlußblock? Angenommen aber, es gibt Verlorenes wiederzuentdecken, warum daraus Possen machen? (Süddeutsche Zeitung, 12.2.1998, S. 21) Es fällt außerdem auf, dass vorausgesetzt recht häufig von Diskurspartikeln wie allerdings und freilich (vgl. (36a) und (36b)) modifiziert wird, die eine einschränkende Funktion im Diskurs übernehmen können (36) a. Der Prozess gegen die vier Hauptverantwortlichen des Flowtex- Skandals wird in der Woche zwischen dem 24. und dem 28. September beginnen - vorausgesetzt allerdings, dass die 2. Wirtschaftsstrafkammer mit der Anklageschrift der Staatsanwaltschaft Mannheim einig geht. (Mannheimer Morgen, 29.5.2001; Flowtex- Finanzchef bleibt in Haft) Anna Volodina 70 b. UN-Generalsekretär Perez de Cuellar will in Kürze alle afghanischen Fraktionen zu einer Friedenskonferenz einladen, vorausgesetzt freilich, diese wollen es auch. (Die Presse, 11.10.1991) Wie aus dem in Abbildung 11 dargestellten Assoziationsplot hervorgeht, sind ausschließlich nachgestellte Modifikatoren von angenommen (wie also, aber, jedoch) im Vergleich zu vorausgesetzt signifikant überrepräsentiert. Die Verwendung von vorausgesetzt also ist dagegen signifikant unterrepräsentiert. Dabei ist anzumerken, dass vorausgesetzt also ausschließlich in vorausgesetzt-V2-Strukturen belegt ist. abb. 11: assoziationsplot: 10 häufigste Modifikatoren rechts von angenommen vs. vorausgesetzt Bemerkenswert ist auch, dass nachgestellte Modifikatoren für angenommen- VL-Strukturen absolut untypisch sind. Unter allen 92 angenommen-VL-Belegen findet sich nur ein einziger Beleg mit dem nachgestellten nun, wie in (37) gezeigt. (37) Angenommen nun, daß nach 2030 der Altersquotient wieder sinkt, dann könnte man durch teilweise Schuldfinanzierung der Renten zwischen 2010 und 2030 und Tilgung nach 2030 dafür sorgen, daß die Lasten der Anpassung an veränderte Bedingungen intergenerationell gleichmäßiger, d.h. mit geringeren Brüchen zum gegenwärtigen Status quo, verteilt werden. (Frankfurter Rundschau, 27.5.1999, S. 8) Anders als angenommen kann vorausgesetzt auch in VL-Strukturen von allen (ausgenommen also) in Tabelle 7 gelisteten nachgestellten Markern modifiziert Variation im Sprachgebrauch 71 werden, es lässt sich jedoch kein statistisch signifikanter Kontrast zwischen V2- und VL-Strukturen in diesem Fall nachweisen. Als Fazit lässt sich festhalten: Die Unterschiede in der Verwendung von angenommen und vorausgesetzt in Bezug auf vorangestellte sowie nachgestellte Modifikatoren zeigen, dass sich die beiden Elemente semantisch stärker unterscheiden als eingangs angenommen. Man kann nicht mehr ohne Weiteres von einer identischen Distribution sprechen: Vielmehr lässt sich generell eine klare inverse Korrelation zwischen den Modifikatoren beobachten. 3.3 Metasprachliche Variation In diesem Abschnitt wird der Frage nachgegangen, ob der funktionale Unterschied zwischen vorausgesetzt und angenommen auf die Unterschiede in ihrer Verwendung auf der Metaebene zurückgeführt werden kann. Dazu werden exemplarisch die drei konsistentesten Metadaten der vorliegenden Korpusbelege - MEDIUM, DOMÄNE und REGISTER 29 - systematisch ausgewertet. Dabei wird geprüft, ob der jeweilige Faktor einen Einfluss auf die relative Häufigkeit von angenommen vs. vorausgesetzt hat. Diese Auswertung wird am kompletten Datenset durchgeführt. 30 Die Klassifikation des Korpus nach inhaltlichen Domänen wurde der DeReKo- Metadatenbank entnommen, in der Informationen zur inhaltlichen Ausrichtung einzelner Texte vorliegen. Die Zuordnung von Belegen wurde in vielen Fällen händisch überprüft. Für genauere Angaben zur Unterteilung des Gesamtkorpus, zu Parametern, Motivierung der für die Teilkorpora relevanten Kategorien, Größe der jeweiligen Unterkorpora usw. siehe Bubenhofer/ Konopka/ Schneider (2014, S. 54-78). Im Folgenden werden alle drei Faktoren je nach Ausprägung an den einschlägigen Beispielen jeweils für angenommen und vorausgesetzt präsentiert und die Ergebnisse zunächst jeweils pro Faktor einzeln mit Assoziationsplots dargestellt und interpretiert. 29 MEDIUM, DOMÄNE und REGISTER sind Kriterien, die bereits in den anderen Pilotstudien des Projekts „Korpusgrammatik“ als Variabilitätsfaktoren behandelt wurden. So konnte beispielsweise in Fuß/ Konopka/ Wöllstein (2017) und Konopka/ Hansen-Morath (2017) eine Medium- und Registerabhängigkeit der AcI-Häufigkeit belegt werden. 30 Da VL-Strukturen generell ca. 10% und angenommen-VL-Strukturen insbesondere nur noch 1,3% aller Belege darstellen, sind die Daten in Bezug auf die Frage, ob der jeweilige Faktor einen Einfluss auf die relative Häufigkeit von V2- und VL-Sätzen bei angenommen bzw. bei vorausgesetzt haben kann, nicht aussagekräftig. Anna Volodina 72 3.3.1 Variabilitätsfaktor „Medium“ Wie in Abschnitt 2 erläutert, sind die Metadaten für MEDIUM mit folgenden fünf Ausprägungen kodiert: 1) Publikumspresse 2) Bücher 3) Internet/ Wikipedia 4) Gesprochenes (verschriftete Sprechsprache) 31 5) Sonstiges Es soll untersucht werden, ob diese Kategorien (1-5) das Vorkommen von angenommen bzw. von vorausgesetzt begünstigen können. In (38)-(42) wird jeweils ein Beispiel für angenommen vs. vorausgesetzt je nach Ausprägung der Kategorie MEDIUM gegeben: MEDIUM-1/ Publikumspresse (38) a. Aber angenommen, wir sagen, es gibt hier ein Missverhältnis, das der Staat korrigieren muss: Wo hören wir auf? (Die Zeit (Online- Ausgabe), 4.11.2010; „Wir zahlen nicht mehr als nötig“) b. „Wenn sie eine eigene Serie machen, vorausgesetzt, dass die Autos sicher sein werden, dann werden wir diese Serie genauso behandeln wie jede andere auch“, kündigte Max Mosley, der Präsident des Automobilsport-Weltverbandes FIA, am Donnerstag an. (Mannheimer Morgen, 10.4.2000; Aus für Rennen in Europa? ) MEDIUM-2: Bücher (39) a. Nein, Reber war es! Er hatte die Geliebte satt. Lasst uns den DNA- Vergleich abwarten. Angenommen, er war wirklich Ingas biologischer Vater: Womöglich hat Marika ihm die Pistole auf die Brust gesetzt. (Kronenberg, Susanne: Rheingrund, [Kriminalroman]. - Meßkirch, 24.3.2011) b. Angermüller tippte auf Würgemale. Da hatte also jemand hinter dem alten Mann gestanden - vorausgesetzt, der Angriff war hier erfolgt - und hatte ihn gewürgt, bis er kein Lebenszeichen mehr von sich gab. (Danz, Ella: Nebelschleier, [Kriminalroman]. - Meßkirch, 28.3.2011) 31 Dabei handelt es sich um Texte, die geschrieben wurden, um gesprochen zu werden, oder auch um gesprochene Kommunikationsbeiträge, die im Nachhinein verschriftlicht wurden: z.B. Ansprache, Diskussion, Rede, Gespräch, Interview, Predigt, Vortrag usw. In beiden Fällen können sie als Übergangszone zwischen konzeptioneller Schriftlichkeit und konzeptioneller Mündlichkeit im Sinne von Koch/ Oesterreicher (1985, 2008) betrachtet werden, vgl. Bubenhofer/ Konopka/ Schneider (2014, S. 64f.). Variation im Sprachgebrauch 73 MEDIUM-3: Internet/ Wikipedia (40) a. Mal ganz übertrieben gefragt: Angenommen, der See-Artikel hat eine Datenmenge von 100kB und der NP-Artikel 0,2 kB - dann würde doch jeder sagen, daß jeder Artikel erhalten bleiben sollte. Ein Artikel Wirtschaft in Deutschland kann ja nicht aus fünf Sätzen zur Volkswirtschaft und 500 Sätzen zur Geldpolitik bestehen. (Diskussion: Crater Lake, In: Wikipedia URL: http: / / de.wikipedia.org/ wiki/ Diskussion: Crater_Lake: Wikipedia, 2011) b. Am 1. September 1273 war er bereits mit Ludwig dem Strengen zu der Übereinkunft gelangt, entweder Siegfried von Anhalt oder Rudolf von Habsburg zu wählen, vorausgesetzt, dass die Wahl Ludwigs sich als nicht möglich erweisen sollte. (Rudolf I. (HRR), In: Wikipedia - URL: http: / / de.wikipedia.org/ wiki/ Rudolf_I._(HRR): Wikipedia, 2011) MEDIUM-4: Gesprochenes (verschriftete Sprechsprache) (41) a. MOPO: Sie sind mittlerweile seit 30 Jahren im Geschäft. Mal angenommen, Sie stünden am Anfang, welchen Tipp würden Sie Ihrem jungen Ich geben? Michelle Pfeiffer: Sei entspannter und genieße das Leben mehr. (Hamburger Morgenpost, 2.8.2009, S. 46) b. Wir brauchen Planungssicherheit. Deswegen lautet meine Frage: Können wir in Neustadt mit dem weiteren Bestand rechnen, vorausgesetzt wir erreichen die Mindestschülerzahlen? (Protokoll der Sitzung des Parlaments Landtag Brandenburg am 25.1.2007) MEDIUM-5: Sonstiges (42) a. Das Grundrecht „die Wohnung ist unverletzlich“ schützt aber nicht nur das Heim vor Polizei oder ungebetenen Vertretern. Die Staatsgewalt oder Schnüffler und Lauscher könnten Wohnungen mit Hilfe moderner Abhörtechniken auch anderweitig verletzen! Angenommen: in Wohnungen werden heimlich Mikrofone eingebaut; Geheimkameras im Wohnzimmer! Das wäre wohl die hinterhältigste Methode um in die Familie, um in die Wohnung einzudringen. (Lauber, Heinz: Das Grundgesetz für die Bundesrepublik Deutschland in Wort und Bild. - Villingen-Schwenningen, 1983) b. Doch Lehrer und Schüler fahren nicht allein auf der Infobahn - auch die Eltern sollen einbezogen werden. Vorausgesetzt, Papi und Mami verstehen vom PC soviel wie ihr Sprößling, könnten sie durchaus, wie in der Studie angeregt, per E-Mail zum Elternabend eingeladen werden. (COMPUTER ZEITUNG, 28.3.1996, S. 6; Gesellschaft für Informatik fordert fest verankerte IT-Kompetenz für unsere Schüler) Anna Volodina 74 Wie an den obigen Belegen gezeigt, wurden keine Beschränkungen in Bezug auf das Vorkommen von angenommen und vorausgesetzt in den jeweiligen Kategorien festgestellt. Als Nächstes soll die Frage nach dem Präferenzbereich für angenommen bzw. für vorausgesetzt innerhalb des Faktors MEDIUM beantwortet werden: In Abbildung 12 wird durch einen Assoziationsplot die Häufigkeitsverteilung von angenommen und vorausgesetzt in Relation zu dem möglichen Einflussfaktor MEDIUM je nach Ausprägung dargestellt. abb. 12: assoziationsplot: Verteilung von angenommen - und vorausgesetzt - Strukturen je nach ausprägung des Faktors „Medium“ Die Abbildung zeigt klar, dass die meisten Daten in der Publikumspresse situiert sind und innerhalb dieser Kategorie angenommen im Vergleich zu den anderen Kategorien signifikant 32 unterrepräsentiert ist. In Pressetexten hat dagegen vorausgesetzt eine höhere Frequenz und ist signifikant überrepräsentiert. Dabei ist angenommen in den übrigen Kategorien signifikant überrepräsentiert und vorausgesetzt dagegen signifikant unterrepräsentiert. Wenn man annehmen würde, dass Pressetexte weniger „spekulativ“ sein sollen und eher über Fakten berichten als Texte in den Kategorien Literatur, Gesprochenes und Internet (meistens Wikipedia-Quellen), die häufiger Zusammenhänge in der „fiktiven Realität“ beschreiben, dann sind durch diesen Befund Indizien für den Unterschied zwischen angenommen und vorausgesetzt gegeben. So könnte man sagen, dass mit angenommen auf alternative Welten 32 Statistische Signifikanz der Daten wurde nach dem Chi-Quadrat-Test ermittelt: X-squared = 1535.6, df = 4, p-value < 2.2e-16. Diese Angaben beziehen sich auf die komplette Verteilung. Variation im Sprachgebrauch 75 bzw. eine fiktive Realität verwiesen wird, während vorausgesetzt in Zusammenhang mit Fakten auftritt, deren Geltungsbereich ggf. eingeschränkt wird. So gesehen kann die in Breindl (2009, S. 290) aufgestellte Hypothese, wonach alle konditionalen Verbzweitsatz-Einbetter über die Komponente „Setzung“ einer alternativen Welt verfügen und sich dadurch von den Standardkonditionalen unterscheiden, (zum Teil) entkräftet werden. 3.3.2 Variabilitätsfaktor „Domäne“ Die Metadaten für DOMÄNE umfassen fünf Kategorien und sind mit folgenden Ausprägungen kodiert. Anders als bei dem oben beschriebenen Faktor MEDIUM konnten nicht alle vorhandenen Belege klassifiziert werden, daher ergibt sich die sechste 0-Kategorie. 0) Unklassifizierbar 1) Fiktion 2) Kultur/ Unterhaltung 3) Mensch/ Natur 4) Politik/ Wirtschaft/ Gesellschaft 5) Technik/ Wissenschaft In (43)-(48) wird jeweils ein Beispiel für angenommen vs. vorausgesetzt je nach Ausprägung der Kategorie DOMÄNE gegeben: DOMÄNE-0: Unklassifizierbar (43) a. Mit einem Achselzucken verweist er auf das Chaos, in dem Togliatti ohnehin versinkt: „Angenommen, wir würden denen morgen das Geld rüberschieben, das merken die doch gar nicht.“ (Der Spiegel, 16.5.1994; Kuckucksei aus Korea, S. 232) b. Vorausgesetzt, daß die institutionellen Reformen mehr Föderalismus hervorbringen - dann wäre es richtig, die Direktwahl des Präsidenten anzusteuern: ein Präsidialsystem, das aber zugleich die Macht der Exekutive und die Möglichkeiten ihrer parlamentarischen Kontrolle stärken würde. (Der Spiegel, 8.8.1994, Ressort: Gespräch; „Ich habe Nerven aus Stahl“, S. 117) DOMÄNE-1: Fiktion (44) a. Scheinbar hängt alles mit allem irgendwie zusammen, Thilo. Ich habe noch keine Ahnung, wie. Mal angenommen, Goldberg war im Besitz von irgendetwas, das sein Mörder, also vielleicht Patzke, haben will. (Gibert, Matthias P.: Kammerflimmern, [Kriminalroman]. - Meßkirch, 25.3.2011) Anna Volodina 76 b. Um das Thema mit der Gerichtsmedizin nochmals aufzugreifen. Ich könnte Thomas bitten, vorausgesetzt er arbeitet überhaupt noch in Münster, den Finger für uns zu untersuchen. (Puschmann, Dorothea: Zwickmühle, [Kriminalroman]. - Meßkirch, 24.3.2011) DOMÄNE-2: Kultur/ Unterhaltung (45) a. Zugespitzt formuliert: Angenommen ein Zuschauer weint bei diesem Film, dann tut er es nicht, weil er weiss, dass es Adèle schlecht geht; er weint, weil Adèle weint. (Die Südostschweiz, 9.1.2014, S. 8) b. Sie definieren sich über den Rhythmus, bei dem man mit muß. Vorausgesetzt, man tanzt gerne zu einer Dampflok im Austro- Takt. (Oberösterreichische Nachrichten, 14.2.1997, Ressort: Jugend; HÄRTE) DOMÄNE-3: Mensch/ Natur (46) a. Angenommen, der Bär bleibt im Münstertal: Was hätte das Ihrer Ansicht nach für Konsequenzen für die Landwirtschaft und für Flora und Fauna? (Die Südostschweiz, 15.8.2005; »Aufmarsch und Echo haben uns überrascht«) b. Jeder Naturheilpraktiker könnte dann kranke Menschen behandeln, vorausgesetzt, er führt keine Blutentnahmen und Injektionen durch, nimmt keine chirurgischen und medizinischen Eingriffe vor, behandelt keine ansteckenden Krankheiten und wendet keine rezeptpflichtigen Heilmittel an. (Die Südostschweiz, 11.10.2005; Kantonal geprüfte Naturheiler bangen um ihren Besitzstand) DOMÄNE-4: Politik/ Wirtschaft/ Gesellschaft (47) a. Nein, dahingestellt, ob die Vertragsverlängerung der Schriftform bedurft hätte oder nicht: Angenommen, dass eine mündliche Abrede ausreichte, bleibt nach Aktenlage weiter unerfindlich, wann und wie diese Abrede Rechtskraft erlangt haben soll. (Süddeutsche Zeitung, 18.8.2007, S. 31; Erzwungene Einigung) b. Eine Liste vom Januar 2008 verzeichnet 150 wenig qualifizierten Berufe, in denen es Arbeitskräftemangel gibt. In diesen Berufen können die Patrons Aufenthaltsgenehmigungen für ihre Beschäftigten beantragen - vorausgesetzt, die Beschäftigten stammen aus den neuen EU-Mitgliedsländern in Osteuropa. (die tageszeitung, 20.2.2008, S. 10; Küchenhilfen erstreiken Papiere) DOMÄNE-5: Technik/ Wissenschaft (48) a. Immerhin bewirkt die Dunkle Energie nur eine Wirkung und zwar die Expansion von Raum. Quasi der Raum in Raum dehnt sich aus, Variation im Sprachgebrauch 77 angenommen ich befinde mich in Galaxie A dann bewegen sich die weiten Galaxien von mir weg. (Diskussion: Dunkle Energie, In: Wikipedia - URL: http: / / de.wikipedia.org/ wiki/ Diskussion: Dunkle _Energie: Wikipedia, 2011) b. Die akustischen Daten werden zusätzlich zur Web-Seite geladen und dann auf dem lokalen PC abgespielt - vorausgesetzt, es ist eine Soundkarte vorhanden und der Web-Browser kann mit Klangdateien umgehen. (Süddeutsche Zeitung, 18.3.1998, S. 910, Ressort: BEILAGE; Die erste Adresse im Netz) Im Folgenden wird die Verteilung zwischen angenommen und vorausgesetzt in Relation zur DOMÄNE in Abbildung 13 mithilfe eines Assoziationsplots dargestellt: abb. 13: assoziationsplot: Verteilung von angenommen - und vorausgesetzt - Strukturen je nach ausprägung des Faktors „domäne“ Die obige Grafik veranschaulicht den Befund, dass der Anteil von vorausgesetzt in der Kategorie „Mensch/ Natur“ signifikant 33 von den erwarteten Häufigkeiten abweicht. Auch dieser Befund bekräftigt die Annahme, dass vorausgesetzt einen von angenommen abweichenden semantischen Beitrag leistet und deswegen in den naturwissenschaftlichen Textsorten präferiert wird. Auffällig ist, dass insbesondere die Bereiche „Kultur/ Unterhaltung“ und „Politik/ Wirtschaft/ Gesellschaft“ einen spiegelverkehrten Effekt in Bezug auf angenommen und vorausgesetzt haben. In Texten der Domäne „Kultur/ Unterhaltung“ ist vorausgesetzt signifikant überrepräsentiert und in den Bereichen zu „Politik, Wirtschaft und Gesellschaft“ ist angenommen signifikant überrepräsentiert. 33 Berechnete Signifikanz: X-squared = 6384.9, df = 5, p-value < 2.2e-16: Diese Angaben beziehen sich auf die komplette Verteilung. Anna Volodina 78 3.3.3 Variabilitätsfaktor „Register“ Im Falle des REGISTERS werden in den Metadaten diese drei Kategorien unterschieden: 1) Pressetexte 2) Sonstige Gebrauchstexte 3) Literarische Texte Mit der Bezeichnung Register sind hier im Sinne von Biber/ Conrad (2009, S. 6ff.) größere Textsortenbzw. Genregruppen gemeint, die sich situativ definieren und hinsichtlich funktional motivierter, typischer (d.h. im Text besonders häufiger) linguistischer Charakteristika zu beschreiben sind (vgl. Bubenhofer/ Konopka/ Schneider 2014, S. 66). Diese drei Kategorien (Pressetexte, Gebrauchstexte und literarische Texte) werden als wichtigere Prädiktoren als DOMÄNE und MEDIUM angesehen, da sie hinsichtlich der Textsortenspezifika möglicherweise eine höhere Merkmalsdichte mit sich bringen, obgleich ihre Verteilung im Korpus 34 durchaus unterschiedlich gewichtet ist, wie in Tabelle 8 unten gezeigt wird. Die Kategorie „Pressetexte“ ist vergleichsweise sehr stark besetzt. 35 Register-Textsorten Connexor-Token Texte Pressetexte 6.372.265.002 22.886.295 Gebrauchstexte 1.516.923.141 2.541.862 Literarische Texte 16.490.064 548 Gesamt 7.905.678.207 25.428.705 tab. 8: unterteilung des gesamtkorpus im Hinblick auf ‘ register ’ (absolute daten, bezogen auf kogra dB 2015) Eine Auflistung von konkreten Textsorten und Genres der DeReKo-Metadatenbank, die zu Registern zugeordnet wurden, ist in Bubenhofer/ Konopka/ Schneider (2014, S. 68) zu finden. Daraus ist ersichtlich, dass die Gebrauchstexte am heterogensten sind. Die in (49)-(51) gelisteten Belege illustrieren die unterschiedenen Textsorten der Kategorie REGISTER jeweils für angenommen und vorausgesetzt. 34 Die Zuordnung der Texte zu den einzelnen Registern erfolgte hauptsächlich anhand der DeReKo-Metadaten zu Textsorte/ Genre, an mehreren fraglichen Stellen wurde diese „von Hand“ überprüft und ggf. angepasst (vgl. Bubenhofer/ Konopka/ Schneider 2014, S. 67). 35 Das Gleiche gilt auch für die Kategorie „Presse“ bei REGISTER. Variation im Sprachgebrauch 79 REGISTER-1: Pressetexte (49) a. Und jetzt müssen wir doch etwas technisch werden: Angenommen, wir führen einem Stück Materie ständig Energie zu, so erhöht sich seine Temperatur. (Braunschweiger Zeitung, 7.12.2010; Plasma - die Story von den kleinen Sonnen) b. Vorausgesetzt, die sich neu konstituierenden Gemeinderäte stimmen einer Kreditaufnahme zu, stünde einer umfassenden Sanierung nichts mehr im Wege. (Niederösterreichische Nachrichten, 1.4.2010; Bad mit Sonnenterasse) REGISTER-2: Gebrauchstexte (50) a. Angenommen, ein 65-jähriger Mann soll für 5000 Euro Versicherungssumme monatlich 35 Euro zahlen. In dieser Größenordnung bewegen sich einige Angebote. (Süddeutsche Zeitung, 26.11.2003, S. 20; Nach dem Wegfall des Sterbegeldes) b. Wer sich mit einem Betrieb in einer Gemeinde neu ansiedeln möchte, kann dies ebenfalls tun, vorausgesetzt, der Betrieb passt dorthin. (Protokoll der Sitzung des Parlaments Landtag Schleswig-Holstein am 17.3.2010. 14. Sitzung der 17. Wahlperiode 2009-2012. Plenarprotokoll, Kiel, 2010) REGISTER-3: Literarische Texte (51) a. Gut, dachte sich Brandtner, angenommen, die beiden hatten nicht von 14 oder 15 Uhr gesprochen, sondern von 2 und 3 Uhr. Dann konnte sich schon leicht ein Hörfehler eingeschlichen haben. (Emme, Pierre: Florentinerpakt, [Kriminalroman]. - Meßkirch, 25.3.2011) b. Gut, ich hätte in eine einsame Höhle ziehen können, vorausgesetzt meine Mutter hätte solange überlebt, bis ich dazu alleine in der Lage gewesen wäre. Dann hätte ich mein Essen selbst sammeln können. (Dietrich, Jutta: Sprung ins Leben. - Föritz, 2006, S. 65) Abbildung 14 verdeutlicht, dass auch der Unterschied zwischen angenommen und vorausgesetzt signifikant 36 vom REGISTER abhängt. In Pressetexten ist vorausgesetzt signifikant überrepräsentiert im Vergleich zu Gebrauchstexten und literarischen Texten. Dadurch, dass Pressetexte den Großteil des Korpus ausmachen, könnte dies auch erklären, wieso die Anzahl von vorausgesetzt-Belegen im Vergleich zu entsprechenden angenommen-Belegen derart überwiegt. Ähnlich verhalten sich angenommen- und vorausgesetzt-Strukturen in Pressetexten hinsichtlich des Faktors „Medium“. Offensichtlich liegt im Bereich „Pressetexte“ bei REGISTER und MEDIUM eine Überschneidung zweier Kate- 36 Berechnete Signifikanz für die komplette Verteilung: X-squared = 1115.3, df = 2, p-value < 2.2e-16. Anna Volodina 80 gorien vor. Das Gesamtbild (vgl. Abb. 12 und 14) könnte u.U. auch dadurch verzerrt sein, dass jeweils eine (und dieselbe) Kategorie („Publikumspresse“ bei MEDUIM und „Presse“ bei REGISTER) vergleichsweise stark besetzt ist. abb. 14: assoziationsplot: Verteilung von angenommen - und vorausgesetzt - Strukturen je nach register Der Befund kann wie folgt interpretiert werden: Einerseits zeigt sich recht deutlich, dass zwischen vorausgesetzt und angenommen ein Registerunterschied existiert. Andererseits ist unklar, ob dies ein Effekt der inhaltlichen Ausrichtung der relevanten Textsorten ist, sprich, dass z.B. in Gebrauchstexten häufiger über hypothetische Möglichkeiten gesprochen wird, während es in Pressetexten häufiger darauf ankommt, die Geltung des Matrixsatzes einzuschränken, oder aber ob die Unterschiede auf Gepflogenheiten, Normen und Textsortenwissen zurückgehen. Möglicherweise handelt es sich hier um beides, was zu einer immer stärkeren, aber pragmatisch bedingten Registerausdifferenzierung führen kann. Das Ergebnis der Untersuchung der metasprachlichen Variation für angenommen und vorausgesetzt ist wie folgt zusammenzufassen: Für die Analyse von angenommen und vorausgesetzt scheinen die Metadaten eine sehr hilfreiche Ressource zu sein. Es ist bei dieser Datenmenge sicherlich kein Zufall, wenn in bestimmten Textsorten vorausgesetzt im Vergleich zu angenommen unerwartet häufig oder selten vorkommt bzw. signifikant über- oder unterrepräsentiert ist. Vielmehr ist mit den Textsorten eine Vielzahl von textspezifischen Faktoren verbunden, deren Aufschlüsselung Hinweise zu Gebrauch und Bedeutung dieser zwei Prädikatsausdrücke geben kann. Wie oben bereits angedeutet, könnte eine naheliegende Erklärung für diesen Befund darin liegen, Variation im Sprachgebrauch 81 dass angenommen hypothetischen Sachverhalten näher steht als vorausgesetzt. Auf diesen Unterschied zwischen angenommen und vorausgesetzt gehen wir in 4.2 noch ausführlicher ein. 4. abschließende Diskussion In diesem Kapitel werden die zentralen empirischen Ergebnisse, die in Abschnitt 3 diskutiert wurden, in Bezug auf die ‘absolute’ Verwendung von angenommen und vorausgesetzt als Prädikatsausdrücke noch einmal zusammengefasst. Anschließend wird ein funktional-pragmatischer Analyseansatz präsentiert, mit dem sich einige der beobachteten Unterschiede zwischen angenommen und vorausgesetzt erklären lassen. 4.1 Zusammenfassung der Ergebnisse Zwar haben angenommen und vorausgesetzt die gleiche (konditionale) Kernbedeutung, die gleichen grammatischen Lizenzierungsbedingungen und können in vielen identischen Umgebungen auftreten. Im Gebrauch verhalten sie sich aber in mehrfacher Hinsicht komplementär zueinander, da sie unterschiedliche Präferenzen aufweisen, wie es in Abschnitt 3 aus der syntaktischen, semantischen und metasprachlichen Perspektive systematisch beschrieben wurde. Die zentralen empirischen Fakten sowie die oben im Detail diskutierten Ergebnisse werden an dieser Stelle kurz zusammengefasst. Auf der syntaktischen Ebene zeichnen sich angenommen und vorausgesetzt sowohl durch Gemeinsamkeiten, vor allem in Bezug auf ihre grammatischen Lizenzierungsbedingungen, als auch durch deutliche Unterschiede aus, die sich im Gebrauch niederschlagen. Dies konnte an statistisch signifikanten Befunden gezeigt werden. - Beide Prädikatsausdrücke lizenzieren Strukturen sowohl mit V2als auch VL-Stellung. - Beide Prädikatsausdrücke präferieren V2-Nebensätze, sie tun es aber in einem unterschiedlichen Maße. In 98% aller Fälle bettet angenommen einen V2-Satz ein, wohingegen die Präferenz bei vorausgesetzt mit ca. 90% immer noch stark, aber deutlich schwächer ist. Dies lässt den Schluss zu, dass bei der ‘absoluten’ Verwendung von angenommen praktisch keine Variation hinsichtlich der Verbstellung im Nebensatz existiert: angenommen-Strukturen sind (in der Regel) angenommen-V2-Strukturen. - angenommen- und vorausgesetzt-Strukturen haben prinzipiell die gleichen topologischen Eigenschaften, sie unterscheiden sich aber massiv hinsichtlich der topologischen Präferenz des eingebetteten Ausdrucks in Bezug auf seine Position zum Matrixsatz. Während angenommen-Nebensätze in Anna Volodina 82 den meisten Fällen desintegriert im Vor-Vorfeld realisiert werden, stehen vorausgesetzt-Nebensätze in den meisten Fällen im Nachfeld des Matrixsatzes oder sind als Nachtrag realisiert. Die Verwendung des eingebetteten Ausdrucks im Vorfeld ist bei beiden Perfektpartizipien möglich, scheint aber nicht präferiert zu werden. - Zwischen der syntaktischen Realisierung der eingebetteten Struktur als V2- oder VL-Satz und der präferierten topologischen Position bzw. der Wahl des prädikativen Ausdrucks konnte kein statistisch signifikanter Unterschied festgestellt werden. - Im Vorfeld integrierte angenommen-Sätze haben eine Präferenz für Verben im Konjunktiv, während im Vorfeld integrierte vorausgesetzt-Sätze Verben im Konjunktiv eher meiden. - Beide Perfektpartizipien werden bevorzugt mit Indikativ im Nebensatz gebraucht. Im Falle von vorausgesetzt liegt aber eine viel stärke Präferenz für Indikativ als für Konjunktiv im nachgestellten Nebensatz vor. angenommen- Strukturen lassen dagegen Konjunktiv leichter zu. Auf der semantischen Ebene zeigen sich mehr Unterschiede als Gemeinsamkeiten zwischen angenommen und vorausgesetzt. - Beide Perfektpartizipien können generell in Kombination mit den voranals auch mit den nachgestellten bedeutungsmodifizierenden Ausdrücken auftreten. Für angenommen-VL-Strukturen ist die Möglichkeit, durch einen nachgestellten Ausdruck modifiziert zu werden, marginal. - vorausgesetzt wird signifikant häufiger in Kombination mit nachgestellten bedeutungsmodifizierenden Ausdrücken verwendet als angenommen. - Es gibt eine klare inverse Korrelation zwischen angenommen und vorausgesetzt und den jeweiligen bedeutungsmodifizierenden Ausdrücken, die unmittelbar links bzw. rechts von angenommen oder vorausgesetzt vorkommen können. Diejenigen Ausdrücke, die die Bedeutung von angenommen modifizieren, sind bei vorausgesetzt unterrepräsentiert und umgekehrt. - Dabei gibt es bei vorausgesetzt eine starke Präferenz zu quantifikationeller Modifikation, während bei angenommen dies gerade nicht der Fall ist. Auf der metasprachlichen Ebene sind Indizien für den Unterschied zwischen angenommen und vorausgesetzt in Bezug auf die untersuchten Faktoren MEDI- UM, DOMÄNE und REGISTER ebenfalls gegeben: - MEDIUM: In Pressetexten haben vorausgesetzt-Strukturen eine höhere Frequenz und sind signifikant überrepräsentiert, angenommen-Strukturen sind signifikant unterrepräsentiert. Dabei sind Strukturen mit angenommen in den übrigen Kategorien (Bücher, Internet, Gesprochenes) signifikant über- Variation im Sprachgebrauch 83 repräsentiert und die mit vorausgesetzt dagegen signifikant unterrepräsentiert. - DOMÄNE: Der Anteil von vorausgesetzt-Strukturen in der Kategorie „Mensch/ Natur“ weicht signifikant von den erwarteten Häufigkeiten ab, angenommen-Strukturen sind in dieser Kategorie signifikant unterrepräsentiert. In Texten der Domäne „Kultur/ Unterhaltung“ sind vorausgesetzt- Strukturen signifikant überrepräsentiert und in den Bereichen zu „Politik, Wirtschaft und Gesellschaft“ sind angenommen-Strukturen signifikant überrepräsentiert. - REGISTER: In Pressetexten sind vorausgesetzt-Strukturen signifikant überrepräsentiert im Vergleich zu Gebrauchstexten und literarischen Texten, in denen angenommen-Strukturen signifikant überrepräsentiert sind. 4.2 Analyse der Ergebnisse Aufgrund dessen, dass die hier behandelten angenommen- und vorausgesetzt- Strukturen in den gleichen Kontexten auftreten können, kann man davon ausgehen, dass angenommen und vorausgesetzt dieselbe Kernbedeutung zugrunde liegt, was eine klassische konditionale Semantik im Sinne der Definition von HDK-2 und der IDS-Grammatik aus der Perspektive der Mögliche- Welten-Semantik (siehe auch Stalnaker 1968; Kratzer 1978) darstellt. (52) angenommen/ vorausgesetzt p, q In Situationen, in denen p wahr ist, ist auch q wahr. Diese rein semantische Definition erfasst aber die Unterschiede im Gebrauch zwischen angenommen und vorausgesetzt nicht, die insbesondere in argumentativen Kontexten deutlich werden, was im Rahmen eines funktional-pragmatischen Analyseansatzes gezeigt werden könnte. Dafür muss für vorausgesetzt zusätzlich angenommen werden, dass vorausgesetzt die Aufmerksamkeit des Adressaten der Äußerung auf die Möglichkeit richtet, dass p - anders als erwartet - nicht wahr sein könnte, und darauf, dass in diesem Fall q möglicherweise ebenfalls nicht wahr ist. Im Gegensatz dazu richtet sich die Aufmerksamkeit des Adressaten bei angenommen eher auf den Fall, in dem p wahr sein könnte. Letzteres ist auch im Sinne von Breindl (2009), die dafür plädiert, alle Verbzweitsatz-Einbetter als eine Art ‘Framesetting-Topik’ zu analysieren (vgl. dazu die Paraphrase in (15) in Abschnitt 1.3). Dabei wird die Aufmerksamkeit des Adressaten der Äußerung auf eine Situation gelenkt, die vorher im Diskurs in der Regel nicht prominent genug war und von der die Proposition q konditional abhängt. Dies gilt für die Analyse von angenommen, nicht aber unbedingt für die Analyse von vorausgesetzt. Anna Volodina 84 Diese Überlegungen lassen sich schematisch wie folgt darstellen: (53) Konditionale Voraussetzung: möglich, dass p, möglich, dass nicht p. • angenommen: Ausgangsdiskurszustand: möglich, dass p falsch ist. Aufmerksamkeit richtet sich auf: Situationen, in denen p wahr ist. • vorausgesetzt: Ausgangsdiskurszustand: möglich, dass p wahr ist. Aufmerksamkeit richtet sich auf: Situationen, in denen p falsch ist. So kann vorausgesetzt in einer Argumentation eher dazu verwendet werden, die Interaktanten an die noch so wenig wahrscheinliche Möglichkeit zu erinnern, dass p falsch ist. Dadurch kann vorausgesetzt zur Abschwächung von Aussagen oder zur Relativierung von Aussagen führen. Im Gegensatz dazu wird angenommen eher in einer Situation verwendet, in der die Proposition p nicht „auf der Tagesordnung“ war, sie aber entweder wünschenswerte oder nicht wünschenswerte Konsequenzen (q) haben könnte. Aus diesem Analyseansatz lassen sich viele der beobachteten Fakten, die in Abschnitt 3.3 zusammengefasst wurden, erklären: Die Tatsache, - dass vorausgesetzt und angenommen jeweils in den gleichen Umgebungen auftreten können, auch wenn es davon Abweichungen geben kann, lässt sich aus der identischen Kernbedeutung von angenommen und vorausgesetzt ableiten. - dass angenommen-Nebensätze präferiert im Vor-Vorfeld verwendet werden, lässt sich durch die Funktion als ‘Framesetting-Topik’ (siehe oben) erklären. Diese Funktion lässt sich natürlicherweise am Satzanfang am besten erreichen, ganz ähnlich wie in Breindls Paraphrase „Nimm mal an/ Stell dir mal vor, p ist der Fall“, vgl. (15). Für vorausgesetzt ist eine solche Verwendung aus Gründen der Sprachverarbeitung äußerst kontraproduktiv, denn vorausgesetzt lenkt die Aufmerksamkeit des Adressaten eher auf die Möglichkeit, dass p wider Erwarten falsch sein könnte. Dadurch kann die Präferenz zur Nachstellung des vorausgesetzt-Nebensatzes begründet werden. - dass vorausgesetzt-Nebensätze mit Konjunktiv kaum verwendet werden, folgt daraus, dass man im Falle von vorausgesetzt die Möglichkeit, dass p wahr sein könnte, bereits im Diskurs akzeptiert hat. Die Verwendung von Konjunktiv im vorausgesetzt-Nebensatz ist eher dann akzeptabel, wenn es um indirekte Redewiedergabe geht. Im Falle von angenommen wiederum ist die Verwendung von Konjunktiv im Nebensatz wenig überraschend, da man die Aufmerksamkeit des Adressaten auf eine Situation lenken möchte, die ohnehin wenig wahrscheinlich ist. Variation im Sprachgebrauch 85 - dass vorausgesetzt eher mit quantifizierenden und kontrastiven Ausdrücken zusammen vorkommt, lässt sich dadurch erklären, dass vorausgesetzt einen Shift in der Aufmerksamkeit oder einen Perspektivenwechsel erzeugt. Von der einen Situation wird die Aufmerksamkeit entweder kontrastiv auf eine andere Situation gelenkt oder auch auf eine ganze Reihe von anderen Situationen, mit der pragmatischen Funktion, Ausnahmen zu suchen, Fälle also, in denen p falsch ist. Dagegen wird die Verwendung von angenommen mit aber darauf zurückgeführt, dass man mit angenommen explizit eine alternative Situation beschreibt, die mit dem vorher etablierten gemeinsamen Wissen kontrastiert. Dies gilt auch für (nur) mal als häufiger Kookkurrenzausdruck für angenommen, was zusätzlich noch spezifiziert, dass die Proposition p wenig wahrscheinlich ist. Anders gesagt: angenommen richtet (mit Vorliebe) die Aufmerksamkeit auf Situationen, in denen die Proposition p wahr ist oder wahr sein könnte, wenn der Kontext eigentlich nahelegt, dass p eher falsch sein könnte, was zu einer kontrastiven Lesart führt. - dass Strukturen mit vorausgesetzt in der Textsorte „Presse“ (in der Kategorie „Publikumspresse“ bei MEDIUM und „Pressetexte“ bei REGISTER) signifikant überrepräsentiert sind und die mit angenommen unterrepräsentiert sind, wohingegen angenommen-Strukturen in den Kategorien wie „Literatur“ (Faktor MEDIUM), die häufiger Zusammenhänge in der ‘fiktiven Realität’ beschreiben, signifikant überrepräsentiert sind, kann dadurch erklärt werden, dass mit angenommen auf ‘alternative’ Welten, ‘fiktive Realität’ verwiesen wird, mit vorausgesetzt dagegen auf Fakten, deren Geltungsbereich dadurch ggf. eingeschränkt wird. 5. Fazit Ziel der vorliegenden Studie war, zentrale Fragen zur Variation im Gebrauch der bedeutungsähnlichen prädikativen Ausdrücke angenommen und vorausgesetzt (in ihrer ‘absoluten’ Verwendung ohne Auxiliar) zu beantworten, Unterschiede und Gemeinsamkeiten aus der syntaktischen, semantischen und metasprachlichen Perspektive aufzudecken und zum besseren Verständnis des Gebrauchs von diesen Perfektpartizipien beizutragen. Basierend auf einer größer angelegten Korpusstudie (insgesamt 6.949 Belege für angenommen und 32.878 Belege für vorausgesetzt) konnte eine Reihe von wichtigen Generalisierungen erarbeitet werden, die die zentralen Gebrauchsunterschiede zwischen den beiden Perfektpartizipien dokumentieren. Die Ergebnisse dieser Studie betreffen sowohl syntaktische Besonderheiten von angenommen und vorausgesetzt, etwa ihre topologischen Präferenzen oder den Modus des finiten Verbs im untergeordneten Satz relativ zum Matrixsatz, als Anna Volodina 86 auch semantische Besonderheiten, die auf der Analyse der unmittelbaren Kookkurrenzpartner links und rechts von dem jeweiligen Perfektpartizip basieren, sowie weitere funktional-pragmatische Faktoren, die sich in der Regel mit einiger Genauigkeit aus den Metadaten der Belege ableiten lassen. Zur Erklärung dieser Ergebnisse wurde ein funktional-pragmatischer Ansatz gewählt, wonach die wahrheitsfunktionale Bedeutung von angenommen und vorausgesetzt zwar weitestgehend identisch sein mag, sie sich aber in der Art, wie sie die Aufmerksamkeit des Adressaten lenken, radikal unterscheiden: Mit dem angenommen-Konnekt wird in der Regel eine neue, hypothetische Situation eingeführt und der Matrixsatz wird in dieser hypothetischen Situation evaluiert. Dabei wird die Aufmerksamkeit des Adressaten eher auf die Möglichkeit gerichtet, dass der Sachverhalt des angenommen-Konnekts wahr ist bzw. wahr sein könnte. vorausgesetzt hingegen schränkt den Geltungsbereich des Matrixsatzes ein und lenkt damit die Aufmerksamkeit des Lesers eher auf die Möglichkeit, dass der Sachverhalt des vorausgesetzt-Konnekts falsch ist. Es wurde damit argumentiert, dass Aufmerksamkeitssteuerung zur grammatikalisierten Bedeutung dieser prädikativen Ausdrücke gehören könnte. literatur Altmann, Hans (1981): Formen der „Herausstellung“ im Deutschen: Rechtsversetzung, Linksversetzung, freies Thema und verwandte Konstruktionen. (= Linguistische Arbeiten 106). Tübingen: Niemeyer. Antomo, Mailin Ines (2015): Abhängige Sätze in einem fragebasierten Diskursmodell. Dissertation, Georg-August-Universität Göttingen. https: / / ediss.uni-goettingen.de/ handle/ 11858/ 00-1735-0000-0022-5D89-5 (Stand: 17.12.2018). Antomo, Mailin/ Steinbach, Markus (2010): Desintegration und Interpretation. Weil- V2-Sätze an der Schnittstelle zwischen Syntax, Semantik und Pragmatik. In: Zeitschrift für Sprachwissenschaft 29, 1, S. 1-37. Antomo, Mailin/ Steinbach, Markus (2013): Zur Semantik von Konzessivsätzen mit obwohl. In: Linguistische Berichte 236, S. 427-453. Averintseva-Klisch, Maria (2009): Rechte Satzperipherie im Diskurs. Die NP-Rechtsversetzung im Deutschen. (= Studien zur deutschen Grammatik 78). Tübingen: Stauffenburg. Biber, Douglas/ Conrad, Susan (2009): Register, genre, and style. Cambridge: Cambridge University Press. Blühdorn, Hardarik/ Foolen, Ad/ Loureda, Óscar (2017): Diskursmarker: Begriffsgeschichte - Theorie - Beschreibung. Ein bibliographischer Überblick. In: Blühdorn, Hardarik et al. (Hg.): Diskursmarker im Deutschen. Reflexionen und Analysen. Göttingen: Verlag für Gesprächsforschung, S. 7-48. Variation im Sprachgebrauch 87 Breindl, Eva (2008): „Die Brigitte nun kann der Hans nicht ausstehen“. Gebundene Topiks im Deutschen. In: Deutsche Sprache 36. Themenheft: Erkenntnisse vom Rande. Zur Interaktion von Prosodie, Informationsstruktur, Syntax und Bedeutung. Hrsg. v. Eva Breindl u. Maria Thurmair, S. 27-49. Breindl, Eva (2009): Fehler mit System und Fehler im System. Topologische Varianten bei Konnektoren. In: Konopka, Marek/ Strecker, Bruno (Hg.): Deutsche Grammatik - Regeln, Normen, Sprachgebrauch. (= Jahrbuch des Instituts für Deutsche Sprache 2008). Berlin: De Gruyter, S. 274-306. Bubenhofer, Noah/ Konopka, Marek/ Schneider, Roman (2014): Präliminarien einer Korpusgrammatik. (= Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache 4). Tübingen: Narr. DeReKo: Release 2015. www.ids-mannheim.de/ DeReKo. Duden (2002): Der Duden in 12 Bänden. Bd. 10: Das Bedeutungswörterbuch. 3., neu bearb. u. erw. Aufl. Mannheim u.a.: Dudenverlag. Duden (2009): Der Duden in 12 Bänden. Bd. 4: Die Grammatik. 8., überarb. Aufl. Mannheim u.a.: Dudenverlag. Duden (2016): Der Duden in 12 Bänden. Bd. 4: Die Grammatik. 9., vollst. überarb. u. aktual. Aufl. Berlin: Dudenverlag. Fabricius-Hansen, Cathrine (1997): Der Konjunktiv als Problem des Deutschen als Fremdsprache. In: Germanistische Linguistik 136, S. 13-36. Fabricius-Hansen, Cathrine/ Sæbø, Kjell Johann (2004): In a mediative mood: The semantics of the German reportive subjunctive. In: Natural Language Semantics 12, 3, S. 213-257. Freywald, Ulrike (2009): Kontexte für nicht-kanonische Verbzweitstellung: V2 nach dass und Verwandtes. In: Ehrich, Veronika et al. (Hg.): Koordination und Subordination im Deutschen. (= Linguistische Berichte, Sonderheft 16). Hamburg: Buske, S. 113-134. Freywald, Ulrike (2018): Parataktische Konjunktionen: Zur Syntax und Pragmatik der Satzverknüpfungen im Deutschen - am Beispiel von obwohl, wobei, während, wogegen und dass. (= Studien zur deutschen Grammatik 90). Tübingen: Stauffenburg. Fuß, Eric/ Konopka, Marek/ Wöllstein, Angelika (2017): Perspektiven auf syntaktische Variation. In: Konopka, Marek/ Wöllstein, Angelika (Hg.): Grammatische Variation. Empirische Zugänge und theoretische Modellierung. (= Jahrbuch des Instituts für Deutsche Sprache 2016). Berlin/ Boston: De Gruyter, S. 229-254. Gärtner, Hans-Martin (2002): On the force of V2 declaratives. In: Theoretical Linguistics 28, S. 33-42. Grimm, Jacob/ Grimm, Wilhelm (1854-1961): Deutsches Wörterbuch von Jacob und Wilhelm Grimm. 16 Bde. in 32 Teilbänden. Leipzig: Hirzel. Quellenverzeichnis Leipzig 1971. Online-Version vom 17.11.2017. (Zit. als Grimm’sches Wörterbuch). http: / / dwb.uni-trier.de/ de/ die-digitale-version/ online-version. Günthner, Susanne (2008): „die Sache ist …“: Eine Projektor-Konstruktion im gesprochenen Deutsch. In: Zeitschrift für Sprachwissenschaft 27, 1, S. 39-71. Anna Volodina 88 Günthner, Susanne (2011): “N be that”-constructions in everyday German conversation: A reanalysis of “die Sache ist/ das Ding ist” (”the thing is”) - clauses as “projector phrases”. In: Laury, Ritva/ Suzuki, Ryoko (Hg.): Subordination in conversation: A cross-linguistic perspective. Amsterdam: Benjamins, S. 11-36. Haegeman, Liliane (2012): Adverbial clauses, main clause phenomena, and composition of the left periphery. (= Oxford Studies in Comparative Syntax 8). Oxford: Oxford University Press. Hansen-Morath, Sandra/ Wolfer, Sascha (2017): Visualisierung linguistischer Daten mit der freien Grafik- und Statistikumgebung R, Onlinepublikation (Tutorial). http: / / kograno.ids-mannheim.de/ VisR-OnlinePub/ index.html. Hansen-Morath, Sandra et al. (2015): Dokumentation zur ersten Erhebung der Daten im Rahmen der Studie zu angenommen/ vorausgesetzt. (Methodenkapitel, 7 S., unveröffentlichtes Manuskript). HDK-1: Pasch, Renate et al. (2003): Handbuch der deutschen Konnektoren. Bd. 1: Linguistische Grundlagen der Beschreibung und syntaktische Merkmale der deutschen Satzverknüpfer (Konjunktionen, Satzadverbien und Partikeln). (= Schriften des Instituts für Deutsche Sprache 9). Berlin/ Boston: De Gruyter. HDK-2: Breindl, Eva/ Volodina, Anna/ Waßner, Ulrich H. (2014): Handbuch der deutschen Konnektoren. Bd. 2: Semantik der deutschen Satzverknüpfer. Berlin/ New York: De Gruyter. Hooper, Joan/ Thompson, Sandra A. (1973): On the applicability of root transformations. In: Linguistic Inquiry 4, 4, S. 465-497. Kaufmann, Gerhard (1972): Das konjunktivische Bedingungsgefüge im heutigen Deutsch. (= Forschungsberichte des Instituts für Deutsche Sprache 12). Tübingen: Narr. Klosa, Annette/ Kupietz, Marc/ Lüngen, Harald (2012): Zum Nutzen von Korpusauszeichnungen für die Lexikographie. In: Lexicographica 28, S. 71-97. Koch, Peter/ Oesterreicher, Wulf (1985): Sprache der Nähe - Sprache der Distanz. Mündlichkeit und Schriftlichkeit im Spannungsfeld von Sprachtheorie und Sprachgeschichte. In: Romanistisches Jahrbuch 36, S. 15-43. Koch, Peter/ Oesterreicher, Wulf (2008): Mündlichkeit und Schriftlichkeit von Texten. In: Janich, Nina (Hg.): Textlinguistik. 15 Einführungen. Tübingen: Narr, S. 199-215. KoGra-R: http: / / kograno.ids-mannheim.de/ index.html (Stand: 17.12.2018). Konopka, Marek/ Hansen-Morath, Sandra (2017): AcI-Konstruktionen und Wie-Komplementsätze - Dokumentation der Parallelexploration. In: grammis 2.0 - Korpusgrammatik. Mannheim: Institut für Deutsche Sprache. https: / / grammis.ids-mann heim.de/ korpusgrammatik/ 6303 (Stand: 20.9.2018). Kratzer, Angelika (1978): Semantik der Rede. Kontexttheorie - Modalwörter - Konditionalsätze. Königstein i.Ts.: Scriptor. Kupietz, Marc/ Lüngen, Harald (2014): Recent developments in DeReKo. In: Calzolari, Nicoletta et al. (Hg.): Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC’14). Reykjavik: ELRA, S. 2378-2385. Variation im Sprachgebrauch 89 Meinunger, André (2004): Verb position, verbal mood and the anchoring (potential) of sentences. In: Lohnstein, Horst/ Trissler, Susanne (Hg.): The syntax and semantics of the left periphery. Berlin u.a.: De Gruyter, S. 313-342. Onea, Edgar/ Volodina, Anna (2011): Between specification and explanation. About a German discourse particle. In: International Review of Pragmatics 3, 1, S. 3-32. Paul, Hermann (1916-1920): Deutsche Grammatik Bd. 1-5. Tübingen: Niemeyer. Potts, Christopher (2005): The logic of conventional implicatures. (= Oxford Studies in Theoretical Linguistics 7). Oxford: Oxford University Press. Quirk, Randolph et al. (1985): A grammar of contemporary English. London: Longman. R Core Team (2014): R: A language and environment for statistical computing. R foundation for statistical computing, Vienna, Austria. www.R-project.org. Rath, Rainer (1971): Die Partizipialgruppe in der deutschen Gegenwartssprache. (= Sprache der Gegenwart 12). Düsseldorf: Schwann. Reis, Marga (1997): Zum syntaktischen Status unselbständiger Verbzweit-Sätze. In: Dürscheid, Christa/ Ramers, Karl-Heinz/ Schwarz, Monika (Hg.): Sprache im Fokus. Festschrift für Heinz Vater zum 65. Geburtstag. Tübingen: Niemeyer, S. 21-144. Reis, Marga (2013): „Weil-V2“-Sätze und (k)ein Ende? Anmerkungen zur Analyse von Antomo und Steinbach (2010). In: Zeitschrift für Sprachwissenschaft 32, 2, S. 221-262. Reis, Marga/ Wöllstein, Angelika (2010): Zur Grammatik (vor allem) konditionaler V1- Gefüge im Deutschen. In: Zeitschrift für Sprachwissenschaft 29, S. 111-179. Stalnaker, Robert C. (1968): A theory of conditionals. In: Rescher, Nicholas (Hg.): Studies in logical theory. Oxford: Blackwell, S. 98-112. Thompson, Sandra A. (2002): „Object complements“ and conversation towards a realistic account. In: Studies in Language 26, 1, S. 125-163. Truckenbrodt, Hubert (2006): On the semantic motivation of syntactic verb movement to C in German. In: Theoretical Linguistics 32, 3, S. 257-306. Vikner, Sten (1995): Verb movement and expletive subjects in the Germanic languages. New York/ Oxford: Oxford University Press. Vinckel, Hélène (2006): Die diskursstrategische Bedeutung des Nachfelds im Deutschen. Eine Untersuchung anhand politischer Reden der Gegenwartssprache. Wiesbaden: Deutscher Universitäts-Verlag. Volodina, Anna (2009): Epistemische Lesarten: konventionell oder pragmatisch? Vortrag auf dem SPWS-Workshop „Semantik und Pragmatik im Südwesten“, Universität Stuttgart. www.annavolodina.de/ dokumente/ Vortrag_SPSW_Stuttgart_volo dina.pdf (Stand: 18.12.2018). Volodina, Anna (2011): Konditionalität und Kausalität im Diskurs. Eine korpuslinguistische Studie zum Einfluss von Syntax und Prosodie auf die Interpretation komplexer Äußerungen. (= Studien zur deutschen Sprache 54). Tübingen: Narr. Volodina, Anna (2012): Perzeption und Interpretation epistemischer Relationen. In: Die deutsche Gegenwartssprache in pragmalinguistischer Sicht. Konferenzband der Anna Volodina 90 Internationalen Konferenz der MPGU in Moskau, 26.-27. April 2012. Moskau: MAKC Press, S. 47-56. Volodina, Anna (2018): angenommen ist nicht vorausgesetzt - eine korpuslinguistische Analyse. In: Deutsche Sprache 46. Themenheft: Über den Tellerrand hinaus: Konnektorenforschung aus unterschiedlichen Blickwinkeln. Hrsg. v. Ludwig M. Eichinger u. Anna Volodina, S. 67-81. WDG (1964-1977): Wörterbuch der deutschen Gegenwartssprache (1964-1977), kuratiert und bereitgestellt durch das Digitale Wörterbuch der deutschen Sprache. Wöllstein, Angelika (2014): Topologisches Satzmodell. 2., aktual. Aufl. (= Kurze Einführungen in die germanistische Linguistik 8). Heidelberg: Winter. Zifonun, Gisela/ Hoffmann, Ludger/ Strecker, Bruno (1997): Grammatik der deutschen Sprache. (= Schriften des Instituts für deutsche Sprache 7). Berlin/ Boston: De Gruyter. patrick Brandt / Eric FuSS rElatIVPronomEnSElEktIon unD grammatISchE VarIatIon: was VS. das In attrIButIVEn rElatIVSätzEn 1. Einleitung Gegenstand dieser Pilotstudie sind Distribution und Eigenschaften verschiedener, z.T. miteinander konkurrierender Strategien, die im Deutschen zur Einleitung von Relativsätzen Verwendung finden.* Im Standard ist dabei die Unterscheidung zwischen relativischen d-Pronomina (der/ die/ das etc.) und w- Pronomina (welche/ welcher etc. vs. wer/ was etc.) zentral. Die Verteilung der Varianten ist zunächst wesentlich von der Unterscheidung zwischen attributiven Relativsätzen (mit Bezugselement/ Antezedens) versus freien Relativsätzen und weiterführenden Relativsätzen (ohne sichtbares Bezugselement/ Antezedens) abhängig. Während attributive Relativsätze in der Regel durch d-Pronomina eingeleitet werden (die bis auf wenige Ausnahmen formgleich mit den entsprechenden Demonstrativpronomina sind), fungieren in freien Relativsätzen, die kein Bezugselement aufweisen und eine Satzgliedfunktion im Matrixsatz innehaben, w-Pronomina als Relativa. Letztere sind von der Lautform identisch mit Interrogativpronomina (Simplizia); w-Determinierer wie welcher sind in freien Relativsätzen nur unter bestimmten Umständen zulässig (vgl. Fußnote 7): (1) ein Pferd, [das den Preis noch nie gewonnen hat] (2) [Was Peter sagt], muss wohl stimmen. W-Pronomina werden ferner zur Einleitung sogenannter weiterführender Relativsätze genutzt, die sich auf das Matrix-Prädikat bzw. die Matrix-Proposition beziehen; hier tritt vor allem das w-Pronomen was auf: (3) Wie bei allen anderen Mannschaftssportarten nahmen die Starken Rücksicht auf die Schwächeren, [was den Spass für alle garantierte]. (St. Galler Tagblatt, 23.10.2009, S. 52; Goldener Herbst im Simmental) * Wir danken Hardarik Blühdorn, Sandra Hansen, Marek Konopka, Hans-Christian Schmitz, Roman Schneider, Anna Volodina, Bernd Wiese, Sascha Wolfer und Angelika Wöllstein für ihre Unterstützung und für hilfreiche Kommentare zu früheren Fassungen dieser Arbeit. Unser besonderer Dank gilt Monica Führbacher für ihre Unterstützung bei der Durchführung und Auswertung von Korpusrecherchen. Teile des Inhalts dieser Studie wurden Zuhörern am ZAS Berlin sowie an der Goethe-Universität Frankfurt vorgetragen, denen wir ebenfalls für wertvolle Hinweise danken. Einige Vorarbeiten zu dieser Studie wurden als Brandt/ Fuß (2014) publiziert. Patrick Brandt / Eric Fuß 92 Wenig Beachtung hat die Tatsache gefunden, dass neben diesen Hauptvarianten nicht-kanonische Strategien der Relativsatzeinleitung existieren. So verlangen bestimmte Neutra das w-Pronomen was als Relativum (vgl. Duden 2009, S. 1031f.; vgl. auch Citko 2004 zu sog. ‚light headed relatives’ im Polnischen): (4) a. Alles, was die Zuschauer dort sehen, ist Lug und Trug. (Niederösterreichische Nachrichten, 17.1.2013, NÖN Großformat, Ressort: Meinungen; PRO & KONTRA) b. Das, was wir machen, ist das, was uns gefällt. (Braunschweiger Zeitung, 4.6.2007; „Das, was wir machen, ist das, was uns gefällt“) c. Das Beste, was Microsoft heute tun kann, ist, Yahoo zu kaufen. (Hannoversche Allgemeine, 8.11.2008, S. 15; Microsoft lässt Yahoo abblitzen) Im Mittelpunkt der vorliegenden Studie steht mit der Alternation zwischen das und was in attributiven Relativsätzen lediglich ein kleiner Ausschnitt des gesamten Phänomenbereichs. 1 Dieser enge Fokus ist zum einen methodisch motiviert: Um die Anwendbarkeit der im Projekt Korpusgrammatik entwickelten korpuslinguistischen Verfahren auf syntaktische Phänomene (auf der Basis der in DeReKo vorliegenden Annotationsschemata) exemplarisch testen zu können, erschien uns eine Beschränkung auf einen klar umgrenzten empirischen Bereich sinnvoll, die es ermöglicht, den Arbeitsaufwand bei Extraktion und (manueller) Überprüfung der Datengrundlage in einem bewältigbaren Rahmen zu halten. 2 Zum anderen hat es sich im Verlauf der Studie herausgestellt, dass allein die Variation im Bereich Neutrum Singular (bei attributiven Relativsätzen) hinsichtlich Variantendistribution und beteiligter Einflussgrößen einen Grad an Komplexität aufweist, der eine eigenständige Studie 1 Mit anderen Worten, die hier betrachtete Variation ist auf Relativsatzeinleiter mit den Merkmalen Neutrum Singular beschränkt; gerade im Hinblick auf die Untersuchung der Natur von Genus- und Numerusmerkmalen ist die Frage nach der eventuellen Funktion der dvs. w- Realisierung des Relativums allerdings besonders interessant, indem das Neutrum im Bezug auf insbesondere numerusrelevante Eigenschaften wie Individuierung und (als Folge) Abzählbarkeit auch sprachhistorisch offenbar eine Zwischenposition zwischen Maskulinum (tendenziell abzählbare Individuen denotierend) und Femininum (tendenziell nicht abzählbare Abstrakta oder Kollektiva denotierend) einnimmt (vgl. dazu Werner 2012). Der Zusammenhang zwischen Genus- und Numerusmerkmalen ist offenbar universell geregelt, indem die Präsenz von Genusmerkmalen die Präsenz von Numerusmerkmalen voraussetzt (= Greenberg 1963, Universal Nummer 36). 2 Zusätzlich werden nicht-attributive Relativsätze herangezogen, wenn deren Eigenschaften Aufschlüsse über die Distribution von was und das in attributiven Kontexten liefern. Relativpronomenselektion und grammatische Variation 93 rechtfertigt. Hervorzuheben ist dabei, dass ein Großteil der korpuslinguistisch ermittelten Fakten bislang in der existierenden Literatur unbeschrieben ist. Aus diesem Grund hat die Studie eher einen explorativen Charakter; im Gegensatz zu vorangegangenen Pilotstudien (vgl. z.B. Konopka/ Fuß 2016) liegt der Schwerpunkt nicht auf der Überprüfung existierender Hypothesen (obwohl auch dies geleistet wird), sondern auf der Sammlung und Beschreibung einschlägiger empirischer Befunde. Die kurze Übersicht in (1) bis (4) macht bereits deutlich, dass die Funktionen von was als Relativsatzeinleiter entschieden vielfältiger sind als die von das. Über die Verwendung als Relativpronomen hinaus fungiert die Form was insbesondere als Interrogativpronomen (Was hat Otto gesehen? ). Außerdem wird es als Indefinitpronomen gebraucht (Otto hat was gesehen). Bei interrogativischer Verwendung schwankt die Bedeutung zwischen argumentalen und adverbialen Lesarten, letztere findet sich in z.B. Was tanzt du auf dem Tisch herum? (= Warum tanzt du auf dem Tisch herum? ). Dies lässt bereits vermuten, dass es sich bei was im Vergleich zu das um ein unterspezifiziertes Element handelt, das mit einer größeren Menge syntaktischer Umgebungen kompatibel ist. 3 Das für die vorliegende korpuslinguistische Untersuchung zentrale Vorgehen des Vergleichs (eventuell vermeintlich) isofunktionaler Strukturen wird aber dadurch zum Teil erheblich erschwert, wie das authentische Beispiel in (5) illustrieren kann. (5) Es ist ein Thema, was uns am Herzen liegt. (dpa, 6.2.2006; (Berichtigung: Wortdreher in der vorletzten Antwort) (Interview) Jürgen Klinsmann: „Für mich hat die Entscheidung keine Konsequenzen“ (Fußball-Bundestrainer)) Zunächst weist (5) die mit der alternativen Struktur Es ist ein Thema, das uns am Herzen liegt eindeutig verbundene Relativsatzinterpretation auf: etwas ist ein Thema und dieses etwas liegt einer den Sprecher einschließenden Gruppe von Personen am Herzen. Darüber hinaus weist (5) eine Reihe weiterer möglicher Interpretationen (sowie entsprechende zugrundeliegende Strukturmöglichkeiten) auf, die eben nicht der einschlägigen Relativsatzbedeutung entsprechen und daher aus dem direkten Vergleich mit durch das eingeleiteten Relativsätzen herausgehalten werden müssen. Welche Interpretation für einen mit was eingeleiteten Nebensatz intendiert ist, kann für den überwältigenden Teil der überaus zahlreichen Einzelfälle aber wenn überhaupt nur auf der Basis 3 Für einen Ansatz, der die Polysemie von was aus dessen Unterspezifikation ableitet, vgl. Jäger (2000). Patrick Brandt / Eric Fuß 94 des Kontextes entschieden werden, was einen immensen, nur manuell zu leistenden Arbeitsaufwand bedeutet. Die für das gewählte Beispiel besonders häufig rekurrierenden Typen sind anhand von (5) in den Paraphrasen in (6) gegeben. 4 (6) a. Das, was uns am Herzen liegt, ist ein Thema. (Freier RS) b. Die Frage, was uns am Herzen liegt, ist ein Thema. (Explikation/ indirekte Frage) c. Etwas ist ein Thema. Dieser Umstand liegt uns am Herzen. (Weiterführender RS) Auf den ersten Blick mag die Wahl zwischen dvs. w-Pronomina in bestimmten Unterbereichen der Relativsatzeinleitung als arbiträr erscheinen. Bei näherer Betrachtung zeigt sich allerdings, dass die Alternation zwischen das und was systematisch von der Natur der syntaktischen Umgebung abhängig ist, in der das Relativpronomen auftritt. Abhängig von der Art der Einflussgrößen bzw. ihrer Effektstärke ergibt sich die folgende Gliederung für die vorliegende Pilotstudie. Nach der Darstellung des aktuellen Stands der Forschung (Abschn. 2) und einigen Vorbemerkungen zu methodischen Aspekten des hier gewählten korpuslinguistischen Ansatzes (Abschn. 3) betrachten wir in Abschnitt 4 zunächst die Wirkung, die Eigenschaften des Antezedens auf die Wahl des Relativpronomens ausüben, da es sich hierbei nach der in der Literatur vorherrschenden Meinung um die zentrale Einflussgröße handelt. Es wird gezeigt, dass die Alternation zwischen das und was in der Funktion als Relativum entscheidend von der Präsenz bzw. Absenz eines lexikalischen Bezugsnomens gesteuert wird. Aufbauend auf Einsichten von Behaghel (1928) und insbesondere Wiese (2013) argumentieren wir dafür, dass sich die Distribution von d-Formen und w-Formen am erfolgreichsten durch einen Beschreibungsansatz erfassen lässt, der was als unterspezifiziertes Default-Relativum betrachtet, das dann Ver- 4 Für das gegebene Beispiel ist die Interpretation als attributiver Relativsatz in dem gegebenen Kontext die wahrscheinlichste; dass dies in erster Linie dem involvierten lexikalischen Material - sowie natürlich dem Medium der gesprochenen Sprache - geschuldet ist, suggeriert eine Korpusrecherche (COSMAS, Connexor-Teilarchiv 8.6.2015) nach dem Strukturmuster Es ist der/ die/ eine __ , was…, die 138 Treffer lieferte, die Subjektsätze, d.h. Explikationen oder indirekte Fragen enthielten. (i) gibt ein Beispiel. (i) Es ist eine Zumutung, was Touristen und Bürgern geboten wird. In anderen europäischen Metropolen wimmelt es nur so von Servicemitarbeitern an Bahnhof und Airport, die gerne Fragen beantworten. So etwas wie hier darf nicht sein. Schlimmer kann es nicht werden - nur besser. (Berliner Zeitung, 2.3.2007, Ressort: Lokales; Eine Zumutung, was den Touristen geboten wird, S. 20) Relativpronomenselektion und grammatische Variation 95 wendung findet, wenn die spezifischeren Lizenzierungsbedürfnisse der d- Form (die ein lexikalisches Substantiv als Antezedens verlangt) nicht erfüllt sind. In Abschnitt 5 wird gezeigt, dass die Wahl zwischen das und was allerdings noch von einer Reihe weiterer Faktoren beeinflusst wird, die zu einer größeren Variationsbandbreite führen. Darunter fallen zum einen grammatische Einflussgrößen wie semantische Eigenschaften und kategoriale Eigenschaften bestimmter nominaler Bezugselemente wie Stoffnomina und substantivierte Adjektive sowie das abweichende Verhalten bestimmter Quantoren/ Indefinita, die das zulassen bzw. verlangen. In diesem Zusammenhang diskutieren wir auch Faktoren, die Struktur und Interpretation der gesamten Nominalphrase (Präsenz quantifikativer Modifikatoren, Bezug auf Gegenstände oder Propositionen) und relativsatzinterne Eigenschaften (Modalität/ Negation sowie Kasus bzw. Satzgliedfunktion des Relativums) betreffen. Dabei wird auch thematisiert, inwiefern umgekehrt die Wahl eines bestimmten Relativums die Interpretation des Bezugselements beeinflussen kann. Zum anderen zeigen wir, dass für die Wahl zwischen das und was auch außersprachliche Faktoren relevant sind. Im Mittelpunkt stehen hierbei Informationen zu Textsorte, Region, Land und Register (insbes. Schriftlichkeit vs. Mündlichkeit), die als Metadaten in der KoGra-Datenbank abgelegt sind. 2. Stand der Forschung 2.1 Strategien der Relativsatzeinleitung im Standarddeutschen Im Deutschen werden attributive Relativsätze in der Regel durch ein sog. d- Pronomen eingeleitet, das einen relativsatzinternen Kasus trägt und in Genus und Numerus mit dem Bezugselement (auch Kopfnomen genannt) des Relativsatzes kongruiert: (7) a. ein Mann, der schläft b. ein Mann, den Otto kennt c. ein Mann, dem Otto vertraut d. ein Mann, dessen Peter sich gerne erinnert e. eine Frau, die schläft f. eine Frau, der Otto vertraut g. eine Frau, deren/ *derer Vater Peter nicht kennt h. eine Frau, derer/ ? deren sich Peter gerne erinnert i. ein Pferd, das schläft j. Kinder, die schlafen k. Kinder, deren/ *derer Väter Peter nicht kennt l. Kinder, derer/ ? deren sich Peter gerne erinnert Patrick Brandt / Eric Fuß 96 Singular Plural Mask. Neut. Fem. Mask./ Neut./ Fem. Nom. der das die die Akk. den das die die Dat. dem dem der denen Gen. dessen dessen deren (attrib.)/ derer 5 deren (attrib.)/ derer tab. 1: relativische d pronomina - Formeninventar Daneben stehen allerdings noch weitere Einleitungsvarianten zur Verfügung, bei denen verschiedene Arten von w-Pronomina Verwendung finden (morphologisch einfach: wer/ was etc.; morphologisch komplex: welcher/ welches etc., vgl. z.B. Holler 2013). 6 So existiert in attributiven Relativsätzen zum einen die stilistisch markierte Alternative der Einleitung durch das Interrogativ-/ Relativpronomen welcher. Nach gängiger Auffassung handelt es sich hier allerdings um eine primär in der Schriftsprache auftretende Variante, die vor allem dann verwendet wird, wenn dadurch eine Kombination aus d-Relativpronomen und einem darauf folgenden gleichlautenden Artikel oder Pronomen vermieden werden kann (Duden 2009, S. 303), vgl. (8) sowie die Korpusbelege in (9). (8) a. eine Frau, die die Welt bereist hat ⇒ eine Frau, welche die Welt bereist hat b. ein Mädchen, das das nicht weiß ⇒ ein Mädchen, welches das nicht weiß (9) a. Indonesien inszenierte dieses Jahr die vermutlich komplizierteste Wahlübung, welche die Welt je sah. (Süddeutsche Zeitung, 22.9.2004, S. 4; Hoffnung, die sich aus Verzweiflung speist) b. […] Seniorinnen und Senioren sehr wohl in der Bedarfsplanung und im Landespflegegesetz enthalten. Die Folge für Sachsen, welches das nicht hat, ist klar. Ohne Gesetz keine Beratungsstrukturen, und das fällt uns genau jetzt bei den Pflegestützpunkten auf die 5 Wie (7g-h und 7k-l) zeigen, wird im Genitiv Singular Fem. sowie im Genitiv Plural zwischen Genitivattributen und Genitivobjekten formal unterschieden. 6 Darüber hinaus finden bei Relativierung von Elementen, die eine adverbiale Satzgliedfunktion im Relativsatz ausüben, weitere w-Formen Verwendung (z.B. Pronominaladverbien der Art wo+P, wo bei Lokal- und Temporalangaben). Eine größere Bandbreite an Einleitungsstrategien findet sich zudem in Dialekten des Deutschen. Hervorzuheben ist dabei insbesondere die Verwendung nicht-flektierbarer Relativpartikeln wie z.B. wo, die vor allem in süddeutschen Varietäten auch in Kombination mit Relativpronomina auftreten können (vgl. z.B. Weise 1916; Fleischer 2005). Relativpronomenselektion und grammatische Variation 97 Füße. (Protokoll der Sitzung des Parlaments Sächsischer Landtag am 12.3.2009. 132. Sitzung der 4. Wahlperiode 2004-2009. Plenarprotokoll, Dresden, 2009, S. 11063) Wie die folgende Tabelle zeigt, weist das Paradigma des Relativpronomens welcher im Vergleich zu seiner interrogativen Verwendungsweise eine Lücke auf: Relativa im Genitiv Singular sind - abgesehen vom Femininum - zumindest in der Gegenwartssprache nicht gebräuchlich. Stattdessen muss hier zu den entsprechenden genitivischen d-Pronomina gegriffen werden, wie in (10) illustriert. Singular Plural Mask. Neut. Feminin Mask./ Neut./ Fem. Nom. welcher welches welche welche Akk. welchen welches welche welche Dat. welchem welchem welcher welchen Gen. - - welcher welcher tab. 2: welcher als relativpronomen - Formeninventar (10) a. ein Mann, dessen/ *welches wir gedenken b. ein Pferd, dessen/ *welches wir gedenken c. eine Frau, welcher/ derer wir gedenken d. Männer/ Frauen/ Pferde, welcher/ derer wir gedenken Mit der Ausnahme von was (siehe unten für Details) sind einfache w-Pronomina in attributiven Relativsätzen unzulässig. Sie dienen aber zur Einleitung von sog. freien Relativsätzen, die kein sichtbares Bezugselement aufweisen und den Kernfall für die Verwendung von w-Pronomina als Relativsatzeinleiter darstellen (Duden 2009, S. 303f.; Wiese 2013): 7 7 Die Verwendung komplexer w-Pronomina (auch w-Determinierer genannt) unterliegt in freien Relativsätzen starken Beschränkungen. Nach gängiger Auffassung ist eine Einleitung durch welcher+NP, nur möglich, wenn der w-Ausdruck durch das adverbiale Element auch immer erweitert bzw. ergänzt wird, vgl. (ic) vs. (ie). Darüber hinaus kann welcher nur attributiv gebraucht werden, vgl. (id): (i) a. Wer das sagt, muss es wissen. b. *Welcher das sagt, muss es wissen. c. *Welcher Mann das sagt, muss es wissen. d. *Welcher auch immer das sagt, muss es wissen. e. Welcher Mann auch immer das sagt, muss es wissen. Patrick Brandt / Eric Fuß 98 (11) a. [Wer wagt], gewinnt. b. [Wen das Abenteuer lockt], sollte einen Abstecher in die Wüste wagen. (Salzburger Nachrichten, 21.12.2000, Ressort: Kultur; Petra - geheimnisvolle Felsenstadt) c. [Was der Mann auch anpackt], funktioniert. (Hannoversche Allgemeine, 14.8.2009; ) d. [Wem das nicht passt], kann nach Hause gehen. (Hamburger Morgenpost, 7.6.2012, S. 36; Claus „Bubu“ Bubke „Hier bin ich das Gesetz“ - Ex-Kult-Zeugwart ist jetzt der Herr der Kunstrasenplätze - Er schwärmt von Stani und trauert alten Zeiten nach) Umgekehrt können freie Relativsätze, die normalerweise von einer w-Form eingeleitet werden, unter bestimmten Umständen auch von einem d-Pronomen eingeleitet werden (vgl. Fuß/ Grewendorf 2014). Dabei handelt es sich um eine stilistisch markierte Alternative, die in der Literatur oft als veralteter Formtyp eingestuft wird (vgl. z.B. Zifonun/ Hoffmann/ Strecker 1997, S. 2274): 8 (12) a. [Der das sagt], lebt es vor und das auf eine Art, die ihn überaus populär macht. (Mannheimer Morgen, 18.1.2012, S. 29; Müntefering fordert zum Einmischen auf) b. [Die das nicht so gut können], fliegen raus. (Die Zeit (Online-Ausgabe), 15.3.2012; Schlachtfeld Frau) c. Da stellt sich schließlich die Frage, was einen guten Wein ausmacht. [Den er im Restaurant bekommt], zählt er nicht dazu. (Rhein- Zeitung, 31.10.2009; Dem Winninger Winzer Reinhard …) d. [Der mich am meisten gezwiebelt hatte], ist gestorben. [Dem ich am meisten verdanke], der lebt noch. (Alfred Kerr: [Briefe 1899], In: Wo liegt Berlin? - Berlin, 1998, S. 511) Eine Alternation zwischen w- und d-Pronomina lässt sich auch in verschiedenen Typen von Spaltsätzen beobachten. Erwartungsgemäß werden sog. Pseudo- Spaltsätze bzw. w-Spaltsätze von einem w-Pronomen eingeleitet (nach traditioneller Auffassung handelt es sich bei dem w-Satz um einen freien Relativsatz): (13) Was ich gekauft habe, war ein Buch. 8 In diesem Zusammenhang ist eine interessante Asymmetrie zwischen freien und attributiven Relativsätzen zu beobachten: Während bei attributiven Relativsätzen nur was als w-Relativum zulässig ist, ist die korrespondierende d-Form das bei freien Relativsätzen grundsätzlich ausgeschlossen (vgl. auch Fuß/ Grewendorf 2014): (i) a. Was du kaufst, kaufe ich auch. b. *Das du kaufst, kaufe ich auch. Relativpronomenselektion und grammatische Variation 99 Demgegenüber wird der relativische Satzbestandteil (der den Hintergrund bildet) von sog. es-Spaltsätzen durch ein d-Pronomen eingeleitet, das sich auf das Matrix-Prädikat (das den Fokus bildet) bezieht: (14) Das Buch ist es, das den Menschen die Kenntnis der Religion ebenso wie jene des Rechnungswesens vermittelt. (www.deutschland funk.de/ eine-reise-durch-fremde-welten.700.de.html, 10.6.2016) Handelt es sich bei dem Fokus/ Matrix-Prädikat um ein neutrales d-Pronomen, wird der Relativsatz allerdings durch die w-Form was eingeleitet (ganz analog zu normalen restriktiven Relativsätzen, vgl. die Einleitung und Abschn. 2.2): (15) Das ist es, was/ ? ? das ich will. Ein interessanter Effekt zeigt sich, wenn der Matrixsatz in eine Frage umgewandelt wird, in der das Prädikat/ der Fokus durch ein Fragepronomen realisiert wird (was). In diesem Fall ist Relativierung durch ein d-Pronomen stark präferiert (möglicherweise ist dies als ein Fall morphosyntaktischer Haplologie zu betrachten, vgl. Fuß/ Grewendorf 2014): 9 (16) Was ist es, das/ ? was du willst? 2.2 was in attributiven Relativsätzen Wie bereits eingangs erwähnt, kann das Pronomen was unter bestimmten Umständen auch zur Einleitung attributiver Relativsätze herangezogen werden. Dieses Phänomen, das im Mittelpunkt der vorliegenden Pilotstudie steht, stellt historisch eine Innovation dar (vgl. z.B. Erdmann 1886, S. 52ff. und Paul 9 In Spaltsätzen zeigt sich zudem ein interessanter Kontrast zwischen das, was und welches. Während welches in ‚normalen’ Relativsätzen die gleiche Distribution wie das aufweist und somit lediglich eine stilistisch markierte Variante der d-Form zu sein scheint, ist die Verwendung von welches in Spaltsätzen mit das/ was als Matrix-Prädikat/ Fokus kaum akzeptabel: (i) a. ? ? Das ist es, welches ich will. b. ? ? Was ist es, welches du willst? Die mangelnde Akzeptabilität von (ia) ist zunächst wenig überraschend, da hier was stark bevorzugt ist. Vor dem Hintergrund von (16) würde man aber erwarten, dass in (ib) welches als Alternative für eine d-Form möglich ist - diese Erwartung bestätigt sich aber nicht (diese Tatsache scheint zudem Fragen für eine Haplologie-Analyse aufzuwerfen). In früheren Sprachstufen des Deutschen (bis hinein ins 19. Jahrhundert), scheinen entsprechende Konstruktionen hingegen möglich zu sein: (ii) sich selber werden, das ist es, welches stirbt und immer wieder vergeht. (Gotthilf Heinrich von Schubert, 1839) (iii) Was ist es, welches ihn darzu leitet? (Bernard de Mandeville, Anti-Shaftesbury oder die Entlarvte Eitelkeit der Selbstliebe und Ruhmsucht, 1761 (übersetzt v. Just German von Freystein)). Patrick Brandt / Eric Fuß 100 1920, S. 206ff.; zu Details der Ausbreitung von was im 18. und 19. Jahrhundert vgl. insbesondere Campbell 1913). Gemeinhin wird angenommen, dass w- Formen (ausgehend von ihrer ursprünglichen Verwendung als Indefinita und Interrogativa) zunächst in freien Relativsätzen auftraten und sich dieser Einleitungstyp später auf attributive Verwendungsweisen ausgedehnt hat (vgl. z.B. Paul 1920; Curme 1922). Die Ausbreitung von was als Relativum betraf zunächst appositive Relativsätze und (im Einklang mit seiner indefiniten Semantik) unbestimmte/ generalisierende Lesarten und führte nach und nach zu einer semantischen Differenzierung von verallgemeinernden/ generalisierenden (was) und determinativen (das) Verwendungsweisen (die ursprünglich beide mittels d-Relativa ausgedrückt werden konnten). In einigen Dialekten und anderen Varietäten ist diese Entwicklung noch weiter fortgeschritten. Wie in (17) gezeigt, hat in einigen (vor allem niederdeutschen) Dialekten was das im Standard vorherrschende das verdrängt und sich sogar zum Default-Relativum entwickelt (Weise 1916; Fleischer 2005); ähnliche Tendenzen (Verdrängung von das) finden sich auch in mündlichen (standardnahen) Varietäten, vgl. (18). (17) a. dat Peerd, wat ik köfft heb das Pferd, was ich gekauft habe (Wiesenhann 1936, S. 27) b. də mån, wåt dåur we: r der Mann, was da war (Pirk 1928, S. 26f.) c. Alle Mannslüd wat dor sind alle Männer, was da sind. (Bock 1933, S. 104) (18) Dann braucht mir Mama bald keine Bücher mehr vorzulesen - dann kann ich selbst lesen. Zum Beispiel das Buch, was Mama mir geschenkt hat. Von Jesus und den Alten. (Rhein-Zeitung, 25.8.1998; HEUTE: SCHULANFANG) Wie bereits erwähnt, sind im gegenwärtigen Standarddeutschen andere w- Elemente als die Neutrum-Singular Form was in attributiven Relativsätzen grundsätzlich ausgeschlossen: 10 10 Eine Ausnahme stellt das genitivische W-Element wessen dar. So finden sich im DeReKo (Wgesamt, 12.11.2014) drei Belege, in denen alles durch einen von wessen eingeleiteten Relativsatz modifziert wird (gegenüber 21 Belegen mit dessen): (i) Ich kann dich nicht dafür bestrafen. Du hast meine Worte nicht respektiert; ich verachte dich, das ist alles, wessen ich noch fähig bin. (S. Lenz: Duell mit dem Schatten. Roman, (Erstv. 1953), In: Werkausgabe in Einzelbänden, Bd. 2. Hamburg, 1996, S. 25) (ii) Du bist naiv wie das Wasser des Mittelmeers. Alles, wessen du fähig bist, ist lieben. Und das ist zu wenig. (S. Lenz: Duell mit dem Schatten. Roman, (Erstv. 1953), In: Werkausgabe in Einzelbänden, Bd. 2. Hamburg, 1996, S. 35) (iii) »Sofa ist heute nicht mehr gleich Sofa! « ruft Möbel Kähler in der Rosenthaler Straße und überrascht »mit einem ungeheuren Formen-, Farben- und Musterreichtum«. »Alles, wessen Relativpronomenselektion und grammatische Variation 101 (19) a. der (Einzige)/ jeder/ keiner, der/ *wer mir einfällt b. der (Einzige)/ jeder/ keiner, den/ *wen Maria gesehen hat c. der (Einzige)/ jeder/ keiner, dem/ *wem man vertrauen kann In deskriptiven Grammatiken des Standarddeutschen (vgl. z.B. Duden 2009, S. 1031f.; Buscha/ Kempter 1980, S. 21) werden die Kontexte, in denen was als Relativum in attributiven Kontexten auftritt, in der Regel als Liste von Ausnahmen behandelt. 11, 12 Dabei werden die folgenden Klassen von Antezedentien genannt: das Herz bedarf« liefert die Möbelhandlung Voigt. (die tageszeitung, 28.3.1991, S. 24; Nimm mich, flüstert das Sofa) In früheren Sprachstufen des Deutschen treten vereinzelt auch andere w-Formen auf. So gibt Paul (1920, S. 209) die folgenden Beispiele für eine „rückbezügliche Verwendung“ von wer (wobei er allerdings darauf hinweist, dass in diesen Belegen der für freie Relativsätze typische „verallgemeinernde Sinn“ zumindest teilweise erhalten bleibt): (vi) der, wer alles vermeint zu rechen (Rollenbagen I, 2, VI, 117) (v) niemand, wer es falsch auslegen könnte (Goe. Br. 1, 169, 23) (vi) Weh dem, wer sich der Welt verdungen (Lenau 2, 246, 945) 11 Die Distribution von nl. wat weist Parallelen zu was auf (Broekhuis/ Keizer 2012, S. 407-420). So erscheint wat als Relativum in Verbindung mit Quantoren und Demonstrativpronomina wie al, niets, iets, dat, Prädikativen, Superlativen und in weiterführenden Relativsätzen. Wat scheint aber im Vergleich zu dt. was in Relativkonstruktionen insgesamt weiter verbreitet zu sein. Im Gegensatz zum Deutschen wird es auch recht gängig mit lexikalischen Neutra, v.a. Abstrakta verwendet (insbes. in appositiven Verwendungen, vgl. Broekhuis/ Keizer 2012, S. 408) und kann ein unbelebtes indirektes Objekt vertreten (S. 418; vgl. unten Abschnitt 5.7.2 zum Deutschen). Darüber hinaus können auch andere w-Pronomina in restriktiven Relativsätzen auftreten. So ist wie ‚wer, wen, wem’ obligatorisch mit Präpositionen (während bei Präposition + nicht-belebtem Neutrum nicht wat, sondern waar+P (Pronominaladverb) bzw. P-stranding auftritt; zu Unterschieden zwischen wie und wat in freien Relativsätzen vgl. Broekhuis/ Keizer 2012, S. 411ff.). 12 Die Tatsache, dass im Zusammenhang mit dem Demonstrativum das die w-Form was als Relativum verwendet wird, wird in der Literatur zuweilen als Dissimilationsprozess (ähnlich Haplologie) analysiert, der eine (unerwünschte) Sequenz von identischen adjazenten Morphemen vermeidet (vgl. z.B. Neeleman/ van de Koot 2006; Nevins 2012; Broekhuis/ Keizer 2012, S. 411 zum Niederländischen; Fuß/ Grewendorf 2014 für weitergehende Diskussion). Beispiele wie (i), die zeigen, dass die Ersetzung von das durch was auch bei fehlender Adjazenz erfolgt, scheinen allerdings gegen eine Analyse von das, was als Resultat eines (oberflächlichen) Dissimilationsprozesses zu sprechen. (i) Die Gemeindepräsidentin sei dafür verantwortlich, dass der symbolische Inhalt nicht einfach ins Archiv wandere, sondern in die neuen Behörden und in die Bevölkerung, und dass dort das umgesetzt werde, was man mit der Vereinigung erreichen wollte. (St. Galler Tagblatt, 3.1.2009, S. 25; Mitternacht - Geburtsstunde der neuen Gemeinde Neckertal) Eine Dissimilationsanalyse würde darüber hinaus übersehen, dass dieser Prozess nicht auf den speziellen Kontext von das+Relativpronomen beschränkt ist, sondern eine wesentlich breitere Distribution aufweist (vgl. (20)). Patrick Brandt / Eric Fuß 102 (20) a. Indefinita/ Quantoren: alles, vieles, eines, etwas … b. Demonstrativa/ Determinierer: das, dasjenige, dem … c. Nominalisierte Adjektive (v.a. Superlative): das Beste, Einzige … Eine Beschreibung, die den Versuch unternimmt, das Auftreten von was auf abstraktere (semantische) Eigenschaften des Bezugselements zurückzuführen, findet sich in Engel (1991, S. 662): Voraussetzung für die relative Verwendung von was ist, daß an eine unbestimmte Größe oder Menge gedacht wird. Sind Größe bzw. Menge und deren Elemente hingegen bekannt und klar umrissen, so kann stets, vor allem jedoch in Fall 2 und 3, auch das reguläre Relativpronomen verwendet werden: alles, das uns heilig ist (seltener) Neues, das wir wissen wollen das Schönste, das ich je erlebt habe. Dieser Ansatz geht auf Einsichten der junggrammatischen Schule zurück, in der die Alternation zwischen das und was ausführlicher behandelt wird (vgl. Erdmann 1886; Cutting 1902; Paul 1920; Curme 1922; Behaghel 1928; die detaillierteste empirische Untersuchung ist Campbell 1913). Dabei lassen sich grundsätzlich zwei verschiedene Erklärungsmuster unterscheiden. Zum einen wird in mehreren Arbeiten die Auffassung vertreten, dass das Relativum was durch bestimmte semantische Eigenschaften des Bezugselements ausgelöst wird. Im Mittelpunkt stehen dabei Faktoren wie Indefinitheit (im Sinne von Unbestimmtheit) oder die Unterscheidung zwischen zählbaren Nomina und Stoffbezeichnungen/ Massennomina (in früheren Sprachstufen findet sich hier ausschließlich das; vgl. Erdmann 1886; Paul 1920; Curme 1922; Behaghel 1928), vgl. das folgende Zitat aus Curme (1922, S. 198): 13, 14 13 Vgl. auch Paul (1920, S. 207): „In der jetzigen Sprache ist das durch was ersetzt bei Rückbeziehung auf etwas, nichts, alles, das(jenige) (soweit nicht dabei ein Subst. zu ergänzen ist), und auf ein substantivisches Adj., soweit dasselbe auf etwas Allgemeines bezogen wird.“ 14 Curme (1922, S. 200f.) weist ferner darauf hin, dass was auch dann steht, wenn das Relativum ein Prädikat vertritt: (i) Mein Bruder ist reich/ ein Millionär, was ich nicht bin. (Curme 1922, S. 201) Allerdings scheint in (i) eher ein weiterführender Relativsatz vorzuliegen, der das Matrix- Prädikat modifiziert. Einschlägiger ist das Beispiel in (ii). In diesem Kontext scheint das als Relativum nicht zulässig zu sein (bzw. zu einer semantisch abweichenden Lesart zu führen). (ii) Mit 1,53 Metern Körpergröße und seiner schmächtigen Statur halten ihn viele für das Kind, was er nicht mehr ist. (www.derwesten.de/ staedte/ luedenscheid/ polizei-in-luedenscheidstoppt-18-jaehrigen-fahrer-weil-sie-ihn-fuer-kind-haelt-id6789969.html, Stand: 3.4.2018) Relativpronomenselektion und grammatische Variation 103 [was is employed] If the antecedent is a word of general or indefinite meaning, or expresses a collective idea, such as das, einiges, eins, das einzige, etwas (or was), solches, ein anderes, nichts, mehreres, manches, viel(es), allerhand, allerlei, das bißchen, wenig, genug, an ordinal, as das Erste, das Zweite, with especial frequency alles, also a neuter abstract noun or adjective-substantive (das Schöne the beautiful, &c., especially a superlative, das Beste that which is best), also a neuter noun denoting a material or a collective idea, provided the reference is to an indefinite mass or amount […] [Hervorhebung durch die Autoren]. Zur Unterstützung dieser Hypothese führt Curme (1922) Beispiele wie die folgenden an, in denen ein was-Relativsatz ein lexikalisches Nomen modifiziert, das in seinen Eigenschaften Stoffbezeichnungen nahesteht (ein Abstraktum in (21a), ein Kollektivum in (21b)): (21) a. Alles Weh, was er mir bereitet hat. (Theodor Fontane, Schach von Wuthenow, ch. xxi; Curme 1922, S. 198f.) b. Um ihn her war alles Getier lebendig, was auf der Heide die Junischwüle auszubrüten pflegt. (Theodor Storm, Ein grünes Blatt; Curme 1922, S. 199) Ein Sonderproblem, nämlich die Distribution von was und das nach substantivierten Adjektiven wird ausführlicher von Cutting (1902) diskutiert, der bereits darauf hinweist, dass was nach Superlativen signifikant häufiger auftritt, während das bei substantivierten Positiven (und Komparativen) überwiegt (vgl. auch Abschn. 5.2 unten). Cutting entwickelt dabei eine Erklärung für diesen quantitativen Unterschied, die wesentlich auf semantische Aspekte Bezug nimmt. Seine Ausführungen zu subtilen semantischen Unterschieden zwischen das- und was-Relativen gehören zu den detailliertesten Bearbeitungen dieses Themenbereichs, die in der Literatur zu finden sind. Cutting vertritt die Hypothese, dass was bevorzugt in verallgemeinernden/ generalisierenden Kontexten auftritt, während das mit einer individualisierenden bzw. determinativen Funktion einhergeht, die einen bestimmten (konkreten) Referenten herausgreift. Dabei unterscheidet er im Zusammenhang drei charakteristische Hauptfälle, die was als Relativum verlangen (und vor allem bei Superlativen anzutreffen sind). Diese illustriert er anhand der folgenden drei Belegsätze: (22) a. das Merkwürdigste, was Richard Wagner je geschaffen hat (Nietzsche, Jenseits von Gut und Böse, Leipzig 1895, S. 235) b. alles das Viele und Grosse, was das menschliche Leben vor dem tierischen auszeichnet (Schopenhauer, Über den Satz vom zureichenden Grunde, S. 113) c. das Einzige, was es vom Ding an sich trennt (Schopenhauer, Parerga und Paralipomena II, S. 105) Patrick Brandt / Eric Fuß 104 Cutting (1902, S. 16f.) bemerkt hierzu, dass was typischerweise in quantifikativen Relationen auftritt, in denen entweder eine Teil-Ganzes Relation (d.h. eine partitive Beziehung) zwischen Antezedens und Relativsatz vorliegt oder der Relativsatz die Bedeutung des Antezedens umfasst: 15 The highest conceivable degree of any quality, the completeness expressed by alles, and the uniqueness expressed by einzig imply an examination and evaluation of each and every member of the species in question. The relative is, therefore, in such cases an expression of the whole species of which the antecedent is part, as in [22a] and [22c], or with which the antecedent is identical, as in [22b]. I should like to call this the ‚omnibus’ relative. (Cutting 1902, S. 17) Behaghel (1928) ergänzt die Perspektive, welche die was-Selektion auf semantische Aspekte zurückführt, durch die wichtige Beobachtung, dass was generell dann als Relativum verwendet wird, wenn kein geeignetes substantivisches Antezedens vorliegt: 16 Die Relativsätze, denen im Hauptsatz kein stützendes Glied entspricht oder deren stützendes Glied durch eine nicht individuelle Größe gebildet wird, werden im allgemeinen durch was eingeleitet [Hervorhebung durch die Autoren], nachdem einmal dieses als Relativ aufgetreten ist. Zu den nicht individuellen Größen gehören es, das, dasjenige, dasselbe, dieses, solches, sowie die indefiniten Pronomina, ferner die substantivierten Adjektiva. (Behaghel 1928, S. 725f.) 15 Die etwas ausführlicheren Erläuterungen von Cutting (1902, S. 16f.) zu (22) lauten wie folgt: In [22a] the relative clause intensifies the superlative by measuring it by the standard of all the musical creations of Wagner. That is, whatever ones of the works be selected for comparison is immaterial for the validity of the degree affirmed. The relative (was) embraces the whole of which the superlative represents the part taken; it is, therefore, a relationship essentially like that expressed by a partitive genitive. […] In [22b] the author sums up the multiplicity and importance of all the characteristic differences between human life and mere animal life. The inclusiveness of the relative coincides with that of its antecedent, The syntactical relation is here clearly appositional. […] The same author implies in [22c] by means of the was-clause a scrutiny of the entire range of things that might be conceived of as separating the object in question from abstract reality. Of this entire range he selects a single item (das Einzige). Was is here, as in [22a], an expression of the implied partitive relationship. Whenever the relationship is conceived of as appositional, the exclusive meaning of das Einzige calls for the determinative relative das. 16 Behaghels Begriff der „individuellen Größe“ entspricht einem (zählbaren/ individualisierbaren) lexikalischen Nomen mit deskriptivem Gehalt. Behaghel (1923, S. 38f.) stellt ferner fest, dass individuelle Größen typischerweise die Setzung eines Artikels verlangen, der bei „individuell nicht bestimmten Größen“ wie Stoffbezeichnungen fehlen kann. Vgl. auch Bühler (1934, S. 304): „Behaghel nennt das im Koordinatensystem des hic et nunc, des Zeigfeldes, Bestimmte, Unverwechselbare, und das begrifflich unverwechselbar Bestimmte mit ein und demselben (nicht gerade glücklich gewählten) Namen ‚individuell bestimmte Größe’ (Größe = Etwas).“ Relativpronomenselektion und grammatische Variation 105 Auf diese Weise kann z.B. erfasst werden, dass w-Pronomina auch zur Einleitung anderer Relativsatz-Konstruktionen genutzt werden, in denen kein substantivisches Bezugselement vorliegt. Dazu gehören neben den bereits erwähnten freien Relativsätzen auch sog. weiterführende Relativsätze, die sich auf das Matrix-Prädikat bzw. die Matrix-Proposition beziehen (vgl. auch Abschn. 4.1.4 unten): (23) Wie bei allen anderen Mannschaftssportarten nahmen die Starken Rücksicht auf die Schwächeren, [was den Spass für alle garantierte]. (St. Galler Tagblatt, 23.10.2009, S. 52; Goldener Herbst im Simmental) Eine ähnliche Intuition findet sich auch bereits bei Paul (1920, S. 189), der ebenfalls feststellt, dass ein wesentlicher Unterschied zwischen (relativen) d- und w-Pronomina darin besteht, dass sich Erstere, nicht aber Letztere auf Nomina beziehen können: In der Entwicklung der relativen Pronomina und Adverbien zeigt sich Übereinstimmung innerhalb der westgerm. Sprachen. In diesen haben sich zwei Reihen gebildet, die eine aus den Demonstrativen, die andere aus den Interrogativen (Indefiniten). Die der ersten Reihe können, soweit sie nicht ein Demonstrativum mit vertreten, zur Bestimmung eines Nomens dienen. Die der zweiten sind zunächst verallgemeinernd; sie können sich ursprünglich nicht auf ein Nomen zurückbeziehen, doch kann auf sie mit einem Dem. zurückgewiesen werden. Die Tatsache, dass Behaghel seine Bedingungen für das Auftreten von was als Relativum negativ formuliert, lässt auch eine Interpretation zu, wonach was erscheint, wenn die Lizenzierungsbedingungen des Relativums das nicht erfüllt sind. Ein entsprechender Ansatz wird von Wiese (2013) vertreten, der die Ideen von Behaghel (1928) aufgreift und weiter präzisiert. Wiese zufolge ist die Wahl zwischen d- und w-Formen bei der Einleitung von Relativsätzen durch drei Faktoren gesteuert: die Präsenz/ Absenz eines (substantivischen) Antezedens, die semantische Unterscheidung zwischen Person und Nicht- Person und die Frage, ob das Bezugselement eine „individuelle Größe“ im Behaghelschen Sinn bezeichnet (wobei Personen stets auch individuelle Größen sind). Fehlt ein substantivisches Antezedens, kommen die w-Formen wer/ was zum Einsatz, da diese - im Gegensatz zu d-Pronomina - einen non-anaphorischen Charakter aufweisen und keine kongruenzbasierte Bestimmung von Genus und Numerus erfordern: Das Genus eines w-Pronomens ist semantisch bestimmt durch die Unterscheidung zwischen Person (wer) und Non- Person (was), eine Numerusunterscheidung liegt nicht vor. Somit stellen - wie bereits im vorangegangenen Abschnitt erwähnt - freie Relativsätze den Kernfall für die Verwendung von w-Formen als Relativa dar; in den Anwendungsbereich von w-Relativa fallen aber auch andere Kontexte, in denen kein prototypisches (substantivisches) Bezugselement vorliegt. Dabei handelt es sich Patrick Brandt / Eric Fuß 106 durchweg um Fälle, in denen das Bezugselement einen non-personalen Charakter hat, der - Wiese spricht hier von semantischer Korrespondenz zwischen Antezedens und Relativum - die entsprechende non-personale w-Form was als Relativum auslöst. Neben weiterführenden Relativsätzen wie (23) sind vor allem Fälle zu nennen, in denen als Bezugselement ein quantifikatives Indefinitpronomen vorliegt (z.B. alles, nichts). Daneben treten neutrale Zahladjektive (das erste) und substantivierte Adjektive (insbesondere Superlative) als Bezugselemente auf. Da mit Letzteren auch das als Relativum auftreten kann, vermutet Wiese, dass die Verteilung der beiden Formtypen „durch die Semantik des Antezedens bestimmt“ sei (Wiese 2013, S. 11). Dabei rekurriert er auf Behaghels Begriff der „individuellen Größe“, um die Distribution von das vs. was im Zusammenhang mit nicht-personalen Antezedentien zu erfassen. Interessanterweise charakterisiert er dabei was als den Default/ Elsewhere-Fall, der dann zum Zuge kommt, wenn ein nicht-personales Bezugselement vorliegt, das keine individuelle Größe darstellt. Die folgende Tabelle stellt bisherige Ansätze zur Beschreibung der Verwendung von das vs. was als Relativum zusammenfassend gegenüber: was das Cutting (1902) indefinite/ generalisierende Lesarten determinative/ individualisierende Lesarten Paul (1920) Antezedens ist etwas, nichts, alles, das(jenige) oder ein substantiviertes Adjektiv (das auf etwas Allgemeines bezogen wird) Standardfall/ überall sonst Curme (1922) Antezedens hat eine allgemeine/ unbestimmte oder kollektive Bedeutung, ist eine Ordinalzahl, ein substantiviertes - v.a. superlativisches - Adjektiv oder ein abstraktes Nomen im Neutrum mit Bezug auf ein Material, einen Sammelbegriff oder ein unbestimmtes Maß Standardfall/ überall sonst Behaghel (1928) Bezugselement fehlt („kein stützendes Glied“) oder bildet keine „individuelle Größe“ Standardfall/ überall sonst Buscha/ Kempter (1980); Duden (2009) Antezedens ist ein (neutrales) Demonstrativ- oder Indefinitpronomen oder ein substantiviertes Adjektiv Standardfall/ überall sonst Relativpronomenselektion und grammatische Variation 107 was das Engel (1991) nach Indefinitpronomina, neutralem (substantiviertem) Adjektiv ohne Artikel oder „autonom gebrauchten“ substantiviertem Superlativ; generelle Voraussetzung für die Verwendung von was als Relativum: Antezedens repräsentiert unbestimmte Menge oder Größe Standardfall/ überall sonst Wiese (2013) überall sonst personales Antezedens, nicht-personales Antezedens, das eine „individuelle Größe“ darstellt tab. 3: Stand der Forschung - Überblick In Abschnitt 4.1.4 werden wir eine Beschreibung der Distribution von was vorstellen, die wesentliche Aspekte des Ansatzes von Wiese (2013) aufgreift und dabei den Aspekt betont, dass was ein unterspezifiziertes Element (Jäger 2000; vgl. auch Boef 2012 zu nl. wat) darstellt, welches - im Gegensatz zu bisherigen in der Literatur vertretenen Hypothesen - als Default-/ Elsewhere-Relativum verwendet wird, wenn das spezifischere Element das nicht lizenziert ist. 3. anmerkungen zur methodik Um die in der einschlägigen Forschungsliteratur formulierten Generalisierungen zu überprüfen bzw. die relevante Datengrundlage explorativ zu erweitern, haben wir zunächst eine exhaustive Extraktion einschlägiger Belege aus den POS-annotierten Teilkorpora des Deutschen Referenzkorpus (DeReKo) angestrebt. Ausgangspunkt war dabei das mit TreeTagger (Schmid 1994) annotierte Teilkorpus, da das dabei zugrunde gelegte STTS Tagset (Stuttgart-Tübingen Tagset, Schiller et al. 1999) eine separate Kategorie für Relativpronomina enthält (‚PRELS’). Diese Markierung wurde genutzt, um 117.619 Belege für Relativsätze aus der Korpusgrammatik-Datenbank (KoGra-DB, vgl. Bubenhofer/ Konopka/ Schneider 2014, S. 79f.) zu extrahieren und in einer Excel-Tabelle abzulegen. Die Belegsammlung wurde anschließend auf die Fälle reduziert, die im Mittelpunkt der Studie stehen, d.h. Relativpronomina, die mit einem Bezugselement im Neutrum Singular kompatibel sind (das/ was/ welches sowie dessen/ wessen). 17 Um die Präzision zu erhöhen (und insbesondere weiterfüh- 17 Das dativische Relativpronomen dem kann zwar ebenfalls mit einem Antezedens im Neutrum Singular auftreten; wesentlich häufiger sind allerdings Fälle, in denen das Bezugselement die Merkmale Maskulin Singular aufweist. Aus diesem Grund haben wir im Interesse der Präzision eine Reduzierung der Ausbeute in Kauf genommen und dem nicht in das Korpus integriert. Vgl. aber Abschnitt 5.7.2 für eine Diskussion einschlägiger Fälle, in denen dem mit Neutra auftritt. Patrick Brandt / Eric Fuß 108 rende Relativsätze auszuschließen, die von was eingeleitet werden), haben wir uns auf Belege beschränkt, in denen das Relativpronomen unmittelbar rechtsadjazent zu einem potenziellen Bezugselement steht (m.a.W., Fälle, in denen der Relativsatz in Distanzstellung zum Bezugselement auftritt (Extraposition), wurden nicht berücksichtigt). Dabei haben wir die folgenden Kategorien des STTS Tagsets in Betracht gezogen: ADJA ((substantivierte) attributive Adjektive), ART (bestimmter/ unbestimmter Artikel), NN (normale Nomina), NE (Eigennamen), PDS (substituierende Demonstrativpronomina, darunter auch demonstrativ gebrauchte d-Pronomen wie das oder dem) und PIS (substituierende Indefinitpronomina wie z.B. alles). 18 Das resultierende Korpus, das 18.307 Belegsätze umfasst, wurde anschließend weiter bearbeitet. Zum einen wurde das Korpus um weitere Informationen angereichert, indem mithilfe eines Skripts Identität und syntaktische Kategorie des Bezugselements (auf der Basis der zur Verfügung stehenden Annotation) ermittelt wurden. 19 Zum anderen haben wir Stichproben durchgeführt, um die Einschlägigkeit der gesammelten Belege und die Korrektheit der kategorialen Zuordnung des Bezugselements zu überprüfen. Dabei wurden für jede einzelne syntaktische Kategorie (ADJA etc.) mindestens 200 einschlägige Belege gesammelt. 20 (Potenziell) nicht relevante Belege wurden aussortiert bzw. entsprechend markiert. Zusätzlich wurde notiert, ob das Bezugselement korrekt zugeordnet wurde; ggf. wurde die Information über ein abweichendes Bezugselement in einer separaten Spalte ergänzt. Zudem wurde auf Basis der Stichprobe untersucht, ob - insbesondere bei Artikeln, Demonstrativpronomina, substantivierten Adjektiven und Indefinita - das Bezugselement einen anaphorischen Charakter besitzt und auf ein im Diskurskontext gegebenes lexikalisches Nomen zurückverweist. Die auf diese Weise angereicherte Excel-Tabelle umfasst die folgenden Spalten: − ‚sentenceid’: neunstellige Zahl, die die Wiederauffindbarkeit des Belegsatzes im Gesamtkorpus gewährleistet − ‚Relativum’: Form des vorliegenden Relativpronomens (das, was etc.) 18 Die (automatische) kategoriale Unterscheidung von bestimmten Artikeln und substituierenden Demonstrativa kann allerdings im Einzelfall Probleme bereiten, weswegen wir beide Kategorien in Betracht gezogen haben. 19 Wir danken Hans-Christian Schmitz für die Erstellung des hierfür verwendeten Skripts und seine Anwendung auf die extrahierten Rohdaten. 20 Die Zahl der Belege, die für jede Kategorie überprüft wurden, ist von Fall zu Fall unterschiedlich, abhängig u.a. davon, wie viele Belege betrachtet werden mussten, um auf mindestens 200 einschlägige Beispielsätze zu kommen (ADJA: 367 Belege (davon 153 nicht einschlägig: entweder kein Relativpronomen/ Relativsatz oder falsch erkanntes Bezugselement), NN: 254 Belege (28 nicht einschlägig), NE: 586 Belege (davon 252 nicht einschlägig, sowie 42 mit anderem Bezugselement), PIS: 442 Belege (51 nicht einschlägig; hier wurden mehr Belege gesichtet, da die Verteilung von das vs. was wesentlich ausgeglichener war), ART: 525 Belege (davon 16 nicht einschlägig sowie 2 mit anderem Bezugselement), PDS: 359 Belege (davon 4 nicht einschlägig)). Relativpronomenselektion und grammatische Variation 109 − ‚Element(e) vor Bezugswort’: manuell hinzugefügte Information über Artikel, Modifikatoren etc., die dem Bezugswort vorangehen (beschränkt auf die Stichproben) − ‚Kategorie’: syntaktisches Muster, das die Kombination aus Artikel, Modifikatoren etc. und Bezugselement beschreibt (z.B. ein orkanartiges Ständchen = ein+Adj+N) − ‚Bezugselement’: Identität des Kopfes des Relativsatzes − ‚POS’: Kategorie des Bezugselements (basierend auf dem STTS Tagset) − ‚Anaphorisch’: Angaben über den anaphorischen Charakter des Bezugselements (insbesondere bei Pronomina (Ellipsen) und substantivierten Adjektiven; mögliche Werte: 1 (anaphorisch) oder 0 (nicht anaphorisch)) − ‚Einschlägiger Beleg’: mögliche Werte: 1 (einschlägig), 0 (nicht einschlägig), 2 (einschlägig, aber falsches Bezugselement) − ‚neues Bezugselement’: manuell hinzugefügte Information über die tatsächliche Identität des Bezugselements − ‚neuer POS’: manuell hinzugefügte Information über die tatsächliche Kategorie des Bezugselements − ‚sentence’: Belegsatz, der das Relativum und sein Antezedens enthält Das folgende Bildschirmfoto illustriert Aufbau und Inhalte der Datensammlung. abb. 1: datensammlung das/ was alternation in relativsätzen (Excel tabelle) Auf der Basis dieser Datenbank haben wir erste quantitative Untersuchungen angestellt, deren Ziel zum einen darin bestand, einige bekannte Generalisierungen zur Verteilung von das und was in der Funktion als Relativum einer Prüfung zu unterziehen bzw. zu präziseren (quantitativen) Aussagen zu gelangen. Darüber hinaus sind wir auch explorativ vorgegangen und haben nach weiteren, bislang unbeschriebenen Kontexten gesucht, in denen was als Relativum auftritt, um zu einem besseren und vollständigeren Verständnis der Faktoren zu gelangen, die das Relativierungsverhalten nominaler Elemente beeinflussen. Dabei haben wir auf Basis unserer Stichproben zunächst die relative Verteilung von das/ was abhängig von verschiedenen Typen von Bezugselementen ermittelt, vgl. die folgende Tabelle. Patrick Brandt / Eric Fuß 110 POS das was NN 226 (100%)   0 NE 291 (99,7%)   1 (0,3%) PIS 168 (43%) 223 (57%) ADJA  42 (19,6%) 172 (80,4%) PDS   8 (2,3%) 347 (97,7%) ART   1 (0,2%) 506 (99,8%) tab. 4: das vs. was nach unterschiedlichen typen von Bezugselementen - Ergebnisse einer korpusrecherche in kogra dB (treetagger teilkorpus) abb. 2: das vs. was nach unterschiedlichen typen von Bezugselementen - Ergebnisse einer korpusrecherche in kogra dB (treetagger teilkorpus) Mit einer Irrtumswahrscheinlichkeit von 5% liegt der tatsächliche relative Anteil von was-Relativsätzen in der Grundgesamtheit (d.h. der Menge aller in unserer Datenbank auftretenden Fälle) in den Bereichen, die in der folgenden Tabelle angegeben sind: 21 21 Dabei wird angenommen, dass die anhand der Stichproben ermittelten Häufigkeiten normalverteilt sind. Relativpronomenselektion und grammatische Variation 111 POS was NN 0% - 2,1% NE 0% - 2,2% PIS 52% - 62% ADJA 74,3% - 85,3% PDS 95,4% - 98,9% ART 98,7% - 100% tab. 5: konfidenzintervalle für den relativen anteil von was relativsätzen auf der Basis der Stichprobe aus tabelle 4, konfidenzniveau 95% (berechnet mit prop.test() in R) Die folgende Abbildung 3 zeigt eine Visualisierung der Konfidenzintervalle, die auch die mittels das eingeleiteten Relativsätze berücksichtigt (erstellt mit der KoGra-R-Schnittstelle, http: / / kograno.ids-mannheim.de, Stand: 3.4.2018). abb. 3: konfidenzintervalle für den relativen anteil von das - und was relativsätzen auf der Basis der Stichprobe aus tabelle 4, konfidenzniveau 95% Die Befunde scheinen zunächst gängige Einschätzungen in der Literatur zu bestätigen: Bei eindeutig lexikalisch-nominalen Elementen wie Substantiven und Eigennamen im Neutrum Singular ist das als Relativum quasi obligatorisch. 22 Bei Indefinita halten sich das und was annähernd die Waage, bei sub- 22 Die Tatsache, dass was als Relativum im Zusammenhang mit Substantiven (NN) und Eigennamen (NE) in der Stichprobe praktisch nicht auftritt, ist allerdings nicht gleichzusetzen mit völliger Absenz im Korpus. Auffällig ist, dass relevante Belege der Art NN/ NE+was-Relativsatz überwiegend in Textsorten auftreten, die gesprochene Sprache repräsentieren bzw. der Mündlichkeit Patrick Brandt / Eric Fuß 112 stantivierten Adjektiven ist was in der Überzahl. Schließlich zeigt sich, dass bei demonstrativen Bezugselementen und Elementen, die als Artikel annotiert sind, was als Relativum stark überwiegt. Eine nähere Betrachtung einzelner Bezugselemente zeigt jedoch, dass die Verhältnisse komplizierter sind, was von traditionellen Beschreibungen i.d.R. nur unzureichend erfasst wird. Die folgende Tabelle 6 zeigt die Verteilung von das vs. was für eine Auswahl an Bezugselementen bzw. Kontexten, die wir vor dem Hintergrund einschlägiger Darstellungen in der Literatur sowie aufgrund der Ergebnisse in Tabelle 3 als potenzielle Auslöser von was als Relativum identifiziert haben und die daher für die Belange der vorliegenden Studie von besonderem Interesse sind (bei besonders häufigen Mustern wie das, was ist die hier angegebene Belegzahl das Resultat einer Hochrechnung auf der Basis der Stichprobe von jeweils 200+ Belegen). nahestehen (z.B. Interviews, Protokolle von Parlamentsdebatten o.Ä.), vgl. auch Murelli (2012) sowie Fuß/ Konopka/ Wöllstein (2016). (i) Klinisch getestet werden z.Z. ein Wachstumshormon, das den Zwergwuchs verhindert, und das durch die Presse bekannt gewordene Interferon, was vielerorts als Wunderheilmittel hochstilisiert wurde. (Zuckerindustrie, 1984, Nr. 9; Gentechnologie und Nutzbarmachung biologischer Vorgänge) (ii) das Primäre ist meiner Meinung nach bei den Sicherheitsorganen, die wir haben, daß die Leute das nicht aus Überzeugung machen, sondern gekauft wurden. das fängt damit an, daß sie bevorzugt werden mit Wohnungen, das fängt an mit dem vielen Geld, was die hier verdienen. (Gespräch mit Wehrpflichtigen der 5. VP-Bereitschaft Leipzig, (Interv. vermutl. Okt. 1989), In: Temperamente. Oktober 1989. Texte. Blätter für junge Literatur, Nr. 1. - Berlin, 1990, S. 82) (iii) Sie begeben sich meines Erachtens in Konflikt mit dem Grundgesetz, das nämlich die Chancengleichheit verlangt, und verlagern mithin die Verantwortung von den Parlamenten zum Bundesverfassungsgericht, was ich natürlich nicht beneide. aber es wird wohl nicht umhin kommen, dazu eine Entscheidung zu treffen. (Volkskammer der Deutschen Demokratischen Republik. 10. Wahlperiode. 28. Tagung am 8.8.1990, [stenographisches Protokoll]. - Berlin, 1990, S. 1322) (iv) Uns geht es vor allem um das Know-how, was vorhanden ist. Es gilt die vorhandenen Methoden und Technologien zu nutzen und dem Mittelstand zur Verfügung zu stellen. (Schulz, Werner: Wirtschaft und Arbeit. Rede im Deutschen Bundestag am 25.11.2004, Hrsg: Bundestagsfraktion Bündnis 90/ DIE GRÜNEN) Relativpronomenselektion und grammatische Variation 113 Bezugselement das was % was das 75 2182 96,7% alles, allem, alle 35 636 94,8% nichts 10 67 87% vieles, vielem, viel 38 5 11,6% jeder, jedes 10 3 23,1% eines, eine, einer 38 2 5% das Einzige 13 77 85,6% keines, keins, keiner 7 1 12,5% dasjenige 1 14 93,3% manches 0 1 100% jegliches 0 0 - einzelnes 0 0 - allerlei 0 0 - einiges 0 0 - irgendetwas 0 0 - etliches 0 0 - etwas 123 134 52,1% Gute(s) 5 3 37,5% Schöne(s) 0 0 - Neue(s) 7 1 12,5% Bessere(s) 0 0 - Schönere(s) 0 0 - Neuere(s) 0 0 - Beste(s) 3 15 83,3% Schönste(s) 2 1 33,3% Neueste(s) 1 2 66,7% tab. 6: das vs. was nach unterschiedlichen Bezugselementen, die potenziell was als relativum auslösen - Ergebnisse einer korpusrecherche in kogra dB (treetagger teilkorpus) Die Untersuchung des Relativierungsverhaltens einzelner lexikalischer Elemente auf der Basis der KoGra-Extraktion hat zu einer Reihe weiterführender und detaillierterer Aufschlüsse geführt, die sich wie folgt zusammenfassen lassen. Neben Erkenntnissen, die das quantitative Verhältnis von das vs. was abhängig von verschiedenen Typen von Bezugselementen betreffen, hat die Untersuchung des aus KoGra gewonnenen Teilkorpus auch zur Identifizierung eines weiteren Kontexts geführt, in dem was als Relativum auftritt. Es hat sich Patrick Brandt / Eric Fuß 114 gezeigt, dass nach Ausdrücken, die im weitesten Sinne als Zitate zu klassifizieren sind, ein attributiver (hier: appositiver) Relativsatz bevorzugt durch was eingeleitet wird. 23 Dass sich der Relativsatz dabei tatsächlich auf das Zitat und nicht etwa auf ein anderes potenzielles Kopfnomen bezieht, kann man daran erkennen, dass in Beispielen wie (24a) keine Genusübereinstimmung zwischen dem Relativpronomen (neutral) und dem Nomen Begriff (maskulin) vorliegt. (24) a. Von disciplina wird der Begriff discipulus hergeleitet, was soviel wie Lehrling oder Schüler bedeutet. (St. Galler Tagblatt, 18.2.2009, S. 36; Geschichte prägt die Disziplin) b. Hauptsache, die Stoffe sind flauschig weich und vermitteln ein Gefühl von »Wellness«, was soviel bedeutet wie Wohlgefühl. (St. Galler Tagblatt, 17.9.1997, Ressort: TB-MOD (Abk.); Ein Modewinter) c. Wenn ein Fussballspieler das eigene Tor erwischt, so spricht der Romand von einem »autogoal«, was soviel bedeutet wie das Deutschschweizer »Eigengoal«. (St. Galler Tagblatt, 6.12.1997, Ressort: TB- INL (Abk.); Wenn die Sprache Brücken schlägt) d. Aufgrund bestimmter Besonderheiten schlägt White - der erst kürzlich die Namensflut in der Anthropologie heftig kritisierte - nun eine neue Unterart des Menschen namens Homo sapiens idaltu vor. Dabei zielt die Bezeichnung idàltu, was „älter“ in der Sprache der einheimischen Afar bedeutet, sowohl auf das paläontologische als auch auf das individuelle Alter des Schädels von vielleicht 35 Jahren. (spektrumdirekt, 11.6.2003; Der Älteste) Die genauere Untersuchung der relativen Häufigkeit von das vs. was nach unterschiedlichen (lexikalischen) Bezugselementen hat gezeigt, dass sich die in Tabelle 3 auf der Basis des STTS Tagsets zusammengefassten Gruppen nicht einheitlich verhalten. So gibt es innerhalb der Klasse der Indefinitpronomina neben Elementen wie alles oder nichts, die eindeutig zu was tendieren, auch solche wie jedes oder keines, die offenbar das als Relativum stark bevorzugen (vgl. die Abschn. 4.1.2 und 5.4 für eine eingehendere Betrachtung). 24 Darüber 23 Allerdings finden sich vereinzelt auch analoge Fälle, in denen ein Zitat bzw. zitatähnliches Element durch einen das-Relativsatz modifiziert wird, vgl.: (i) Die Cajuns sind Nachfahren im 18. Jahrhundert aus den Atlantikprovinzen Kanadas vertriebener akadischer Franzosen. Ihre Vorfahren stammen aus der ostkanadischen Provinz Acadie (daher stammt auch der Name ‚Acadiens‘, das die englischsprachigen Nordamerikaner später über „Acadians“ zu „Cajuns“ verballhornten), von wo sie 1755 von den Briten nach deren Sieg im Britisch-Französischen Krieg brutal vertrieben wurden. (Acadiana, In: Wikipedia - http: / / de.wikipedia.org/ wiki/ Acadiana, Stand: 2011). 24 Etwas überraschend ist in diesem Zusammenhang der Befund für vieles/ vielem/ viel, das nach gängiger Auffassung stärker zu was tendiert. Vgl. Abschnitt 4.1.1 unten für weitere Diskussion und die Beobachtung, dass diese Tendenz bei Berücksichtigung einer größeren Datenmenge wieder umschlägt. Relativpronomenselektion und grammatische Variation 115 hinaus gibt es Indefinita wie etwas, bei denen sich die Zahl der das- und was- Belege in etwa die Waage hält (123x das vs. 134x was, vgl. auch Abschn. 5.5). Ein ähnlicher Befund ergibt sich für die Klasse der substantivierten Adjektive, bei denen wir einen Kontrast zwischen Positiven wie Gute(s) und Superlativen wie Beste(s) beobachten, der in der Literatur (mit Ausnahme von Cutting 1902) bislang noch wenig Beachtung gefunden hat: Während substantivierte Positive stärker zu das tendieren, findet sich bei Superlativen vorwiegend was als Relativum. Allerdings ist die Zahl der einschlägigen Belege für deadjektivische Nomina doch recht bescheiden, sodass diese Befunde zunächst als vorläufig gelten müssen. Dies bringt uns unmittelbar zu einem generellen Problem unserer Extraktion: Obwohl wir über 18.000 Beispielsätze in unserer Datenbank gesammelt haben, ist die Datenbasis offenbar zu schmal, um weniger frequente Kontexte ausreichend abdecken zu können. So enthält das aus KoGra-DB extrahierte Korpus nicht nur wenige substantivierte Positive und Superlative (und keine Komparative), sondern weist auch bei vielen Pronominalformen Lücken auf (keine oder nur sehr wenige Belege für Indefinita wie manches, einiges oder irgendetwas; Ähnliches gilt auch für Demonstrativpronomina wie dasjenige). Um die erwähnten Lücken zu schließen und auch für weniger frequente Muster belastbare Aussagen formulieren zu können, haben wir uns daher dazu entschlossen, zu ausgewählten Phänomenbereichen (hypothesengeleitete) ergänzende Einzelerhebungen im gesamten DeReKo (bzw. in den entsprechend annotierten Teilkorpora) über die COSMAS-Webschnittstelle durchzuführen (https: / / cosmas2.ids-mannheim.de/ cosmas2-web, Stand: 3.4.2018). Ziel der ergänzenden Korpusstudien ist es, ein vollständigeres Bild der Kontexte zu bekommen, die was als Relativum auslösen (können), um auf diese Weise zu einem besseren Verständnis der (abstrakten) syntaktischen und semantischen Faktoren zu gelangen, die die Alternation zwischen das und was steuern. Die auf diese Weise gewonnenen Befunde sollen überdies zur Evaluation und ggf. Korrektur der Ergebnisse der eingänglich durchgeführten „Gesamtextraktion“ genutzt werden. Bei den quantitativen Analysen wurde sowohl auf deskriptivals auch inferenzstatistische Verfahren zurückgegriffen. Neben der Ermittlung relativer Häufigkeiten haben wir Berechnungen zur zentralen Tendenz und Streuung (Mittelwert, Standardabweichung) angestellt und mittels einschlägiger Tests die Signifikanz von Häufigkeitsunterschieden geprüft (Chi-Quadrat-Test, Berechnung von standardisierten Pearson- Residuen, Visualisierung anhand von Assoziations- und Mosaikplots); für ausgewählte Phänomene wurden überdies Cluster-Analysen (Visualisierung mittels Dendrogrammen) und Berechnungen zur Effektstärke (Phi-Koeffizient) durchgeführt. Patrick Brandt / Eric Fuß 116 4. korpuslinguistische Befunde Im Mittelpunkt unserer ergänzenden korpuslinguistischen Untersuchungen stehen zwei Problemkomplexe, die sich wie folgt charakterisieren lassen. Zum einen streben wir eine präzisere Identifikation und quantitative Beschreibung der Kontexte bzw. Klasse von Bezugselementen an, die was als Relativum zulassen bzw. fordern. Zum anderen soll auf dieser Basis eine Antwort gegeben werden auf die Frage, welche (morpho-syntaktischen/ semantischen) Faktoren die Alternation zwischen das/ was in der Funktion als Relativpronomen steuern. Es scheint klar zu sein, dass dabei (lexikalischen) Eigenschaften des Bezugselements eine entscheidende Rolle zukommt. In diesem Zusammenhang wollen wir vor allem die folgenden zwei Hypothesen überprüfen, die sich aus der Darstellung des Forschungsstands ableiten lassen: (25) Neutra mit bestimmten lexikalisch-semantischen Eigenschaften lösen was aus. (→ Mit allen anderen Neutra Sing. erscheint das als Relativum) (26) Ein lexikalisches Bezugsnomen mit der Eigenschaft [+Neutrum] löst das aus. (→ Mit allen anderen Neutra Sing. erscheint was als Relativum) Hypothese (25) gibt die allgemein vorherrschende Meinung wieder, wonach das den Standardfall darstellt, der nur unter bestimmten (besonderen) Umständen durch ein w-Pronomen ersetzt wird (vgl. z.B. Curme 1922; Duden 2009). Der Beschreibungsansatz in (26) stellt einen Perspektivenwechsel dar, der wesentlich auf der Erkenntnis von Behaghel (1928) aufbaut, dass was erscheint, wenn kein geeignetes substantivisches Bezugselement vorliegt. Dies lässt sich so interpretieren, dass die Verwendung eines d-Pronomens als Relativum einen bestimmten Kontext voraussetzt; ist diese Bedingung nicht erfüllt, kommt was als unterspezifiziertes Default-Relativum zum Einsatz (vgl. Wiese 2013 und Brandt/ Fuß 2014). Wir werden zeigen, dass diese Sichtweise auf die das/ was-Alternation eine einfachere Beschreibung der Fakten ermöglicht und durch Resultate einschlägiger Korpusstudien im DeReKo gestützt wird. In diesem Zusammenhang haben wir zum einen anhand der Mass/ Count-Unterscheidung untersucht, inwiefern lexikalisch-semantische Eigenschaften des Bezugselements die Wahl des Relativums beeinflussen (Hypothese (25)); zum anderen haben wir studiert, welche Wirkung die Absenz/ Präsenz eines lexikalischen Nomens auf das Relativierungsverhalten von Elementen wie Quantoren/ Indefinita, Demonstrativa und substantivierten Adjektiven hat, die eine starke Tendenz zu was als Relativum aufweisen. Relativpronomenselektion und grammatische Variation 117 4.1 Eigenschaften des Antezedens 4.1.1 N → das Um zu testen, welchen Einfluss die Absenz/ Präsenz eines lexikalischen Bezugsnomens auf die Wahl des Relativums hat, haben wir die Häufigkeit von das/ was in Konstruktion mit ausgewählten Elementen untersucht, die in Isolation nach gängiger Überzeugung Relativierung durch was verlangen (u.a. Artikel wie das, Indefinita wie alles, vieles, substantivierte Adjektive wie einzig). Die Ergebnisse der entsprechenden Einzeluntersuchungen sind in der folgenden Abbildung 4 zusammengefasst: 25, 26 abb. 4: präsenz/ absenz von n bei Elementen, die was als relativum verlangen (D e R e K o , recherche im connexor teilarchiv, Juni 2014) 27 25 Um nicht relevante Konstruktionstypen wie weiterführende Relativsätze auszuschließen, wurde die Suche auf Kombinationen von Bezugselement und Relativsatz beschränkt, die im Vorfeld stehen. In Fällen, in denen aufgrund der Belegzahl eine detaillierte manuelle Sichtung nicht möglich war, wurden die ersten 200 Belege überprüft und das Ergebnis anschließend auf die Gesamtzahl hochgerechnet. 26 Die Korpusuntersuchungen haben keine Hinweise darauf geliefert, dass sich appositive und restriktive Relativsätze hinsichtlich der Wahl zwischen das und was unterschiedlich verhalten (im Gegensatz zum Niederländischen, vgl. Broekhuis/ Keizer 2012, S. 408). 27 Die wenigen Belege der Art nichts+N enthalten allesamt substantivierte Adjektive (nichts Gutes/ Schönes etc.), die ebenfalls zu Relativierung mittels was führen können (vgl. Abschn. 5.2.1). Aufgrund der niedrigen Belegzahl lassen sich hier aber keine verlässlichen Schlüsse ziehen. Patrick Brandt / Eric Fuß 118 Die Korpusbefunde stützen die Hypothese, dass die Präsenz/ Absenz eines lexikalischen Bezugsnomens eine entscheidende Rolle bei der Wahl zwischen d- und w-Relativum spielt. Exemplarisch lässt sich dieser Effekt am Beispiel des quantifizierenden Elements alles illustrieren, das bei Absenz eines lexikalischen Nomens quasi obligatorisch was als Relativum auslöst. Wie aus Abbildung 4 hervorgeht, löst die Hinzufügung eines lexikalischen Nomens (das durch alles modifiziert wird) eine Umkehr der Häufigkeitsverhältnisse aus (ca. 84% das). Wir können also festhalten, dass die Präsenz eines lexikalischen Nomens das als Relativum auszulösen scheint. Gleichzeitig scheint bei Vorliegen eines substantivischen Antezedens die Quantorenbzw. Indefinitsemantik von Elementen wie alles/ nichts/ vieles, die als „nackte“ Determinierer bzw. Indefinitpronomina einen w-Relativsatz verlangen, keine bzw. nur eine untergeordnete Rolle zu spielen (auffällig ist jedoch, dass bei alles + N in immerhin ca. 16% der Belege was auftritt; vgl. Abschn. 5.1 und 5.4 für weitere Diskussion). Diese Beobachtungen lassen sich durch die folgende Generalisierung festhalten: (27) Generalisierung: Relativierung mittels das N [Neutrum Singular] → das Im Folgenden verwenden wir „lexikalisches Nomen“ oder „Substantiv“ synonym für die Präsenz eines lexikalischen Elements, das im Rahmen von Phrasenstrukturgrammatiken konventionell mit dem Symbol „N“ bezeichnet wird (vs. andere (pro)nominale Kategorien wie NP, D(P)). 4.1.2 jedes/ eines/ keines → das Vor dem Hintergrund von (27) ist es allerdings zunächst unerwartet, dass nicht alle „nackten“ Determinierer/ Indefinitpronomina was als Relativum auslösen. Es existiert eine Teilklasse von Elementen, zu der u.a. jedes/ eines/ keines gehören, die systematisch (> 90%) das verlangen, unabhängig davon, ob ein lexikalisches Kopfnomen vorhanden ist, vgl. die folgende Abbildung. Das abweichende Relativierungsverhalten der Elemente in Abbildung 5 lässt sich allerdings möglicherweise auf den elliptischen Charakter entsprechender pronominaler Verwendungsweisen von jedes/ eines/ keines zurückführen, die sich strukturell so deuten lassen, dass der Relativsatz nicht direkt die Quantoren keines oder jedes modifiziert, sondern vielmehr an ein lexikalisches Nomen angebunden ist, das unter Identität mit einem prominenten Diskursreferenten getilgt worden ist (Brandt/ Fuß 2014; vgl. auch Duden 2009, S. 1032, der bemerkt, dass was „nicht bei elliptischen Ausdrücken“ stehe; siehe auch Citko 2004 für ähnliche Befunde zum Polnischen): (28) … N i … [NP jedes/ keines [ N i S Rel ]] Relativpronomenselektion und grammatische Variation 119 abb. 5: determinierer/ pronomina, die relativierung mittels das verlangen Für diese Analyse spricht, dass entsprechende Beispiele, die das Muster jedes/ keines, das enthalten, stets eine elliptische Interpretation zu haben scheinen. In allen relevanten Belegen, die uns im Korpus begegnet sind, wird die lexikalische Restriktion des Quantors durch ein zuvor im Diskurs genanntes Nomen beigesteuert. Exemplarisch ist dies in den folgenden Beispielen illustriert (das Antezedens des getilgtenNomens istdurch Unterstreichung gekennzeichnet): 28 (29) Ein richtiges Fußballspiel. Keines, das ich nur im Fernsehen anschauen kann, sondern eines auf Rasen, eines, bei dem ich am Rand stehen und mitfiebern kann. Eines, bei dem man die Spieler nicht nur als Stars aus der Werbung kennt. (Braunschweiger Zeitung, 12.3.2010) (30) Es wurde (teilweise wider besseres Wissen) jedes Verbrechen sofort den Serben angelastet. Jedes, das nachweislich von Serben begangen wurde, hat man in den Medien breitgetreten, jedes an Serben verschwiegen. (Diskussion: Peter Handke, In: Wikipedia - http: / / de.wikipedia.org/ wiki/ Diskussion: Peter_Handke, Stand: 2011). Ähnliche Beobachtungen lassen sich auch für andere Bezugselemente machen, die normalerweise obligatorisch was als Relativum verlangen. So geht die (ausgesprochen seltene) Verwendung von das nach dem gleichlautenden 28 Man beachte, dass die Form des Quantors in Kontexten wie (29) von der Form abweicht, die man bei Präsenz eines overten Nomens beobachtet (*keines Fußballspiel vs. kein Fußballspiel). Dies spricht aber nicht notwendig gegen die hier vorgebrachte Analyse als Ellipse, da analoge Kontraste auch bei diskontinuierlich auftretenden Nominalphrasen wie in (i) auftreten: (i) Geld habe ich [keines/ *kein __ ] mehr. Patrick Brandt / Eric Fuß 120 Determinierer (bzw. Demonstrativum) in der Regel mit einer anaphorischen Interpretation einher, die an ein im Diskurs gegebenes lexikalisches Nomen anknüpft: (31) a. Didi Senft kommt daher wie das Duracell-Häschen aus der Werbung. Das, das am längsten trommelt. (die tageszeitung, 26.6.2006, S. 5; Didi, der Teufel) b. Auf die Frage, welches Foto ihr bestes sei, antwortete Berenice Abbott einmal: „Das, das ich morgen mache.“ (Berliner Zeitung, 11.7.1998; Schmale Schluchten, S. III) Die Setzung eines w-Relativums scheint entsprechende anaphorische/ elliptische Lesarten zu blockieren (s. auch unten); stattdessen liegt in der Regel eine Interpretation vor, bei der der Relativsatz als Restriktion des Determinierers fungiert: (32) Das, was möglicherweise auf Berlin zukommt, ist im Land Bremen seit Jahren Realität. (Berliner Zeitung, 1.6.2001; Firmenberater sanieren den „Konzern Bremen“, S. 21) Die Bedeutungsunterschiede, die mit der das/ was-Alternation einhergehen, lassen sich auch am folgenden (konstruierten) Minimalpaar demonstrieren: (33) Das Bild, das Peter gekauft hat, war teurer als das, das Maria gekauft hat. ⇒ Maria hat ebenfalls ein Bild gekauft. (33’) … als [das Bild, [das Maria gekauft hat]] (elidiertes Kopfnomen) (34) Das Bild, das Peter gekauft hat, war teurer als das, was Maria gekauft hat. ⇒ Maria kann auch etwas anderes gekauft haben. (34’) … als [das, [was Maria gekauft hat]] (kein lexikalisches Kopfnomen vorhanden) Während (33) eine Interpretation nahelegt, nach der Maria ebenfalls ein Bild gekauft hat (vgl. die Struktur in (33’) mit elidiertem lexikalischem Nomen), kann (34) auch die Bedeutung transportieren, dass Maria etwas anderes gekauft hat. Diese Lesart entspricht Brandt/ Fuß (2014) zufolge einer Struktur, in der der Relativsatz direkt einen Determinierer modifiziert, vgl. (34’). Zusätzliche Evidenz für die Annahme, dass „nackte“ Verwendungsweisen von jedes/ eines/ keines die Präsenz eines elidierten lexikalischen Nomens implizieren, liefert eine Clustering-Analyse auf der Basis der rohen Häufigkeiten in Abbildung 3 und 4, die zeigt, dass die entsprechenden Determinierer bzw. Quantoren zu den Antezedentien mit Nomina geclustert werden, vgl. Abbildung 7 und 8 in Abschnitt 4.1.3. Relativpronomenselektion und grammatische Variation 121 Der Effekt, den die Präsenz eines lexikalischen Kopfnomens auf die Wahl des Relativums hat, lässt sich auch mithilfe weiterer inferenzstatistischer Methoden nachweisen bzw. veranschaulichen. Dies soll hier am Beispiel eines sog. Mosaikplots illustriert werden, der auf der Basis der Daten aus Abbildung/ Tabelle 3 und 4 erzeugt wurde. Zu einer einzigen Tabelle aggregiert ergibt sich die folgende Verteilung von Antezedentien mit bzw. ohne Nomen und Relativierer das bzw. was: das was Antezedens ohne N   678 17006 Antezedens mit N 36796   152 tab. 7: Verteilung von das/ was abhängig von der präsenz eines substantivischen Bezugs elements (aggregierte Zahlen) Der auf dieser Grundlage erzeugte Mosaikplot (Abb. 6) bestätigt das bereits in der Tabelle deutliche Bild, nach dem Antezedentien mit Nomen Relativierung mittels das auslösen und umgekehrt Antezedentien ohne Nomen zu Relativierung mittels was führen: abb. 6: Mosaikplot: Verteilung von das/ was abhängig von präsenz/ absenz eines substantivischen antezedens Der dem Plot zugrundeliegende Chi-Quadrat-Test beachtet dabei die unterschiedliche Auftretenswahrscheinlichkeit von Antezedentien mit Nomen (gegeben die zugrundeliegende Datenbasis). Diese ist daran abzulesen, dass die rechte „Spalte“ des Plots, welche die Fälle mit Antezedentien mit Nomen repräsentiert, deutlich breiter ist als die linke. Die Größe der jeweiligen Flächen repräsentiert den Anteil an der Gesamtheit der Fälle, d.h., alle Flächen zu- Patrick Brandt / Eric Fuß 122 sammen stellen 100% der Fälle dar. Dunkle Einfärbung mit durchgehender Umrandung signalisiert die hochsignifikante Überrepräsentation der infrage stehenden Kombination, dunkle Einfärbung mit gestrichelter Umrandung die hochsignifikante Unterrepräsentation der infrage stehenden Kombination. Demnach ist was in Kombination mit Antezedentien ohne N hochsignifikant überrepräsentiert (dunkle durchgehend umrandete Fläche links oben) und in Kombination mit Antezedentien mit N hochsignifikant unterrepräsentiert (dunkle gestrichelt umrandete Fläche rechts oben). das ist in Kombination mit Antezedentien ohne N hochsignifikant unterrepräsentiert (dunkle gestrichelt umrandete Fläche links unten) und in Kombination mit Antezedentien mit Nomen hochsignifikant überrepräsentiert. 4.1.3 Taxonomie der NP-Typen Die oben notierten Häufigkeiten der Relativierung mittels das bzw. was in Abhängigkeit von bestimmten Antezedentien und deren statistische Interpretation und Visualisierung lassen bestimmte solche Antezedentien als einander mehr oder weniger ähnlich erscheinen, wobei zunächst kein Maß der Ähnlichkeit bzw. Unähnlichkeit gegeben ist. Um Ähnlichkeitsstrukturen auch ganz unabhängig von theoretischen Vorannahmen aufzudecken und zu beschreiben, empfiehlt sich die Durchführung einer Clusteranalyse, die innerhalb der Daten gemäß der untersuchten Eigenschaften zusammengehörige Gruppen identifiziert. Auf Basis der ermittelten Häufigkeiten wird dabei zunächst eine Distanzmatrix erstellt; diese dient dann als Maß der (Un-)Ähnlichkeit der untersuchten Elemente, nach dem in einem iterativen Verfahren Gruppen (‚Cluster’) gebildet werden: Jedes Objekt wird im ersten Schritt seinem eigenen Cluster zugeordnet. In der Folge werden die einander jeweils ähnlichsten, d.h. am nächsten beieinander liegenden Objekte zusammengruppiert, bis schließlich nur noch eine einzige, alle Elemente umfassende und hierarchisch binnenstrukturierte Gruppe übrig bleibt. Im vorliegenden Fall wurden eine euklidische Distanzmatrix und das Verfahren der „complete linkage“ zugrunde gelegt. Dabei enthält die Verbindung zwischen Gruppen alle involvierten Paare von Elementen; als Distanz zwischen den Gruppen wird die Distanz zwischen denjenigen Elementen angesetzt, die am weitesten voneinander entfernt sind. Bei jedem Schritt des Clusterings ist es dann die jeweils kürzeste dieser maximalen Distanzen, die zur Zusammengruppierung führt. Diese als „complete linkage clustering“ oder auch „farthest neighbour clustering“ bezeichnete Methode führt zur Bildung kleinerer und kompakter Gruppen ähnlichen Umfangs, während auf minimalen Abständen oder Durchschnittswerten basierende Clusterings tendenziell zur Bildung größerer und weniger einheitlicher Gruppen führen. Das Ergebnis der Hierarchisierung auf Basis der rohen Häufigkeiten ist in dem folgenden Dendrogramm abgebildet. Relativpronomenselektion und grammatische Variation 123 abb. 7: dendrogramm: clusteranalyse der Verteilung von das/ was bei ausgewählten determinierern/ Quantoren (rohe Häufigkeiten) Im in Abbildung 7 gegebenen Dendrogramm werden die Fälle mit das + N und ein + N als eigene separate Gruppe geclustert; auch die Fälle mit alles stehen isoliert im Dendrogramm. Diese Abtrennung ist in der schieren Überzahl an Belegen gerade dieser Klassen gegenüber den anderen Klassen begründet; allerdings spielt die absolute Zahl an Belegen für die vorliegende Untersuchung keine wichtige Rolle. Demgemäß ist es angemessener, die Clusteranalyse auf Basis normierter Häufigkeiten auszuführen, d.h. auf Basis der prozentualen Anteile der entsprechenden Realisierung (100 geteilt durch Zeilensumme mal Zellenwert). Die entsprechenden Werte sind in Tabelle 8 wiedergegeben. Patrick Brandt / Eric Fuß 124 das was das 0,34% 99,66% das N 99,58% 0,42% alles 0,32% 99,68% alles N 84,21% 15,79% vieles 4,78% 95,22% viel N 96,15% 3,85% nichts 3,01% 96,99% das Einzige 7,15% 92,85% das einzige N 97,13% 2,87% jedes 94,12% 5,88% jedes N 98,75% 1,25% eines 99,49% 0,51% ein N 99,78% 0,22% keines 96,88% 3,12% kein N 100% 0 tab. 8: relativischer anschluss durch das/ was bei ausgewählten determinierern/ Quantoren (normierte Häufigkeiten) Die Durchführung der Clusteranalyse ergibt das Schema in Abbildung 8, in dem die Gruppen der dasvs. was-Selektierer klar voneinander getrennt sind. Hier wird das + N mit eines und ein + N mit kein + N (als Teil einer u.a. auch keines und jedes umfassenden größeren Gruppe) gruppiert und alles mit das (als Teil einer auch das Einzige, vieles und nichts umfassenden Gruppe). Interessant ist hier, dass alles N „spät“ zu der Gruppe der das-Selektierer sortiert wird; hinsichtlich der Tendenz zu das als Relativpronomen weist es das unklarste, wenn auch immer noch eindeutige Muster auf (nämlich rund 84% das zu 16% was), vgl. Abschnitt 5.1 für den Einfluss von alles auf die Relativpronomenselektion bei Stoffnomina und Abschnitt 5.2 für entsprechende Effekte im Zusammenhang mit substantivierten Adjektiven. Die Verrechnung normierter Häufigkeiten lässt es legitim erscheinen, auch unter anderen Bedingungen erhaltene Befunde mit einzubeziehen. Nachträglich mittels der KoGra-DB erhobene Häufigkeiten (11.2.2015) des dasvs. was- Relativanschlusses für weitere Determinierer bzw. Quantoren sind in Tabelle 9 notiert; gesucht wurde ausschließlich nach zu dem Antezedens adjazenten Relativsätzen. Relativpronomenselektion und grammatische Variation 125 abb. 8: dendrogramm: clusteranalyse der Verteilung von das/ was bei ausgewählten antezedentien (normierte Häufigkeiten) das was etliches 7 29 dasjenige 134 143 jegliches 0 2 manches 144 968 einzelnes 1 0 allerlei 3 32 irgendetwas 164 109 einiges 226 968 tab. 9: relativischer anschluss durch das/ was bei anderen determinierern/ Quantoren Die Integration der normierten Häufigkeiten dieser neu hinzugekommenen Quantoren bzw. Determinatoren ergibt das folgende Gesamtdendrogramm. Patrick Brandt / Eric Fuß 126 abb. 9: dendrogramm: clusteranalyse der Verteilung von das/ was bei ausgewählten determinierern/ Quantoren, gesamtbild (normierte Häufigkeiten) Die Gruppierungen innerhalb des Dendrogramms lassen sich nicht ohne Ausnahmen direkt auf etablierte distinktive Eigenschaften von (generalisierten) Quantoren abbilden, die z.B. Intersektivität, Monotonizität oder Präsuppositionalität betreffen. Allerdings fallen bei näherer Betrachtung doch einige Umstände auf, die für eine systematische und letzten Endes möglicherweise semantische Motivation der dasvs. was- Selektion sprechen: − Die früh zusammen gruppierten das-Selegierer (keines bis jedes N) distribuieren allesamt über Atome, d.h. wohlunterschiedene Individuen, die die nicht weiter reduzierbaren Elemente der infrage stehenden Mengen bilden. − Sämtliche ein substantivisches Element involvierenden Antezedentien werden zu den das-Selegierern gruppiert. Im Hinblick auf die vorurteilsfreie Aufdeckung von Strukturähnlichkeiten erweist sich das Verfahren der Clusteranalyse als wertvolle Heuristik. Insbesondere können aus informierter Perspektive überraschende Eingruppierungen darauf hinweisen, dass sich ein genauerer Blick auf die Daten lohnt. So zeigt sich z.B. für den spät zu den das-Selegierern gruppierten Fall dasjenige, dass die ungefähr ausgewogene Verteilung entlang der oben diskutierten Unterscheidung „elliptischer“ vs. „nicht-elliptischer“ Konstruktion motiviert ist, d.h., Relativpronomenselektion und grammatische Variation 127 die Fälle, in denen das selegiert wird, ermöglichen in aller Regel die Rekonstruktion des infrage stehenden substantivischen Antezedens. Die ausgewogene Verteilung bezüglich des Antezedens irgendetwas dagegen scheint anders begründet zu sein, wie die Detailbetrachtung des Antezedens etwas suggeriert, das aus eben dem Grunde der oberflächlich betrachtet ausgewogenen Verteilung von das vs. was zunächst ausgeklammert wurde (vgl. dazu Abschn. 5.6). 4.1.4 Analyse Die Befunde der Korpusstudien legen u.E. einen Beschreibungsansatz nahe, der im Gegensatz zu der in der Literatur vorherrschenden Meinung das w- Pronomen was als Default-Relativum behandelt, das dann genutzt wird, wenn die spezifischeren Lizenzierungsbedingungen für die konkurrierende d-Form nicht erfüllt sind (vgl. Wiese 2013; Brandt/ Fuß 2014): (35) Generalisierung: Relativierung mittels w-Pronomen w-Pronomina werden als (Default-) Relativierer verwendet, wenn kein geeignetes substantivisches Antezedens vorliegt. Diese Analyse geht davon aus, dass d-Pronomina ein lexikalisches Nomen als Bezugselement verlangen (vgl. auch Behaghel 1928), während was ein unterspezifiziertes Element darstellt, das keine Anforderungen an die Kategorie seines Antezedens stellt und typischerweise in Kombination mit funktionalen Kategorien wie Indefinita/ Quantoren (alles, vieles, eines, etwas) und Determinierern (das, dasjenige, dem etc.) auftritt. 29 Formal kann dieser Unterschied durch die Annahme erfasst werden, dass relativische d-Pronomina im Rahmen der (syntaktischen) Kongruenzbeziehung mit dem Bezugselement nicht nur Genus- und Numerusmerkmale abgleichen, sondern überdies auch die Präsenz eines für lexikalische Nomina charakteristischen kategorialen Merkmals verlangen. 30 Diese zusätzliche Lizienzierungsbedingung kann möglicherweise darauf zurückgeführt werden, dass d-Formen (Artikel, Demonstrativa etc.) stets einen anaphorischen bzw. referenziellen Charakter haben, der formal durch die Annahme eines Merkmals [+definit] beschrieben werden kann, das nur in Kombination mit einem kategorialen N-Merkmal interpretierbar ist (vgl. Wiltschko 29 Im Rahmen dieses Ansatzes kann die Wahl des Relativsatzeinleiters Hinweise auf kategoriale Eigenschaften des Bezugselements eines attributiven Relativsatzes liefern. Entscheidend ist dabei natürlich, wie der Begriff „geeignetes substantivisches Antezedens“ in (35) näher zu spezifizieren ist, vgl. Fuß (2017). 30 Brandt/ Fuß (2014) identifizieren das relevante nominale Merkmal als einen sog. referenziellen Index (RI), der nach Baker (2003) für eine Reihe kategoriespezifischer Eigenschaften von Nomina konstitutiv ist (u.a. referenzielles Potenzial, Zähl- und Messbarkeit, Partizipation in Bindungsrelationen). Patrick Brandt / Eric Fuß 128 1998; Boef 2012). Im Gegensatz dazu handelt es sich bei was um einen reinen Operator/ Skopus Marker, der ansonsten völlig unterspezifiziert ist (vgl. Jäger 2000; Bayer/ Brandner 2008) und keine speziellen Anforderungen an den syntaktischen Kontext stellt (siehe unten für weitere Argumente, die diese Einschätzung stützen). 31, 32 Die Distribution von das und was in der Funktion als Relativpronomen ergibt sich nun unmittelbar, wenn man zudem der weit verbreiteten Annahme folgt, dass die Einsetzung lexikalischer Elemente der Elsewhere Condition unterliegt (Kiparsky 1973, 1982; vgl. auch das Subset Principle, Halle 1997): Sind mehrere Formen mit einem Einsetzungskontext kompatibel, muss das spezifischste Element eingesetzt werden. Die Funktionsweise dieses Beschreibungsansatzes kann an dem folgenden Beispielpaar illustriert werden: (36) a. das Buch, [das du liest] b. alles/ vieles/ nichts, [was du liest] In (36a) sind sowohl dals auch w-Form mit dem Einsetzungskontext kompatibel (es liegt ein von der d-Form gefordertes lexikalisch-nominales Bezugselement vor, mit dem aber auch ein w-Pronomen im Prinzip kompatibel ist). Da die Elsewhere Condition aber die Verwendung des spezifischeren Elements 31 Man beachte, dass das und was hinsichtlich ihres sonstigen Merkmalsgehalts ähnlich unterspezifiziert sind. Unter der Annahme, dass Neutrum Singular die unmarkierte Merkmalskombination darstellt und als die Absenz von (positiv spezifizierten) Genus- und Numerusmerkmalen charakterisiert werden kann, besteht zunächst kein Unterschied zwischen das und was. Hinsichtlich der Kasuseigenschaften ist das Bild aber etwas komplexer. Zwar sind beide Formen auch hier unterspezifiziert (Nominativ und Akkusativ fallen zusammen). Ein Unterschied tritt jedoch im Zusammenhang mit dem Dativ auf: Während das generell mit Dativ inkompatibel ist, scheint was zumindest als Interrogativum (nicht aber als Relativum) im Substandard (Mündlichkeit etc.) mit präpositionalem Dativ zu harmonieren (das Prozentzeichen bei (iib) signalisiert dialektale Variation): (i) a. etwas, mit dem/ *das ich gerechnet habe b. etwas, mit dem/ *was ich gerechnet habe (ii) a. Womit hast du gerechnet? b. %Mit was hast du gerechnet? Die Annahme, dass was kaum grammatische Informationen im eigentlichen Sinne kodiert, wird auch durch das Phänomen des sog. „w-drop“ im Bairischen gestützt: Von den w-Pronomina kann nur was unausgedrückt bleiben (bzw. getilgte w-Wörter haben nur die was-Interpretation), vgl. Bayer (2013, S. 190); (das Rautenzeichen signalisiert pragmatische Unangemessenheit): (i) ___ is-n de: s? OK: ‘Was ist denn das? ’ #‘Wer ist denn das? ’ #‘Wo ist denn das? ’ #‘Wann ist denn das? ’ / #‘Wann findet das denn statt? ’ etc. 32 Vgl. aber Paul (1920, S. 186), der annimmt, dass was negativ spezifiziert ist, indem er feststellt, „daß das Pron. was nicht auf Substantiva bezogen werden darf“. Relativpronomenselektion und grammatische Variation 129 verlangt, ist hier nur das als Relativum zulässig. 33 In (36b) kann das allerdings nicht eingesetzt werden, da es die Präsenz eines lexikalischen Nomens als Antezedens voraussetzt, was in (36b) nicht gegeben ist. Daher muss in diesem Kontext Einsetzung von was als Default-Relativierer erfolgen. Diese Analyse ermöglicht eine einheitliche Beschreibung von Relativsätzen und relativsatzähnlichen Konstruktionen, die durch ein w-Pronomen eingeleitet werden. So wird korrekt vorausgesagt, dass was nicht nur nach bestimmten Determinierern/ Quantoren in attributiven Relativsätzen auftritt, sondern darüber hinaus generell zur Einleitung von Relativsätzen verwendet wird, die kein nominales Antezedens besitzen: − freie Relativsätze (vgl. (37)); − weiterführende Relativsätze mit Bezug auf das Matrix-Prädikat bzw. die Matrix-Proposition (vgl. (38)); 34, 35 − Relativsätze, die sich auf Zitate/ zitatähnliche Ausdrücke beziehen (z.B. Übersetzungen, vgl. (39)). (37) a. [Wer wagt], gewinnt. b. [Wen das Abenteuer lockt], sollte einen Abstecher in die Wüste wagen. (Salzburger Nachrichten, 21.12.2000, Ressort: Kultur; Petra - geheimnisvolle Felsenstadt) c. [Was der Mann auch anpackt], funktioniert. (Hannoversche Allgemeine, 14.8.2009; ) (38) Wie bei allen anderen Mannschaftssportarten nahmen die Starken Rücksicht auf die Schwächeren, [was den Spass für alle garantierte]. (St. Galler Tagblatt, 23.10.2009, S. 52; Goldener Herbst im Simmental) (39) a. Von disciplina wird der Begriff discipulus hergeleitet, was soviel wie Lehrling oder Schüler bedeutet. (St. Galler Tagblatt, 18.2.2009, S. 36; Geschichte prägt die Disziplin) 33 Die Tatsache, dass in mündlichen Varietäten des Deutschen was eine größere Distribution aufweist und z.T. das als Relativum im Kontext Neutrum Singular ersetzt hat, kann vor diesem Hintergrund so gedeutet werden, dass die relevanten Varietäten das als Relativum verloren haben (was diachron als Ausbreitung des unmarkierten Falls analysiert werden kann). Alternativ könnte man auch die Auffassung vertreten, dass was hier die Eigenschaften von das angenommen hat (also eine Spezifizierung für nominale Kontexte aufweist). Diese Analyse würde allerdings die (prima facie wenig attraktive) Annahme erforderlich machen, dass das Lexikon zwei verschiedene (homonyme) Lexeme mit der Lautgestalt was enthält. 34 Neben was können weiterführende Relativsätze auch durch w-Elemente wie womit, worüber, wobei, wofür etc. sowie weswegen/ weshalb eingeleitet werden. 35 was findet auch dann als Relativsatzeinleiter Verwendung, wenn das semantische Prädikat durch ein substantivisches Element ausgedrückt wird (vgl. bereits Curme 1922, S. 200f.): (i) Peter ist ein Genie, was ich nicht bin. Patrick Brandt / Eric Fuß 130 b. Hauptsache, die Stoffe sind flauschig weich und vermitteln ein Gefühl von »Wellness«, was soviel bedeutet wie Wohlgefühl. (St. Galler Tagblatt, 17.9.1997, Ressort: TB-MOD (Abk.); Ein Modewinter) c. Wenn ein Fussballspieler das eigene Tor erwischt, so spricht der Romand von einem »autogoal«, was soviel bedeutet wie das Deutschschweizer »Eigengoal«. (St. Galler Tagblatt, 6.12.1997, Ressort: TB-INL (Abk.); Wenn die Sprache Brücken schlägt) Allen diesen Konstruktionstypen ist gemein, dass sie kein nominales Bezugselement besitzen. Freie Relativsätze üben direkt eine syntaktische Funktion im übergeordneten Satz aus; im Gegensatz zu den anderen w-Relativkonstruktionen ist das einleitende w-Element nicht auf die unterspezifizierte Form was beschränkt. Weiterführende Relativsätze wie in (38) beziehen sich auf die Matrix-VP bzw. Matrix-Proposition und lassen nur was als Relativum zu. Die gleiche Einschränkung gilt für attributive Relativsätze, wenn sie wie in (39) Zitate (insbesondere Übersetzungen) modifizieren. Dass in diesen Fällen das Antezedens kein Nomen, sondern vielmehr ein (abstrakter) Begriff ist, lässt sich z.B. daran erkennen, dass keine Genuskongruenz mit dem Bezugselement vorliegt (vgl. z.B. (39a)). Die Verwendung von w-Pronomina in diesen Kontexten lässt sich also so interpretieren, dass w-Formen im Gegensatz zu d- Pronomina keinen anaphorischen/ referenziellen Charakter haben (und i.d.S. unterspezifiziert sind, vgl. auch Wiese 2013; Brandt/ Fuß 2014 zum Dt.; Boef 2012 und Hachem 2013 zum Niederländischen). Im Rahmen der vorliegenden Analyse kann dieser Kontrast so erfasst werden, dass d-Pronomina im Rahmen einer syntaktischen Kongruenzbeziehung Identität mit dem Bezugselement herstellen, während dieser Bezug bei w-Formen weniger eindeutig ist und ggf. pragmatisch erschlossen werden muss (vgl. Brandt/ Fuß 2014). Einen Hinweis darauf, dass der Bezug des Relativums was nicht eindeutig strukturell festgelegt ist, liefert die Beobachtung, dass bei nachgestellten was-Relativsätzen Ambiguitäten auftreten, die sich darauf zurückführen lassen, dass was potenziell verschiedenen Bezugselementen zugeordnet werden kann (vgl. Holler 2005; Brandt/ Fuß 2014): In (40) kann sich der Relativsatz entweder auf das Prädikat oder auf das direkte Objekt alles beziehen; in (41) kann der weiterführende Relativsatz entweder mit der übergeordneten Proposition oder dem übergeordneten Prädikat konstruiert werden: (40) Adrian hat alles gekauft, was Anton auch hat. a. ‚Anton hat ebenfalls alles gekauft.’ (Bezug auf Matrix-Prädikat/ VP) b. ‚Adrian hat alles das gekauft, was Anton auch bereits besitzt.’ (Bezug auf alles) Relativpronomenselektion und grammatische Variation 131 (41) Adrian will in die Bretagne fahren, was Anton auch will. a. ‚Adrian will in die Bretagne fahren, und Anton will auch, dass Adrian in die Bretagne fährt.’ (Bezug auf Matrix-Proposition) b. ‚Adrian will in die Bretagne fahren, und Anton will auch in die Bretagne fahren.’ (Bezug auf Matrix-Prädikat/ VP) Ferner kann die Tatsache, dass was mit unterschiedlichen Typen von Antezedentien aufteten kann (neben nominalen Kategorien Prädikate (VP), Propositionen/ Sätze sowie Zitate (deren kategorieller Status unklar ist)), als Hinweis darauf verstanden werden, dass was (im Gegensatz zu das) keine eindeutigen Anforderungen an die syntaktische Kategorie seines Bezugselements stellt. 5. Weitere Faktoren: abweichende Verteilungen von was/ das In den vorangegangenen Abschnitten haben wir Daten präsentiert, die darauf hindeuten, dass die Wahl zwischen d- und w-Relativa wesentlich davon abhängt, ob ein lexikalisches Substantiv als Antezedens vorliegt. Dabei haben wir für eine Analyse dieses Zusammenhangs argumentiert, die was als Default- Relativum ansieht, das dann zum Einsatz kommt, wenn die spezifischere d- Form (die ein Substantiv als Antezedens voraussetzt) nicht lizenziert ist. In der Folge wird gezeigt, dass die Verteilung von das und was noch von einer Reihe weiterer Faktoren beeinflusst wird, die zu Abweichungen von dieser generellen Regel führen können. Zunächst wird in Abschnitt 5.1 das Verhalten von Stoffnomina diskutiert, die zwar generell eine d-Form als Relativum verlangen (und sich somit auf den ersten Blick nicht von anderen Substantiven unterscheiden), aber offenbar „durchlässig“ sind für quantifikative Eigenschaften, indem die Kombination alles + Stoffnomen zu einem signifikanten Anstieg der Einleitung durch das führt. Ferner wird gezeigt, dass die Wahl von was als Relativum im Zusammenhang mit Stoffnomina bevorzugt zu sog. Amount-Lesarten führt, in denen die NP als Mengen- und Gradangabe interpretiert wird. Im Anschluss behandelt Abschnitt 5.2 ausführlich das Relativierungsverhalten von substantivierten Adjektiven, die im Vergleich zu lexikalischen Substantiven stärker zwischen das- und was-Relativierung variieren, dabei aber kein einheitliches Verhalten zeigen: Während substantivierte Positive stärker zu das tendieren, findet sich im Zusammenhang von Superlativen fast ausschließlich was. Analoge Beobachtungen zu deverbalen Nomina werden kurz in Abschnitt 5.3 erwähnt. Abschnitt 5.4 greift die Beobachtung aus Abschnitt 4.1.2 wieder auf, dass sich unterschiedliche Typen von Quantoren/ Indefinita hinsichtlich der Wahl zwischen das/ was nicht einheitlich verhalten, Patrick Brandt / Eric Fuß 132 und führt entsprechende Kontraste auf die unterschiedliche Semantik von alles und jedes (und die damit verbundenen Selektionseigenschaften) zurück. Die Beobachtung, dass die Wahl des Relativpronomens durch die Semantik (bzw. referenziellen Eigenschaften) des Bezugselements beeinflusst wird, wird in Abschnitt 5.5 am Beispiel von etwas diskutiert, das bei gegenstandsbezogener Interpretation zu das tendiert, aber bei Bezug auf eine Proposition was auslöst (analoge Beobachtungen gelten auch für dasselbe/ das Gleiche). In diesem Zusammenhang diskutieren wir in Abschnitt 5.6 auch den umgekehrten Fall, dass durch die (nicht kontextgerechte bzw. regelkonforme) Verwendung einer bestimmten Pronominalform (dvs. w-) bestimmte Implikaturen ausgelöst werden können, was die Interpretation des Bezugselements betrifft. Abschnitt 5.7 zeigt, dass die Wahl des Relativums ferner auch von internen Eigenschaften des Relativsatzes beeinflusst ist. Im Mittelpunkt stehen dabei Modalität/ Negation sowie Satzgliedfunktion/ Kasus des Relativpronomens. Schließlich betrachten wir in Abschnitt 5.8 außersprachliche Faktoren wie Region, Land, Textsorte und Register, über die wir im Rahmen der in Kogra-DB verfügbaren erweiterten Annotation Zugriff haben. 5.1 Lexikalisch semantische Eigenschaften von N Viele Grammatiker, die sich mit dem Problem der hier beschriebenen Variation befasst haben, setzen als relevante Faktoren für die Relativsatzeinleiterwahl Merkmale an, die im weiteren Sinne mit Numerus, also der grammatischen Unterscheidung zwischen insbesondere Einzahl und Mehrzahl, zu tun haben. Paul (1920, S. 207) bemerkt, dass die w-Morphologie mit dem Bezug auf etwas „Allgemeines“ zu tun hat; Curme (1922, S. 198) vertritt die Auffassung, dass solche Nomina im Neutrum von was wieder aufgenommen werden, die „ein Material oder eine kollektive Idee denotieren, insofern Bezug auf ein indefinites Maß genommen wird“; Behaghel (1928, S. 725f.) meint, dass Konzepte, die keine „individuellen Größen“ darstellen, zur Selektion von was führen. Es stellt sich die Frage, ob über die Kategorisierung als Neutrum Singular hinaus insbesondere semantische Merkmale für die Variation zwischen das und was eine Rolle spielen oder ob Neutrum Singular eventuell schon der Ausdruck solcher möglicherweise relevanten semantischen Eigenschaften ist. Etwas pointiert schreibt etwa Werner (2012, S. 24) zur numerusrelevanten Semantik der Genera im Deutschen: Während das Femininum als konturiertes Ganzes einzelne Teile in den Hintergrund treten lässt und zusammenfasst, tritt beim Maskulinum die einzelne Einheit, d.h. der Teil, individuiert in den Vordergrund. Das Neutrum als ‚kategoriales Massennomen’ repräsentiert dagegen das Nicht-Pluralisierbare, Homogene […]. Das Neutrum ist das Genus der Massennomina, auch als sog. Kontinuativa bezeichnet. Relativpronomenselektion und grammatische Variation 133 Als einschlägiger und naheliegender Testfall für die Frage nach dem Zusammenhang zwischen die Eigenschaft der Zählbarkeit betreffender Semantik und der dvs. w- Realisierung des Relativsatzeinleiters bieten sich demnach als Antezedens fungierende Massennomina an, auf die die eben zitierten Eigenschaften zuzutreffen scheinen; der grammatische Sonderstatus von Massennomina ist darüber hinaus gut etabliert und passt zu der relevant erscheinenden Unterscheidung zwischen prototypisch nominaler bzw. adjektivischer Referenzweise. Insbesondere verbieten Massennomina Mehrzahlbildung sowie Determination durch genau solche Artikel bzw. Quantoren, die so etwas wie Zählbarkeit vorauszusetzen scheinen, vgl. (42) *jedes Mehl, *ein Mehl … Im letzten Abschnitt haben wir gesehen, dass gerade Quantoren wie jedes oder ein(es) auch in Abwesenheit eines sichtbaren nominalen Komplementes zur Selektion von das führen. Geachs (1962) Kriterium der Angemessenheit von Prädikaten wie „dasselbe sein“ führt klar zur Kategorisierung von Massennomina als eben nominale Kategorie, vgl. (43) a. Das Kind hier ist dasselbe wie das (das) gestern (da war). b. Das Mehl hier ist dasselbe wie das (das) neulich (benutzt wurde). Mit Geach spricht das Muster in (43) also für die Existenz eines für Nomina charakteristischen (und Identitätsaussagen ermöglichenden) sog. „Referentiellen Index“ auch an Massennomina. Andererseits lässt sich beobachten, dass Massennomina bezüglich Identitätsbeziehungen atypische Interpretationen hervorrufen. So wirkt die Beschreibung des in der Skizze dargestellten Sachverhalts mittels eines zählbaren Substantivs merkwürdig, diejenige mittels eines Massennomens dagegen unauffällig: (44) \__O__/ \__O__/ a. ? ? Das Ding in der linken Schüssel ist dasselbe wie das (Ding) in der rechten (Schüssel). b. Das Metall in der linken Schüssel ist dasselbe wie das (Metall) in der rechten (Schüssel - nämlich Gold). Um die Relevanz der Unterscheidung zwischen zählbaren Nomina und Massen-/ Stoffnomina zu untersuchen, führten wir eine Korpusrecherche nach 11 „nackten“ häufigen Stoffnomina durch (Neutra: Wasser, Geld, Licht, Obst, Gemüse, Fleisch, Bier, Eis, Brot, Eisen, Mehl), die direkt am Satzanfang mit adjazentem Relativsatz auftreten; ein etwaiger Einfluss von Artikel oder anderen overt Patrick Brandt / Eric Fuß 134 sichtbaren Strukturelementen war so ausgeschlossen. 36 Im Ergebnis überwog der Anschluss mittels das ganz entschieden, vgl. Tabelle 10. Zumindest auf den ersten Blick scheint also die Unterscheidung zwischen Stoffnomina und zählbaren Nomina keine Rolle für die Wahl zwischen das und was als Relativsatzeinleiter zu spielen. 37 (45) Geld, Wasser etc., das/ was … das was Geld, Wasser etc. 5.297 (99,3%) 38 (0,7%) tab. 10: Verteilung von das vs. was als relativierer bei (artikellosen) Stoffnomina (D e R e K o , archiv W gesamt, 1.5.2015) Eine nähere Betrachtung der Fälle, in denen was als Relativum auftritt, liefert allerdings Hinweise darauf, dass der Einsatz der w-Form mit bestimmten semantischen Effekten verknüpft ist, die nur im Zusammenhang mit Stoffnomina aufzutreten scheinen. Im Mittelpunkt stehen dabei zunächst Belege mit dem Bezugsnomen Geld, da diese das Gros der Treffer ausmachen, bei denen der Relativsatzanschluss ausnahmsweise mittels was geleistet wurde. Das abweichende Verhalten des Massennomens Geld bezüglich der Relativpronomenselektion ist anscheinend mit einer zugrundeliegenden Mengenlesart („amount reading“) verbunden, wie einige repräsentative Beispiele suggerieren: 36 Nicht ausgeschlossen sind dagegen natürlich womöglich vorhandene interpretative Eigenschaften, die mit der Vorfeldposition assoziiert sind, wie z.B. Topikalität und damit zusammenhängend kontextuelle Gegebenheit. Im Sinne des Ausschlusses solcher insbesondere mit links-peripheren Positionen assoziierter semantisch/ pragmatischer Merkmale wäre es evtl. angemessener, „nackte“ Nomina in Objektposition zu betrachten; die Identifizierung der entsprechenden Strukturen ist allerdings technisch aufwendig bzw. ohne erheblichen manuellen Aufwand nicht zu leisten. 37 Einen ähnlichen Befund lieferte eine unabhängige Korpusrecherche, deren Gegenstand Prädikate oder Prädikatmodifikatoren waren, die aufgrund ihrer Semantik vor allem solche Subjekte lizenzieren sollten, die nicht zählbar sind. Verglichen wurden die Häufigkeiten der Konstruktionen in (ia) vs. (ib). (i) a. …, was massenweise/ massenhaft/ zuhauf b. …, das massenweise/ massenhaft/ zuhauf Auch hier überwog die in (b) dargestellte Konstruktion mit Relativanschluss durch das ganz erheblich. Das einzige Beispiel mit Anschluss durch was ist in (ii) gegeben, welches das substantivierte Adjektiv einzige als Antezedens involviert. (ii) Geschenkideen sind das einzige, was es hier massenweise gibt. (Nürnberger Zeitung, 14.12.2009, S. 1; Der Geschenkemarkt „Winterkiosk“ war ein Erfolg - Liedermacher und Langohren lockten) Wie wir bereits in den Abschnitten 4.1.1 und 4.1.3 gesehen haben, führen solche Einzigkeit ausdrückenden Konstruktionen in Abwesenheit eines sichtbaren nominalen Komplements zum Relativsatzanschluss durch was. Relativpronomenselektion und grammatische Variation 135 (46) „… Das Geld, was ich für die Wohnung ausgeben müsste, spare ich lieber und lebe in meinem eigenen Reich - auf dem Campingplatz“, sagt Steffens. (Rhein-Zeitung, 16.6.2009; Günstig leben auf dem Campingplatz) (47) Das Geld, was sie aber an Beiträgen sparen, können sie in eine lukrativere Anlage einzahlen. (Berliner Zeitung, 17.8.2002; Garantie für Verunsicherte, S. 31) (48) Das Geld, was Bund und Länder bisher gemeinsam für Programme ausgegeben hätten, solle künftig direkt den Ländern zur Verfügung stehen. (Berliner Zeitung, 16.10.2003) In solchen Beispielen wäre eine Lesart, die strikte Identität mit dem impliziert, worauf das Antezedens materialiter referierte, eigenartig - gemeint ist ja nicht, dass es sich in den im Matrixsatz und Relativsatz ausgedrückten Sachverhalten etwa um dieselben Schecks oder Scheine oder Münzen handelt. Während der Bedeutungsunterschied zunächst subtil erscheint, können weitere Faktoren ihn deutlicher zutage treten lassen und den Gebrauch von das, insofern er mit der Lesart strikter materialer Identität verbunden ist, als seltsam erscheinen lassen. In (48) erschiene Identität etwa der infrage stehenden Schecks, Scheine oder Münzen qua perfektiver Verbform im Relativsatz ausgeschlossen. Die Verbundenheit von Mengenlesarten mit dem Relativeinleiter was wird besonders deutlich an Bespielen wie dem folgenden (vgl. auch unten Abschnitt 5.5). (49) Ein Anfänger bekommt am Staatstheater monatlich 2 500 Mark brutto, dasselbe, was er an einem einzigen Drehtag verdient. (Berliner Zeitung, 2.3.2001, S. 12) Diese Beobachtung knüpft an die theoretische Diskussion an, ob systematisch zwischen regulären restriktiven Relativsätzen und sog. Amount-Relativsätzen, die Eigenschaften von Mengen oder Graden denotieren, unterschieden werden muss (Carlson 1977; Heim 1987): (50) a. Marv put everything he could in his pocket. (Carlson 1977, S. 528) b. It would take days to drink the champagne they spilled that evening. (Heim 1987, S. 38; McNally 2008) Der englische Satz (50a) lässt sich wie folgt paraphrasieren (McNally 2008): Für eine maximale Menge a von Objekten, für die gilt, dass Marv die Menge a in seine Tasche stecken konnte, hat er genau diese Menge a eingesteckt. Für Satz (50b) scheint nur eine Amount-Lesart Sinn zu machen: Es geht lediglich um die Menge von Champagner, die auf dem Boden verschüttet wurde, nicht darum, dass man denselben Champagner trinkt, der verschüttet wurde (letz- Patrick Brandt / Eric Fuß 136 tere Identitätslesart ist mit einem regulären restriktiven Relativsatz assoziiert). Für Amount-Lesarten ist im Englischen u.a. charakteristisch, dass sie nicht mit w-Pronomina (who, which) kompatibel sind und durch die Präsenz von only blockiert werden (McNally 2008): (51) a. It will take years to drink the champagne which they spilled that evening. (Keine Amount-Lesart) b. It will take years to drink the only champagne they spilled that evening. (Keine Amount-Lesart) Ähnliche Bedeutungsunterschiede scheinen auch im Zusammenhang mit der Variation zwischen das und was aufzutreten. Insbesondere scheinen unter Verwendung von das als Relativum Amount-Lesarten weniger plausibel oder sogar unmöglich zu sein. So scheint nur in (52a) eine Lesart als Amount-Relativsatz möglich zu sein, während das in (52b) eine (einigermaßen unsinnige) Interpretation auslöst, in der es sich nicht nur um dieselbe Menge von Wasser, sondern tatsächlich um dasselbe Wasser handeln muss, das getrunken wird. Analoges gilt für die Beispiele in (53). (52) a. Wir bräuchten Wochen, um alles Wasser zu trinken, was verschüttet wurde. b. Wir bräuchten Wochen, um alles Wasser zu trinken, das verschüttet wurde. (53) a. Es würde Wochen dauern, alles Geld auszugeben, was gestern eingenommen wurde. b. Es würde Wochen dauern, alles Geld auszugeben, das gestern eingenommen wurde. Ohne an dieser Stelle näher auf die theoretische Frage eingehen zu können, ob diese Asymmetrien rein pragmatischen/ semantischen Ursprungs sind oder sich aus strukturellen Eigenschaften von Amount-Relativsätzen ableiten lassen, können wir zumindest festhalten, dass bei Stoffnomina das Auftreten von was als Relativum nicht selten mit Amount-Lesarten verknüpft zu sein scheint, während das eine entsprechende Interpretation weniger leicht zulässt. 38 Diese 38 Die Analyse von Amount-Relativsätzen wirft in diesem Zusammenhang eine Reihe von interessanten Fragen auf, die wir im Rahmen der vorliegenden Studie nicht weiter verfolgen können. Erklärungsbedürftig sind z.B. einige Unterschiede zwischen dem Deutschen und Englischen, die im Zusammenhang mit Amount-Lesarten und w-Relativierung auftreten. So sind im Englischen Amount-Lesarten mit w-Relativa generell inkompatibel, während sie im Deutschen (zumindest bei Stoffnomina) bevorzugt mit was auftreten. Die Tatsache, dass im Englischen only Amount-Lesarten verhindert, dt. einzig aber zu den Elementen zählt, die was-Relativierung fordern (als Substantiv) bzw. positiv beeinflussen, scheint überdies zu zeigen, dass die Wahl des Relativums möglicherweise nur bedingt von der +/ -Amount Unterscheidung beeinflusst wird. Relativpronomenselektion und grammatische Variation 137 Kontraste stehen im Einklang mit der Hypothese (vgl. Abschn. 4.1.4), dass das Relativum das Identität mit dem Bezugselement herstellt, während der Bezug von was in der Syntax nicht eindeutig festgelegt ist und ggf. pragmatisch erschlossen werden muss. Ein weiterer interessanter Kontrast zwischen zählbaren Nomina und Stoffnomina zeigt sich, wenn man das Verhalten Letzterer in Konstruktion mit dem Quantor alles betrachtet. Im Rahmen unserer Cluster-Analysen haben wir bereits festgestellt, dass die Kombination alles+N mit einem auffällig hohen Anteil an was-Relativsätzen einhergeht (vgl. Abschn. 4.1.3). Um diesen Zusammenhang näher zu untersuchen, haben wir eine weitere Korpusrecherche durchgeführt und mit den Ergebnissen zum Relativierungsverhalten „nackter“ Stoffnomina verglichen. Es hat sich herausgestellt, dass die Präsenz eines Allquantors die Verfügbarkeit von was positiv zu beeinflussen zu scheint (ein analoger Effekt kann auch bei substantivierten Adjektiven beobachtet werden, vgl. Abschn. 5.2.1 unten): das was Geld, Wasser etc. 5.297 (99,3%) 38 (0,7%) alles Geld, Wasser etc. 329 (80%) 82 (20%) tab. 11: Einfluss von alles auf die Verteilung von das vs. was bei Stoffnomina Der Einfluss, den alles auf die Wahl des Relativums im Zusammenhang mit Stoffnomina ausübt, kann mithilfe inferenzstatistischer Methoden noch detaillierter herausgearbeitet werden. Der Chi-Quadrat-Test ergibt einen p-Wert < 2,22-16, wonach der durch alles ausgelöste Effekt als statistisch hochsignifikant einzuschätzen ist. Eine Berechnung der Effektstärke liefert einen Phi- Koeffizienten von 0,34, der den Schwellenwert überschreitet (> 0,3), der in den Sozialwissenschaften gängigerweise für mittlere Zusammenhänge angenommen wird. Von besonderer Aussagekraft ist in diesem Zusammenhang die Berechnung der standardisierten Pearson-Residuen. Mit diesem Test wird geschätzt, inwieweit die beobachteten Häufigkeiten von den erwarteten Häufigkeiten in einzelnen Zellen abweichen. Ist der Betrag des entsprechenden Residuums größer als 1,96, ist von einer signifikanten Abweichung von der erwarteten Häufigkeit auszugehen. Die folgenden Ergebnisse zeigen, dass dies mit Ausnahme der Kombination von Stoffnomina+das durchgängig für die Zellen in Tabelle 11 zutrifft. 39 Eine Visualisierung der inferenzstatistischen Befunde durch einen Assoziationsplot findet sich in Abbildung 10. Das Vorzeichen des jeweiligen Residuums zeigt eine Abweichung von der Erwartung nach oben bzw. unten an. 39 Dass das als Relativum im Zusammenhang mit „nackten“ Stoffnomina trotz einer relativen Häufigkeit von > 99% nicht überrepräsentiert ist, erklärt sich damit, dass dieser Wert mehr oder weniger der erwarteten Verteilung (Baseline) entspricht. Patrick Brandt / Eric Fuß 138 das was Geld, Wasser etc. 1.015805 -6.955358 alles Geld, Wasser etc. -3.659793 25.059117 tab. 12: Einfluss von alles auf die Verteilung von das vs. was bei Stoffnomina: pearson residuen abb. 10: assoziationsplot: Einfluss von alles auf die Verteilung von das vs. was bei Stoffnomina Abbildung 10 visualisiert die Befunde in Tabelle 12, d.h. die standardisierten Abweichungen der beobachteten Häufigkeiten von den unter einer bestimmten Unabhängigkeitshypothese erwarteten Häufigkeiten. Jede Zelle wird durch ein Rechteck repräsentiert, dessen Höhe proportional zum Residuum der Zelle und dessen Breite proportional zur Wurzel der erwarteten Häufigkeit ist. Die Fläche des Rechtecks ist daher proportional zur Differenz von beobachteten und erwarteten Häufigkeiten. Generell gilt, dass dunkelgraue Flächen eine hochsignifikante Abweichung signalisieren, während (schwach) signifikante Abweichungen durch Mittelgrau markiert werden; nicht-signifikante Abweichungen entsprechen hellgrau eingefärbten Flächen. Die hohe mittelgraue Säule im unteren rechten Bereich bildet ab, dass die Präsenz von alles einen hochsignifikanten Einfluss auf die Wahl des Relativums hat und was im Kontext mit Stoffnomina deutlich nach vorne bringt. Wir können also abschließend festhalten, dass (vor allem „nackte“) Stoffnomina zwar analog zu zählbaren Nomina systematisch das als Relativum verlangen, aber unter bestimmten Umständen ein abweichendes Relativierungsverhalten zeigen, das offenbar Relativpronomenselektion und grammatische Variation 139 an bestimmte interpretative Effekte gebunden ist, die nur im Zusammenhang mit der speziellen Semantik von Stoffnomina verfügbar sind (Amount-Lesarten, Präsenz von alles). 5.2 Substantivierte Adjektive Eingangs wurde bereits erwähnt, dass sich neutrale substantivierte Adjektive hinsichtlich der Relativpronomenselektion von „normalen“ Substantiven unterscheiden und häufig in Kombination mit was auftreten. Dabei machen gängige grammatische Beschreibungen des Deutschen keinen Unterschied zwischen substantivierten Positiven und Superlativen (vgl. z.B. Duden 2009, S. 1032). Eine Untersuchung des Relativierungsverhaltens dieser Formtypen im Rahmen einer Korpusstudie im DeReKo zeigt aber, dass die tatsächlichen Verhältnisse etwas komplizierter sind und sich Positive und Superlative nicht einheitlich verhalten (vgl. Cutting 1902 für ähnliche Befunde). Die erwähnte Variation zwischen das und was als Relativum tritt im Standarddeutschen nur in Kombination mit substantivierten Adjektiven auf, die mittels Konversion aus adjektivischen Basen abgeleitet werden (gut → das Gute, besser → das Bessere, best- → das Beste). Diese Bildungsvariante ist im Gegensatz zu Ableitungen per Derivationssuffix äußerst produktiv (vgl. Lücken wie *Gutheit, *Hochheit, *Gekauftheit, *Besserkeit etc.) und kann nicht nur auf Adjektive und ihre Steigerungsformen, sondern auch auf (adjektivisch gebrauchte) Partizipien angewendet werden (sehend → der Sehende, erlebt → das Erlebte, gekauft → das Gekaufte). Entsprechende Nominalisierungen weisen heterogene kategoriale Eigenschaften auf. Sie besitzen zum einen typisch nominale Eigenschaften; zum anderen weisen sie aber auch Züge auf, die für lexikalische Nomina untypisch sind bzw. eher für Adjektive charakteristisch sind (vgl. Fuß 2017 für eine ausführlichere Betrachtung). So scheint Beste in Beispielen wie (54) der Kopf der entsprechenden Nominalphrase zu sein, der von Artikeln und Attributen modifiziert wird. (54) Der Fortschritt der neueren Zeit ist so gewaltig, daß das Leben die eigentliche Schule ist, das heutige Beste ist morgen schon durch das Bessere überholt. (Friedrich Harkort, Die preussische Marine und die deutsche Flotte, Berlin: Georg Reimer, 1861, S. 40) Während deadjektivische Bildungen einerseits also die typische syntaktische Distribution von Nomina aufweisen, zeigen sie andererseits die Stark/ schwach Alternation, die von vielen Grammatikern als wortartdefinierendes Kriterium für die Kategorie Adjektiv betrachtet wird (vgl. z.B. unlängst Schäfer 2015): Patrick Brandt / Eric Fuß 140 (55) a. das/ vieles/ alles Gute b. etwas/ viel/ nichts Gutes (56) a. das Heiligtum b. ein Heiligtum Eine weitere (lexikalisch-semantische) Besonderheit entsprechender Konversionen ist es, dass sie (mit einigen semantisch bedingten Lücken) im Gegensatz zu anderen Nomina in allen drei Genera auftreten. Die Wahl des Genus geht zudem mit semantischen Unterschieden einher, während Genus bei lexikalischen Nomina eine primär grammatische Kategorie ist. Maskulina und Feminina bezeichnen Personen, während Neutra i.d.R. Unbelebtes und insbes. Abstrakta bezeichnen (Ausnahmen sind aber z.B. das Junge/ ein Junges für Tierkinder): 40 (57) der Schöne, die Schöne, das Schöne Ein weiterer Reflex der speziellen Eigenschaften deadjektivischer Nomina ist das Kongruenzverhalten bestimmter attributiver Adjektive, die im Gegensatz zur Situation bei „echten“ lexikalischen Kopfnomina unflektiert bleiben können (und somit einen eher adverbialen Charakter zu besitzen scheinen): 41 (58) a. das vermeintlich/ einzig/ vollständig Neue b. das vermeintliche/ einzige/ vollständige Neue (59) a. *das vermeintlich/ einzig/ vollständig Pferd b. das vermeintliche/ einzige/ vollständige Pferd Konversionsprozesse, die lediglich eine Änderung der syntaktischen Distribution bewirken, aber flexionsmorphologische Eigenschaften der Basis weitgehend unangetastet lassen, werden in der traditionellen Grammatikschreibung auch als „syntaktische Konversion“ bezeichnet (Erben 2000; vgl. auch Duden 2009, S. 667), um sie von sog. „morphologischer Konversion“ (Eisenberg 2006) 40 Bei elliptischem Gebrauch wie in (i) können substantivierte Adjektive mit den Merkmalen maskulin/ feminin scheinbar auch auf nicht menschliche Entitäten referieren. Allerdings ist in diesem Kontext von einem getilgten Nomen auszugehen, dessen Genusmerkmale (und Numerusmerkmale) mit einem salienten Diskursreferenten identisch sind, vgl. Abschnitt 4.1.2 für Diskussion. (i) Fünf Staubsauger wurden getestet. Der beste __ kommt ohne Beutel aus. 41 Man beachte, dass bei anderen Konversionen attributive Adjektive obligatorisch flektiert erscheinen - auch wenn es sich dabei um Elemente handelt, die in der Quellstruktur in adverbialer Funktion (und somit unflektiert) verwendet werden: (i) Sie haben schrecklich gejammert. (ii) *das schrecklich Jammern (iii) das schreckliche Jammern Relativpronomenselektion und grammatische Variation 141 bzw. „paradigmatischer Umsetzung“ (Erben 2000) abgrenzen zu können. Bei morphologischer Konversion treten segmental identische Stämme in verschiedenen Wortarten auf und werden i.d.R. der Zielwortart entsprechend flektiert (z.B. schlafen → Schlaf, Fisch → fischen etc.). 42 5.2.1 Positive Adjektive, die in elliptischen Ausdrücken auftreten (für die also ein getilgtes Kopfnomen anzunehmen ist), lösen regelmäßig das als Relativum aus. Im Folgenden wird mit Bezug auf Beispiele wie (60) auch von einer anaphorischen bzw. attributiven Lesart des Bezugselements gesprochen: (60) Ich glaube, zu seinem Geburtstag nächste Woche schenke ich ihm einen Gutschein für das Fitnesscenter. Vielleicht kriege ich noch den Willkommensrabatt für das Neue, das gerade aufgemacht hat. (Die Rheinpfalz, 17.4.2013; ) Umgekehrt zeigt sich, dass das Relativum was systematisch eine nicht anaphorische Lesart des Ausdrucks signalisiert (siehe unten für einige wenige Ausnahmen): (61) Was mich aber wirklich ärgert, ist Ihr neuer Sparvorschlag bei den Reinigungskräften! Super, das einzig Neue, was Ihnen einfällt, ist, bei denen zu sparen, die uns den Dreck hinterherräumen! (Protokoll der Sitzung des Parlaments Bremische Bürgerschaft am 8.12.2010. 77. Sitzung der 17. Wahlperiode 2007-2011. Plenarprotokoll, Bremen, 2010) Die Form-Funktions-Zuordnung geht mit dem Unterschied zwischen Klein- und Großschreibung des adjektivischen Elements einher. Bei Kleinschreibung des Adjektivs liegt i.d.R. eine anaphorische Lesart vor, die das verlangt: (62) Das bisher bestehende Kraftwerk ist bekanntlich völlig überaltet und muß schon allein aus Umweltgründen erneuert werden. Das neue, das Ende 1994 fertiggestellt sein soll, wird nach dem neuesten Stand der Technik errichtet und bis zu 90 Prozent weniger Schadstoffe an die Umwelt abgeben. (Salzburger Nachrichten, 5.3.1993; Heizkraftwerk Nord 88 Mill. S teurer) 42 Ein alternativer Ansatz zur Erklärung der speziellen Eigenschaften deadjektivischer Konversionen besteht darin anzunehmen, dass das adjektivische Element nicht Gegenstand eines Konversionsprozesses ist, sondern als Attribut ein phonetisch leeres Nomen modifiziert, das den Kopf der Nominalphrase darstellt (Kester 1996a, 1996b; Wiltschko 1998; Matushansky 2008 für Superlative; Broekhuis/ Keizer 2012, S. 409 zum Niederländischen). Patrick Brandt / Eric Fuß 142 Relativum eindeutig anaphorisch potenziell anaphorisch nicht anaphorisch total das 20 (83,3%) 0 4 (16,7%) 24 was  0 0 5 (100%)  5 tab. 13: Einfluss der das/ was alternation auf die interpretation des Bezugselements (alles/ das/ vieles + gute/ schöne/ neue, kleinschreibung) Wie aus Tabelle 13 ersichtlich, liegen allerdings einige wenige Belege vor, in denen was (das eigentlich fehlende Anaphorizität signalisiert) als Relativum nach kleingeschriebenem gute/ schöne/ neue auftritt: (63) Emotionaler Mehrwert wird bezahlt. In dieser Version von mir war die Übereinstimmung mit marktwirtschaftlichen Prinzipen so ungefähr das einzig gute, was ich am „fairen“ Handel entdecken konnte ; -)). (Diskussion: Fairer Handel/ Archiv/ 2009, In: Wikipedia - http: / / de.wikipedia.org/ wiki/ Diskussion: Fairer_Handel/ Archiv (Stand: 2011). Dabei handelt es sich durchweg um Fälle, in denen man eigentlich Großschreibung des adjektivischen Elements erwarten würde. Bei zwei von fünf Belegen handelt es sich um Beiträge zu Wikipedia-Diskussionen wie (63), die durch einen umgangssprachlichen Stil gekennzeichnet sind und insgesamt mehr Abweichungen von gängigen orthografischen Konventionen aufweisen. Hinzu kommt ein Büchner-Zitat, wobei die fehlende Großschreibung von neue (nicht anaphorisch) vermutlich auf abweichende orthografische Konventionen zurückzuführen ist. 43 Übrig bleiben zwei Beispiele aus Zeitungsartikeln, bei denen man ebenfalls Großschreibung erwarten würde: (64) a. „[…] Wenn wir etwas Neues probieren, müssen wir das behutsam tun, um niemanden zu vertreiben“, erklärt Julia Schafranek, die Direktorin des Vienna‘s English Theatre. Das neue, was sie ab Jänner probiert, ist ein südafrikanisches Musical mit dem Titel „Kat and the Kings“. (Die Presse, 23.12.1999, Ressort: Kultur; Vienna‘s English Theatre: Behutsam auf neuem Weg) b. „[…] Man stellt dich sofort in die Ecke, macht dich fertig und sagt dir, daß es am besten wäre, wenn du selbst ‚auf eigenen Wunsch’ verschwindest. Es ist, als ob die Zeitungen und all das gute, was man uns mitteilt und wozu man uns aufruft, sich im Traum ab- 43 Das Büchner-Zitat lautet wie folgt: (i) Man müsse die „abgelebte moderne Gesellschaft zum Teufel gehen lassen … Sie mag aussterben, das ist das einzig neue, was sie noch erleben kann.“ (Die Zeit (Online-Ausgabe), 17.10.2013; Du bist ein starkes Echo) Relativpronomenselektion und grammatische Variation 143 spielt, während in der Wirklichkeit alles bleibt wie es war.“ (die tageszeitung, 31.10.1989, S. 12f.; Die realexistierende Katastrophe) Diese Befunde legen den Schluss nahe, dass Kleinschreibung tatsächlich der heutigen Konvention entsprechend einen attributiven Charakter des Adjektivs signalisiert (in Kombination mit einem elidierten lexikalischen Kopfnomen). Nicht-attributive Belege (mit was als Relativum) sind durchweg auf eine abweichende Orthografie (mangelnde Großschreibung) zurückzuführen. Bei Großschreibung des substantivierten Positivs liegt Variation zwischen das und was vor, wobei es auf den ersten Blick nicht ganz klar ist, welche Faktoren für die Wahl der Varianten verantwortlich sind: (65) a. In vielen Ländern Afrikas - wie auch Osteuropas - sind alte, überkommene Ordnungen oder Unordnungen im Umbruch oder sogar gestürzt. Das Neue, das sich aus solchen Veränderungen ergeben könnte, ist vielerorts allerdings noch nicht in Sicht. (die tageszeitung, 24.6.1992, S. 16; Zensur in der neuen Weltunordnung) b. Aber auch ganz neue Ideen seien gerne willkommen und oft sei es das Neue, was den Anstoß gebe, eingefahrene Fahrwasser endlich zu verlassen. (Rhein-Zeitung, 5.7.1997; Gute Ideen sind in der Tat gefragt) Generell dominieren nicht anaphorische Lesarten, unabhängig von der Wahl des Relativpronomens, vgl. auch die Beispiele mit das in (66). Mit anderen Worten, die das/ was-Alternation lässt sich hier nicht eindeutig auf die Unterscheidung ±anaphorisch zurückführen. Exemplarisch zeigt dies Tabelle 14 für alles/ das/ vieles Neue. Der einzige eindeutig elliptisch zu interpretierende Beleg ist bereits in (60) genannt worden und zeigt das als Relativum. 44 Relativierung mittels was führt ausschließlich zu nicht anaphorischen Lesarten. (66) a. Andere, ich denke an die Erstklässler und solche, die auf eine reizvolle, neue Aufgabe nach den Ferien zugehen, warten mit Spannung und vielleicht etwas Angst auf das Neue, das auf sie zukommt. (St. Galler Tagblatt, 8.8.1998, Ressort: WV-EXT) b. Nicht alles Neue, das von der FIFA kommt, ist schlecht. Aber auch nicht unbedingt gut. (Neue Kronen-Zeitung, 10.7.1998, S. 72; Tollwut) 44 Ein potenziell elliptisch zu interpretierender Beleg ist etwa der folgende: (i) Frau Ministerin hat hier noch am Schluss gesagt: Das ist ein wunderschöner Tag für Niedersachsen. - Das Gesetz ist noch gar nicht in Kraft, da kommt schon das Neue, das ja auch in Gesetzesfassung gebracht werden muss. (Protokoll der Sitzung des Parlaments Landtag Niedersachsen am 29.8.2002. 113. Sitzung der 14. Wahlperiode 1998-2003. Plenarprotokoll, Hannover, 2002, S. 11295) Patrick Brandt / Eric Fuß 144 Relativum eindeutig anaphorisch potenziell anaphorisch nicht anaphorisch total das 1 (0,3%) 3 (1,1%) 276 (98,6%) 280 was 0 0  77 (100%)  77 tab. 14: Einfluss der das/ was alternation auf die interpretation des Bezugselements (alles/ das/ vieles Neue) Etwas überraschend ist allerdings, dass bei substantivierten Positiven (Großschreibung) das Relativum das bei Weitem überwiegt (ca. 70% aller Fälle), entgegen der Einschätzung in der Dudengrammatik (siehe oben), vgl. Tabelle 15 (vgl. bereits Cutting 1902 für analoge Beobachtungen). 45 Bezugselement was das total alles/ das/ vieles Gute 139 (23,8%) 444 (76,2%) 583 nichts/ viel/ ein/ etwas Gutes 33 (41,7%) 46 (58,2%) 79 alles/ das/ vieles Schöne 38 (29,9%) 89 (70,1%) 127 nichts/ viel/ ein/ etwas Schönes 9 (17,3%) 43 (82,7%) 52 alles/ das/ vieles Neue 77 (21,6%) 280 (78,4%) 357 nichts/ viel/ ein/ etwas Neues 95 (30%) 222 (70%) 317 tab. 15: das/ was alternation nach substantivierten adjektiven (großschreibung) Der Befund in Tabelle 15 wirft die Frage auf, ob freie Variation zwischen das und was vorliegt oder es möglich ist, grammatische Faktoren zu ermitteln, die die Alternation der beiden Relativierungsstrategien steuern. Als potenzielle Einflussgrößen, die unmittelbar mit Eigenschaften des Bezugselements zusammenhängen, kommen dabei u.a. in Betracht: (i) lexikalisch-semantische Eigenschaften des Adjektivs (wir haben bereits festgestellt, dass Adjektive wie einzig, die eine superlativähnliche Bedeutung haben, eindeutig zu was tendieren); (ii) Flexionseigenschaften des Adjektivs (starke vs. schwache Flexion: viel Gutes vs. alles Gute); (iii) Präsenz quantifizierender Modifikatoren wie alles oder einzig. 46 45 Im Rahmen der Suchanfrage wurden Belege berücksichtigt, bei denen der Abstand zwischen Determinierer und substantiviertem Adjektiv bis zu einem Wort beträgt. Auf diese Weise konnten auch Beispiele erfasst werden, bei denen ein modifizierendes Adjektiv zwischen den beiden Elementen interveniert. 46 An diesem Punkt zeigt sich auch, dass der Begriff der „individuellen Größe“, der von Behaghel (1928) und Wiese (2013) verwendet wird, um semantische Eigenschaften zu bezeichnen, die die das/ was-Alternation steuern, zu unscharf ist, um ihn ohne Weiteres für die Zwecke einer Korpusstudie operationalisieren zu können. Relativpronomenselektion und grammatische Variation 145 Die folgende Tabelle zeigt den relativen Anteil von dasvs. was-Relativierung nach den drei (häufigen) substantivierten Adjektiven Gute, Schöne, Neue. Ein kurzer Blick zeigt bereits, dass der Anteil der beiden Relativierungsstrategien bei allen drei Adjektiven mehr oder weniger identisch ist: was das Gute(s) 172 (26%) 490 (74%) Schöne(s)  47 (26,3%) 132 (73,7%) Neue(s) 172 (25,5%) 502 (74,5%) tab. 16: Verteilung von das/ was nach verschiedenen adjektiven Dieser erste Eindruck wird auch durch einschlägige inferenzstatistische Tests bestätigt. So ergibt ein Chi-Quadrat-Test einen p-Wert von 0,9711, der belegt, dass die Wahl zwischen den hier überprüften Adjektiven keinen signifikanten Einfluss auf die Wahl des Relativpronomens hat (auch der Wert für Cramérs V-Koeffizienten, der die Effektstärke angibt, fällt hier mit 0,0062 äußerst gering aus). Ein analoges Bild ergibt die Berechnung der standardisierten Pearson-Residuen. Wie die folgende Tabelle 17 zeigt, liegt der Betrag der einzelnen Residuen deutlich unter dem Schwellenwert (1,96), der üblicherweise für signifikante Abweichungen von der erwarteten Häufigkeit festgesetzt wird. Eine Visualisierung dieser Befunde durch einen Assoziationsplot findet sich in Abbildung 11 (man beachte, dass das Vorzeichen des jeweiligen Residuums eine Abweichung von der Erwartung nach oben bzw. unten anzeigt). was das Gute(s) 0,088 -0,052 Schöne(s) 0,118 -0,069 Neue(s) -0,148 0,087 tab. 17: Verteilung von das/ was nach verschiedenen adjektiven; standardisierte pearson residuen Patrick Brandt / Eric Fuß 146 abb. 11: assoziationsplot: Einfluss der lexikalischen Wahl (substantivierte adjektive) auf die das/ was alternation Der Befund, dass die beobachteten Häufigkeiten nicht signifikant von den (unter einer bestimmten Unabhängigkeitshypothese) erwarteten Häufigkeiten abweichen, wird in Abbildung 11 durch eine hellgraue Färbung sämtlicher Flächen visualisiert. Auf diese Weise wird die Tatsache veranschaulicht, dass zumindest die Wahl zwischen den Lexemen gut, schön, neu keinen Einfluss auf das Relativierungsverhalten hat. Ein etwas anderes Ergebnis ergibt sich, wenn man die Verteilung der Varianten abhängig von den Flexionseigenschaften des substantivierten Adjektivs betrachtet: was das Gute, Schöne, Neue 254 (23,8%) 813 (76,2%) Gutes, Schönes, Neues 137 (30,6%) 311 (69,4%) tab. 18: Einfluss der Stark/ schwach unterscheidung auf die das/ was alternation Eine inferenzstatistische Überprüfung der Befunde ergibt aber auch hier kein klares Bild. Zwar liefert der Chi-Quadrat-Test einen im Vergleich zur lexikalischen Wahl besseren p-Wert von < 0,01 und auch der Phi-Koeffizient liegt mit 0,069 etwas höher. Eine Berechnung der standardisierten Pearson-Residuen zeigt jedoch, dass der Einfluss, den die Wahl des Flexionstyps auf die das/ was- Alternation hat, als sehr gering einzuschätzen ist. Zwar lässt sich erkennen, dass was bei starker Flexion leicht überrepräsentiert ist (während das dement- Relativpronomenselektion und grammatische Variation 147 sprechend unterrepräsentiert ist). Der Assoziationsplot zeigt aber wiederum ausschließlich hellgraue Flächen, was bedeutet, dass diese Tendenzen nicht signifikant sind: abb. 12: assoziationsplot: Einfluss des Flexionstyps (stark vs. schwach) auf die das/ was alternation (substantivierte adjektive) Interessanterweise übt die Präsenz quantifizierender Attribute wie das einzig(e) oder alles einen stärkeren Einfluss auf die Wahl des Relativums aus. Wie aus Tabelle 19 hervorgeht, liegt bei was-Relativierung der Anteil von Belegen mit zusätzlichen quantifizierenden Attributen jeweils bei ca. 50%, während er bei das-Relativierung ca. 20% nicht übersteigt und teils deutlich darunter liegt. Dabei verhalten sich die einzelnen lexikalischen Elemente nicht gleich (am deutlichsten ist der Kontrast bei Neue). 47 47 Die das/ was-Alternation geht im Zusammenhang mit Positiven mit z.T. subtilen Bedeutungsunterschieden einher, die dazu führen können, dass in manchen Kontexten die Relativpronomina nicht ohne Weiteres füreinander ersetzt werden können. So akzeptieren viele Sprecher zwar in (67a) alternativ auch das als Relativum, während diese Ersetzung in (67b) meist abgelehnt wird. Dies ist möglicherweise darauf zurückzuführen, dass das einen Kontext suggeriert, in dem das Bezugselement bzw. die Kombination von Bezugselement und Relativsatz auf etwas (im weitesten Sinne) „Spezifisches“ referiert, das aus dem Diskurskontext rekonstruiert werden kann, ohne dass eine explizit elliptische/ anaphorische Interpretation vorliegt (z.B. in (67a) auf eine bestimmte Aussage aus einer Menge von Dingen, die sich über die Rürup-Kommission sagen lassen, ähnlich wie ein Demonstrativum ein Element aus einer Menge von Alternativen herausgreift). Umgekehrt geht eine nicht-spezifische generalisierende Interpretation im Sinne von ‚das Gute schlechthin’ wie in (67b) i.d.R. mit Relativierung durch was einher (Bernd Wiese, persönliche Kommunikation, vgl. auch Cutting 1902). Diese Unterschiede lassen sich auch an Patrick Brandt / Eric Fuß 148 (67) a. Nun gut, es hätte auch schlimmer kommen können: Das ist schon das einzig Gute, was sich über die Vorschläge der Rürup-Kommission zur Sanierung des Gesundheitswesens sagen lässt (Nürnberger Nachrichten, 10.4.2003; Klägliches Ergebnis - Die Rürup- Kommission erreichte nur ihr Minimalziel) b. Für den Mundart-Dichter verkörpern die Früchte alles Gute, was einem im Leben so passieren kann. Denn Zwetschgen bedeuten Glückseligkeit. (Nürnberger Nachrichten, 5.11.2012, S. 37; Bald regnet es Zwedschgä - Dialekt-Dichter Fitzgerald Kusz stellt seinen neuen Lyrikband vor) was das total das einzig(e) alles das einzig(e) alles Gute 32/ 139 (23%) (davon 2x einzige) 42/ 139 (30,2%) 24/ 444 (5,4%) (4x einzige) 72/ 444 (16,2%) 583 Schöne 3/ 38 (7,9%) (1x einzige) 16/ 38 (42,1%) 0/ 89 (0%) 16/ 89 (18%) 127 Neue 21/ 77 (27,3%) (4x einzige) 16/ 77 (20,8%) 12/ 280 (4,3%) (2x einzige) 8/ 280 (2,9%) 357 tab. 19: Einfluss quantifizierender Modifikatoren auf die das/ was alternation Zusammengefasst (und für die automatische inferenzstatistische Auswertung mittels der KoGra-R-Schnittstelle aufbereitet) ergibt sich abhängig von den Faktoren das einzig(e)+Adj. und alles+Adj. die folgende Verteilung von das/ was (Vergleichsgröße ist die Verteilung von das vs. was in allen anderen Daten mit Gute/ Schöne/ Neue, die wir im Rahmen der COSMAS-Recherche erhoben haben): was das das einzig(e) Adj. 56 36 alles Adj. 74 96 vieles/ das/ … Adj. 124 681 tab. 20: Einfluss quantifizierender attribute auf die das/ was alternation (substantivierte adjektive) den folgenden Beispielen illustrieren. Während in (i)-(ii) die meisten Sprecher Relativierung durch was präferieren, scheint durch die Hinzufügung des lokal-deiktischen Adverbs hier eine Anbindung an den Kontext geleistet zu werden, die Relativierung durch das besser werden lässt: (i) Apfelwein ist das einzig Gute, was es gibt. (ii) ? Apfelwein ist das einzig Gute, das es gibt. (iii) Apfelwein ist das einzig Gute, das es hier gibt. Inwiefern diese Bedeutungsunterschiede, die nicht immer eindeutig zu erkennen sind und eher eine Art Kontinuum darstellen, tatsächlich einen weiteren (möglicherweise unabhängigen) Faktor darstellen, der die das/ was-Alternation steuert, konnte jedoch noch nicht abschließend durch eine quantitative Untersuchung geklärt werden. Relativpronomenselektion und grammatische Variation 149 Der Chi-Quadrat-Test lieferte hier mit einem p-Wert von 2,22-16 ein hochsignifikantes Ergebnis. Die Effektstärke liegt mit einem V-Koeffizienten von 0,36 über dem Schwellenwert (0,3), der in den Sozialwissenschaften allgemein für mittlere Zusammenhänge angenommen wird. Ein noch detaillierteres Bild liefert die Berechnung der Pearson-Residuen, die in der folgenden Tabelle wiedergegeben sind: was das das einzig(e) Adj. 7,286 -4,073 alles Adj. 5,271 -2,946 vieles/ das/ … Adj. -4,885 2,731 tab. 21: Einfluss quantifizierender attribute auf die das/ was alternation: pearson residuen Der Betrag der entsprechenden Residuen ist jeweils größer als 1,96; es liegen also signifikante Abweichungen von der erwarteten Häufigkeit vor. Dies wird durch den folgenden Assoziationsplot veranschaulicht, der deutlich macht, dass was im Zusammenhang mit den quantifizierenden Attributen alles/ das einzig(e) hochsignifikant überrepräsentiert ist: abb. 13: assoziationsplot: Einfluss quantifizierender attribute auf die das/ was alternation (substantivierte adjektive) Diese Befunde scheinen nahezulegen, dass im Gegensatz zu „echten“ lexikalischen Substantiven, die stets das verlangen, bei derivierten deadjektivischen Nomina die Wahl des Relativpronomens auch von weiteren (semantischen) Patrick Brandt / Eric Fuß 150 Faktoren beeinflusst sein kann, zu denen z.B. die Präsenz quantifizierender Elemente in der Nominalphrase zu zählen ist. 48 Deren Einfluss kann auch im Sinne Behaghels/ Wieses im Rahmen des Begriffs der „individuellen Größe“ gedeutet werden (wobei quantifizierende Ausdrücke nicht-individuelle Größen bilden). Das Relativierungsverhalten substantivierter Adjektive und insbesondere die dabei zu beobachtende Variation zwischen den Einleitungsformen das und was wirft einige Fragen für die oben vertretene Hypothese auf, dass die Wahl des Relativums wesentlich durch kategoriale Eigenschaften des Bezugselements bestimmt wird. Ein „geradliniger“ Erklärungsansatz, der diese Hypothese beibehält, könnte auf der Annahme aufbauen, dass substantivierte Adjektive „Mischkategorien“ darstellen, die sowohl nominale (Präsenz eines Artikels) als auch adjektivische Eigenschaften aufweisen (Alternation zwischen starker und schwacher Flexion: das Gute vs. ein Gutes). 49 Aufgrund ihres unbestimmten kategorialen Charakters sind substantivierte Adjektive im Prinzip sowohl mit dals auch mit w-Relativa kompatibel, was sich im Korpus als Variation zwischen das und was niederschlägt. Aufgrund dieser kategorialen Unbestimmtheit ist die Wahl des Relativums im Gegensatz zu Nomina stärker durch semantische Faktoren (z.B. die Hinzufügung von Quantoren oder subtile Bedeutungsnuancen, vgl. Fußnote 47) beeinflussbar, was u.U. ebenfalls durch den Begriff der „individuellen Größe“ erfasst werden kann. Nach Wiese (2013) könnte man z.B. die Behauptung vertreten, dass substantivierte Adjektive dann Relativierung durch das auslösen, wenn sie sich auf eine nichtpersonale individuelle Größe beziehen (bzw. wenn der Sprecher signalisieren möchte, dass eine entsprechende individuelle Größe vorliegt, vgl. auch Abschn. 5.6 sowie Fußnote 63). Die Beobachtung, dass substantivierte Positive dennoch eine Tendenz zu das als Relativum zeigen, ist evtl. darauf zurückzuführen, dass Substantivierungen stets als lexikalische Nomina rekategorisiert/ lexikalisiert werden können (vgl. Verwandte, Illustrierte, Junge(s) etc.), die dann obligatorisch ein d-Pronomen als Relativum auslösen. So findet sich im Zusammenhang mit dem Neutrum Junge(s) ausschließlich das als Relativierer (57 Belege im DeReKo): (68) Sie stieben davon. Keineswegs von uns Notiz nehmen eine Rehmutter und ihr Junges, das höchst vergnügt auf der Waldwiese herumspringt. (Salzburger Nachrichten, 2.9.1992; Helles und Dunkles erfahren - Mit dem Rad durchs Waldviertel) 48 Bezeichnenderweise enthalten auch alle Beispiele, die der Duden (2009, S. 1032) für was-Relativierung mit substantivierten Positiven nennt, ein quantifizierendes Element (all das Schöne, etwas Beunruhigendes, etwas Einfacheres). 49 Wobei wir an dieser Stelle offen lassen, wie sich diese Annahme im Rahmen einer Strukturanalyse konkretisieren lässt. Vgl. Fuß (2017) für einen entsprechenden Vorschlag im Rahmen der Distribuierten Morphologie. Relativpronomenselektion und grammatische Variation 151 5.2.2 Steigerungsformen Die Einschätzung, dass sich Nomina, die aus adjektivischen Basen abgeleitet wurden, anders verhalten als lexikalische Substantive, erfährt durch die Betrachtung von Steigerungsformen zusätzliche Unterstützung. Darüber hinaus wird deutlich, dass die Klasse der substantivierten Adjektive auch untereinander kein einheitliches Verhalten hinsichtlich der Wahl des Relativpronomens zeigt. Während Komparative nicht zuletzt aufgrund der geringen Belegzahl kein klares Bild liefern (abgesehen davon, dass Belege mit was stets nicht anaphorisch sind, vgl. Tabelle 22), unterscheiden sich Superlativformen hinsichtlich der das/ was-Alternation deutlich von substantivierten Positiven. Bezugselement was das total bessere/ Bessere 2 (alle nicht-anaph.) 3 (1x anaph.) 5 besseres/ Besseres 14 (alle nicht-anaph.) 17 (4x anaph.) 50 31 schönere/ Schönere 0 1 1 schöneres/ Schöneres 0 51 7 (nicht-anaph.) 8 neuere/ Neuere 1 (100%, nicht-anaph.) 0 1 neueres/ Neueres 1 (25%, nicht-anaph.) 3 (75%; 1x anaph.) 4 tab. 22: das/ was alternation nach substantivierten komparativen Obwohl sich substantivierte Superlative in ihren flexionsmorphologischen (Genusvariabilität, Stark/ schwach-Alternation, sofern semantisch möglich) und syntaktischen Eigenschaften nicht wesentlich von anderen substantivierten Adjektiven unterscheiden, lösen sie, wie aus Tabelle 23 hervorgeht, systematisch (in mehr als 92% der hier berücksichtigten Fälle) das Relativum was aus (vgl. auch Cutting 1902). 52 50 Auch bei den Komparativformen überwiegen bei das-Relativierung nicht anaphorische Belege, vgl. (i). (i) Bei der Feindesliebe soll man nach Augustinus auf das Gute schauen, das in der Natur des Feindes liegt, und noch mehr auf das Bessere, das der Feind noch werden kann. Man liebe in ihm nicht, was er ist, sondern was man wolle, dass er sei. (Nächstenliebe, In: Wikipedia - http: / / de.wikipedia.org/ wiki/ Nächstenliebe, Stand: 2011). 51 Es liegt ein Beleg für schöneres+was vor, dessen Interpretation/ Analyse aber unklar ist. Naheliegend scheint eine Interpretation als freier Relativsatz+Finalsatz zu sein (i.S. von was auch immer komponiert wurde, um es zu übertreffen): (i) In den Konzertsälen und in den Kirchen singt man das schönste Lied, das je geschrieben wurde - es gibt kein schöneres, was auch komponiert wurde, es zu übertreffen. (Neue Kronen-Zeitung, 2.4.1999, S. 63). 52 In Fällen, in denen aufgrund der Belegzahl eine detaillierte manuelle Sichtung nicht möglich war, wurde eine zufällige Stichprobe von 200 Belegen überprüft und das Ergebnis anschließend auf die Gesamtzahl hochgerechnet. Dabei zeigte sich, dass der Anteil der einschlägigen Bei- Patrick Brandt / Eric Fuß 152 Bezugselement was das Verhältnis Beste 5.835 (93,4%) 410 (6,6%) 14: 1 Bestes 5 (62,5%)   3 (37,5%)  1,7: 1 Schönste 783 (90,1%) 53  86 (9,9%) 54  9: 1 Schönstes 0   0 - Neueste 54 (83,1%)  11 (16,9%)  4,9: 1 Neuestes 0   0 - Gesamt 6.677 (92,9%) 510 (7,1%) 13,1: 1 tab. 23: das/ was alternation nach substantivierten Superlativen (großschreibung) Dabei bildet Tabelle 23 zunächst nur die Verhältnisse bei Großschreibung des Superlativs ab. Ähnlich wie bei substantivierten Positiven findet man in diesem Zusammenhang fast ausschließlich nicht anaphorisch zu interpretierende Belege, hier exemplarisch für Beste+das/ was illustriert: Relativum eindeutig anaphorisch potenziell anaphorisch nicht anaphorisch total das 2 (1,4%) 8 (5,4%) 137 (93,2%) 147 (aus 200 von insgesamt 559 Belegen) was 0 2 (1%) 198 (99%) 200 (aus 200 von insgesamt 5.835 Belegen) tab. 24: Einfluss der das/ was alternation auf die interpretation des Bezugselements (Beste, großschreibung) in einer Stichprobe von jeweils 200 zufällig gewählten Beispielen Bei Kleinschreibung des Superlativs lässt sich zunächst der gleiche Effekt wie bei substantivierten Positiven beobachten: Im Zusammenhang mit dem Relativum das überwiegen eindeutig anaphorische Lesarten (84%), die eine strukturelle Analyse nahelegen, wonach ein elidiertes Kopfnomen vorliegt, das durch ein attributives adjektivisches Element modifziert wird: (69) Regen und schlechte Plätze im Trainingslager in Südspanien. Trotzdem herrscht Zuversicht beim FCSt.Gallen: Trainer Roger Hegi hält sein Team für das beste Team, das er in St.Gallen bisher betreut hat. (St. Galler Tagblatt, 12.2.1998, Ressort: TB-SPO (Abk.); Hohes Ziel mit Hegis bester Auswahl) spiele bei was-Relativierung generell größer war (sowohl bei Beste+was als auch bei Schönste+was waren alle 200 Zufallsbelege einschlägig; bei Beste+das betrug der Anteil der Treffer lediglich 147 aus 200). 53 Alle 200 Belege der Zufallsstichprobe sind nicht anaphorisch zu interpretieren. 54 Darunter 2 potenziell und 2 eindeutig anaphorisch zu interpretierende Belege. Relativpronomenselektion und grammatische Variation 153 Relativum eindeutig anaphorisch potenziell anaphorisch 55 nicht anaphorisch total das 121 (84%)  5 (3,5%)  18 (12,5%) 144 (aus 200 von insgesamt 316 Belegen) was   8 (4,1%) 12 (6,2%) 174 (89,7%) 194 (aus 200 von insgesamt 765 Belegen) tab. 25: Einfluss der das/ was alternation auf die interpretation des Bezugselements (beste, kleinschreibung) in einer Stichprobe von jeweils 200 zufällig gewählten Beispielen Ein Teil der Ausnahmen lassen sich ähnlich wie bei Positiven auf unabhängige Faktoren zurückführen. So ist mangelnde Großschreibung von beste (+das) in (70) (bei nicht anaphorischer Lesart) wohl als orthografische Nachlässigkeit einzuschätzen, während die Verwendung von was im Zusammenhang mit anaphorischen Lesarten wie in (71) vermutlich Eigenschaften der gesprochenen Sprache reflektiert, in der was oft als generelles Relativum verwendet wird. (70) Das beste, das die Wiener Linien bieten, ist ihre Werbekampagne gegen Schwarzfahrer. Sie wissen: 101 Ausreden, die nichts nützen. (Die Presse, 13.1.2000, Ressort: Seite Zwei; Licht ins Schwarzfahren) (71) In 30 Minuten kam er auf eine Leistung von 550 Watt. Heinrich: „Das Ergebnis war das beste, was wir je hatten.“ (Kleine Zeitung, 27.7.1997, Ressort: Sport; 160 Liter Luft schnappt Ullrich in einer Minute) Es gibt jedoch eine recht große Zahl von Belegen (> 650, ca. 10% aller Belege mit was), in denen was-Relativierung trotz Kleinschreibung des adjektivischen Elements offenbar mit einer nicht anaphorischen Interpretation einhergeht: (72) „Die erste Halbzeit war das beste, was in den letzten beiden Jahren ein Team aus Lockenhaus geboten hat. […]“ (Burgenländische Volkszeitung, 22.8.2007, S. 57; STIMMEN & SPRÜCHE) Hierbei ist es zunächst unklar, ob hier lediglich eine abweichende Orthografie vorliegt oder ob es sich um einen genuinen Kontrast zwischen Positiv und Superlativ handelt. Auf jeden Fall beobachten wir eine eindeutigere Form- 55 Belege, die sowohl anaphorisch als auch nicht anaphorisch interpretiert werden können, sind z.B.: (i) Für unterschiedliche ethnische Gruppen ist ein föderales System das beste, das man sich vorstellen kann, denn dort genießen sie Autonomie und kommen nur zusammen, um die gemeinsame Außenpolitik oder Sicherheitspolitik festzulegen. (Die Presse, 14.7.1993; Fortsetzung von Seite 17) (ii) „Das Spiel gegen Cremlingen war das beste, was wir seit Jahren abgeliefert haben“, betont Müller. (Braunschweiger Zeitung, 17.10.2007; Udo Müller testet seinen zweiten Anzug) Patrick Brandt / Eric Fuß 154 Funktions-Zuordnung bei kleingeschriebenen Superlativen: das markiert anaphorische Lesarten, während was eine nicht anaphorische Interpretation des adjektivischen Bezugselements signalisiert. Unabhängige Evidenz für die Annahme, dass eine d-Form die Präsenz eines lexikalischen Bezugsnomens erfordert, liefert das Relativierungsverhalten von Superlativen, die durch eine (postnominale) Genitivphrase modifiziert werden. Abweichend von der in anderen Kontexten vorliegenden starken Tendenz zu was als Relativum, verlangen (neutrale) Superlative in Konstruktion mit einem nachgestellten Genitivattribut systematisch Relativsatzeinleitung durch das: Unter Abzug solcher Redewendungen wie das höchste der Gefühle ist das Verhältnis zwischen das und was bei entsprechenden Antezedentien 34: 0 (Connexor- Archiv, 6.2.2015); Beispiel (73) illustriert die relevante Konstruktion. (73) Ritalin ist vielleicht das bekannteste der Methylphenidat-Präparate, das ADS-Kindern verabreicht wird, um ihre Aufmerksamkeit zu stimulieren und ihnen so über ihre Konzentrationsprobleme hinwegzuhelfen. (Rhein-Zeitung, 20.1.2006; ADS-Kinder sind auf Hilfe angewiesen) Eine Interpretation dieser Befunde, die im Einklang mit der in Abschnitt 4.1.4 skizzierten Analyse steht, ist es anzunehmen, dass nachgestellte Genitivattribute nur bei Präsenz eines - nicht unbedingt sichtbaren - lexikalisch-nominalen Kopfes lizenziert sind, der in Beispielen wie (74) stets das als Relativum auslöst: (74) das bekannteste N der Methylphenidrat-Präparate, das … Diese Hypothese wird durch die Beobachtung gestützt, dass zumindest im Gegenwartsdeutschen reine (nicht anaphorische) Determinierer oder Quantoren wie alles keine nachgestellten Genitivattribute zulassen (Fügungen wie alles des Weges (5. Mose 8: 2) oder alles des Volkes sind archaisch), während Quantoren, die die Präsenz eines (elidierten) Nomens implizieren (bzw. deren semantische Eigenschaften durch die Annahme eines elidierten Nomens beschrieben werden können), auch mit Genitivattributen kompatibel sind: (75) a. *alles des Präsidenten b. jedes N des Präsidenten Eine weitere Beobachtung, die in diesem Zusammenhang Erwähnung verdient, betrifft die Tatsache, dass der Relativanschluss bei (pluralischen) elliptischen Superlativen hinsichtlich der Numeruskongruenz stark variiert. Dazu heißt es im Duden (2011, S. 785f.): Wird eine einzelne Person oder Sache aus einer Vielzahl herausgehoben und schließt ein Relativsatz an das Wort an, das die Vielzahl bezeichnet, dann steht das Relativpronomen im Allgemeinen nicht im Singular, sondern im Plural: Relativpronomenselektion und grammatische Variation 155 Es ist einer der schönsten Filme, die ich gesehen habe (nicht: …, den ich gesehen habe). Dieser Satz sagt aus: Von all den Filmen, die ich gesehen habe, ist dieser einer der schönsten. (Im Gegensatz dazu: Es ist der schönste Film, den ich gesehen habe.) Weitere Beispiele: Er ist einer der ersten Menschen, die im Weltraum waren (nicht: …, der im Weltraum war). Frankfurt ist eine der wenigen Großstädte, in denen es eine solche Einrichtung gibt (nicht: …, in der es eine solche Einrichtung gibt). Eine Cosmas-Recherche (18.3.2015) ergab, dass in dem Fall, wo das Antezedens im Neutrum steht, der „falsche“, d.h. singularische Relativsatzanschluss deutlich überwiegt - er ist fast doppelt so hoch wie der eigentlich korrekte, pluralische Anschluss. Liegt ein maskulines Antezedens vor, liegt der Anteil „falscher“ Anschlüsse bei deutlich weniger als der Hälfte der Belege. (76) illustriert die Muster, nach denen gesucht wurde; Tabelle 26 zeigt die Ergebnisse der Recherche. 56 (76) a. eines der besten, die/ das b. einer der besten, die/ ? der/ den die das bzw. der/ den eines der A-sup, 17 30 einer der A-sup, 57 40 tab. 26: Elliptische Superlative mit singularischem vs. pluralischem anschluss Ungeachtet der genannten Kontexte, in denen auch bei Superlativen das als Relativum auftritt, bleibt aber als Explanandum und zentraler empirischer Befund festzuhalten, dass substantivierte Superlative im Gegensatz zu Positiven eine wesentlich stärkere Tendenz zu was als Relativum zeigen. Um diesen Kontrast zu erfassen, könnte man zum einen darauf rekurrieren, dass substantivierte Superlative generell einen im Vergleich zu substantivierten Positiven stärker adjektivischen Charakter beibehalten und somit die Lizenzierungsbedürfnisse von d-Formen nicht erfüllt werden können (so ist die Superlativflexion charakteristisch für Adjektive). Dies schlägt sich auch darin nieder, dass im Gegensatz zu Positiven kaum lexikalisierte Nominalisierungen existieren (ein relevantes Beispiel wäre aber evtl. Dorfälteste). Unklar bliebe dabei aber, wie sich der oberflächlich nominale Charakter dieser Substantivierungen (siehe oben, Abschn. 5.2) erfassen lässt. Ein alternativer Erklärungs- 56 Diese verblüffende Fehlerquote kann möglicherweise darauf zurückgeführt werden, dass die Sprecher hier das pronominal gebrauchte eines als (potenzielles) Bezugselement des Relativsatzes betrachten. Patrick Brandt / Eric Fuß 156 ansatz wird durch die Überlegung verfügbar, dass sich die Bedeutung des Superlativs paraphrasieren lässt als ‚mehr als alles (andere)’. Diese komplexe Bedeutung ist nach Bobaljik (2012) aufzuspalten in eine Kategorie „Komparativ“ (‚mehr’) und eine Kategorie „Superlativ“, die den Vergleichsstandard ‚als alles (andere)’ als Bedeutungsbeitrag liefert. 57 Vor diesem Hintergrund kann das Relativierungsverhalten von Superlativen möglicherweise darauf zurückgeführt werden, dass der Relativsatz das Element ‚alles (andere)’ modifiziert (das was als Relativum verlangt): (77) das Beste, was es gibt = ‚dasjenige/ etwas, das besser ist als [alles, [was es gibt]]’ Durch die Annahme, dass Superlative auf Komparative zurückgehen, deren Vergleichsstandard universell quantifiziert ist, ließe sich der überaus starke mit Superlativen verknüpfte Effekt in Richtung von Relativierung mittels was damit auf den als grundlegend erscheinenden Fall der Relativierung von alles durch was reduzieren. 58 Zusammenfassend lassen sich die folgenden Befunde als zentrale empirische Ergebnisse dieses Abschnitts festhalten: (78) a. was signalisiert stets eine nicht anaphorische Lesart, während das mit beiden Lesarten kompatibel zu sein scheint. b. Substantivierte Adjektive unterscheiden sich von lexikalischen Nomina, indem sie insgesamt häufiger was als Relativum selegieren. c. Substantivierte Adjektive verhalten sich als Klasse nicht uniform: Positive tendieren zu das, während Superlative eindeutig was präferieren. d. Bei Positiven wird die Wahl des Relativums durch die Präsenz zusätzlicher quantifizierender Attribute beeinflusst: das einzig(e)+A sowie alles+A führen signifikant häufiger zu was. 57 In Sprachen wie Russisch wird diese Bedeutung anscheinend transparent in der Syntax kompositional kodiert (Bobaljik 2012, S. 61): (i) Positiv: xoroš-ij Komparativ: luč-še Superl.: luč-še vse-go/ -x gut-mask.sg besser-kmpr besser-kmpr all-gen.sg/ -gen.pl 58 Weniger klar ist, wie sich im Rahmen dieser Analyse die Beobachtung erfassen lässt, dass substantivierte Positive wie das Einzige, die analog zu Superlativen Einzigkeit ausdrücken, ebenfalls was als Relativum verlangen. Zumindest ergibt sich ein Problem, wenn man davon ausgeht, dass die Präsenz eines universell quantifizierten Vergleichsstandards an die morphologische Kategorie des Superlativs gebunden ist. Man könnte allerdings annehmen, dass die Einzigkeitssemantik, die beim Superlativ kompositional zustande kommt und flexionsmorphologisch reflektiert wird, bei den entsprechenden Positiven bereits in der lexikalischen Semantik des Adjektivs vorliegt. Relativpronomenselektion und grammatische Variation 157 e. Bei Großschreibung des adjektivischen Elements dominieren nicht anaphorische Lesarten, unabhängig von der das/ was-Alternation. f. Bei Kleinschreibung des adjektivischen Elements signalisiert das eine attributive/ anaphorische Lesart. In Kombination mit was zeigt sich ein Kontrast zwischen Positiven und Superlativen: Bei Kleinschreibung des Bezugselements ist was mit Positiven äußerst marginal, während es bei Superlativen robuster attestiert ist und eine nicht anaphorische Lesart signalisiert. 5.3 Deverbale Nomina Die (robusten) Effekte im Zusammenhang mit (78a) und (78c) lassen sich auch bei Nomina nachweisen, die vom Xerox-Tagger als deverbal eingestuft werden. Dabei handelt es sich bei den einschlägigen Fällen, die in Kombination mit den Relativierern das bzw. was auftreten, sämtlich um Partizipien (I oder II): das was Belege insgesamt 84 38 Antezedens superlativisch 42 34 eindeutig anaphorischer Bezug 78  2 tab. 27: relativpronomenwahl bei neutralen deverbalen nomina Die Daten bestätigen die Vermutung, dass für die Selektion von das insbesondere der anaphorische Bezug ausschlaggebend ist (78 Fälle von insgesamt 84). Bemerkenswert ist, dass 34 von 38 Belegen mit dem Relativpronomen was superlativisch sind; m.a.W., es handelt sich hier um Nomina, die über den Umweg einer Adjektivierung aus Verben (Partizipien) deriviert worden sind. Wie im letzten Abschnitt dargestellt, führt superlativische Flexion bei Absenz eines Nomens im Antezedens systematisch zur Selektion von was. Die Tatsache, dass es sich bei den Antezedentien um ursprünglich aus Verben derivierte nominale Kategorien handelt, scheint dagegen keine Rolle zu spielen. Bisher haben wir uns in erster Linie mit der Frage befasst, inwiefern die Wahl zwischen das und was als Relativum durch Eigenschaften des Bezugselements bestimmt wird (Absenz/ Präsenz, Mass/ Count-Unterscheidung, kategoriale Eigenschaften von Determinierern/ Indefinita und substantivierten Adjektiven). Dabei sind wir bereits auf das Phänomen gestoßen, dass zumindest bei bestimmten Typen von nominalen Bezugselementen (Stoffnomina und substantivierte Adjektive) auch weitere Bestandteile der Nominalphrase (wie z.B. Quantoren) einen Einfluss auf die Relativpronomenselektion ausüben. In der Patrick Brandt / Eric Fuß 158 Folge sollen weitere Zusammenhänge dieser Art, die z.B. Eigenschaften der NP als Ganzes bzw. ihrer Teile betreffen (Einfluss unterschiedlicher Quantoren, Satzgliedfunktion, Gegenstandsvs. Propositonsbezug), näher untersucht werden. Dabei werden wir auch interne Eigenschaften des Relativsatzes behandeln (Modalität, Kasus des Relativpronomens) und darüber hinaus auch diskutieren, inwiefern umgekehrt die Wahl eines bestimmten Relativums die Interpretation des Bezugselements (bzw. des unmittelbaren syntaktischen Kontexts) beeinflussen kann. Schließlich werden wir in 5.8 die Rolle außersprachlicher Faktoren (wie Land, Region, Textsorte und Register) thematisieren. 5.4 jedes/ keines vs. alles/ nichts Im Hinblick auf die dasvs. was- Selektion lassen sich zwei Pole ausmachen, die durch jedes einerseits und alles andererseits markiert werden: jedes verhält sich stets so, als selegiere es ein lexikalisches Nomen, indem es ganz überwiegend zur Selektion von das führt, während die durch alles ausgelöste Selektion von was mit der beobachteten Abwesenheit eines nominalen Komplements kompatibel ist. Tatsächlich ist es so, dass alles nur mit ganz bestimmten Substantiven verkettet werden kann, nämlich mit den in Abschnitt 5.1 behandelten Stoffnomina; wie dort beschrieben, führt die Präsenz eines Stoffnomens als Antezedens allerdings wiederum zur Selektion von das. Die Affinität von alles zu einer Interpretation in Begriffen von Stoffen oder Massen versus der von jedes zu einer Interpretation in Begriffen von wohlunterschiedenen Gegenständen bzw. Eventualitäten lässt sich gut anhand solcher Paare wie in (79) beobachten; die hier gebrauchten Substantive sind an sich mit beiden Interpretationen kompatibel, verhalten sich jedoch unter Verkettung mit alles eindeutig wie Massennomina. (79) a. Alles Talent/ Übel ist ausgestorben. (Stoffnomen; nur generalisierende Lesart) b. Jedes Talent/ Übel ist ausgestorben. (Zählbares Nomen; nur individuierende Lesart) Eine Korpusrecherche unter Adjazenz von alles bzw. jedes und seinem Komplement zeigt, dass jedes vs. alles in absoluten Zahlen mit etwa gleicher Häufigkeit Komplemente selegieren, die vom Xerox-Tagger als Adjektive klassifiziert werden (262 vs. 221). Dabei fällt auf, dass die durch alles selegierten Adjektive in ihrer Bedeutung kaum beschränkt erscheinen, wiewohl ein beträchtlicher Teil der Belege aus mehr oder weniger festen Redewendungen besteht (alles Mögliche, alles Übrige etc.). Die durch jedes selegierten Adjektive hingegen setzen nahezu ausnahmslos Zählbarkeit voraus, entsprechend ist die Konstruktion insgesamt in der Regel elliptisch zu interpretieren (jedes ein- Relativpronomenselektion und grammatische Variation 159 zelne, jedes dritte etc.). Die Häufigkeit der durch alles selegierten Komplemente mit substantivischem Kern dagegen fällt gegenüber der Häufigkeit der durch jedes selegierten Komplemente mit substantivischem Kern stark ab (838 vs. 44.456). Dabei umfassen die Komplemente im Fall von jedes ganz überwiegend mehrzahlfähige, also zählbare Nomina; im Falle von alles dagegen sind die selegierten Nomina durchweg als Massennomina zu klassifizieren. In dem Sinne, dass Massennomina ebenso wie die meisten Adjektive ceteris paribus, d.h. ohne hinzutretende Klassifizierer o.Ä., keine Kriterien zur Identifizierung wohlunterschiedener Individuen innerhalb ihrer Extension bereitstellen, haben durch jedes bestimmte Phrasen insgesamt eher nominalen Charakter, durch alles bestimmte Phrasen dagegen eher adjektivischen Charakter. Insgesamt ist es in Analogie zur Praxis innerhalb der Theorie der generalisierten Quantoren (Barwise/ Cooper 1981) möglicherweise angemessener, die Eigenschaften der aus Determinierer/ Quantor und Nomen bzw. Determinierer/ Quantor und Adjektiv gebildeten Komplexe insgesamt als Auslöser für die Selektion von das vs. was anzusetzen, vgl. auch die Rede von „nominaler“ vs. „adjektivischer“ Bezugsweise bei Geach (1962) bzw. Baker (2003). Ob und inwieweit sich die traditionellen Unterscheidungen von „(nicht-)individuellen Größen“ (Behaghel 1928, S. 725f.) bzw. „(in)definite mass[es] or amount[s]“ (Curme 1922, S. 198) eventuell mit solchen grammatisch-kategorialen Unterscheidungen decken bzw. auf sie reduzieren lassen, muss hier offen bleiben. Angesichts des Selektionsverhaltens solcher quantifizierenden Elemente wie jedes, eines oder keines, die trotz der oberflächlichen Abwesenheit eines Substantivs Relativierung mittels das auslösen, stellt sich die Frage, ob dies einer unsichtbaren, allerdings strukturell präsenten lexikalisch-nominalen Kategorie zugeschrieben werden sollte (wie in Abschnitt 4.1.2 vermutet) oder eher einem möglicherweise gegebenen nominalen Charakter des Quantifizierers selbst. Eine COSMAS-Recherche innerhalb des Connexor-Teilkorpus von jedes bzw. alles gefolgt von einem als Adjektiv getaggten Wort ergab allerdings zu wenige Treffer, um eine statistische Auswertung und Interpretation der Ergebnisse zu rechtfertigen, vgl. die folgende Tabelle. das was jedes A 1  0 alles A 9 22 tab. 28: relativierungsverhalten von Quantoren in konstruktion mit adjektivischen Elementen Bessere Ergebnisse lieferte eine Extraktion aus der Korpusgrammatik-Datenbank (KoGra-DB, 18.2.2015) von durch alles (oder allem) bzw. jedes (oder jedem) eingeleiteten Phrasen im Vorfeld. Diese ergab unter anderem, dass lediglich ein verschwindend geringer Teil der als Nomina getaggten Komplemente von Patrick Brandt / Eric Fuß 160 alles genuine Nomina waren (d.h. zählbare bzw. underivierte Nomina gegenüber deverbalen/ deadjektivischen Nomina oder Massennomina), während es sich bei der überwältigenden Mehrzahl der als nominal getaggten Komplemente von jedes um eben solche underivierten, zählbaren Nomina handelte. Die insgesamt 12 (von 4.194) mit alles gefundenen Nomina fielen auf gerade 5 Typen: Ding (8x), Abendessen, Abenteuer, Gemüt und Mittel. Die 44.921 Fälle, in denen ein Komplement von jedes als Nomen getaggt wurde, fielen auf 4.398 Typen. Die Token-Zahlen zeigt die folgende Tabelle. alles + N jedes + N zählbare/ underivierte Nomina 12 44.921 derivierte Nomina/ Massennomina 4.182  1.148 tab. 29: relativierungsverhalten von Quantoren in konstruktion mit lexikalischen (zählbaren) Substantiven Der zugehörige Assoziationsplot in Abbildung 14 bestätigt, dass diese Verteilung hochsignifikant von der Eigenschaft der Phrase abhängt, eben durch alles bzw. jedes eingeleitet zu werden (Phi = 0,8792867). abb. 14: assoziationsplot: relativierungsverhalten von Quantoren in konstruktion mit lexikalischen (zählbaren) Substantiven Ein entgegengesetztes Bild ergibt sich für die Auszählung der als Massennomina zu klassifizierenden Komplemente, verglichen mit dem Rest. Massennomina machen insgesamt fast ein Viertel der als nominal getaggten Komplemente von alles aus (vgl. auch Abschn. 5.1 für die Beobachtung, dass die Relativpronomenselektion und grammatische Variation 161 Präsenz von alles die Verwendung von was bei Stoffnomina günstig beeinflusst) gegenüber einem Anteil von etwa einem Hundertstel bei jedes. Auch diese Verteilung ist hochsignifikant, wie der folgende Assoziationsplot in Abbildung 15 zeigt (Phi = 0,346374). abb. 15: assoziationsplot: relativierungsverhalten von Quantoren in konstruktion mit Massennomina Schließlich ergibt die Extraktion der als Adjektiv getaggten Komplemente von alles bzw. jedes ein auf den ersten Blick relativ ausgewogenes Bild, indem jeweils etwa 250 Trefferbelege gezählt werden (275 bei alles vs. 228 bei jedes). Auffällig ist allerdings, dass über die Hälfte der Gesamttreffer bei alles als „normale“ (substantivierte) Adjektive klassifiziert werden können, d.h. underivierte (lexikalische) Simplizia, die nicht weitergehend spezialisiert sind (z.B.: billige, coole, echte), während sich dies von höchstens zwei Prozent der Gesamttreffer bei jedes sagen lässt. 59 Umgekehrt machen Ordinalzahlen nahezu die Hälfte der Belege bei jedes aus, während deren Anteil bei alles unter einem Prozent liegt. Ordinalzahlen setzen die Zählbarkeit eines zu ergänzenden Nomens voraus, die eben charakteristisch für die Bezugsgrößen von jedes, aber nicht für die von alles ist (vgl. auch oben Abschn. 5.1). Wie zu erwarten, ist diese Verteilung hochsignifikant, vgl. den folgenden, die Gesamttrefferzahlen mit einbeziehenden Assoziationsplot in Abbildung 16 (Phi = 0,9403). 59 Wahrscheinlich liegt der tatsächliche Anteil bei weniger als einem Prozent; extrahiert wurde nur die im Vorfeld befindliche Phrase, wodurch sich Ambiguitäten mit als maskulin zu klassifizierenden elidierten Bezugsausdrücken nicht immer auflösen lassen wie z.B. in jedem neuen im Vorfeld gefolgt von einer Form von müssen in der linken Satzklammer. Patrick Brandt / Eric Fuß 162 abb. 16: assoziationsplot: relativierungsverhalten von Quantoren in konstruktion mit adjektivischen Elementen und ordinalzahlen Insgesamt wird deutlich, dass das quantifizierende Element alles auf adjektivische Komplemente spezialisiert ist, während jedes substantivische Ergänzungen fordert. Massennomina präsentieren sich dabei als besonders „adjektivische“ Substantive, die als Antezedentien jedoch nach wie vor klar Relativierung mittels das präferieren. Weiter oben haben wir gesehen, dass „nackte“ Stoffnomina zu Relativierung mittels das führen (sofern keine Mengenlesart intendiert ist), während die Kombination von alles mit einem Stoffnomen allerdings den Relativierer was signifikant nach vorne bringt, vgl. Abschnitt 5.1. 5.5 etwas zwischen Gegenstands - und Prädikats - / Propositionsbezug In der hier betrachteten Domäne scheinen die dasbzw. was-Varianten in der überwiegenden Zahl der Fälle jeweils dieselbe Funktion zu haben, die eben im Anschluss eines Relativsatzes besteht. Eine Grundunterscheidung besteht allerdings darin, welche Semantik der Bezug hat; grob lässt sich dabei zwischen dem Bezug auf Individuen oder Gegenstände einerseits versus Sachverhalte oder Eigenschaften andererseits unterscheiden. Beispiele wie das folgende illustrieren dies besonders prägnant. (80) Wie soll sich ein Kleinkind, was 4-jährige sind, über einen so langen Zeitraum konzentrieren? (St. Galler Tagblatt, 29.10.2008, S. 31; Kinder werden überfordert) Relativpronomenselektion und grammatische Variation 163 Wiewohl aus oberflächlicher syntaktischer Sicht in (80) ein substantivisches Antezedens gegeben ist und man entsprechend das Relativum das erwarten würde, kann hier nur was erscheinen. Der Grund liegt darin, dass hier kein Bezug auf ein konkretes Individuum hergestellt wird, sondern vielmehr auf eine aus solchen Individuen abstrahierte Eigenschaft; das Relativpronomen was hat im Relativsatz prädikative Funktion. In diesem Sinne weist der Matrixsatz in (80) sehr wohl ein stützendes Glied im Behaghel’schen Sinne auf, das aber eben keine Individuensemantik hat. Anschluss mittels das schiene prinzipiell möglich, würde aber im Falle von (80) zu einer unsinnigen Interpretation führen (verschiedene 4-Jährige können nicht ein und dasselbe Kleinkind sein, was allerdings der Gebrauch von das bedeuten würde). Offenbar liegt so etwas wie eine Unterscheidung zwischen Gegenstandsbezug einerseits und Propositionsbzw. Prädikatsbezug andererseits auch der Verteilung der Relativpronomina das bzw. was in Kombination mit dem Element etwas zugrunde, das bei der Clusteranalyse in Abschnitt 4.1.3 ausgeklammert wurde. Aus kategorialer Perspektive kann etwas sowohl pronominal wie auch - wiederum in Kombination mit Massennomina - in Quantorenbzw. Artikelfunktion gebraucht werden (etwas Salz). Aus semantischer Perspektive kann sich etwas in pronominaler Verwendung einerseits auf Gegenstände, andererseits auf Sachverhalte bzw. Eigenschaften beziehen. Eine Korpusrecherche in KoGra-DB (20.1.2015) nach etwas mit adjazentem das bzw. was ergab eine insgesamt ausgewogene Häufigkeit der beiden Varianten (141 vs. 154). Eine genauere manuelle Sichtung der Belege zeigte, dass im Falle von etwas, was in 53 Fällen eindeutig Propositions- oder Prädikatsbezug vorlag; für etwas, das dagegen ist in nur 12 Fällen eindeutig Propositions- oder Prädikatsbezug gegeben. Authentische Beispiele für Prädikatsbzw. Satzbezug von was versus Bezug auf ein (in der Regel individuendenotierendes) Substantiv sind in (81) gegeben. (81) a. Ich erfuhr, wie wichtig es ist, die Hypotheken der Vergangenheit anzuerkennen, überhaupt einen Gaumen für die Bedeutung von Vergangenheit zu zeigen - etwas, was mein literarisches Vorbild nicht tat, nicht tun konnte. (Bezug auf Prädikat/ VP) (Siegfried Lenz: Mein Vorbild Hemingway. In: Werkausgabe in Einzelbänden, Bd. 19. Hamburg, 1997) b. Also war da etwas, was ich nicht wissen soll? (Satzbezug) (Rolf F. Schütt: Die Irren sind auch nicht mehr die einzig Normalen. Oberhausen, 1997) Patrick Brandt / Eric Fuß 164 c. Eine Burg ist etwas, das alle Kinder beschäftigt, und Tiere aller Art könnten Kinder in diesem Alter ebenfalls begeistern. (Gegenstandsbezug) (St. Galler Tagblatt, 21.7.1997, Ressort: AT-KAP (Abk.); Waldstätter Kinder bauten »Igelburg«) Die Ergebnisse der Erhebung sind in der folgenden Tabelle zusammengefasst. etwas, das etwas, was Belege insgesamt 141 154 Prädikats- oder Satzbezug  12  53 Gegenstandsbezug 129 101 tab. 30: Einfluss des Bezugs von etwas auf die das/ was alternation Der Mosaikplot in Abbildung 17 zeigt, dass die Selektion von das bzw. was signifikant vom Bezug des Relativierers auf das vorhergehende Prädikat bzw. den vorhergehenden Satz (versus ein Substantiv) abhängt (p = 1.774e-07). Der Wert für die Effektstärke liegt knapp über dem allgemein angenommenen Schwellenwert für mittlere Zusammenhänge (Cramérs V = 0,304). abb. 17: Mosaikplot: Einfluss des Bezugs von etwas auf die das/ was alternation Zu ganz analogen Ergebnissen führt die Untersuchung von Identität bzw. Ähnlichkeit kodierenden Antezedentien wie dasselbe oder das gleiche, die bezüglich der Unterscheidung von Propositionsbzw. Prädikatsbezug vs. Ge- Relativpronomenselektion und grammatische Variation 165 genstandsbezug zunächst neutral sind. Auch hier löst die Wahl von das systematisch eine Interpretation in Begriffen des Gegenstandsbezugs aus, während die Wahl von was zu einer Interpretation in Begriffen propositionaler Bedeutungen (Tatsachen, Ereignissen) oder Prädikaten (Tätigkeiten, Eigenschaften) führt. Die Beispiele in (82) sind repräsentativ für Gegenstandsbezug mittels das vs. Prädikatsbzw. Gegenstandsbezug mittels was: (82) a. Wen genau sollen wir jetzt verachten? Die Paparazzi? die Sensationspresse? Die CD-Produzenten? Den Tourismus? Den allesverschlingenden Markt generell? Das tränenduselige Publikum? Schon munkelt man, es sei dasselbe, das doch eben jene Sensationspresse lese. (St. Galler Tagblatt, 22.9.1997, Ressort: TB-FRO) b. Aber was die Frauen sagen, ist genau dasselbe, was sie auch hierzulande sagen würden auf die ewigen Fragen: Was magst Du an Deinem Job? Was nicht? (Die Rheinpfalz, 18.2.2009, S. 18; Fegen und faulenzen) Es fällt auf, dass Gegenstandsbezug unter Verwendung von dasselbe, was im Korpus nicht vorkommt, vgl. die Tabelle 31. Für das gleiche, was/ das ist das Bild sehr ähnlich, wiewohl insgesamt etwas weniger scharf; so gibt es im Korpus drei Belege mit das gleiche, was, die eher Gegenstandsbezug aufweisen. 60 Gesondert zu erwähnen ist auch, dass 2 der 67 Fälle von dasselbe, was sowie 2 der 43 Fälle von das gleiche, was eine Mengeninterpretation haben, die unter Verwendung von das ausgeschlossen zu sein scheint (vgl. Beispiel (82)). 60 Dabei liegt in einem Fall Stoffbezug durch ein Massennomen vor, in zwei Fällen steht das gleiche, was prädikativ: (i) Als vorbildlich, zukunftsweisend, innovativ wird die neue Heizanlage der St. Galler Ortsbürger gepriesen. Doch der Blick in den genialen Ofen zeigt, dass ganz gewöhnliches Holz verfeuert wird, das gleiche, was auch im Lagerfeuer der Pfadfinder brennt. (St. Galler Tagblatt, 15.9.1999, Ressort: TB-FRO (Abk.)) (ii) Sie sind aus der SPD ausgetreten und bei den Grünen ausgetreten. Politische Heimatlosigkeit scheint ein Erkennungsmerkmal vieler Mitglieder der Linkspartei zu sein. Ist das, was Sie mit der Partei verbindet, nicht das Gleiche, was auch die Wähler anzieht - der reine Protest? (Berliner Zeitung, 25.7.2005, Ressort: Lokales; „Ungerechtigkeit ist kein Naturereignis“, S. 25) (iii) Gilbert zufolge lassen Menschen fast immer außer acht, daß ihr seelischer Apparat über außerordentlich wirkungsvolle psychohygienische Mechanismen verfügt, die bittere, peinliche und schmerzhafte Erfahrungen entschärfen. „Diese Abwehrmech[a]nismen sind für den Geist das gleiche, was das Immunsystem für den Körper ist“, schreibt er. (Berliner Zeitung, 23.12.1998; Ein Schutzengel, der nur im Verborgenen wirken kann, S. IV) Patrick Brandt / Eric Fuß 166 dasselbe, das dasselbe, was das gleiche, das das gleiche, was Prädikats-/ Satzbezug  2 67  4 43 Gegenstandsbezug 22  0 17  3 tab. 31: Einfluss des Bezugs von dasselbe auf die das/ was alternation Der Mosaikplot in Abbildung 18 veranschaulicht die Verhältnisse: Der insgesamt überwiegende Prädikatsbzw. Satzbezug ist für dasselbe, was (aber nicht für das gleiche, was) signifikant überrepräsentiert. Gegenstandsbezug ist für sowohl dasselbe, das wie für das gleiche, das hochsignifikant überrepräsentiert. Die Effektstärke ist sehr hoch (Cramérs V = 0,863). abb. 18: Mosaikplot: Einfluss des Bezugs von dasselbe auf die das/ was alternation Wie bereits oben in Abschnitt 5.1 erwähnt, gehen Mengen- oder Gradlesarten („amount readings“) mit der Einleitung des Relativsatzes durch was einher; nach dem Kriterium des Relativsatzanschlusses kann dies eventuell dafür sprechen, dass Grade nicht in Analogie zu Gegenständen zu behandeln sind (vgl. einflussreiche Analysen in der Tradition von Cresswell 1976), sondern eher so etwas wie Eigenschaften von Prädikaten bzw. Propositionen darstellen (Lewis 1970). (83) illustriert noch einmal die mit Relativsatzeinleitung durch was verbundene Mengeninterpretation. (83) Ein Anfänger bekommt am Staatstheater monatlich 2 500 Mark brutto, dasselbe, was er an einem einzigen Drehtag verdient. (Berliner Zeitung, 2.3.2001, S. 12) Relativpronomenselektion und grammatische Variation 167 5.6 Zur Pragmatik des „irregulären“ Gebrauchs von das/ was Wie schon weiter oben in Abschnitt 4.1.2 beschrieben wurde, kann die Wahl von das vs. was in bestimmten, die Rekonstruktion eines Antezedens prinzipiell erlaubenden Kontexten einen Bedeutungsunterschied markieren, vgl. (84). (84) Das ist ein schönes Fahrrad im Vergleich zu dem, das/ was du hast. Der Anschluss mittels das bewirkt in solchen Fällen eine ‚elliptische’ Interpretation in Begriffen eines Vergleichs mit Entitäten, die von der durch das Antezedens bestimmten Sorte sind. Demgegenüber bewirkt der Anschluss mittels was eine Interpretation in Begriffen eines Vergleichs mit allen möglichen Entitäten, d.h., der Bezug des Artikels oder Pronomens dem ist in diesem Fall rein kontextuell bestimmt. 61 Die Wahl von was in Kontexten, wo das lizenziert ist, hat in Beispielen wie dem gegebenen einen semantisch/ pragmatischen Effekt, der stark an die Wirkungsweise konversationeller Implikaturen (Grice 1975) erinnert: die Wahl der schwächeren Form führt zu einer Interpretation, die die Negation der stärkeren Form prima facie zu beinhalten scheint. Gerade die Tatsache, dass die stärkere Interpretation (d.h. eine Interpretation in den für das Relativpronomen das einschlägigen Begriffen, die als Selektion aus einer durch eine lexikalisch-nominale Restriktion gegebenen Menge beschrieben werden kann) auch bei Verwendung von was letztlich nicht ausgeschlossen zu sein scheint, spricht allerdings dafür, dass die Elemente das und was in ihrer Verwendung als Relativpronomen tatsächlich in einem Inklusionsverhältnis stehen, d.h., dass die allgemeinere Funktion von was die spezifischere Funktion von das im Prinzip mit abdeckt. Aus theoretischer Sicht und in Übereinstimmung mit Freges (1892) Auffassungen ist festzuhalten, dass sich damit der Bezug auf Propositionen bzw. Prädikate gegenüber dem auf Gegenstände als der grundlegendere Fall darstellt. In weniger involvierten (d.h. weniger tief eingebetteten) Konstruktionen sind eventuelle Unterschiede wenn überhaupt dann nur schwer greifbar. So kann der Gebrauch von das in bestimmten Kontexten - etwa bei substantivierten Adjektiven - im Vergleich zum Gebrauch von was eine erhöhte Konkretizität oder Sicherheit des Gegebenseins suggerieren, was auch mit dem Gebrauch bestimmter Tempora und Modi zu korrelieren scheint: Perfekt und Präteritum und ‚indikative’ Modi scheinen frequent bei Verwendung von das, während 61 Diese Beobachtung findet sich auch in der Dudengrammatik (2009, S. 1031). Dort heißt es: „Die Form was steht bei Bezug auf Pronomen mit Genus Neutrum […]. Aber nicht bei elliptischen Ausdrücken: Ich wählte das Bild, das eine Blume zeigte, und nicht das/ dasjenige, das einen Baum darstellte (= … und nicht das/ dasjenige Bild, das einen Baum darstellte.)“. Patrick Brandt / Eric Fuß 168 Präsens und Futur und ‚konjunktive’ Modi bzw. der Gebrauch von epistemisch zu interpretierenden Modalverben bei solchen Beispielen überrepräsentiert zu sein scheint, in denen was verwendet wird. Weiter unten wird auf diesen Zusammenhang im Kontext des Antezedens nichts genauer eingegangen. (85) und (86) illustrieren den Unterschied für durch alles quantifizierte substantivierte Adjektive. 62 (85) Aber ich sah den damaligen US-Botschafter John Kornblum und seine Frau Helen, wie sie dem Ruf ihres Hypothalamus folgten. Sie rockten. Und wie! Nicht dünn, aber wild. Und sehr ineinander verliebt. Die Körper hatten sich verändert, die Bewegungen waren original. Alles Schöne, das die beiden miteinander erlebt hatten, vielleicht College, Harvard oder Stanford, seine erste Zeit in Washington, war plötzlich wieder da. (Die Zeit (Online-Ausgabe), 14.2.2008, S. 46; Stoned! ) (86) Thüringen findet das zu allgemein, Thüringen will es konkret und in vielen umständlichen Sätzen erklären, was zur Kultur gehört, nämlich Literatur, Theater, Museen - solche Dinge. Aber warum? Nun, die Frage ist einzig, was fehlt. Film zum Beispiel, neue Medien, alles Neue, was auch eines Tages zur Kultur zu zählen droht. Soll etwa ein Förderer von Autorenfilmen nicht gemeinnützig sein? Haben sie in Thüringen die Übersicht verloren? Ja. (Berliner Zeitung, 14.5.2007, Ressort: Feuilleton; FÖDERALISMUS, S. 25) Ein weiterer Effekt, der sich in Fällen der Verwendung von was in Kontexten, wo das lizenziert erscheint, beobachten lässt, kann vielleicht als Herunterspielen, bis hin zur Herabsetzung beschrieben werden - möglicherweise als 62 Festlegungen, was auf der Formseite eindeutig einer z.B. futurischen oder modalen Interpretation entspricht, sind wenn überhaupt nur sehr schwer zu machen; in der Folge ist es unklar, welche Klassen von Fällen man im Hinblick auf eine Kodierung als „konkrete“ oder vielleicht „sichere“ versus „mögliche“ oder „unsichere“ Gegebenheit miteinander vergleichen sollte. Auffällig im Bereich von unerwartetem das bei durch alles quantifizierten substantivierten Adjektiven ist die Häufung im Bereich bestimmter Textsorten in bestimmten Regionen. Bei über 30 der ungefähr 40 einschlägigen Belege für das Muster alles Gute/ Neue/ Schöne/ Schlimme/ Schlechte/ Böse/ Alte, das handelt es sich um Glückwunsch- oder Todesanzeigen aus Österreich und der Schweiz wie in dem folgenden Beispiel. (i) Die Lebensflamme unserer Mutter, Schwiegermutter, Grossmutter, Urgrossmutter und Tante ist am 31. Mai 2006 erloschen, nachdem sie in den letzten Wochen und Monaten immer schwächer geworden ist. Nun wurde sie von ihren altersbedingten Leiden erlöst. Wir sind dankbar für alles Gute, das sie uns so reichlich gegeben hat. (Die Südostschweiz, 7.6.2006; Barbara (Bethli) Nufer- Zanella) Vgl. Abschnitt 5.8 für eine Diskussion der Distribution von das bzw. was in Abhängigkeit von außersprachlichen Faktoren wie Region, Land, Textsorte und Register. Relativpronomenselektion und grammatische Variation 169 Effekt der distinktive Unterschiede aufhebenden Generalisierung oder als Effekt der Übertragung aus dem weniger strikt geregelten Bereich der Mündlichkeit, in dem was als Relativsatzeinleiter vermehrt auch in solchen Kontexten auftritt, in denen auch das lizensiert wäre, d.h., wo das Antezedens einen substantivischen Kern aufweist: (87) Und die Sonne schien in China für Nadine Angerer vom ersten bis zum letzten Tag. Das Bisschen, das sie zu halten hatte, hat die Fränkin souverän gemacht. (Die Rheinpfalz, 1.10.2007, S. 13; Es geht auch ohne Zettel) (88) Otto war der dritte Sohn eines Mächtigen, der sein Streben nach der Kaiserkrone teuer bezahlen musste. Niemand traute Otto viel zu. Das bisschen, was er erben sollte, wurde zerstört. (Braunschweiger Zeitung, 1.8.2009; „Nette Fürsten wären untergegangen“) (89) Statt zu studieren und sich zu bilden, pauken sie stupide Wissensmassen, um auswendig Gelerntes im Prüfungsakkord wiederzukauen. Sie fürchten durch die Bachelor-Reform zurecht um ihre Chancen auf dem Arbeitsmarkt, fürchten Gebühren für ein Studium, was nichts wert ist. (dpa, 22.11.2009; Leipziger Volkszeitung zu Studentenprotesten) Insgesamt ist festzuhalten, dass die Effekte des Eindringens von was in die Domäne von das verschiedener Natur sind, sich jedoch womöglich unter einer Überschrift wie „Understatement“ zusammenfassen lassen. Indem die Kontexte, in denen das selegiert werden kann, eine Untermenge der Kontexte sind, in denen was selegiert werden kann, bilden die Elemente das und was eine Skala bezüglich ihrer Spezifizität bzw. Allgemeinheit; das ist hier das spezifischere, also semantisch stärkere Element. Wenn nun ein Sprecher in einem bestimmten Kontext das schwächere Element verwendet, so greift der übliche Mechanismus der Quantitätsimplikatur auf Seiten des Hörers, der folgert, dass der Sprecher nicht in einer epistemischen Position war, das stärkere Element - also das - zu verwenden. In den Worten Horns (2000, S. 306, sein Beispiel (24)): (90) The utterance of …W… (containing an unembedded occurrence of a weak scalar value) will Q(uantity)-implicate that the speaker was not in a position to affirm …S… (Where …S… is informationally stronger than, i.e. unilaterally entails, …W…) only if S is at least as lexicalized as W within the relevant domain. Die Äußerung von …W… (das ein uneingebettetes Vorkommen eines schwachen skalaren Werts enthält) Q(uantitäts)-implikatiert, dass der Sprecher nicht in einer Position war, …S… zu behaupten Patrick Brandt / Eric Fuß 170 (wobei …S… informativer ist als …W…, d.h., …W… folgt unidirektional aus …S…), nur dann, wenn S in der relevanten Domäne wenigstens so stark lexikalisiert [d.h. genauso oder weniger komplex; PB] ist wie W. Der Sprecher ist aber, wie wir gesehen haben, genau dann nicht in der Lage, das zu verwenden, wenn die Referenz des Relativsatzeinleiters nicht durch ein substantivisches Antezedens eingeschränkt ist. Mit anderen Worten signalisiert der Gebrauch von was in das-lizenzierenden Kontexten den „Verzicht“ auf die eindeutige, formale Identifizierung des Relativums mit dem Antezedens; es handelt sich um einen Fall von willentlicher und noch dazu unökonomischer Vagheit. Sofern der Hörer in der Lage ist, dies zu erkennen, wird er versuchen, einen Grund für die angesichts der Tatsachen zu schwache Formulierung auszumachen; hier öffnet sich eine Reihe von Möglichkeiten, deren gemeinsamer Nenner ist, dass nicht die stereotypische, nichts weiter involvierende Interpretation des Relativums in Begriffen des substantivischen Antezedens in Anschlag zu bringen ist. Levinson (2000, S. 136) erfasst Muster solcher Art mittels seines M- (für „manner“) Prinzips: (91) M Principle: Indicate an abnormal, nonstereotypical situation by using marked expressions that contrast with those you would use to describe the corresponding normal, stereotypical situation. M-Prinzip: Zeige eine ungewöhnliche, nichtstereotype Situation an, indem du markierte Ausdrücke verwendest, die mit denjenigen kontrastieren, die du verwenden würdest, um die korrespondierende normale, stereotype Situation zu beschreiben. Wie wir in Abschnitt 5.8 sehen werden, finden sich besonders im Bereich der Mündlichkeit Vorkommen von relativsatzeinleitendem was in Kontexten, die eigentlich das erwarten lassen. Dies mag mit den eben gemachten Bemerkungen insofern konvergieren, als der Bereich der Mündlichkeit insgesamt weniger streng geregelt ist und der Einfluss solcher Größen wie Beschränkung im Ausdruck oder der möglicherweise auch durch den realzeitlichen Produktionsdruck motivierte vermehrte Gebrauch multifunktionaler, d.h. breit anwendbarer Ausdrücke den in der Schriftlichkeit eher zum Zuge kommenden Willen zur sprachlichen Genauigkeit und Diversifizierung aussticht. Die Konvergenz dieser für die Mündlichkeit typischen Eigenschaften zeigt sich in Beispielen wie dem folgenden, das aus einem betont locker gehaltenen Interview in einer Radiosendung stammt. (92) Das wievielte Album ist das eigentlich, was Du gemacht hast? (SWR 1 Kopfhörer, 27.5.2015 22.55h) Wie gesagt, gibt es umgekehrt weniger häufige Fälle des Eindringens von das in die Domäne von was. Hier scheint die Verwendung von das beim Hörer die Relativpronomenselektion und grammatische Variation 171 Konstruktion eines Kontextes [sic! ] zu erzwingen, der die Lizenzierungsbedingungen für das schafft, d.h. insbesondere die Konstruktion eines geeigneten, aber unausgedrückt bleibenden substantivischen Antezedens. 63 (93) Fast nichts, das die rot-grüne Mannschaft ankündigte, nahm sie nicht bald darauf teilweise wieder zurück. Die 620-Mark-Jobs, die Steuerreform, die Ökosteuer, die Gesundheitsreform - daß die jeweils Leidtragenden protestieren würden, war zu erwarten und konnte ausgehalten werden, wenn man sich gewiß war, auf dem richtigen Weg zu sein. (Berliner Zeitung, 16.12.1998; Rot-grüne Regierungs-Azubis übernehmen sich VON PETER BENDER, S. 4) Im gegebenen Beispiel bezieht sich das Relativpronomen offenbar nicht auf das wörtliche Antezedens, das eben gerade gar keinen Referenten hat, sondern auf das, was tatsächlich angekündigt wurde (nämlich die im darauffolgenden Satz genannten Maßnahmen wie 620-Mark-Jobs, Steuerreform etc.). In gewisser Weise signalisiert die Wahl von das in Kombination mit nicht referierenden Antezedentien, dass eben doch ein Antezedens zur Verfügung steht, das allerdings nicht direkt aus dem explizit gegebenen Sprachmaterial erschlossen werden kann. Interessanterweise deuten im Kontext der Analyse der Metadaten gemachte Beobachtungen darauf hin, dass ein solcher Konkretizität suggerierende Gebrauch von das gehäuft im politischen Ressort vorkommt, wo er womöglich genau die rhetorische Funktion hat, eine „gesicherte“ Referenz vorzuspiegeln, wo eigentlich keine solche gegeben ist, vgl. etwa das folgende Beispiel (und Abschnitt 5.8 weiter unten): (94) Die universelle Zuständigkeit von Kraushaar für alles, das mit 68 zu tun hat, wird nur noch übertroffen von der universellen Zuständigkeit von Herfried Münkler für globale Konflikte und eigentlich überhaupt für alles. (die tageszeitung, 9.6.2009, S. 16; Öffentlichkeit und Erfahrung) 63 Vgl. die folgende Bemerkung von Curme (1922, S. 199) zu Beispielen wie (i) oder (ii): (i) Herr v. Körber erwiderte, er erachte die Schaffung einer provisorischen Fakultät als das einzig Richtige, das die Regierung vorläufig tun könnte. (Hamburger Nachrichten, 7.11.1904) (ii) Das Höchste und das Beste, das der Deutschlehrer in Schule und Universität leistet, kann immer nur Anregung sein. (Friedrich Kluge, in Marburg 1913) „It is possible that there is often here an intentional use of das or welches by way of differentiation, to refer to something definite, definite at least to the speaker. […] We cannot, however, in many cases on account of the lack of clearness in the thought absolutely determine whether the das or welches is used merely as a survival of older usage to indicate a collective idea or something indefinite or general, or is employed intentionally in accordance with modern usage elsewhere, to refer to something definite.“ Patrick Brandt / Eric Fuß 172 5.7 Relativsatzinterne Eigenschaften 5.7.1 Modalität Wie oben notiert (vgl. Abb. 3), löst das Antezedens nichts nach unseren Recherchen insgesamt die Selektion von was aus. Die ursprüngliche, auf den Satzanfang beschränkte COSMAS-Recherche ergab 9 Vorkommen von das vs. 290 Vorkommen von was, d.h. ein Verhältnis von etwa 1: 30. Eine breitere Suche, die auch Belege im Mittelfeld berücksichtigt, bestätigt dies, wobei das Verhältnis weniger deutlich, aber immer noch stark asymmetrisch ausfällt (102 zu 1037, d.h. etwa 1: 10). 64 nichts, das nichts, was Belege insgesamt 102 1037 RS modalisiert oder negiert  61  563 RS nicht modalisiert oder negiert  41  474 tab. 32: Einfluss von Modalität und negation auf die das/ was alternation Auffällig ist hier die relativ hohe Zahl der modalisierten oder negierten Relativsätze sowohl bei Einleitung durch das wie bei Einleitung durch was. Als modalisiert wurden hier zunächst solche Relativsätze eingestuft, deren finites Verb im Konjunktiv II steht, sowie modale Infinitive (z.B. das Buch ist zu lesen), aber nicht grundsätzlich Relativsätze, die Modalverben enthalten. Letztlich entschieden semantische Intuitionen über die Klassifizierung als „modal“; als notwendige Bedingung wurde dabei die Angemessenheit einer Paraphrase in Begriffen der bloßen Möglichkeit (versus Tatsächlichkeit) des Bestehens des kodierten Sachverhalts angesehen. Als negiert wurden allein solche Relativsätze eingeordnet, die das Negationselement nicht enthielten. Die Differenz der Verhältnisse für die Fälle nichts, das bzw. nichts, was ergab kein statistisch signifikantes Ergebnis. Das Fehlen harter Kriterien zur Einstufung als modal ist ein Problem; Analoges gilt für die Auszählung negierter Belege angesichts der Möglichkeit der Negation durch andere, auch derivationelle Elemente, einmal abgesehen von Fällen, in denen die Negation nicht transparent bzw. overt (lexikalisch) ausgedrückt wird. 64 Aussortiert wurden solche Fälle, in denen nichts eindeutig als nominaler lexikalischer Kopf fungiert. Entsprechende Beispiele weisen sämtlich Relativierung mittels das auf, was zeigt, dass nicht Referentialität im eigentlichen Sinne - also eine semantisch/ pragmatische Eigenschaft - für die das-Selektion wesentlich ist, sondern eben eine grammatische Eigenschaft, nämlich die Präsenz eines Substantivs im Antezedens. Das folgende Beispiel zeigt die nominale Verwendung von Nichts. (i) Schwieriger steht es um die Frage, was dieses Nichts denn sei: ein Etwas, das es nicht gibt, oder ein Nichts, das es nicht geben kann, oder ein Etwas, das es zwar aktuell nicht gibt, unter anderen Umständen aber geben könnte. (Die Zeit (Online-Ausgabe), 6.3.2008, S. 49; Etwas wird nichts) Relativpronomenselektion und grammatische Variation 173 Eine breiter angelegte Recherche unter Hinzunahme weiterer Vergleichsgrößen und unter Trennung verschiedener, jeweils klar definierter „Modalisierungen“ bei gleichzeitigem Verzicht auf die Erfassung aller möglicherweise als modal anzusehender Relativsätze lieferte allerdings interessante und signifikante Ergebnisse. Erhoben wurde die Präsenz − einer Form von können, − einer Konjunktiv-II-Form des Verbs, − des Negationselements nicht in Relativsätzen mit den Antezedentien einiges und nichts sowie in der deutschen Entsprechung der Existenzkonstruktion (EK) Es gibt nichts, das/ was. Tabelle 33 gibt die Ergebnisse für können wieder, der zugehörige Assoziationsplot ist in Abbildung 19 gegeben. einiges, das einiges, was nichts, das nichts, was EK, das EK, was können 18  48  49  708  4 110 Rest 92 263 356 1527 38 281 tab. 33: Einfluss der präsenz von können auf die das/ was alternation Zunächst bildet die alleinige Berücksichtigung von nichts die Modalisierung mittels einer Form von können unter d-Relativierung als hochsignifikant unterrepräsentiert ab, unter w-Relativierung hingegen als signifikant überrepräsentiert, vgl. den folgenden Plot; man bemerke allerdings, dass der Effektstärkenkoeffizient hier relativ niedrig ist, nämlich Phi = 0,155. abb. 19: assoziationsplot: Einfluss der präsenz von können auf die das/ was alternation (Bezugselement: nichts) Patrick Brandt / Eric Fuß 174 Interessant ist in der Folge, dass die d-/ w-Unterscheidung gekreuzt mit der Präsenz einer Form von können für das Antezedens einiges keine Rolle zu spielen scheint in dem Sinne, dass die Fälle mit können für beide Varianten vergleichsweise unterrepräsentiert sind. Für das Antezedens nichts dagegen ist können bei Relativierer was unter Hinzunahme der Vergleichsgröße hochsignifikant überrepräsentiert, die Abwesenheit von können dagegen signifikant unterrepräsentiert. Ähnlich asymmetrisch, wenngleich nur für das Muster Es gibt nichts, das in signifikanter Weise, stellen sich die Verhältnisse für die Existenzkonstruktion dar. Es ist hier wieder der Relativierer was, der Modalisierung mittels einer Form von können nach vorne bringt (Phi/ V-Koeffizient = 0,1734), vgl. Abbildung 20. abb. 20: assoziationsplot: Einfluss der präsenz von können auf die das/ was alternation (einiges, nichts und Existenzkonstruktionen) Ein ganz ähnliches Bild ergibt der Vergleich der Auftretenshäufigkeiten von Konjunktiv II an den Verbformen der Relativsätze (Phi/ V-Koeffizient = 0,2402), vgl. Tabelle 34 und Abbildung 21. einiges, das einiges, was nichts, das nichts, was EK, das EK, was Konj. II 11  25  84  899  9 111 Rest 99 286 321 1336 33 280 tab. 34: Einfluss des Vorliegens konjunktivischer Verbformen auf die das/ was alternation (einiges, nichts und Existenzkonstruktionen) Relativpronomenselektion und grammatische Variation 175 abb. 21: assoziationsplot: Einfluss des Vorliegens konjunktivischer Verbformen auf die das/ was alternation (einiges, nichts und Existenzkonstruktionen) Die Auftretenshäufigkeit des Negationselements nicht schließlich ist wie folgt verteilt: einiges, das einiges, was nichts, das nichts, was EK, das EK, was nicht 18  53  73 1026 17 230 Rest 92 258 332 1209 25 161 tab. 35: Einfluss der negation nicht auf die das/ was alternation (einiges, nichts und Existenzkonstruktionen) Wieder ergibt sich ein ähnliches Bild - im Fall des Antezedens nichts stellt sich die Auftretenshäufigkeit von nicht im Relativsatz stark asymmetrisch und statistisch signifikant entlang der Unterscheidung zwischen dasvs. was- Relativierern dar, während sie im Fall von einiges symmetrisch ist, nämlich signifikant unterrepräsentiert im Fall von einiges, das und hochsignifikant unterrepräsentiert im Fall von einiges, was. Ähnlich wie für „nacktes“ nichts ist die Präsenz des Negationselements im Fall der w-relativierten Existenzkonstruktion hochsignifikant überrepräsentiert; die d-relativerte Existenzkonstruktion weist keine signifikant abweichende Häufigkeit auf, vgl. Abbildung 22. Die Frequenz der d-relativierten Existenzkonstruktion ist allerdings sehr niedrig (Phi/ V-Koeffizient = 0,275). Patrick Brandt / Eric Fuß 176 abb. 22: assoziationsplot: Einfluss der negation nicht auf die das/ was alternation (einiges, nichts und Existenzkonstruktionen) Unter Hinzunahme weiterer Vergleichsgrößen, die aufgrund robust bestehender Variation bei vertretbarer Trefferzahl ausgewählt wurden, bleibt das Bild bestehen: Auch für die Elemente manches sowie für (nominalisierte) Adjektive scheint die Alternation zwischen das bzw. was nicht vom Auftreten einer Form von können bzw. des Konjunktiv II im Relativsatz abzuhängen. Der nächste Assoziationsplot in Abbildung 23 zeigt die verschiedenen als Antezedens fungierenden Elemente bei dasvs. was-Selektion gekreuzt mit der Auftretenshäufigkeit einer Form von können in der Gesamtschau (Phi = 0,2920347). Hinzugekommen sind die Daten in Tabelle 36: manches, das manches, was A, das A, was können  1  18  43  25 Rest („nicht“) 58 412 767 228 tab. 36: Einfluss der präsenz von können auf die das/ was alternation (Bezugselemente: manches und adjektivische Elemente) Aus methodologischer Sicht ist interessant und bemerkenswert, dass die Alternation zwischen den Relativierern das und was beim Antezedens nichts zunächst nicht signifikant mit dem Vorliegen von Modalisierung im Relativsatz zu korrelieren scheint; dabei wurden verschiedene Arten der Modalisierung „in einen Topf“ geworfen, z.B. wurden auch Infinitive der Art x ist zu V-en als Relativpronomenselektion und grammatische Variation 177 modal eingestuft; letztlich entschieden semantische Intuitionen über die Einordnung als modal. Der Verzicht auf einen Großteil möglicherweise modaler Belege durch die Beschränkung auf eindeutig und weitestgehend unabhängig zu identifizierende zu einer modalen Interpretation führende Elemente liefert ein anderes Bild, nach dem Modalisierung (im Zusammenhang mit dem Antezedens nichts) eben doch signifikant mit der Relativpronomenselektion korreliert (Modalität bei was vs. keine Modalität bei das). abb. 23: assoziationsplot: Einfluss der präsenz von können auf die das/ was alternation (einiges, manches, nichts, Existenzkonstruktionen und adjektivische Bezugselemente) Unter der Annahme (Brandt/ Fuß 2014), dass Relativpronomina einen referenziellen Index erhalten müssen, der Identität mit einem Bezugselement herstellt, lassen sich diese Daten wie folgt interpretieren: Das quantifizierende Element nichts führt keinen Referenten ein, ergo kann das Relativpronomen seinen Index nicht in einer lokalen Beziehung abgleichen und nur was kommt eigentlich infrage. Insofern der Index von was kontextuell festgelegt wird, ist die Modalisierung hier wesentlich für die referenzielle Verortung außerhalb der tatsächlich gegebenen aktuellen Welt. 65 Broekhuis/ Keizer (2012) beobachten ähnliche Effekte im Zusammenhang mit der Alternation zwischen dat und wat im Niederländischen. Sie stellen fest, dass der Relativierer wat in dem Muster (95a), das ein in keinerlei Sinn direkt 65 Fälle von nichts, das können eventuell als lexikalisch-nominale (substantivische) Verwendungen von nichts verstanden werden, das qua kategorieller Zugehörigkeit einen referenziellen Index bereitstellt. Patrick Brandt / Eric Fuß 178 referierendes niets (‚nichts’) enthält, etwa viermal häufiger vorkommt als der Relativierer dat, während dat im in (95b) gegebenen Muster sechsmal häufiger vorkommt als wat (vgl. ebd. S. 410f.). (95) a. [Niets wat/ dat ik doe] helpt. b. Er is [niets dat/ wat ik kan doen]. Das Muster in (95a) ist dadurch charakterisiert, dass niets hier in der üblichen Subjektposition erscheint; der Relativsatz - hier überwiegend durch wat eingeleitet - steht im Indikativ Präsens. In (95b) dagegen erscheint niets in der Position des sogenannten „associates“ des expletiven Elements er; diese Position ist gerade dadurch ausgezeichnet, dass die dort erscheinenden Terme nicht referenziell sein dürfen (vide „Definitheitseffekte“). Der zugehörige, überwiegend durch dat eingeleitete Relativsatz enthält eine Form des Möglichkeit kodierenden Modalverbs kunnen. Interessanterweise scheinen die Verhältnisse im Deutschen denen, die Broekhuis und Keizer für das Niederländische beobachten, wenigstens auf den ersten Blick entgegengesetzt zu sein, indem in modalisierten Kontexten tendenziell dat auftritt, während solche Kontexte im Deutschen an die Relativierung mittels was gekoppelt zu sein scheinen. 5.7.2 Relativsatzinterne oblique Kasus (Dativ und Genitiv) Zusätzlich zu den bereits erwähnten (starken) grammatischen Faktoren wird die Wahl zwischen d- und w-Relativierung bei (nicht-belebten) Neutra auch von den Kasuseigenschaften des Relativpronomens beeinflusst: Wenn das Relativpronomen im Relativsatz einen Dativ vertritt, kann was nicht mehr als Relativum auftreten. Stattdessen erscheint das d-Pronomen dem (vgl. auch Buscha/ Kempter 1980, S. 21): (96) Denn fast alles, dem die King’s Singers auf ihrer Reise begegneten, wurde unter ihren Stimmen zum Kunstschatz und zum einschneidenden Erlebnis. (Berliner Zeitung, 17.10.1997; Sechs englische Sänger Die King‘s Singers sangen in der Philharmonie, S. 16) (97) „Bush kennt die roten Linien und macht nichts, dem ich nicht zustimme“, verrät Olmert der „Jerusalem Post“. (Braunschweiger Zeitung, 9.1.2008; Lobeshymnen auf den besten Freund) (98) Differenziert äußerte sich die grüne Klubobfrau Madeleine Petrovic: „Einige Aspekte sind positiv, es gibt aber vieles, dem wir nicht zustimmen können.“ (Die Presse, 19.12.1992; Umstrittenes Gewerberecht) Diese Beispiele werden von einigen Sprechern als markiert eingeschätzt, stellen aber die einzig mögliche Konstruktionsvariante dar, da was mit (verbalem) Relativpronomenselektion und grammatische Variation 179 Dativ inkompatibel ist, vgl. (99a). 66 Wie (99b) zeigt, ist hier das dativische w- Pronomen wem ebenfalls ausgeschlossen, da es für das Merkmal [+belebt] (bzw. [+menschlich]) spezifiziert ist (also einen laut Wiese 2013 „personalen“ Charakter aufweist): (99) a. *alles, was ich zustimme b. *alles, wem ich zustimme Wesentlich akzeptabler scheinen Fälle zu sein, in denen der Dativ von einer Präposition zugewiesen wird. Hier verlangt die Grammatikschreibung zwar üblicherweise die Verwendung eines Pronominaladverbs wie wovon in (100). Die Variante mit Präposition + was wie in (100b) ist aber durchaus auch (vor allem in der Mündlichkeit) anzutreffen, vgl. (101). (100) a. alles, wovon ich geträumt habe/ womit ich gerechnet habe b. ? alles, von was ich geträumt habe/ mit was ich gerechnet habe (101) Überraschungen - das ist aber auch schon alles, mit was „Gysis bunte Truppe“ (Wahlwerbung) das Bonner Politestablishment noch in Erstaunen versetzen kann. Im Parlament haben deren 17 Vorgänger keine einzige Initiative durchgebracht oder auch nur ein Gesetz mitgeprägt. (die tageszeitung, 29.10.1994, S. 5, Ressort: Inland; Die Linken der Jahrtausendwende? ) Der Kontrast zwischen verbalem und präpositionalem Dativ kann möglicherweise darauf zurückgeführt werden, dass für oblique Kasus eine Sichtbarkeitsbedingung gilt (vgl. z.B. die sog. Genitivregel, Duden 2009), die verlangt, dass das entsprechende Argument über seine Kasusmarkierung (oder andere grammatische Mittel) identifiziert werden kann. 67 Bei verbalem Dativ würde 66 Entsprechende Beispiele werden von einigen Sprechern als natürlicher eingeschätzt, wenn das Bezugselement ebenfalls im Dativ steht: (i) a. ? alles, dem ich zustimme b. allem, dem ich zustimme Zwar ist bei attributiven Relativsätzen der Kasus des Relativpronomens eigentlich unabhängig vom Kasus des Bezugselements; denkbar ist jedoch, dass Kasusidentität Verarbeitungsvorteile mit sich bringt, die sich in dem Kontrast in (i) manifestieren. Relevant ist hier möglicherweise auch die Beobachtung, dass bei freien Relativsätzen entsprechende sog. Matchingeffekte quasiobligatorisch sind bzw. dass in früheren Sprachstufen auch in attributiven Relativsätzen das Phänomen der Kasusattraktion auftritt (vgl. z.B. Paul 1998 zum Mittelhochdeutschen). 67 Relevant ist in diesem Zusammenhang auch die Beobachtung, dass im Schweizerdeutschen (das keine Relativpronomina besitzt und zur Einleitung von Relativsätzen die invariante Relativpartikel wo verwendet) bei der Relativierung indirekter Objekte (nicht aber bei Subjekten und direkten Objekten) obligatorisch ein resumptives Pronomen statt einer Lücke im Relativsatz auftritt (vgl. Salzmann 2008): Patrick Brandt / Eric Fuß 180 bei Verwendung von was (das weder Dativ noch Genitiv signalisieren kann) der oblique Kasus unausgedrückt bleiben. Bei Vorliegen einer Präposition kann man hingegen annehmen, dass der Kasus durch die Präposition selbst ausgedrückt wird (vgl. z.B. Caha 2009 u.v.a. für die Hypothese, dass Präpositionen als morphologische Realisierung inhärenter/ lexikalischer Kasus zu analysieren sind). 68 Ein ähnliches Phänomen tritt mit genitivischen Relativpronomina auf. Allerdings scheint hier zumindest potenziell Variation zwischen d- und w-Formen möglich zu sein (entgegen Buscha/ Kempter 1980, S. 21); zumindest finden sich in DeReKo 3 Belege der Art alles, wessen (allerdings primär in literarischen Texten) gegenüber 21 Belegen mit dessen (W-gesamt, 12.11.2014): 69 (102) Im Wald treibt ein böser Zwerg sein Unwesen. Er stiehlt alles, dessen er habhaft werden kann. (Mannheimer Morgen, 8.10.2003; Märchenhaftes im Parktheater) (103) Ich kann dich nicht dafür bestrafen. Du hast meine Worte nicht respektiert; ich verachte dich, das ist alles, wessen ich noch fähig bin. (S. Lenz: Duell mit dem Schatten. Roman, (Erstv. 1953), In: Werkausgabe in Einzelbänden, Bd. 2. - Hamburg, 1996, S. 25) Abschließend soll an dieser Stelle die Frage behandelt werden, wie sich die Intuition, dass die Ersetzung von was durch dem durch eine Sichtbarkeitsbedingung für den Dativ (bzw. oblique Kasus generell) motiviert ist, mit dem in Abschnitt 4.1.4 skizzierten Wettbewerbsmodell vereinbaren lässt, das auf der Hypothese aufbaut, dass was dann zum Einsatz kommt, wenn die Lizenzierungsbedingungen für d-Pronomina nicht erfüllt sind. Es scheint, dass in (i) de Bueb, wo mer * (em) es Velo versproche händ der Junge wo wir ihm ein Fahrrad versprochen haben (Zürichdeutsch, Bayer/ Salzmann 2013, S. 303) 68 Dieser Analyseansatz kann möglicherweise überdies eine Erklärung dafür liefern, weshalb sich Dativ und Genitiv auf den ersten Blick unterschiedlich verhalten: Während der Genitiv morphologisch markiert werden muss, unterliegt der Dativ scheinbar keiner analogen Bedingung: (i) die Heilkraft frischen Wasser*(s) (Genitiv) (ii) die Heilkraft von (frischem) Wasser (Dativ) Während in (i) der Genitiv notwendig durch eine (sichtbare) Kasusmarkierung angezeigt werden muss, kann eine (morphologische) Markierung des Dativs in (ii) ausbleiben. Dieser Unterschied kann evtl. darauf zurückgeführt werden, dass der Dativ in (ii) bereits eindeutig durch die Präposition ausgedrückt wird (unklar bleibt dabei allerdings zunächst, warum genitivische Adpositionen sich hier offenbar anders verhalten und eine morphologische Markierung des Genitivs am Nomen weiterhin notwendig ist, vgl. *mangels frischen Wasser). 69 Vgl. auch Paul (1920, S. 208): „Nicht ebenso wie das durch was ist dessen durch wessen zurückgedrängt. Wenigstens ist Verwendung von wessen mit Rückbeziehung auf etwas Vorhergehendes immer vereinzelt geblieben, vgl. alles, wessen vnsere Dürfftigkeit nicht entperen kan Op. 150, Prosa 5 […]“. Relativpronomenselektion und grammatische Variation 181 diesem Fall miteinander unvereinbare Anforderungen im Widerstreit liegen. Zum einen sollte die Absenz eines lexikalischen Bezugsnomens die Verwendung des Default-Relativierers was auslösen; zum anderen scheint gerade diese Form mit dem Dativ inkompatibel zu sein. Zu erklären ist nun, warum dieser Konflikt von der Grammatik so aufgelöst wird, dass trotz Absenz eines geeigneten Bezugsnomens eine d-Form als Relativum gewählt wird. Eine Möglichkeit wäre es, anzunehmen, dass w-Formen (als Resultat eines Wettbewerbs) nur dann als Relativum auftreten können, wenn innerhalb des Relativsatzes im Prinzip eine Wahl zwischen d- und w-Formen besteht. Liegt keine solche (potenzielle) Opposition vor, d.h., ist aus unabhängigen Gründen die w-Form ausgeschlossen wie im vorliegenden Fall (was ist inkompatibel mit Dativ), dann schlägtdie d-Formdurch (BerndWiese, persönliche Kommunikation). 70, 71 Alternativ könnte man annehmen, dass die Verwendung eines d-Pronomens bei Dativ/ Genitiv dadurch erzwungen wird, dass dativische Relativpronomina „von Haus aus“ bereits einen Merkmalsgehalt aufweisen, der eine Lizenzierung der d-Form durch den syntaktischen Kontext überflüssig macht und deswegen die Verwendung der spezifischeren d-Form ermöglicht und somit vor dem Hintergrund des Elsewhere-Prinzips erzwingt. Formal kann dies z.B. als das Resultat einer lokalen Reparatur (durch Merkmalsanreicherung) dargestellt werden, die einem dativischen Relativpronomen per Redundanzregel ein nominales Merkmal ([+N]) hinzufügt, das eine Interpretation des Merkmals [+definit] ermöglicht: (104) [+definit] → [+definit, +N] / [+oblique, +objekt] 5.8 Metadaten Die bisherigen (COSMAS-)Teiluntersuchungen basierten auf allen in den jeweiligen Korpora (zumeist: Connexor-Teilarchiv) verfügbaren Daten, d.h. Sätzen mit POS-Annotation; die untersuchten Einflussgrößen betrafen dabei 70 Um die Inkompatibilität der Form was mit (verbalen) obliquen Kasus zu beschreiben, könnte man unter Zugrundelegung des Merkmalssystems von Jakobson (1971 [1936]), vgl. (i), davon ausgehen, dass was zusätzlich für das Merkmal [-oblique] spezifiziert ist. (i) a. Nominativ: [-oblique, -objekt] b. Akkusativ: [-oblique, +objekt] c. Dativ: [+oblique, +objekt] d. Genitiv: [+oblique, -objekt] 71 Der Effekt, den ein obliquer Kasus (vor allem der Dativ) auf die Wahl zwischen d- und w- Form hat, kann auch mithilfe optimalitätstheoretischer Annahmen modelliert werden: Im vorliegenden Kontext verletzen sowohl dals auch w-Form bestimmte Beschränkungen; unter der Annahme, dass die Sichtbarkeitsbedingung für den Dativ eine größere Bedeutung hat als die Lizenzierungsbedingung für d-Pronomina, würde gewährleistet, dass für ein dativisches Relativpronomen stets eine d-Form gewählt wird. Patrick Brandt / Eric Fuß 182 vor allem bestimmte Eigenschaften des Kotextes der Relativsatzeinleiter, z.B. das Vorkommen einer bestimmten Kategorie in einer bestimmten Distanz zum Relativpronomen. Unberücksichtigt blieben dabei möglicherweise relevante übergeordnete Eigenschaften der Daten; auf Basis der Literatur, aber auch auf Basis von bei den bisher durchgeführten Erhebungen gemachten Beobachtungen ist z.B. erwartbar, dass das Medium einen Einfluss auf die Relativeinleiterselektion hat, d.h., dass es eine Tendenz zu was im Bereich des Gesprochenen gibt sowie dass die Verteilung von das vs. was in bestimmten Dialekten mit genuin anderen Relativsatzeinleitungsstrategien (z.B. Relativsatzeinleitung durch wo im Alemannischen) im Vergleich zum Gesamtkorpus in spezifischer Weise anders ausfällt. Um den Einfluss solcher Metadaten zu untersuchen, wurde eine zusätzliche Extraktion innerhalb der Korpusgrammatik-Datenbank (KoGra-DB) durchgeführt. Zum Zeitpunkt der Recherchen am 28.5.2015 und 11.6.2015 (Vergleichsgrößen, siehe unten) belief sich die Größe dieses mit Metadaten angereicherten Teilkorpus auf etwa 500 Mio. (486.962.689 am 28.5.2015) Sätze. Diese sind folgenden Oberkategorien zugeordnet: (105) Region, Land, Domäne, Medium, Register. Aus verschiedenen Gründen haben wir uns bei der Betrachtung der Metadaten auf die Kategorien „Land“ und „Medium“ konzentriert; Informationen über die zeitliche Situierung sowie die Domäne (Fiktion, Kultur, Mensch, Politik, Technik) wurden für ausgezeichnete Fälle herangezogen, wenn das angezeigt schien. Zum einen ist zu erwarten, dass signifikante Ausprägungen zu erwartender Unterschiede insbesondere entlang der medialen und regionalen Dimensionen verlaufen; zum anderen erscheinen die jeweiligen Teilkorpora im Bezug auf die zu betrachtenden Phänomene am ehesten als ausreichend groß. Um nämlich einschlägige Unterschiede entlang der Metadaten schnell zu erkennen und gleichzeitig den Aufwand bei der manuellen Aussortierung irrelevanter Treffer gering zu halten, haben wir uns bei der Suche auf solche strikt lokal identifizierbaren (d.h. durch Adjazenz gekennzeichneten) Muster konzentriert, die als ausnahmehaft gelten können, d.h., wir haben zunächst in solchen Kontexten nach das gesucht, in denen was zu erwarten ist, und umgekehrt (Extraktion am 28.5.2015). Nach Sichtung der Ergebnisse wurden bei vertretbaren Trefferzahlen dann die jeweils komplementären Muster als Vergleichsgrößen erhoben (Extraktion am 11.6.2015). Im Einzelnen betrafen die Suchen bei der ersten Extraktion die folgenden Muster: alles, das; manches, das; ein N, was; das N, was; eines, was; jedes, was; keines, was. Die Ergebnisse für ausnahmehaftes ein N, was und das N, was wiesen aufgrund der oben (vgl. Abschn. 1) beschriebenen Mehrdeutigkeit zwischen echtem Relativsatz einerseits und weiterführendem Nebensatz bzw. Explika- Relativpronomenselektion und grammatische Variation 183 tion oder indirektem Fragesatz andererseits bei sehr hoher Trefferzahl eine derart schlechte Präzision auf, dass wir diese Muster aus praktischen Gründen fallen ließen. Bei den anderen Extraktionen ergaben sich relativ brauchbare Trefferzahlen bei guter Präzision entlang der Dimensionen „Medium“ („Gesprochenes“ 72 versus „Internet“ (Wikipedia-Artikel und Diskussionen) versus Rest (= Publikumspresse, Bücher/ Fachzeitschriften/ Graue Literatur)) sowie „Land“ (Deutschland vs. Österreich vs. Schweiz). Dabei variieren die einzelnen Teilkorpusgrößen stark, wie die folgende Tabelle zeigt. Teilkorpus Größe (Sätze) Medium: Gesprochenes 25.306.603 Medium: Internet 76.306.651 Medium: Rest 382.179.982 Land: Deutschland 396.519.736 Land: Österreich 52.413.904 Land: Schweiz 32.935.801 tab. 37: teilkorpusgrößen in kogra dB (Metadaten: Medium und land) Um auch im Lichte der Größenunterschiede zwischen den Teilkorpora verlässliche Vergleichsgrößen zu haben, wurden zu den oben genannten Mustern komplementäre Extraktionen durchgeführt (am 11.6.2015 entsprechend nach alles, was; manches, was; eines, das; jedes, das; keines, das). Die folgende Tabelle zeigt die Trefferzahlen bei den einzelnen Erhebungen für das Metadatum „Medium“. 73 Rest Internet Gesprochenes das was das was das was alles 302 132.276 26 4.842 11 10.580 manches 222 2.032 6 42 20 407 eines 6.437 183 185 7 437 203 keines 535 18 26 4 67 8 tab. 38: Verteilung von das vs. was nach Quantoren, abhängig vom Faktor Medium 72 Bei den Texten im Bereich „Gesprochenes“ handelt es sich einerseits um Texte, die geschrieben wurden, um mündlich vorgetragen zu werden, oder um Verschriftlichungen von gesprochenen Texten. Dazu gehören Textsorten wie Interviews, Protokolle, Predigten, Reden, Rundfunk- und Fernsehbeiträge sowie Hörspiele, also Fälle, die sich zwischen konzeptioneller Schriftlichkeit und konzeptioneller Mündlichkeit bewegen (vgl. Bubenhofer/ Konopka/ Schneider 2014, S. 64f.). 73 Vereinzelt fanden sich unter den Ergebnissen eindeutig an Anführungszeichen zu erkennende, aus dem Bereich des Mündlichen stammende Belege im Teilkorpus „Publikumspresse“ (z.B. Interviews). Patrick Brandt / Eric Fuß 184 Ein Problem für die statistische Auswertung besteht in der starken Asymmetrie der Trefferzahlen: Die Häufigkeiten der ausnahmehaften Muster sind naturgemäß sehr viel geringer als die der regelhaften Muster. Dies schlägt sich in z.T. (sehr) geringen Effektstärken nieder. Andererseits deutet die Konvergenz der einzelnen, logisch a priori voneinander unabhängigen Muster auf eine gewisse Belastbarkeit der vorgefundenen Tendenzen hin. Der folgende Assoziationsplot in Abbildung 24 visualisiert die Verhältnisse zwischen den Häufigkeiten von alles, das und alles, was bezogen auf das Medium. abb. 24: assoziationsplot: Verteilung von das vs. was nach alles, abhängig vom Faktor Medium Es zeigt sich, dass das Muster alles, das im Teilkorpus „Internet“ (d.h. im Wikipedia-Teilkorpus) in deutlicher Weise überrepräsentiert ist (Pearson-Residuen > 4), während es im Bereich „Gesprochenes“ unterrepräsentiert ist. Die Effektstärke ist allerdings sehr gering, der V-Koeffizient ist gleich 0,0135. Bemerkenswert ist dabei, dass die einschlägigen Wikipedia-Belege allesamt aus der Region Deutschland stammen und nicht aus Österreich oder der Schweiz, wo sich unabhängig vom Medium generell eine Überrepräsentation von alles, das beobachten lässt (siehe unten). Darüber hinaus sind die Wikipedia-Belege allesamt aus der Zeit ab 2010. Die Belege für alles, das aus dem Bereich „Gesprochenes“, wo das Muster klar unterrepräsentiert ist, sind sämtlich aus dem Bereich „Politik“ (vgl. die Bemerkungen oben in Abschn. 5.6). Insgesamt verteilt sich der überwiegende Teil der Fälle von alles, das ungefähr ausgewogen auf die beiden Bereiche „Politik“ (160) und „Kultur“ (142), die mit jeweils etwas über 200 Mio. Sätzen („Politik“ 216, „Kultur“ 201 Mio.) auch den überwie- Relativpronomenselektion und grammatische Variation 185 genden Teil des ressortbezogen annotierten Teilkorpus ausmachen (insgesamt etwa 485 Mio. Sätze; davon noch 37 Mio. aus dem Bereich Technik und 22 Mio. unklassifizierbar). Ein ähnliches Bild ergibt sich für die Relativierung des Elements manches: Auch hier ist der Anschluss mittels das im Teilkorpus „Internet“ (allerdings statistisch nicht signifikant) überrepräsentiert; in „Gesprochenes“ dagegen ist diese Relativierungsstrategie signifikant unterrepräsentiert, vgl. den folgenden Assoziationsplot (Abb. 25). abb. 25: assoziationsplot: Verteilung von das vs. was nach manches, abhängig vom Faktor Medium Zu beachten ist, dass die Effektstärke abermals gering ist (V-Koeffizient = 0,0671). Man beachte auch, dass die oben in Abschnitt 5.4 und Abschnitt 5.5 diskutierte und allem Anschein nach hochrelevante Unterscheidung zwischen Dingbezug einerseits (Anschluss mittels das) und Eigenschaftsbzw. Sachverhaltsbezug andererseits (Anschluss mittels was) bei dieser Auswertung unberücksichtigt bleibt. Eine stichprobenhafte Überprüfung der Daten aus dem Gesprochenen deutet darauf hin, dass mit manches häufig (möglicherweise überdurchschnittlich) auf Sachverhalte oder ereignisbezogene Abstrakta Bezug genommen wird wie z.B. Verfahren oder Maßnahmen. Bei Anschluss mittels das überwiegen wiederum die Belege aus dem Bereich „Politik“ sehr deutlich (17 von 20 Belegen). Dabei stammen 109 von insgesamt 222 Fällen von manches, das aus der Domäne „Politik“. Patrick Brandt / Eric Fuß 186 Die Auswertung der Verteilung von eines, das versus eines, was fällt hinsichtlich der Sonderstellung der gesprochenen Sprache noch deutlicher aus, und der Effekt des Mediums ist hier stärker (Phi/ V-Koeffizient = 0,363). Hier ist der Anschluss mittels das im Teilkorpus der gesprochenen Sprache hochsignifikant unterrepräsentiert, der durch was hochsignifikant überrepräsentiert. Der Bereich „Internet“ sticht nicht besonders heraus, wiederum bleibt die Unterscheidung zwischen Dingversus Eigenschaftsbzw. Sachverhaltsbezug unberücksichtigt. Der folgende Plot in Abbildung 26 veranschaulicht die Verhältnisse. abb. 26: assoziationsplot: Verteilung von das vs. was nach eines, abhängig vom Faktor Medium Die Verteilung von keines, was und keines, das schließlich liefert im wesentlichen Punkt ein ähnliches Bild, vgl. den folgenden Assoziationsplot (Abb. 27): Die Kombination keines, was ist im Bereich der gesprochenen Sprache signifikant überrepräsentiert, diesmal ist die Verteilung im Bereich Internet ganz parallel. Die Effektstärke fällt wiederum geringer aus, Phi/ V-Koeffizient = 0,1453. Wir haben gesehen, dass es im Gesprochenen bzw. in Texten, die dem Bereich der Mündlichkeit näher stehen, eine deutliche Tendenz zum Relativsatzeinleiter was gibt. Ein Grund dafür liegt möglicherweise darin, dass insbesondere die Sprachproduktion in Echtzeit die Verwendung multifunktionaler Elemente mit breiter Anwendbarkeit begünstigt, während Diversifizierung und Spezialisierung sich eher in der Schriftlichkeit niederschlagen. In Bezug auf die gesprochene Sprache kommt hinzu, dass Sprecher und Hörer sich hinsichtlich der Herstellung referenzieller Bezüge viel stärker auf den außersprach- Relativpronomenselektion und grammatische Variation 187 lichen Kontext verlassen können, als dies im Schriftlichen der Fall ist. Gerade weil der referenzielle Bezug des Relativsatzeinleiters was kontextuell geregelt ist (vgl. oben Abschnitt 4.1.4), stellt die Verwendung von was in der gesprochenen Sprache möglicherweise insofern so etwas wie den unmarkierten Fall dar, als relevante kontextuelle Parameter in der Regel direkt in der Äußerungssituation gegeben sind und die Herstellung von Bezügen insbesondere mit deiktischen Mitteln keine Schwierigkeit bedeutet. Selbst wenn die Bedingungen für die anaphorische Identifizierung des Relativsatzeinleiters gegeben sind, bedeutet die kontextuelle Identifizierung in der gesprochenen Sprache in vielen Fällen möglicherweise keinen Nachteil, d.h. keinen erhöhten interpretativen Aufwand. In der geschriebenen Sprache dagegen bedeutet die anaphorische Identifizierung des Relativsatzeinleiters plausiblerweise einen entscheidenden Vorteil, indem sie die wenig erschwingliche Betrachtung von Information, die nicht im (lokalen) Kotext verankert ist, unnötig macht. In diesem Sinne kodiert was in der gesprochenen Sprache die naheliegende (da kontextuell leicht erschließbare) Bedeutung, während das in der geschriebenen Sprache die naheliegende (da kotextuell lokal bestimmte) Bedeutung kodiert (vgl. die Diskussion in Abschnitt 5.6). abb. 27: assoziationsplot: Verteilung von das vs. was nach keines, abhängig vom Faktor Medium Mundarten sind dadurch charakterisiert, dass sie sich fast ausschließlich im Bereich des Gesprochenen manifestieren, d.h., es gibt in der Regel keine mundartspezifische Schriftlichkeit. Die für diese Studie verwendeten Korpora sind allerdings in schriftsprachlicher Form gegeben und beinhalten in aller- Patrick Brandt / Eric Fuß 188 erster Linie hochsprachliche bzw. standarddeutsche Texte. Gleichzeitig ist bekannt, dass auch die Schriftsprache nicht frei von dialektalen Einflüssen ist, die sich gegebenenfalls je regional in der (hochsprachlichen) Schriftlichkeit niederschlagen. Aufgrund der oben erwähnten Gegebenheiten bezüglich Kategorisierungen und Korpusgrößen bietet sich im Hinblick auf regionale Unterschiede in der Schriftsprache die Gegenüberstellung der Teilkorpora für Deutschland einerseits und Österreich und die Schweiz andererseits an. Für Österreich und die Schweiz ist der mögliche Einfluss des Bairischen und des Alemannischen einschlägig. Wiederum haben wir uns auf durch Adjazenz gekennzeichnete und daher gut auffindbare Muster konzentriert, die als ausnahmehaft gelten können. Gegenstand des ersten Vergleichs ist die relative Häufigkeit des Vorkommens von stark ausnahmehaftem alles, das und weniger stark ausnahmehaftem manches, das; die folgende Tabelle zeigt die Trefferzahlen: D A CH das was das was das was alles 221 119111 85 16154 38 9829 manches 170 2146 47 180 23 102 tab. 39: Verteilung von das/ was nach den Quantoren alles/ manches, abhängig vom Faktor land Die Visualisierung mittels eines Assoziationsplots in Abbildung 28 macht deutlich, dass die Kombination alles, das in den Österreich und der Schweiz zugeordneten Korpora überrepräsentiert ist, und zwar in hochsignifikanter Weise für Österreich und in signifikanter Weise für die Schweiz. Für Deutschland sind entsprechende Vorkommen dagegen signifikant unterrepräsentiert. Die Effektstärke ist allerdings gering, Phi ist gleich 0,0233. Bemerkenswert ist, dass die Fälle von alles, das in Österreich und der Schweiz fast ausnahmslos in das Medium „Publikumspresse“ fallen - nur 3 Fälle insgesamt stammen aus dem Bereich Gesprochenes. Ein ganz ähnliches Bild ergibt der Vergleich der Konstruktion manches, das, die, wie wir gesehen haben, aufgrund der hier einschlägigen Ambiguität zwischen Ding vs. Eigenschaftsbzw. Situationsbezug insgesamt frequenter ist; wiederum ist die Konstruktion in Österreich hochsignifikant und in der Schweiz signifikant überrepräsentiert gegenüber einer signifikanten Unterrepräsentation für Deutschland, vgl. Abbildung 29. Die Effektstärke ist hier etwas größer, Phi = 0,149. Es gibt also Anzeichen dafür, dass eigentlich ausnahmehafter Gebrauch des Relativsatzeinleiters das in schriftsprachlichen Texten aus Österreich und der Schweiz gebräuchlicher ist als in Deutschland. Relativpronomenselektion und grammatische Variation 189 abb. 28: assoziationsplot: Verteilung von das/ was nach alles, abhängig vom Faktor land abb. 29: assoziationsplot: Verteilung von das/ was nach manches, abhängig vom Faktor land Patrick Brandt / Eric Fuß 190 Umgekehrt ist der insgesamt ausnahmehafte Gebrauch von relativsatzeinleitendem was bei dem Antezedens eines in Österreich und der Schweiz in signifikanter Weise noch weniger stark ausgeprägt als in Deutschland, vgl. den folgenden Assoziationsplot in Abbildung 30 (die Effektstärke ist mit Phi = 0,0553 allerdings sehr gering). abb. 30: assoziationsplot: Verteilung von das/ was nach eines, abhängig vom Faktor land Schließlich ergibt die Prüfung der Konstruktion alles, das/ was in Bezug auf die Kategorie „Region“, die quer zur Kategorisierung nach Ländern liegt, die folgenden Trefferzahlen. Südost Südwest Nordost Nordwest alles, das 114 43 23 27 alles, was 30.519 11.339 19.088 11.057 tab. 40: Verteilung von das/ was nach alles, abhängig vom Faktor region Die vorhergehenden Ergebnisse stützend sehen wir, dass der Gebrauch von insgesamt ausnahmehaftem alles, das im Südosten in signifikanter Weise überrepräsentiert ist gegenüber einer hochsignifikanten Unterrepräsentation im Nordosten, vgl. Abbildung 31; in schwächerer, nicht signifikanter Ausprägung sehen wir dasselbe Muster für den Südwesten, verglichen mit dem Nordwesten. Wiederum ist die Effektstärke sehr gering mit Phi = 0,0205. Wiewohl die geringen Effektstärken Vorsicht gebieten, deutet das insgesamt homogene Bild doch darauf hin, dass in Texten österreichischer oder schweize- Relativpronomenselektion und grammatische Variation 191 rischer (also südlicher und vor allem südöstlicher) Provenienz eine Tendenz zu vergleichsweise stärkerem Gebrauch des Relativsatzeinleiters das besteht. abb. 31: assoziationsplot: Verteilung von das/ was nach alles, abhängig vom Faktor region Wenn wir nach möglichen Gründen für diese regionalen Besonderheiten suchen, können wir zunächst feststellen, dass Relativsätze im alemannischen und bairischen Raum üblicherweise mit der Relativpartikel wo eingeleitet werden (vgl. Weise 1916; van Riemsdijk 1989; Salzmann/ Seiler 2010 für das Alemannische; Merkle 1993; Zehetner 1985 sowie Brandner/ Bräuning 2013 für das Bairische); die folgenden Beispiele stammen aus van Riemsdijk (1989, S. 343) (Schweizerdeutsch) und Zehetner (1985, S. 146) (Bairisch). (106) s auto wo du gsäit häsch das mer s ois nöd chönd läischte das Auto rel du gesagt hast dass wir es uns nicht könnenleisten (107) des Auddo, wo do schded das Auto rel da steht Darüber hinaus gibt es sowohl im Alemannischen wie im Bairischen eine insgesamt weniger gebräuchliche Doppelstrategie, nach der Relativsätze zugleich durch ein d-Pronomen und die Relativpartikel wo eingeleitet werden. Brandner/ Bräuning (2013) stellen die Ergebnisse einer aktuellen systematischen Erhebung der Realisierungsmöglichkeiten von Relativsätzen im Projekt Synalm anhand standardisierter Fragebögen vor, wonach diese Doppelstrategie sowohl im Alemannischen wie im Bairischen allerdings insgesamt eher seltene Anwendung findet. Weise (1916, S. 67) berichtet, dass diese Doppelstrategie Patrick Brandt / Eric Fuß 192 im Alemannischen und südwestlichen Gebiet des Fränkischen insbesondere in den obliquen Kasus Anwendung findet, gelegentlich aber auch z.B. im Nominativ (ähnlich Schübel 1955; Reuter 1989). (108) Ta Mann, dem wu tes Haus keherat hot der Mann dem wo das Haus gehört hat (Weise 1916, S. 67) (109) A gedicht, des wu dä lera gemacht kod hod ein Gedicht, das wo der Lehrer gemacht gehabt h a t (Schübel 1955, S. 332) Fleischer (2005, S. 176) fasst zusammen, dass das d-Pronomen im Moselfränkischen für Nominativ und Akkusativ fakultativ, für oblique Kasus dagegen obligatorisch ist. Im Ostfränkischen ist das Pronomen auch für Nominativ und Akkusativ üblich (vgl. Schübel 1955, S. 332f.). Ähnlich bemerkt Merkle (1993, S. 149) für das Bairische, dass das flektierte d-Relativpronomen insbesondere dann dem unveränderlichen wo hinzuzusetzen ist, wenn das Antezedens und das Relativpronomen verschiedene Kasus tragen, vgl. das folgende Beispielpaar mit nominativischem Antezedens und dativischem Relativsatzeinleiter: (110) a. *dea Mo, wo dees kead der Mann, wo das gehört b. dea Mo, dem wo dees kead der Mann, dem wo das gehört Die Verwendung des d-Pronomens hat in solchen Fällen also offenbar mit Sichtbarkeitsbedingungen für bestimmte Kasus(unterschiede) zu tun; analoge Beobachtungen und Überlegungen wurden in Abschnitt 5.7.2 im Zusammenhang der Unmöglichkeit des Relativsatzeinleiters was in dativbzw. genitivmarkierten Positionen vorgestellt. Unseres Erachtens ist das häufigere Auftreten von d-Pronomina mit nichtlexikalischen Antezedentien im südöstlichen Raum möglicherweise als eine Form der Hyperkorrektur einzuschätzen: Im Bewusstsein, dass die Verwendung der Partikel wo nicht dem schriftsprachlichen Standard entspricht, wird ausgehend von der Doppelstrategie die Partikel wo gestrichen. Übrig bleibt das d-Pronomen, für die hier einschlägigen Fälle das d-Pronomen das. Man bemerke, dass eine ebenso denkbare Doppelstrategie, die sich durch den Gebrauch eines w-Pronomens neben der Partikel wo auszeichnet, für keinen Dialekt belegt ist. Zu untersuchen wäre, ob der alleinige Gebrauch von wo über den Umweg der Doppelstrategie unter Streichung der Relativpartikel mit der ausschließlich d-pronominalen Relativsatzeinleitung verbunden ist. Alternativ ersetzen Dialektsprecher solitäres wo direkt durch denjenigen Relativsatz- Relativpronomenselektion und grammatische Variation 193 einleiter, von dem sie denken, dass er dem standarddeutschen Gebrauch entspricht. Der Blick in traditionelle Grammatiken lässt kaum einen anderen Schluss zu, als dass im Neutrum Singular das d-Pronomen das das Mittel der Wahl zur Relativsatzeinleitung ist. 6. Ergebnisse und Schlussfolgerungen 6.1 Methodische Aspekte Die korpusbasierte Untersuchung syntaktischer Phänomene wird dadurch erschwert, dass zurzeit lediglich grundlegende morphologische (Parts-of-Speech-) Annotationen für Teile des DeReKo vorliegen (in Form der TreeTagger- und Connexor-Teilkorpora). Eine der Aufgaben der vorliegenden Pilotstudie war es daher, auszuloten, inwiefern auf der Basis der vorhandenen Annotationsschemata syntaktische Muster gefunden werden können bzw. welche alternativen Methoden angewendet werden können, um zu (hinsichtlich Precision und Recall) befriedigenden Ergebnissen zu kommen, die als repräsentativ gelten können. Diese Problemstellung wurde exemplarisch anhand eines auf den ersten Blick sehr kleinen Phänomenbereichs - die Alternation zwischen das und was in attributiven Relativsätzen - bearbeitet, um den Arbeitsaufwand in einem bewältigbaren Rahmen zu halten. Die Wahl des Untersuchungsgegenstands war zusätzlich dadurch motiviert, dass es sich bei der Relativpronomenselektion um ein Phänomen an der Schnittstelle von Syntax und Morphologie handelt, dessen Auffindbarkeit durch die morphologischen Informationen, mit denen DeReKo annotiert ist, erleichtert wird. Wie in Abschnitt 3 ausführlicher berichtet wurde, haben wir zunächst eine exhaustive Extraktion relevanter Belege aus dem TreeTagger-Teilkorpus der KoGra-Datenbank angestrebt, das mit Informationen zur Kategorie „Relativpronomen“ annotiert ist. Die auf diese Weise gewonnenen Rohdaten haben wir zusätzlich - mithilfe eines Skripts und auf der Basis der im TreeTagger-Korpus vorhandenen Annotation - um Informationen zur syntaktischen Kategorie des Elements angereichert, das dem Relativpronomen unmittelbar vorangeht und in der überwiegenden Zahl aller Fälle das Antezedens des Relativsatzes darstellt. Es hat sich allerdings gezeigt, dass die auf diese Weise gewonnenen Ergebnisse sehr fehlerbehaftet sind (vor allem, was die tatsächliche Kategorie des vermuteten Relativpronomens betrifft) und eine umfangreiche manuelle Sichtung und Nachkorrektur erforderlich machen. Dennoch hat sich dieser Ansatz vor allem als Mittel zur Datenexploration als sehr fruchtbar erwiesen. So konnten wir auf der Basis von Stichproben bereits zu einigen korpuslinguistisch abgesicherten (quantitativen) Aussagen zur Distribution von w- und d-Relativa im Kontext Neutrum Singular gelangen, die z.T. bereits über den Patrick Brandt / Eric Fuß 194 bisherigen Kenntnisstand hinausgehen (vgl. Abschn. 3 und Abschn. 6.2). 74 Flankiert wurde die Gesamtextraktion durch begleitende Einzelrecherchen über die COSMAS-Schnittstelle zum DeReKo. Diese waren ursprünglich vor allem dadurch motiviert, dass die Extraktion aufgrund der in diesem Bereich zu wenig spezifischen Annotation eine Reihe von Lücken und Abdeckungsschwächen im Bereich substantivierter Adjektive und niederfrequenter was- Auslöser (wie z.B. manches) aufwies. Aufgrund der Tatsache, dass sowohl Ausbeute als auch Präzision der zusätzlichen Korpusrecherchen weitaus höher lagen, haben wir Letztere als Grundlage für alle weiterführenden quantitativen Aussagen gewählt. 75 Bei den quantitativen Analysen kam eine Auswahl an deskriptiv- und inferenzstatistischen Verfahren zur Anwendung. Im Mittelpunkt standen dabei zunächst Berechnungen zur relativen Häufigkeit von das vs. was in verschiedenen Kontexten (bzw. zu deren prozentuellem Anteil an der Gesamtheit der Varianten). Darüber hinaus haben wir regelmäßig Signifikanzprüfungen zu Häufigkeitsunterschieden (Chi-Quadrat-Test) und Berechnungen des Assoziationskoeffizienten Phi als Effektstärkemaß durchgeführt. Um einschätzen zu können, inwiefern bei unterschiedlichen Bezugselementen eine signifikante Tendenz zu das oder was als Relativum vorliegt, hat sich insbesondere die Berechnung der standardisierten Pearson-Residuen sowie deren Visualisierung mithilfe von Assoziationsplots als hilfreich erwiesen. Ferner haben wir Clusteranalysen durchgeführt, die (auf der Basis normierter Häufigkeiten) ein rein datengetriebenes Verfahren zur Aufdeckung quantitativer Gemeinsamkeiten darstellen und zur Kategorisierung von Kontexten genutzt wurden, die das oder was in ähnlicher Weise präferieren (bzw. dispräferieren). Bei den Arbeiten zur vorliegenden Pilotstudie haben wir eine Reihe von Erfahrungen zu methodischen Aspekten gesammelt, die für künftige Untersuchungen (zu syntaktischen Phänomenen) im Rahmen des Projekts „Korpusgrammatik“ potenziell relevant sind: − Die korpusbasierte Untersuchung relativer Häufigkeiten von grammatischen Alternanten kann Aufschlüsse liefern über (morpho-)syntaktische Regularitäten, welche die Distribution der Varianten steuern. Hervorzuheben sind dabei insbesondere Erkenntnisse, die den Nachweis erbringen, dass die Wahl eines Formtyps signifikant von bestimmten Umgebungsva- 74 Eine vollständige Durchsicht aller +18.000 Belege konnte bislang noch nicht geleistet werden. Es ist aber vorgesehen, die Gesamtdatenbank in bereinigter Form öffentlich zugänglich zu machen. 75 Die Verbesserung der Präzision wurde z.B. dadurch erreicht, dass für bestimmte Muster mit was als Relativum die Suche auf Belege am Satzanfang eingeschränkt wurde. Auf diese Weise konnten z.B. weiterführende Relativsätze systematisch ausgeschlossen werden, die im Rahmen der Gesamtextraktion eine Vielzahl der Fehlbelege ausmachen. Relativpronomenselektion und grammatische Variation 195 riablen beeinflusst wird (wie z.B. die Präsenz eines quantifikativen Elements im Zusammenhang mit Stoffnomina und substantivierten Adjektiven). − Vor allem im Zusammenhang mit weiterführenden inferenzstatistischen Analysen hat sich die neu zur Verfügung stehende KoGra-R-Schnittstelle als besonders hilfreich erwiesen (http: / / kograno.ids-mannheim.de), die eine Reihe statistischer Standard-Tests online zugänglich macht und es nicht nur erlaubt, Rechercheergebnisse aus KoGra-R automatisch auszuwerten, sondern darüber hinaus auch die Möglichkeit bietet, anderweitig gewonnene Daten in Form von Tabellen hochzuladen und einer Auswahl an statistischen Testverfahren zu unterziehen. − Es hat sich gezeigt, dass Assoziationsplots ein nützliches Mittel zur Veranschaulichung inferenzstatistischer Befunde sind (vgl. auch Konopka/ Fuß 2016 für ähnliche Erfahrungswerte). − Für die Untersuchung syntaktischer Phänomene wie z.B. die Abhängigkeit bestimmter Form- und Strukturvarianten von kontextuellen Variablen (hier: verschiedene Typen von Bezugselementen) haben sich Clusteranalysen (sowie deren Visualisierung mittels Dendrogrammen) bewährt, die es erlauben, quantitative Parallelen aufzudecken, die Hinweise liefern können auf strukturelle Gemeinsamkeiten, die verschiedenen Oberflächenmustern zugrunde liegen. Neben diesen positiven Befunden müssen wir aber auch über einige methodische Probleme berichten, die vor allem die (automatische) Auffindbarkeit einschlägiger syntaktischer Muster im Korpus betroffen haben. Die quantitative Untersuchung des Zusammenhangs zwischen der Art des Bezugselements und der Relativpronomenselektion setzt voraus, dass die Bezugselemente von Relativsätzen/ Relativpronomina zuverlässig erkannt werden. Dies ist auf der Basis der in DeReKo vorliegenden POS-Annotation nur bedingt möglich. Probleme bereiten dabei vor allem Fälle, in denen Relativsatz und Bezugselement nicht unmittelbar adjazent sind: − Die für das DeReKo zur Verfügung stehende Annotation (Connexor, Tree- Tagger, Mecolb) ist im Hinblick auf das Auffinden größerer syntaktischer Einheiten nur eingeschränkt zu gebrauchen; insbesondere ist es aufgrund der innerhalb bestimmter Grenzen variablen Wortstellung im Deutschen sowie der Möglichkeit der diskontinuierlichen Realisierung bestimmter Einheiten (z.B. Kopfnomen - Relativsatz) bei nur sporadisch sichtbarer Markierung der Funktion durch z.B. Kasusmorphologie notorisch schwierig, unabhängig von lexikalischer Information ein vertretbares Maß von Präzision einerseits und Recall andererseits zu erreichen. Für die Erarbeitung einer korpusbasierten Grammatik des Deutschen, wie sie das Projekt „Korpusgrammatik“ anstrebt, ist es aber grundlegend, dass bestimmte Patrick Brandt / Eric Fuß 196 grammatische Muster und syntaktische Konstruktionsweisen ohne Rekurs auf die Untersuchung in gewissem Sinne vorverurteilendes lexikalisches Material zuverlässig identifiziert werden können. Als konkrete Desiderata sind dabei die folgenden Punkte zu nennen: • Die korpusbasierte quantitative Untersuchung anaphorischer (und kataphorischer) Beziehungen wird dadurch erschwert, dass DeReKo (wie andere größere elektronische Korpora) keine Informationen über entsprechende Diskursrelationen enthält (einschlägig annotierte kleinere Korpora sind z.B. die Lancaster Anaphoric Treebank, die Tübinger Baumbank des Deutschen/ Zeitungskorpus oder das Coreferentially Annotated Corpus of Newswire Texts (University of Wolverhampton)). Für die Belange der Grammatikforschung und -schreibung sind dabei vor allem die Beziehungen zwischen (verschiedenen Typen von) pronominalen Elementen und ihren (potenziellen) Antezedentien von unmittelbarem Interesse. • Ein phrasenstrukturell bzw. dependenz-annotiertes Korpus würde es erlauben, einen Teil der genannten Probleme zu überwinden, insofern es die Kodierung von Teil-Ganzes- oder Abhängigkeitsinformation beinhaltet, die die Unterscheidung prinzipiell selbstständiger Einheiten von monofunktionalen, auch diskontinuierlich realisierten Komplexen gewährleistet. Solche prinzipiell auch dependenzkodierbare Strukturbeziehungen sind z.B. in der Czech Dependency Treebank implementiert. • Darüber hinaus ist es wünschenswert, Information über Abfolgerelationen und die relative (hierarchische) Position innerhalb der Satzstruktur zu kodieren, wie sie z.B. innerhalb der Penn Corpora of Historical English (bei Verwendung einer insgesamt eher flachen Struktur) durch die Unterscheidung zwischen Konjunktionalebene (CP: Inversionseffekte, Satzeinleitung etc.) und Propositions-/ Prädikatsebene (IP/ VP) verfügbar gemacht wird. − Aufgrund der fehlenden syntaktischen Annotation ist die korpuslinguistische Untersuchung entsprechender Phänomene mit einem erheblichen Mehraufwand verbunden, der sowohl die Erstellung einschlägiger Suchanfragen als auch die manuelle Durchsicht und Korrektur von Rechercheergebnissen betrifft. Im Rahmen der vorliegenden Studie konnte dieses Problem teilweise dadurch aufgefangen werden, dass die Kategorie des Relativpronomens aufgrund der vorhandenen (wenn auch recht fehlerhaften) morphologischen Annotation prinzipiell im Korpus auffindbar ist. Für weitere syntaktische Untersuchungen, die z.B. Wortstellungseigenschaften betreffen, ist ein solcher morphologischer „Anker“ aber nicht unbedingt gegeben. Dennoch waren auch in unserem Fall eine Reihe von Behelfslösungen notwendig, um zu belastbaren Ergebnissen zu gelangen. Ziel entsprechender korpuslinguistischer „Workarounds“ war es, die Prä- Relativpronomenselektion und grammatische Variation 197 zision der Rechercheergebnisse zu verbessern. Dies führte aber in der Regel zu Einbußen in der Ausbeute. So haben wir uns bei der vorliegenden Untersuchung fast ausschließlich auf Kontexte konzentriert, in denen das Bezugselement und der Relativsatz unmittelbar adjazent zueinander sind, da es auf der Basis der vorliegenden Annotation nicht möglich ist, das Antezedens eines extraponierten Relativsatzes automatisch zu identifizieren (bzw. eine Sichtung entsprechender Beispiele nur mit großem Zusatzaufwand möglich gewesen wäre). 76 6.2 Linguistische Aspekte Im Rahmen der vorliegenden Pilotstudie haben wir die Distribution der Relativsatzeinleiter das und was in attributiven Kontexten untersucht. Als zentrales Ergebnis ist festzuhalten, dass die Form des relativischen Anschlusses (mittels dvs. w-Formen) im Kontext Neutrum Singular wesentlich von der syntaktischen Kategorie des Antezedens bestimmt wird. Dies wird durch die folgende Generalisierung erfasst: (111) Generalisierung: Relativierung mittels das N [Neutrum Singular] → das Die Generalisierung in (111) wird durch Korpusbefunde gestützt, die zeigen, dass die Präsenz eines lexikalischen Bezugsnomens i.d.R. Relativierung durch das auslöst - auch bei Elementen, die ansonsten was als Relativum verlangen (z.B. Quantoren und Indefinita). Dies lässt auch darauf schließen, dass bei Vorliegen eines substantivischen Antezedens semantische Faktoren wie indefinite/ quantifikative Lesarten nur eine untergeordnete Rolle bei der Relativselektion spielen. Ferner hat sich gezeigt, dass auch lexikalisch-semantische Eigenschaften wie der Unterschied zwischen zählbaren Nomina und Stoffnomina (die aufgrund ihrer spezifischen Bedeutungseigenschaften in der Literatur wiederholt als potenzielle Auslöser von was gehandelt werden) keinen direkten Einfluss auf die Wahl zwischen w- und d-Relativa haben. Bei näherer Betrachtung konnten wir aber feststellen, dass die Kombination aus quantifikativen Modifizierern und Stoffnomina den relativischen Anschluss durch was signifikant begünstigt (siehe unten; vgl. auch Abschn. 5.1). 76 Bei extraponierten was-Relativsätzen tritt das zusätzliche Problem auf, dass nicht automatisch zwischen attributiven Relativsätzen, freien Relativsätzen, weiterführenden Relativsätzen und indirekten Fragen unterschieden werden kann. Um dieses Problem einzugrenzen, haben wir (wiederum auf Kosten der Ausbeute) bei vielen Recherchen nur Belege zugelassen, bei denen Bezugselement und Relativsatz am Satzanfang (d.h. im Vorfeld) stehen. Patrick Brandt / Eric Fuß 198 Wir haben in Abschnitt 4.1.4 auf der Basis dieser empirischen Ergebnisse dafür argumentiert, dass d-Relativa anaphorische/ determinative Elemente sind, die einen spezifischeren Merkmalsgehalt als w-Pronomina aufweisen. Letztere stellen reine Operatoren dar, die keinen syntaktisch-rückverweisenden Charakter besitzen und somit nicht die Präsenz eines substantivischen Antezedens voraussetzen (was sich in generalisierenden/ verallgemeinernden Lesarten niederschlägt). 77 Vor diesem Hintergrund kann bei Annahme des Elsewhere- Prinzips (Kiparsky 1973, 1982) die Distribution von das und was in attributiven Relativsätzen am einfachsten (und elegantesten) durch einen Beschreibungsansatz erfasst werden, der was als Default-Form betrachtet, die dann verwendet wird, wenn die spezifischeren Lizenzierungsbedingungen der konkurrierenden d-Form das nicht erfüllt sind. Diese Perspektive ermöglicht überdies eine einheitliche Erklärung für das Auftreten von w-Pronomina in anderen relativsatzähnlichen Konstruktionen, die ebenfalls kein substantivisches Antezedens aufweisen (freie Relativsätze, weiterführende Relativsätze sowie attributive Relativsätze, die sich auf Zitate beziehen). Im Rahmen unserer Korpusrecherchen sind wir aber auch auf eine Klasse von Kontexten und Bezugselementen mit abweichenden Relativierungseigenschaften gestoßen, die zunächst nicht mit der Generalisierung in (111) kompatibel zu sein scheinen. Diese können wie folgt systematisiert werden: − Kontexte, die das verlangen, aber anscheinend kein substantivisches Bezugselement aufweisen; − Kontexte, die was als Relativum auslösen, obwohl anscheinend ein substantivisches Bezugselement vorliegt; − Kontexte, die Variation zwischen das und was zulassen; − „Irreguläre“ Verwendungsweisen von das/ was, die mit bestimmten kommunikativen (pragmatisch-semantischen oder stilistischen) Effekten verbunden sind. Die erste Ausnahme, d.h. Verwendung von das, ohne dass an der syntaktischen Oberfläche ein substantivisches Bezugselement vorliegt, betrifft Fälle, die wir im Text als „anaphorische“ Lesarten gekennzeichnet haben. Dazu zählen individuierende Quantoren und Indefinita wie jedes, eines oder keines, die in der Regel rückverweisende Lesarten auslösen, die strukturell durch die Annahme 77 In diesem Zusammenhang haben wir die Hypothese vertreten, dass im Gegensatz zu d-Formen der Bezug von was nicht syntaktisch (über Kongruenz), sondern über pragmatische Mechanismen hergestellt wird. Relativpronomenselektion und grammatische Variation 199 eines elidierten Kopfnomens beschrieben werden können, das unter (formaler) Identität mit einem im Diskurs gegebenen Substantiv getilgt wird: 78 (112) Ein richtiges Fußballspiel. Keines Fußballspiel, das ich nur im Fernsehen anschauen kann, sondern eines auf Rasen, eines, bei dem ich am Rand stehen und mitfiebern kann. Eines, bei dem man die Spieler nicht nur als Stars aus der Werbung kennt. (Braunschweiger Zeitung, 12.3.2010) Analoge anaphorische Lesarten treten auch in Kontexten wie (113) auf, die normalerweise obligatorisch was als Relativum verlangen; ferner haben wir gezeigt, dass auch ein Großteil der das-Relativa im Zusammenhang mit substantivierten Adjektiven (Positive und Superlative) mit einer rückverweisenden Interpretation des Bezugselements einhergeht, vgl. (114) und (115). In diesem Kontext dominiert Kleinschreibung des Adjektivs (was seinen attributiven Charakter signalisiert). (113) Didi Senft kommt daher wie das Duracell-Häschen aus der Werbung. Das Duracell-Häschen, das am längsten trommelt. (die tageszeitung, 26.6.2006, S. 5; Didi, der Teufel) (114) Das bisher bestehende Kraftwerk ist bekanntlich völlig überaltet und muß schon allein aus Umweltgründen erneuert werden. Das neue Kraftwerk, das Ende 1994 fertiggestellt sein soll, wird nach dem neuesten Stand der Technik errichtet und bis zu 90 Prozent weniger Schadstoffe an die Umwelt abgeben. (Salzburger Nachrichten, 5.3.1993; Heizkraftwerk Nord 88 Mill. S teurer) (115) Regen und schlechte Plätze im Trainingslager in Südspanien. Trotzdem herrscht Zuversicht beim FCSt.Gallen: Trainer Roger Hegi hält sein Team für das beste Team, das er in St. Gallen bisher betreut hat. (St. Galler Tagblatt, 12.2.1998, Ressort: TB-SPO (Abk.); Hohes Ziel mit Hegis bester Auswahl) Der umgekehrte Fall, also ein relativischer Anschluss mittels was bei Vorliegen eines substantivischen Bezugselements ist vor allem bei substantivierten Superlativen (nicht anaphorische Lesarten) zu beobachten, die zu über 92% der hier untersuchten Fälle was als Relativum auslösen (vgl. Abschn. 5.2.2). 78 Wie bereits in Fußnote 28 erwähnt, kann die Tatsache, dass der Quantor nicht die „richtige“ Form aufweist (keines statt kein) auf die gleiche Regularität zurückgeführt werden, die in analogen Fällen wie (i) greift: (i) Geld habe ich keines/ *kein. Patrick Brandt / Eric Fuß 200 Dies wirft vor dem Hintergrund der hier vertretenen Analyse der das/ was- Alternation einige Fragen hinsichtlich der syntaktischen Kategorie von substantivierten Superlativen auf, die einerseits anscheinend den Kopf der Nominalphrase bilden, andererseits aber Relativierungseigenschaften aufweisen, die für nicht-nominale Elemente charakteristisch sind. In Abschnitt 5.2.2 haben wir dafür argumentiert, dass sich dieser scheinbare Widerspruch auflösen lässt, wenn man mit Bobaljik (2012) annimmt, dass die Semantik des Superlativs stets einen Allquantor als (strukturell repräsentierten) Bedeutungsbestandteil involviert, der das Bezugselement für den Relativsatz darstellt. Auf diese Weise kann die Form des relativischen Anschlusses bei Superlativen auf das Relativierungsverhalten des Quantors alles zurückgeführt werden (vgl. Fuß 2017 für eine alternative theoretische Analyse im Rahmen der Distribuierten Morphologie). Eine ähnliche Problematik tritt im Zusammenhang mit substantivierten Positiven auf, die ebenfalls häufig was als Relativum zulassen. Die quantitative Untersuchung in Abschnitt 5.2.1 hat allerdings gezeigt, dass hier im Vergleich zu Superlativen ein wesentlich größeres Maß an Variation vorliegt, wobei das (ca. 70%) eindeutig präferiert zu werden scheint. Die Beobachtung, dass sich verschiedene Typen substantivierter Adjektive hinsichtlich ihres Relativierungsverhaltens nicht einheitlich verhalten, ist einer der wesentlichen empirischen Befunde dieser Arbeit (vgl. aber bereits Cutting 1902 für ähnliche Feststellungen). Um diesen Unterschied erfassen zu können, haben wir die Auffassung vertreten, dass es sich bei substantivierten Positiven um „Mischkategorien“ handelt, die sowohl nominale als auch adjektivische Eigenschaften aufweisen und daher gleichermaßen mit das wie auch mit was kompatibel sind (vgl. Fuß 2017 für eine theoretische Ausformulierung dieses Ansatzes). Zudem haben wir festgestellt, dass die Wahl des Relativums im Zusammenhang mit substantivierten Positiven offenbar mit semantischen Unterschieden verknüpft ist: Während generalisierende Lesarten des adjektivischen Elements typischerweise mit was-Relativen verbunden sind, löst das tendenziell eine konkrete/ individuierende Interpretation des Bezugselements aus (vgl. auch bereits Cutting 1902). Damit geht einher, dass die Präsenz quantifizierender Elemente (insbes. alles) ebenfalls einen relativischen Anschluss durch was begünstigt. Analoge Effekte lassen sich bei Stoffnomina beobachten, die zwar (vor allem in unmodifizierter Form) obligatorisch d-Relativierung auslösen, aber in Konstruktion mit alles immerhin in 20% der Fälle was als Relativum zeigen. Interessanterweise scheinen diese Verwendungen oft zu sog. Amount- Lesarten zu führen, in denen der Relativsatz keine Identität mit dem Bezugselement herstellt, sondern als Grad- oder Mengenangabe interpretiert wird. Um das im Vergleich zu zählbaren Nomina abweichende Verhalten von Stoffnomina erklären zu können, haben wir die Hypothese verfolgt, dass Stoffnomina in ihren semantischen Eigenschaften adjektivischen Elementen nahe- Relativpronomenselektion und grammatische Variation 201 stehen. Ein weiterer Fall von Variation zwischen was- und das-Relativen, der auf die semantische Interpretation des Bezugselements zurückgeführt werden kann, betrifft etwas. Hier liegen im Korpus das und was praktisch zu gleichen Teilen vor; eine nähere Betrachtung hat aber gezeigt, dass die Wahl des Relativums entscheidend davon bestimmt ist, ob sich etwas auf einen Gegenstand oder eine Proposition bezieht. Im ersteren Kontext dominiert das, im letzteren was (analoge Beobachtungen gelten für dasselbe, das/ was). Der Zusammenhang, der zwischen der Semantik des Bezugselements und der Wahl des Relativums besteht, kann umgekehrt im Sprachgebrauch auch genutzt werden, um durch die „irreguläre“ Verwendung von d- und w-Formen in Kontexten, die eigentlich die jeweils andere Form verlangen, bestimmte kommunikative Effekte zu erzielen. Dabei haben wir dafür argumentiert, dass entsprechende Belege wie (116) nicht notwendig als „Fehler“ zu betrachten sind, sondern vielmehr eine systematische Gebrauchsvariante darstellen, die sich pragmatisch im Rahmen der Theorie konversationeller Implikaturen analysieren lässt. (116) Die universelle Zuständigkeit von Kraushaar für alles, das mit 68 zu tun hat, wird nur noch übertroffen von der universellen Zuständigkeit von Herfried Münkler für globale Konflikte und eigentlich überhaupt für alles. (die tageszeitung, 9.6.2009, S. 16; Öffentlichkeit und Erfahrung) Wir haben festgestellt, dass diese Art von Variation vor allem dadurch entsteht, dass was in die Domäne von das eindringt (wie z.B. in mündlichen Varietäten stark belegt), während der umgekehrte Fall wie (116) recht selten ist. Dieser Kontrast lässt sich u.U. pragmatisch erklären (Präferenz für schwächere Aussagen mit größerem Vagheitsgehalt auf Sprecherseite), steht aber auch im Einklang mit der bekannten Beobachtung, dass sich unterspezifizierte „multifunktionale“ Formen diachron ausbreiten (Wurzel 1984; Hock 1991). In Abschnitt 5.7 haben wir festgestellt, dass die Wahl des Relativums nicht ausschließlich von Eigenschaften des Bezugselements bestimmt wird, sondern partiell auch von relativsatzinternen Faktoren abhängig ist. Die stärkste Einflussgröße ist hierbei der Kasus, den das Relativpronomen erhält: Steht das Relativpronomen in einem obliquen Kasus, muss es als d-Form realisiert werden. Dieser Effekt ist obligatorisch bei Dativ, bei Genitiv scheint die Form wessen marginal möglich zu sein. Den starken Effekt, den eine Dativmarkierung auf die Wahl des Relativpronomens ausübt, haben wir darauf zurückgeführt, dass die Form was mit (verbalem) Dativ inkompatibel ist, sodass das Relativpronomen dem in diesem Kontext die einzig verbleibende Option darstellt. Zudem haben wir mithilfe statistischer Untersuchungen nachgewiesen, dass die Wahl des Relativums auch von dem Faktor Modalität (bzw. Negation) Patrick Brandt / Eric Fuß 202 beeinflusst wird. Es hat sich dabei gezeigt, dass die Form was bei Vorliegen (i) eines Modalverbs wie können oder (ii) Konjunktiv II im Zusammenhang mit dem Bezugselement nichts signifikant häufiger auftritt als erwartet. Schließlich haben wir im Zusammenhang mit dem abweichenden Gebrauch von das/ was den Einfluss von außergrammatischen Faktoren wie Region, Land, Textsorte oder Register untersucht, die als Metadaten in der KoGra-Datenbank abgelegt sind. Dabei konnten wir die folgenden Tendenzen feststellen, die aber aufgrund der z.T. begrenzten Belegzahlen noch weiterer Überprüfung bedürfen: − Im Bereich „Gesprochenes“ ist was in Kontexten, die im Standard das verlangen, signifikant überrepräsentiert (und auch bei Elementen wie eines oder keines anzutreffen, die in der Schriftlichkeit stark zu das tendieren). − Die vom Standard abweichende Verwendung von das in Kombination mit den Quantoren alles und manches ist im Bereich „Internet“ hochsignifikant überrepräsentiert (Belege in anderen Domänen sind vor allem auf die Bereiche „Politik“ und „Kultur“ beschränkt). − Die Verteilung des Musters alles, das scheint auch von den Faktoren „Land“ bzw. „Region“ beeinflusst zu werden. So tritt das in diesem Kontext vor allem in Texten aus der Schweiz (signifikante Abweichung) und Österreich (hochsignifikante Abweichung) auf, während es in Deutschland insgesamt wenig gebräuchlich ist. Analog gilt dies für den Faktor „Region“: Während alles, das vor allem im Südosten belegt ist, ist es im Nordosten hochsignifikant unterrepräsentiert. Es erscheint naheliegend, diesen Kontrast zwischen Nord und Süd auf dialektale Interferenz zurückzuführen, also auf den Einfluss dialektaler Eigenschaften auf die hochsprachliche Produktion (vgl. Abschn. 5.8 für Details). Abschließen möchten wir mit einer Reihe von Beobachtungen und Schlussfolgerungen generellerer Natur. Wir haben in dieser Studie gesehen, dass die Selektion von d-Relativa in erster Linie strukturell, d.h. formal bedingt ist. Wenn der Relativsatz in einer syntaktischen Konfiguration steht, die ein substantivisches Antezedens mit den Eigenschaften Neutrum Singular enthält, wird das gewählt. Mit anderen Worten, zentral für die Relativpronomenselektion ist die Präsenz einer lexikalisch-nominalen Restriktion, nicht, ob innerhalb dieser letztlich einen Bezug zur außersprachlichen Wirklichkeit, d.h. Referenz hergestellt wird. Somit weist die Alternation von das vs. was auf die grammatische Trennung von „ordinären“ Individuen einerseits und allem anderen, d.h. propositionalen oder prädikativen Bedeutungen andererseits hin (vgl. die in Zifonun/ Hoffmann/ Strecker 1997 getroffene grundlegende Unterscheidung zwischen Gegenstandsfundierung einerseits und Sachverhaltsfundierung andererseits). Die w-Form kommt dann (als Default-Relativum) zum Zug, wenn kein geeignetes substantivisches Bezugselement zur Relativpronomenselektion und grammatische Variation 203 Verfügung steht. Oberflächlich äußert sich dies im „multifunktionalen“ Charakter von was (und w-Formen generell), das in einer Reihe verschiedener Kontexte als Relativum Verwendung finden kann. Neben dem Bezug auf durch Sätze kodierte Sachverhalte (weiterführende Relativsätze, propositionsbezogene Lesarten von etwas oder dasselbe) ist hier vor allem der quasi-universelle oder generische Bezug auf Individuen (Freie Relativsätze) zu nennen sowie die Verwendung in Relation zu bestimmten Eigenschaften, wie sie in superlativischen und anderen „Einzigkeit“ kodierenden Konstruktionen sowie durch bestimmte „Gesamtheit“ ausdrückende Quantoren, insbesondere alles und nichts, ausgedrückt werden. Der Form-Funktions-Zusammenhang im untersuchten Phänomenbereich ist dabei ikonisch in dem Sinne, dass die allgemeinere Form die allgemeinere Bedeutung kodiert. Im Einklang mit der logikophilosophischen Tradition würde dies bedeuten, dass Propositionen und Prädikate die im Vergleich mit Gegenständen allgemeineren Bedeutungen ausmachen (vgl. z.B. Frege 1892; Strawson 1959; Quine 1960). 6.3 Unklare Fälle, potenzielle Anschlussforschung In diesem Abschnitt möchten wir stichpunktartig eine Reihe von Lücken, nicht ausreichend behandelten bzw. offenen Fragen identifizieren, die sich aus der vorliegenden Pilotstudie ergeben und potenzielle Gegenstände von Anschlussforschungen sein können: Primär empirische Aspekte: − Inwiefern verändert sich das Gesamtbild, wenn im Kontext Neutrum Singular auch das (komplexe) w-Element welches berücksichtigt wird? Nach allem, was wir wissen, sollte sich welches analog zu das verhalten (vgl. ? ? nichts/ alles, welches) - welche Faktoren steuern dann die Alternation von welches vs. das? − Wie sind die Varianten bei Relativsätzen mit präpositionalem Anschluss verteilt? Hier gibt es mit w-Pronominaladverbien eine dritte Variante, die nach gängigen Einschätzungen den Bildungen mit P+das/ was vorgezogen wird (alles/ jedes, für das/ für was/ wofür). − Welchen Einfluss haben Wortstellungseigenschaften (insbes. Extraposition des Relativsatzes) auf die Wahl des Relativums? Lässt sich hier doch zeigen, dass ein Teil der relevanten Phänomene auf andere Faktoren zurückzuführen sind (z.B. Dissimilation von adjazenten identischen Formen, *das, das). − Inwiefern lassen sich die vorläufigen Beobachtungen zur Relativpronomenselektion in Spaltsätzen (vgl. Abschn. 2.1) im Rahmen einer korpusbasierten Untersuchung bestätigen? Patrick Brandt / Eric Fuß 204 − Inwiefern können fortgeschrittene statistische Methoden weiterführende Erkenntnisse zur relativen Effektstärke verschiedener Einflussgrößen liefern (z.B. mittels Regressionsanalysen)? − Ein vollständiger Überblick über den Funktionsumfang von d- und w- Formen (im Sinne einer Form-Funktions-Zuordnung) könnte möglicherweise tiefergehende Einsichten zur Struktur und Semantik dieser Elemente liefern. Primär theoretische Aspekte: − Inwiefern kann die Verwendung von was bei den folgenden Konstruktionstypen, die zumindest oberflächlich Ähnlichkeiten mit Relativsätzen aufweisen, unter die hier vorgebrachte Analyse subsumiert werden: • was … angeht/ betrifft/ anbelangt • Satzwertige/ korrelative Ergänzungen zu Pronominaladverbien: Ich habe darüber (= über das) nachgedacht, was du gesagt hat. − Unter der Annahme, dass die Wahl zwischen d- und w-Relativa abhängig ist von der Präsenz eines (geeigneten) substantivischen Antezedens, kann die Art des relativischen Anschlusses als diagnostisches Mittel genutzt werden, um Aufschlüsse über die Natur syntaktischer Kategorien zu erhalten (vgl. z.B. Abschnitt 5.2 und insbesondere Fuß 2017 zu substantivierten Adjektiven). − Unter Umständen kann die das/ was-Alternation Hinweise auf die (interne und externe) Struktur von Relativsätzen (und evtl. Spaltsätzen) liefern (Anbindung an das Bezugselement, Adjunktion vs. Raising vs. Matching- Analysen; vgl. Brandt/ Fuß 2014 für einige relevante Anmerkungen). − Warum sind w-Pronomina in attributiver Funktion auf die Form was beschränkt? Lässt sich diese Restriktion auf die Unterscheidung zwischen markierten (maskulin, feminin) und unmarkierten Genusmerkmalen zurückführen (vgl. Brandt/ Fuß 2014 für einige Spekulationen)? − Warum sind in freien Relativsätzen auch andere w-Formen neben was als Einleiter zulässig (Wem das nicht passt, kann ja gehen)? Lässt sich die Vermutung bestätigen, dass was auch in freien Relativsätzen die häufigste und daher unmarkierte Einleitungsvariante darstellt (vgl. Fuß/ Grewendorf 2014 für einige einschlägige Beobachtungen)? − Inwiefern ist die hier vorgebrachte Analyse für das Relativierungsverhalten von Quantoren/ Indefinita wie jedes/ keines/ eines stichhaltig? Liegt hier tatsächlich eine Form von Ellipse vor, oder ist ein Ansatz anzustreben, der das Relativierungsverhalten „direkt“ auf die spezifischen pronominalen Eigenschaften dieser Elemente zurückführt? Relativpronomenselektion und grammatische Variation 205 − Wie ist vor dem Hintergrund der Erkenntnisse dieser Studie die Tatsache einzuschätzen, dass bei der (marginalen) Verwendung von d-Pronomina in freien Relativsätzen (Fuß/ Grewendorf 2014) die Form das ausgeschlossen ist? Lässt sich diese Lücke auf einen Mangel an irgendwie restriktiv wirksamem lexikalischem Gehalt zurückführen (während Maskulinum und Femininum und auch Plural den möglichen Bezug auf Außersprachliches bereits im für das grammatische System einschlägigen Sinne hinreichend einschränken)? literatur Baker, Mark C. (2003): Lexical categories: Verbs, nouns, and adjectives. (= Cambridge Studies in Linguistics 102). Cambridge: Cambridge University Press. Barwise, Jon/ Cooper, Robin (1981): Generalized quantifiers and natural language. In: Linguistics and Philosophy 4, 2, S. 159-219 Bayer, Josef (2013): W-Frage, Fragepartikel und W-drop im Bairischen. In: Rüdiger Harnisch (Hg.): Strömungen in der Entwicklung der Dialekte und ihrer Erforschung. Beiträge zur 11. Bayerisch-Österreichischen Dialektologentagung in Passau, September 2010. (= Regensburger Dialektforum 19). Regensburg: Edition Vulpes, S. 188-207. Bayer, Josef/ Brandner, Ellen (2008): On wh-head-movement and the doubly-filledcomp filter. In: Chang, Charles B./ Haynie, Hannah J. (Hg.): Proceedings of the 26th West Coast Conference on Formal Linguistics. Somerville, MA: Cascadilla Proceedings Project, S. 87-95. Bayer, Josef/ Salzmann, Martin (2013): That-trace effects and resumption - How improper movement can be repaired. In: Brandt, Patrick/ Fuß, Eric (Hg.): Repairs. The added value of being wrong. Berlin: De Gruyter, S. 275-333. Behaghel, Otto (1923): Deutsche Syntax. Eine geschichtliche Darstellung. Bd. 1: Die Wortklassen und Wortformen. (= Germanische Bibliothek 10). Heidelberg: Winter. Behaghel, Otto (1928): Deutsche Syntax. Eine geschichtliche Darstellung. Bd. 3: Die Satzgebilde. (= Germanische Bibliothek 10). Heidelberg: Winter. Bobaljik, Jonathan D. (2012): Universals in comparative morphology. Suppletion, superlatives, and the structure of words. (= Current Studies in Linguistics 50). Cambridge, MA: The MIT Press. Bock, Karl Nielsen (1933): Niederdeutsch auf dänischem Substrat. Studien zur Dialektgeographie Südostschleswigs. (= Deutsche Dialektgeographie 34). Kopenhagen u.a.: Levin & Munksgaard. Boef, Eefje (2012): Doubling in relative clauses. Aspects of morphosyntactic microvariation in Dutch. Utrecht: LOT. Brandner, Ellen/ Bräuning, Iris (2013): Relative wo in Alemannic. Only a complementizer? In: Linguistische Berichte 234, S. 131-169. Brandt, Patrick/ Fuß, Eric (2014): Most questionable pronouns: Variation between dasvs. was-relatives in German. In: Linguistische Berichte 239, S. 297-329 Patrick Brandt / Eric Fuß 206 Broekhuis, Hans/ Keizer, Evelien (2012): Syntax of Dutch. Nouns and noun phrases. Bd. 1. Amsterdam: Amsterdam University Press. Bubenhofer, Noah/ Konopka, Marek/ Schneider, Roman (2014): Präliminarien einer Korpusgrammatik. Tübingen: Narr. Bühler, Karl (1934): Sprachtheorie. Die Darstellungsfunktion der Sprache. Jena: Gustav Fischer. Buscha, Annerose/ Kempter, Fritz (1980): Der Relativsatz. 2., neubearb. Aufl. Leipzig: Verlag Enzyklopädie. Caha, Pavel (2009): The nanosyntax of case. Diss. Tromsø: University of Tromsø. Campbell, Charles B. (1913): Concerning the pronominal antecedent and the form of the accompanying relative pronoun in modern German prose. Berlin: Ebering. Carlson, Greg (1977): Amount relatives. In: Language 53, 3, S. 520-542. Citko, Barbara (2004): On headed, headless, and light-headed relatives. In: Natural Language and Linguistic Theory 22, 1, S. 95-126. Cresswell, Max J. (1976): The semantics of degree. In: Partee, Barbara H. (Hg.): Montague grammar. New York: Academic Press, S. 261-292. Curme, George O. (1922): A grammar of the German language. Designed for a thoro and practical study of the language as spoken and written today. 2., überarb. u. erw. Aufl. [Ninth printing 1964]. New York/ London: Macmillan. Cutting, Starr Willard (1902): Concerning the modern German relatives, „das“ and „was“, in clauses dependent upon substantivized adjectives. In: The Decennial Publications of the University of Chicago 7, S. 113-131. Duden (2009): Der Duden in zwölf Bänden. Bd. 4: Die Grammatik. 8., überarb. Aufl. Mannheim u.a.: Dudenverlag. Duden (2011): Richtiges und gutes Deutsch. Bd. 9. 7. Aufl. Mannheim u.a.: Dudenverlag. Eisenberg, Peter (2006): Grundriss der deutschen Grammatik. 2 Bde. 3., durchges. Aufl. Stuttgart: Metzler. Engel, Ulrich (1991): Deutsche Grammatik. 2., verb. Aufl. Heidelberg u.a.: Groos. Erben, Johannes (2000): Einführung in die deutsche Wortbildungslehre. 4., aktual. u. erg. Aufl. (= Grundlagen der Germanistik 17). Berlin: Schmidt. Erdmann, Oskar (1886): Grundzüge der deutschen Syntax nach ihrer geschichtlichen Entwicklung. 2 Bde. Stuttgart: Cotta. Fleischer, Jürg (2005): Relativsätze in den Dialekten des Deutschen: Vergleich und Typologie. In: Linguistik online 24, 3, S. 171-186. Frege, Johann Gottlob (1892): Über Sinn und Bedeutung. In: Zeitschrift für Philosophie und philosophische Kritik 100, 1, S. 25-50. Fuß, Eric (2017): Relativierungsverhalten und syntaktische Kategorie substantivierter Adjektive. In: Döring, Sandra/ Geilfuß-Wolfgang, Jochen (Hg.): Probleme der syntaktischen Kategorisierung: Einzelgänger, Außenseiter und mehr. (= Stauffenburg Linguistik 90). Tübingen: Stauffenburg, S. 43-99. Relativpronomenselektion und grammatische Variation 207 Fuß, Eric/ Grewendorf, Günther (2014): Freie Relativsätze mit d-Pronomen. In: Zeitschrift für Sprachwissenschaft 33, 2, S. 165-214. Fuß, Eric/ Konopka, Marek/ Wöllstein, Angelika (2017): Perspektiven auf syntaktische Variation. In: Konopka, Marek/ Wöllstein, Angelika (Hg.): Grammatische Variation - empirische Zugänge und theoretische Modellierung. Jahrbuch des Instituts für Deutsche Sprache 2016. Berlin/ Boston: De Gruyter. Geach, Peter T. (1962): Reference and generality. An examination of some medieval and modern theories. Ithaca, NY: Cornell University Press. Greenberg, Joseph H. (1963): Some universals of grammar with particular reference to the order of meaningful elements. In: Greenberg, Joseph H. (Hg.): Universals of Grammar. Report of a conference held at Dobbs Ferry, New York, April 13-15, 1961. Cambridge, MA: The MIT Press, S. 73-113. Grice, Herbert Paul (1975): Logic and conversation. In: Cole, Peter/ Morgan, Jerry L. (Hg.): Syntax and Semantics. Bd. 3. New York: Academic Press, S. 41-58. Hachem, Mirjam (2013): Dand w-pronouns in the left periphery of German and Dutch relative clauses. Beitrag präsentiert beim Relative Clause Workshop am 26.4.2013. Konstanz: Universität Konstanz. Halle, Morris (1997): Distributed morphology: Impoverishment and fission. In: Bruening, Benjamin/ Kang, Yoonjung/ McGinnis, Martha (Hg.): PF: Papers at the interface. (= MIT Working Papers in Linguistics 30). Cambridge, MA: MIT Department of Linguistics, S. 425-450. Heim, Irene (1987): Where does the definiteness restriction apply? Evidence from the definiteness of variables. In: Reuland, Eric J./ ter Meulen, Alice G. (Hg.): The representation of (in)definiteness. (= Current Studies in Linguistics 14). Cambridge, MA: The MIT Press, S. 21-42. Hock, Hans Henrich (1991): Principles of historical linguistics. 2., überarb. Aufl. Berlin/ New York: De Gruyter. Holler, Anke (2005): Weiterführende Relativsätze. Empirische und theoretische Aspekte. (= Studia grammatica 60). Berlin: Akademie Verlag. Holler, Anke (2013): d- und w-Relativsätze. In: Meibauer, Jörg/ Steinbach, Markus/ Altmann, Hans (Hg.): Satztypen des Deutschen. Berlin: De Gruyter, S. 266-300. Horn, Laurence R. (1972): On the semantic properties of logical operators in English. PhD Diss. Los Angeles: University of California, Los Angeles. Horn, Laurence R. (2000): From IF to IF F : Conditional perfection as pragmatic strengthening. In: Journal of Pragmatics 32, 3, S. 289-326. Jäger, Agnes (2000): Unterspezifikation am Beispiel des Pronomens was. Zur Grammatik eines w-Elements. Magisterarbeit. Jena: Universität Jena. Jakobson, Roman (1971 [1936]): Beitrag zur allgemeinen Kasuslehre: Gesamtbedeutung der russischen Kasus. In: Jakobson, Roman: Selected writings. Bd. 2: Word and language. Den Haag: Mouton, S. 23-71. [Nachdr. d. Originalausg. in: Travaux du Cercle Linguistique de Prague 6, S. 240-288.] Kester, Ellen-Petra (1996a): The nature of adjectival inflection. PhD Diss. Utrecht: Utrecht University. Patrick Brandt / Eric Fuß 208 Kester, Ellen-Petra (1996b): Adjectival inflection and the licensing of empty categories in DP. In: Journal of Linguistics 32, 1, S. 57-78. Kiparsky, Paul (1973): ‚Elsewhere’ in phonology. In: Anderson, Stephen/ Kiparsky, Paul (Hg.): A Festschrift for Morris Halle. New York: Holt, Rinehart and Winston, S. 93-106. Kiparsky, Paul (1983): Word-formation and the lexicon. In: Ingemann, Frances J. (Hg.): 1982 Mid-America Linguistics Conference papers. Lawrence, KS: University of Kansas, S. 3-29. Konopka, Marek/ Fuß, Eric (2016): Genitiv im Korpus. Untersuchungen zur starken Flexion des Nomens im Deutschen. (= Studien zur deutschen Sprache 70). Tübingen: Narr. Levinson, Stephen (2000): Presumptive Meanings: The Theory of Generalized Conversational Implicature. Cambridge: MIT Press. Lewis, David (1972): General semantics. In: Davidson, Donald/ Harman, Gilbert (Hg.): Semantics of Natural Language. Cambridge: Cambridge University Press, S. 3-15. Matushansky, Ora (2008): On the attributive nature of superlatives. In: Syntax 11, 1, S. 26-90. McNally, Louise (2008): DP-internal only, amount relatives, and relatives out of existentials. In: Linguistic Inquiry 39, 1, S. 161-169. Merkle, Ludwig (1993): Bairische Grammatik. 5. Aufl. München: Hugendubel. Murelli, Adriano (2012): Das Geheimnis, das oder was du mir verraten hast? Das oder was als Relativpronomen. In: Konopka, Marek/ Schneider, Roman (Hg.): Grammatische Stolpersteine digital. Festschrift für Bruno Strecker zum 65. Geburtstag. Mannheim, S. 145-152. Neeleman, Ad/ van de Koot, Hans (2006): Syntactic haplology. In: Everaert, Martin/ van Riemsdijk, Henk (Hg.): The Blackwell companion to syntax. Bd. 4. (= Blackwell Handbooks in Linguistics 19). Malden, MA u.a.: Blackwell, S. 685-710. Nevins, Andrew (2012): Haplological dissimilation at distinct stages of exponence. In: Trommer, Jochen (Hg.): The morphology and phonology of exponence. (= Oxford Studies in Theoretical Linguistics 41). Oxford: Oxford University Press, S. 84-116. Paul, Hermann (1920): Deutsche Grammatik. Bd. 4: Syntax. Halle (Saale): Niemeyer. Paul, Hermann (1998): Mittelhochdeutsche Grammatik. 24. Aufl., überarb. v. Peter Wiehl u. Siegfried Grosse. (= Sammlung kurzer Grammatiken germanischer Dialekte 2). Tübingen: Niemeyer. Pirk, Kurt (1928): Grammatik der Lauenburger Mundart. Ein Beitrag zur niederdeutschen Sprache in Ostpommern. (= Vorarbeiten zum Pommerschen Wörterbuch 1). Greifswald: Ratsbuchhandlung L. Bamberg. Quine, Willard Van Orman (1960): Word and object. Cambridge, MA: The MIT Press. Reuter, Elvira (1989): Die Mundart von Horath (Hunsrück). Phonetik und Morphologie. (= Forum phoneticum 45). Hamburg: Buske. Riemsdijk, Henk van (1989): Swiss relatives. In: Jaspers, Dany et al. (Hg.): Sentential complementation and the lexicon. Studies in honour of Wim de Geest. (= Linguistic Models 13). Dordrecht: Foris, S. 343-354. Relativpronomenselektion und grammatische Variation 209 Ross, John R. (1964): A partial grammar of English superlatives. M.A. Diplomarbeit. Philadelphia: University of Pennsylvania. Ross, John R. (1967): Constraints on variables in syntax. Dissertation. Cambridge, MA: Massachusetts Institute of Technology. Salzmann, Martin (2008): Variation in resumption requires violable constraints - A case study in Alemannic relativization. In: Broekhuis, Hans/ Vogel, Ralf (Hg.): Optimality theory and minimalism: Interface theories. (= Linguistics in Potsdam 28). Potsdam: Universitätsverlag Potsdam, S. 99-132. Salzmann, Martin/ Seiler, Guido (2010): Variation as the exception or the rule? Swiss relatives, revisited. In: Sprachwissenschaft 35, 1, S. 79-117. Schäfer, Roland (2015): Einführung in die grammatische Beschreibung des Deutschen. (= Textbooks in Language Sciences 2). Berlin: Language Science Press. Schiller, Anne/ Teufel, Simone/ Stöckert, Christine (1999): Stuttgart-Tübingen-TagSet. Institut für Maschinelle Sprachverarbeitung, Stuttgart, und Universität Tübingen. Schübel, Georg (1955): Die Ostfränkisch-Bambergische Mundart von Stadtsteinach im ehemaligen Fürstbistum Bamberg. Lautlehre und Beugungslehre. (= Beiträge zur deutschen Philologie 3). Gießen: Schmitz. Sternefeld, Wolfgang (2008): Syntax. Eine morphologisch motivierte generative Beschreibung des Deutschen. Bd. 1. 3., überarb. Aufl. (= Stauffenburg Linguistik 31). Tübingen: Stauffenburg. Strawson, Peter F. (1959): Individuals. An essay in descriptive metaphysics. London u.a.: Routledge. Weise, Oskar (1916): Die Relativpronomina in den deutschen Mundarten. In: Zeitschrift für deutsche Mundarten 12, S. 64-71. Werner, Martina (2012): Genus, Derivation und Quantifikation. Zur Funktion der Suffigierung und verwandter Phänomene im Deutschen. (= Studia Linguistica Germanica 114). Berlin/ Boston: De Gruyter. Wiese, Bernd (1999): Unterspezifizierte Paradigmen. Form und Funktion in der pronominalen Deklination. In: Linguistik online 4, 3. https: / / bop.unibe.ch/ linguistikonline/ article/ view/ 1034/ 1698 (Stand: 12.12.2018). Wiese, Bernd (2013): Relativpronomina: Flexion und Wortfelder. Ms. Mannheim: Institut für Deutsche Sprache. Wiesenhann, Tjabe (1936): Einführung in das ostfriesische Niederdeutsch. Leer: Schuster. Wiltschko, Martina (1998): On the syntax and semantics of (relative) pronouns and determiners. In: The Journal of Comparative Germanic Linguistics 2, S. 143-181 Wurzel, Wolfgang U. (1984): Flexionsmorphologie und Natürlichkeit. Ein Beitrag zur morphologischen Theoriebildung. (= Studia grammatica 21). Berlin: Akademie Verlag. Zehetner, Ludwig (1985): Das bairische Dialektbuch. München: Beck. Zifonun, Gisela/ Hoffmann, Ludger/ Strecker, Bruno (1997): Grammatik der deutschen Sprache. (= Schriften des Instituts für Deutsche Sprache 7). Berlin/ New York: De Gruyter. patrick Brandt untEr MitWirkung Von FElix BildHauEr altErnatIon Von zu unD dass komPlEmEntEn: kontrollE, korPuS unD grammatIk 1. Einleitung Das Deutsche kann bei der Realisierung von Komplementen, die propositionale Inhalte kodieren, von verschiedenen Optionen Gebrauch machen. Die vorliegende korpusgestützte Studie untersucht die Alternation zwischen infinitivischen Komplementen mit zu (im Folgenden: zu-Komplemente) einerseits und finiten, durch dass eingeleiteten Komplementen (im Folgenden: dass- Komplemente) andererseits, wie in den Beispielen in (1) und (2) illustriert. (1) „Doch ich habe geschworen, dass ich beim Malen sterbe“, schreibt Paul Cézanne im Oktober 1906 an seinen Sohn. (Neue Kronen- Zeitung, 17.1.2000; S. 32) (2) Ich hatte geschworen, die Wahrheit zu suchen, aber mußte ich durch solch ein Labyrinth? (Der Spiegel, 20.9.1993; Wunder sind mein Wesen) Wie in dem gegebenen Paar ist in einer beträchtlichen Zahl von Fällen zunächst unklar, welche Gründe hinter der Wahl der einen oder der andere Realisierung des Komplements liegen mögen. Einzelne Sprecher verfügen in aller Regel über beide Varianten, die unter bestimmten Grundbedingungen semantischer Natur miteinander konkurrieren. Insbesondere variieren zu- und dass-Komplemente zuallererst unter der Bedingung, dass zwischen einem Argument des Matrixprädikats (hier: schwören) und dem Subjekt des eingebetteten Prädikats (hier: sterben bzw. die Wahrheit suchen) Koreferenz besteht, sie sich also auf dieselbe außersprachliche Entität beziehen (in (1) und (2): den Sprecher). Wann immer eine solche Koreferenzbeziehung zwischen einem Matrixargument und dem Subjekt eines ebenso als Argument des Matrixprädikats fungierenden propositionalen Komplements besteht, sprechen wir hier von (semantischer) Kontrolle, also sowohl im Fall von zuwie auch im Fall von dass-Komplementen. 1 1 In der Literatur ist vor allem bei infiniter Komplementrealisierung die Rede von Kontrolle. Wie Stiebels (2015) oder Rapp et al. (2017) gebrauchen wir den Begriff auch für Koreferenzbeziehungen zwischen einem Matrixargument und dem eingebetteten Subjekt bei finiter Realisierung des Komplements. Rapp et al. (2017) benutzen für diese spezifische Kontrollart genauer gesagt den Terminus semantische Kontrolle. Patrick Brandt unter Mitwirkung von Felix Bildhauer 212 Indem der wesentliche Unterschied zwischen Beispielen wie in (1) und (2) im Ausdruck der Argumente bestimmter Prädikate besteht, fallen sie in den Phänomenbereich sogenannter Argumentstrukturalternationen. In ihrem einflussreichen Buch „English verb classes and alternations“ argumentiert Levin (1993), dass Verben, die an denselben Argumentrealisierungsmustern teilhaben, auch zentrale Bedeutungsaspekte teilen: [T]he behavior of a verb, particularly with respect to the expression and interpretation of its arguments, is to a large extent determined by its meaning. Thus verb behavior can be used effectively to probe for linguistically relevant pertinent aspects of verb meaning. (Levin 1993, S. 1) Levin stützt sich auf Grammatikalitätsurteile, die bezüglich argumentstruktureller und damit auch syntaktischer Realisierungsmöglichkeiten stabil sind, verglichen mit zwischen einzelnen Sprechern stark variierenden semantischen Intuitionen. Der Ertrag des von Levin prominent vertretenen Programms besteht zunächst in einer Klassifizierung von Verben nach deren Potenzial, in bestimmten argumentstrukturellen Mustern vorzukommen. Semantische Eigenschaften, die die Verben einzelner Klassen gemeinsam haben, sind Kandidaten für die Art von semantischer oder funktionaler Information, die für die grammatische Komposition tatsächlich relevant sind, zu der wir aber keinen direkten Zugang haben. 2 Die vorliegende Studie nimmt Klassen von Verben als ihren Ausgangspunkt, die auf der Basis der durch sie prototypisch projizierten Kontrollstrukturen (z.B.: Subjektvs. Objektkontrolle, siehe unten) gebildet sind. Das ist nicht unproblematisch - insbesondere sind einzelne Verben nicht exklusiv auf bestimmte Kontrollstrukturtypen festgelegt, sondern können an je verschiedenen Mustern teilhaben, die unter Umständen in systematischer Weise aufeinander bezogen sind. Letztlich sind die Verblemmata Vehikel, um das System von Kontrollstrukturtypen in den Blick zu bekommen (vgl. aber unten Abschn. 4.3). Dabei stützen wir uns auf Beobachtungen der Art „Verb(typ) V tritt unter Bedingung G im Verhältnis m zu n in Muster y gegenüber Muster z auf“, wobei y und z die Ausprägung der abhängigen Variablen, d.h. die Realisierung von zubzw. dass-Komplementen erfassen. Die Frage ist, ob es einen systematischen Zusammenhang gibt zwischen der anteilsmäßigen Ausprägung von zuvs. dass-Komplementen einerseits und zur Grammatik gehörigen oder die Grammatik irgendwie beeinflussenden Eigenschaften andererseits derart, dass die anteilsmäßige Ausprägung der zuvs. dass-Komplementation sich sinnvoll als Funktion dieser Eigenschaften betrachten lässt. 2 Als Beispiel sei die Generalisierung genannt, dass Verben, die bezüglich Agentivität unterspezifizierte externe Argumente erlauben, an der Kausativ-Inchoativ-Alternation teilhaben, vgl. Levin/ Rappaport (1995) oder Reinhart (2002). Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 213 2. Phänomenbereich und theoretischer rahmen Im oben skizzierten Rahmen ergeben sich zwei globale Fragen. 1. Unter welchen Bedingungen konkurrieren überhaupt zu-Komplemente mit dass-Komplementen? Und 2. Welche Einflussgrößen sind für eine mehr oder weniger starke Ausprägung der jeweiligen Realisierung verantwortlich? 2.1 Objektsinfinitive, Kontrolle und Verantwortlichkeit In aller Regel können an Positionen, in denen zu-Komplemente stehen können, auch dass-Komplemente stehen, selbst wenn bestimmte Verben in der Literatur mitunter als reine zu-Infinitivselegierer präsentiert werden. 3 Ob zu-Komplemente aufgrund ihrer Eigenschaften unter bestimmten Bedingungen „konkurrenzlos“ sein können, ist fraglich (vgl. unten Abschn. 2.4, 4.4.1). Wir können die erste Frage daher vorerst dahingehend vereinfachen, dass wir danach fragen, unter welchen Bedingungen zu-Komplemente lizenziert sind. Zifonun/ Hoffmann/ Strecker (1997, S. 1393-1396) präsentieren eine Ordnung, die zunächst entlang grammatisch-funktionaler Klassen und innerhalb dieser Klassen entlang semantischer Unterscheidungen verläuft, vgl. Tabelle 1. Wenn wir den Komplementbegriff auf Satzglieder beschränken, die von Verben regiert werden und unter aktivischer Diathese als Objekte erscheinen, fallen Subjekt-Infinitiv-Konstruktionen aus der Betrachtung heraus. Innerhalb der Konstruktionen mit Infinitiven in Objektfunktion besteht immer noch relativ große Heterogenität bezüglich argumentstruktureller Realisierungsmöglichkeiten. Aus argumentstruktureller Perspektive homogen und gut überschaubar erscheint der Bereich der Objektsinfinitive in dreistelligen Konstruktionen; semantisch haben die anhand bestimmter Verben identifizierten Gruppen nach Zifonun, Hoffmann und Strecker (1997) einen Aspekt gemeinsam, der mit Verpflichtung oder der Zuweisung von Verantwortung zu tun hat; es geht darum, dass ein nominales Argument des übergeordneten verbalen Prädikats als in irgendeinem Sinne verantwortlich für das durch den zu-Infinitiv bezeichnete Geschehen bzw. den durch diesen bezeichneten Sachverhalt präsentiert wird. Zifonun, Hoffmann und Strecker (1997) unterscheiden dabei „Handlungssteuerung“ (Fremdverpflichtung) einerseits und „Selbstverpflichtung“ andererseits. Insgesamt entsprechen diese Felder weitestgehend dem in der Literatur traditionsreichen und vieldiskutierten Phänomenbereich sogenannter Kon- 3 Die unerwartete Realisierung von dass-Komplementen kann dabei auch relativ banale Gründe haben wie den, dass zu-Komplemente in bestimmten Dialekten praktisch nicht vorkommen, vgl. Bayer/ Brandner (2004) zum Bairischen und Alemannischen. Das folgende Beispiel gehört vermutlich hierher. (i) Ich habe immer versucht, dass ich mich nicht runterziehen lasse, cool bleibe und mich aufs Skifahren konzentriere. (dpa 15.2.2009; Maria Riesch: Alle Schmerzen sind jetzt „wurscht“) Patrick Brandt unter Mitwirkung von Felix Bildhauer 214 trollstrukturen bzw. durch Kontrollverben projizierten Strukturen. In diesem Rahmen werden zumindest sogenannte Subjektkontrollstrukturen (Selbstverpflichtung) und Objektkontrollstrukturen (Fremdverpflichtung) unterschieden. Für das Deutsche liegt innerhalb der Fremdverpflichtung kodierenden Strukturen eine weitergehende strukturelle Unterscheidung entlang des Kasus des nominalen Komplements auf der Hand - wir haben einerseits Strukturen mit akkusativischem nominalem Komplement (warnen, überreden, bitten) und andererseits Strukturen mit dativischem nominalem Komplement (zusagen, geloben, raten). Aus struktureller Sicht ähneln die Selbstverpflichtung kodierenden Subjektkontrollstrukturen den Fremdverpflichtung kodierenden dativischen Objektkontrollstrukturen, indem sie in aller Regel ein Dativargument lizenzieren. Subjekt-IK Objekt-IK 2-stellig Objekt-IK 3-stellig kopulaähnlich heißen, bedeuten, gelten, … Mitteilungs-V (Verhältnis Person/ Sachverhalt) bedauern, behaupten, zugeben, … verbale Handlungssteuerung bitten-Gruppe: warnen, überreden, … „Psychverb“ freuen, gefallen, interessieren, … Mitteilungs-V (Handlung beabsichtigt) versuchen, planen, beschließen, … verbale Handlungssteuerung befehlen-Gruppe: erlauben, verbieten, … Sachverhaltskorrelation voraussetzen, erfordern, erlauben, … Sachverhaltskorrelation bedingen, erfordern, voraussetzen, … verbale Selbstverpflichtung versprechen-Gruppe: zusagen, geloben, … modalähnlich freistehen, sich erübrigen, sich erweisen, … modalähnlich vermögen, verstehen, wissen, … Bewertung sich auszahlen/ empfehlen, (miss)gelingen, … Phasen-V anfangen, fortfahren, aufhören, … Einstellungs-V (kognitiv/ evaluativ) glauben, befürchten, wünschen, … tab. 1: V prädikat klassenbildung Aus semantischer Perspektive betont Farkas (1988) die Zentralität des semantischen Aspekts der Verpflichtung bzw. Verantwortlichkeit für die Interpretation von Kontrollstrukturen. 4 Farkas definiert eine Beziehung „RESP“ (‘responsi- 4 Die in syntaktisch-semantischer Dimension einschlägige Diskussion von Kontrollphänomenen betrifft vor allem Fragen der Obligatorizität koreferenzieller Interpretation („obligatorische“ vs. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 215 bility’) zwischen initiierenden Individuen (Initiatoren) und Situationen dergestalt, dass das infrage stehende Individuum die infrage stehende Situation herbeiführt; im nach Farkas unmarkierten Fall von Subjektkontrolle wird der Initiator mit dem Subjekt des Matrixprädikats identifiziert und ist mithin verantwortlich für den im Komplement ausgedrückten Sachverhalt. Für den nach Farkas markierten Fall der Objektkontrolle führt sie eine Regel ein, die ein Individuum, dessen Handlungen durch den Initiator bestimmt werden, als für den im Komplement kodierten Sachverhalt verantwortlich ausweist. In generativen Ansätzen wird das unsichtbare Subjekt von Infinitiven durch die Kategorie PRO erfasst. Die Beispiele (3) und (4) illustrieren Subjekt- und Objektkontrolle (hier: Dativobjektkontrolle) anhand der von Farkas vorgeschlagenen Kategorien, wobei Indices den außersprachlichen Bezug der individuendenotierenden Terme anzeigen. (3) Ich initiator, +resp, i hatte meiner Tochter versprochen, PRO +resp, i ein Tor zu machen. (Rhein-Zeitung, 27.11.1999; Premiere für Heynckes: sieben Tore) (4) Denn er initiator hat [seinen Engeln] +resp, i befohlen, dass sie +resp, i dich behüten auf allen deinen Wegen. (Rhein-Zeitung, 2.10.2000; Rund 100 Mitglieder der evangelischen Kirchengemeinde verabschiedeten sich von „ihrem“ Vikar) Subjekt- und Dativobjektkontrollstrukturen weisen oberflächlich ganz parallele Strukturen auf, indem sie neben Subjekt und zubzw. dass-Komplement ein Dativargument oder indirektes Objekt lizenzieren. Womöglich unterscheiden sich Subjekt- und Dativobjektkontrollstrukturen nur semantisch, nämlich, mit Farkas, in der Realisierung der Beziehung der Verantwortlichkeit, die in Dativobjektkontrollstrukturen das Dativobjekt involviert und in Subjektkontrollstrukturen das Subjekt. Die zwei anderen Strukturtypen, die hier eine zentrale Rolle spielen, instantiieren Akkusativobjektkontrolle und sogenannte Antikontrolle 5 , vgl. die Beispiele mit zu-Komplementen in (5) und (6), wiederum „nicht-obligatorische“ Kontrolle, z.B. Williams 1980) sowie Fragen der strukturellen Beziehung zwischen kontrollierendem und kontrolliertem Argument (z.B. Rosenbaum 1970; Larson 1990). Die anteilige Rolle syntaktischer bzw. semantisch-pragmatischer Bedingungen an Kontrollphänomenen ist umstritten (vgl. Chierchia 1984). Lyngfelt (2009) bietet einen kompakten Überblick über die Behandlung von Kontrolle im generativen Paradigma. 5 Im Wesentlichen ersetzt der speziell in der jüngeren generativen Kontrolltheorie verwendete Begriff „Antikontrolle“ den weiteren, aus der slawistischen und romanistischen Tradition bekannten Begriff der „Obviation“. Empirisch angemessener wäre eventuell von „Antisubjektkontrolle“ zu sprechen, vgl. weiter unten in diesem Abschnitt und die Abschnitte 3.2 und 3.3 sowie aus sprachvergleichender Perspektive Brandt, Trawiński und Wöllstein (2016). Patrick Brandt unter Mitwirkung von Felix Bildhauer 216 versehen mit Anzeigern für das logische Subjekt des eingebetteten Prädikats (PRO) und für die Farkas’schen Rollen bzw. die Verantwortlichkeitsbeziehung sowie mit referenziellen Indizes. 6 (5) Er initiator, i hatte [einen Bauern] +resp, j gebeten, PRO +resp, j seine Wiese zu mähen […]. (Nürnberger Nachrichten, 20.12.2002; Landwirt übersah Baumstumpf - Mähen mit Hindernissen) (6) Vor einer Woche hatte Putin initiator, i angeordnet, PRO +resp, j die Terroristen zu finden und zu vernichten. (Rhein-Zeitung, 4.7.2006; Gibt Moskau Agenten Lizenz zum Töten? ) Offenbar wird die Verantwortlichkeitsbeziehung in Akkusativobjektkontrollstrukturen regelhaft zwischen dem Referenten des Akkusativobjekts des Matrixverbs und dem eingebetteten logischen PRO-Subjekt etabliert. Antikontrollstrukturen scheinen im Hinblick auf eine eventuell bestehende Verantwortlichkeitsbeziehung negativ definiert zu sein: Sie zeichnen sich dadurch aus, dass das eingebettete PRO-Subjekt referenziell nicht mit dem verantwortlichen Subjekt des Matrixprädikats (dem Initiator) identifiziert werden darf. Dies ist auch der Grund für die initiale Selektion von Antikontrollverben bzw. deren Vergleich mit Akkusativobjektkontrollverben, der historisch am Anfang der vorliegenden Untersuchung stand (vgl. Wöllstein 2015): Sofern ein Zusammenhang zwischen Kontrolle und zu-Komplementierung besteht, sollten sich Akkusativ- und Antikontrollverben im Hinblick auf die betrachtete Variation signifikant voneinander unterscheiden (vgl. weiter unten Abschn. 2.4 und 2.5). Bei näherer Betrachtung zeigt sich, dass zwischen Akkusativobjektkontrollstrukturen und Antikontrollstrukturen enge Zusammenhänge und Wechselbeziehungen bestehen; insbesondere gibt es eine Reihe Verben, die an beiden Mustern teilnehmen, wie z.B. das hier als Antikontrollverb geführte veranlassen, vgl. (7) und (8). (7) Auch hier hat die Verwaltung initiator, i veranlaßt, PRO +resp, j die Arbeitszeiten zu erhöhen. (Rhein-Zeitung, 15.2.1996; Blaue Briefe an Reinigungsfirmen) (8) Das Massaker von Littleton habe Mitschüler +resp, i veranlaßt, PRO +resp, i die Behörden zu informieren. (Die Presse, 29.4.1999, Ressort: Chronik; Jugendliche planten Anschlag auf Schule) 6 In generativen Modellen werden für semantisch besetzte, aber oberflächlich unausgedrückte Argumentstellen aus theoretischen Gründen die leeren Kategorien PRO (für (logische) Subjekte in infiniten Strukturen) und pro (für Argumente in finiten Strukturen) angesetzt. Die Motivation liegt in der Annahme des sogenannten „Theta-Kriteriums“, das verlangt, dass das Verhältnis zwischen semantischen Rollen und syntaktisch ausgedrückten Argumenten eineindeutig ist, d.h., dass jedem semantischen Argument auch ein syntaktischer Argumentausdruck entspricht und umgekehrt. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 217 Die Beispiele (7) und (8) unterscheiden sich zuallererst durch die Präsenz bzw. Absenz eines Akkusativarguments im Matrixsatz voneinander. Wie wir sehen werden, spricht vieles dafür, Antikontrollstrukturen als Akkusativobjektkontrollstrukturen zu analysieren, deren Akkusativargument implizit bleibt, d.h., hinter (7) verbirgt sich tatsächlich (9) mit „leisem“ Pronomen, das als verantwortlich für den im eingebetteten Satz kodierten Sachverhalt präsentiert wird. 7 Wie in der generativen Literatur üblich, bezeichnen wir das leise Pronomen mit „pro“. (9) Auch hier hat die Verwaltung initiator, i pro +resp, j veranlaßt, PRO +resp, j die Arbeitszeiten zu erhöhen. Wenn (9) die Struktur von Antikontrollverben ist, ist klar, warum Antikontrollstrukturen offenbar immer Antisubjektkontrollstrukturen sind: Da Pronomen nicht mit Koargumenten koreferieren dürfen, bedeutet die Identifizierung des Akkusativarguments als verantwortlich und mithin PRO kontrollierend, dass das Subjekt für die Kontrolle von PRO nicht infrage kommt. Die Abschnitte 3.2 und 3.3 weiter unten versammeln Argumente für die Parallelität von Akkusativobjektkontrollstrukturen und Antikontrollstrukturen. Ohne weitere Voraussetzungen können wir an dieser Stelle bemerken, dass die Struktur mit Akkusativargument die einzig plausible grammatische Quelle für die Matrix-passivische Struktur in (10) darstellt, in der der Initiator implizit bleibt und das logische Objekt als verantwortlich präsentiert wird und als kontrollierendes Argument fungiert. (10) Damit werden die Kfz-Lenker veranlaßt, langsamer zu fahren. (Kleine Zeitung, 13.9.1997, Ressort: Villach; Sanierung bald beendet) Beispiel (10) instantiiert das Subjektkontrollmuster, das hier durch Matrixpassivierung eines prototypisch Akkusativobjektkontrollstrukturen projizierenden Verbs zustande kommt. Solche zum mit Subjektkontrolle verbundenen Strukturmuster führenden grammatischen Operationen sind verglichen mit anderen die Kontrollbedingungen manipulierenden Operationen besonders prominent und frequent (vgl. besonders die Abschn. 2.2, 3.2 u. 4.3). In der Summe ist die vorliegende Untersuchung auf einen in argumentstrukturell-syntaktischer wie auch semantischer Hinsicht homogenen bzw. entlang bekannter systemgrammatischer Beziehungen strukturierten Phänomenbe- 7 In dieser Richtung schlägt Stiebels (2007, S. 9; 2010, S. 396) für das Antikontrollverb anordnen (vgl. Bsp. (6)) vor, dass es „implizite Kontrolle“ instantiiert, indem das kontrollierende Argument oberflächlich nicht realisiert werden kann. Stiebels’ Beispiele zeigen allerdings, dass sie das implizite Argument als eine Art Dativergänzung ansieht. Noch davor erwähnen Stechow und Sternefeld (1988, S. 310-311) die Möglichkeit, anordnen als Kontrollverb zu analysieren, das allerdings keine Subjektkontrolle zulässt. Patrick Brandt unter Mitwirkung von Felix Bildhauer 218 reich eingeschränkt, die Auswahl und Gruppierung der untersuchten Fallklassen - namentlich die Einbeziehung von Antikontrollverben bzw. Antikontrollstrukturen - jedoch neu. Für die Untersuchung der Interaktion hier interessierender lexikalisch-semantischer und grammatischer Einflussgrößen erscheint dies präferabel, insbesondere bietet die innerhalb des abgesteckten Bereichs betrachtete Variation zwischen zu- und dass-Komplementen eine Chance, grammatisch wirksame Faktoren jenseits oberflächlicher und intuitiver Funktionsunterschiede zu identifizieren. Nicht zuletzt ermöglicht ein formseitig einheitlicher Phänomenbereich, mit einheitlichen Suchmustern zu relevanten Korpusbelegen zu gelangen und eventuell technisch bedingte Unausgewogenheiten in den Daten einzudämmen. Wir halten fest, dass eine semantische Bedingung für die Teilhabe an der zuvs. dass-Alternation im Bestehen von so etwas wie einer Beziehung der Verantwortlichkeit zwischen dem kontrollierenden Argument und dem im Komplement kodierten Sachverhalt gegeben zu sein scheint. 8 In Erweiterung von Stiebels (2015, S. 428) definieren wir: (11) In Kontrollstrukturen selegiert ein Prädikat P ein sachverhaltsdenotierendes Argument X und ein individuendenotierendes Argument Y, dessen Referent für den durch X kodierten Sachverhalt verantwortlich ist und in der Menge der durch das Subjekt von X bezeichneten Entitäten a) enthalten ist (Kontrolle) b) notwendig nicht enthalten ist (Antikontrolle) Das Vorliegen einer Verantwortlichkeitsbeziehung stellt gemäß der Definition eine notwendige Bedingung für Kontrolle dar - demgemäß sollte es keine bona fide Kontrollstrukturen geben, die nicht auch irgendwie Verantwortlichkeit involvieren; dabei ist zunächst allerdings offen, wie Verantwortlichkeit genauer zu definieren ist, und auch, wie sie eventuell ins Spiel kommen kann (vgl. dazu Abschn. 4.3). Verantwortlichkeit ist ein Aspekt des ubiquitär relevanten, allerdings inhaltlich umstrittenen Konzepts der Agentivität. Indem bestimmte grammatische Operationen wie Passivierung oder Modalisierung mit Agentivität interagieren bzw. auf Agentivität wirken, erwarten wir, ceteris paribus, dass solche grammatischen Operationen einen Einfluss auf die Realisierung von Kontrollstrukturen und mithin die anteilige Ausprägung von zuvs. dass-Komplementen haben (siehe Abschn. 4.3). 8 So auch Rapp et al. (2017): „Semantische Kontrolle besteht, wenn ein Matrixsatzgliedreferent als verantwortlich für den im Komplementsatz geschilderten Sachverhalt angesehen wird.“ Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 219 2.2 Verben und Strukturtypen Ein naheliegender und gängiger Weg, das Komplementationspotenzial von Verben zu modellieren, besteht in der lexikalischen Festlegung von Selektionseigenschaften syntaktischer sowie semantischer Natur. Eine solche lexikalische Festlegung regelt das Selektionsverhalten definitiv und endgültig; dies beinhaltet z.B., dass etwaige ausnahmehafte Abweichungen vom regulären Selektionsverhalten nicht erfasst werden. Fundamental gegen eine rein lexikalische Festlegung spricht, dass die graduell mehr oder weniger frequente Ausprägung bestimmter Muster für bestimmte Verben durch lexikalische Festlegung nicht erfasst werden kann beziehungsweise als reine Zufälligkeit erscheinen muss. Wöllstein (2015) demonstriert aber, dass sich Verben, die an der zu-/ dass-Alternation teilhaben, bezüglich der anteiligen Ausprägung der einen oder anderen Variante unterscheiden und dass Verben mit ähnlicher Bedeutung auch ein ähnliches zu-/ dass-Verhältnis, viz. einen ähnlichen zu-Index aufweisen. Auch haben einzelne Verben an unterschiedlichen (Kontroll-)Strukturmustern teil, sodass das Komplementationsverhalten schon deshalb wenigstens zum Teil von verbzentrierten lexikalischen Festlegungen entkoppelt werden muss. Gleichzeitig treten bestimmte Verben vorrangig in bestimmten Mustern auf, sodass diese Präferenzen die Basis für die Bildung bestimmter Klassen von Kontrollverben bilden können: Bei Subjektkontrollverben ist es das nominale Subjekt des Matrixsatzes, das unter normalen Bedingungen als kontrollierendes Argument fungiert, bei Akkusativobjektkontrollverben ist es das nominale Akkusativobjekt des Matrixverbs, bei Dativobjektkontrollverben ist es das Dativobjekt des Matrixverbs. Mit „normalen Bedingungen“ ist der unmarkierte Fall gemeint, d.h. konkret eine Struktur, die ein aktivisches und nicht reflexiviertes Matrixprädikat sowie Ausdrücke für alle durch dieses selegierten Argumente aufweist; das satzwertige Komplement, das selbst eine Argumentrolle des Matrixsatzes absättigt, weist ebenso ein aktivisches verbales Prädikat auf, das nicht modalisiert oder reflexiviert ist. Dass die verschiedenen Kontrollstrukturtypen in gewissem Sinne nicht ebenbürtig sind, ist eine alte Beobachtung; diesbezüglich bemerkt Bech (1983, S. 83), dass Abweichungen von vermeintlichen lexikalischen Festlegungen als Akkusativbzw. Dativobjektkontrollverb (bei Bech gefasst als „Koeffizienz“ des Matrixverbs oder „Orientierung“ des eingebetteten logischen Subjekts am Akkusativargument des Matrixsatzes (A‘ = N‘‘) bzw. am Dativargument des Matrixsatzes (D‘ = N‘‘)) überwiegend dem Muster der Subjektkontrolle (N‘ = N‘‘) folgen: Vor allem ist zu bemerken, daß man in gewissen fällen die orientierung N‘ = N‘‘ vorfindet, wo man nach der dritten oder vierten orientierungsregel A‘ = N‘‘ oder D‘ = N‘‘ erwarten sollte, d.h. wo der status von V‘‘ mit einem akk. oder dat. kooperiert. Patrick Brandt unter Mitwirkung von Felix Bildhauer 220 Subjektkontrolle wird oft als Regelfall angesehen und vorliegende korpuslinguistische Untersuchungen legen nah, dass sie besonders häufig vorkommt (vgl. Høyem 2015). Bestimmte Kontrollstrukturen sind auf Subjekte als kontrollierende Argumente beschränkt wie z.B. in-order-to-Zwecksätze (‘purpose clauses’) im Englischen (Stiebels 2015, S. 437). 9 Hinsichtlich des Deutschen lässt sich beobachten, dass sogenannte Subjektkontrollverben die grammatisch potenteste Fallklasse darstellen, d.h., Subjektkontrollstrukturen sind diejenigen, die überhaupt einen Großteil der in den Blick genommenen möglichen Faktoren realisieren können. Aus anderen Bereichen wissen wir, dass das Subjekt die am stärksten grammatikalisierte und entsprechend vielfältig manipulierbare grammatische Funktion darstellt (vgl. z.B. Eisenberg 2013, S. 63-64). Aus semantischer Sicht ist der Subjektbegriff eng verbunden mit Fragen der Agentivität: Wenn ein Verb mehr als eine semantische Rolle zuweist, so wird unter Ausklammerung bestimmter „deagentivierender“ Operationen wie Passiv sprachübergreifend diejenige Rolle als Subjekt realisiert, die in einem spezifischen Sinn agentivischer ist als die andere(n) (vgl. Dowty 1991; Primus 1999). Aus sprachvergleichender Perspektive bemerkenswert ist in diesem Zusammenhang, dass in bestimmten Sprachen Subjektkontrolle die einzig mögliche Kontrollkonfiguration überhaupt ist. Chang und Tsai (2013) bemerken hinsichtlich der austronesischen Sprache Kavalan, dass hier nur bona fide Agensargumente des Matrixprädikats agentivisches PRO im eingebetteten Satz kontrollieren können; insofern Kontrolle bei Prädikaten gefragt ist, die in anderen Sprachen beispielsweise als Objektkontrollverben erscheinen, greift Kavalan auf Kausativierung des eingebetteten Prädikats zurück, um dem einzig möglichen Subjektkontrollmuster zu entsprechen, das bona fide agentivische (und mithin verantwortliche) Subjekte miteinander identifiziert. Beispiel (12) illustriert das Phänomen (aus Stiebels 2015, S. 422; pa = Possessorkongruenz, AV = Actor voice). (12) pawRat a tina-na i tu suni j [__ i pa-qaynep] force NOM mother-3sg.pa ACCchild CAUS.AV-sleep ‘his mother forces her child such that she sleeps’ 9 Frühe Arbeiten von Chomsky (1969) zeigen, dass Subjektkontrollstrukturen im Spracherwerb zuletzt, d.h. nach Objektkontrollstrukturen, erworben werden. Insofern Spracherwerb auch und gerade die Identifizierung grammatisch relevanter Regeln beinhaltet, steht dies der These der starken Grammatikalisierung von Subjektkontrollstrukturen nicht entgegen. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 221 2.3 Kontrollwechsel Eng verbunden mit Fragen der Agentivität bzw. Verantwortlichkeit scheint auch das Phänomen sogenannten Kontrollwechsels zu sein. Regelhafter Kontrollwechsel bedeutet, dass vorgefundene Kontrollstrukturmuster unter replizierbaren Bedingungen von dem Kontrollstrukturmuster abweichen, das prototypisch mit den involvierten Verben verbunden ist. So kann die Manipulation dessen, was gemeinhin unter der Überschrift „Agentivität“ verhandelt wird, zu einer Veränderung der Kontrollbedingungen führen; insbesondere kann die Manipulation oder der „Abzug“ solcher Eigenschaften, die mit Verantwortlichkeit bzw. Verpflichtung zu tun haben, anscheinend zu einer Erweiterung der Kontrollmöglichkeiten führen. Frappierende Beispiele sind in (13) und (14) gegeben, in denen das vermeintlich keine zu-Komplemente lizenzierende Matrixverb sagen mit zu-Komplement erscheint, das allerdings modalisiert ist (13) bzw. ein nicht-agentivisches Prädikat involviert (14). 10 (13) Petric habe gesagt, mit rausgehen zu wollen. (Rhein-Zeitung, 17.4.2010; Mladen Petric: „Die dümmste Verletzung … “) (14) Korda hatte gesagt, es nicht zu wissen. (Kleine Zeitung, 15.1.1999, Ressort: Sport) Gleichzeitig ist der allem Anschein nach stark grammatikalisierte Fall von Subjektkontrolle genau dadurch gekennzeichnet, dass die Kontrollbeziehung hier Argumente involviert, die im Matrixbzw. Komplementsatz die thematische Rolle des Agens tragen. Intuitiv k ann man von zwei entgegengesetzten Strategien sprechen: Zur Erreichung von Kontrollbedingungen kann die Grammatik einerseits darauf setzen, die Ansprüche an die Agentivität des logischen PRO-Subjekts herabzusetzen, um bezüglich der Wahl des kontrollierenden Arguments erweiterte Optionen zu schaffen. Andererseits kann die Grammatik darauf setzen, durch Manipulation der Struktur so etwas wie eine „ideale“ Kontrollkonfiguration zu erreichen, die eben durch die jeweilige Agentivität des kontrollierenden und des kontrollierten Arguments charakterisiert ist und deren typische Instantiierung Subjektkontrolle ist. Schlagende Beispiele für die letztere Strategie geben (15) und (16), die via Passivierung des zur Klasse der Antikontrollverben gehörenden Matrixprädikats formal dem Subjektkontrollstrukturmuster entsprechen, allerdings die für reguläre (vs. unper- 10 „Nicht-agentivisch“ meint, dass das Subjekt an der im Prädikat ausgedrückten Handlung bzw. dem ausgedrückten Zustand nicht bewusst und willentlich teilhat. Als Test kann Imperativformierung fungieren, die im Falle nicht oder wenig agentivischer Prädikate zweifelhaft ist, vgl. (i). (i) Sage/ *Wisse die Antwort! Patrick Brandt unter Mitwirkung von Felix Bildhauer 222 sönliche) Passivierung notwendige Bedingung der argumentstrukturellen Präsenz eines direkten Objekts wenigstens oberflächlich nicht erfüllen. 11 (15) Meine Spieler werden gefordert, selbstständig zu sein, mitzudenken und mit zu verschieben. (Rhein-Zeitung, 21.1.2000; Ein Studiendirektor will in die Oberliga) (16) So werden die Tiere gefordert, Strategien zu entwickeln, um an die Nahrung zu kommen . (Rhein-Zeitung, 21.8.2007; Affen: Spass bei der Futtersuche) Ein Ansatz, der die zentrale Rolle der Agentivität für Kontrollkonstruktionen gerade im Kontext von Kontrollwechsel betont und der von den Gegebenheiten im Deutschen im Vergleich zum Englischen ausgeht, ist der von Panther und Köpcke (1993), den wir hier kurz darstellen. 12 Nach Panther und Köpcke (1993) sind vor allem zwei Parameter für die Regelung von Kontrollverhältnissen wesentlich. Direkt an den zuletzt dargestellten Sachverhaltskomplex anschließend betrifft der erste Parameter den Grad der Agentivität des im Infinitiv unausgedrückt bleibenden Subjekts. Das PRO-Subjekt im Beispiel in (17) etwa weist einen hohen Agentivitätsgrad auf, das PRO-Subjekt in Beispiel (18) mit passiviertem Komplementsatz dagegen einen niedrigen Agentivitätsgrad. (17) Unternehmer Dietiker hat jedoch zugesichert, Personal zu übernehmen. (Die Südostschweiz, 22.8.2006; Mystery Park in Interlaken soll verkauft werden) (18) Zum Motiv sagte Marx, der mutmaßliche Täter habe seiner Mutter vor den tödlichen Messerstichen vorgehalten, vernachlässigt worden zu sein. (Berliner Zeitung, 7.8.2002; 32-jähriger Mann ersticht eigene Mutter, S. 20) Der zweite Parameter betrifft die Herstellung einer Rollenidentität zwischen dem unausgedrückt bleibenden Subjekt des Infinitivkomplements und einem Argument des Matrixsatzes, wobei diese wiederum immer auf dem Konzept 11 Tatsächlich realisieren Antikontrollstrukturen die für Passivierung einschlägige Strukturkonfiguration, sofern sie wie hier postuliert Akkusativobjektkontrolle mit einem nur oberflächlich unausgedrückten Akkusativargument realisieren, vgl. den vorherigen Abschnitt sowie insbesondere Abschnitt 3.3. 12 Agentivität ist natürlich für viele andere grammatische Regularitäten einschlägig, insbesondere für die Abbildung semantischer auf syntaktische Strukturen. Eines der wenigen unzweifelhaften sprachübergreifenden Prinzipien besteht darin, dass das semantisch agentivischere Argument einer transitiven Beziehung als Subjekt realisiert werden muss. Im Rahmen der von transitiven Strukturen ausgehenden Protorollenansätze (Dowty 1991 für das Englische; Primus 1999 für das Deutsche) ist das Agens (und mithin Subjekt) dasjenige Argument, das überhaupt positiv definiert ist, im Gegensatz zum Patiens/ Thema (und mithin Objekt), das in gewissem Sinne nicht mehr ist als eben ein Nicht-Agens. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 223 der Agentivität beruht. Mit Panther und Köpcke (1993) weisen Kontrollverben eine semantische Rolle „prospektives Agens“ zu; Subjektkontrollverben sind dann diejenigen Kontrollverben, die diese Rolle an das grammatische Subjekt (im Aktivsatz) zuweisen, Dativobjektkontrollverben sind diejenigen Kontrollverben, die die Rolle des prospektiven Agenten an das Dativargument zuweisen etc. 13 Im folgenden Beispiel ist die Stadt das prospektive Agens; das eingebettete PRO-Subjekt weist einen hohen Agentivitätsgrad auf und wird entsprechend mit dem prospektiven Agens identifiziert. (19) Die Stadt hat dem Spediteur zugesichert, ein Gleis zu verlegen von der Halle zur Oberhafenbahn, die unter der Pfeilerbahn, auf der die ICE-Züge gen Süden rollen, entlang führt. (die tageszeitung, 9.1.2010; Kein Ort des Erinnerns, S. 35) Zusammengefasst können Kontrollstrukturen nach Panther und Köpcke (1993) einer bestimmten Idealkonfiguration mehr oder weniger entsprechen - diese Idealkonfiguration besteht in der Kontrolle eines semantisch agentivischen PRO-Subjekts durch ein prospektives Agens, wobei die Zuweisung dieser prospektiven Agensrolle lexikalisch geregelt ist: Ist das Subjekt das prospektive Agens, resultiert eine Subjektkontrollstruktur; ist ein Objekt das prospektive Agens, resultiert eine Objektkontrollstruktur etc. Ein niedrigerer Agentivitätsgrad von PRO eröffnet alternative Möglichkeiten der Kontrolle z.B. durch ein Matrixargument, das die Rolle des Nutznießers oder evtl. auch des Patiens innehat (Panther/ Köpcke 1993, S. 95-96). Die Attraktivität der zu-Komplementierung unter Kontrolle einmal angenommen (vgl. den folgenden Abschn.) und angesichts der in diesem Abschnitt skizzierten und einander offenbar entgegengesetzten Strategien zur Erreichung einer Kontrollstruktur durch a) eine (möglicherweise mit grammatischen Mitteln herbeigeführte) „Idealkonfiguration“ (Subjektkontrolle) gegenüber b) einer „Herabsetzung der Standards“ durch die Zulassung weniger agentivischer eingebetteter Subjekte ist zu fragen, welche der Strategien stärker in Richtung zu-infiniter Komplementrealisierung wirkt (vgl. Abschn. 4.2, 4.3). 13 Man kann vielleicht sagen, dass „prospektive Agentivität“ nichts anderes ist als Agentivität in einer möglichen Welt, die durch die Verbsemantik und eventuell hinzukommende grammatische Parameter wie Tempus und Modus etc. bestimmt bzw. eingeschränkt wird. Die infrage stehende mögliche Welt ist eine, in der die durch das Matrixverb kodierte Handlung glückt bzw. von Erfolg gekrönt ist, vgl. z.B. die folgenden Beispiele und Paraphrasen: (i) Abt hatte versprochen, in Hockenheim zu fahren. (Nürnberger Nachrichten, 10.7.2000; Die Äbte üben sich in Gelassenheit, S. 22) ‘In einer Welt, in der Abt sein Versprechen hält, fährt er in Hockenheim.’ (ii) Vor wenigen Minuten habe ich General Clark befohlen, die Nato-Luftoperation zu unterbrechen. (St. Galler Tagblatt, 11.6.1999; Nato stoppt Luftangriffe) ‘In einer Welt, in der General Clark den Befehl des Sprechers ausführt, bricht General Clark die Nato-Luftoperation ab.’ Patrick Brandt unter Mitwirkung von Felix Bildhauer 224 2.4 Explizitheit, Eindeutigkeit und Ökonomie des Ausdrucks zu-Komplemente sind zeichenseitig ärmer als dass-Komplemente: Sie weisen weder grammatische Tempusnoch Modusmarker auf und lizenzieren keinen overten Subjektausdruck. Der Ausdruck eines Subjekts und die Kodierung von Tempus und Modus hängen zusammen: Nur dann gibt es ein nominativisches Subjekt, wenn Finitheit gegeben ist. Eine plausible Idee bezüglich der Beziehung zwischen zu-Komplementen und dass-Komplementen besteht darin, dass zu-Komplemente durch eine Art Tilgung aus dass-Komplementen abzuleiten sind: 14 Unter Identität des Subjekts des Komplementsatzes mit einem Matrixargument ist es möglich und unter der Maßgabe ökonomischen Ausdrucks (siehe unten) eventuell auch präferabel, das referenzidentische Subjekt nicht nochmals auszudrücken; die zu-infinitivische Realisierung leistet (u.a.) genau dies und ist daher unter Vorliegen von Kontrolle die prinzipiell zu bevorzugende Strukturkonfiguration. In dieser Richtung schreibt Eisenberg in der zweiten Auflage des „Grundriss der Deutschen Grammatik“ (1989, S. 379) mit Blick auf Verben wie versuchen, beabsichtigen oder versäumen: 15 Nur ein Infinitivkomplement und kein dass-Satz steht bei einer Reihe von Verben mit intentionaler Bedeutung […]. Die vom Subjekt bezeichnete Person will oder will nicht die Handlung ausführen, die im Komplement genannt ist. Von der Bedeutung des Matrixverbs her ist es nicht möglich, im Komplement ein anderes Subjekt zu haben als im Matrixsatz. Eisenberg formuliert hier den in der jüngeren Literatur einflussreichen Gedanken, dass ursprünglich aus Bedingungen des Sprachgebrauchs erwachsende Prinzipien, die die Ökonomie des Ausdrucks betreffen, auch innerhalb der Kerngrammatik eine zentrale Rolle spielen können. Ein entsprechendes Ökonomieverständnis geht zurück auf Grices (1975) Maxime der Art und Weise, die informell wie in (20) gefasst werden kann. (20) Sei gerade so explizit wie nötig! (20) ist seinem Ursprung nach ein pragmatisches Prinzip, das unter bestimmten Umständen auch missachtet werden kann (vgl. z.B. Levinson 1983, S. 102, 2000, S. 137-138; Horn 1984, 1989, S. 197ff.). So mögen unabhängige Gründe unter Umständen für einen erhöhten Kodierungsaufwand, d.h. hier eine dassfinite Realisierung des Komplementsatzes vis-a-vis der rein semantisch betrachtet vergleichbaren Leistung bzw. Eindeutigkeit einer alternativen zu-infiniti- 14 Vgl. für eine frühe Darstellung des Tilgungsgedankens Bech (1983, S. 31ff.). 15 In neueren Darstellungen werden entsprechende Verben „inhärente Kontrollverben“ genannt, da ihre Verwendung in aller Regel mit Kontrolle einherzugehen scheint (vgl. Stiebels 2010). Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 225 vischen Realisierung, sprechen. 16 Gleichzeitig finden wir Varianten von (20) im Kern moderner grammatischer Theorien insbesondere generativer Prägung wieder. Reinhart (2006) plädiert für ein syntaktisch-semantisches Schnittstellenprinzip, das informell in (21) wiedergegeben ist. (21) Die Verwendung eines Ausdrucks X ist nur dann erlaubt, wenn es keinen Ausdruck Y gibt, sodass X und Y dasselbe bedeuten und Y einfacher ist als X. Mit der Beziehung „dasselbe bedeuten“ sind grundlegende Schwierigkeiten verbunden. 17 Im hier verhandelten Zusammenhang ist erwähnenswert, dass bestimmte Quasi-Koreferenzbeziehungen tatsächlich nur mittels dass-finiter Komplemente kodierbar sind. Dazu gehören z.B. bestimmte Teil-Ganzes- Beziehungen oder auch Koreferenzbeziehungen mit Possessoren, die nicht durch infinitivische Komplementierung ausgedrückt werden können. Diesem Umstand wurde insofern Rechnung getragen, als solche Beziehungen nicht als Koreferenz angesehen und annotiert wurden, wodurch die entsprechenden Strukturen aus dem direkten Vergleich mit infinitivischen Kontrollstrukturen herausfallen. Insofern die Wirksamkeit eines Prinzips wie (21) in den Bereich der Pragmatik fällt bzw. pragmatischen Ursprungs ist, erwarten wir, dass es auch „ausgebeutet“ werden kann, d.h., dass seine Verletzung zur Erreichung bestimmter kommunikativer Zwecke möglich ist. Wenn die Wahrung von Ausdrucksökonomie ein strikt grammatisches Gebot wäre, würden wir vorhersagen, dass die Verwendung eines finiten Satzkomplements unter Koreferenz des eingebetteten Subjekts unter prinzipieller Wohlgeformtheit der infinitivischen Realisierungsalternative unzulässig wäre. Dem ist aber nicht so, wie Beispiele wie die folgenden zeigen. (22) Ich habe ihm aber oft vorgeworfen, dass er zu wenig aus seinem Talent gemacht hat. (Niederösterreichische Nachrichten, 11.8.2008; Die Niederlage kann zum Sieg werden, S. 51) 16 Man denke etwa an ikonizitätsbasierte Prinzipien, nach denen markierte Kodierung regelmäßig mit markierter Bedeutung einhergeht, siehe die zitierte Literatur. Eine Annäherung an die Frage, was „markierte Bedeutung“ im Einzelfall meint, wird in der Regel eine aufwendige manuelle Überprüfung des Gebrauchszusammenhangs auch über den lokal angrenzenden Kontext hinaus implizieren, die hier höchstens ausnahmehaft geleistet werden kann. Vgl. aber Abschnitt 4.4.2 unten. 17 Mit Frege (1892, S. 27) zu sprechen: „Zu einer allseitigen Erkenntnis der Bedeutung würde gehören, daß wir von jedem gegebenen Sinne sogleich angeben könnten, ob er zu ihr gehöre. Dahin gelangen wir nie.“ Patrick Brandt unter Mitwirkung von Felix Bildhauer 226 (23) Auf die Tabelle schauen wir nicht, sagte Tremmel, wir haben uns geschworen, dass wir jetzt Stuttgart besiegen. (Berliner Zeitung, 26.2.2008, Ressort: Sport; Aufregung im Kopf) Dass zu-Komplemente ausdrucksseitig ökonomischer sind als dass-Komplemente scheint hinreichend klar. Andererseits sind zu-Komplemente konzeptuell eventuell aufwendiger, indem die in dass-Komplementen explizit kodierte Information auf anderem, je nach Umständen inferenziellem oder diskursivkontextuellem Wege festgeschrieben werden muss. 18 Wenn man allerdings mit Levinson (2000, S. 29) davon ausgeht, dass artikulatorischer Aufwand gegenüber konzeptuell-inferenziellem Aufwand kostspielig ist, gelangt man zu der übergreifenden Hypothese in (24). (24) Wenn dass-Komplement und zu-Komplement (in einem bestimmten Kontext) bedeutungsseitig dasselbe leisten, wird das zu-Komplement gewählt. In einem für die vorliegende Studie wegweisenden Papier begreift Rapp (2015) „bedeutungsseitig dasselbe leisten“ als in den Dimensionen Tempus, Modus und Subjektinterpretation gleich eindeutig sein: Grundlegend ist, dass zu-Infinitive aufgrund ihrer infiniten Flexion in mehrfacher Hinsicht unspezifischer sind als dass-Sätze: zum einen bzgl. der temporalen und modalen Interpretation, zum anderen bzgl. der Interpretation des impliziten Subjekts. Meine These ist, dass sie vor allem dann als Satzkomplemente auftreten, wenn das einbettende Prädikat Eindeutigkeit bzgl. dieser Faktoren herstellt. Je leichter die semantischen Korrelate der fehlenden Flexionsmerkmale erschließbar sind, desto adäquater ist der zu-Infinitiv. Rapp nimmt anhand von Belegen mit dass-Komplementen quantifizierte Eindeutigkeit als Prädiktor für die zu-Komplementierung, d.h., je häufiger die Belege mit dass-Komplement bezüglich ihrer temporalen oder modalen Interpretation bzw. bezüglich einer Kontrollbeziehung eindeutig sind, desto häufiger sollten insgesamt zu-Komplemente erscheinen. 19 Während die Betrach- 18 Wir würden erwarten, dass sich die Abstimmung zwischen zeichenseitiger und konzeptueller Komplexität entlang der Dimension Schriftlichkeit versus Mündlichkeit verschiebt, indem die Notwendigkeit der Verarbeitung in Echtzeit in der Mündlichkeit gegen konzeptuell aufwendige Konstruktion zu sprechen scheint. Eine ausführliche Untersuchung solcher möglicherweise modalitätsbedingten Unterschiede sprengt den Rahmen dieser Studie, allerdings spielen zugehörige Überlegungen eine Rolle in der Diskussion bestimmter offenbar ausnahmehafter Realisierungen weiter unten in Abschnitt 4.4. 19 Rapps (2015) empirische Basis besteht aus mittels des TreeTagger-Archivs innerhalb von COSMAS II durchgeführten Stichproben, die Strukturen mit bestimmten Konversationsverben enthalten. Eindeutigkeit wird von Rapp (2015) als das Überwiegen einer bestimmten Spezifizierung hinsichtlich der betrachteten Eigenschaft (also als Abwesenheit diesbezüglicher Ambiguität) interpretiert. In der temporalen Dimension wird unterscheiden zwischen den Aus- Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 227 tung der Dimensionen Tempus und Modus unter Rapps Interpretation von Eindeutigkeit keine klaren Hinweise liefert, konstatiert Rapp einen Zusammenhang zwischen der Häufigkeit des Vorliegens einer Kontrollbeziehung innerhalb der Belege mit dass-Komplementen und der Häufigkeit der zu- Komplementierung insgesamt. Auf Rapps Arbeit aufbauend überprüft Wöllstein (2015) in einer korpusgestützten Studie konkret die folgenden Hypothesen: (H) Konstruktionen, deren Semantik die koreferente Interpretation des eingebetteten Subjekts mit einem Argument des Matrixsatzes erlaubt, weisen zu-infinite Satzkomplemente auf. (H‘) Konstruktionen, deren Semantik die Identifikation des eingebetteten Subjekts mit einem Argument des Matrixsatzes verbietet, weisen dass-finite Satzkomplemente auf. Unter für H einschlägige Konstruktionen fallen insbesondere Strukturen, die durch aus der Literatur bekannte Kontrollverben projiziert werden. Unter für H‘ einschlägige Konstruktionen fallen insbesondere Strukturen, die durch sogenannte Antikontrollverben projiziert werden (siehe oben). Wöllstein vergleicht durch Akkusativobjektkontrollverben (bitten, zwingen) projizierte Strukturen mit durch Antikontrollverben (anordnen, kritisieren) projizierten Strukturen und zeigt, dass sie sich entlang H und H‘ deutlich voneinander unterscheiden: zu-Komplemente sind verglichen mit dass-Komplementen bei Akkusativobjektkontrollverben in hochsignifikanter Weise überrepräsentiert und umgekehrt bei Antikontrollverben in hochsignifikanter Weise unterrepräsentiert. Die zugrundeliegenden Belege sind dabei allerdings nicht auf ihre Einschlägigkeit hin überprüft noch auf die tatsächlich vorliegenden Koreferenzbeziehungen annotiert (vgl. unten Abschn. 3.1). Insgesamt liefert Wöllsteins Arbeit Evidenz für die Hypothese, dass Kontrolle zu-Komplementierung begünstigt. Darüber hinaus findet Wöllstein unter einer alternativen Interpretation von „Eindeutigkeit“ innerhalb der Dimension Modus in den Rapp’schen Daten Hinweise darauf, dass die Häufigkeit konjunktivischer Markierung innerhalb der Belege mit dass-Sätzen mit einer insgesamt häufigeren zu-Komplementierung korreliert: Verben, deren dass-Komplemente häufig konjunktivisch realisiert werden, zeigen insgesamt eine Tendenz zur zu-Komplementation. zu-Infinitive sind im Allgemeinen ohne weitere Markierung für modale Interpretationen offen (vgl. z.B. Holl 2010); dass Infinitive in der modalen Dimension nicht festgelegt sind, prädestiniert sie unter einer richtungen „prospektiv“, „simultan“ und „anterior“. Eindeutigkeit in der Dimension „Modus“ wird als Überwiegen indikativischer bzw. konjunktivischer Realisierung angesehen. Patrick Brandt unter Mitwirkung von Felix Bildhauer 228 Ökonomieperspektive für bestimmte Verwendungskontexte, die unter finiter Realisierung weiteren Kodierungsaufwand nötig machen würden. Die Arbeit von Rapp et al. (2017) liefert weitere empirische Evidenz dafür, dass Kontrolle die zu-Komplementation begünstigt. 20 Allerdings stellen die Autoren der Idee der Motivation durch Kontrolle (und evtl. Ökonomie) einen weiteren Gesichtspunkt gegenüber, den sie „lexikalische Trägheit“ nennen. Lexikalische Trägheit besteht, wenn Sprecher sich angesichts insgesamt selten auftretender alternativer Möglichkeiten gewohnheitsmäßig verhalten: „Sprecher bleiben, unabhängig vom Kontext, zumeist bei der Variante, die sie normalerweise benutzen.“ Wenn z.B. in Konstruktionen mit einem bestimmten Verb insgesamt überwältigend häufig dass-Komplemente realisiert werden, wirkt lexikalische Trägheit in Richtung der dass-Komplementierung auch, wenn die kontextuellen Bedingungen, insbesondere das Vorliegen von Kontrolle, die zu-Komplementierung ermöglichen würden. Ihre zentrale Hypothese formuliert einen positiven verbspezifischen Zusammenhang zwischen dem Vorliegen von Kontrolle insgesamt und der Realisierung eines zu-Komplements (vgl. Rapp et al. 2017): Je häufiger in Sätzen mit einem Matrixverb V semantische Kontrolle vorliegt, umso häufiger wird in Sätzen mit V und einem Satzkomplement das Komplement als zu-Infinitiv ausgedrückt. (Rapp et al. 2017, S. 218) 2.5 Zentrale Hypothese und weitere Fragestellungen Wir rücken den Einflussfaktor Kontrolle in das Zentrum der Untersuchung. Dafür spricht neben den bereits vorliegenden Ergebnissen auch der Umstand, dass sich Kontrollmuster gegenüber bestimmten temporalen oder modalen Interpretationsmöglichkeiten durch eine relativ klare Identifizierbarkeit auszeichnen. Indem Kontrolle über die Interpretation eingebetteter Subjekte spricht, schließt sie Aspekte der temporalen bzw. modalen Interpretation des Komplementsatzes auch in gewissem Sinne mit ein, bzw. die Festlegung hinsichtlich eines expliziten oder impliziten Subjekts bedeutet auch Festlegungen hinsichtlich Tempus bzw. Modus. Verstehen wir Tempus- und Modusinformation im modelltheoretischen Sinne als Anzeiger der zur Evaluierung propositionaler Gehalte heranzuziehenden Zeiten oder Welten, so gilt in aller Regel, dass eben nur solche Zeiten oder Welten infrage kommen, zu denen der außersprachliche Bezug des Subjekts gewährleistet ist. Nicht zuletzt werden Kontrollphänomene seit Jahrzenten in der Literatur mit relativ einheitlichen Begriffen beschrieben, die im Hinblick auf Daten, wie sie hier erhoben und betrachtet werden, Unterscheidungen liefern, auf deren Basis sich Vorhersagen machen lassen. 20 In Rapp et al. (2017) wird Kontrolleindeutigkeit nicht mehr als Überwiegen einer bestimmten Art von Kontrolle, sondern als Vorliegen von Kontrolle überhaupt angesehen. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 229 Unter ausdrücklicher Betonung der Suche nach konkreten Motivationen für spezifische Realisierungsformen spitzen wir unsere zentrale Hypothese zu: (25) Wenn Kontrollbedingungen vorliegen, wird ceteris paribus zu-infinitivisch komplementiert. Die Generalisierung in (25) erfasst damit so etwas wie den unmarkierten Fall, der eintritt, wenn nichts spezifisch anderes gefordert ist. Gesondert zu begründen wären insbesondere Vorkommen dass-finiter Komplemente bei Vorliegen von Kontrolle. Die Hypothese ist verbunabhängig formuliert und damit auch offen für Einflussgrößen jenseits lexikalischer Einträge; wie wir in Abschnitt 2.3 bereits gesehen haben, können grammatische Operationen wie Passivierung oder Modalisierung Einfluss auf die Kontrollbedingungen ausüben (vgl. ausführlicher Abschn. 4.3 unten). Zum Teil verknüpft mit der Frage, ob sich die Korrelation von Kontrolle und zu-Komplementierung durch die Überprüfung der hier formulierten zentralen Hypothese erhärten lässt, zum Teil auch über sie hinausgehend ergeben sich die folgenden generelleren linguistischen Forschungsfragen: - Kann die zuvs. dass-Alternation analog zu anderen Argumentstrukturalternationen für die Inventarisierung grammatisch relevanter semantischer Eigenschaften und Beziehungen fruchtbar gemacht werden? - Sollte bezüglich der Teilhabe an der hier untersuchten Alternation zwischen notwendigen Bedingungen (im Sinne Levins 1993) einerseits und spezifische Ausprägungen begünstigenden Eigenschaften andererseits unterschieden werden, und wie? - Sollten verschiedene Typen von Kontrolle unterschieden werden, und welche? Welche Beziehungen bestehen gegebenenfalls zwischen einzelnen Typen? - Wird die Annahme verschiedener Verbklassen durch die Betrachtung der Variation zwischen zuvs. dass-Komplementen gestützt bzw. kann die Betrachtung dieser Variation bei der Definition von Verbklassen helfen? - Welchen Einfluss haben grammatische Faktoren auf die dassvs. zu-Komplementation, und wie interagieren sie mit lexikalischen Festlegungen (Motiviertheit vs. Trägheit)? - Welche Eigenschaften haben semantisch anzusetzende, aber morphosyntaktisch unausgedrückte Subjekte (viz. PRO)? Gibt es Hinweise auf deren inhärente Agentivität oder ist PRO semantisch unterbestimmt? Es ist klar, dass einzelne Fragen mehr oder weniger stark aufeinander bezogen sind - die Unterscheidung zwischen für spezifische Ausprägungen notwendigen und diese lediglich verstärkenden (oder schwächenden) Bedingungen ist Patrick Brandt unter Mitwirkung von Felix Bildhauer 230 zum Beispiel eng verknüpft mit den für unausgedrückte („logische“) Subjekte anzusetzenden Eigenschaften (Abschn. 2.3, 4.3), gleichzeitig ist sie eventuell relevant für die derzeit wieder engagiert diskutierte Frage, ob wesentliche Teile der Grammatik überhaupt in einem strengen Sinne regelgeleitet sind oder ob wir es mit einem Gemenge sich im Gebrauch verfestigender Tendenzen zu tun haben. Aus heuristischer Perspektive ist es allemal sinnvoll, die übergeordnete systemlinguistische Frage darin zu sehen, ob sich größere Teile der betrachteten natürlich vorkommenden Sprachproduktion auf ein beschränktes Inventar von Elementen und Mustern ihrer Kombination zurückführen lassen und welche dies sind. 3. methodische aspekte Die vorliegende Untersuchung ist hypothesengeleitet und nimmt daher vornehmlich solche Daten in den Blick, die für die in Anschlag gebrachten Hypothesen besonders einschlägig erscheinen. Wie bei aller analytisch-empirischen Arbeit gibt es eine Wechselwirkung zwischen Theorie und Empirie: Vom Standpunkt einer Ausgangshypothese werden Beobachtungen an den Daten gemacht, die eventuell zu Anpassungen der Hypothese führen, was wiederum dazu führt, ganz bestimmte Aspekte in den Daten genauer zu betrachten oder eventuell zunächst nicht gesondert beachtete Daten in den Blick zu nehmen bzw. spezifisch zu gewichten. Ein solches Vorgehen beinhaltet zahlreiche Einzelentscheidungen, die oft zunächst arbiträr anmuten, sich im weiteren Verlauf allerdings als keineswegs harmlos erweisen können, und sei es, weil bestimmte Daten, deren Relevanz man zu einem späteren Zeitpunkt zu sehen meint, nicht zuletzt aus Gründen der Machbarkeit zuvor aus dem Blick geraten sind. Mit Bech (1983, S. 4, Schreibung übernommen) können wir sagen: Man findet im material anhaltspunkte für gewisse hypothesen, die darauf die beobachtungsarbeit in dem sinne beeinflussen, daß das weitere material u.a. im hinblick auf die nachprüfung dieser vorläufigen hypothesen eingesammelt und erforscht wird. Auf grundlage des erweiterten materials werden nun die ursprünglichen annahmen korrigiert, und es kommen eventuell neue hinzu; … Das Feld der Beobachtung ist auf den in der Literatur gut etablierten und abgegrenzten Phänomenbereich von Kontrollstrukturen bestimmten Typs eingeschränkt (vgl. Abschn. 2.1). Ein Teil dieser Kontrollstrukturen ist anhand oberflächlicher Eigenschaften, insbesondere anhand des Vorkommens bestimmter Lemmata in oberflächlich definierbaren Vorkommenskontexten im Korpus auffindbar. Insofern suchtechnisch bedingte Einschränkungen für den Großteil der betrachteten Teilbereiche gleichermaßen gelten, darf gehofft werden, dass die Datenauswahl qua Abdeckung der relevanten Phänomentypen einigermaßen exhaustiv und qua Abdeckung der die Phänomentypen instantiierenden Token repräsentativ ist. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 231 Die Klassen von Lemmata, die Ausschnitte aus einer zunächst rein strukturbasierten Extraktion identifizieren, werden zunächst vorausgesetzt. Die korpuslinguistische Betrachtung der Distribution der Lemmata und die Variation ihrer Auftretenskontexte liefert Anhaltspunkte zur teilweisen Neuordnung der zunächst in Anschlag gebrachten Klassen bzw. lässt evtl. eine Ordnung entlang der beobachtbar begrenzten vorkommenden Strukturtypen präferabel erscheinen. Die Ordnung der Daten ist ebensowenig unschuldig wie ihre Auswahl, sondern konstitutiv für den Blick auf den Untersuchungsgegenstand. Quantitativ-statistische Auswertungen korpuslinguistisch erhobener Daten involvieren zuallererst Vergleiche. In einem allgemeinen Format werden Daten vom Typ X und Daten vom Typ Y hinsichtlich einer Eigenschaft P oder Eigenschaften P und Q verglichen. X und Y und P und Q können verschiedener Natur sein: Es kann sich um Datensätze und ihre Qualität (z.B.: Recall, Präzision, Größe, Ausgewogenheit), um Hypothesen und ihre Vorhersagekraft oder insbesondere um Häufigkeiten bestimmter Muster in Abhängigkeit von bestimmten als mögliche Einflussgrößen betrachteten Merkmalen handeln - die Häufigkeiten sind das, was man abhängige Variable nennt; die Einflussgrößen das, was man unabhängige Variable (oder Prädiktorvariable) nennt. Das grundlegende Argument verläuft folgendermaßen: Die Häufigkeit des Auftretens von X in Kombination mit Y in Kontext Z ist im Vergleich mit der Frequenz des Auftretens von X‘ in Kombination mit Y in Kontext Z (höchst)wahrscheinlich nicht zufällig. Y stellt wahrscheinlich einen Faktor dar, der das Auftreten von X positiv beeinflusst (oder das von X‘ negativ). Wesentlich ist die Schaffung einer „gerechten“ Datenbasis in dem Sinne, dass die Belege sich möglichst nur in der oder den zu untersuchenden Variablen unterscheiden und sich ansonsten möglichst ähneln sollten. Dabei müssen Kompromisse gemacht werden: Je mehr möglicherweise relevante Eigenschaften methodisch kontrolliert werden, desto kleiner wird die Datenbasis. Je mehr Variation bezüglich möglicherweise relevanter Eigenschaften in den Vergleichen zugelassen wird, desto weniger sicher kann man sich der Relevanz der eigentlich interessierenden Eigenschaft sein. Idealerweise sollten bei den jeweiligen Vergleichen alle unabhängigen Variablen kontrolliert werden, also denselben Wert haben, bis auf diejenigen, deren möglicher Einfluss auf die abhängige Variable gerade untersucht wird. In vielen Fällen würde dies allerdings dazu führen, dass die Zahl der verglichenen Fälle zu gering ist, um - gerade unter Zuhilfenahme statistischer Methoden - zu belastbaren Ergebnissen zu gelangen. In der Praxis bedeutet dies, dass Variation bezüglich bestimmter unabhängiger Variablen zugelassen werden muss; vorzugsweise natürlich nur dann, wenn diese nach aller Wahrscheinlichkeit und Erfahrung keinen Einfluss auf die Ausprägung der abhängigen Variablen hat. Patrick Brandt unter Mitwirkung von Felix Bildhauer 232 Der aus der strukturalistischen Linguistik stammenden Strategie der Minimalpaarbildung, bei der einzelne Merkmale unter Konstanthaltung möglicher anderweitiger Einflussgrößen isoliert werden, steht die kaum zu leugnende Tatsache entgegen, dass letztlich in aller Regel verschiedene Faktoren im Spiel sind und miteinander interagieren. Lineare statistische Modelle (vgl. Abschn. 4.2) ermöglichen die Betrachtung der Wirksamkeit verschiedener Faktoren (Prädikatorvariablen) in Abhängigkeit voneinander; sie sprechen nicht über die Wahrscheinlichkeiten, mit denen Faktoren in Isolation in Richtung der Ausprägung der abhängigen Variablen wirksam sind. Gleichzeitig sollten die Variablen, deren jeweiliger Einfluss untersucht wird, im logischen Sinne voneinander unabhängig sein, d.h., die Ausprägung einzelner unabhängiger Variablen darf nicht von den Ausprägungen anderer unabhängiger Variablen bestimmt werden. Je nach Sachlage können vermeintlich je voneinander unabhängige Variablen jedoch sehr wohl in Abhängigkeitsbeziehungen zueinander stehen; im Bereich des Kontrollwechsels (vgl. Abschn. 2.3) lässt sich beispielsweise beobachten, dass grammatische Operationen wie Passivierung oder Modalisierung in Abhängigkeit von der Verbklasse, bestimmt durch die von einem Verb vorherrschend projizierte Struktur, jeweils ganz verschieden wirken können. Über alle Daten hinweg können solche nur in Teilbereichen wirksamen Einflussgrößen als schwache Effekte erscheinen oder sich gar nicht signifikant niederschlagen, während sie sich auf den Bereich ihrer Wirksamkeit eingegrenzt unter Umständen als starke oder absolute Effekte präsentieren können. Zur Erhellung von nur für Teilbereiche der Daten einschlägigen Zusammenhängen ist es notwendig, spezifische Ausschnitte aus den Daten herauszunehmen und an die lediglich in lokalen Bereichen beobachtbare Systematik heranzuzoomen (vgl. Abschn. 4.3, 4.4). 3.1 Extraktion und Annotation Alle dieser Studie zugrundeliegenden korpuslinguistischen Befunde, die in eine quantitativ-statistische Auswertung eingingen, basieren auf einer Extraktion aus dem mit dem TreeTagger-Tagset annotierten Teil der Korpusgrammatik- Datenbank (KoGra-DB, vgl. Bubenhofer/ Konopka/ Schneider 2014, S. 79ff.), die am 30.1.2014 durchgeführt wurde und ungefiltert zunächst insgesamt etwas über eine Million Satztoken-Belege enthielt (im Folgenden: Erstextraktion). Die KoGra-DB basiert auf dem Deutschen Referenzkorpus (DeReKo), das am Institut für Deutsche Sprache (IDS) in Mannheim beheimatet ist und zum Zeitpunkt der Extraktion etwa 8 Milliarden Token enthielt; die KoGra-DB bestand zum Zeitpunkt der Extraktion aus etwa 4 Milliarden Token in 200 Millionen (genau 200.303.766) Satztoken. Grundlage der Extraktion bildete eine strukturbasierte Suche nach relevanten Mustern. Zur Erreichung einer vertretbaren Präzision durch eine entsprechende Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 233 Einschränkung des Suchraums nutzten wir dabei den Umstand, dass die einschlägigen Komplementsatzstrukturen in jenen Fällen (weitestgehend) adjazent zum sie selegierenden lexikalischen Verb erscheinen, in denen das lexikalische Verb als Partizip Perfekt realisiert ist und entsprechend in der rechten Satzklammer erscheint. Für den zu-infinitivischen Komplementationstyp wurde dabei zwischen Nachfeldstellung (199.876 Belege) und Mittelfeldstellung (27.734 Belege) unterschieden; dass-finite Satzkomplemente können nur im Nachfeld erscheinen. Die Suchmuster sind in (26) wiedergegeben. 21 (26) a. PartPerf, (X Y Z) zu-Infinitiv b. zu-Infinitiv PartPerf c. PartPerf, dass Die rohen Ergebnisse der Erstextraktion sind in der folgenden Tabelle 2 wiedergegeben; die ein spezifisches ein Satzkomplement selegierendes Verb aufweisenden Belege werden dabei jeweils zu einem Type zusammengefasst (d.h., z.B., sämtliche Belege mit leugnen bzw. geleugnet). Anzahl Token Anzahl Types zu-Infinitive im Nachfeld 240.578 4.570 zu-Infinitive im Mittelfeld 31.812 1.101 dass-Sätze (im Nachfeld) 826.857 5.966 tab. 2: Belegzahlen Erstextraktion aus der kogra dB vom 30.1.2014 Die Tabelle zeigt, dass die Belege mit finiten dass-Satzkomplementen auf der Ebene der Token zahlenmäßig klar überwiegen, während das Verhältnis zwischen infinitivischer und finiter Komplementierung auf der Ebene der Types ausgeglichener ist. Die überwältigende Mehrzahl der infinitivischen Satzkomplemente ist im Nachfeld positioniert; insgesamt erscheint lediglich etwas mehr als jeder zehnte Infinitiv im Mittelfeld. Die Positionierung im Mittelfeld ist eine Bedingung für die sogenannte kohärente (abbzw. zusammenhängende) Konstruktion von Infinitiven, die gegenüber der inkohärenten (selbstständigen bzw. unzusammenhängenden) Konstruktion den Sonderfall darstellt 21 X, Y und Z sind Variablen über Worttoken, d.h., in (a) können zwischen 0 und drei Wörter zwischen dem dem Partizip Perfekt nachfolgenden Komma und der zum Infinitiv gehörigen Form zu erscheinen. In den anderen Fällen ist die Intervention lexikalischen Materials ausgeschlossen: zwischen einer zu-infinitivischen Verbform im Mittelfeld und dem Partizip Perfekt in der rechten Satzklammer kann ebensowenig lexikalisches Material erscheinen wie zwischen dem Partizip Perfekt und der einen finiten Nebensatz einleitenden Form dass im Nachfeld. Man beachte, dass damit auch evtl. einschlägige Komplemente aus der Suche ausgeschlossen wurden, die in Nebensätze eingebettet sind. Finite Satzkomplemente können nur im Nachfeld erscheinen. Patrick Brandt unter Mitwirkung von Felix Bildhauer 234 und deren Möglichkeit von bestimmten semantischen Eigenschaften der selegierenden Verben und der daraus resultierenden strukturellen Realisierung abzuhängen scheint, vgl. dazu Brandt, Trawiński und Wöllstein (2016). Es ist klar, dass durch die Einschränkungen der Suchmuster eine Vielzahl einschlägiger Beispiele nicht erfasst wurde, d.h., dass von einem mäßigen Recall auszugehen ist. Für den überwiegenden Teil scheint dies die betrachteten Verben in ähnlichem Maße zu betreffen; bei näherer Betrachtung werden jedoch Unterschiede offenbar, die zu einer Verzerrung des Bildes führen können. So gibt es einschlägige Konstruktionen, die in den mittels Partizip II kodierbaren Tempora nicht oder kaum vorkommen, wie etwa unpersönliche expletivreflexive Konstruktionen wie in (27) und (28), die nicht aus der Erstextraktion stammen, sondern mit einer separaten COSMAS-Suche gefunden wurden. 22 (27) Es empfiehlt sich eine Beratung mit dem Zahnarzt, welche Zahnseide geeignet ist. (Hannoversche Allgemeine, 21.9.2009, S. 18; Einmal täglich Zahnseide) (28) Es verbietet sich, dem Urteil in einem Strafprozess vorzugreifen. (FOCUS, 27.1.2014, S. 32-36; „Ich bin seit eh und je von milder Beharrlichkeit“) Andererseits gibt es bestimmte Verben, die aufgrund von Homonymie vom Suchmuster erfasst wurden, allerdings z.B. in präsentischen Konstruktionsweisen vorkommen; ein Beispiel ist versichern wie in (29). (29) Die Ruhe ausströmende Künstlerin versichert, ‚intuitiv zu arbeiten‘. (Süddeutsche Zeitung, 13.4.1995, S. 2; „Ekstatische Sprengkraft“) 22 Auch an anderer Stelle wird deutlich, dass Tempus für bestimmte Realisierungsmuster eine entscheidende Rolle spielt; inwiefern verschiedene Tempora mit der Häufigkeit der hier im Zentrum stehenden infiniten vs. finiten Satzkomplementrealisierung bei einzelnen Verben zusammenhängen, müsste separat untersucht werden. Unser Eindruck ist, dass das Tempus des Matrixsatzes für den prototypischen Gebrauch der untersuchten Verben keine große Rolle spielt. Demgegenüber verlangen insbesondere solche alternativen Realisierungsmuster, die nicht reflexivisch interpretierte Reflexivmorphologie involvieren, (i) sowie modalähnliche Strukturen (ii) tendenziell nach präsentischer Realisierung, ebenso Strukturen mit nicht agentivischen Subjekten (iii). Das jeweils erste Beispiel der Paare illustriert diesen speziellen Gebrauch gegenüber der prototypischen Verwendung im jeweils zweiten Beispiel. (i) Es empfiehlt sich, … vs. ? ? Es hat sich empfohlen, … (i‘) Peter empfiehlt (ihr)… vs. Peter hat (ihr) empfohlen … (ii) Es verspricht, vs. ? ? Es hat versprochen, … (ii‘) Peter verspricht (ihr)… vs. Peter hat (ihr) versprochen … (iii) Die Situation legt (es) nahe, dass… vs. ? Die Situation hat es nahegelegt, dass … (iii‘) Peter legt ihr nahe… vs. Peter hat ihr nahegelegt … Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 235 Entsprechende Verben haben unter (hier nicht notwendiger) Adjazenz (dass- Satz) bzw. hinreichender Nähe (zu-Infinitiv) zum Satzkomplement einen „Vorteil“ gegenüber der überwiegenden Zahl der Verben, bei denen solche Homonymie nicht gegeben ist; daher wurden solche Belege manuell ausgemustert und gingen nicht in eventuell statistisch ausgewertete Vergleiche ein. 23 Aus der Erstextraktion wurden auf der Basis von anhand der Literatur und anhand manueller Sichtung der Belege erstellter Verblisten im Wesentlichen zwei verschiedene Datensätze erstellt. Datensatz I, der Wöllstein (2015) zugrundeliegt, umfasst Belege mit Akkusativobjektkontrollverben (bitten, zwingen), inhärent reflexiven Verben (sich anstrengen, sich weigern) und Antikontrollverben (anordnen, missbilligen). Datensatz II umfasst Belege mit Subjektkontrollverben (versprechen, drohen), Dativobjektkontrollverben (empfehlen, raten) und wiederum Antikontrollverben; Einzelheiten zur Auswahl der Typen von Kontrollverben sowie zu den Verblisten sind Gegenstand des nächsten Abschnitts. Datensatz I wurde in Wöllstein (2015) weitestgehend ungefiltert verwendet, d.h., es fand keine manuelle Sichtung der Belege auf ihre Einschlägigkeit hin statt. Die Belege wurden auch nicht in ihrer Gesamtheit annotiert, es lag lediglich die bereits durch die Erstextraktion gegebene Information vor, ob es sich um einen Beleg mit zubzw. dass-Komplement handelt. Für die vorliegende Studie wurde allerdings eine Zufallsstichprobe von 400 Belegen mit Akkusativobjektkontrollverben und inhärent reflexiven Kontrollverben aus Datensatz I entnommen, genauer betrachtet und annotiert, um eine Vergleichbarkeit mit den Daten des aufwendig bereinigten und annotierten Datensatzes II herzustellen. Die Stichprobe diente auch dazu, die Präzision von Datensatz I insgesamt zu ermitteln; von den 400 Belegen waren 326 oder 81,5% einschlägig. Datensatz II wurde von vornherein und in seiner Gesamtheit aufwendig manuell bereinigt und annotiert. Die maximale Trefferzahl pro Verblemma wurde auf 400 begrenzt, um Verzerrungen durch den Einfluss besonders frequenter, aber möglicherweise lexikalisch-idiosynkratischer Types einzudämmen. Im Zuge der Annotation wurden 3.001 Belege ausgemustert, die allerdings zum Teil zur Beleuchtung unabhängiger Fragestellungen wieder herangezogen wurden (vgl. Abschn. 4.5). Die folgende Übersicht präsentiert die Belegzahlen der Datensätze bzw. Stichproben im Vergleich. 23 Die anderen Fälle sind: akzeptieren, beantragen, begrüßen, erlauben, garantieren, genehmigen, gestatten, gewähren, honorieren, kritisieren, missbilligen, respektieren, untersagen, veranlassen, verlangen, versichern, verurteilen, verwehren. Insgesamt 1.054 Belege aus dem betroffenen Datensatz von 10.518 Belegen wurden entsprechend annotiert. Patrick Brandt unter Mitwirkung von Felix Bildhauer 236 Datensatz I Stichprobe DS I Datensatz II Belege insgesamt 76.762 400 10.691 gültige Belege 62.561 ± 3,8% 24 326 7.690 tab. 3: Belegzahlen datensatz i, Stichprobe datensatz i und datensatz ii Die folgende Liste gibt die wichtigsten Merkmale wieder, die für Datensatz II annotiert wurden; für die Stichprobe aus Datensatz I wurde nur der Ausschnitt von Merkmalen annotiert, der in das gemischte lineare Modell (vgl. Abschn. 4.2) einging. 25 - Gültig: der Beleg ist gültig - Tempus: es liegt eine Partizipialkonstruktion vor - Matrix.IO: der Matrixsatz enthält ein indirektes Objekt - Matrix.von.PP: der Matrixssatz enthält ein durch eine von-Präpositionalphrase ausgedrücktes Agens - Matrix.von.PP2: der Matrixsatz enthält eine vom aktivischen Verb selegierte von-Präpositionalphrase in Argumentfunktion - Klasse: das Matrixverb gehört zur Klasse der Subjektkontrollverben, Dativobjektkontrollverben oder Antikontrollverben - Kompsatz.non.agent: das Prädikat des Komplementsatzes ist nicht agentivisch - KOREF: das Subjekt des Komplementsatzes koreferiert mit einem Argument des Matrixsatzes aus der Menge: Subjekt, direktes Objekt, indirektes Objekt, Präpositionalkomplement, 0 - Korrelat: der Matrixsatz weist ein Korrelat für den Komplementsatz auf - Lemma: das lexikalische Prädikat des Komplementsatzes - Matrix.hat.Subjekt: der Matrixsatz hat ein Subjekt - Komplementsatz.hat.Subjekt: der Komplementsatz hat ein Subjekt - Teil: der Subjektreferent des Komplementsatzes steht in einer Teil-Ganzes- Beziehung zu einem Argument des Matrixsatzes - G: das Subjekt des Komplementsatzes koreferiert mit einem Element des Matrixsatzes, das kein Argument des Matrixprädikats ist - reflexiv: das Matrixprädikat ist reflexiv 24 Bei einer Irrtumswahrscheinlichkeit von 5%. 25 Um eine möglichst einheitliche und fehlerfreie Annotation bei einer Vielzahl von Annotatorinnen zu erreichen, wurde ein Annotationsschema (‘flowchart’) angefertigt, mittels dessen die verschiedenen relevanten Merkmalkodierungen systematisch erfasst werden können. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 237 Hinzu kommen bestimmte ohnehin annotierte Metadaten sowie Bemerkungen oder Erläuterungen zu den Merkmalen oder über sie hinaus; dazu gehört die Form der Korrelate oder eventuelle Besonderheiten der Koreferenzbeziehung sowie gegebenenfalls Gründe für die Ausmusterung des Belegs. Innerhalb der verschiedenen Typen von Koreferenz (viz. Kontrolle) haben kontrollierende Präpositionalphrasen einen Sonderstatus. Ausdrucksseitig handelt es sich dabei in aller Regel um optional realisierbare Phrasen mit der Präposition von, die einerseits (und ganz überwiegend) als thematische Ergänzungen von (Antikontroll-)Verben wie fordern oder verlangen erscheinen („Matrix.von.PP“) und andererseits in passivierten Strukturen das agentivische Argument realisieren („Matrix.von.PP2“). Da jeweils eine enge thematische Beziehung zum Verb besteht und die Ausdrücke sich syntaktisch eher wie Ergänzungen (Komplemente) als wie Angaben (Adverbiale) verhalten, fassen wir sie in einer Klasse „Präpositionalkomplement (PK)“ zusammen. 3.2 Kontrolltypen und Verbklassen Kontrolle ist ein in der Literatur vieldiskutiertes Phänomen, vgl. Abschnitt 2 und für rezenten Überblick Lyngfelt (2009) oder Stiebels (2015). Die hier vorgenommene Beschränkung des Untersuchungsbereichs hat den Vorteil, dass wir uns (mit Einschränkungen für Antikontrollverben) auf relativ gut etablierte Klassen von für Kontrolle einschlägigen Verben stützen können, die im Zuge des Abgleichs mit den in der Erstextraktion vorliegenden Belegen zu bezüglich der verschiedenen Klassen quasi-exhaustiven Listen führen. Für die regelmäßig unterschiedenen Typen von Verben im Kontext der Kontrolle sind dies die folgenden: (30) Subjektkontrollverben (SU-KV): anbieten, drohen, garantieren, schwören, versichern, versprechen, zusagen, zusichern (31) Dativobjektkontrollverben (DO-KV): abraten, abverlangen, anbieten, anraten, auftragen, ausreden, befehlen, beibringen, empfehlen, erlauben, genehmigen, gestatten, gewähren, nahebringen, nahelegen, offerieren, untersagen, verbieten, vorhalten, verwehren, vorschlagen, vorschreiben, vorwerfen, zugestehen, zuraten (32) Akkusativobjektkontrollverben (AO-KV): abhalten, anflehen, anhalten, animieren, anregen, anspornen, anstiften, antreiben, auffordern, aufrufen, auserkiesen, autorisieren, beauftragen, bedrängen, befähigen, beknieen, beschuldigen, beschwören, bewegen, bitten, drängen, einladen, ermahnen, ersuchen, hindern, motivieren, nötigen, überreden, verpflichten, zwingen Patrick Brandt unter Mitwirkung von Felix Bildhauer 238 (33) Inhärent reflexive Kontrollverben (IR-KV): angewöhnen, anstrengen, aufmachen, beeilen, befassen, bemühen, bereiterklären, durchringen, entschließen, freuen, getrauen/ trauen, schämen, scheuen, überlegen, vornehmen, weigern (34) Antikontrollverben (A-KV): abnicken, absegnen, akzeptieren, anerkennen, anordnen, beantragen, begrüßen, billigen, fordern, gutheißen, honorieren, kritisieren, missbilligen, respektieren, tolerieren, veranlassen, verurteilen, würdigen Die folgende Tabelle 4 zeigt die Type/ Token-Verhältnisse innerhalb des aufwendig manuell annotierten Datensatzes II, wobei die Tokenzahlen den Belegen insgesamt entsprechen (vs. nur gültige Belege). Lemmata (Types) Belege (Token) Type/ Token- Verhältnis Subjektkontrollverben (SU-KV) 8 2.875 0,0028 Dativkontrollverben (DO-KV) 25 4.235 0,006 Antikontrollverben (A-KV) 17 3.084 0,0055 tab. 4: type / token - Verhältnisse der einzelnen Verbklassen (datensatz ii) Es ist deutlich, dass das Verhältnis zwischen Types und Token bei Subjektkontrollverben deutlich niedriger ist als in den anderen Klassen; die Tokenzahlen sind dabei über die Klassen hinweg relativ ausgewogen. Keine genauen Tokenzahlen liegen für Akkusativobjektkontrollverben bzw. inhärent reflexive Kontrollverben vor; eine Schätzung auf Basis der Stichprobe von 400 Belegen deutet auf sehr hohe Tokenzahlen. 26 Lemmata (Types) Belege (Token) Akkusativobjekt-Kontrollverben (AO-KV) 30 33.821 ± 3,8% Inhärent reflexive Kontrollverben (IR-KV) 16 13.089 ± 3,8% tab. 5: types und geschätzte tokenzahlen datensatz i Die einzelnen Klassen seien kurz charakterisiert, bevor wir auf mit der Einteilung in Verbklassen verbundene Probleme zu sprechen kommen. 26 Hier wurden die absoluten rohen Trefferzahlen mit dem ermittelten Präzisionswert von 81,5 v.H. multipliziert, vgl. Abschnitt 3.1. Die Trefferzahl schwankt mit einer Irrtumswahrscheinlichkeit von 5% innerhalb des Konfidenzintervalls von ± 3,8%. Dabei ist für AO-KV zu bedenken, dass die projizierten Strukturen eventuell zwischen dem Akkusativobjektkontrollmuster und dem Antikontrollmuster schwanken können. Auch IR-KV projizieren zum Teil alternative Argumentstrukturmuster. Vgl. die Abschnitte 3.2 und 3.3. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 239 Subjektkontrollverben gelten als Musterbeispiel für grammatisch regulierte Kontrolle induzierende Verben und auch als besonders frequent im Gebrauch (Høyem 2015). 27 In Panther und Köpckes (1993) Begriffen werden in (prototypischen) Subjektkontrollstrukturen verantwortliche (agentivische) Matrixsubjekte mit verantwortlichen (agentivischen) eingebetteten Subjekten identifiziert. Subjektkontrollverben erlauben neben den zubzw. dass-Komplementen dativische Nominalphrasen in Argumentfunktion, die im Hinblick auf die hier betrachtete Variation in interessanter Weise mit grammatischen Operationen wie z.B. Passivierung interagieren (siehe unten Abschn. 4.3). Dativobjektkontrollverben projizieren (prototypisch) Strukturen, in denen (wiederum in Panther und Köpckes Begriffen) ein verantwortliches dativisches Matrixargument mit einem verantwortlichen (agentivischen) eingebetteten Subjekt identifiziert wird. Die projizierten Strukturen sind oberflächlich betrachtet weitestgehend parallel zu denen von Subjektkontrollverben und auch in ähnlicher Weise syntaktisch manipulierbar; die einschlägigen grammatischen Operationen haben allerdings in semantischer Dimension deutlich verschiedene Effekte. Akkusativobjektkontrollverben wirken als die stabilsten Infinitivselegierer. Die von Akkusativobjektkontrollverben projizierten Strukturen scheinen im Kern wenig manipulierbar, z.B. muss das im Regelfall kontrollierende Akkusativargument nahezu obligatorisch overt realisiert werden. Dativische Nominalphrasen in Argumentfunktion sind nicht möglich. Passivierung des Matrixsatzes führt zu einer Struktur analog zu derjenigen, die prototypisch von Subjektkontrollverben projiziert wird. Inhärent reflexive Verben erscheinen wesentlich als Varianten von Akkusativobjektkontrollverben; durch die reflexive Struktur lässt sich allerdings letztlich nicht entscheiden, ob es sich um Subjekt- oder Akkusativobjektkontrolle handelt. Antikontrollverben präsentieren sich als semantisch konvers zu Subjektkontrollverben, indem sie bei oberflächlich paralleler Konstruktionsweise die Koreferenz zwischen Matrixsubjekt und eingebettetem Subjekt gerade verbieten. Eine genauere Betrachtung ihrer Syntax zeigt, dass sie strukturell betrachtet Akkusativobjektkontrollverben ähnlich sind bzw. eventuell sogar dasselbe Strukturmuster instantiieren (vgl. besonders Abschn. 3.3). 27 Eine vergleichende Untersuchung polnischer und deutscher Kontrollmuster zeigt den Sonderstatus von Subjektkontrollstrukturen deutlich auf (Brandt/ Trawiński/ Wöllstein 2016): Im Polnischen interagiert die Interpretation von Subjektkontrollstrukturen systematisch mit dem komplementiererähnlichen grammatischen Element żeby, dessen Präsenz ähnlich wie ein switch reference marker Koreferenz zwischen übergeordnetem und eingebettetem Subjekt ausschließt. Patrick Brandt unter Mitwirkung von Felix Bildhauer 240 Einerseits lässt sich die Zugehörigkeit eines Lemmas zu einer bestimmten Klasse anhand des Typs der Kontrolle im Regelfall gut rechtfertigen. Dies zeigt eine Erhebung anhand des Datensatzes II, die für die Klasse der Subjekt- und Dativobjektkontrollverben die Anzahl der dem unmarkierten Fall (kein Passiv im Matrix- oder Komplementsatz, realisiertes Dativobjekt, kein Modalverb im Komplementsatz) entsprechenden Belege vergleicht, die jeweils gar keine Kontrolle oder Subjektkontrolle oder Dativobjektkontrolle instantiieren. Die insgesamt 1.264 einschlägigen Fälle präsentieren sich wie folgt, wobei „0“ für keine Kontrolle „DO“ und „SU“ für Kontrolle durch das Dativobjekt oder durch das Subjekt stehen; unter „Klasse“ steht die genuine Zuordnung zu den Dativobjektbzw. Subjektkontrollverben. Die Zahlen zeigen, dass in der überwältigenden Mehrheit der Fälle die genuine Zuordnung zu einer Verbklasse dem deutlichen Überwiegen des entsprechenden Kontrolltyps im unmarkierten Fall entspricht. Sofern so etwas wie eine Einteilung in Verbklassen gefragt ist, können Untersuchungen des vorliegenden Typs zu deren Definition beitragen. Aus der Tabelle ist z.B. ersichtlich, dass das Verb anbieten entgegen seiner ursprünglichen Klassifikation als Dativobjektkontrollverb im unmarkierten Fall überwiegend das Subjektkontrollmuster realisiert; auch in anderer Hinsicht zeigt sich, dass anbieten eine Art Grenzfall zwischen Subjekt- und Dativobjektkontrollverb darstellt, vgl. dazu Abschnitt 3.3. Verblemma 0 DO SU Klasse abraten 0 78 1 DO-KV abverlangen 0 9 0 DO-KV anbieten 1 28 56 DO-KV anraten 0 10 1 DO-KV auftragen 0 56 0 DO-KV ausreden 0 4 0 DO-KV befehlen 0 123 2 DO-KV beibringen 0 78 2 DO-KV drohen 0 2 31 SU-KV empfehlen 0 64 0 DO-KV erlauben 0 45 1 DO-KV garantieren 0 0 1 SU-KV genehmigen 0 6 0 DO-KV gestatten 0 34 0 DO-KV nahelegen 0 86 0 DO-KV offerieren 0 1 1 DO-KV Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 241 Verblemma 0 DO SU Klasse schwören 0 1 76 SU-KV untersagen 0 51 0 DO-KV verbieten 0 40 0 DO-KV versichern 0 0 27 SU-KV versprechen 1 0 40 SU-KV verwehren 0 7 1 DO-KV vorhalten 0 25 0 DO-KV vorschlagen 6 40 9 DO-KV vorschreiben 0 11 1 DO-KV vorwerfen 0 108 0 DO-KV zugestehen 0 10 1 DO-KV zuraten 0 7 0 DO-KV zusagen 1 0 27 SU-KV zusichern 0 1 52 SU-KV tab. 6: Subjektkontrollverben und dativobjektkontrollverben - Verbklassen und tatsächlich projizierte Struktur (datensatz ii) Andererseits gibt es innerhalb der ursprünglich angesetzten Verbklassen ausgezeichnete Untergruppen, die an spezifischen Argumentstrukturalternationen teilhaben. Die alternativen Argumentstrukturen gehören in der Regel zu einem anderen Kontrolltyp. Wir sehen dies am deutlichsten, wenn wir vom Kontrolltyp ausgehen und prüfen, wie einzelne nach dem kontrollierenden Element sortierte Kontrollmuster durch die verschiedenen Verbklassen realisiert werden. Die geringen Belegzahlen bei Akkusativobjektkontrolle bzw. Akkusativobjektkontrollverben, zu denen wir hier auch inhärent reflexive Verben schlagen, rühren daher, dass hier nur die Stichprobe von insgesamt 400 Belegen mit Akkusativobjektkontrollverben bzw. inhärent reflexiven Verben zugrundeliegt. Gesamt SU-KV AO-KV DO-KV A-KV Subjektkontrolle (SU-K) 1.333 1.127 54 60 92 Akkusativobjektkontrolle (AO-K) 266 0 106 0 160 Dativobjektkontrolle (DO-K) 1.465 51 0 1.403 11 Präpositionalkomplementkontrolle (PK-K) 80 5 0 1 74 tab. 7: Verbklassen und kontrollstrukturtypen Patrick Brandt unter Mitwirkung von Felix Bildhauer 242 Während einzelne Kontrolltypen wie Subjektkontrolle von Strukturen mit allen Typen von Kontrollverben instantiiert werden, sind andere Kontrolltypen, insbesondere Akkusativobjektkontrolle, auf bestimmte Kontrollverben beschränkt. 28 Im Bereich der Akkusativobjektkontrolle besteht so etwas wie eine „Arbeitsteilung“ zwischen Antikontrollverben einerseits und Akkusativobjektkontrollverben andererseits, wie die Visualisierung verdeutlicht. abb. 1: Verbklassen und kontrollstrukturtypen 28 Nicht in Anschlag gebracht werden dabei über Reflexivierung hergestellte Strukturen mit Dativobjektkontrollverben, die ein insgesamt anderes Fügungsmuster instantiierten und z.B. keine Dativargumente mehr lizenzieren. Das Muster kommt bei Verben wie anbieten und empfehlen vor, vgl. (i). (i) Der Frührentner habe sich angeboten, diese zu waschen, weshalb die Schülerin tags drauf in Begleitung ihrer Freundin bei ihm vorsprach, um die Jacke abzuholen. (Rhein-Zeitung, 11.4.2009; Wieder Haft für einen Sexualtäter) Im reflexiven Muster ist die zu-infinite Realisierung des Komplements hier offenbar erzwungen. Auch an anderer Stelle lässt sich beobachten, dass es einen Zusammenhang zwischen Reflexivierung und zu-infiniter Komplementierung gibt; so scheint das reflexive Beispiel in (ii) mit dass-Komplement hochmarkiert, vgl. dagegen das nicht reflexivische Beispiel in (iii). (ii) Dort, wo man sich gestattet, Zeit zu haben, kann man fast immer erleben, dass sich die Dinge langsam wandeln. (Mannheimer Morgen, 14.12.2005; Die Trauerwege als Lebenswege gehen) (iii) Jockel Fuchs hat uns sogar gestattet, dass wir das Mainzer Rad in unser Wappen aufnehmen, erinnerte sich Stumm, der seit Vereinsgründung den Vorsitz innehat. (Rhein-Zeitung, 19.7.2002; Trasse führt mitten durch den Gemeinschaftsraum) Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 243 Namentlich die hier zuerst als Antikontrollverben geführten Verben veranlassen, verurteilen und kritisieren treten frequent dann im Akkusativobjektkontrollmuster auf, wenn die durch sie projizierte Struktur ein Pronominaladverb beinhaltet, vgl. (35), (36) und (37). 29 (35) Geldsorgen hätten ihn dazu veranlasst, die Tankstelle zu überfallen, sagte er im Polizeiverhör aus. (Nürnberger Nachrichten, 19.1.2006; Räuber stellte sich der Polizei - 17-Jähriger mit Hilfe eines Überwachungsvideos identifiziert) (36) So wurde ein Ladendieb dazu verurteilt, 10.000mal zu schreiben: „Ich werde nie wieder fremder Leute Eigentum stehlen.“ (Neue Kronen-Zeitung, 12.2.199; USA: Ungewöhnliche Strafen für Kriminelle, S. 6) (37) Wir werden viel dafür kritisiert, retro zu sein. (Berliner Zeitung, 7.3.2000) Das Auftreten eines Pronominaladverbs bei Realisierung mit Akkusativargument weist darauf hin, dass das Satzkomplement in diesen Fällen durch die präpositionale Projektion angeschlossen wird. Das Auftreten entsprechender als Korrelate fungierender Pronominaladverbien ist gerade für Akkusativobjektkontrollverben typisch, wo das Pronominaladverb in der Regel die finale Interpretation des Komplements sichtbar macht. Im Einzelnen haben wir bei Akkusativobjektkontrollverben: (38) davon abhalten, darum anflehen, dazu anhalten, dazu animieren, dazu anregen, dazu anspornen, dazu anstiften, dazu antreiben, dazu auffordern, dazu aufrufen, dazu auserkiesen, dazu autorisieren, damit beauftragen, bedrängen (dazu drängen), dazu befähigen, darum beknieen, beschuldigen (dafür schuldig erklären), dazu beschwören, dazu bewegen, darum bitten, dazu drängen, dazu einladen, dazu ermahnen, darum ersuchen, daran hindern, dazu motivieren, dazu nötigen, dazu überreden, dazu verpflichten, dazu zwingen Sofern Antikontrollverben, für die diese Möglichkeit besteht, mit Korrelat - in der Regel: dafür - und einem Akkusativargument erscheinen, sehen sie oberflächlich wie Akkusativobjektkontrollverben aus. Wir haben im Einzelnen: (39) anerkennen, anordnen, dafür anprangern, begrüßen, dafür bemängeln, billigen, dafür entschuldigen, dafür honorieren, dafür kritisieren, dafür respektieren, tolerieren, verlangen, dafür würdigen, zurückweisen 29 Die Matrix-passivischen Beispiele in (36) und (37) instantiieren oberflächlich Subjektkontrolle, das kontrollierende Argument ist jedoch zugrundeliegend ein Objekt. Patrick Brandt unter Mitwirkung von Felix Bildhauer 244 Im Gegensatz zu Akkusativobjektkontrollverben und Antikontrollverben treten Dativobjektkontrollverben oder Subjektkontrollverben prinzipiell nicht mit Pronominaladverbien auf. Lediglich raten erlaubt die Varianten davon abraten, (dazu) raten. Bei Subjektkontrollverben finden wir damit drohen als einzigen Fall, der mit pronominalem Korrelat auftritt. Die beobachteten Muster entsprechen natürlich dem unabhängig beobachtbaren Selektionsverhalten der die verschiedenen Kontrollmuster prototypisch projizierenden Verben: Akkusativobjektkontrollverben und Antikontrollverben lizenzieren Präpositionalobjekte, aber nicht Subjektkontrollverben oder Dativobjektkontrollverben. 3.3 Alternationen und zu - Index Mit Levin (1993) weist die gemeinsame Teilhabe an spezifischen Argumentalternationen auf gemeinsame Bedeutungsaspekte hin. Wie in der Einleitung dargestellt, können wir die alternative Realisierung von zuvs. dass-Komplementen als eine ebensolche, allerdings graduell ausgeprägte Argumentstrukturalternation betrachten, die gegebenenfalls einen neuen Zugang zu ansonsten eben nicht objektiv beobachtbaren Bedeutungsaspekten erschließt. Das Maß dieser graduellen Ausprägung soll der sogenannte zu-Index sein, der nichts anderes als den Quotienten aus der Zahl infiniter Komplemente (Zähler) und finiter Komplemente (Nenner) darstellt. 30 Der zu-Index bildet also das Verhältnis der Häufigkeiten von zuvs. dass-Komplementen bei einzelnen selegierenden Verben ab, und zwar unabhängig von deren Vorkommenskontext oder Interpretation. Hinweise darauf, dass homogene zu-Indexe homogene Bedeutungen reflektieren, liefert Wöllstein (2015), die auf Basis der Erstextraktion ähnliche zu- Indexe für intuitiv bedeutungsähnliche Verben ermittelt (vgl. oben Abschn. 1). Hier vergleichen wir beispielhaft die zu-Indexe von Verben, die durch die Teilhabe an bestimmten in den Daten vorkommenden Alternationen ausgezeichnet sind, jeweils vor und nach der Abtrennung der Belege, die die jeweils alternativen Strukturmuster instantiieren. Sofern zu-Index und Bedeutung korrelieren, sollten sich die zu-Indexe der einzelnen Verben durch die Abtrennung der alternativen Muster und mithin Bedeutungen realisierenden Belege annähern. Gleichzeitig kann der Vergleich den Fortschritt der Datenqualität von der Erstextraktion zum aufwendig manuell annotierten Datensatz II sichtbar machen. 30 Problematisch ist dies, wenn der Nenner 0 und damit kein möglicher Divisor ist. Wiewohl dieses mögliche Problem vorhersehbar war, konnten wir es aus Mangel an konkreten Fällen ignorieren. Der weniger gravierende Fall, dass der Zähler gleich 0 ist, wird ggf. gesondert vermerkt. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 245 Die Alternation, die wir aufgrund ihres relativ häufigen Auftretens in den Daten beispielhaft näher betrachten, 31 verbindet das Antikontroll- und das Akkusativkontrollmuster, d.h., wir haben es einerseits mit einer Struktur zu tun, die typischerweise gerade keine Koreferenzbeziehung(en) zwischen Matrix- und eingebettetem Satz involviert, und andererseits mit einer Struktur, in der das Akkusativargument des Matrixsatzes typischerweise referenzidentisch mit dem (verstandenen) eingebetteten Subjekt ist. Die Alternation lässt sich anhand des Lemmas veranlassen schematisch wie in (40) darstellen, wobei [+person] eine Beschränkung auf belebte (und mithin potenziell verantwortliche, vgl. oben Abschn. 1) Referenten signalisiert: (40) Antikontroll-Akkusativobjektkontrollalternation a. X [+person] veranlasst, dass …/ zu … b. X veranlasst Y [+person] (dazu), dass …/ zu … Beispiele sind in (41) und (42) gegeben. 31 Ein weiteres Muster, das eine nähere Betrachtung verdient und allerdings bezüglich eventueller Konsequenzen für den zu-Index aufgrund der Seltenheit einer der Varianten für die momentanen Zwecke wenig einschlägig ist, verbindet das Subjektkontrollmuster und eine modalähnliche Verwendung. An dieser Alternation nehmen teil versprechen, drohen und (mit Einschränkungen) garantieren. (i) Subjektkontroll-Modalalternation a. X [+person] verspricht (Y [+person]), dass …/ zu … b. X verspricht, zu … Die modalähnliche oder quasi-raising Variante ist weitestgehend auf präsentische Tempora beschränkt, sodass sie in den Daten praktisch nicht vorkommt. garantieren bildet aufgrund der Homonymie von Partizip II und dritter Person Präsens eine unter das Suchmuster fallende theoretische Ausnahme, die sich allerdings praktisch nicht in den Daten niederschlägt (bzw. keine gültigen Belege liefert). versprechen und drohen weisen auf Basis von Datensatz II einen ähnlichen zu-Index auf (1,03 und 1,18), während garantieren mit 0,05 einen entschieden niedrigeren zu-Index hat. Daran ist bemerkenswert, dass garantieren im Gegensatz zu versprechen oder drohen überproportional häufig mit nicht-agentivischen Matrixsubjekten vorkommt, die gerade für die modalähnliche Verwendung typisch sind. (ii) ist ein (aufgrund oben genannter Homonymie) allerdings ungültiger Beleg für die Dativobjektkontrollstruktur, (iii) und (iv) sind unabhängig mit der Google-Suchmaschine gefundene Belege für die modalähnliche Struktur. (ii) Demnach sollen Steine mit einem speziellen Zertifikat versehen werden, das sowohl dem Steinmetz als auch dem Käufer garantiert, dass dieser nicht von Kinderhand hergestellt worden ist. (Rhein-Zeitung, 1.3.2009; Baar gegen Zertifikate) (iii) Ihr Bikeurlaub im Vinschgau garantiert ein Erfolg zu werden. (http: / / zentral.it/ news lett erarchiv/ na.php? showEntry=3&selectedYear=2016, Stand: 2016) (iv) Ein Abend im „Tokio Sushi“ garantiert ein Erfolg zu werden. (https: / / groupon.de/ deals/ all-day-all-you-can-eat-im-tokio-sushi-hamburg-de-867,Stand: 2017) Patrick Brandt unter Mitwirkung von Felix Bildhauer 246 (41) Allerdings hat man veranlasst, dass Polizisten anderer Wachen und nicht nur die Wache Templin Merkels Freizeitobjekt im Auge behalten sollen. (Rhein-Zeitung, 9.2.2006; Merkels Ferienhaus sorgt für Polizisten-Knappheit) (42) Die erschütternden Erfahrungen muslimischer Bosnierinnen […] haben uns veranlaßt, unseren Ansatz zu erweitern und Flüchtlinge aus anderen Kulturkreisen und Epochen miteinzubeziehen, erzählt Frau Neuhauser. (Salzburger Nachrichten, 28.12.1998, Ressort: Österreich; Flucht, Vertreibung und Leiden) Zur Gruppe der Verben, die an diesem Muster teilhaben, gehören (dazu) veranlassen, (dazu, dafür) verurteilen und (dafür) kritisieren. 32 Die Tabelle zeigt die anhand der Erstextraktion rein lemmabasierten zu-Indexe im Vergleich mit den zu-Indexen, die unter Aussortierung der Akkusativobjektkontrollfälle ermittelt wurden. Erstextraktion: zu-Index Antikontrollverb Datensatz II: zu-Index Antikontrollverb unter Antikontrollmuster veranlassen 2.111 0.0618 verurteilen 3.85 0.05555 kritisieren 0.014 0.0112 tab. 8: antikontroll akkusativobjektkontrollalternation und zu index Die zu-Indexe unter Beachtung des realisierten Musters nähern sich deutlich an; insbesondere bewegen sich veranlassen und verurteilen, die relativ häufig im Akkusativobjektkontrollmuster vorkommen, dem relativ selten im Akkusativobjektkontrollmuster vorkommenden kritisieren an, das sich vor der Bereinigung als Ausreißer präsentierte. Wenn wir uns die Daten exemplarisch genauer ansehen, stellen wir fest, dass veranlassen bei 305 gültigen Belegen 175-mal im Antikontrollmuster (keine Koreferenz) vorkommt und 130-mal im Akkusativobjektkontrollmuster (Koreferenz des eingebetteten Subjekts mit dem direkten Objekt des Matrixsatzes). 165 der 175 Antikontrollfälle weisen ein dass-Komplement auf, 129 der 130 Akkusativobjektkontrollfälle weisen ein zu- Komplement auf. Der eine Fall mit dass-Komplement ist in (43) gegeben. 32 Darüber hinaus nehmen (dafür) respektieren und (dafür) würdigen an der Alternation teil. Die Belegzahlen sind hier niedrig und es gibt in den Daten keine Belege mit zu-Komplement, weshalb wir sie hier außer Betracht lassen. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 247 (43) Dies hat uns veranlasst, dass wir bei der vergangenen Vorstandssitzung über dieses Thema gesprochen haben. (Niederösterreichische Nachrichten, 14.8.2007; ÖVP hält am Dorfzentrum fest! , S. 25) Bei kritisieren weisen von 107 gültigen Belegen 90 keine Koreferenz auf (Antikontrollmuster) und 17 Koreferenz mit dem direkten Objekt des Matrixsatzes (unter Matrixpassivierung, die 12-mal vorkommt, ist dies das grammatische Subjekt). Bei verurteilen weisen von wiederum 107 gültigen Belegen 17 keine Koreferenz auf (Antikontrolle) und 90 Koreferenz mit dem direkten Objekt (unter Passivierung, die 48-mal vorkommt, ist dies das Matrixsubjekt). Es ist klar, dass das Vorkommen der einzelnen Verben in den verschiedenen Mustern den zu-Index je nach Häufigkeit der einzelnen Vorkommen stark beeinflussen kann: Die zu-Indexe von veranlassen und verurteilen sinken erheblich, wenn die Akkusativobjektkontrollfälle aussortiert werden, der zu-Index von kritisieren sinkt aufgrund des geringen Vorkommens der Akkusativobjektkontrollstruktur nur unerheblich. 33 Eine rein lemmabasierte Betrachtung der Daten bzw. Berechnung des zu-Indexes auf Basis der Lemmata allein kann also erheblich in die Irre führen bzw. liefert ganz andere Ergebnisse als die Betrachtung der tatsächlich realisierten Strukturmuster. Zusammenfassend können wir festhalten, dass Verbklasse und Kontrolltyp in Teilen der Daten sehr stark miteinander korrelieren: Subjektkontrollverben kommen fast ausschließlich in Subjektkontrollstrukturen vor, und Dativobjektkontrollverben sowie Akkusativobjektkontrollverben kommen fast ausschließlich in Dativobjektkontrollstrukturen bzw. Akkusativobjektkontrollstrukturen vor. Die Ausnahme bilden Antikontrollverben, die nicht selten in Akkusativobjektkontrollstrukturen vorkommen und dann ganz überwiegend zu-Komplemente realisieren, während sie im Antikontrollmuster ganz überwiegend dass-Komplemente realisieren. Der umgekehrte Fall, dass Akkusativobjektkontrollverben im Antikontrollmuster vorkommen, zeigt sich in den Daten nicht. Akkusativobjektkontrollverben verbieten in aller Regel, das Akkusativargument nicht auszudrücken. bitten bildet hier eine Ausnahme; wenn wir im Korpusbeispiel (6) aus der Einleitung das Antikontrollverb anordnen durch bitten ersetzen, erzeugen wir eine Antikontrollstruktur, vgl. (44). (44) Vor einer Woche hatte Putin initiator, i gebeten, PRO +resp, j die Terroristen zu finden und zu vernichten. Es gibt also konvergierende Evidenz dahingehend, dass Antikontrollverben und Akkusativobjektkontrollverben unter Abstraktion von oberflächlichen Gegebenheiten ganz parallele Strukturen aufweisen. Die korpuslinguistische 33 In drei der fünf Akkusativobjektkontrollfälle steht das als Korrelat fungierende Pronominaladverb dafür, siehe den letzten Abschnitt. Patrick Brandt unter Mitwirkung von Felix Bildhauer 248 Arbeit liefert gerade in diesem in der Gesamtbetrachtung zunächst eventuell randständig erscheinenden Bereich Einsichten, die den Kern des grammatischen Systems betreffen. Der Fall der Akkusativobjektbzw. Antikontrollverben deutet auch darauf hin, dass die möglichen Kontrollstrukturmuster insgesamt begrenzt sind und daher eine brauchbare Taxonomie für den untersuchten Bereich begründen können. Darüber hinaus lassen sich die verschiedenen Kontrolltypen anhand des kontrollierenden Arguments in aller Regel gut unterscheiden. Es ist daher insgesamt präferabel, diese Kontrollmuster und nicht die sie prototypisch projizierenden Verben als feste Größen in der quantitativ-statistischen Auswertung anzusetzen. Die nähere Betrachtung der genannten Alternation hat auch gezeigt, dass ein gesteigerter Annotations- und damit verbunden Klassifizierungsaufwand in bestimmten Fällen - insbesondere bei den hier als Antikontrollverben geführten Lemmata - entscheidend ist. In anderen Fällen wie dem der Subjekt- oder Dativkontrollverben spielt er scheinbar keine große Rolle, da die Verhältnisse zwischen Verbtypen und Kontrolltypen hier eindeutiger sind. 4. Einzeluntersuchungen Die in diesem Abschnitt präsentierten Einzeluntersuchungen ordnen sich in drei Bereiche: In den Abschnitten 4.1 und 4.2 geht es darum, den Einfluss von Kontrolle auf die zubzw. dass-Komplementation sozusagen aus der Vogelperspektive zu prüfen; qua Hypothese sollte das Vorliegen einer Koreferenzbeziehung zwischen einem Matrixargument und dem eingebetteten (logischen) Subjekt zu zu-Komplementation führen - der Zusammenhang zwischen Kontrolle und zu-Komplementation wird zunächst pauschal betrachtet und dann im Rahmen einer logistischen Regressionsanalyse nach verschiedenen Kontrolltypen ausdifferenziert (Abschn. 4.2). Abschnitt 4.3 zoomt in ausgewählte Bereiche der Daten hinein, um das Wirken von grammatischen Einflussgrößen auf Kontrolle und mithin zu-Komplementation zu prüfen. Grammatische Faktoren wie Passivierung oder Modalisierung sind jeweils nur für bestimmte Typen der Kontrolle und damit nur in Teilbereichen der Daten wirksam; die pauschale quantitativ-statistische Betrachtung ist für solche insgesamt niederfrequenten Phänomene wenig aufschlussreich oder kann in die Irre führen. Abschnitt 4.4 greift wiederum Teilbereiche der Daten heraus, in denen das Wirken von Faktoren jenseits von Kontrolle sichtbar wird. Beispielhaft diskutieren wir hier Phänomene, die unter der Überschrift „Stärken und Schwächen“ verhandelbar sind und in den Bereich der Pragmatik fallen. Abschnitt 4.5 schließlich behandelt den Zusammenhang zwischen Verbklassen bzw. Kontrolltypen und dem Auftreten von Korrelaten, der ein Nebenbzw. Abfallpro- Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 249 dukt der Hauptuntersuchung darstellt - es stehen hier adjektivisch-passivische Strukturen im Fokus, die aus den Untersuchungen anhand des Datensatzes II aus Gründen der Herstellung „gerechter“ Vergleiche herausgenommen wurden (vgl. Abschn. 3.1). Im Hinblick auf die Visualisierung der Ergebnisse von Erhebungen, die nur Teilbereiche der Daten betreffen, werden vornehmlich Mosaikplots verwendet, wie sie in der KoGra-R-Schnittstelle implementiert sind. 34 4.1 Kontrolle und zu - Komplemente Ein globaler Blick auf die Daten zeigt zunächst das Verhältnis zwischen den alternierenden Komplementationstypen und dem (Nicht)-Gegebensein von Kontrolle. zu-infinit dass-finit Kontrolle 2.969 901 Keine Kontrolle 590 3.069 tab. 9: kontrolle und komplementationstyp Es gibt also - wie erwartet, vgl. Abschnitt 2 - einen Zusammenhang zwischen dem Vorliegen einer Koreferenzbeziehung zwischen einem nominalen Matrixargument und zu-Komplementation dahingehend, dass eine solche Koreferenzbeziehung die zu-Komplementation wahrscheinlicher macht. Der Mosaikplot veranschaulicht, dass zu-infinite Komplemente unter Kontrolle in hochsignifikantem Maße überrepräsentiert sind, während dass-Komplemente unter Kontrolle in hochsignifikantem Maße unterrepräsentiert sind (p < 2.2e-16). Das umgekehrte Bild ergibt sich, wenn keine Kontrolle gegeben ist. Es handelt sich hierbei um einen starken Effekt, Phi ist gleich 0.6063376. 34 Vgl.: http: / / kograno.ids-mannheim.de/ index.html, Stand: 16.4.2018. Zur Interpretation von Mosaikplots vgl. Abschnitt 4.1. Patrick Brandt unter Mitwirkung von Felix Bildhauer 250 abb. 2: Mosaikplot kontrolle und komplementationstyp Mosaikplots sind folgendermaßen zu interpretieren: Die Größe der Felder bildet den Anteil an der Gesamtheit der Fälle ab - alle Felder zusammen entsprechen also 100% der Fälle. Mittels standardisierter Residuen kann eine mehr oder weniger signifikante Abweichung einzelner Zellen (= Fälle mit bestimmten Merkmalskombinationen) von den statistisch erwartbaren Häufigkeiten berechnet werden. In den Mosaikplots bedeutet dunkle Einfärbung mit durchgehender Umrandung die hochsignifikante Überrepräsentation der infrage stehenden Kombination, dunkle Einfärbung mit gestrichelter Umrandung deren hochsignifikante Unterrepräsentation; hellere Einfärbung mit entsprechender Umrandung bedeutet eine nur signifikante Überbzw. Unterrepräsentation (vgl. zu Einzelheiten das Methodenkapitel in diesem Band). Der Zusammenhang zwischen Kontrolle und zu-Komplementation ist über alle Daten hinweg betrachtet stark. Dennoch gibt es, wie bereits in Abschnitt 3.2 bemerkt, innerhalb der nach Verbklassen geordneten Strukturen auffällige Unterschiede. Die folgende Tabelle zeigt die Verhältnisse zwischen Kontrolle und zu-Komplementen für die einzelnen Verbklassen. zu insgesamt (a) zu mit Kontrolle (b) Anteil von (b) an (a) DO-KV 1.724 1.465 84,9% A-KV 653 337 51,6% SU-KV 1.198 1.183 98,7% AO-KV 161 160 99,4% tab. 10: Verbklassen, kontrolle und zu komplemente Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 251 Für Strukturen mit Subjektkontrollverben oder Akkusativobjektkontrollverben bedeutet Kontrolle und Realisierung eines zu-Komplements nahezu dasselbe - es gibt also kaum Strukturen ohne Kontrolle, aber mit zu-Komplementen oder mit Kontrolle und dass-Komplementen. Strukturen mit Dativobjektkontrollverben weisen auch ohne Vorliegen von Kontrolle in geringem Maße zu-Komplemente auf; es gibt bei Strukturen mit Dativobjektkontrollverben auch einen relativ großen Anteil von Strukturen mit Kontrolle und dass-Komplementen, nämlich 376 von insgesamt 1.357 dass-Komplementfällen, was etwa einem Viertel (27 v.H.) entspricht. Etwa die Hälfte zu-infiniter durch Antikontrollverben projizierter Strukturen weist Kontrolle auf (82 von 1.427 dass-Komplementfällen oder etwa 6 v.H. weisen Kontrolle auf). Wiederum von Verbklassen ausgehend zeigt sich darüber hinaus, dass durch Akkusativobjektkontrollverben bzw. Subjektkontrollverben projizierte Strukturen bezüglich der Variation des kontrollierenden Arguments weniger flexibel sind als Dativobjektkontrollverben oder Antikontrollverben. Die Tabelle zeigt die Zahlen für Matrix-aktivische und Matrix-passivische Strukturen. M.aktiv KOREF = 1 M.passiv KOREF = 1 DO-KV 979 (922 DO, 57 SU) 481 (478 DO, 2 SU) A-KV 257 (36 SU, 160 AO, 5 DO, 56 PK) 80 (56 SU, 6 DO, 18 PK) SU-KV 1.168 (1127 SU, 35 DO) 15 (10 DO, 5 PK) AO-KV 83 (82 AO, 1 SU) 53 (SU) tab. 11: Verbklassen, kontrolle und kontrollstrukturtypen Subjektkontrollverben und Akkusativobjektkontrollverben wirken damit am stärksten festgelegt bezüglich der Form-Inhalts-Beziehung: zu-Komplementation und das Vorliegen einer Kontrollbeziehung sind nahezu eineindeutig aufeinander bezogen, und die Art der Kontrollbeziehung ist nahezu immer dieselbe. 35 Gesonderte Erwähnung verdient dabei das Faktum, dass von den 35 Die weniger erwartbaren Zahlen seien kurz kommentiert: Bei den zwei Fällen unerwarteter Kontrolle in Matrix-passivischen Objektkontrollstrukturen - die prototypische Kontrolle durch das Dativargument bleibt durch reguläres Passiv ja unberührt - handelt es sich um Fälle von sogenanntem bekommen-Passiv (vgl. z.B. „Der Peter bekommt geholfen“). Bei den 160 Fällen von Kontrolle durch DO bei Matrix-aktivischen Antikontrollstrukturen handelt es sich um die Konstruktionsweise als Akkusativobjektkontrollverb (vgl. Abschn. 3.3), die damit den Großteil der Fälle ausmacht. Die fünf unerwarteten Fälle von Kontrolle durch ein Dativobjekt involvieren allesamt das Matrixverb beantragen und kommen aus dem Schweizer Sprachraum. (i) ist ein authentisches Beispiel. Patrick Brandt unter Mitwirkung von Felix Bildhauer 252 35 Fällen von Kontrolle durch ein Dativobjekt in Matrix-aktivischen Subjektkontrollstrukturen 33 das Matrixverb anbieten involvieren, dessen Projektionen regelmäßig geteilte Kontrolle zwischen dem Subjekt und dem indirekten Objekt kodieren. Die nähere Betrachtung der verschwindend geringen Zahl der Fälle von zu-Komplementation ohne Vorliegen von Kontrolle bei Subjektkontrollverben ergibt, dass es sich durchweg um Fälle sogenannter „geteilter Kontrolle“ handelt; zählte man diese entgegen unserer Praxis als reguläre Kontrollfälle, gäbe es überhaupt keine Fälle Matrix-aktivischer Subjektkontrollverben, die bei zu-Komplementation nicht auch Kontrollstrukturen wären. Wir sehen wiederum den Sonderstatus von Subjektkontrollstrukturen, die bezüglich ihrer Syntax und Semantik ein stark uniformes Verhalten zeigen. Die genannten drei Fälle sind in (45), (46) und (47) gegeben. (45) Bereits im März hatte Renault dem maroden südkoreanischen Autoproduzenten Samsung Motors angeboten, ein 70-zu-30-Joint-Venture zu bilden. (Die Presse, 21.4.2000; Renault bestätigt die geplante Übernahme von Samsung) (46) Für den Sonntag habe ich meinem 13-jährigen Patensohn Maximilian versprochen, eine Radtour zu unternehmen. (Berliner Zeitung, 7.4.2007; Zur Beleidigung ein Schnäppchen) (47) Kritisch äußert sich Zernatto über Wirtschaftsminister Johannes Farnleitners Verhalten in der Frage der Autobahn-Doppelmaut für Kärnten: „Er hat mir zugesagt, den Konsens zu suchen.“ (Die Presse, 30.8.1996, Ressort: Inland; Windmühlen-Kampf gegen rechtes Klischee) Die drei Fälle weisen jeweils ein Dativargument auf und es handelt sich jeweils um „geteilte“ Kontrolle: der Subjektreferent und der Referent des Dativarguments fungieren gemeinsam als Subjekt des eingebetteten Prädikats. Solche Fälle wurden bei der Annotation zwar markiert, allerdings nicht als Fälle von (i) Der Zuzwiler Gemeinderat hat dem Departement beantragt, die Reviergrenzen zu belassen. (St. Galler Tagblatt, 31.5.1997, Ressort: wv-wil (Abk.); Zuzwil erhält eine Kultur- Kommission) Von den 35 Fällen von Kontrolle durch ein Dativobjekt in Matrix-aktivischen Subjektkontrollstrukturen involvieren 33 das Matrixverb anbieten, dessen Projektionen regelmäßig geteilte Kontrolle zwischen dem Subjekt und dem indirekten Objekt kodieren (siehe unten). Die übrigen Fälle involvieren einen modalisierten Komplementsatz (vgl. (ii)) oder entsprechen nicht dem Standard, vgl. (iii). (ii) Vor den letzten beiden Spielen hatte mir Trainer Muslin zugesichert, spielen zu können. (Die Südostschweiz, 6.8.2006; Eldin Jakupovic: »Ich muss jetzt vor allem geduldig sein«) (iii) Er hat ihr gedroht, sich gut zu überlegen, ob sie in Berlin aussagen soll. (Die Presse, 22.4.1998, Ressort: Sport; Stasi, Spritze, Schlammschlacht) Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 253 Kontrolle wie hier definiert (strikte Koreferenz des eingebetteten Subjekts mit einem Argument des Matrixprädikats) gezählt. In Einklang mit der These, dass Subjektkontrolle die am weitesten grammatikalisierte Kontrollkonfiguration darstellt, deuten die Daten darauf hin, dass die Wahl dieser Strukturkonfiguration sozusagen auch dazu verpflichtet, auf die Bedeutung zu zielen, für die diese Struktur spezialisiert ist. In grammatiktheoretischer Hinsicht interessant ist dabei, dass die Zahl der Belege mit zu-Komplement ohne als solche annotierte Kontrolle bei den Subjektkontrollverben unter Passivierung des Matrixprädikats steigt. Ein genauerer Blick auf die Daten lässt sehen, dass das in Passivstrukturen nur semantisch vorhandene Agensargument, das in der Aktivstruktur als kontrollierendes Argument fungiert, typischerweise aus dem Kontext erschließbar ist. Ein repräsentatives Beispiel ist (48), das Bestandteil eines Artikels mit der Überschrift „Korrupte Politiker“ ist. (48) Seit 20 Jahren wird versprochen, die Grundschulbildung zu verbessern, aber wenig ist passiert. (Nürnberger Nachrichten, 16.4.2009; Milliardenvolk geht zur Wahl - Die Republik Indien steht vor einer ungewissen Zukunft, S. 6) Wir sehen, dass das Ausgehen von Verbklassen gegenüber dem Ausgehen von Kontrolltypen für Teilbereiche der Daten - insbesondere den der Subjektkontrolle bzw. von Subjektkontrollverben projizierten Strukturen und offenbar auch den der Akkusativobjektkontrolle bzw. Akkusativobjektkontrollverben (für die allerdings nur eine Stichprobe genauer annotierter Belege vorliegt) - kaum einen Unterschied bedeutet. Im Bereich der Antikontrolle bzw. Antikontrollverben und zum Teil auch bei Dativobjektkontrolle bzw. Dativobjektkontrollverben dagegen weichen die projizierten Strukturen stärker von den durch die Verbklasse zunächst erzeugten Erwartungen ab. Wie auch in Abschnitt 3 diskutiert, empfiehlt sich über alle Daten hinweg daher das Ausgehen von Kontrollstrukturtypen, die durch das jeweils kontrollierende Argument des Matrixprädikats definiert sind und nicht durch das involvierte Matrixverb. Patrick Brandt unter Mitwirkung von Felix Bildhauer 254 4.2 Logistische Regressionsanalyse (Felix Bildhauer) Der Datensatz umfasst 7.685 Belege und wurde für die folgenden Variablen manuell annotiert: X1 KOREF Bestehen einer Koreferenzbeziehung zwischen einem Element im Matrixsatz und dem (impliziten oder expliziten) Subjekt des eingebetteten Satzes SU (Subjekt), AO (Akkusativ-Objekt), DO (Dativ-Objekt), PK (Präpositionalkomplement (von-PP)), 0 (keine Koreferenz) X2 K.MODAL Anwesenheit eines Modalverbs im eingebetteten Satz 0,1 X3 K.PASSIV Der eingebettete Satz steht im Passiv 0,1 X4 REFLEX Das Partizip im Matrixsatz tritt mit einem Reflexivpronomen auf 0,1 X5 KLASSE Verbklasse des Partizips im Matrixsatz AO-KV (Akkusativobjektkontrollverb), DO-KV (Dativobjektkontrollverb), A-KV (Antikontrollverb), SU-KV (Subjektkontrollverb) VERB Das Verblemma des Partizips im Matrixsatz (Lemma) tab. 12: kodierung der unabhängigen Variablen Modellspezifikation Die Daten werden in einer logistischen Regression mit festen und zufälligen Effekten modelliert (ein generalisiertes gemischtes Modell mit logit-Linkfunktion). Dabei wird in Abhängigkeit der verschiedenen Prädiktoren die Wahrscheinlichkeit modelliert, dass in einem gegebenen Fall ein infiniter Komplementsatz mit zu auftritt. Der Einfluss einzelner Prädiktoren (d.h. unabhängig von anderen Prädiktoren) auf diese Wahrscheinlichkeit kann dabei jedoch nicht quantifiziert werden. Stattdessen wird der Einfluss einzelner Prädiktoren auf die logarithmierte Chance, das „logit“, geschätzt. 36 Die Variabilität zwischen einzelnen Verblemmata wird hier als Randomeffekt modelliert, in Form von 36 Die Chance (odds) ist das Verhältnis der Wahrscheinlichkeit eines Ereignisses zur Gegenwahrscheinlichkeit. Nimmt man davon den natürlichen Logarithmus, erhält man log odds oder logit: Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 255 individuellen Konstanten (Intercepts) für die einzelnen Matrixverblemmata (Variable VERB). Zunächst werden alle oben genannten Variablen, mit Ausnahme der Verbklasse, als Prädiktoren verwendet. Damit ergibt sich für Modell 1 folgende Modellspezifikation: Pr (zu = 1) = logit -1 (α j + β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + β 4 X 4 ) mit α j ~ N (μ α , σ 2 ) α Dabei ist α j die vorhergesagte Konstante für Verblemma j, und die Verteilung der α j ist normal. Interpretation Tabelle 13 zeigt die geschätzten Parameter für Modell 1 (die 95%-Konfidenzintervalle lassen sich Abb. 3 entnehmen). In der linken Spalte stehen die Namen der unabhängigen Variablen und, nach dem „=“-Zeichen, eine Ausprägung der Variablen. In der mittleren Spalte steht der geschätzte Koeffizient für diese Ausprägung der Variable, also die Auswirkung der jeweiligen Ausprägung auf die log odds (und damit auch auf die Wahrscheinlichkeit) für das Auftreten eines zu-Infinitivs. Die rechte Spalte zeigt den Standardfehler der Schätzung. Das Vorzeichen lässt die Richtung des Einflusses erkennen: Bei einem positiven Koeffizienten erhöht sich die Wahrscheinlichkeit für das Auftreten eines zu-Infinitivs, bei einem negativen Wert wird die Wahrscheinlichkeit kleiner. Die Konstante (Intercept) gibt den Koeffizienten für den Basisfall an, der als eine bestimmte Kombination von Variablenausprägungen für ein durchschnittliches Verblemma festgelegt ist. In diesem Modell ist der Basisfall ein Beleg ohne Modalverb im Komplementsatz (K.MODAL = 0), ohne Passiv im Komplementsatz (K.PASSIV = 0), ohne Reflexivpronomen beim Matrixverb (REFLEX = 0) und ohne Koreferenzbeziehung zwischen einem Element im Matrixsatz und dem (expliziten oder impliziten) Subjekt des Komplementsatzes (KOREF = 0). Alle anderen Koeffizienten beziehen sich auf diesen Basisfall und geben die entsprechende Veränderung bei den logarithmierten Chancen (logits) an. Ist zum Beispiel ein Modalverb im Komplementsatz vorhanden, ist das logit gegenüber einem Fall ohne Modalverb um 4.192 kleiner und die Wahrscheinlichkeit für das Auftreten eines zu-Infinitivs damit geringer. Um wie viel geringer, lässt sich jedoch nicht unabhängig von den Ausprägungen der anderen Variablen sagen (siehe aber die Effektplots weiter unten). ( p(zu) ) log 1 ‒ p(zu) Die inverse Logitfunktion, notiert als logit -1 , überführt ein logit zurück in eine Wahrscheinlichkeit. Patrick Brandt unter Mitwirkung von Felix Bildhauer 256 Koeffizient Standardfehler p (Intercept) −1.813 0.295 8.13 ∙ 10 -10 Koref = AO 4.939 0.368 < 2 ∙ 10 -16 Koref = DO 3.522 0.149 < 2 ∙ 10 -16 Koref = PK 2.265 0.412 3.99 ∙ 10 -8 Koref = SUB 4.580 0.166 < 2 ∙ 10 -16 K.Modal = 1 −4.192 0.198 < 2 ∙ 10 -16 K.Passiv 4.269 0.352 < 2 ∙ 10 -16 Reflex = 1 -0.022 0.228 0.924 Tab. 13: Parameterschätzungen für Modell 1 abb. 3: parameterschätzungen für Modell 1 mit 95% konfidenzintervallen (bootstrap) Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 257 Bei Betrachtung der festen Effekte fällt zunächst auf, dass jede Art von Koreferenzbeziehung zwischen einem Element im Matrixsatz und dem (expliziten oder impliziten) Subjekt des Komplementsatzes die Wahrscheinlichkeit erhöht, einen zu-Infinitiv vorzufinden. Am größten ist der Einfluss für koreferente Subjekte und Objekte im Matrixsatz, aber auch bei PKs (von-PPs, vgl. Abschn. 3.1) ist er deutlich ausgeprägt. Die relativ weiten 95%-Konfidenzintervalle bei Akkusativobjekten und PKs zeigen jedoch an, dass die Schätzungen für diese beiden Ausprägungen weniger zuverlässig sind. Demgegenüber verringern Modalverben und Passivkonstruktionen im Komplementsatz deutlich die Wahrscheinlichkeit, einen zu-Infinitiv vorzufinden. Das Vorhandensein eines Reflexivpronomens beim Matrixverb wirkt sich dagegen offenbar nicht nennenswert auf die Realisierung eines zu-Infinitivs aus (der geschätze Koeffizient ist relativ klein, und das 95%-Konfidenzintervall schließt die Null ein). Abbildung 4 zeigt den Einfluss der einzelnen Prädiktoren auf die Wahrscheinlichkeit, einen zu-Infinitiv vorzufinden. Da sich der Einfluss einer Variable auf diese Wahrscheinlichkeit nicht unabhängig von den Ausprägungen der restlichen Prädiktorvariablen schätzen lässt (siehe oben), wird dabei angenommen, dass die jeweils anderen Variablen typische, d.h. für den Datensatz charakteristische Werte annehmen (vgl. Fox 2003). Abbildung 5 visualisiert den Randomeffekt. Dargestellt sind die vorhergesagten bedingten Modi der Gruppen (die individuellen Konstanten für die einzelnen Verblemmata), zusammen mit ihren 95%-Vohersageintervallen. Hierin spiegelt sich die Tendenz individueller Lemmata zur zu-Variante wider (ceteris paribus, je größer die vorhergesagte Konstante, desto höher die Wahrscheinlichkeit, einen zu-Infinitiv vorzufinden), zum anderen zeigt sich in den individuellen Konstanten auch die Menge an Evidenz, die für ein gegebenes Verblemma vorliegt (ceteris paribus liegen die Konstanten von weniger gut belegten Lemmata näher am Durchschnittswert aller Konstanten, 0). Die abgebildeten Intervalle spiegeln Unsicherheit in der Vorhersage wider: Für häufig belegte Lemmata (z.B. beantragen, 343 Belege) kann die Konstante mit größerer Zuverlässigkeit vorhergesagt werden als für schwach belegte Lemmata (z.B. einladen, 3 Belege). Patrick Brandt unter Mitwirkung von Felix Bildhauer 258 abb. 4: Einfluss der verschiedenen Variablenausprägungen auf die Wahrscheinlichkeit, einen zu infinitiv vorzufinden Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 259 abb. 5: konditionale Modi (vorhergesagte konstanten) für Verblemmata, mit 95% - Vorhersageintervallen Patrick Brandt unter Mitwirkung von Felix Bildhauer 260 Modellevaluation - Pseudo-R 2 Für klassische lineare Modelle lässt sich die Modellgüte mithilfe des R 2 -Werts beurteilen, der den Anteil der durch das Modell erklärten Varianz angibt. Für generalisierte lineare Modelle wie das oben beschriebene gibt es kein direktes Äquivalent zum R 2 -Wert. Aus diesem Grund wurden verschiedene Pseudo-R 2 vorgeschlagen, die in ähnlicher Weise die durch das Modell erklärte Varianz beziffern. Es gibt keinen Konsens darüber, welches dieser Maße zu bevorzugen ist (vgl. Long 1997; Menard 2000). Bei gemischten Modellen (wie dem oben beschriebenen) ergibt sich die zusätzliche Komplikation, dass ein Pseudo-R 2 mit oder ohne Berücksichtigung der Randomeffekte berechnet werden kann. Nakagawa und Schielzeth (2013) schlagen ein zweifaches Pseudo-R 2 -Maß vor: das marginale R 2 ist ein Maß für die durch feste Effekte erklärte Varianz, und das konditionale R 2 gibt die erklärte Varianz des gesamten Modells an. Für das oben beschriebene Modell liegt das marginale R 2 bei 0.59 und das konditionale R 2 bei 0.82, d.h., die festen Effekte allein erklären einen beachtlichen Teil der Varianz und durch die Modellierung der Varianz zwischen den Matrixverblemmata (der Randomeffekt) kann das Gesamtmodell einen Großteil der Varianz in den Daten erklären. Vorhersagequalität Ein weiteres Kriterium für die Modellevaluation ist die Vorhersagequalität. Das Modell sagt für jeden Fall eine Wahrscheinlichkeit für das Auftreten des zu-Infinitivs vorher. Diese Wahrscheinlichkeiten lassen sich auf diskrete Ereignisse (ein zu-Infinitiv tritt auf oder nicht) abbilden. Üblicherweise nimmt man dabei eine vorhergesagte Wahrscheinlichkeit von 0.5 als Schwellenwert. Die auf diese Weise vorhergesagten Fälle von zu-Infinitiven können mit den tatsächlichen Beobachtungen verglichen und der Anteil korrekt klassifizierter Fälle angegeben werden. Dieser Wert für sich genommen ist jedoch nicht sehr aussagekräftig, weil ein naives Modell schon mindestens 50% der Daten korrekt vorhersagen würde, wenn es immer die häufigere der beiden Kategorien auswählt. In unserem Datensatz kommen dass-Komplementsätze (51.39%) etwas häufiger vor als Komplementierungen mit zu-Infinitiv. Diese Baseline kann man berücksichtigen, indem man bei der Anteilsberechnung die Zahl der Fälle abzieht, die ein im obigen Sinne naives Modell korrekt klassifiziert hätte. Dieses Maß entspricht Goodman und Kruskals (1954) λ und wird gelegentlich auch als R 2AdjustedCount bezeichnet (Long 1997). Man erhält damit eine Einschätzung darüber, wie sich die zusätzlichen Prädiktoren im Model auf die Vorhersagegüte auswirken. Für das oben beschriebene Modell liegt dieser Wert bei 0.73 und ist damit relativ hoch. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 261 Der Einfluss der Verbklasse Als Alternative zum obigen Modell 1 lässt sich ein alternatives Modell 2 spezifizieren, das zusätzlich zu den bisher verwendeten Prädiktoren auch die Verbklasse mit einbezieht. Die Verbklasse fungiert dabei als Prädiktor auf der zweiten Ebene des hierarchischen Modells, d.h., sie stellt zusätzliche Information bereit, um die lemmaspezifische Konstante α j vorherzusagen. Modell 2 hat die Form: Pr (zu = 1) = logit -1 (α j + β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + β 4 X 4 ) mit α j ~ N (γ 0 + γ 1 X 5 , σ 2 ) α Wie zuvor ist dabei ist α j die Konstante für Verblemma j. Im Unterschied zum einfacheren Modell 1 werden hier jedoch die α j durch eine Regression modelliert, die mit X 5 (Verbklasse) einen weiteren Prädiktor beinhaltet. Tabelle 14 zeigt die Parameterschätzungen für Modell 2. Koeffizient Standardfehler p (Intercept) −0.013 0.847 0.98745 Koref = AO 4.755 0.385 < 2 ∙ 10 -16 Koref = DO 3.474 0.149 < 2 ∙ 10 -16 Koref = PK 2.287 0.412 2.87 ∙ 10 -8 Koref = SU 4.584 0.167 < 2 ∙ 10 -16 K.Modal = 1 −4.189 0.198 < 2 ∙ 10 -16 K.Passiv = 1 −4.258 0.352 < 2 ∙ 10 -16 Reflex = 1 −0.047 0.229 0.83804 Klasse = DO-K −0.981 0.937 0.29519 Klasse = A-K −3.132 1.005 0.00183 Klasse = SU-K −3.040 1.074 0.00464 tab. 14: Mehrebenenmodell mit Verbklasse als zusätzlichem prädiktor für die lemmaspezifischen konstanten; die ausprägung ao k (akkusativobjektkontrollverb) liegt auf dem intercept Auffällig sind die relativ hohen Standardfehler bei den geschätzten Koeffizienten für die Verbklasse. Bei Modell 2 liegt Nakagawa und Schielzeths (2013) Pseudo R 2 für die festen Effekte über dem des einfacheren Modells 1 (marginales R 2 = 0.65), für das gesamte Modell einschließlich des Randomeffekts fällt die Steigerung sehr gering aus (konditionales R 2 = .83), die Vorhersagequalität Patrick Brandt unter Mitwirkung von Felix Bildhauer 262 erhöht sich gegenüber dem einfacheren Modell 1 nicht (R 2AdjustedCount bzw. λ = 0.73). Häufig werden für die Entscheidung, ob ein Prädiktor in ein Modell aufgenommen werden soll oder nicht, Informationskriterien herangezogen. Die bekanntesten sind Akaikes Informationskriterium (AIC; Akaike 1973) und das Bayesische Informationskriterium (BIC; Schwarz 1978) sowie Varianten davon. Informationskriterien setzen die Modellanpassung in Beziehung zur Modellkomplexität, d.h., eine möglicherweise verbesserte Modellanpassung wird abgewogen gegen eine höhere Modellkomplexität durch zusätzliche Prädiktoren. Wie Tabelle 15 zeigt, sprechen beide Informationskriterien dagegen, die Verbklasse in der Modellspezifikation zu berücksichtgen. AIC BIC Modell 1 (ohne Klasse) 4903 4979 Modell 2 (mit Klasse) 4916 4987 tab. 15: Modellvergleich anhand von akaikes informationskriterium (aic) und des Bayesischen informationskriteriums (Bic). nach beiden wäre hier das weniger komplexe Modell (ohne Verbklasse als prädiktor) zu bevorzugen. Darüber hinaus lässt sich ein Modell 3 spezifizieren, das auf Koreferenz als Prädiktor verzichtet und die Verbklasse als Prädiktor beibehält: Pr (zu = 1) = logit -1 (α j + β 0 + β 2 X 2 + β 3 X 3 + β 4 X 4 ) mit α j ~ N (γ 0 + γ 1 X 5 , σ 2 ) α Nach allen bisher verwendeten Maßen liegt die Modellgüte von Modell 3 deutlich unter Modell 1 und Modell 2, die Koreferenz als Prädiktor mit einbeziehen (R 2marginal = 0.52, R 2konditional = 0.74, R 2AdjustedCount bzw. λ = 0.55). Rolle der lemmataspezifischen Konstanten Um die Rolle der variablen Konstanten in den bisher berechneten gemischten Modellen zu illustrieren, lässt sich ein generalisiertes lineares Modell 4 spezifizieren, bei dem nur eine einzige Konstante geschätzt wird (statt, wie bei den bisher betrachteten gemischten Modellen, eine Konstante für jedes Verblemma vorherzusagen). Die restlichen Prädiktoren entsprechen dabei wie in Modell 1 KOREF, K.MODAL, K.PASSIV und REFLEX: Pr (zu = 1) = logit -1 (β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + β 4 X 4 ) Das R 2AdjustedCount dieses Modells liegt mit 0.65 deutlich unter dem der beiden Modelle mit variablen Konstanten für Verblemmata (R 2Nagelkerke = 0.58). Auch ein fünftes Modell, das zusätzlich noch die Verbklasse berücksichtigt, weist kein verbessertes R 2AdjustedCount / λ auf (R 2Nagelkerke = 0.6). Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 263 In den bisher spezifizierten Modellen wurde die syntaktische Funktion des koreferierenden Elements im Matrixsatz berücksichtigt. Es zeigt sich jedoch, dass dadurch nicht allzuviel gewonnen wird, d.h., ein alternatives Modell 6, das diese Unterscheidungen aufgibt und lediglich die Ausprägungen Koref = 1 und Koref = 0 umfasst, erklärt die Daten nur unwesentlich schlechter (marginales R 2 = 0.59, konditionales R 2 = 0.81, R 2AdjustedCount = 0.73). Zusammenfassung Aus der obigen Diskussion geht hervor, dass erwartungsgemäß Koreferenz die entscheidende Rolle für die Wahl zwischen zu- und dass-Komplementierungen spielt. Darüber hinaus verhalten sich verschiedene Verblemmata recht unterschiedlich. Berücksichtigt man diese Variabilität zwischen den Lemmata, indem man eine individuelle Konstante für jedes Verblemma zulässt und als Randomeffekt modelliert, verbessert sich die Vorhersagequalität deutlich. Wenn Variation zwischen Verblemmata auf diese Weise erfasst wird, leistet die Verbklasse als zusätzlicher Prädiktor wenig für die Modellierung der zu-/ dass-Alternation. 4.3 Kontrolle kontextuell begünstigen oder behindern Wir haben starke Evidenz dafür gesehen, dass das Vorliegen von Kontrolle insgesamt stark in Richtung der zu-Komplementation wirkt. Nicht ausgemacht ist damit jedoch, ob und inwieweit es tatsächlich Merkmale des konkret vorliegenden linguistischen Kontextes sind, die in Richtung der zubzw. dass-Komplementierung wirken, oder ob es sich dabei eher um so etwas wie „memorisierte Gebrauchsspuren“ (Rapp et al. 2017) handelt, die sich im Laufe der Verwendung einzelner lexikalischer Verben verfestigen und verstärken. In dieser Richtung formulieren Rapp et al. (2017) die folgende Hypothese, wiederholt aus Abschnitt 2.4. Je häufiger in Sätzen mit einem Matrixverb V semantische Kontrolle vorliegt, umso häufiger wird in Sätzen mit V und einem Satzkomplement das Komplement als zu-Infinitiv ausgedrückt. (Rapp et al. 2017, S. 218) Ob einzelne Fälle von zubzw. dass-Komplementation tatsächlich durch Kontrolle motiviert sind, ist gemäß der Formulierung der Hypothese offen. Sie spricht nicht über Bedingungen oder Einflussgrößen für zu-Komplementation als solche, sondern über für einzelne Verben gültige Gesamttendenzen. 37 Insbesondere lässt die Hypothese es zu, dass der konkrete Komplementationstyp im Einzelfall auch entgegen der vorliegenden Struktur- und Interpretations- 37 Indem solche Bedingungen bzw. Einflussgrößen natürlich auch auf der linken (Je-)Seite der Generalisierung implizit operativ sind, ist deren Wirken natürlich nicht ausgeschlossen; es wird allerdings nicht für konkrete Einzelfallrealisierungen in Anschlag gebracht. Patrick Brandt unter Mitwirkung von Felix Bildhauer 264 bedingungen ausfallen kann, d.h. z.B., dass auch bei Vorliegen von Kontrolle und anderweitiger Erfüllung etwaiger Bedingungen ein dass-Komplement erscheinen kann; insbesondere wird dies der Hypothese gemäß dann möglich sein, wenn das involvierte Verb insgesamt zur Realisierung von dass-Komplementen neigt. Demgegenüber fokussiert die hier formulierte Hypothese (25) den konkreten Vorkommenskontext und ist insbesondere unabhängig von einzelnen Verblemmata formuliert: (25) Wenn Kontrollbedingungen vorliegen, wird ceteris paribus zu-infinitivisch komplementiert. Wir folgen Farkas (1988) und Rapp et al. (2017) in der Annahme, dass das Vorliegen einer Verantwortlichkeitsbeziehung zwischen einem Matrixargument und dem im zubzw. dass-Komplement kodierten Sachverhalt für Kontrolle wesentlich ist (vgl. Abschn. 2). Bezüglich der Realisierung dieser Bedingung lässt der Einzelfall unter unserer Formulierung allerdings Spielräume: Wir haben im Rahmen der in Abschnitt 4.2 präsentierten Analyse mittels logistischer Regression bereits gesehen, dass verschiedene Typen von Kontrolle unterschiedlich stark in Richtung der zu-Komplementierung wirken. Damit eventuell zusammenhängend stellt sich z.B. die Frage nach 1) der Art oder Herkunft einer solchen Verantwortlichkeitsbeziehung sowie 2) nach ihrer konkreten Realisierung, z.B. in Begriffen ihrer Explizitheit. In der verbbezogenen Formulierung von Rapp et al. (2017) sollte die Verantwortlichkeitsbeziehung an die Semantik des vorliegenden Verbs gekoppelt, also lexikalisch festgelegt sein, während unsere Formulierung deren Herkunft offen lässt. Ohne Weiteres sagt die Rapp’sche Hypothese auch nichts direkt darüber, ob auf die erste Stelle der Verantwortlichkeitsbeziehung explizit Bezug genommen werden muss oder ob sie auch implizit besetzt werden kann etc. Sofern sich wirksam argumentieren lässt, dass solche kontextuellen Unterschiede jenseits von Gesamttendenzen bzw. ihnen entgegen in signifikanter Weise wirksam sind, spricht dies für unsere Formulierung. 38 Im Folgenden betrachten wir Ausschnitte der Daten im Hinblick auf solche Eigenschaften, die sich nicht mittels lexikalischer Festlegung beim Verb erfassen lassen und allerdings Bedingungen für Kontrolle herstellen oder auch aufheben können; insofern gezeigt werden kann, dass das Vorliegen solcher nicht-lexikalischen Eigenschaften mit der zubzw. dass-Komplementation korreliert, ist dies ein Argument gegen lexikalische Trägheit und für die kontextuelle Motivation der gewählten Variante. 38 Die Möglichkeit der kriterienbasierten Ad-hoc-Entscheidung für eine bestimmte Realisierungsweise ist dabei wohlgemerkt kompatibel mit der Unbewusstheit bzw. Automatizität der Entscheidung. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 265 Die Manipulation der Agentivität des eingebetteten Prädikats mit grammatischen Mitteln kann zu-infinite Komplementation gegen vermeintlich lexikalische Festlegungen ermöglichen, wie die folgenden Beispiele (wiederholt aus Abschn. 2) zeigen. (13) Petric habe gesagt, mit rausgehen zu wollen. (Rhein-Zeitung, 17.4.2010; Mladen Petric: „Die dümmste Verletzung …“) (14) Korda hatte gesagt, es nicht zu wissen. (Kleine Zeitung, 15.1.1999, Ressort: Sport) In diesen Beispielen wird die Verantwortlichkeitsbeziehung nicht vom Matrixverb etabliert. In (13) wird sie anscheinend durch das Modalverb im eingebetteten Satz eingeführt; „wissen“ in (14) ist wenig agentiv und selegiert gerade ein wenig bzw. überhaupt nicht verantwortliches Subjekt. Die Annotation eingebetteter Prädikate im Hinblick auf die Agentivität ihrer Subjekte ist allerdings noch problematischer als die Annotation bezüglich der Modalisierung, die immerhin von bestimmten im Ausdruck erscheinenden Formen ausgehen kann, weshalb wir uns hier weitgehend auf den Aspekt der Modalisierung beschränken. In der Regressionsanalyse (vgl. oben Abschn. 4.2) kommt heraus, dass Modalisierung oder Passivierung des Komplements in Richtung der dass-Komplementation wirken. Allerdings geht die Regressionsanalyse schon von den Kontrolltypen aus, sodass die Information, wie die spezifische Kontrolle zustande gekommen ist, unberücksichtigt bleibt. Subjektkontrolle etwa kann, wie wir sehen werden, gerade bei den hier als Antikontrollverben geführten Lemmata erst durch Modalisierung oder Passivierung des Komplementsatzes zustande kommen. Für die Untersuchung der Wirksamkeit dieser Kontrolle nur unter bestimmten Umständen beeinflussenden Faktoren ist es daher unumgänglich, wiederum von Verbklassen auszugehen. Insgesamt sind die einschlägigen Operationen innerhalb von zu-Komplementen überaus selten; in den folgenden Tabellen sind die Vorkommen von Modalisierung und Passivierung in zu-Komplementen denen in dass-Sätzen gegenübergestellt (mit „K.mod“ = Komplementsatz modalisiert, „K.nonag“ = Komplementsatz mit nicht-agentivischem Prädikat und „KoRef“ = Vorliegen von Kontrolle (Koreferenz)). Patrick Brandt unter Mitwirkung von Felix Bildhauer 266 dass Gültig K.mod K.nonag KoRef Insgesamt 3944 1156 843 912 SU-KV 1160 264 132 454 DO-KV 1357 495 195 376 A-KV 1427 397 516 82 tab. 16: dass komplemente - Modalisierung und nicht agentivische prädikate zu Gültig K.mod K.nonag KoRef Insgesamt 3575 40 63 2977 SU-KV 1198 27 0 1179 DO-KV 1724 7 33 1461 A-KV 653 6 30 337 tab. 17: zu komplemente - Modalisierung und nicht agentivische prädikate Die Seltenheit von nicht-agentivischen eingebetteten Prädikaten bei den zu- Komplementen kann als unterstützende Evidenz für Panther und Köpckes (1993) These der inhärenten Agentivität von PRO angesehen werden (vgl. Abschn. 2.3). Die Seltenheit von Modalisierung innerhalb von zu-Komplementen ist relevant für die Frage, ob und inwiefern die Wahl von zu-Komplementen auch dem Wunsch nach dem Ausdruck von Modalität geschuldet sein können; Abschnitt 4.4.1 diskutiert diese Frage ausführlicher. 39 Im Kontext der Diskussion von lexikalischer Trägheit einerseits und kontextueller Motivation andererseits steht die Seltenheit der Operationen quantitativ-statistisch gestützter Argumentation entgegen. Die von der Grundhypothese generierte Erwartung wäre, dass Modalisierung oder Passivierung in solchen Strukturen gehäuft vorkommt, in denen erst durch sie Kontrollbedingungen geschaffen werden und mithin ein zu-Komplement erscheinen kann. Andererseits ermöglicht die niedrige Belegzahl eine detaillierte Betrachtung der Fälle, die unabhängig nötig scheint: Die Kombinationsmöglichkeit mit einzelnen Modalverben variiert von Verbklasse zu Verbklasse, und der Bedeutungsbeitrag einzelner Modalverben kann je nach von ihnen selegiertem Verb in einer für die Kontrollfrage signifikanten Weise schwanken. 39 In der Literatur finden sich verschiedentlich Beobachtungen dahingehend, dass zuinfinitivische Strukturen zu einer modalen Interpretation neigen, vgl. z.B. Holl 2010. Panther und Köpcke (1993) präsentieren eine Theorie, nach der unausgedrückte Subjekte infinitivischer Strukturen inhärent agentivisch interpretiert werden und nach einem agentivischen kontrollierenden Argument verlangen. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 267 Die für Kontrollwechsel einschlägigen Typen der Modalisierung finden im Deutschen vor allem durch die Modalverben können und dürfen Ausdruck. Diese Modalverben führen insgesamt zu einer Schwächung der Bedeutung ihres Bezugssatzes. Vereinfachend gesprochen gilt, dass, wann immer p der Fall ist, es auch möglich bzw. erlaubt ist, dass p der Fall ist (epistemische bzw. deontische Interpretation von können bzw. dürfen). 40 Bezogen auf die Interpretation des Subjekts kann im Kontext dieser Modalverben ebenso von einer Schwächung, d.h. einer Relaxierung der für die Interpretation des Subjekts geltenden Beschränkungen gesprochen werden. Sofern eine Konkurrenz bezüglich der Realisierung als Subjekt besteht, d.h., sofern wir es mit einem zwei- oder mehrstelligen Prädikat zu tun haben, wird bei aktivischer Diathese offenbar universal dasjenige Argument als Subjekt realisiert, das als Agens identifiziert werden kann. Wiewohl die Definition von Agentien umstritten ist, besteht doch einige Einigkeit dahingehend, dass ein prototypisches Agens mit Intentionen begabt ist und bestimmte Fähigkeiten und auch die Autorität aufweist, diese Intentionen eventuell zu realisieren. Die Umsetzung dieser Fähigkeiten wird nun durch das Modalverb können aus dem Bereich des Tatsächlichen in den Bereich des Möglichen verschoben, analog die Ausübung der Autorität durch das Modalverb dürfen. Passivierung ist natürlich insbesondere dadurch charakterisiert, dass sie die „Räumung“ der grammatischen Subjektstelle durch das im Aktiv obligatorisch als Subjekt erscheinende Agens bedeutet. Es scheint unabhängig plausibel, anzunehmen, dass Kontrollwechsel wesentlich mit der Manipulation bestimmter mit Agentivität verbundener Eigenschaften zu tun hat. Der Spielraum bezüglich der Kontrollinterpretation, dessen Wachsen wir unter Modalisierung bzw. Passivierung beobachten können, begegnet uns nämlich genauso, wenn das Prädikat des eingebetteten Satzes ein von vornherein nur wenig agentivisches Subjekt verlangt. In Abschnitt 3.3 haben wir gesehen, dass Modalisierung bzw. die Wahl eines nicht-agentivischen eingebetteten Prädikats unter bestimmten Bedingungen Kontrolle ermöglichen kann. Wir betrachten zunächst die Modalisierung des Komplementsatzes (K.mod); da Modalisierung gegebenenfalls entscheidend zur Herstellung einer Kontrollkonfiguration beiträgt, greifen wir hier wiederum auf Verbklassen (versus Kontrollstrukturtypen) zurück. Die Zahlen sind wie in Tabelle 18. 40 Anders formuliert: Die Wahrheit des nicht modalisierten Satzes impliziert die Wahrheit des modalisierten Satzes, aber nicht andersherum: Wenn x der Fall ist, dann kann (oder darf) x der Fall sein (aber nicht unbedingt umgekehrt). Patrick Brandt unter Mitwirkung von Felix Bildhauer 268 DO-KV A-KV SU-KV Modalisiertes zu-Komplement 9 10 36 Nicht mod. zu-Komplement 2286 944 1232 tab. 18: Verbklassen und Modalisierung (datensatz ii) Überraschend ist die relativ hohe Zahl modalisierter Infinitive bei Subjektkontrollverben; wie oben dargelegt, beeinflusst Modalisierung die Kontrollmöglichkeit in diesem Fall negativ. Besieht man sich die Fälle, so stellt man fest, dass es sich in 32 Fällen um das Modalverb wollen handelt, das keinen Einfluss auf die Kontrollmöglichkeit per se hat, vgl. dazu noch einmal (49) und (50), die beide Subjektkontrolle instantiierten (bei (50) handelt es sich um das Originalbeispiel). (49) Mit einem Dolch habe er einer Frau gedroht, sie abzustechen. (50) Mit einem Dolch habe er einer Frau gedroht, sie abstechen zu wollen. (Rhein-Zeitung, 13.3.2007; Feuer in Kapelle der Psychiatrie gelegt) Die übrigen 4 Fälle sind als Instanzen von „Fähigkeits“-können zu klassifizieren, das ebenso keinen Einfluss auf die Kontrollmöglichkeit hat, vgl. analog zu (49) und (50) die Beispiele in (51) und (52) (bei (52) handelt es sich um das Originalbeispiel). (51) Gemäß Vertrag hat die CCAC zugesichert, Originale zu liefern. (52) Gemäß Vertrag hat die CCAC zugesichert, Originale liefern zu können. (Mannheimer Morgen, 13.12.2007, S. 38; Billige Terrakotta- Kopien sorgen für Museumspanne) In der Summe finden wir bei Subjektkontrollverben keinen einzigen Fall von Modalisierung, der in der Kontrolldimension wirksam ist. Für Dativobjektkontrollverben sieht es nicht viel anders aus; hier finden wir 5 Fälle von in der Agentivitätsdimension unwirksamem wollen, einen Fall von dürfen und einen Fall von müssen; hinzu kommen ein ungrammatischer (und daher auszusortierender) und ein falsch als „modalisiert“ annotierter Beleg. Weder im Fall mit dürfen noch in dem mit müssen werden allerdings die Kontrollmöglichkeiten tangiert, vgl.: (53) Der Fall von perikarditischer Pseudoleberzyrrhose, dessen Diagnose von so schrecklicher Sicherheit ist, wird dem Wohl jener dienen, denen das Schicksal gnädig gestattet, noch leiden zu dürfen, nicht nur an ihren Krankheiten, sondern auch an den Irrtümern, welche über dieselben möglich sind. (Bamm, Peter: Ex ovo (Erstv. 1956) - Stuttgart, 1963) Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 269 (54) Immerhin habe ihm Godefroot zugestanden, nicht durchfahren zu müssen. (Frankfurter Allgemeine, 1995) In der Klasse der Antikontrollverben finden wir zwei irrtümlich als modalisiert annotierte Belege und einen auszusortierenden Fall. Es bleiben 6 Fälle mit dürfen und ein Fall mit können. Ein repräsentativer dürfen-Fall und der können-Fall sind in (55) und (56) gegeben. (55) Die Firma Jungbunzlauer Ladenburg hat beantragt, Grundwasser entnehmen zu dürfen. (Mannheimer Morgen, 19.4.2000; Ilvesheimer Rat tagt heute) (56) Wie Bürgermeister Rolf Wenzel am Donnerstag sagte, hatte der Beirat in der Vergangenheit mehrfach beantragt, sich vergrößern zu können. (Frankfurter Rundschau, 4.7.1997; Größerer Ausländerbeirat? , S. 2) (55) illustriert die für Antikontrollverben charakteristische, die Kontrolle ermöglichende Funktion von dürfen; fehlte dieses Modalverb, so käme das Matrixsubjekt als kontrollierendes Argument nicht infrage. Analoges gilt für die anderen Fälle mit dürfen. Bei (56) handelt es sich um „permissives“ können, das ohne relevante Bedeutungsveränderung durch dürfen ersetzt werden könnte. Tatsächlich ist der Gebrauch von können hier als nicht dem Standard gemäß anzusehen. Im Kontext der sich hier etablierenden Generalisierung, dass es sich bei den von Antikontrollverben prototypisch projizierten Strukturen um Akkusativobjektkontrollstrukturen handelt, deren Akkusativobjekt ein stilles Pronomen realisiert, ist interessant zu bemerken, dass das Modalverb dürfen innerhalb der Komplemente gerade von Akkusativobjektkontrollstrukturen ebenso wie Passivierung regelhaft zu einer Abweichung von der „Normalkoeffizienz“ (Bech 1974, S. 31), also einem Wechsel des Kontrolltyps von Akkusativobjektkontrolle hin zu Subjektkontrolle führt. 41 Aufgrund der niedrigen Belegzahlen innerhalb der nachträglich annotierten Stichprobe von Belegen mit Akkusativobjektkontrollverben ist eine quantitative Auswertung hier noch weniger ergiebig als bei Strukturen mit Antikontrollverben. 41 Das folgende Beispielpaar illustriert Kontrollwechsel durch nicht-agentivische Prädikate im Komplement von Antikontrollstrukturen. (i) Nach zwei verlorenen Runden hatte Fischer verlangt, die TV-Übertragung zu beenden, da sie seine Konzentration stören würde. (Berliner Zeitung, 19.1.2008, Ressort: Blickpunkt; Am Brett ein Genie) (ii) Er hatte verlangt, erschossen zu werden. (St. Galler Tagblatt, 5.10.1998, Ressort: TB-SPL (Abk.); Kurz) Patrick Brandt unter Mitwirkung von Felix Bildhauer 270 Wir finden also nur bei den zu-komplementierenden Antikontrollverben solche Vorkommen von Modalverben, die für Kontrollwechsel einschlägig sind. In den Verbklassen, wo relevante Modalverben der Kontrollmöglichkeit entgegenstehen würden, kommen sie in den betrachteten Daten nicht vor. Aufschlussreich wäre eventuell ein Vergleich mit den Zahlen im Bereich finiter Komplementierung, in dem wir eine ausgeglichenere Verteilung relevanter Modalverben erwarten, da sie hier eigentlich keine Rolle spielen sollten, indem die Kontrollmöglichkeit für finite Satzkomplementierung ganz irrelevant ist. Angesichts der gerade im Fall von Modalverben nötigen Einzelfallbetrachtung bei den gegebenen hohen Fallzahlen (1.537 potenziell einschlägige Fälle) müssen wir hier darauf verzichten. Die Tatsache, dass Modalisierung und Passivierung des Komplementsatzes nur dort vorkommen, wo sie Kontrolle ermöglichen, deutet allerdings darauf hin, dass eben diese Kontrolle und mithin zu-Komplementation die genannten Operationen motiviert. Andere grammatische Operationen treten hinreichend häufig auf, um quantitativ-statistisch für eine Diskussion von lexikalischer Trägheit vs. kontextueller Motivation brauchbar zu sein, jedoch wiederum nur in Teilbereichen der Daten, die allerdings entschieden größer sind als im Fall von Modalisierung bzw. Passivierung des Komplementsatzes. Wir betrachten Subjektkontrollstrukturen und Dativobjektkontrollstrukturen im Hinblick auf die Passivierung des Matrixsatzes sowie im Hinblick auf die Präsenz eines Dativarguments im Matrixsatz. Beide Operationen sind im Kontext der oberflächlich ganz parallelen Strukturen der beiden Klassen möglich. Entscheidend ist, dass Passivierung des Matrixsatzes den Kontrollbedingungen bei Subjektkontrollverben ceteris paribus abträglich ist, indem sie das kontrollierende Argument (oberflächlich) eliminiert; bei Dativobjektkontrollverben werden die Kontrollbedingungen durch Matrixpassivierung nicht tangiert. Wir sagen vorher, dass Matrixpassivierung sich bei Subjektkontrollverben, aber nicht bei Dativobjektkontrollverben negativ auf die Häufigkeit von zu-Komplementen auswirkt. Die Präsenz eines Dativarguments sollte sich bei Dativobjektkontrollverben positiv auf die Häufigkeit von zu-Komplementen auswirken, während sie für die zu-Komplementation bei Subjektkontrollverben keine Rolle spielen sollte. Weder Matrixpassivierung noch die oberflächliche Realisierung von Dativargumenten lassen sich mittels lexikalischer Verbeinträge erfassen - sofern sie eine Rolle für die zu-Komplementation spielen, sprechen sie für kontextuelle Motivation und gegen lexikalische Trägheit. Die folgenden Tabellen stellen wiederum die Zahlen für Matrixpassivierung und die Präsenz eines Dativarguments im Matrixsatz bei dass-Komplementen und bei zu-Komplementen einander gegenüber (mit „M.Passiv“ = Matrixsatz passivisch, „M.Dativ“ = Ausdruck eines Dativarguments im Matrixsatz und „KoRef“ = Vorliegen von Kontrolle (Koreferenz)). Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 271 dass Gültig M.Passiv M.Dativ KoRef Insgesamt 3.944 927 1.232 912 SU-KV 1.160 124 564 454 DO-KV 1.357 453 639 376 A-KV 1.427 350 29 82 tab. 19: dass komplemente - passiv und dativ im Matrixsatz zu Gültig M.Passiv M.Dativ KoRef Insgesamt 3.575 707 1.864 2.977 SU-KV 1.198 29 366 1.179 DO-KV 1.724 564 1.421 1.461 A-KV 653 114 77 337 tab. 20: zu komplemente - passiv und dativ im Matrixsatz Die Häufigkeit von Matrixpassivierung fällt bei den Belegen mit zu-Komplementen gegenüber denen mit dass-Komplementen bei Subjektkontrollverben, aber nicht bei Dativobjektkontrollverben deutlich ab: Bei Subjektkontrollverben ist unter dass-Komplementation etwa jeder zehnte Beleg Matrix-passivisch, unter zu-Komplementation nur etwa jeder fünfzigste Beleg. Bei den Dativobjektkontrollverben ist unter dass-Komplementation ebenso wie unter zu- Komplementation etwa jeder dritte Beleg Matrix-passivisch. Wiewohl Matrixpassivierung bei Subjektkontrollverben auch unter dass-Komplementation selten ist, ist sie dies der Erwartung entsprechend in Sonderheit unter zu- Komplementation. Ausgewogenere Verhältnisse unter dass-Komplementation finden wir bezüglich Dativargumentpräsenz im Matrixsatz: etwa jeder zweite Beleg mit dass-Komplement bei Subjektkontrollverben (49%) ebenso wie bei Dativobjektkontrollverben (47%) weist ein im Matrixsatz oberflächlich realisiertes Dativargument auf. Bei Subjektkontrollstrukturen fällt der Anteil unter zu- Komplementation auf etwa 30%, bei Dativobjektkontrollstrukturen steigt er auf über 80%. Angesichts der Ausgeglichenheit unter dass-Komplementation scheint es legitim, die Verhältnisse unter zu-Komplementation direkt miteinander zu vergleichen; die Tabelle zeigt die absoluten Zahlen der zu-Komplemente mit bzw. ohne Dativargument im Matrixsatz für die beiden Kontrolltypen, der Mosaikplot zeigt, dass Strukturen mit Dativargument und zu-Komplement bei Dativobjektkontrollverben in hochsignifikantem Maße überrepräsentiert sind. Die Effektstärke ist Phi = 0.52. Patrick Brandt unter Mitwirkung von Felix Bildhauer 272 SU-KV DO-KV Dativ und zu 366 1.421 Andere zu 832 304 tab. 21: Subjekt - und dativobjektkontrollverben - dativpräsenz und zu komplemente abb. 6: Mosaikplot Subjekt - und dativobjektkontrollverben - dativpräsenz und zu komplemente In der Zwischensumme liefert die Betrachtung von Matrixpassivierung und Dativargumentpräsenz bei Subjektkontrollstrukturen respektive Dativobjektkontrollstrukturen Evidenz gegen lexikalische Trägheit und für kontextuelle Motivation im Bereich der zuvs. dass-Komplementation. Abschließend betrachten wir das Komplementationsverhalten einzelner Verben. Rapp et al. (2017) präsentieren als Argument für lexikalische Trägheit solche Verben, die unabhängig von Kontrolle stark zu dass-Komplementation neigen und dann auch unter putativen Kontrollbedingungen in der Regel dass-Komplemente realisieren - Beispiele sind berichten, bestätigen, darlegen, enthüllen, erzählen, klarmachen, mitteilen oder verraten. Man könnte einwenden, dass in diesen Fällen die semantische Eintrittsbedingung - dass ein Argument des Prädikats als für den im eingebetteten Satz kodierten Sachverhalt als verantwortlich präsentiert wird - wenigstens aus lexikalisch-semantischer Sicht Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 273 nicht erfüllt ist und man es mithin nicht mit genuin Kontrollstrukturen projizierenden Fällen zu tun hat. Allerdings kann so etwas wie eine Verantwortlichkeitsbeziehung offenbar auch anderweitig ins Spiel kommen, wie wir weiter oben in diesem Abschnitt gesehen haben (vgl. auch Abschn. 2.3 u. 3.3). Inwieweit die von Rapp et al. (2017) in Anschlag gebrachten Belege bestimmte Modalverben oder nicht-agentivische Prädikate oder Modalverben involvieren, wäre evtl. gesondert zu prüfen (vgl. oben Abschn. 2.4). Von den im Rahmen dieser Studie betrachteten Verben können fordern und kritisieren als prototypische dass-Komplementierer und mithin trägheitsverdächtig angesehen werden. Wir finden hier die folgenden Zahlen vor: fordern kritisieren insgesamt Kontrolle insgesamt Kontrolle dass 205 9 94 4 zu 45 9 13 12 tab. 22: fordern und kritisieren - komplemente und kontrolle Strukturen mit fordern weisen selten Kontrolle auf, nämlich bei weniger als jedem zehnten Beleg. Etwa jeder fünfte Beleg weist ein zu-Komplement auf, wiederum jedes fünfte zu-Komplement ist Teil einer Kontrollstruktur - demgegenüber ist weniger als jeder zwanzigste Fall einer Struktur mit dass-Komplement auch eine Kontrollstruktur. Kontrolle ist unter zu-Komplementation also entschieden häufiger und kann eventuell als Motiv für die zu-Komplementation im Angesicht gewohnheitsmäßiger dass-Komplementation angesehen werden. Deutlicher sind die Verhältnisse bei kritisieren: Hier weist etwa nur jeder zehnte Beleg ein zu-Komplement auf. Während bei den dass-Komplementen weniger als 5% (also weniger als jeder zwanzigste Fall) Kontrolle aufweist, sind nahezu sämtliche Belege mit zu-Komplement auch Kontrollstrukturen; es liegt nahe zu vermuten, dass Kontrolle hier zu-Komplementation gegen die Gewohnheit motiviert. Allerdings liegt den Belegen mit zu-Komplementen das Akkusativobjektkontrollmuster zugrunde; bemerkenswert ist darüber hinaus, dass zehn der zwölf zu-Komplemente Matrix-passivisch sind und damit dem Subjektkontrollmuster entsprechen; wir sehen bestätigt, dass Subjektkontrolle innerhalb der Kontrollstrukturen insgesamt eine Art Idealkonfiguration darzustellen scheint (vgl. Abschn. 2.1, 2.3 sowie 3.2). (57) ist ein repräsentatives Beispiel. (57) Ich ordne mich immer unter - soll das Offensiv-Spiel tragen, und werde ständig kritisiert, keine Defensivarbeit zu verrichten. (Die Presse, 28.8.1997; Sport, Ärger, Frust und Kritik) Patrick Brandt unter Mitwirkung von Felix Bildhauer 274 Insgesamt kann eine kursorische Betrachtung, wie eben vorgenommen, zwar nicht konklusiv sein; insofern aber lexikalisch nicht festschreibbare Eigenschaften zur Ermöglichung von Kontrolle führen und daher mit erhöhter zu- Komplementierung korrelieren, sprechen sie gegen die Vorherrschaft vermeintlich gewohnheitsmäßig träger Realisierungsmuster. 4.4 Jenseits von Kontrolle: Schwächen und Stärken In diesem Abschnitt betrachten wir beispielhaft mögliche Motive für die Wahl eines zubzw. dass-Komplements, die jenseits bzw. quer zu der Schaffung oder Verhinderung von Kontrollbedingungen liegen. Wir gehen dabei vor allem von dem in Abschnitt 2.4 diskutierten Faktum aus, dass zu-Komplemente auf der Bedeutungsseite weniger festgelegt sind als dass-Komplemente, was sie für bestimmte Funktionen wie z.B. den Ausdruck von Modalität oder überhaupt den Ausdruck von schwächeren und weniger festgelegten Bedeutungen prädestiniert. Umgekehrt können dass-Komplemente auch bei Vorliegen von Kontrolle dadurch motiviert sein, dass in bestimmten Kontexten unabhängig erhöhte Explizitheit gefragt sein mag. 42 4.4.1 zu - Komplemente und modale Interpretationen In den Abschnitten 2.3 und 2.4 haben wir bereits Hinweise darauf gesehen, dass zu-Infinitive besonders affin für eine modale Interpretation sind. Ein Beispiel gibt (58), dessen Komplement eine modale, in diesem Fall wohl permissive Interpretation innehat (dürfen, können). (58) Bremen hat beim DFB beantragt, in Orange zu spielen. (Mannheimer Morgen, 1.3.2010; Schwarze Trikots für Mainz ein schlechtes Omen, S. 9) Bei einem entsprechenden Beispiel mit finiter Realisierung des Komplements wird die im gegebenen Fall deontische Modalität durch ein Modalverb (sollen) explizit gemacht, vgl. (58‘). (58‘) Aus diesem Grund hat die SPD-Fraktion nun beantragt, dass sich der Verbandsgemeinderat mit der Thematik beschäftigen soll. (Rhein-Zeitung, 9.11.2010; Filsen wartet noch auf schnellen Internetzugang, S. 20) 42 Vgl. z.B. zum Mandat besonders expliziter Kommunikation in Hochrisikokontexten Krifka/ Martens/ Schwarz (2003). Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 275 Im Sinne der in Abschnitt 2.4 vorgestellten Ökonomieüberlegungen könnte die Wahl eines zu-Komplements durch den ökonomischen Ausdruck von Modalität motiviert sein, was wir in der Hypothese in (H mod ) fassen. (H mod ) Der Wunsch nach Ausdruck von Modalität motiviert in bestimmten Kontexten die Realisierung von zu-Komplementen. Der Ausdruck von Modalität innerhalb von dass-finiten Komplementen macht den Gebrauch von Ausdrücken notwendig, die die modale Bedeutung spezifisch markieren (können, dürfen, müssen etc., vgl. oben Abschn. 2.3). Um das eventuelle Erklärungspotenzial der Hypothese in (H) zu prüfen, gehen wir wie folgt vor: Wir greifen aus den Gruppen der Dativobjektkontrollverben und Antikontrollverben solche Verblemmata heraus, die besonders häufig in zu-infiniten Konfigurationen vorkommen, ohne dass eine als solche annotierte Kontrollbeziehung vorliegt. Es scheint plausibel, dass sich die Eigenschaft eines Verblemmas, eine modale Interpretation seines Komplements zu verlangen oder zu begünstigen, an der expliziten Markierung von Modalität innerhalb seiner dass-finiten Komplemente ablesen lässt. Um zu prüfen, inwieweit zu-Komplementation eventuell mit dem Ausdruck von Modalität zusammenhängt (vgl. H mod ), erheben wir die Häufigkeit modaler Marker in dass-finiten Komplementen (ohne Kontrolle) bei Verben, die zur Realisierung von zu-Komplementen auch in Abwesenheit von Kontrolle neigen und vergleichen sie mit der Häufigkeit der Markierung von Modalität innerhalb dass-finiter Komplemente (ohne Kontrollbeziehung) bei solchen Verben, die wenige Vorkommen zu-infiniter Komplemente ohne Kontrollbeziehung aufweisen. 43 Da die Herstellung einer Kontrollbeziehung als Grund für die zu-Komplementation ausscheidet, muss sie durch andere Faktoren bedingt sein; qua Hypothese H mod erwarten wir, dass zu-Komplemente ohne Kontrolle bei solchen Verben häufig vorkommen, deren dass-Komplemente (ohne Kontrolle) häufig modal markiert sind. 43 Indem Modalisierung eine schwächere Bedeutung liefert, besteht eine Nähe zu Phänomenen wie Höflichkeit, die oft willentliche Vagheit (viz. Understatement) involvieren. Interessant ist in diesem Zusammenhang, dass bestimmte Vorkommen von zu-Infinitiven ebenso Höflichkeit geschuldet zu sein scheinen wie in dem ungrammatischen Fall in (i). (i) Sollten Sie über keinen Internetzugang zu verfügen, dürfen wir Sie bitten, das beigefügte Formular auszufüllen und per Fax oder Post an uns zurückzureichen. (Schreiben der VG Wort anlässlich der Übertragung von Autorenrechten, August 2009) Wir würden erwarten, dass der Faktor Höflichkeit mit dem möglichen Effekt zu-infiniter Komplementierung bei Dativobjektkontrollstrukturen eine Rolle spielt, aber nicht bei Subjektkontrollstrukuren, insofern es höflich ist, Handlungsanweisungen nicht zu stark zu formulieren, während Höflichkeit für die Kodierung von Selbstverpflichtung keine Rolle spielen sollte. Patrick Brandt unter Mitwirkung von Felix Bildhauer 276 Innerhalb der Dativobjektkontrollverben treten zu-infinite Komplemente ohne Kontrollbeziehung häufig auf bei vorschlagen (108 Belege) und empfehlen (71 Belege), relativ häufig bei befehlen und abraten mit je 23 Belegen. Bei abraten gibt es allerdings keinen dass-finiten Beleg, weshalb das Lemma aus dem Vergleich herausgenommen wurde. 44 Die restlichen betrachteten Lemmata sind bis auf untersagen mit 7 Fällen im niedrigen einstelligen Bereich, was die Realisierung eines zu-infiniten Komplements ohne Kontrolle betrifft. Innerhalb der dass-finiten Komplemente finden wir die folgenden Zahlen: bei vorschlagen 99 modale dass-Sätze von 180, bei empfehlen 81 von 143, bei befehlen 16 von 28. Aggregiert ergeben sich 351 dass-Komplemente bei diesen Verben, von denen 196 modal sind. Bei den wenig zu-affinen Lemmata finden wir 630 dass-Sätze vor, von denen 204 modal sind. dass nicht modal dass modal zu-ohne Kontrolle affin 155 196 Rest 426 204 tab. 23: Modalisierung von dass - Sätzen bei zu komplementaffinen Verben abb. 7: Mosaikplot Modalisierung von dass - Sätzen bei zu komplementaffinen Verben 44 Wir finden bei abraten 23 Fälle zu-infiniter Komplementation ohne Kontrolle, aber keinen einzigen dass-Fall. In etwa der Hälfte der zu-Fälle erhellt die Referenz von PRO aus dem Kontext; bei der anderen Hälfte liegt „generischer“ Bezug vor wie in (i) als Teil eines Textes über Gewaltkriminalität in Lesotho. (i) Es wird abgeraten, im Auto zu übernachten. (Rhein-Zeitung, 5.7.1996; risiko/ jemen bis phi) Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 277 Die Visualisierung zeigt, dass modale dass-Sätze bei den Lemmata, die in Abwesenheit einer Kontrollbeziehung zu-infinit komplementieren, in hochsignifikantem Maße überrepräsentiert sind. Der Effekt ist allerdings relativ schwach mit Phi = 0.2266724. Innerhalb der Antikontrollverben treten die folgenden Verben häufig mit zuinfiniten Komplementen, aber ohne Kontrolle auf: anordnen (93 Belege), beantragen (133 Belege), fordern (36 Belege), verlangen (39 Belege). Die restlichen Antikontrollverben sind im niedrigen einstelligen Bereich. Innerhalb der dass- Sätze sind modal 99 von 189 bei anordnen, 63 von 162 bei beantragen, 104 von 196 bei fordern und 19 von 51 bei verlangen. Aggregiert ergeben sich die folgenden Verhältnisse für Antikontrollverben und entsprechende Visualisierung. dass nicht modal dass modal zu-ohne Kontrolle affin 313 285 Rest 648 99 tab. 24: Modalisierung von dass - Sätzen bei zu komplementaffinen antikontrollverben abb. 8: Mosaikplot Modalisierung von dass - Sätzen bei zu komplementaffinen antikontrollverben Wiederum sind modale dass-Sätze bei denjenigen Verben in hochsignifikantem Maße überrepräsentiert, die auch zu-Infinitive in Abwesenheit einer Kontrollbeziehung erlauben; der Effekt ist bei den Antikontrollverben stärker mit Phi = 0.3768872. Patrick Brandt unter Mitwirkung von Felix Bildhauer 278 Im Ergebnis finden wir deutliche Hinweise, dass die Realisierung eines zu- Komplements durch Wunsch nach Ausdruck von Modalität motiviert sein kann. Modale Interpretationen - im Sinne der Bedeutung von Möglichkeit - sind schwächer als nicht modale Interpretationen (vgl. Abschn. 4.3). Bei Realisierung eines dass-Komplements erfordert die Kodierung von Modalität zusätzlichen Aufwand auf der Ausdrucksseite, was zu-Komplementen aus der Ökonomieperspektive einen zusätzlichen Vorteil verschafft. Wenn zu-Komplemente den im finiten dass-Satz explizit zu kodierenden Bedeutungsaspekt der Modalität ohne Weiteres mit abdecken können, dann wird das Einsparungsmotiv im Bereich modal zu interpretierender Komplemente noch stärker als ohnehin schon. Zwar sind zu-Komplemente an sich weniger festgelegt bzw. vager bezüglich ihrer Interpretation als dass-Komplemente, indem z.B. die spezifische Art der Modalität zunächst nicht festgelegt ist. Der linguistische Kontext - insbesondere das Verb im Matrixsatz - stellt jedoch in aller Regel Eindeutigkeit bezüglich der anzusetzenden Modalität her, 45 sodass zu-Komplemente in ihrem linguistischen Kontext qua Bedeutungsspezifizität dass- Sätzen prinzipiell ebenbürtig erscheinen. In der Summe sollten modal zu interpretierende Komplemente daher ceteris paribus vermehrt als infinite zu- Komplemente realisiert werden. 4.4.2 dass - Komplemente und verbindliche Selbstverpflichtung Gerade unter einer Ökonomieperspektive noch weniger erwartet als zu-infinite Komplemente ohne Kontrolle sind Strukturen mit dass-finiten Komplementen, deren Subjekte jedoch koreferent mit einem Matrixargument sind. Solche Fälle sind insgesamt relativ ausgewogen verteilt über Subjektkontrollverben (454 Belege) und Dativobjektkontrollverben (376 Belege) und kommen seltener bei Antikontrollverben vor (82 Belege). Ähnlich präsentiert sich die Verteilung über die kontrollierenden Argumente; wir finden 416 Belege mit Subjektkontrolle und 468 Belege mit Kontrolle durch das indirekte Objekt (sowie 13 mit Kontrolle durch eine thematisch vom Verb abhängige Präpositionalphrase); auch ist es überwiegend das unter zu-infiniter Realisierung typischerweise kontrollierende Argument, zu dem die Koreferenzbeziehung besteht. 46 Viele mögliche Motive kommen in Betracht. Ein Blick auf im Sinne der 45 Die Matrixverben beantragen oder erlauben z.B. sind verknüpft mit permissiver Modalität des Komplements (dürfen, können) und schließen deontische Interpretationen aus; die Matrixverben fordern oder anordnen dagegen sind mit deontischer Modalität des Komplements (sollen, müssen) verknüpft und schließen mit dem Ausdruck von Möglichkeit verbundene Interpretationen (können) aus etc. 46 Allerdings finden wir bei Subjektkontrollverben entschieden mehr Variation in den dass-finiten Strukturen als in den zu-infiniten Strukturen; bei Dativobjektkontrollverben scheint die Variation eher kleiner zu werden. Wenn es also so etwas wie eine Idealkonfiguration gibt, in Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 279 hier untersuchten Hypothese H (vgl. Abschn. 2.4) besonders überraschende Daten macht deutlich, dass bei bestimmten Verben in bestimmten Konstruktionsweisen die zu-Komplementation auch bei Vorliegen einer Verantwortlichkeitsbeziehung sowie Kontrolle wenig naheliegend ist, man vgl. etwa (59). (59) Ich habe mir geschworen, dass ich nie wieder als Vierter bei einer Siegerehrung bei einem Großereignis dabei sein will. (dpa, 17.2.2013; (Aktuell gefragt) Neureuther: „Einer der schönsten Tage für mich“) Die temporale Distanzierung des in der gesamten Konstruktion kodierten Sachverhalts von der Äußerungssituation führt gegebenenfalls zur intuitiv natürlicheren Verwendung eines zu-Komplements, vgl. z.B. den Gebrauch des Plusquamperfekts in (60). (60) Wir hatten uns geschworen, hier nicht zu verlieren. (Rhein-Zeitung, 26.5.2003; Lob an Mannschaft) Die Markiertheit des zu-Infinitivs scheint also nicht bestimmten lexikalischsemantischen Eigenschaften per se geschuldet zu sein, sondern eher mit ihrer Präsentation zu tun zu haben. Die im Kontext kontrollloser zu-infiniter Belege gemachten Beobachtungen wiederaufnehmend (vgl. Abschn. 4.4.1) könnte die verglichen mit dass-Komplementen weniger festgelegte Semantik der zu-Komplementation im Wege stehen. Wir formulieren die tentative Hypothese in (61). (61) dass-finite Realisierung des Komplements unter Koreferenz kann in bestimmten Kontexten dem Wunsch nach Ausdruck einer im Hinblick auf verbindliche Selbstverpflichtung stärkeren (expliziteren) Semantik geschuldet sein. Der dass-Satz erscheint nach (61) also, weil die mit der zu-Komplementierung verbundene schwächere bzw. weniger festgelegte Bedeutung der auf Explizitheit (Verbindlichkeit) zielenden Semantik des selegierenden Verbs entgegensteht. Dabei kommt der Aspekt der verbindlichen Selbstverpflichtung überhaupt nur unter bestimmten Äußerungsbedingungen zum Tragen, nämlich speziell in (der Wiedergabe) mündlicher Rede. Wir betrachten die einzelnen Verblemmata innerhalb der Gruppe der Subjektkontrollverben unter der prototypischen Kontrollkonfiguration, d.h. Subjektkontrolle, daraufhin, in welchem Maße es sich bei den Belegen um wörtliche Rede bzw. um die direkte Wiedergabe von wörtlicher Rede handelt. Die Tabelle ist nach der Natürlichkeit des Vorkommens des Verblemmas in wörtlicher Rede, d.h. als performatives Verb, geordnet. Für die Konstruktionen mit dass-Komplementen unter Koreferenz ist neben dem Anteil modalisierter Komplementsätze auch der der zwei agentivische Subjekte miteinander identifiziert werden, dann ist dieses Ideal offenbar an die zu-infinite Realisierung gekoppelt. Patrick Brandt unter Mitwirkung von Felix Bildhauer 280 Anteil derjenigen Belege gegeben, bei denen es sich aller Wahrscheinlichkeit nach um wörtliche Rede bzw. die Wiedergabe wörtlicher Rede handelt. 47 In der jeweils oberen Zelle steht die Gesamtzahl der Belege mit dass-finiten Komplementen, darunter links die Zahl der Belege (der Wiedergabe) wörtlicher Rede, rechts die Zahl der im Komplementsatz modalisierten Belege. Verb KoRef = 1 KoRef = 0 schwören 101 61 85 17 48 15 versprechen 56 111 37 2 46 14 versichern 32 85 16 7 24 9 anbieten 23 96 13 5 30 50 zusichern 35 127 14 3 38 10 zusagen 42 133 23 13 35 35 drohen 55 79 19 7 7 20 tab. 25: Subjektkontrollverben - dass komplemente, koreferenz und wörtliche rede Das Lemma schwören sticht heraus, indem hier zunächst fast doppelt so viele Fälle mit Koreferenz gezählt werden wie ohne. Alle anderen Verben zeigen ein umgekehrtes Verhältnis. Dabei weisen 17 der 101 Belege mit schwören und dass- Komplement einen modalisierten Komplementsatz auf; in der überwiegenden Zahl handelt es sich um buletisches wollen, das durch den Bezug auf die Wünsche des Subjektreferenten in Richtung einer Interpretation in Begriffen der Möglichkeit und damit einer schwächeren Interpretation wirkt. Tatsächlich erscheinen viele Fälle von Belegen mit schwören dilemmatisch: Einerseits 47 Kriterien zur Klassifizierung als wörtliche Rede oder Wiedergabe von wörtlicher Rede waren Vorkommen von Personalpronomen der ersten (Sprecher) bzw. zweiten (Adressat) Person sowie Hinweise wie Anführungszeichen oder Ausdrücke, die explizit auf den Sprechakt referieren (z.B.: „… sagte eine Stimme …“, „… berichtete der Angeklagte …“). In bestimmten Kontexten wie z.B. Berichten über Gerichtsverhandlungen ist auch beim Gebrauch indirekter Rede die Treue zum Wortlaut wahrscheinlich. In Zweifelsfällen wurde zu ungunsten der Klassifizierung als wörtliche Rede oder Wiedergabe von wörtlicher Rede entschieden. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 281 zielt die Verwendung von schwören auf möglichst verbindliche Selbstverpflichtung. Andererseits ist die Semantik der Konstruktion ohne Weiteres oft zu stark, als dass der Sprecher für deren Wahrheit bürgen könnte; Sprecher greifen dann regelmäßig zu der Strategie, die Bedeutung mittels Modalisierung wiederum abzuschwächen, vgl. die folgenden Belege. (62) Wir haben uns in der Halbzeit geschworen, dass wir hier nicht verlieren wollen. (vgl. ? … hier nicht zu verlieren / hier nicht verlieren zu wollen) (Hamburger Morgenpost, 15.10.2010; Der Titel führt nur über den THW, S. 44) (63) Glücklicherweise hatte ich mir bereits während des Studiums geschworen, dass ich nie vom Verkauf meiner Werke abhängig sein wollte. (Zürcher Tagesanzeiger, 26.4.1996, Kultur; Geld und Geist im Kunstbetrieb, S. 95) (64) Wir haben uns geschworen, dass wir den Zuschauern das zurückgeben wollten, was sie in uns investiert haben, sagte Christian Eichner. (Hamburger Morgenpost, 8.12.2008; SEITENLINIE, S. 6) Tatsächlich ist die Semantik dieser Belege wiederum so schwach, dass auch bei Nichteintreten des im Komplementsatz kodierten Sachverhalts der Sprecher nicht haftbar gemacht werden könnte. Sprachliche Mechanismen der Verstärkung und der Abschwächung sind Brot und Butter in der alltäglichen Kommunikation und entsprechend vielfältig; nicht selten findet man Reflexe beider Mechanismen in ein und derselben Struktur. Es kommt hinzu, dass Sprecher in diesem Bereich nicht immer glücklich agieren. So erweist sich mancher Fall von Modalisierung als redundant oder sogar semantisch „falsch“ - in dem in (65) berichteten Ereignis hat die infrage stehende handelnde Person höchstwahrscheinlich ja keine modalisierte und damit schwächere Drohung ausgesprochen („Ich will dich abstechen“) sondern eine nicht modalisierte und damit stärkere („Ich steche dich ab“). 48 48 Auch an anderer Stelle fällt auf, dass insbesondere permissive Modalverben z.B. bei Verben, die eine Autorisierung ausdrücken, fehlen, obwohl sie semantisch anzusetzen wären. Betroffen sind offenbar nur finite dass-Komplemente, man vergleiche den ausnahmehaften Fall in (i) und den regulären Fall in (ii) (vgl. zu der in Infinitiven angelegten Modalität Abschn. 4.4.1). (i) Wir haben der Bewag zugestanden, dass sie sich an der Veag mit Minderheitsbeteiligung von 25 Prozent beteiligt. (die tageszeitung, 18.7.2002; und sonst? , S. 18) (ii) Bei der Handelskonferenz von Doha 2001 haben die USA und die EU den Entwicklungsländern zugestanden, dass diese Arzneimittelpatente der Pharmakonzerne brechen dürfen. (die tageszeitung, 28.6.2003; Die Globalisierung ist zu Ende, S. 8) Umgekehrt stehen (permissive) Modalverben zuweilen an Stellen, wo sie als eigentlich überflüssig empfunden werden, nämlich bei infiniten zu-Komplementen, vgl. etwa Beispiel (53). Patrick Brandt unter Mitwirkung von Felix Bildhauer 282 (65) Mit einem Dolch habe er einer Frau gedroht, sie abstechen zu wollen. (Rhein-Zeitung, 13.3.2007; Feuer in Kapelle der Psychiatrie gelegt) Umgekehrt finden wir auch Fälle von Verstärkung mittels Modalisierung im Sinne von Notwendigkeit, die wie in dem Beispiel in (66) zu einer allzu starken Semantik zu führen scheint. (66) Den Auszug eines 19-jährigen hat dessen Mutter versucht zu verhindern, indem sie ihn einsperrte und den Ausweis versteckte. […] Die Polizei veranlasste, dass die Eltern ihn ziehen lassen mussten. (Mannheimer Morgen 6.5.2015; Mutter sperrt Sohn ein, S. 27) Es ist klar, dass das Zusammenspiel von Mechanismen der Schwächung und Stärkung komplex ist und darüber hinaus mit Eigenschaften auf anderen Ebenen, z.B. der des Mediums, interagiert. Nicht zuletzt mag Mündlichkeit die Realisierung dass-finiter Komplemente unter Kontrollbedingung begünstigen, da Sprecher durch den eigentlich redundanten Ausdruck des Subjekts Zeit für die weitere Sprechplanung gewinnen (vgl. Biber et al. 1999, S. 1068ff.). Eine genauere Untersuchung der Zusammenhänge muss in die Zukunft verschoben werden. 4.5 Adjektivische Passive und Korrelate Ein Nebenbzw. Abfallprodukt aus der im Rahmen dieser Studie vorgenommenen umfänglichen Annotation stellt der Zusammenhang des Vorkommens von Korrelaten und adjektivisch-passivischer Realisierung bestimmter Lemmata dar. Nach Augenschein kommt ein sogenanntes Korrelat-es in adjektivisch-passivischen Strukturen besonders häufig vor; wenigstens in bestimmten Fällen scheint Korrelat-es in adjektivisch-passivischen Strukturen stärker gefordert als in verbal-passivischen Strukturen, wo es auch als störend empfunden werden kann, man vergleiche das adjektivisch-passivische Korpusbeispiel in (67) mit seinem (konstruierten) verbal-passivischen Pendant in (67‘). (67) Seit Jahrzehnten war es der CIA offiziell verboten, Anschläge zu verüben. (Nürnberger Nachrichten, 22.10.2001, Auftrag an die CIA - Befehl zu Morden? - Angeblich soll bin Laden getötet werden, S. 1) (67‘) Seit Jahrzehnten wurde (? es) der CIA offiziell verboten, Anschläge zu verüben. Der Großteil der Vorkommen von Korrelat-es fällt in die Gruppe der ungültigen Belege, wobei adjektivisch-passivische Konstruktion den Hauptgrund Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 283 für die Ausmusterung von Belegen aus dem den einzelnen Vergleichen zugrundeliegenden Teilkorpus abgibt. 49 Tabelle (26) zeigt die Zahlen. Korrelat-es Restliche Belege Gültige Belege 48 7.472 Ungültige adjektivisch-passivische Belege 64 475 tab. 26: korrelat es und adjektivisch passivische realisierung Nach Helbig/ Buscha (1998, S. 670) sind (extraponierte) Nebensätze immer mittels Korrelat im Matrixsatz verankert. Eisenberg (2013, S. 324) betrachtet obligatorisch im Mittelfeld zu realisierendes Korrelat-es als eine Art „Adapter“ für den Anschluss bestimmter ansonsten integrationsresistenter Elemente: 50 „Je weniger eine Komplementposition für Sätze syntaktisch festgeschrieben ist, desto eher braucht sie ‘es’ zur Anbindung des Satzes.“ Unsere Zahlen scheinen Eisenbergs Position zu unterstützen: Zum einen ist das Auftreten von Korrelaten bei Subjektkontrollverben besonders selten; wir haben bereits an verschiedenen Stellen Hinweise darauf gesehen, dass Subjektkontrollstrukturen als besonders stark grammatikalisiert anzusehen sind; solch starke Grammatikalisierung scheint mit regelmäßigen Anschlussproblemen des Komplements nicht kompatibel. Bezüglich Antikontrollverben dagegen gibt es Gründe, den Anschluss eines Satzkomplements als eher problematisch anzusehen (vgl. Brandt/ Trawiński/ Wöllstein 2015). Besonders häufig kommt 49 Es wurden nur eindeutige Vorkommen von Korrelat-es im Mittelfeld gezählt; (möglicherweise) grammatisch unabhängig motivierte Vorkommen von sogenanntem Vorfeld- (auch: Stellungs-) es wurden ausgeschlossen. Verschiedentlich werden Korrelate als Zeichen betrachtet, die bestimmte propositionale Gehalte „ankündigen“. Das Vorkommen von Korrelat-es ist immer stellungsgebunden, indem es nur bei Positionierung des Komplements im Nachfeld (viz. Extraposition) vorkommt. Mit Eisenberg (2013, S. 173ff.) sind innerhalb des „semantisch leeren“ (vs. phorisches, argumentstellenbesetzendes) es das rein grammatisch bedingte expletive es, das rhematisierende Vorfeld-es und eben das Korrelat-es zu unterscheiden, vgl. (i)-(iii): (i) Es schneit. (ii) Es naht ein Gewitter. (iii) Er schaffte es, zu verschwinden. 50 Ähnlich Köhler (1976). Die Frage der Obligatorik bzw. Fakultativität von Korrelaten bei bestimmten Verben bzw. Konstruktionen wird in der Literatur nicht einheitlich beantwortet, die relevanten Daten sind umstritten. Einen Überblick über verschiedene Typen von Korrelaten und ihre Behandlung in der Literatur gibt Pittner (1999, S. 154ff.); vgl. für rezenten Überblick und Diskussion Mollica (2010, S. 51ff.). Angesichts einer zu vermutenden stärkeren Integrationsresistenz von dass-Komplementen formulieren Zifonun, Hoffmann und Strecker (1997, S. 1483-1484) zu Obligatorik/ Fakultativität von Korrelaten: „Insgesamt sind Subjunktorsätze korrelatfreundlicher als Infinitivkonstruktionen.“ In der pauschalen Betrachtung bestätigt sich die Behauptung nicht, indem Korrelate in Konstruktionen mit zu-Komplementen insgesamt häufiger vorkommen als in Konstruktion mit dass-Komplementen, nämlich 187- (von 3.741) vs. 139- (von 3.949) mal. Patrick Brandt unter Mitwirkung von Felix Bildhauer 284 Korrelat-es in Dativobjektkontrollstrukturen vor; wiewohl möglicherweise prosodische Gründe gegen das gleichzeitige Auftreten von Dativen und Korrelaten sprechen mögen, treten in dieser Klasse in fast der Hälfte der Fälle (15 von 34) Dative und Korrelate gleichzeitig auf. Zu den Korrelaten zählen unter anderem auch Pronominaladverbien wie dazu, dafür oder damit, die mit Weinrich (2003, S. 569) als „Vorsignale für ein Inhaltsadjunkt mit dass-“ fungieren. Innerhalb der durch Pronominaladverbien ausgedrückten Korrelate gibt es strukturelle Unterschiede, die hier jedoch nicht systematisch berücksichtigt werden; so lässt sich in bestimmten Fällen z.B. beobachten, dass ein als Korrelat fungierendes Pronominaladverb dazu ohne Bedeutungsänderung weggelassen werden kann (68), was für das Pronominaladverb dafür, sofern es in denselben Kontexten vorkommen kann, nicht der Fall ist; vielmehr führt die Weglassung von dafür zu eben der Interpretation, die sich unter Verwendung von dazu ergibt (vgl. den Korpusbeleg in (69) mit künstlich hinzukonstruiertem dafür). 51 (68) So wurde ein Ladendieb dazu verurteilt, 10.000mal zu schreiben: „Ich werde nie wieder fremder Leute Eigentum stehlen“ (Neue Kronen-Zeitung, 12.2.1994; USA: Ungewöhnliche Strafen für Kriminelle, S. 6) (69) Die Vermieterin wurde (dafür) verurteilt, die Erlaubnis zu erteilen. (die tageszeitung, 24.2.1999, Ressort: Bunte; Ungekündigt, S. 24) Im Bereich der durch Pronominaladverbien realisierten Korrelate sind die Verhältnisse insgesamt komplex (vgl. Köhler 1976, S. 227ff. oder Engel 1991, S. 252ff.). In den Listen dieser Autoren sind vorrangig Akkusativobjektkontrollverben unter den Verben, die als obligatorisch mit einem Korrelat zu realisieren angegeben sind (vgl. ebendort). Einen Überblick über verschiedene Typen von Korrelaten und ihre Behandlung in der Literatur gibt Pittner (1999, S. 154ff.); wie auch Mollica (2010) bezüglich des Korrelat-es bemerkt, könnten gerade korpuslinguistische Untersuchungen dabei helfen, diesen durch uneinheitliche Einschätzungen der Daten geprägten und bisher nicht genügend 51 Aus Platzgründen können wir nicht eingehender auf Unterschiede zwischen Strukturen mit verschiedenen Pronominaladverbien eingehen. Für die Unterscheidung zwischen Ergänzungen (Komplementen) und Angaben (Adjunkten) einschlägige Tests deuten darauf hin, dass der Anschluss an das Verb mittels dazu enger ist als der mit dafür oder auch damit. Durch dazu vertretene Komplemente scheinen den Status „echter“ (Präpositional-)Objekte (valenzgrammatischer Ergänzungen) zu haben, während durch dafür oder auch damit vertretene satzwertige Projektionen eher als Angaben zu fungieren scheinen, vgl. etwa die Ersetzbarkeit der relevanten Strukturteile durch einen Adverbialsatz nur in den letzteren Fällen: (i) Sie hat ihn zu einer Gefängnisstrafe verurteilt ≠ Sie hat ihn verurteilt, damit er ins Gefängnis kommt / um ihn ins Gefängnis zu bringen. (ii) Sie hat ihn für das Verbrechen verurteilt = Sie hat ihn verurteilt, weil er ein Verbrechen begangen hat. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 285 systematisch erforschten Bereich auf empirisch stabilere Füße zu stellen. Wie in Abschnitt 3 dargestellt, ist im hier untersuchten Kontext besonders bemerkenswert, dass die Verteilung „adverbialer“ Korrelate wiederum auf die strukturelle Nähe zwischen Akkusativobjektkontrollverben und Antikontrollverben hinweist. Hinsichtlich des Auftretens von Korrelat-es in adjektivischen Strukturen stellt Eisenberg (2013, S. 409, 451) die Generalisierung in (70) auf, die er mit (71) illustriert. (70) Adjektive, die auch einen zu-Infinitiv als Subjekt zulassen, verlangen es, auch wenn das Vorfeld anderweitig besetzt ist. Wo kein zu- Infinitiv als Subjekt möglich ist, kann es wegfallen. (71) Bald ist *(es) erlaubt, dass man neues Terrain betritt. Bald ist (es) klar, dass man neues Terrain betritt. Stichprobenhaft betrachtete adjektivisch-passivische Strukturen aus dem Korpus scheinen die Generalisierung insgesamt zu bestätigen, was die adjektivische Qualität der einschlägigen Belege untermauert. Die Weglassung des Korrelat-es bei adjektivisch-passivischen Verblemmata, die zu-Infinitive als Subjekt erlauben, führt regelmäßig zu intuitiv fragwürdigen Ergebnissen, vgl. den Beleg in (72), in dem Korrelat-es obligatorisch ist. (72) Mathematik hat noch eine besondere Schwierigkeit: In der Gesellschaft ist es anerkannt, Mathematik nicht zu können. (Berliner Zeitung, 2.6.2006; Zu Anstrengungen sind nur wenige Schüler bereit) Der Beleg in (73), der dasselbe Prädikat anerkannt enthält, dessen dass-Komplement jedoch nicht durch einen zu-Infinitiv ersetzbar ist, kommt ohne Korrelates aus. 52 (73) Zudem sei allgemein anerkannt, dass trotz überzogener Verfahrensdauer grundsätzlich keine Verfahrenseinstellung erfolgen dürfe. (Rhein-Zeitung, 8.2.2007; Einstellung zu Unrecht? ) Adjektivische Passive werden auch als Zustandspassive bezeichnet, da diese Strukturen ausdrücken, dass sich ihr Subjekt als Resultat der durch das zugehörige verbale Prädikat ausgedrückten Handlung in einem bestimmten Zustand befindet. Verben unterscheiden sich hinsichtlich ihres Potenzials, einen solchen Resultatszustand einzuführen, was an der Möglichkeit bzw. Natürlichkeit einer adjektivisch-passivischen Konstruktion abzulesen ist. Adjektivischpassivische Korpusbeispiele sind in (74) und (75) gegeben. 52 In (73) ist das Prädikat allerdings adverbial modifiziert; es ist denkbar, dass das Adverb alternativ zu Korrelat-es eventuell bestehende Bedingungen zur formalen Besetzung bestimmter Positionen erfüllt (die z.B. phonologisch begründet sein können). Patrick Brandt unter Mitwirkung von Felix Bildhauer 286 (74) Nach islamischer Rechtsauffassung ist es streng verboten, dass unverheiratete Paare gemeinsam übernachten. (dpa, 29.12.2007; Ägyptischer Abgeordneter empört sich über Sarkozys Liebesreise) (75) So war es den Frauen beispielsweise verboten, ohne Erlaubnis zu telefonieren. (Nürnberger Zeitung, 16.1.2010, S. 32; Schwere Vorwürfe gegen Sektenführer in Israel - Frauen als Sklavinnen gehalten) Tabelle 27 zeigt die Zahlen adjektivisch-passivischer Strukturen für die einzelnen Verbklassen (ausgenommen sind die nur stichprobenhaft ausführlich annotierten Akkusativobjektkontrollverben, siehe oben). Gültige Belege Adjektivische Passive DO-KV 3.081 381 A-KV 2.080 215 SU-KV 2.360 6 tab. 27: Verbklassen, gültige und adjektivisch passivische Belege Es wird deutlich, dass adjektivische Passive im Bereich von Dativobjektkontrollverben in hochsignifikantem Maße überrepräsentiert sind; auch bei Antikontrollverben sind adjektivische Passive in vergleichsweise signifikantem Maße überrepräsentiert. Subjektkontrollverben stechen wiederum deutlich heraus; adjektivisch-passivische Strukturen sind hier in hochsignifikantem Maße unterrepräsentiert, wie der Mosaikplot zeigt (die Effektstärke ist mit Phi = 0.1770494 allerdings als gering anzusehen). Die Befunde sprechen dafür, dass namentlich in Dativobjektkontrollstrukturen so etwas wie ein Resultatszustand semantisch prominent repräsentiert ist, während das im Fall von Subjektkontrollstrukturen nicht der Fall zu sein scheint. Es sieht nicht so aus, als ob dies an einzelnen Verben und ihrer spezifischen Semantik liegt; ein Blick auf die verbspezifischen Zahlen zeigt, dass die ersten Plätze einer Rangliste, an deren Spitze anteilsmäßig häufig adjektivisch-passivisch realisierte Verblemmata stehen, durch Dativobjektkontrollverben besetzt sind, während Subjektkontrollverben erst ungefähr in der zweiten Hälfte vertreten sind. 53 53 Brandt (2003, 2006) argumentiert dafür, dass so etwas wie die semantische Repräsentation eines Resultatzustandes eine Lizenzierungsbedingung für produktiv vorkommende Dativargumente im Deutschen darstellt. Einen ähnlichen Effekt können nach Brandts Analyse allerdings auch andere semantische Merkmale haben wie z.B. die Zugehörigkeit zu bestimmten komparativischen Strukturtypen (die im Rahmen der vorliegenden Belegsammlung nicht annotiert sind). Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 287 abb. 9: Mosaikplot Verbklassen, gültige und adjektivisch passivische Belege Verb Gültig Adj.-passivisch Adj.-passivisch/ gültig Klasse gewähren 2 3 1,5 DO-KV verwehren 18 25 1,389 DO-KV vorschreiben 97 75 0,773 DO-KV verbieten 126 93 0,738 DO-KV gestatten 88 59 0,670 DO-KV verurteilen 107 49 0,458 A-KV erlauben 132 56 0,424 DO-KV untersagen 138 47 0,340 DO-KV fordern 250 72 0,288 A-KV veranlassen 305 55 0,180 A-KV absegnen 6 1 0,167 A-KV anerkennen 139 21 0,151 A-KV anraten 28 4 0,143 DO-KV garantieren 24 3 0,125 SU-KV Patrick Brandt unter Mitwirkung von Felix Bildhauer 288 zugestehen 141 8 0,057 DO-KV auftragen 84 4 0,048 DO-KV akzeptieren 129 6 0,046 A-KV verlangen 160 5 0,031 A-KV billigen 37 1 0,027 A-KV versichern 226 4 0,017 SU-KV abraten 126 2 0,016 DO-KV anordnen 283 3 0,010 A-KV kritisieren 107 1 0,009 A-KV vorhalten 157 1 0,006 DO-KV versprechen 373 2 0,005 SU-KV zusagen 379 2 0,005 SU-KV befehlen 223 1 0,004 DO-KV beantragen 343 1 0,002 A-KV wertschätzen 0 1 - A-KV Total 4.228 605 tab. 28: Verben, Verbklassen und Quotient adjektivisch passivische: gültige Belege Wir betrachten nun die Distribution von Korrelat-es in Kombination mit adjektivischen Passiven und gelangen zu den Zahlen in der folgenden Tabelle. es und adj.-pass. es und gültig Rest A-KV 0 18 3.304 SU-KV 0 4 2.897 DO-KV 64 26 4.199 tab. 29: Verbklassen, adjektivisch passivische realisierung und korrelat es Trotz der geringen Zahl einschlägiger Belege ergibt sich ein Bild, nach dem Dativobjektkontrollverben insgesamt am häufigsten mit Korrelat-es vorkommen, und exklusiv und in deutlich überwiegender Zahl adjektivisch-passivisch mit Korrelat-es. Der Intuition folgend, dass Korrelat-es propositionale Inhalte „ankündigt“, scheint der Zusammenhang weiter verfolgenswert; dass die korpuslinguistische Untersuchung des empirisch umstrittenen Bereichs der Korrelate besonders fruchtbar sein kann, scheint deutlich. Es fehlen wiederum Daten zu Akkusativobjektkontrollverben, für die allerdings als Korrelate nur Pronominaladverbien infrage zu kommen scheinen. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 289 5. zusammenfassung 5.1 Linguistische Aspekte Die Studie hat neue, deutliche Evidenz für einen Zusammenhang zwischen Kontrolle und zu-Komplementation geliefert, wie er in der Literatur schon postuliert wurde (z.B. Wöllstein 2015; Rapp et al. 2017). Die zentrale Hypothese in (25) wird bestätigt: (25) Wenn Kontrollbedingungen vorliegen, wird ceteris paribus zu-infinitivisch komplementiert. Dabei werden Unterschiede zwischen einzelnen Typen der Kontrolle offenbar, die zwar hinsichtlich des generellen Zusammenhangs in (25) untergeordnet sind, allerdings interessanterweise entlang etablierter Hierarchien verlaufen, die grammatische Funktionen betreffen (vgl. im Zusammenhang von z.B. Relativierung einzelner Satzglieder Comrie 1981). Von links nach rechts fällt der Einfluss in Richtung der zu-Komplementierung je nach kontrollierendem Matrixargument wie in (76). (76) Objekt AKK (AO-K) > Subjekt (SU-K) > Objekt DAT (DO-K) > Komplement PP (PK-K) Diese Ordnung nach Kontrolltypen lässt sich im Sinne von Köpcke als eine Hierarchie der Qualität im Hinblick auf das Ideal der Identifizierung eines verantwortlichen Matrixargumentreferenten mit einem verantwortlichen Referenten des eingebetteten (logischen PRO-) Subjekts interpretieren; sie präsentiert sich als die Generalisierung in (27). (27) Je besser die Qualität der Kontrolle, desto eher wird zu-infinit komplementiert Nicht letztlich deutlich ist dabei, ob Subjekt- oder Akkusativobjektkontrolle den eigentlich prototypischen Fall für Kontrolle darstellen - die beiden Kontrolltypen unterscheiden sich bezüglich der Stärke, mit der sie in Richtung der zu-Komplementierung wirken, nur minimal. 54 An den Polen der Hierarchie 54 Die Ähnlichkeit von Subjekt- und Akkusativobjektkontrolle weist wiederum auf die grammatische Zentralität transitiver Strukturkonfigurationen hin. In Verlängerung der hier postulierten Parallelität von Akkusativobjektkontrollstrukturen und Antikontrollstrukturen ließe sich spekulieren, dass Subjektkontrollstrukturen durch eine allerdings oberflächlich nicht ausgedrückte Reflexivierungsoperation aus Akkusativobjektkontrollstrukturen abgeleitet sind. Für eine solche Analyse könnte sprechen, dass die Akkusativobjektstelle in Subjektkontrollstrukturen grundsätzlich nicht overt besetzt werden kann. Dafür, dass Subjektkontrolle über eine grammatische Regel zustande kommt, scheint auch der späte Erwerb der Konstruktion zu sprechen, vgl. Fußnote 9 oben. Patrick Brandt unter Mitwirkung von Felix Bildhauer 290 haben wir in der Begrifflichkeit aus Abschnitt 2 die folgenden qualitativen Schemata für Subjektkontrolle bzw. Akkusativobjektkontrolle und Kontrolle durch eine thematisch mit dem Verb verbundene Präpositionalphrase: gut: SU/ OB AKK+verantwortlich kontrolliert SU +verantwortlich minder: PK +/ -verantworitlich kontrolliert SU +/ -verantwortlich An verschiedenen Stellen zeigt sich, dass die zuvs. dass- Alternation gerade auch für systemgrammatische Fragen fruchtbar gemacht werden kann. Mit Blick auf die Grammatik als in wesentlichen Teilen regelhaft gesteuertes Produktionssystem ist festzuhalten: - Die Rekurrenz immer wieder derselben Kontrollstrukturen über alle betrachteten Korpusdaten hinweg deutet darauf hin, dass die Menge möglicher Kontrollstrukturtypen insgesamt eng begrenzt ist. Bestimmte Muster bzw. Alternationen treten gehäuft jeweils unter bestimmten Bedingungen auf. Sie sind offenbar von ähnlichen Bedingungen abhängig, die das grammatische Skelett des betrachteten Phänomenbereichs darstellen. - Unter den Kontrollstrukturtypen stellen Subjektkontrollstrukturen so etwas wie einen Idealfall dar, der bezüglich der Kopplung von Form und Funktion besonders stark festgelegt ist und mehr als andere Strukturtypen auch mit lexikalisch anderweitig spezifizierten Verben vorkommt. Subjektkontrollverben variieren am wenigsten bezüglich der realisierten Kontrollstrukturen. - Innerhalb der untersuchten Fallklassen gehören einerseits Subjekt- und Dativobjektkontrollstrukturen zueinander, wie am Phänomen der „geteilten Kontrolle“ sowie an zwischen Subjekt- und Dativobjektkontrolle oszillierenden Verben wie z.B. anbieten zu sehen ist. Andererseits gehören Akkusativobjektkontrollstrukturen und Antikontrollstrukturen zusammen. Wahrscheinlich handelt es sich um ein und dasselbe Strukturmuster, wobei das Akkusativobjekt im Fall der Realisierung als Antikontrollstruktur unausgedrückt bleibt. Qua Prinzip B bzw. Obviation muss das unausgedrückte kontrollierende Akkusativobjekt als distinkt vom Subjekt interpretiert werden, das Resultat ist Antikontrolle. (77) veranschaulicht noch einmal die Struktur im in Abschnitt 2 präsentierten Format. (77) Vor einer Woche hatte Putin initiator, i pro j gebeten, PRO +resp, j die Terroristen zu finden und zu vernichten. - Für Kontrolle sind einerseits quasi-notwendige Bedingungen im Sinne Levins (1993), namentlich eine semantische Beziehung der Veranwortlichkeit zwischen kontrollierendem Argument und dem im Komplement kodierten Sachverhalt wesentlich, andererseits spielen im linguistischen Kontext Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 291 identifizierbare Faktoren eine Rolle, die Kontrolle (und mithin zu-Komplementierung) begünstigen bzw. verhindern können; dazu gehören z.B. Passivierung oder Modalisierung des Komplementsatzes (Abschn. 4.3). - Die geringe Frequenz von Operationen, die zu einer Minderung des Agentivitätsgrades des eingebetteten Subjekts führen, deutet darauf hin, dass unsichtbare logische Subjekte (PRO) im Sinne von Panther und Köpcke (1993) inhärent agentivisch interpretiert werden. Interessanterweise ermöglichen solche agentivitätsmindernden Operationen gerade dort die zu- Komplementierung, wo das Gegebensein der vermeintlich für Kontrolle notwendigen Verantwortlichkeitsbeziehung fraglich ist. Während die Grammatik im Kernbereich von Kontrollphänomenen auf die Manipulation der Struktur zur Erreichung von („idealer“ Subjekt-) Kontrollbedingungen setzt, greift so etwas wie eine Herabsetzung der Standards offenbar in Randphänomenbereichen, die von vornherein keine „guten“ Kontrollkonfigurationen abgeben (vgl. oben Abschn. 2.3). - Die Betrachtung lexikalisch nicht festschreibbarer, aber Kontrolle und zu- Komplementation beeinflussender Faktoren deutet darauf hin, dass der linguistische Kontext eine größere Rolle spielt, als ausgeprägte lexikalische Trägheit vermuten lassen würde (Abschn. 4.3). - Die niedrige Vorkommensfrequenz von Modalisierung in zu-Komplementen (Abschn. 4.2, 4.3) weist ebenso wie die Nahbetrachtung unter dass- Komplementierung modalisierungsaffiner verbspezifischer Strukturen darauf hin, dass jenseits von Kontrolle der Wunsch nach Ausdruck von Modalität die zu-Komplementation motivieren kann (Abschn. 4.4.1). In diesem Sinne ist es eigentlich nicht so, dass der Ausdruck von Modalisierung die Wahrscheinlichkeit der zu-Komplementierung senkt (vgl. 4.2); vielmehr kann die zu-Komplementierung selbst Modalisierung ausdrücken und daher eine weitergehende explizite Markierung von Modalität „ausbluten“. Umgekehrt können dass-Komplemente trotz Vorliegens von Kontrolle offenbar dann erscheinen, wenn spezifische kontextuelle Bedingungen besondere Explizitheit verlangen (Abschn. 4.4.2). - Die Untersuchung der anteilsmäßigen Ausprägung bestimmter Varianten und der ihr zugrundeliegenden Faktoren ist neben der Formulierung absoluter Bedingungen für das Vorkommen dieser Varianten ein für die Erstellung bzw. Überprüfung syntaktisch-semantisch begründeter Taxonomien wertvolles Instrument. Verbklassen sind allerdings in bestimmten Bereichen nur dann eine brauchbare Basis, wenn lexikalische Ambiguitäten berücksichtigt werden. 55 55 Damit ist noch nicht klar, wie diese berücksichtigt werden sollen; die Zuweisung verschiedener Lemmata zu einzelnen Formen wäre nicht mehr als eine Beschreibung des Problems. Patrick Brandt unter Mitwirkung von Felix Bildhauer 292 Insgesamt kann die Frage, ob sich größere Teile der Sprachproduktion auf wiederkehrende Bestandteile und deren Kombinationsmuster reduzieren lassen, für den betrachteten Bereich positiv beantwortet werden. 5.2 Methodische Aspekte In der vorliegenden Studie wurden einerseits Datensätze erheblicher Größe und - hier nur zum Teil beschriebener, aber möglichst exakt erfasster - Heterogenität in bestimmten grammatischen Dimensionen daraufhin untersucht, ob sie Evidenz für die untersuchte Hypothese liefern. Andererseits wurden relativ eng definierte Ausschnitte aus den Korpusdaten im Hinblick auf das Auftreten angesichts bestimmter Annahmen erwartbarer Muster betrachtet. Logistische Regressionsmodelle (Abschn. 4.2) nehmen alle Daten auf einmal und alle in Anschlag gebrachten Faktoren in Abhängigkeit voneinander in den Blick. Ein Modell, das Koreferenz sowie die Art der Koreferenz in Begriffen des kontrollierenden Arguments als feste Effekte sowie das Verblemma als Zufallseffekt in Anschlag bringt, kann über 85% der Daten erfassen. Weiter zu fragen ist dabei nach der Rolle des Verblemmas als die Verbklasse ersetzende Information. Gleichzeitig werden die Grenzen logistischer Regressionsanalyse sichtbar, die nur für solche Variablen interessante Ergebnisse liefert, die logisch voneinander unabhängig sind und die darüber hinaus grundsätzlich über alle Daten hinweg einschlägig sind. Für den Kontrolltyp ist dies der Fall, aber nicht z.B. für die Präsenz eines Dativarguments im Matrixsatz, die im Fall von Dativobjektkontrollverben in Richtung der zu-Komplementierung wirkt, aber im Großteil der Daten überhaupt nicht möglich ist. Operationen wie die overte Modalisierung oder Passivierung des Komplementsatzes senken die Wahrscheinlichkeit der zu-Komplementierung insgesamt, können allerdings in durch die Verbklasse definierten Teilbereichen der Daten Kontrolle und mithin zu-Komplementation begünstigen (Abschn. 4.2, 4.3). Es ist also möglich und auch wahrscheinlich, dass aus Sicht des Grammatikers interessante Beziehungen und Korrelationen aufgrund ihres Nischendaseins und der damit verbundenen niedrigen Vorkommensfrequenz bei pauschaler statistischer Analyse der Daten unentdeckt bleiben oder falsch interpretiert werden. Die wiederholte Durchführung von Regressionsanalysen unter alternativen Taxonomien wie auch bezüglich separierter tatsächlich für einzelne Faktoren einschlägiger Teilbereiche der Daten wäre geeignet, die Daten besser zu ordnen und die Qualität in Anschlag gebrachter Taxonomien zu prüfen. Ein in einem bestimmten Bereich starker Effekt oder eine nur lokal greifende Regel kann in der globalen Betrachtung gar nicht oder als schwacher Effekt erscheinen oder gänzlich falsch interpretiert werden (vgl. Abschn. 4.2, 4.3). Dass man es mit einem lokalen Effekt zu tun hat, zeigt sich daran, dass der Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 293 Effekt innerhalb eines bestimmten Bereichs signifikant und stark ist, bei Erweiterung des betrachteten Bereichs aber an Signifikanz und Stärke verliert. Das richtige Scharfstellen des Bereichs könnte durch Ausprobieren inklusiverer bzw. exklusiverer Beschränkungen bei gleichzeitiger Kontrolle von Signifikanz und Effektstärken quasi mechanisch erfolgen; die primäre Auswahl eines bestimmten Bereichs bleibt allerdings ein nicht hintergehbares Ergebnis intelligenter Spekulation. Die theoretisch motivierte Eingrenzung der jeweils betrachteten Phänomenbereiche passt zu einer modularen Sicht auf die Grammatik, nach der bestimmte Regeln und Prinzipien in je spezifischer Weise in bestimmten Phänomenbereichen wirksam sind. Demgegenüber passt die prinzipielle Gleichbehandlung aller möglicher Einflussgrößen über prinzipiell alle Daten hinweg zu einer frequenzfundierten Sicht auf die Grammatik, die dann letztlich nichts anderes darstellt als die Verfestigung bestimmter Muster aufgrund deren Häufigkeit im Gebrauch. Häufigkeiten sind für alles Beobachtbare einschlägig und machen es dadurch vergleichbar. Umgekehrt führt die Berücksichtigung feinerer Unterscheidungen und der Versuch des im Sinne der strukturalistischen Minimalpaarstrategie gerechten Vergleichs häufig zu geringen Fallzahlen, die wiederum belastbaren statistischen Ergebnissen entgegenstehen. Nicht zu unterschätzen, sondern möglichst bei der Planung zu berücksichtigen ist der Umstand, dass an den Daten und bei ihrer Annotation gemachte Beobachtungen regelmäßig zu neuen Hypothesen und Generalisierungen führen, deren Überprüfung wiederum die Erhebung von Zusatzeigenschaften innerhalb der Daten, d.h. neue Annotationsarbeit, bedeuten kann. Für hypothesengeleitete empirische Arbeit, wie sie hier präsentiert wurde, sollten daher verschiedene Erhebungs- und Annotationsphasen eingeplant werden. Gerade die Annotation sich als relevant erweisender semantischer Eigenschaften ist nur von Hand zu leisten; eventuell muss man fragen, wie hoch dieser Aufwand im Kontext der Herstellung einer umfassenden Grammatik sein darf. Andererseits hat gerade die manuelle Datensichtung und Annotationsarbeit großes Innovationspotenzial. Mit Pullum (2017) zu schließen: One advantage of corpus investigation that I have not seen mentioned by corpus linguists, though it strikes me as important, concerns serendipity: I find that whenever I search a corpus I always learn new things that I wasn’t initially looking for. Ein Vorteil von Korpusuntersuchungen, den ich Korpuslinguisten nicht habe herausstellen hören und der mir aber wichtig scheint, betrifft glücklichen Zufall: Ich stelle fest, dass ich immer, wenn ich einen Korpus durchsuche, Neues lerne, das ich ursprünglich nicht gesucht habe. Patrick Brandt unter Mitwirkung von Felix Bildhauer 294 literatur Akaike, Hirotogu (1973): Information theory and an extension of the Maximum Likelihood Principle. In: Petrov, Boris N./ Csáki, Frigyes (Hg.): Second International Symposium on Information Theory, Tsahkadsor, Armenien, USSR, 2.-8. September 1971. Budapest: Akadémiai Kiadó, S. 267-281. Bayer, Josef/ Brandner, Eleonore (2004): Klitisiertes zu im Bairischen und Alemannischen. In: Patocka, Franz/ Wiesinger, Peter (Hg.): Morphologie und Syntax deutscher Dialekte und historische Dialektologie des Deutschen. Beiträge zum 1. Kongress der Internationalen Gesellschaft für Dialektologie des Deutschen, Marburg/ Lahn, 5.-8. März 2003. Wien: Praesens, S. 160-188. Bech, Gunnar (1974): Zur Koeffizienz der deutschen Verben des Bittens. In: Engel, Ulrich/ Grebe, Paul (Hg.): Sprachsystem und Sprachgebrauch. Festschrift für Hugo Moser zum 65. Geburtstag. Bd. 1. (= Sprache der Gegenwart 33). Düsseldorf: Schwann, S. 31-32. Bech, Gunnar (1983): Studien über das deutsche Verbum infinitum. 2., unveränd. Aufl. (= Linguistische Arbeiten 139). Tübingen: Niemeyer. Biber, Douglas et al. (1999): Longman grammar of spoken and written English. Harlow: Longman. Bisang, Walter (2014): Overt and hidden complexity. Two types of complexity and their implications. In: Poznan Studies in Contemporary Linguistics 50, 2, S. 127-143. Brandt, Patrick (2003): Cipient predication: Unifying double object, dative experiencer and existential/ presentational constructions. (= LOT Dissertation Series 74). Utrecht: LOT Publications. Brandt, Patrick (2006): Receiving and perceiving datives (cipients): A view from German. In: Hole, Daniel/ Meinunger, André/ Abraham, Werner (Hg.): Datives and other cases: Between argument structure and event structure. (= Studies in Language - Companion Series 75). Amsterdam: Benjamins, S. 103-140. Brandt, Patrick/ Fuß, Eric (2014): Most questionable pronouns: Variation between dasvs. was-relatives in German. In: Linguistische Berichte 239, S. 297-329. Brandt, Patrick/ Trawiński, Beata/ Wöllstein, Angelika (2016): (Anti-)control in German: Evidence from comparative, corpusand psycholinguistic studies. In: Reich, Ingo/ Speyer, Augustin (Hg.): Coand subordination in German and other languages. (= Linguistische Berichte, Sonderheft 21). Hamburg: Buske, S. 77-98. Bubenhofer, Noah/ Konopka, Marek/ Schneider, Roman (2014): Präliminarien einer Korpusgrammatik. (= Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache 4). Tübingen: Narr. Chang, Yung-Li/ Tsai, Wei-Tien Dylan (2001): Actor-sensitivity and obligatory control in Kavalan and some other Formosan languages. In: Language and Linguistics 2, 1, S. 1-20. Chierchia, Gennaro (1984): Topics in the syntax and semantics of infinitives and gerunds. Diss. Amherst, MA: University of Massachusetts. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 295 Chomsky, Carol (1969): The acquisition of syntax in children from 5 to 10. Cambridge, MA: The MIT Press. Comrie, Bernard (1981): Language universals and linguistic typology. Syntax and morphology. Oxford: Blackwell. Dowty, David (1991): Thematic proto-roles and argument selection. In: Language 67, 3, S. 547-619. Eisenberg, Peter (1989): Grundriss der deutschen Grammatik. 2., überarb. u. erw. Aufl. Stuttgart: Metzler. Eisenberg, Peter (2013): Grundriss der deutschen Grammatik. Bd. 1: Der Satz. 4., aktual. u. überarb. Aufl. Stuttgart: Metzler. Engel, Ulrich (1991): Deutsche Grammatik. 2., verb. Aufl. Heidelberg: Groos. Farkas, Donka F. (1988): On obligatory control. In: Linguistics and Philosophy 11, 1, S. 27-58. Fox, John (2003): Effect displays in R for generalised linear models. In: Journal of Statistical Software 8, 15, S. 1-27. Fox, John (2016): Applied regression analysis and generalized linear models. 3. Aufl. Los Angeles u.a.: Sage. Frege, Gottlob (1892): Über Sinn und Bedeutung. In: Zeitschrift für Philosophie und philosophische Kritik 100, S. 25-50. Gelman, Andrew/ Hill, Jennifer (2007): Data analysis using regression and multilevel/ hierarchical models. Cambridge: Cambridge University Press. Goodman, Leo A./ Kruskal, William H. (1954): Measures of association for cross classifications. Journal of the American Statistical Association, 49. S. 732-764. Grice, H. Paul (1975): Logic and conversation. In: Cole, Peter/ Morgan, Jerry L. (Hg.): Syntax and semantics. Bd. 3: Speech acts. New York: Academic Press, S. 41-58. Haiman, John (2011): Competing motivations. In: Song, Jae J. (Hg.): The Oxford handbook of linguistic typology. Oxford: Oxford University Press, S. 148-165. Helbig, Gerhard/ Buscha, Joachim (1998): Deutsche Grammatik. Ein Handbuch für den Ausländerunterricht. 18. Aufl. Leipzig u.a.: Langenscheidt, Verlag Enzyklopädie. Holl, Daniel (2010): Modale Infinitive und dispositionelle Modalität im Deutschen. (= Studia Grammatica 71). Berlin: Akademie Verlag. Horn, Laurence (1984): Toward a new taxonomy for pragmatic inference: Q-based and R-based implicature. In: Schiffrin, Deborah (Hg.): Meaning, form, and use in context: Linguistic applications. Washington, DC: Georgetown University Press, S. 11-42. Horn, Laurence (1989): A natural history of negation. Chicago u.a.: University of Chicago Press. Høyem, Inghild Flaate (2015): Zum Kontrollproblem adverbialer Infinitive im Deutschen. In: Deutsche Sprache 43, S. 159-183. Köhler, Karl-Heinz (1976): Zum Problem der Korrelate in Gliedsätzen. In: Schumacher, Helmut (Hg.): Untersuchungen zur Verbvalenz. Eine Dokumentation über die Ar- Patrick Brandt unter Mitwirkung von Felix Bildhauer 296 beit an einem deutschen Valenzlexikon. (= Forschungsberichte des Instituts für deutsche Sprache 30). Tübingen: Narr, S. 174-239. Krifka, Manfred/ Martens, Silka/ Schwarz, Florian (2003): Group interaction in the cockpit: Some linguistic factors. In: Dietrich, Rainer (Hg.): Communication in high risk environments. (= Linguistische Berichte, Sonderheft 12). Hamburg: Buske, S. 75-102. Larson, Richard K. (1991): Promise and the theory of control. In: Linguistic Inquiry 22, 1, S. 103-139. Levin, Beth (1993): English verb classes and alternations. A preliminary investigation. Chicago u.a.: University of Chicago Press. Levin, Beth/ Hovav, Malka Rappaport (1995): Unaccusativity: At the syntax-lexical semantics interface. (= Linguistic Inquiry Monographs 26). Cambridge, MA u.a.: The MIT Press. Levinson, Stephen C. (1983): Pragmatics. Cambridge: Cambridge University Press. Levinson, Stephen C. (2000): Presumptive meanings. The theory of generalized conversational implicature. Cambridge, MA: The MIT Press. Long, J. Scott (1997): Regression models for categorical and limited dependent variables. (= Advanced Quantitative Techniques in the Social Science 7). Thousand Oaks u.a.: Sage. Lyngfelt, Benjamin (2009): Control phenomena. In: Brisard, Frank/ Östman, Jan-Ola/ Verschueren, Jef: Grammar, meaning and pragmatics. (= Handbook of Pragmatics Highlights 5). Amsterdam/ Philadelphia: Benjamins, S. 33-49. Menard, Scott (2000): Coefficients of determination for multiple logistic regression analysis. In: The American Statistician 54, 1, S. 17-24. Mollica, Fabio (2010): Korrelate im Deutschen und im Italienischen. (= Deutsche Sprachwissenschaft international 9). Frankfurt a.M. u.a.: Lang. Nakagawa, Shinichi/ Schielzeth, Holger (2013): A general and simple method for obtaining R 2 from generalized linear mixed-effects models. In: Methods in Ecology and Evolution 4, 2, S. 133-142. Nerbonne, John (2018): Vaulting Ambition. In: Fuß, Eric et al. (Hg.): Grammar and Corpora 2016. Heidelberg: Heidelberg University Publishing, S. 445-468. Panther, Klaus-Uwe/ Köpcke, Klaus-Michael (1993): A cognitive approach to obligatory control phenomena in English and German. In: Folia Linguistica 27, 1-2, S. 57-105. Pittner, Karin (1999): Adverbiale im Deutschen. Untersuchungen zu ihrer Stellung und Interpretation. (= Studien zur deutschen Grammatik 60). Tübingen: Stauffenburg. Primus, Beatrice (1999): Cases and thematic roles: Ergative, accusative and active. (= Linguistische Arbeiten 393). Tübingen: Niemeyer. Pullum, Geoffrey K. (2017): Theory, data, and the epistemology of syntax. In: Konopka, Marek/ Wöllstein, Angelika (Hg.): Grammatische Variation. Empirische Zugänge und theoretische Modellierung. (= Jahrbuch des Instituts für Deutsche Sprache 2016). Berlin: De Gruyter, S. 283-300. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik 297 Rapp, Irene (2015): Zur Distribution von infiniten Komplementsätzen im Deutschen: Fragen, Fakten und Faktoren. In: Engelberg, Stefan et al. (Hg.): Argumentstruktur zwischen Valenz und Konstruktion. (= Studien zur deutschen Sprache 68). Tübingen: Narr, S. 177-200. Rapp, Irene et al. (2017): Lexikalisch-semantische Passung und argumentstrukturelle Trägheit - eine korpusbasierte Analyse zur Alternation zwischen dass-Sätzen und zu-Infinitiven in Objektfunktion. In: Deutsche Sprache 45, S. 193-221. Reinhart, Tanya (2000): The theta system: Syntactic realization of verbal concepts. OTS Working Papers in Linguistics, University of Utrecht. Reinhart, Tanya (2006): Interface strategies: Optimal and costly computations. (= Linguistic Inquiry Monographs 45). Cambridge MA: The MIT Press. Rosenbaum, Peter S. (1967): The grammar of English predicate complement constructions. Cambridge, MA: The MIT Press. Schwarz, Gideon (1978): Estimating the dimension of a model. In: The Annals of Statistics 6, 2, S. 461-464. Stechow, Arnim von/ Sternefeld, Wolfgang (1988): Bausteine syntaktischen Wissens. Ein Lehrbuch der generativen Grammatik. Opladen: Westdeutscher Verlag. Stiebels, Barbara (2007): Towards a typology of complement control. In: Stiebels, Barbara (Hg.): Studies in complement control. (= ZAS Papers in Linguistics 47). Berlin: ZAS, S. 1-59. Stiebels, Barbara (2010): Inhärente Kontrollprädikate im Deutschen. In: Linguistische Berichte 224, S. 391-440. Stiebels, Barbara (2015): Control. In: Kiss, Tibor/ Artemis, Alexiadou (Hg.): Syntax - theory and analysis. An international handbook. Bd. 1. (= Handbücher zur Sprach- und Kommunikationswissenschaft 42.1). Berlin: De Gruyter, S. 412-446. Weinrich, Harald (2003): Textgrammatik der deutschen Sprache. 2., rev. Aufl. Hildesheim: Olms. Williams, Edwin (1980): Predication. In: Linguistic Inquiry 11, 1, S. 203-238. Wöllstein, Angelika (2015): Grammatik - explorativ. Hypothesengeleitete und -generierende Exploration variierender Satzkomplementationsmuster im standardnahen Deutsch. In: Eichinger, Ludwig M. (Hg.): Sprachwissenschaft im Fokus. Positionsbestimmungen und Perspektiven. (= Jahrbuch des Instituts für Deutsche Sprache 2014). Berlin/ Boston: De Gruyter, S. 93-120. Zifonun, Gisela/ Hoffmann, Ludger/ Strecker, Bruno (1997): Grammatik der deutschen Sprache. (= Schriften des Instituts für Deutsche Sprache 7). Berlin/ New York: De Gruyter. Zuur, Alain F. et al. (2009): Mixed effects models and extensions in ecology with R. New York, NY: Springer. Sandra HanSEn - MoratH / HanS cHriStian ScHMitZ / roMan ScHnEidEr / SaScHa WolFEr kogra r: StanDarDISIErtE StatIStISchE auSWErtung Von korPuSrEchErchEn 1. Einleitung Das Projekt Korpusgrammatik hat zusätzlich zu seiner linguistischen Zielsetzung die Aufgabe, Techniken und Werkzeuge zu entwickeln, um grammatische Phänomene mit Bezug auf große Korpora geschriebener Sprache zu beschreiben, Korpusdaten explorativ zu untersuchen und eine transparente quantitativ-statistische Basis für die Validierung linguistischer Hypothesen bereitzustellen. Damit schafft es Grundlagen für differenzierte Untersuchungen, wie sie der geplanten Grammatik (vgl. das Vorwort zu diesem Band) zugrunde liegen sollen, aber auch anderen korpusorientierten Grammatikprojekten zugutekommen können. Im Rahmen der im Projekt durchgeführten Pilotstudien (siehe v.a. die Studien in diesem Band sowie Konopka/ Waßner 2013; Bubenhofer/ Hansen-Morath/ Konopka 2014; Bubenhofer/ Konopka/ Schneider 2014, S. 125ff.; Konopka/ Fuß 2016) wurden u.a. statistische Analysearten bestimmt, die für die erste Exploration der Daten bei der Erstellung der Grammatik als sinnvoll und nützlich erscheinen. Sie bilden einen „Werkzeugkasten“ für korpusgestützte grammatische Untersuchungen. Die Menge der Analysearten ist prinzipiell offen und kann erweitert werden. Bislang umfasst sie − die Darstellung von Tabellen und Diagrammen für Rohdaten, normierte und relative Werte, − den Chi-Quadrat-Test, Berechnung von erwarteten Häufigkeiten und Residuen, − die Berechnung der Assoziationsstärke Phi bzw. Cramérs V, − Assoziationsplot, Mosaikplot, − die Darstellung von Tabellen und Diagrammen für Konfidenzintervalle und − die Berechnung von Dispersionsmaßen, insbesondere die DP norm (Gries 2008, 2009; Lijffijt/ Gries 2012). Um die Analysearten möglichst einfach zur Verfügung zu stellen, wurde KoGra-R entwickelt. KoGra-R ist ein webbasiertes Analysetool, über das die genannten, in der Programmiersprache R (R Core Team 2016) implementierten, Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 300 statistischen Auswertungen durchgeführt werden können. R ist eine freie und flexible Entwicklungsumgebung zur Umsetzung von statistischen Analysen, die u.a. zahlreiche Optionen zur Datenvisualisierung bereithält und sehr gut für große Datensätze geeignet ist (vgl. Wolfer/ Hansen-Morath 2017). Die Programmiersprache ist mittlerweile in vielen Wissenschaftsbereichen zum Standard für quantitative Analysen geworden. Eine große Stärke von R liegt in der weltweiten Gemeinschaft der Nutzer/ innen, die über Zusatzpakete immer neue Funktionen zur Verfügung stellen. KoGra-R ist über die Homepage unter www.ids-mannheim.de/ kogra-r (letzter Zugriff: 27.11.2018) öffentlich verfügbar. 1 Die wichtigste Datengrundlage der geplanten Grammatik ist das Deutsche Referenzkorpus (DeReKo) 2 (Institut für Deutsche Sprache 2014), das projektintern mittels einer zu Testzwecken erstellten Datenbank (KoGra-DB) 3 sowie des Recherchesystems COSMAS II 4 durchsucht werden kann. Durch KoGra-R können KoGra-DB-Rechercheergebnisse und von COSMAS II erzeugte Frequenzlisten statistisch ausgewertet und miteinander verglichen werden. Darüber hinaus ist es möglich, beliebige, anderweitig erzeugte Kontingenztabellen einzugeben und auswerten zu lassen. KoGra-R ist ein Werkzeug, dessen primärer Zweck es ist, die Arbeit der am Projekt beteiligten Linguist(inn)en zu vereinfachen. Die Bedienung von KoGra-R verlangt keine Programmierkenntnisse, statistische Auswertungen werden mithilfe der Dateneingabe über eine Benutzeroberfläche durchgeführt. Darüber hinaus soll KoGra-R standardisierend auf die Projektarbeit wirken, insofern durch das Analysetool die Menge derjenigen Analysen definiert wird, die möglichst bei allen Fragestellungen der geplanten Grammatik durchgeführt werden sollen. Wir erwarten, dass KoGra-R auch für Aufgaben jenseits der „Korpusgrammatik“ nützlich sein kann, und haben das Tool daher online für die Öffentlichkeit zugänglich gemacht. Das vorliegende, methodische Kapitel ist wie folgt aufgebaut: Zunächst beschreiben wir in Abschnitt 2 verschiedene Nutzungsszenarien von KoGra-R. In Abschnitt 3 erläutern wir die in KoGra-R bislang realisierten statistischen 1 In Hansen-Morath/ Wolfer (2017) wird gezeigt, inwiefern das Tool dazu genutzt werden kann, Variationsphänomene auf verschiedenen linguistischen Ebenen zu untersuchen. 2 Vgl. www1.ids-mannheim.de/ kl/ projekte/ korpora (letzter Zugriff: 23.11.2017). Datengrundlage ist das DeReKo-Release 2014-II. 3 Siehe Abschnitt 4.1 und Bubenhofer/ Konopka/ Schneider (2014, S. 79ff.). 4 COSMAS II verfügt über eine Web-Schnittstelle: https: / / cosmas2.ids-mannheim.de/ cosmas2web (letzter Zugriff: 23.11.2017). KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 301 Analysen. In Abschnitt 4 beschreiben wir knapp die technische Implementierung. KoGra-R wurde zweimal evaluiert. In Abschnitt 5 stellen wir die Evaluationsergebnisse vor. Schließlich machen wir im letzten Abschnitt 6 eine kurze Bestandsaufnahme. 2. nutzungsszenarien Input für KoGra-R sind Kontingenztabellen mit Häufigkeitsangaben. 5 Die Häufigkeitsangaben sind, so die Intention, Angaben sprachlicher Phänomenrealisierungen, die sich als Ergebnisse von Korpusrecherchen ergeben. Es gibt drei verschiedene Möglichkeiten, Tabellen an KoGra-R zu übergeben: Erstens können Ergebnisse von KoGra-DB-Recherchen direkt übergeben werden; die Ergebnisdarstellungen von KoGra-DB enthalten entsprechende Links. Zweitens können mit COSMAS II Frequenzlisten für Rechercheergebnisse exportiert und hochgeladen werden. Drittens können Tabellen als CSV-Dateien übergeben oder händisch in ein Formular eingetragen werden. Alle Modi der Dateneingabe sind auf der KoGra-R-Webseite ausführlich dokumentiert. 2.1 Eingabe von Daten via KoGra - DB Eine in der Pilotphase genutzte Datengrundlage für grammatische Untersuchungen im Projekt Korpusgrammatik besteht aus mit Metadaten angereicherten, in einer relationalen Datenbank (KoGra-DB) durchsuchbar gemachten Teilkorpora des Deutschen Referenzkorpus (DeReKo). 6 Ergebnisse von KoGra-DB-Recherchen können gespeichert und analysiert werden. Beides, Speicherung und Analyse, geschieht über entsprechende Links. Sobald die Rechercheergebnisse gespeichert sind, können sie über den Link „[KoGra-R]“ (vgl. Abb. 1) statistisch ausgewertet werden. 5 Vgl. z.B. Tabelle 1 in Abschnitt 3.1 unten. 6 Vgl. diesbezüglich Abschnitt 4.1. Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 302 abb. 1: rechercheergebnisse in der kogra dB Es können auch mehrere Abfragen miteinander verglichen werden. Dazu müssen sie in der Ergebnisliste markiert werden. Die Daten der KoGra-DB sind mit Metadaten versehen, nämlich über das jeweilige Medium („Bücher“, „Gesprochenes“, „Internet“, „Publikumspresse“, „Sonstiges“), das Register („Pressetexte“, „Gebrauchstexte“, „Literarische Texte“), das Land („Deutschland“, „Dtld. Ost“, „Dtld. West“, „Österreich“, „Schweiz“), die Region („überregional“, „Mittelost“, „Mittelsüd“, „Mittelwest“, „Nordost“, „Nordwest“, „Südost“, „Südwest“, „Herkunft nicht zuordenbar“, „Herkunft unbekannt“), die Domäne („Fiktion“, „Kultur/ Unterhaltung“, „Mensch/ Natur“, „Politik/ Wirtschaft/ Gesellschaft“, „Technik/ Wissenschaft“, „unklassifizierbar“) und das Jahrzehnt (1960er-, 1970er-, 1980er-, 1990er-, 2000er-, 2010er-Jahre). 7 Die Metadaten induzieren unterschiedliche Klassifizierungen der Rechercheergebnisse, die jeweils separat statistisch ausgewertet werden. Es wird geprüft, wie sich ein bestimmtes Phänomen über die verschiedenen Medien, Register, Länder etc. verteilt. Entsprechend werden die Verteilungen über die durch die Metadaten definierten Klassen separat berechnet und angezeigt. 8 Die verschiedenen Auswertungen können, wie im entsprechenden Screenshot (siehe Abb. 2) zu sehen, über Reiter angesteuert werden. 7 Zur Auswahl und Beschreibung der Metadaten siehe Bubenhofer/ Konopka/ Schneider (2014, S. 84ff.). 8 Vgl. Abschnitt 3. KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 303 abb. 2: Ergebnisse einer kogra dB auswertung KoGra-DB-Rechercheergebnisse enthalten stets die Informationen über die Teilkorpusgrößen der verschiedenen Metadatenkategorien als Bezugsgrößen (= Korpusbezugsgrößen). Diese werden zur Berechnung u.a. von relativen Häufigkeiten verwendet. 9 2.2 Eingabe von COSMAS - II - Frequenzlisten COSMAS II ist ein im Web öffentlich zugängliches Recherche- und -analysesystem für die Korpora des Instituts für Deutsche Sprache (www.ids-mann heim.de/ cosmas2, letzter Zugriff: 27.11.2018). Ergebnisse von COSMAS-II- Recherchen können exportiert und als Dateien lokal gespeichert werden. Die Dateien enthalten sogenannte Ergebnisansichten (Ansicht nach Quellen, Korpora, Dokumenten, Ländern, Textsorten, Themen, Jahrzehnten, Jahren, Monaten …) und optional entsprechende Korpusansichten. Eine Ergebnisansicht enthält die Verteilung eines Rechercheergebnisses über den gewählten Bereich (die Quellen, Dokumente, Korpora …). Diese Verteilung wird von KoGra-R ausgewertet, was analog zur oben beschriebenen Auswertung der Metadateninduzierten Verteilungen von KoGra-DB-Ergebnissen geschieht. Eine Korpusansicht enthält die entsprechende Häufigkeitsverteilung für die einzelnen Teile des Gesamtkorpus. Diese können als Bezugsgröße zur Berechnung u.a. von normierten Häufigkeiten verwendet werden. Während bei KoGra-DB- 9 Vgl. hierzu genauer die Beschreibung in Abschnitt 3. Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 304 Auswertungen die Korpusbezugsgrößen stets berücksichtigt werden, ist ihre Angabe bei COSMAS-II-Auswertungen optional. Es ist möglich, mehrere Exportdateien zugleich in KoGra-R zu laden und dadurch Ergebnisse verschiedener COSMAS-II-Recherchen miteinander zu vergleichen. Voraussetzung dafür ist, dass alle Dateien Ergebnis- und Korpusansichten des gleichen Typs enthalten. 10 2.3 Freie Eingabe von Nutzer definierten Tabellen Mit KoGra-R besteht die Möglichkeit, selbst definierte Tabellen auszuwerten (vgl. hierzu das Eingabefeld in Abb. 3). Diese Tabellen müssen aus einer Kopfzeile, einer Kopfspalte und Datenfeldern bestehen. Die Datenfelder dürfen nur Zahlen enthalten. Zusätzlich zum eigentlichen Datenwert kann ein Datenfeld eine zweite Zahl als Bezugsgröße enthalten. Diese Zahl ist durch einen Schrägstrich von der ersten Zahl zu trennen. Beispiel: 3079/ 6914444 - 3079 dürfte im Regelfall die festgestellte Häufigkeit einer untersuchten Realisierung sein (z.B. eine bestimmte Anzahl von Tokens), 6914444 ist die entsprechende Größe der Korpusgesamtheit (z.B. die Anzahl der in Betracht gezogenen Tokens). Die Angabe der Bezugsgröße ist optional, muss aber, wenn sie in einer Zelle der Tabelle erfolgt, in allen anderen Zellen ebenfalls vorhanden sein. Eine Tabelle kann als lokal gespeicherte CSV-Datei hochgeladen werden. Anders als bei der Übergabe von COSMAS-II-Exportdateien kann nur eine Datei (mit einer Tabelle) geladen werden; es ist nicht möglich, mehrere Dateien zugleich auszuwerten. 11 Alternativ kann die Tabelle in einem Textfeld erstellt oder in das Textfeld kopiert und von dort aus übergeben werden. Auf diese Weise können z.B. Tabellen aus Word-Dokumenten übergeben werden. 10 Es ist beispielsweise nicht möglich, eine Ansicht nach Themen mit einer Ansicht nach Jahren zu vergleichen. 11 Dieses Vorgehen wäre auch nicht sinnvoll, da die Informationen über die Häufigkeiten verschiedener Realisierungen direkt in einer Kontingenztabelle angegeben werden können. KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 305 abb. 3: Eingabe einer nutzer definierten tabelle Die geladenen oder eingegebenen Tabellen werden nicht direkt ausgewertet, sondern zuerst auf ihre Wohlgeformtheit geprüft. Das Ergebnis der Tabellenprüfung wird angezeigt. Falls die Tabelle nicht wohlgeformt ist, werden Fehlermeldungen gegeben und potenzielle Fehler markiert. Die in Abbildung 3 eingegebene Tabelle enthält einen Fehler. Dieser wird nach der Prüfung angezeigt (Abb. 4). abb. 4: Ergebnis der prüfung einer nicht wohlgeformten tabelle Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 306 Nicht wohlgeformte Tabellen wie die obige können im Textfeld korrigiert und erneut geprüft werden, bis sie wohlgeformt sind. Sobald die Tabelle wohlgeformt ist, d.h., sobald alle Fehler korrigiert sind, kann sie ausgewertet werden (Abb. 5). abb. 5: Ergebnis der prüfung einer wohlgeformten tabelle 3. Statistische analysen Wie oben beschrieben, basieren sämtliche Funktionen in KoGra-R auf Häufigkeitsangaben. Zu den statistischen Auswertungen ist in KoGra-R eine Dokumentation verfügbar, zu der man über diverse Hyperlinks im Tool geleitet wird. Dort wird außerdem an den entsprechenden Stellen der R-Code zur Verfügung gestellt, der zur jeweiligen Auswertung und Erstellung der Ausgabe nötig ist. Je nach Menge und Art der Informationen wird durch das Tool ein passender Analysemodus gewählt. Der passende Modus ergibt sich aus der Anzahl der Spalten in der Tabelle sowie dem Vorhandensein von Korpusbezugsgrößen. Die meisten statistischen Analysen können mit mehrspaltigen Tabellen mit Korpusbezugsgrößen durchgeführt werden. Der typische Anwendungsfall ist hier der Vergleich von Häufigkeiten zweier Abfragen, bei denen jeweils die Größe des zugrundeliegenden Korpus bekannt ist. Im Rahmen der Auswertung werden die Daten zunächst in verschiedenen Formaten dargestellt. In einem zweiten Schritt erfolgen tiefer gehende deskriptive und inferenzstatistische Analysen und entstehen Darstellungen, die KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 307 im Folgenden beschrieben werden. Hierzu werden zwei Abfragen mithilfe der KoGra-DB durchgeführt und in KoGra-R ausgewertet. Die beiden Abfragen beziehen sich auf zwei mögliche Realisierungen der Genitivformen des Nomens Werk. Die tokenbasierten Abfragen (Werkes und Werks) werden in Bezug auf die Häufigkeit der beiden Varianten in verschiedenen Jahrzehnten miteinander verglichen, wobei den Jahrzehnten unterschiedlich große Teilkorpora zugrunde liegen. Zusätzlich wird die Häufigkeit der Realisierungen in Abhängigkeit von verschiedenen Medien betrachtet, denen ähnlich große Teilkorpora zugrunde liegen. Bei den Ausgangsdaten der Analysen handelt es sich um mehrspaltige Tabellen mit entsprechenden Korpusbezugsgrößen. 12 3.1 Darstellung der Rohdaten Die Rohdaten werden in Form von Kontingenztabellen dargestellt (vgl. Tab. 1). Werkes Werks -1969 13 83 19 1970-79 23 3 1980-89 7 5 1990-99 13629 8751 2000-09 16786 12433 2010- 16024 11353 tab. 1: rohdaten der abfragen Werks vs. Werkes im D e R e K o 14 Die Tabelle gibt die absolute Trefferzahl für die übergebenen Abfragen an. Die Spalten repräsentieren die Art der verschiedenen Abfragen bzw. die Varianten. In den Zeilen sind die verschiedenen Ausprägungen des jeweiligen Metadatums (hier Jahrzehnte) abgetragen. Die Wortform Werkes kommt demnach z.B. 23-mal zwischen 1970 und 1979 vor, in den Jahren zwischen 2000 und 2009 ist sie 16.786-mal vertreten. Um die enormen Häufigkeitsschwankungen bezogen auf die Jahrzehnte beurteilen und interpretieren zu können, muss man die Teilkorpusgrößen (hier: Anzahl aller Tokens in den betreffenden Jahren) zurate ziehen. 15 Die zweite Tabelle in KoGra-R (vgl. Tab. 2) zeigt diese Information für die einzelnen Abfragen an. 12 Vgl. die Kontingenztabelle mit Beispieldaten auf der Startseite von KoGra-R. 13 Die ältesten Texte des in KoGra-DB abfragbaren DeReKo-Ausschnitts stammen von 1955. 14 Datengrundlage ist das DeReKo-Release 2014-II (vgl. Institut für Deutsche Sprache 2014). 15 Da in diesem Beispiel eine auf Tokens basierte Abfrage durchgeführt wurde, werden die Teilkorpusgrößen ebenfalls in Tokens (laut TreeTagger) angegeben. Je nach Abfragebzw. Phä- Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 308 Werkes-Teilkorpus Werks-Teilkorpus -1969 8061722 8061722 1970-79 2120012 2120012 1980-89 2912554 2912554 1990-99 1715718062 1715718062 2000-09 2952571847 2952571847 2010- 2803516611 2803516611 tab. 2: korpusbezugsgrößen für die übergebenen abfragen Ein Blick auf die Tabelle zeigt, dass die Anzahl an Tokens in den Teilkorpora ab 1990 stark ansteigt. Es verwundert also nicht, dass auch die in den beiden Abfragen ermittelten Häufigkeiten der Realisierungen von Werkes respektive Werks in diesen Jahren zunehmen. 3.2 Darstellung von normierten Daten Um Daten aus unterschiedlich großen Teilkorpora miteinander vergleichen zu können und diese deskriptiv zu untersuchen, ist es sinnvoll, die gefundenen Häufigkeiten zu normieren. Die normierten Daten werden in KoGra-R ebenfalls in Form einer Kontingenztabelle (vgl. Tab. 3) dargestellt. Dabei werden die Treffer pro eine Million Tokens angegeben. Hierzu wird die Tabelle mit der absoluten Anzahl der Treffer mit der Tabelle der Korpusbezugsgrößen entsprechend verrechnet. 16 Werkes Werks -1969 10.295567 2.356817 1970-79 10.848995 1.415086 1980-89 2.403389 1.716706 1990-99 7.943613 5.100488 2000-09 5.685213 4.210905 2010- 5.715679 4.049557 tab. 3: treffer pro eine Million tokens nomenart kann es sinnvoll sein, die Teilkorpusgrößen in Sätzen oder anderen Einheiten anzugeben. 16 Die normierten Werte werden deshalb in KoGra-R nur berechnet und visualisiert, wenn die Informationen über die Korpusbezugsgrößen vorliegen. KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 309 Die normierten Daten werden zusätzlich in einem Säulendiagramm abgetragen (vgl. Abb. 6). Die Säulen werden dabei nach den Ausprägungen des jeweiligen Metadatums gruppiert. Im vorliegenden Beispiel sind dies die verschiedenen Jahrzehnte, in denen die abgefragten Genitivformen von Werk vorkommen. Innerhalb jeder Säulengruppe befindet sich für jede Abfrage eine Säule. abb. 6: gruppiertes Säulendiagramm der normierten Werte 17 Die Visualisierung der normierten Daten verdeutlicht, dass die genannten Genitivvarianten von Werk insgesamt rückläufig sind. Außerdem lässt sich feststellen, dass die lange Endung -es in Relation zur kürzeren Endung -s seltener wird. 3.3 Darstellung der relativen Werte Die absoluten Werte geben an, wie oft ein Merkmal bzw. eine Variante vorkommt. Mit den relativen Häufigkeiten wird in KoGra-R angegeben, wie hoch der Anteil jedes Teilkorpus an der jeweiligen Variante ist. Sind die Teilkorpora ungefähr gleich groß, ist die Berechnung und Darstellung der relativen Werte sinnvoll und kann als alternative Analysemethode zur Normierung der Daten angewendet werden. Die eventuellen Affinitäten eines Teilkorpus zu einer bestimmten Variante werden so unmittelbar sichtbar gemacht. Die relativen Häufigkeiten werden berechnet, indem für jede Variante ihre absoluten Häufigkeiten in den Teilkorpora durch ihre Häufigkeit im Ge- 17 In diesem Beitrag werden alle Diagramme in Graustufen präsentiert. In KoGra-R sind die Grafiken farbig. Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 310 samtkorpus geteilt werden. Somit variiert die relative Häufigkeit immer zwischen 0 und 1. Die Summe der relativen Häufigkeiten für eine Variante beträgt 1. Multipliziert man die Zahl mit 100, erhält man den Prozentanteil des jeweiligen Teilkorpus für die entsprechende Variante. Um dies zu illustrieren, untersuchen wir die regionale Verteilung von Werkes und Werks in unterschiedlichen Teilkorpora, die eine ungefähr gleich große Tokenanzahl aufweisen. Hierzu wurden die beiden Varianten in verschiedenen Zeitungen über COSMAS II abgefragt. Ausgewählt wurden Texte des Trierischen Volksfreunds aus den Jahren 2000-2016, der Ostthüringer Zeitung aus den Jahren 2000-2012, der Kleinen Zeitung aus den Jahren 2002-2016 und der Neuen Zürcher Zeitung von 2000-2016. Der Trierische Volksfreund ist dabei eine Zeitung aus Westmitteldeutschland, die Ostthüringer Zeitung ein Blatt aus Ostmitteldeutschland, die Kleine Zeitung eines aus Österreich, und die Neue Zürcher Zeitung wird in der Schweiz verlegt. In Tabelle 4 sind die absoluten Häufigkeiten sowie die Korpusbezugsgrößen (hier: Anzahl der Tokens) in Klammern hinter den Zeitungsnamen abgetragen. Werks Werkes Trierischer Volksfreund (347946108) 1765 1710 Ostthüringer Zeitung (335299068) 317 2317 Kleine Zeitung (338764250) 1004 1638 Züricher Zeitung (314206790) 3793 2101 tab. 4: rohdaten und korpusbezugsgrößen der abfragen Werks vs. Werkes in den betreffenden Zeitungen In einem ersten Schritt werden in KoGra-R die relativen Werte in Form einer Kontingenztabelle dargestellt (vgl. Tab. 5). Werks Werkes Trierischer Volksfreund 25.657799 22.01906 Ostthüringer Zeitung 4.608228 29.83518 Kleine Zeitung 14.595145 21.09194 Neue Zürcher Zeitung 55.138828 27.05382 tab. 5: relative Werte der gefundenen tokens pro Variante Die Tabelle gibt pro Variante an, wie viel Prozent der Treffer einer Ausprägung des Metadatums (hier: Zeitungen aus verschiedenen Regionen) zuzuordnen sind. Somit summiert sich jede Spalte auf 100%. 18 18 Relative Werte werden immer ausgegeben - mit Ausnahme von aggregierten Tabellen. In aggregierten Tabellen werden alle Zeilen zu einer summiert. Sie enthalten somit nur die jeweili- KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 311 In einem zweiten Schritt werden die prozentualen Verteilungen der Variantenrealisierungen über die Ausprägungen des Metadatums mithilfe eines gruppierten und eines gestapelten Säulendiagramms visualisiert. Im gruppierten Säulendiagramm (Abb. 7) sind die Säulengruppen über die Ausprägungen des jeweiligen Metadatums definiert. 19 abb. 7: gruppiertes Säulendiagramm der relativen Werte Diese Grafik ist u.U. schwieriger zu lesen, als es zunächst den Anschein hat. Es ist daher nochmals darauf hinzuweisen, dass eine Säule den Anteil der Realisierungen einer Variante bei einer Metadaten-Ausprägung am Gesamtvorkommen dieser Variante repräsentiert. Ist innerhalb einer Säulengruppe eine Säule höher, muss das also nicht bedeuten, dass hier mehr Vorkommen vorliegen. Die Darstellung der relativen Werte unterscheidet sich demnach inhaltlich von der der normierten Werte. Am vorliegenden Beispiel lässt sich anhand der relativen Werte feststellen, dass die Variante Werkes im Vergleich zur Variante Werks in der Ostthüringer Zeitung und der Kleinen Zeitung in Verhältnis überrepräsentiert ist, während sie in den anderen beiden Zeitungen unterrepräsentiert ist. In Kapitel 3.4.4 werden wir zeigen, dass die unterschiedliche Verteilung der Varianten auf die verschiedenen Zeitungskorpora höchstsignifikant ist. Vor allem in der Neuen Zürcher Zeitung kommt die Variante Werks relativ häufig (in 55% aller Fälle der Variante) vor. Die Variante mit der Endung -es scheint somit für die Pressetexte aus der Ostthüringer gen Gesamtvorkommen des Phänomens. Aggregierte Tabellen können in KoGra-R über den Reiter „aggregierte Daten“ angefordert werden. 19 Innerhalb jeder Säulengruppe befindet sich pro Abfrage eine Säule. Wird lediglich eine Abfrage zu einem Einzelphänomen analysiert, besteht jede Gruppe folgerichtig aus nur einer Säule. Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 312 Zeitung und für die österreichische Zeitung dominierend zu sein. 20 Diese Verteilung bestätigt die Ergebnisse aus einer Studie von Fürbacher (2015), in der die Verteilung der Genitivallomorphe -es und -s untersucht wird. In dieser Studie konnte festgestellt werden, dass Tokens mit -es in Texten aus dem Osten und Südosten (einschließlich Österreichs) höchstsignifikant häufiger vorkommen als Formen mit der Endung -s (vgl. ebd.). Bei der Darstellung der relativen Werte in KoGra-R bietet es sich an, über die Tabelle und das gruppierte Säulendiagramm hinaus ein gestapeltes Säulendiagramm zu erstellen. Die Verhältnisse in den einzelnen Subkorpora können so auf zwei Arten visuell erfasst werden. Das gestapelte Säulendiagramm (Abb. 8) zeigt die prozentuale Verteilung der jeweiligen Variante in gestapelten Rechtecken an, die den Ausprägungen der Metadaten (hier: regionale Zeitungen) entsprechen. Die Ausprägungen werden in KoGra-R mit unterschiedlichen Farben kodiert. Jede Säule korrespondiert mit einer Variante. Es werden in alternativer Weise exakt dieselben Werte visualisiert wie im vorigen Diagramm. abb. 8: gestapeltes Säulendiagramm der relativen Werte 20 Um weitere Aussagen zu treffen, müsste die Verteilung der Genitivallomorphe durch genauere quantitative und qualitative Auswertungen auf einer breiteren Datenbasis untersucht werden. KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 313 3.4 Analysen im Rahmen der Chi - Quadrat - Statistik 3.4.1 Der Chi - Quadrat - Test Um zu prüfen, ob die Ausprägungen von zwei nominalen Variablen voneinander unabhängig sind, eignet sich der Chi-Quadrat-Test (siehe Bortz 2005, S. 168ff.). 21 Hierzu werden die beobachteten Häufigkeiten mit erwarteten Häufigkeiten verglichen, die im Verhältnis zur jeweiligen Größe der Teilkorpora stehen. 22 Als Testergebnis werden verschiedene Werte ausgegeben. Aus dem berechneten Chi-Quadrat-Wert (Prüfgröße) und den sog. Freiheitsgraden (= df ) kann die Wahrscheinlichkeit errechnet werden, durch Zufall eine solche Stichprobe aus einer Population zu ziehen, in der es keinen Zusammenhang zwischen den beiden Merkmalen gibt (vgl. ebd.). Ein Testergebnis wird als statistisch signifikant bezeichnet, wenn diese Wahrscheinlichkeit unterhalb einer konventionell gesetzten Schwelle liegt - i.d.R. 0,05 oder kleiner (vgl. ebd., S. 114). 23 Für die Verteilung der beiden Genitivvarianten Werkes und Werks in Abhängigkeit von Jahrzehnten ergibt der Chi-Quadrat-Test folgende Werte (so auch die Darstellung in KoGra-R): Pearson’s Chi-squared test X-squared = 94.3741, df = 5, p-value < 2.2e-16 Der Wert der Prüfgröße (= X-squared) beträgt gerundet 94 bei 5 Freiheitsgraden, die daraus berechnete Irrtumswahrscheinlichkeit p ist deutlich kleiner als 0,05. Aus diesem Ergebnis ist abzulesen, dass sich die Verteilungen der Realisierungen der beiden Varianten in Abhängigkeit von Jahrzehnten höchstsignifikant unterscheiden. Allerdings ist die Anwendung des Chi-Quadrat- Tests in diesem Punkt nicht unproblematisch, weil größere absolute Häufigkeiten (unter Konstanthaltung der Verhältnisse) direkte Auswirkungen auf die Höhe des p-Werts haben. Multipliziert man z.B. alle Zahlen mit 10, blei- 21 Es sind andere Maße und Tests denkbar, die alternativ oder zusätzlich zum Chi-Quadrat-Test berechnet werden können (siehe Wiechmann 2008). Wir haben uns dafür entschieden, den Chi-Quadrat-Test in KoGra-R zu implementieren. Der wichtigste Grund für diese Entscheidung war, dass der Chi-Quadrat-Test am allgemeinsten anwendbar ist, weil er u.a. auch auf Tabellen angewendet werden kann, die mehr als zwei Spalten/ Zeilen haben. Bei Bedarf werden im Projekt Korpusgrammatik allerdings auch andere Maße berechnet, z.B. der exakte Test nach Fisher, wenn der Stichprobenumfang zu gering ist. 22 Die erwarteten Häufigkeiten sollten bei einem Chi-Quadrat-Test nicht in über 20% der Zellen unter 5 fallen (siehe Bortz 2005, S. 177). 23 Laut Konvention spricht man ab einer Irrtumswahrscheinlichkeit kleiner 5% (p < 0,05) von einem signifikanten, ab 1% (p < 0,01) von einem hochsignifikanten und ab 0,1% (p < 0,001) von einem höchstsignifikanten Ergebnis. Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 314 ben die Verhältnisse zwar exakt gleich, aber der p-Wert wird kleiner. Daher sollte im Rahmen einer Chi-Quadrat-basierten Auswertung immer die Assoziationsstärke mit angegeben werden. Diese wird von der allgemeinen Größenordnung der absoluten Häufigkeiten nicht beeinflusst (z.B. 100 vs. 300 Tokens im Vergleich zu 10000 vs. 30000 Tokens). 24 3.4.2 Assoziationsstärke: Phi/ Cramérs V Nicht nur die statistische Signifikanz ist für die Bedeutsamkeit eines Ergebnisses ausschlaggebend. Auch die Stärke der Korrelation zweier Variablen ist relevant. Der Phi-Koeffizient ist ein Maß für die Stärke des Zusammenhangs zweier dichotomer Merkmale, die in einer Tabelle mit zwei Spalten und zwei Zeilen abgetragen werden (siehe Bortz/ Lienert 2008, S. 259ff.). Cramérs V ist ein Kontingenzkoeffizient, der bei jeder Kontingenztabelle, unabhängig von der Anzahl der Zeilen und Spalten, berechnet werden kann (vgl. ebd., S. 271ff.). 25 Cramérs V wird berechnet mit V = , wobei n die Gesamtanzahl der Fälle angibt und k das Minimum der Anzahl der Spalten und der Anzahl der Zeilen der Kontingenztabelle. Für Tabellen mit zwei Spalten und zwei Zeilen sind die Werte von Phi und Cramérs V identisch. Phi kann mit Φ = berechnet werden, da k für Vier-Felder-Tabellen immer 2 ist. Beide Koeffizienten weisen ein Wertespektrum zwischen 0 und 1 auf. Je höher der Wert ist, desto stärker ist der Zusammenhang. Für die Abfrage Werkes vs. Werks in Abhängigkeit von Jahrzehnten ist die Ausgabe in KoGra-R wie folgt: Phi/ V-Koeffizient 0.03453776 Zwar unterscheiden sich die Verteilungen der beiden Abfragen in Abhängigkeit von Jahrzehnten signifikant voneinander, allerdings ist die Assoziationsstärke mit einem Koeffizienten von 0,03 als sehr klein einzuschätzen. 3.4.3 Erwartete Häufigkeiten und Residuen Um beurteilen zu können, ob die Abweichungen der beobachteten von den erwarteten Häufigkeiten in den Einzelzellen der Kreuztabelle ausschlaggebend für die Signifikanz sind oder nicht, werden sog. standardisierte Residuen nach Pearson berechnet (siehe Backhaus et al. 2016, S. 350). Die absoluten 24 Der Chi-Quadrat-Test wird in KoGra-R für mehrspaltige und nicht-aggregierte Tabellen berechnet. 25 Die Assoziationsstärke Phi bzw. V wird in KoGra-R für mehrspaltige, nicht-aggregierte Tabellen berechnet. KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 315 Abweichungen in jeder Zelle der Tabelle werden durch die Quadratwurzel der erwarteten Häufigkeiten dividiert. Auf diese Weise kann gezeigt werden, welche Häufigkeitsunterschiede in der Kontingenztabelle hauptsächlich für den Effekt verantwortlich sind. In unserem Beispiel lässt sich so überprüfen, in welchem Jahrzehnt die beobachteten Häufigkeiten von den erwarteten Häufigkeiten besonders auffällig abweichen. In KoGra-R werden die erwarteten Werte und die standardisierten Residuen nach Pearson angegeben. Für unser Abfragebeispiel sind die Ausgaben in Tabelle 6 und Tabelle 7 dargestellt. Werkes Werks -1969 60.016988 41.983012 1970-79 15.298448 10.701552 1980-89 7.060822 4.939178 1990-99 13168.433187 9211.566813 2000-09 17192.513373 12026.486627 2010- 16108.677183 11268.322817 tab. 6: darstellung der erwarteten Häufigkeiten Es werden zum Beispiel in den Jahren bis 1969 ca. 60 Wortformen mit es-Endung erwartet und ca. 42 Tokens mit s-Endung. In den Jahren zwischen 1990 und 1999 wird das Token Werkes ca. 13168-mal erwartet, das Token Werks allerdings 9211-mal. Die Pearson-Residuen (Tab. 7) deuten bei einer Irrtumswahrscheinlichkeit von 5% auf die Signifikanz der Unterschiede hin, wenn sie über 1,97 oder unter -1,97 liegen (Field/ Miles/ Field 2012, S. 826). Ist ein standardisiertes Residuum kleiner als -1,97, weichen in dieser Zelle die beobachteten Häufigkeiten signifikant nach unten von den erwarteten Häufigkeiten ab. Ist das standardisierte Residuum größer als 1,97, weichen in dieser Zelle die beobachteten Häufigkeiten signifikant nach oben von den erwarteten Häufigkeiten ab. Werkes Werks -1969 2.96667418 -3.54707320 1970-79 1.96904017 -2.35426244 1980-89 -0.02288936 0.02736743 1990-99 4.01352145 -4.79872528 2000-09 -3.10031022 3.70685374 2010- -0.66716993 0.79769480 tab. 7: darstellung der standardisierten pearson residuen Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 316 An der Beispieltabelle ist abzulesen, dass alle Residuen bis auf die zwischen 1980 und 1989 und die ab 2010 signifikant sind. Bis zum Jahr 1969 ist das Token Werkes signifikant überrepräsentiert und das Token Werks signifikant unterrepräsentiert (die Residuen befinden sich bei ca. 2,97 bzw. -3,55). 26 Ähnlich verhält es sich in der Zeit zwischen 1970 und 1979. Zwischen 1980 und 1989 gibt es dagegen keine signifikanten Abweichungen von der erwarteten Verteilung der beiden Realisierungen. In der Zeit zwischen 1990 und 1999 wiederum sind die standardisierten Residuen am höchsten. Das heißt, dass in diesen Jahren die beobachteten Werte stark nach oben (für Werkes) bzw. unten (für Werks) von den erwarteten Werten abweichen. 27 In den nachfolgenden Jahren kehrt sich dieses Verhältnis um: Die Wortform mit der es-Endung ist signifikant unterrepräsentiert, während das Token Werks signifikant häufiger vorkommt als erwartet. 3.4.4 Assoziationsplot Der Assoziationsplot visualisiert die standardisierten Pearson-Residuen in Abhängigkeit von den Metadatenausprägungen (z.B. den Jahrzehnten, vgl. Abb. 9). Die Höhe der Balken entspricht der Höhe der Abweichung: Balken oberhalb der gepunkteten Linie bedeuten höhere Werte als erwartet. Balken unterhalb der Linie bedeuten, dass die Werte niedriger sind als erwartet. Die Breite der Balken ist definiert durch die erwartete Häufigkeit der Realisierungen. Sind die Pearson-Residuen signifikant (> 1,97 oder < -1,97) werden sie in KoGra-R im Plot eingefärbt. 28 Wird die Schwelle von +/ - 4 überschritten, werden die Balken in einem stärkeren Ton eingefärbt, da hier von einer ganz besonders starken Abweichung ausgegangen werden kann (siehe Cohen 1980; Friendly 1992; Meyer/ Zeileis/ Hornik 2005). 29 26 Im Allgemeinen kann davon ausgegangen werden, dass mindestens eine Zelle signifikant über- oder unterrepräsentiert ist, wenn der Chi-Quadrat-Test insgesamt eine signifikante Abweichung der beobachteten von den erwarteten Häufigkeiten anzeigt. Das gilt auch in die andere Richtung (signifikanter Chi-Quadrat-Wert bei mindestens einer signifikanten Zellenabweichung). 27 Gründe dafür könnten evtl. durch genauere quantitative und qualitative Auswertung der Belege aus diesem Zeitraum ermittelt werden. 28 In KoGra-R steht die Farbe Blau für signifikante Abweichungen nach oben, die Farbe Rot für signifikante Abweichungen nach unten. 29 Der Assoziationsplot wird nur für mehrspaltige und nicht-aggregierte Tabellen ausgegeben. KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 317 abb. 9: assoziationsplot für die realisierungen Werks vs. Werkes in abhängigkeit von Jahrzehnten Der Plot visualisiert die Residuen, die in Tabelle 7 angegeben wurden, und verdeutlicht, dass die Realisierung des Nomens Werk mit der Endung -s in neueren Texten signifikant überrepräsentiert ist, wogegen es bei der Realisierung mit der Endung -es in älteren Texten der Fall ist. Wir kommen an dieser Stelle nochmals auf die in Kapitel 3.3 (Darstellung der relativen Werte) besprochene Analyse der Variation der beiden Genitivallomorphe in Zeitungen aus verschiedenen Regionen zurück und stellen die Verteilung der Residuen dieser Analyse in einem Assoziationsplot dar (Abb. 10): Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 318 abb. 10: assoziationsplot für die realisierungen Werks vs. Werkes in abhängigkeit von verschiedenen regionalen Zeitungen Der Assoziationsplot bestätigt die Schlussfolgerung aus der Verteilung der relativen Häufigkeiten: Werkes ist in der Ostthüringer Zeitung und der Kleinen Zeitung signifikant überrepräsentiert, während Werks in diesen Pressetexten signifikant unterrepräsentiert ist. Die Variante mit -es ist hingegen im Trierischen Volksfreund sowie in der Neuen Zürcher Zeitung signifikant unterrepräsentiert, während die kürzere s-Variante in diesen Texten signifikant überrepräsentiert ist. 3.4.5 Mosaikplot Eine andere Möglichkeit, um Zusammenhänge zwischen Daten zu visualisieren, bietet der Mosaikplot (siehe Hartigan/ Kleiner 1984; Friendly 1994; Emerson 1998; Meyer/ Zeileis/ Hornik 2005). Er visualisiert die Häufigkeitsverteilung in einer Kontingenztabelle über Rechtecke, deren Größe proportional zur Fallzahl in den Zellen ist (Abb. 11). Die Farbe der Rechtecke bezieht sich - ähnlich wie beim Assoziationsplot - auf die standardisierten Pearson-Residuen. Ist ein Rechteck in KoGra-R rot eingefärbt, ist die Ausprägung in der entsprechenden Zelle unterrepräsentiert. Ist ein Rechteck blau eingefärbt, ist die Ausprägung in der entsprechenden Zelle überrepräsentiert. Stärkere Abweichungen werden wiederum mit einer stärkeren Einfärbung signalisiert. Im Mosaikplot werden im Gegensatz zum Assoziationsplot zudem die relativen Häufigkeiten dargestellt. Dabei wird jede Variable (hier: Phänomenrealisierungen der beiden abgefragten Genitivformen von Werk und die Informa- KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 319 tion über die Jahrzehnte) einer Achse zugeordnet. Am linken Rand ist die erste Variable abgetragen, die sich im vorliegenden Beispiel auf die beiden abgefragten Genitivvarianten bezieht. Die gesamten Daten werden zunächst in Blöcke unterteilt, die durch die Ausprägungen der Variablen definiert werden. Die Höhe einer Zelle repräsentiert die relative Häufigkeit der jeweiligen Ausprägung. Am oberen Rand wird die zweite Variable abgetragen, die sich im vorliegenden Beispiel auf das Jahrzehnt bezieht. Die Anzahl der Spalten ergibt sich aus der Anzahl der Ausprägungen der zweiten Variable. Die Breite einer Zelle repräsentiert die relative Häufigkeit der jeweiligen Ausprägung der zweiten Variable. Sind mehr als zwei Variablen im Mosaikplot abgetragen, werden die Achsen mehrfach belegt und die Flächen des Diagramms werden entsprechend weiter aufgeteilt. 30 ++ -- - + abb. 11: Mosaikplot für die Varianten Werks vs. Werkes in abhängigkeit von Jahrzehnten; abweichungen nach oben bzw. unten werden für den Schwarz - Weiß druck über die Symbole + und - symbolisiert (bei stärkeren abweichungen werden die Symbole gedoppelt) 31 3.5 Konfidenzintervalle Mit der Angabe von Konfidenzintervallen kann man von den vorliegenden Stichprobenergebnissen auf die Grundgesamtheit verallgemeinern (siehe Brunner/ Munzel 2013, S. 80ff.). 30 Wie der Assoziationsplot wird auch der Mosaikplot nur für mehrspaltige und nicht-aggregierte Tabellen ausgegeben. 31 In KoGra-R wird der Mosaikplot - wie der Assoziationsplot - farbig dargestellt. Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 320 Ein Konfidenzintervall gibt an, in welchem Bereich der Populationsparameter liegen könnte. Ein 95%-Konfidenzintervall besagt, dass bei hinreichender Wiederholung des Experiments (d.h. Neuberechnung des 95%-Konfidenzintervalls aus jeweils neuen Stichproben) 95% der so berechneten Intervalle den Populationsparameter enthalten. Liegt der obere oder untere Wert des berechneten Konfidenzintervalls für die Realisierungshäufigkeit eines Phänomens nicht im Konfidenzintervall der Realisierungshäufigkeit eines anderen Phänomens, deutet dies auf einen signifikanten Unterschied zwischen dem Anteil der beiden Realisierungen hin (siehe ebd.). In KoGra-R werden die Konfidenzintervalle für jede Realisierung in Abhängigkeit von den verschiedenen Metadaten in einer Tabelle (vgl. Tab. 8) und mithilfe eines Diagramms (vgl. Abb. 12) dargestellt. Außerdem wird der prozentuale Anteil der Realisierungen bezogen auf die Ausprägungen der jeweiligen Metadaten angegeben, der die Grundlage für die Berechnung des Konfidenzintervalls bildet. Wie das vorliegende Beispiel zeigt, beziehen sich 100% dabei auf alle Vorkommen im betreffenden Metadatum (hier Jahrzehnt) bezogen auf eine Realisierung (Werkes vs. Werks). === Werkes === Anteil in Prozent Konf.-Intervall unten Konf.-Intervall oben -1969 0.17829524 0.139972082 0.21661840 1970-79 0.04940711 0.029220367 0.06959386 1980-89 0.01503695 0.003898463 0.02617543 1990-99 29.27693762 28.863583497 29.69029174 2000-09 36.05860113 35.622412422 36.49478985 2010- 34.42172195 33.990128123 34.85331577 === Werks === Anteil in Prozent Konf.-Intervall unten Konf.-Intervall oben -1969 0.058346640 0.032118928 0.08457435 1970-79 0.009212627 -0.001211770 0.01963703 1980-89 0.015354379 0.001896953 0.02881181 1990-99 26.873234246 26.391755224 27.35471327 2000-09 38.180198993 37.652529346 38.70786864 2010- 34.863653114 34.346073261 35.38123297 tab. 8: darstellung der konfidenzintervalle für jede realisierung in abhängigkeit von Jahrzehnten KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 321 abb. 12: gruppiertes Säulendiagramm mit konfidenzintervallen für jede realisierung in abhängigkeit von Jahrzehnten Das Diagramm visualisiert die prozentuale Verteilung der Phänomene auf Jahrzehnte mit den entsprechenden Konfidenzintervallen, die in der Tabelle abgetragen sind. 32 3.6 Dispersion - Verteilung von Phänomenrealisierungen über das Gesamtkorpus Die oben dargestellten statistischen Tests können verwendet werden, um Zusammenhänge zwischen verschiedenen Variablen zu erkennen. Im Analysebeispiel wurde überprüft, ob Zusammenhänge zwischen zwei Realisierungen der Genitivmarkierung des Lexems Werk und den Jahrzehnten, in denen die Texte entstanden sind, existieren. Dennoch kann mit den beschriebenen Analysearten noch nicht ausgeschlossen werden, dass innerhalb eines Jahrzehntes (also innerhalb eines Teilkorpus) eine sehr ungleichmäßige Verteilung der Treffer vorliegt. So kann sich beispielsweise ein Phänomen vornehmlich auf nur einen Text (z.B. einen Zeitungsartikel eines einzigen Autors) beschränken und so für eine hohe Frequenz im ganzen Teilkorpus verantwortlich sein (sog. Clumpiness, siehe Church/ Gale 1995; Kilgarriff 2001, S. 107; Gries 2008, 2009; 32 Die Konfidenzintervalle können in der Visualisierung auch unter 0% bzw. über 100% liegen, weil sie symmetrisch berechnet werden. In solchen Fällen sind 0% bzw. 100% als die reale Grenze des Konfidenzintervalls zu betrachten. Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 322 Lijffijt/ Gries 2012; Bubenhofer/ Konopka/ Schneider 2014, S. 134ff.). Gries (2008) diskutiert verschiedene Maße, um die Gleichmäßigkeit einer Phänomenrealisierung im Korpus zu untersuchen (z.B. Juilland et al.s D, Rosengrens S etc.). Für die Berechnung dieser Maße wird das Korpus in kleinere Einheiten, wie z.B. Texte, Abschnitte oder Teilkorpora unterteilt. Die Maße beruhen auf einer Verrechnung der erwarteten mit den beobachteten Frequenzen in den Korpusteilen. 33 Da bei den meisten Maßen davon ausgegangen wird, dass die einzelnen Korpusteile gleich groß sind, sind sie zu überbzw. unterempfindlich gegenüber Häufigkeitsschwankungen in den Korpusteilen. Ein Maß, das speziell für Korpusdaten in Teilkorpora verschiedener Größe entwickelt wurde, ist hingegen die DP bzw. DP norm (Deviation of Proportions, siehe Gries 2008, 2009). 34 Dabei wird für jedes Teilkorpus in Relation zur Korpusgröße die erwartete Frequenz sowie die beobachtete Frequenz eines Phänomens in Prozent berechnet. Anschließend werden die Differenzen zwischen allen erwarteten und den beobachteten Prozentwerten pro Teilkorpus berechnet, summiert und durch 2 dividiert. Der berechnete Wert wird normiert, sodass das Ergebnis zwischen 0 und 1 liegt. 35 Je näher es bei 0 liegt, desto gleichmäßiger ist das Phänomen über die Teilkorpora verteilt. In Bubenhofer/ Konopka/ Schneider (2014, S. 134ff.) wurde gezeigt, wie die DP norm verwendet werden kann, um dabei zu helfen, Realisierungen als standardnah oder standardfern einzustufen: Hierzu wurde die DP norm für verschiedene Recherchebeispiele basierend auf dem DeReKo berechnet. 36 Da im DeReKo mehrere Texte zu Einheiten zusammengefasst und Dokumente genannt werden (z.B. alle Zeitungsartikel aus einem Monat einer Zeitung), wurde in der Untersuchung pro Dokument die Frequenz des Phänomens berechnet (siehe ebd.). Die abgefragten Beispiele wurden zudem als Korrelation zwischen DP norm und Frequenz im Korpus in einem Streudiagramm abgebildet (vgl. Abb. 13). 37 33 Siehe hierzu auch die Ausführungen in Bubenhofer/ Konopka/ Schneider (2014, S. 134ff.). 34 Für eine Diskussion verschiedener Maße siehe Bubenhofer/ Konopka/ Schneider (2014, S. 134ff.). 35 DP/ (1-min(s)), wobei min(s) die Größe des kleinsten Teilkorpus ausdrückt. 36 Es wurde mit unterschiedlichen Korpora gearbeitet: Das Korpus, aus dem die hier dargestellten Abfragen sind, umfasst eine Zufallsauswahl von 10% der Wörter des gesamten DeReKo und damit 374521682 Wörter und 1547513 Texte. Zudem werden Ergebnisse aus einem Schweizer Teilkorpus von Pressetexten gezeigt, das jeweils alle entsprechenden Zeitungen aus dem DeReKo beinhaltet (siehe ebd.). 37 Eine detaillierte Beschreibung der Untersuchung lässt sich in Bubenhofer/ Konopka/ Schneider (siehe ebd.) finden. KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 323 abb. 13: korrelationsplot zwischen dp norm und Frequenz im korpus einiger recherchebeispiele aus dem D e R e K o (Beispiel aus Bubenhofer/ konopka/ Schneider 2014, S. 138) Die Grafik verdeutlicht, dass das abgefragte Token diskutieren mit einer niedrigen DP norm relativ gleichmäßig im vorliegenden Korpus verteilt ist. Die anderen Recherchebeispiele weisen einen höheren Wert für die DP norm auf. Der Ausdruck diesen Jahres ist weniger gleichmäßig verteilt als dieses Jahres, das Token frug ist mit einer DP norm von über 0,95 am ungleichmäßigsten im Korpus verteilt (vgl. ebd., S. 238f.). Auch der Ausdruck parkieren ist im gesamten Korpus mit einer DP norm von über 0,9 ungleichmäßig verteilt, da das Token mit großer Wahrscheinlichkeit größtenteils in Schweizer Texten verwendet wird. Wird hingegen die DP norm des Tokens parkieren auf der Grundlage von ausschließlich Schweizer Zeitungen berechnet, so ergibt sich ein anderer Wert: Die DP norm für parkieren liegt hier unter 0,2 (die Recherche ist in der Grafik oben mit CH markiert). Die Variante parkieren ist erwartungsgemäß in den Schweizer Texten gleichmäßiger verteilt als parken. Werden DP norm und Frequenz der abgefragten Tokens korreliert (vgl. Abb. 13), kann festgestellt werden, dass Ausdrücke, die häufiger im Korpus vorkommen, oft gleichmäßiger im Korpus verteilt sind, während Ausdrücke, die ungleichmäßiger verteilt sind (im oberen Bereich der Grafik), seltener vorkommen. Die Korrelation von der Frequenz im Korpus und der DP norm kann somit dazu genutzt werden, die Standardnähe einer Realisierung zu analysieren. Auf diese Weise Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 324 kann gezeigt werden, dass Realisierungen, die im oberen Bereich der Grafik liegen und eine niedrigere Frequenz im Korpus aufweisen, eher standardferne Varianten darstellen, während Realisierungen im unteren Bereich der Grafik häufig eine hohe Frequenz im Korpus aufweisen und eher der standardnahen Sprache zuzuordnen sind. In KoGra-R werden die Teilkorpora durch die Metainformationen definiert, die im Rahmen der Kontingenztabelle typischerweise zeilenweise dargestellt werden. In dem Abfragebeispiel aus den vorangegangenen Abschnitten sind dies die Häufigkeiten für Werks und Werkes in den jeweiligen Jahrzehnten. Für jedes Teilkorpus (= Jahrzehnt) wird die Frequenz des Phänomens berechnet. 38 Folgende Ergebnisse werden für die Berechnung der DP und DP norm ausgegeben: === Werkes === Deviation of proportions (DP): 0.06446221 Deviation of proportions, normalized (DP norm ): 0.06448047 === Werks === Deviation of proportions (DP): 0.03950845 Deviation of proportions, normalized (DP norm ): 0.03951965 Die DP und die DP norm der Abfrage Werkes liegen bei ca. 0,06. Die Werte der Abfrage Werks betragen beide ca. 0,04. Das Nomen mit der kurzen Genitivendung -s ist demnach gleichmäßiger über die Jahrzehnte verteilt als die Realisierung mit der langen Genitivmarkierung -es. Es ist aber ebenfalls anzumerken, dass beide Phänomene im Vergleich zur Gesamtspanne der DP-Werte (zwischen 0 und 1) sehr gleichmäßig im Korpus verteilt sind. 39 4. Implementation KoGra-R ist ein webbasiertes Tool: Über Links, die von KoGra-DB-Rechercheergebnissen ausgehen, oder von einer Webseite aus, über die COSMAS-II- Exportdateien und frei definierte Tabellen eingegeben werden können, wird ein CGI-Programm gestartet. 40 Dieses Programm ist in der Programmierspra- 38 Dispersionsmaße können in KoGra-R nur berechnet werden, wenn die jeweiligen Korpusbezugsgrößen (hier: Gesamttokenanzahl der Teilkorpora) vorliegen. 39 In KoGra-R wird außerdem die DP norm für jedes Phänomens bzw. für jede Abfrage mit der absoluten Trefferanzahl korreliert und in einem Streudiagramm abgetragen. 40 CGI = Common Gateway Interface. KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 325 che Python geschrieben. 41 Es liest die zu analysierenden Tabellen ein, prüft sie und wandelt sie um in das Tabellenformat der Statistiksprache R (R Core Team 2016). Dann ruft das Programm ein R-Skript auf, übergibt diesem die umgewandelten Tabellen und empfängt die Analyseergebnisse. Die Analyseergebnisse werden formatiert, in ein HTML-Template eingefügt und der Nutzerin/ dem Nutzer als Webseite zurückgegeben und angezeigt. Bei der Implementation sowohl des Pythonals auch des R-Skripts wurde darauf geachtet, dass sie modular aufgebaut, leicht modifizierbar und vor allem problemlos zu erweitern sind. So können leicht zusätzliche statistische Analysen hinzugefügt und ggf. auch weitere Inputmodi ergänzt werden. Die Programme sind durchweg ausführlich dokumentiert, sodass ihre Pflege gewährleistet ist. In diesem Abschnitt beschreiben wir in gebotener Kürze den Aufbau der Ko- Gra-DB (Unterabschnitt 4.1), des CGI-Programms (Unterabschnitt 4.2) und des R-Programms (Unterabschnitt 4.3). 4.1 KoGra - DB Die Korpusgrammatik-Datenbank KoGra-DB wurde als Testsystem mit dem Ziel entwickelt, die Anwendbarkeit relationaler Datenstrukturen für die Verwaltung sprachwissenschaftlich motivierter Textkorpora zu evaluieren. Sie enthält Primärdaten - also authentische Sprachbelege aus DeReKo-Subkorpora - kombiniert mit linguistischen und außersprachlichen Metadaten. Die Segmentierung erfolgt auf Wortebene, d.h., ein Datensatz besteht aus einem Textwort, angereichert um Lemma- und Wortklassenangabe. Deren Inhalte sowie die Bestimmung von Satzgrenzen basieren auf dem morphosyntaktischen Output dreier Tagging-Werkzeuge: TreeTagger, Connexor Machinese Phrase Tagger und Xerox Incremental Parser. Gemeinsam nehmen die Sprach- und Annotationsdaten ca. vier Terabyte (TB) Speicherplatz ein. Angereichert wurden die wortspezifischen Inhalte um korpusspezifische Metadaten, die in Kapitel 2.1 detaillierter beschrieben werden. 41 www.python.org (letzter Zugriff: 7.3.2017). Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 326 abb. 14: online abfrage der kogra dB Sämtliche Inhalte von KoGra-DB wurden zu Evaluationszwecken projektintern durch ein Online-Frontend recherchierbar gemacht (Abb. 14). Dies erlaubt die Eingabe beliebiger Kombinationen aus Wortfolgen sowie Lemma- oder Wortklassenangaben. Die außersprachlichen Metaangaben können zur Eingrenzung der Suchergebnisse herangezogen werden; vgl. auch Abschnitt 2.1. Die nachfolgende Tabelle (Tab. 9) vermittelt einen Eindruck vom Umfang des Datenbestands. KoGra-DB basiert aktuell auf dem DeReKo-Release 2014-II; im Vergleich zum in Bubenhofer/ Konopka/ Schneider (2014) beschriebenen Inventar hat sich der Umfang damit auf knapp 8 Milliarden Tokens nahezu KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 327 verdoppelt. Ausgenommen von dieser Erweiterung sind bislang die auf dem Xerox-Tagger basierten Teildaten sowie das ausgewogene Korpus. 42 Untersuchungskorpus Ausgewogenes Korpus Texte 25.426.585 20.148 Connexor-Sätze 486.874.983 1.165.198 Connexor-Tokens 7.903.963.339 20.026.757 TreeTagger-Sätze 367.143.190 815.029 TreeTagger-Tokens 7.484.900.808 18.517.447 tab. 9: text - , Satz - und Wortvolumen der kogra dB 4.2 CGI/ Python KoGra-R besteht aus Python-Skripten, R-Skripten, HTML-Dateien und -Templates und einem CSS-Skript. Die HTML-Dateien enthalten (i) die Eingabemaske für COSMAS-II-Exportdateien und Nutzer-definierte Tabellen, (ii) die Erläuterungen zur Dateneingabe und (iii) die Erläuterungen zu den statistischen Auswertungen. Die Templates dienen der Formatierung der Ausgaben, also (i) der Prüfungsergebnisse von Tabellen 43 und (ii) der Auswertungen wohlgeformter Tabellen. Die Darstellung aller HTML-Seiten wird durch ein CSS-Skript gesteuert. Das eigentliche CGI-Programm ist in Python 2.7 implementiert. Zentral ist ein Modul, in dem verschiedene Funktionen zur Datenkontrolle und -transformation definiert sind. Außerdem werden globale Variablen in einer separaten Steuerdatei definiert, weshalb das Programm leicht an Änderungen der Serverstruktur oder der Input-Formate angepasst werden kann. Zwei CGI-Skripte laden die zentral definierten Funktionen und Variablen. Ein Skript dient der Prüfung von Input-Daten, das andere fungiert als Schnittstelle zu den in R programmierten statistischen Analysen und ruft diese für alle geprüften Tabellen auf. 42 Dieses Korpus ist aus ausgewählten Texten des Gesamtkorpus zusammengestellt und ausgewogen in Bezug auf den Parameter Medium (siehe Bubenhofer/ Konopka/ Schneider 2014, S. 76f.). 43 Siehe oben, Abschnitt 2: Gerade von Nutzer(inne)n frei definierte Tabellen sind möglicherweise nicht wohlgeformt und können also nicht ausgewertet werden. Sie werden daher vor ihrer Weiterverarbeitung geprüft. Das Prüfungsergebnis wird der Nutzerin/ dem Nutzer angezeigt. Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 328 4.3 R Serverseitige R-Ausführung Ein R-Steuerskript (unsere Terminologie) wird mit den übergebenen Parametern gestartet. Die ersten 6 Parameter bei der Ausführung repräsentieren Teile der übergebenen Tabellen, Parameter 7 ist technischer Natur und Parameter 8 steuert den genauen Analysemodus (in Abhängigkeit von der Anzahl vorhandener Abfragen und dem Vorhandensein von Korpusbezugsgrößen). Das Steuerskript lädt dann ein R-Paket, das alle Funktionen enthält, die für die weiteren Auswertungen notwendig sind. Je nach aktuellem Analysemodus werden dann alle oder einige der Funktionen ausgeführt. Erweiterungen am R-Teil von KoGra-R müssen also immer an zwei Orten erfolgen: Die neue Funktion muss in das Paket aufgenommen werden und die Funktion muss im Steuerskript aufgerufen werden. Das Steuerskript enthält außerdem einige Ausgaben, die dem umgebenden CGI-Skript erlauben, mit den Outputs der R-Funktionen umzugehen. Diese Ausgaben sind in Form von XML-Tags realisiert. Das Steuerskript ist ausführlich im Programmcode dokumentiert, sodass eine Erweiterung für Personen, die mit R vertraut sind, keine große Hürde darstellen sollte. Anwenderseitige Ausführung Die R-Funktionen werden immer serverseitig ausgeführt und von KoGra-R per Browser zurückgegeben. Allerdings ermöglicht KoGra-R, den R-Code in einer lokalen R-Installation auszuführen. Hierzu wird im Output sowie in der Dokumentation der aktuell serverseitig ausgeführte R-Code mit ausgegeben. Wichtig ist hierbei, dass auch der Code für die Erzeugung der Tabellen bereitgestellt wird. Nur so können alle Auswertungen am eigenen PC nachvollzogen bzw. bei Bedarf modifiziert oder erweitert werden. Hierzu muss eine lokale R-Installation gestartet werden und der angezeigte Code in einen Skript-Editor kopiert werden. R ist freie Software und kann unter www.r-project.org (letzter Zugriff: 10.12.2018) für Windows, macOS und Linux heruntergeladen werden. 5. Evaluation KoGra-R wurde zweimal evaluiert, jeweils mithilfe eines Fragebogens (siehe Anhang). Beide Evaluationen fanden nach unterschiedlichen Entwicklungsstufen des Tools statt. Die erste Evaluation erfolgte von Dezember 2014 bis Januar 2015. Sie beschränkte sich auf die Auswertung von KoGra-DB-Re- KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 329 cherchen. 44 Sechs Personen haben teilgenommen, durchweg Mitarbeiter/ innen des Projekts Korpusgrammatik und Nutzer/ innen der KoGra-DB, die nicht an der Konzeption und Implementierung von KoGra-R beteiligt waren. Diese Evaluation war besonders wichtig, da die Teilnehmer/ innen zunächst die primäre Zielgruppe des Tools bildeten. Die zweite Evaluation erfolgte, nachdem das Tool für die Öffentlichkeit zur Verfügung gestellt wurde, von März bis Juni 2015, wieder mithilfe desselben, leicht angepassten, Fragebogens. Bei der zweiten Evaluation ging es um die statistischen Auswertungen von COSMAS-II-Exportdateien und Nutzer-definierten Tabellen. Es haben 18 Personen teilgenommen, die aber nicht durchweg alle Fragen beantwortet haben - die meisten Fragen wurden von insgesamt 13 Personen beantwortet. Ein Teil der Mitarbeiter/ innen des Projekts Korpusgrammatik, die bereits an der ersten Evaluation teilgenommen hatten, hat auch an der zweiten Evaluation teilgenommen. Die übrigen Teilnehmer/ innen waren Mitarbeiter/ innen aus verschiedenen Abteilungen des Instituts für Deutsche Sprache, deren wissenschaftliches Interesse vom Projekt Korpusgrammatik unabhängig war. Bei beiden Evaluationen wurden die Teilnehmer/ innen gebeten, Korpusrecherchen durchzuführen und die Ergebnisse mit KoGra-R auszuwerten, um so Erfahrungen im Umgang mit dem Tool zu sammeln. Es stand den Teilnehmer(inne)n frei, eigene Fragestellungen zu bearbeiten. Darüber hinaus wurden Vorschläge gemacht, was sie untersuchen könnten. Bei der ersten Evaluation wurden sie angeregt, das Verhältnis von wegen + Genitiv und wegen + Dativ zu untersuchen. Eine Annäherung kann durch die Suchanfragen wegen des und wegen dem vorgenommen werden. Bei der zweiten Evaluation wurden zusätzlich Vergleiche von Werks und Werkes, des Irak, des Iraks und des Irakes, parkieren und parken, fragte und frug und diesen Jahres und dieses Jahres vorgeschlagen. Im Rahmen der ersten Evaluation wurden die Teilnehmer/ innen aufgefordert, sowohl Korpusrecherchen einzeln auszuwerten als auch mehrere Recherchen miteinander zu vergleichen und gemeinsam auszuwerten. Bei der zweiten Evaluation sollten die Teilnehmer/ innen die Auswertung von COSMAS-II-Exportdateien und von frei definierten Tabellen bewerten. Die Fragebögen wurden jeweils online ausgefüllt. Beide Evaluationen waren anonym. Die Evaluationen hatten qualitative und quantitative Aspekte. Es wurden zum einen offene Fragen gestellt, zum anderen sollten Vorkenntnisse der Teilnehmer/ innen und Eigenschaften von KoGra-R auf einer Skala von 1-7 beurteilt werden. Mit den Evaluationen haben wir drei Ziele verfolgt: Erstens wollten wir mehr über die Nutzer/ innen, insbesondere ihre korpuslinguisti- 44 Die Schnittstellen zur Eingabe von COSMAS-II-Exportdateien und Nutzer-definierten Tabellen waren zu dieser Zeit noch nicht implementiert. Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 330 schen und statistischen Vorkenntnisse und ihr Interesse im Umgang mit Korpusdaten erfahren. Zweitens wollten wir die Nützlichkeit und Nutzbarkeit des Tools einschätzen. Drittens wollten wir Anforderungen zur Erweiterung und Verbesserung des Analysetools erheben. Um mehr über die Nutzer/ innen und ihre Vorkenntnisse zu erfahren, haben wir sie nach ihren Fachgebieten und ihren Erfahrungen mit Korpusrecherche und statistischer Analyse gefragt. Wir haben sie gebeten, ihre Erfahrungen mit Korpusrecherche und statistischer Analyse auf einer Skala von 1-7 (1: sehr niedrig, 7: sehr hoch) einzuschätzen. Außerdem haben wir sie gebeten zu beschreiben, welche Korpusrecherchen sie üblicherweise durchführen. Darüber hinaus wollten wir die Akzeptanz der Nutzer/ innen von KoGra-R einschätzen. Dem Technology Acceptance Model (TAM; Davis/ Bagozzi/ Warshaw 1989) zufolge sind die zentralen Faktoren der Akzeptanz die wahrgenommene Nützlichkeit und die Nutzbarkeit, d.h. Einfachheit der Nutzung (Perceived Usefulness and Perceived Ease of Use; Davis 1989). In Anlehnung an Davis (1989) haben wir Fragen formuliert, um die Einschätzungen bezüglich Nützlichkeit und Einfachheit der Nutzung zu erheben. Wir haben die Teilnehmer/ innen auf einer Skala von 1-7 (1: sehr niedrig, 7: sehr hoch) bewerten lassen, (i) ob KoGra-R nützlich für sie ist, (ii) ob sie ihre Arbeitsziele mit dem Tool besser erreichen können, (iii) ob die Bedienung einfach, (iv) frustrierend oder (v) mühsam ist, (vi) ob das Tool motivierend wirkt, (vii) ob die Teilnehmer/ innen ihre Aufgaben mit dem Tool besser eigenständig bewältigen können und (viii) ob sie das Tool öfter benutzen wollen. Außerdem haben wir detailliert für jeden Input-Modus und jede einzelne statistische Analyse und Darstellung gefragt, (i) ob der/ die Nutzer/ in die Daten respektive Auswertungsergebnisse versteht, (ii) ob Letztere für ihn hilfreich sind, (iii) ob die Erläuterungen zu den Daten respektive Auswertungen hilfreich sind und (iv) ob die Erläuterungen das Informationsbedürfnis befriedigen. Wir haben die genannten Urteile wieder durch Bewertungen auf einer Skala von 1-7 abgeben lassen. Schließlich haben wir zur Erhebung weiterer Anforderungen die Teilnehmer/ innen explizit gefragt, welche zusätzlichen statistischen Analysen und Darstellungsformen sie sich wünschen, wie die Erläuterungen verbessert werden können, welche weiteren Input-Modi sie für sinnvoll erachten und wie man das Tool darüber hinaus noch verbessern könnte. Zu den Ergebnissen: 45 Die Teilnehmer/ innen beider Evaluationen gaben an, über gute Kenntnisse in Korpusrecherchen zu verfügen (auf einer Skala von 1-7, im Mittel: erste Evaluation 5,0, zweite Evaluation 4,71). Allerdings konstatierten sie, dass ihre Er- 45 Die Ergebnisse sind - bis auf die Freitextantworten - im Anhang dargestellt. KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 331 fahrungen mit statistischen Analysen weniger als mittelgut sind (auf einer Skala von 1-7, im Mittel: erste Evaluation 3,17, zweite Evaluation 2,94). Es lässt sich daraus schließen, dass die Teilnehmer/ innen Unterstützung bei der Auswahl und Interpretation statistischer Analysen und Darstellungsweisen benötigen. Diese Einschätzung wird durch explizite Antworten auf die Fragen zur Verbesserung des Tools gestützt. Nach der Auswertung der ersten Evaluation wurde aus diesem Grund ein besonderes Augenmerk auf die Erweiterungen der Dokumentation und der Erläuterungen zu den statistischen Analysen gelegt. Dabei legten wir insbesondere Wert auf die Nennung zusätzlicher weiterführender Literatur sowie eine bessere didaktische Aufbereitung der Erläuterungen zu den Analysen. Außerdem räumten wir potenzielle Missverständnisse aus, die aus der bis dato vorliegenden Dokumentation hervorgehen konnten. An einigen Stellen wurden weiterhin Hinweise zu den Voraussetzungen der einzelnen Tests eingefügt. In beiden Evaluationen wurde KoGra-R von den Teilnehmer(inne)n auf einer Skala von 1-7 als nützlich (im Mittel: erste Evaluation 6,0, zweite Evaluation 4,29) und einfach zu bedienen (im Mittel: erste Evaluation 5,12, zweite Evaluation 4,67) eingeschätzt. Die Benutzung war weder mühsam (im Mittel: erste Evaluation 2,67, zweite Evaluation 2,19) noch frustrierend (im Mittel: erste Evaluation 2,5, zweite Evaluation 2,13). Die Teilnehmer/ innen gaben an, dass sie das Tool in Zukunft öfter nutzen werden (erste Evaluation 5,84, zweite Evaluation 4,0). Das Ergebnis der ersten Evaluation kann im Allgemeinen als gut, das der zweiten als etwas verhaltener beschrieben werden. Wenn man statt des arithmetischen Mittels jeweils den Modus und den Median betrachtet, muss man die Ergebnisse beider Evaluationen noch positiver bewerten. 46 Die unterschiedlichen Ergebnisse beider Evaluationen sind dadurch zu erklären, dass KoGra-R in erster Linie für das Projekt Korpusgrammatik entwickelt wurde, dessen Mitarbeiter/ innen es in der ersten Evaluation entsprechend sehr gut bewertet haben. Auf die Mitarbeiter/ innen der anderen Abteilungen des IDS, die an der zweiten Evaluation teilnahmen, war das Tool nicht direkt zugeschnitten. Es ist daher nicht verwunderlich, dass sie das Tool zwar positiv, aber zurückhaltender bewerteten. Die Teilnehmer/ innen beider Evaluationen haben zahlreiche Hinweise gegeben, wie das Tool für die allgemeine Nutzung erweitert werden kann. Darunter waren kleinere Hinweise zu Details der Ergebnisansichten und Erläuterungen, die leicht umgesetzt werden konnten und unmittelbar umgesetzt wurden. Darüber hinaus betrafen die Hinweise der ersten Evaluation in erster Linie (i) die Dokumentation und Erläuterungen und (ii) die Ergänzung weiterer Input-Modi. Anforderungen zur Erweiterung der Erläuterungen wurden 46 Vgl. Ergebnisse im Anhang, insbesondere die Fragen unter Punkt 4. Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 332 sowohl explizit als auch implizit gegeben, Letzteres durch Hinweise, die Missverständnisse in Bezug auf einzelne Analysen offenbarten. Die Erläuterungen wurden entsprechend ergänzt und umformuliert. Zur Zeit der ersten Evaluation gab es nur einen Input-Modus, nämlich die Schnittstelle zur KoGra-DB. Die Antworten der Evaluationsteilnehmer/ innen wurden zum Anlass genommen, die beiden zusätzlichen Input-Modi - die Schnittstelle zu COSMAS II und das Formular zur Eingabe selbstdefinierter Tabellen - zu implementieren. In der zweiten Evaluation wurden verstärkt Hinweise zur Anpassung der statistischen Analysen und Diagramme gegeben, die in die Dokumentation aufgenommen wurden. Außerdem wurde das Farbspektrum zur Darstellung der Ergebnisse bei den Vergleichen beliebig vieler Abfragen erweitert. Darüber hinaus wurden an einigen Stellen die Labels in den Diagrammen so angeordnet, dass sie übersichtlicher erscheinen. Dennoch muss (auch im Rahmen der Dokumentation) darauf hingewiesen werden, dass ab einer Anzahl von 100 Variablenausprägungen mit Sicherheit davon ausgegangen werden kann, dass weder Übersichtlichkeit noch Responsivität des Tools gegeben sind (z.B. bei einer COSMAS-II-Quellenansicht). Nach der zweiten Evaluation wurde zusätzlich zu den Erläuterungen zur Tabelleneingabe eine Beispieltabelle auf der Startseite erstellt, die zum einen als Vorlage für eigene Tabellen verwendet werden kann, zum anderen in das Auswertungsformular kopiert werden kann, um direkt zu einer Beispielauswertung zu gelangen. Im Ergebnis konnte durch die beiden Evaluationen bestätigt werden, dass KoGra-R ein sinnvolles und gut zu nutzendes Werkzeug für die datengestützte Linguistik ist. KoGra-R kann ausgebaut und durch zusätzliche Analysen ergänzt werden. Der Ausbau soll allerdings nicht zu weit gehen: KoGra-R muss einfach und unmittelbar zu bedienen sein und die schnelle Durchführung vordefinierter Analysen ermöglichen. 6. zusammenfassung und ausblick In diesem Kapitel wurde das webbasierte Tool KoGra-R vorgestellt, über das in der Programmiersprache R implementierte statistische Auswertungen durchgeführt werden können. In Abbildung 15 wird die Struktur von KoGra- R zusammenfassend dargestellt: KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 333 - abb. 15: Schematische darstellung der Struktur von kogra r Durch das Tool können Kontingenztabellen, die über die projektinterne Datenbank KoGra-DB recherchiert werden, ausgewertet werden. Darüber hinaus bietet KoGra-R die Möglichkeit, von COSMAS II erzeugte Frequenzlisten zu analysieren und miteinander zu vergleichen. Durch das Hochladen von (evtl. in Excel erzeugten) CSV-Tabellen und durch die direkte Eingabe von Kontingenztabellen über die Benutzeroberfläche bestehen weitere Möglichkeiten der Dateneingabe. Die eingegebenen Tabellen werden nicht direkt ausgewertet, sondern zuerst auf ihre Wohlgeformtheit geprüft. Falls die Tabelle nicht wohlgeformt ist, werden Fehlermeldungen ausgegeben und potenzielle Fehler markiert. Zu den statistischen Werkzeugen, die durch das Tool zur Verfügung gestellt werden, zählen deskriptive Analysearten, wie z.B. die Auswahl von Tabellen und Diagrammen für Rohdaten, normierte und relative Werte sowie die Anwendung von inferenzstatistischen Verfahren und Visualisierungsmöglichkeiten, die auf der Chi-Quadrat-Statistik beruhen. Darüber hinaus werden Konfidenzintervalle berechnet und visualisiert. Eine weitere Analysemöglichkeit besteht in der Berechnung der DP norm , mit der Aussagen über die Verteilung von Phänomenrealisierungen im Korpus getroffen werden können. Zu der Eingabe der Tabellen und den statistischen Analysearten ist in KoGra-R eine Dokumentation verfügbar, zu der man über Hyperlinks im Tool geleitet wird. Außerdem wird zu den verschiedenen Analyseschritten der verwendete R-Code zur Verfügung gestellt. KoGra-R wurde im Rahmen der Projektarbeit zwei Evaluationsprozessen unterzogen. Das Tool wurde als nützlich und in der Bedienung einfach empfunden. Die Hinweise der Teilnehmer/ innen aus beiden Evaluationen wurden je nach Möglichkeit berücksichtigt und umgesetzt. Vor allem die Verbesserun- Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 334 gen in der Dokumentation und die Erweiterung der Input-Modi um eine Schnittstelle zu COSMAS II und das Formular zur Eingabe selbstdefinierter Tabellen haben sich im Zuge der zweiten Evaluation als gewinnbringend erwiesen. Die statistischen Analysen sowie die einbettende Infrastruktur können an mehreren Stellen erweitert werden. Mögliche Erweiterungen lassen sich grob in zwei Teilbereiche gliedern: Erweiterungen bezüglich der Präsentation der Ergebnisse und Erweiterungen bezüglich der durchgeführten Analysen. Präsentationsseitig wäre daran zu denken, noch mehr auf unterschiedliche Zielsetzungen beim Einsatz des Tools einzugehen. Führt man z.B. Analysen durch, um die resultierenden Schaubilder in Veröffentlichungen zu verwenden, wäre es hilfreich, die Schaubilder zusätzlich zur momentanen Form noch als hochauflösende Grafiken zur Verfügung zu stellen. Da sich die Erstellung hochauflösender Grafiken u.U. negativ auf die Performanz des Tools auswirken könnte, wäre es wünschenswert, diese Versionen der Grafiken nur auf Anfrage der Nutzerin/ des Nutzers zu erstellen. Ebenfalls eine präsentationsbezogene Erweiterung wäre die Einführung eines Modus für Expert(inn)en, in dem die Rückgabe besonders schlank, also ohne zusätzliche Kurzkommentare, erfolgen könnte. Auf Seiten der statistischen Analyse sind der Erweiterung auf weitere Tests oder Visualisierungen momentan nur insofern Grenzen gesetzt, als jedes zusätzliche Verfahren mit einer einfachen Kontingenztabelle umgehen können muss. Ein korpuslinguistisch inzwischen breit angewendetes Verfahren wie eine logistische Regressionsanalyse, mit der man z.B. auch die Interaktion zwischen verschiedenen Faktoren untersuchen kann, ist somit nicht ohne Weiteres möglich, weil logistische Regressionen auf Einzelfallbasis operieren und somit nicht mit Kontingenztabellen umgehen können. Komplexere statistische Verfahren, die in der Regel auf Einzelfallbasis beruhen, stehen aber auch nicht im Fokus des Tools, denn das Ziel von KoGra-R ist eine erste Datenexploration, um ggfs. Hypothesen für weitere statistische Analysen zu gewinnen. 47 Auch die bereits implementierten Tests können an einigen Stellen erweitert bzw. verfeinert werden. Der Chi-Quadrat-Test kann z.B. zu verzerrten Ergebnissen führen, wenn in mehr als 20% der Zellen die erwartete Häufigkeit unter 5 fällt. Dies ist momentan lediglich in der Dokumentation vermerkt. Es 47 Im Projekt Korpusgrammatik werden und wurden komplexere statistische Verfahren in weiteren Untersuchungsphasen durchgeführt. Zu nennen sind hier z.B. Bubenhofer/ Hansen-Morath/ Konopka (2014) und Konopka/ Fuß (2016) sowie Brandt (unter Mitwirkung von Bildhauer; in diesem Band), in denen die Variation zum einen mithilfe eines durch maschinelles Lernen erzeugten Entscheidungsbaumes und zum anderen durch logistische Regressionsanalysen untersucht wurde. KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 335 wäre aber auch denkbar, dass dies innerhalb des statistischen Auswertungsskripts automatisch eruiert wird. Sollte es der Fall sein, dass die kritische Zahl an schwach besetzten Zellen überschritten wird, könnte dann statt des Chi- Quadrat-Tests automatisch ein Fisher’s Exact Test berechnet und ausgegeben werden. KoGra-R ist im augenblicklichen Zustand auch durch projektexterne Mitarbeiter/ innen des Instituts für Deutsche Sprache evaluiert worden. Man merkt der dazugehörigen Dokumentation an einigen Stellen noch die ursprüngliche Ausrichtung auf korpusbasierte Häufigkeitsdaten an. Im Grunde spricht aber nichts dagegen, KoGra-R für alle häufigkeitsbasierten Auswertungen anzuwenden. Dies würde den potenziellen Kreis an Benutzer(inne)n deutlich erweitern. So könnten auch experimentell arbeitende Wissenschaftler/ innen ihre Daten in KoGra-R auswerten. Dabei ist z.B. an Häufigkeiten bestimmter Antwortkategorien (z.B. richtig/ falsch) von Proband(inn)en innerhalb eines experimentellen Settings zu denken, wie es beispielsweise in der Psycholinguistik angewendet wird. Die Spalten einer solchen Tabelle könnten sich dann durch verschiedene Experimentalbedingungen definieren. Im Grunde kann KoGra-R schon jetzt auf diese Art von Daten angewendet werden, z.B. über die Eingabe von benutzerdefinierten Tabellen. Auch der Einsatz von KoGra-R in der Lehre, nämlich als einfach zu bedienendes Werkzeug zur häufigkeitsbasierten statistischen Auswertung, ist nicht zu unterschätzen. Hier kann die ausführliche Dokumentation schon jetzt dazu dienen, Studierenden die quantitativ-statistische Forschungsarbeit behutsam nahezubringen. literatur Backhaus, Klaus et al. (2016): Multivariate Analysemethoden. Eine anwendungsorientierte Einführung. 14. Aufl. Berlin/ Heidelberg: Springer. Bortz, Jürgen (2005): Statistik für Human- und Sozialwissenschaftler. 6., vollst. überarb. u. aktual. Aufl. Berlin u.a.: Springer. Bortz, Jürgen/ Lienert, Gustav A. (2008): Kurzgefasste Statistik für die klinische Forschung. Leitfaden für die verteilungsfreie Analyse kleiner Stichproben. 3., aktual. u. bearb. Aufl. Heidelberg: Springer. Brunner, Edgar/ Munzel, Ullrich (2013): Nicht-parametrische Datenanalyse. Unverbundene Stichproben. 2., überarb. Aufl. Berlin/ Heidelberg: Springer. Bubenhofer, Noah/ Hansen-Morath, Sandra/ Konopka, Marek (2014): Korpusbasierte Exploration der Variation der nominalen Genitivmarkierung. In: Zeitschrift für germanistische Linguistik 42, 3, S. 379-419. Bubenhofer, Noah/ Konopka, Marek/ Schneider, Roman (2014): Präliminarien einer Korpusgrammatik. (= Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache 4). Tübingen: Narr. Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 336 Church, Kenneth W./ Gale, William A. (1995): Poisson mixtures. In: Natural Language Engineering 1, 2, S. 163-190. Cohen, Ayala (1980): On the graphical display of the significant components in twoway contingency tables. In: Communications in Statistics - Theory and Methods 9, 10, S. 1025-1041. Davis, Fred D. (1989): Perceived usefulness, perceived ease of use, and user acceptance of information technology. In: MIS Quarterly 13, 3, S. 319-340. Davis, Fred D./ Bagozzi, Richard P./ Warshaw, Paul R. (1989): User acceptance of computer technology: A comparison of two theoretical models. In: Management Science 35, 8, S. 982-1003. Emerson, John W. (1998): Mosaic displays in S-PLUS: A general implementation and a case study. In: Statistical Computing & Statistical Graphics Newsletter 9, 1, S. 17-23. Field, Andy/ Miles, Jeremy/ Field, Zoë (2012): Discovering statistics using R. Los Angeles, CA u.a.: SAGE. Friendly, Michael (1992): Graphical methods for categorical data. In: SEUGI ‘92. Proceedings of the SAS User’s Group International Conference May 19-22, 1992. (= SAS Institute 17). Heidelberg: SAS Institute, S. 190-200. www.math.yorku.ca/ SCS/ sugi/ sugi17-paper.html (Stand: 23.11.2017). Friendly, Michael (1994): Mosaic displays for multi-way contingency tables. In: Journal of the American Statistical Association 89, 425, S. 190-200. Fürbacher, Monica (2015): Spezialstudie: Regionale Verteilung. In: Grammis 2.0, Variation der starken Genitivmarkierung. Mannheim: Institut für Deutsche Sprache. http: / / hypermedia.ids-mannheim.de/ call/ public/ korpus.ansicht? v_id=5087 (Stand: 16.4.2018). Gries, Stefan Thomas (2008): Dispersions and adjusted frequencies in corpora. In: International Journal of Corpus Linguistics 13, 4, S. 403-437. Gries, Stefan Thomas (2009): Dispersions and adjusted frequencies in corpora: Further explorations. In: Language and Computers 71, 1, S. 197-212. Hansen-Morath, Sandra/ Wolfer, Sascha (2017): Standardisierte statistische Auswertung von Korpusdaten im Projekt „Korpusgrammatik“ (KoGra-R). In: Konopka, Marek/ Wöllstein, Angelika (Hg.): Grammatische Variation. Empirische Zugänge und theoretische Modellierung. (= Jahrbuch des Instituts für Deutsche Sprache 2016). Berlin: De Gruyter, S. 345-356. Hartigan, John A./ Kleiner, Beat (1984): A mosaic of television ratings. In: The American Statistician 38, 1, S. 32-35. Institut für Deutsche Sprache (2014): Deutsches Referenzkorpus. Archiv der Korpora geschriebener Gegenwartssprache 2014-II (Release vom 11.9.2014). Mannheim: Institut für Deutsche Sprache. www.ids-mannheim.de/ DeReKo (Stand: 23.11.2017). Kilgarriff, Adam (2001): Comparing corpora. In: International Journal of Corpus Linguistics 6, 1, S. 97-133. Konopka, Marek/ Fuß, Eric (2016): Genitiv im Korpus. Untersuchungen zur starken Flexion des Nomens im Deutschen. (= Studien zur deutschen Sprache 70). Tübingen: Narr. KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 337 Konopka, Marek/ Waßner, Ulrich Hermann, unter Mitwirkung von Sandra Hansen (2013): Standarddeutsch messen? Frequenz und Varianz negativ-konditionaler Konnektoren. In: Korpus - gramatika - axiologie 8, S. 12-35. Lijffijt, Jefrey/ Gries, Stefan Thomas (2012): Correction to „Dispersions and adjusted frequencies in corpora“. In: International Journal of Corpus Linguistics 17, 1, S. 147-149. Meyer, David/ Zeileis, Achim/ Hornik, Kurt (2005): The strucplot framework: Visualizing multi-way contingency tables with vcd. In: Research Report Series - Department of Statistics and Mathematics 22, Wirtschaftsuniversität Wien. http: / / epub.wu.ac.at/ dyn/ openURL? id=oai: epub.wu-wien.ac.at: epub-wu-01_8a1 (Stand: 23.11.2017). R Core Team (2016): The R project for statistical computing. www.R-project.org (Stand: 7.3.2017). Wiechmann, Daniel (2008): On the computation of collostruction strength: Testing measures of association as expressions of lexical bias. In: Corpus Linguistics and Linguistic Theory 4, 2, S. 253-290. Wolfer, Sascha/ Hansen-Morath, Sandra (2017): Visualisierung linguistischer Daten mit der freien Grafik- und Statistikumgebung R. http: / / kograno.ids-mannheim.de/ VisR-OnlinePub (Stand: 23.11.2017). Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 338 anhang A. Fragen des Evaluationsbogens 1. Was ist Ihr Fachgebiet? 2. Wie hoch würden Sie Ihre Erfahrung mit der statistischen Analyse von Korpusdaten einschätzen? □ sehr niedrig □ niedrig □ mittelhoch □ hoch □ sehr hoch 3. Bitte beschreiben Sie kurz Ihre Erfahrungen mit Korpusrecherche und statistischer Analyse. 4. Sie haben mit KoGra-R ein System zur automatischen Durchführung vorgegebener statistischer Analysen von Korpusrecherchen benutzt. Es gab zwei Benutzungsszenarien: (a) Die Daten einer einzelnen KoGra-Abfrage wurden ausgewertet, (b) die Daten mehrerer KoGra-Abfragen wurde ausgewertet und im Zuge dessen verglichen. Inwieweit stimmen Sie den folgenden Aussagen zu? − Das System ist nützlich für mich. stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Ich kann meine Arbeitsziele aufgrund des Systems besser erreichen. stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Die Bedienung des Systems war einfach. stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Die Benutzung des Systems war frustrierend. stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Die Benutzung des Systems war mühsam. stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Die Benutzung des Systems war motivierend. stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Durch das System konnte ich meine Aufgaben besser eigenständig bewältigen. stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Ich werde das System, sofern ich Zugang zu ihm habe, öfter benutzen. stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 339 5. Inwieweit stimmen Sie den folgenden Aussagen zu? 5.1 Für den Fall der Auswertung einer einzelnen KoGra-Abfrage: 5.1.1 Ich verstehe die Daten respektive Auswertungsergebnisse. − R-Code zur Tabellenerzeugung stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Rohdaten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Phi Assoziationsstärke/ Cramérs V Assoziationsstärke stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, erweiterte Häufigkeiten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, Residuen (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Assoziationsplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Mosaikplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 340 − Konfidenzintervalle (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Dispersionsmaße stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu 5.1.2 Die Daten respektive Auswertungsergebnisse sind für meine Arbeit hilfreich. − R-Code zur Tabellenerzeugung stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Rohdaten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Phi Assoziationsstärke/ Cramérs V Assoziationsstärke stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, erweiterte Häufigkeiten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, Residuen (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Assoziationsplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Mosaikplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 341 − Konfidenzintervalle (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Dispersionsmaße stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu 5.1.3 Die Erläuterungen der Daten respektive der Auswertungsergebnisse sind hilfreich. − R-Code zur Tabellenerzeugung stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Rohdaten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Phi Assoziationsstärke/ Cramérs V Assoziationsstärke stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, erweiterte Häufigkeiten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, Residuen (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Assoziationsplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 342 − Mosaikplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Dispersionsmaße stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu 5.1.4 Die Erläuterungen der Daten respektive der Auswertungsergebnisse erfüllen mein Informationsbedürfnis. − R-Code zur Tabellenerzeugung stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Rohdaten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Phi Assoziationsstärke/ Cramérs V Assoziationsstärke stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, erweiterte Häufigkeiten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, Residuen (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 343 − Assoziationsplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Mosaikplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Dispersionsmaße stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu 5.2 Für den Fall der Auswertung und des Vergleichs mehrerer KoGra-Abfragen: 5.2.1 Ich verstehe die Daten respektive Auswertungsergebnisse. − R-Code zur Tabellenerzeugung stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Rohdaten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Diagramm, gestapelt) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Diagramm, gruppiert) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 344 − Phi Assoziationsstärke/ Cramérs V Assoziationsstärke stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, erweiterte Häufigkeiten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, Residuen (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Assoziationsplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Mosaikplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Dispersionsmaße (DP norm ) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu 5.2.2 Die Daten respektive Auswertungsergebnisse sind für meine Arbeit hilfreich. − R-Code zur Tabellenerzeugung stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Rohdaten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Diagramm, gestapelt) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 345 − relative Werte (Diagramm, gruppiert) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Phi Assoziationsstärke/ Cramérs V Assoziationsstärke stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, erweiterte Häufigkeiten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, Residuen (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Assoziationsplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Mosaikplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Dispersionsmaße (DP norm ) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu 5.2.3 Die Erläuterungen der Daten respektive der Auswertungsergebnisse sind hilfreich. − R-Code zur Tabellenerzeugung stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Rohdaten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 346 − relative Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Diagramm, gestapelt) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Diagramm, gruppiert) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Phi Assoziationsstärke/ Cramérs V Assoziationsstärke stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, erweiterte Häufigkeiten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, Residuen (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Assoziationsplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Mosaikplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Dispersionsmaße (DP norm ) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu 5.2.4 Die Erläuterungen der Daten respektive der Auswertungsergebnisse erfüllen mein Informationsbedürfnis. − R-Code zur Tabellenerzeugung stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Rohdaten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 347 − normierte Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − normierte Werte (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Diagramm, gestapelt) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − relative Werte (Diagramm, gruppiert) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Phi Assoziationsstärke/ Cramérs V Assoziationsstärke stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, erweiterte Häufigkeiten (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Chi-Quadrat-Test, Residuen (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Assoziationsplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Mosaikplot (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Tabelle) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Konfidenzintervalle (Diagramm) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu − Dispersionsmaße (DP norm ) stimme gar nicht zu □ □ □ □ □ □ □ stimme vollkommen zu Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 348 6. Welche zusätzlichen statistischen Analysen und Darstellungsformen würden Sie sich für Ihre Arbeit wünschen? 6.1 Für den Fall der Auswertung einer einzelnen KoGra-Abfrage: 6.2 Für den Fall der Auswertung und des Vergleichs mehrerer KoGra- Abfragen: 7. Wie könnten die Erläuterungen zu den statistischen Analysen und Darstellungsformen verbessert werden? 8. Bislang gibt es eine Schnittstelle nur zwischen KoGra und dem Modul zur statistischen Analyse. Grundsätzlich könnte das System auch für andere Daten, die nicht aus KoGra stammen, geöffnet werden. Für Daten welcher Art, meinen Sie, ist eine solche Erweiterung sinnvoll? 9. Verrichten Sie Korpusarbeit, die nicht auf statistische Analyse hinausläuft? Wenn ja, bitte beschreiben Sie die kurz. 10. Haben Sie weitere Vorschläge zur Verbesserung des Systems? KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 349 B. Ergebnisse der Evaluation (ohne Freitextantworten) 4. Sie haben mit KoGra-R ein System zur automatischen Durchführung vorgegebener statistischer Analysen von Korpusrecherchen benutzt. Inwieweit stimmen Sie den folgenden Aussagen zu? (Skala 1-7, stimme gar nicht zu - stimme vollkommen zu) • Das System ist nützlich für mich. ○ AM = 6.0, SD = 1.53 , Median = 7.0, Modus = 7 • Ich kann meine Arbeitsziele aufgrund des Systems besser erreichen. ○ AM = 6.0, SD = 1.53 , Median = 7.0, Modus = 7 • Die Bedienung des Systems war einfach. ○ AM = 4.67, SD = 1.80, Median = 5.0, Modus = 6 • Die Benutzung des Systems war frustrierend. ○ AM = 2.5, SD = 1.26, Median = 2.5, Modi = 1, 4 • Die Benutzung des Systems war mühsam. ○ AM = 2.67, SD = 1.11, Median = 2.5, Modus = 2, 4 • Die Benutzung des Systems war motivierend. ○ AM = 4.00, SD = 1.60, Median = 5.0, Modi = 3, 5 • Durch das System konnte ich meine Aufgaben besser eigenständig bewältigen. ○ AM = 5.5, SD = 1.90, Median = 6.5, Modus = 7 • Ich werde das System, sofern ich Zugang zu ihm habe, öfter benutzen. ○ AM = 5.84, SD = 1.86, Median = 7.0, Modus = 7 5. Es gab zwei Benutzungsszenarien: (1) Die Daten einer einzelnen KoGra- Abfrage wurden ausgewertet, (2) die Daten mehrerer KoGra-Abfragen wurden ausgewertet und im Zuge dessen verglichen. Inwieweit stimmen Sie den folgenden Aussagen zu? (Skala 1-7, stimme gar nicht zu - stimme vollkommen zu) 5.1 Für den Fall der Auswertung einer einzelnen KoGra-Abfrage: 5.1.1 Ich verstehe die Daten respektive Auswertungsergebnisse. • R-Code zur Tabellenerzeugung: ○ AM = 5.17, SD = 1.77, Median = 5.5, Modus = 7 • Rohdaten (Tabelle): ○ AM = 6.0, SD = 1.0, Median = 6.0, Modus = 6 • normierte Werte (Tabelle): ○ AM = 5.83, SD = 1.77, Median = 6.5, Modus = 7 Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 350 • normierte Werte (Diagramm): ○ AM = 5.83, SD = 1.77, Median = 6.5, Modus = 7 • relative Werte (Tabelle): ○ AM = 4.67, SD = 1.80, Median = 5.0, Modus = 6 • relative Werte (Diagramm): ○ AM = 5.17, SD = 1.57, Median = 5.5, Modi = 5, 6 • Chi-Quadrat-Test: ○ AM = 5.17, SD = 1.21, Median = 5.0, Modus = 4 • Phi Assoziationsstärke/ Cramérs V Assoziationsstärke: ○ AM = 5.0, SD = 1.63, Median = 5.5, Modus = 6 • Chi-Quadrat-Test, erwartete Häufigkeiten (Tabelle): ○ AM = 4.0, SD = 1.0, Median = 4.0, Modus = 4 • Chi-Quadrat-Test, Residuen (Tabelle): ○ AM = 3.17, SD = 1.57, Median = 3.0, Modus = 3 • Assoziationsplot (Diagramm): ○ AM = 4.0, SD = 1.67, Median = 3.0, Modus = 3 (nur 5 Antworten) • Mosaikplot (Diagramm): ○ AM = 3,67, SD = 1.49, Median = 3.5, Modus = 2 • Konfidenzintervalle (Tabelle): ○ AM = 5.17, SD = 1.07, Median = 5.0, Modi = 4, 5 • Konfidenzintervalle (Diagramm): ○ AM = 5.33, SD = 1.11, Median = 5.5, Modi = 4, 6 • Dispersionsmaße: ○ AM = 4.83, SD = 1.77, Median = 5.5, Modus = 6 5.1.2 Die Daten respektive Auswertungsergebnisse sind für meine Arbeit hilfreich. • R-Code zur Tabellenerzeugung: ○ AM = 4.83, SD = 2.19, Median = 5.0, Modus = 7 • Rohdaten (Tabelle): ○ AM = 6.0, SD = 1.41, Median = 6.5, Modus = 7 • normierte Werte (Tabelle): ○ AM = 5.67, SD = 1.60, Median = 6.5, Modus = 7 • normierte Werte (Diagramm): ○ AM = 5.83, SD = 1.46, Median = 6.5, Modus = 7 KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 351 • relative Werte (Tabelle): ○ AM = 5.83, SD = 1.46, Median = 6.5, Modus = 7 • relative Werte (Diagramm): ○ AM = 5.83, SD = 1.46, Median = 6.5, Modus = 7 • Chi-Quadrat-Test: ○ AM = 6.0, SD = 1.53, Median = 7.0, Modus = 7 • Phi Assoziationsstärke/ Cramérs V Assoziationsstärke: ○ AM = 6.0, SD = 1.53, Median = 7.0, Modus = 7 • Chi-Quadrat-Test, erwartete Häufigkeiten (Tabelle): ○ AM = 5.5, SD = 1.61, Median = 6.0, Modus = 7 • Chi-Quadrat-Test, Residuen (Tabelle): ○ AM = 5.5, SD = 1.61, Median = 6.0, Modus = 7 • Assoziationsplot (Diagramm): ○ AM = 5.67, SD = 1.49, Median = 6.0, Modus = 7 • Mosaikplot (Diagramm): ○ AM = 4.33, SD = 1.60, Median = 3.5, Modus = 3 • Konfidenzintervalle (Tabelle): ○ AM = 6.0, SD = 1.41, Median = 6.5, Modus = 7 • Konfidenzintervalle (Diagramm): ○ AM = 6.17, SD = 1.46, Median = 7.0, Modus = 7 • Dispersionsmaße: ○ AM = 5.33, SD = 1.80, Median = 6.0, Modus = 7 5.1.3 Die Erläuterungen der Daten respektive der Auswertungsergebnisse sind hilfreich. • R-Code zur Tabellenerzeugung: ○ AM = 5.67, SD = 1.25, Median = 6.0, Modi = 4, 6, 7 • Rohdaten (Tabelle): ○ AM = 6.17, SD = 1.07, Median = 6.5, Modus = 7 • normierte Werte (Tabelle): ○ AM = 6.33, SD = 1.11, Median = 7.0, Modus = 7 • normierte Werte (Diagramm): ○ AM = 6.33, SD = 1.11, Median = 7.0, Modus = 7 • relative Werte (Tabelle): ○ AM = 5.67, SD = 1.60, Median = 6.5, Modus = 7 Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 352 • relative Werte (Diagramm): ○ AM = 6.0, SD = 1.15, Median = 6.5, Modus = 7 • Chi-Quadrat-Test: ○ AM = 5.20, SD = 1.47, Median = 6.0, Modus = 6 (nur 5 Antworten) • Phi Assoziationsstärke/ Cramérs V Assoziationsstärke: ○ AM = 5.83, SD = 1.46, Median = 6.5, Modus = 7 • Chi-Quadrat-Test, erwartete Häufigkeiten (Tabelle): ○ AM = 4.83, SD = 1.95, Median = 5.0, Modus = 7 • Chi-Quadrat-Test, Residuen (Tabelle): ○ AM = 4.83, SD = 1.95, Median = 5.0, Modus = 7 • Assoziationsplot (Diagramm): ○ AM = 5.83, SD = 0.90, Median = 6.0, Modus = 7 • Mosaikplot (Diagramm): ○ AM = 5.33, SD = 1.37, Median = 6.0, Modus = 7 • Konfidenzintervalle (Tabelle): ○ AM = 5.67, SD = 1.11, Median = 5.5, Modi = 5, 7 • Konfidenzintervalle (Diagramm): ○ AM = 4.83, SD = 1.57, Median = 5.0, Modus = 5 • Dispersionsmaße: ○ AM = 5.83, SD = 1.34, Median = 6.0, Modus = 7 5.1.4 Die Erläuterungen der Daten respektive der Auswertungsergebnisse erfüllen mein Informationsbedürfnis. • R-Code zur Tabellenerzeugung: ○ AM = 5.5, SD = 1.61, Median = 6.0, Modus = 7 • Rohdaten (Tabelle): ○ AM = 6.17, SD = 1.21, Median = 7.0, Modus = 7 • normierte Werte (Tabelle): ○ AM = 6.17, SD = 1.21, Median = 7.0, Modus = 7 • normierte Werte (Diagramm): ○ AM = 6.0, SD = 1.54, Median = 6.5, Modus = 7 • relative Werte (Tabelle): ○ AM = 6.0, SD = 1.54, Median = 6.5, Modus = 7 • relative Werte (Diagramm): ○ AM = 6.0, SD = 1.54, Median = 6.5, Modus = 7 KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 353 • Chi-Quadrat-Test: ○ AM = 5.17, SD = 1.07, Median = 5.0, Modi = 4, 5 • Phi Assoziationsstärke/ Cramérs V Assoziationsstärke: ○ AM = 4.83 , SD = 1.21, Median = 5.0, Modus = 5 • Chi-Quadrat-Test, erwartete Häufigkeiten (Tabelle): ○ AM = 4.17, SD = 1.07, Median = 4.5, Modus = 5 • Chi-Quadrat-Test, Residuen (Tabelle): ○ AM = 4.0, SD = 1.10, Median = 4.0, Modi = 4, 5 (nur 5 Antworten) • Assoziationsplot (Diagramm): ○ AM = 4,83, SD = 1.07, Median = 5.0, Modi = 5, 6 • Mosaikplot (Diagramm): ○ AM = 4.67, SD = 1.11, Median = 4.5, Modi = 4, 6 • Konfidenzintervalle (Tabelle): ○ AM = 5.0, SD = 1.29, Median = 5.0, Modus = 5 • Konfidenzintervalle (Diagramm): ○ AM = 4.17, SD = 1.34, Median = 4.5, Modus = 5 • Dispersionsmaße: ○ AM = 5.17, SD = 1.46, Median = 5.0, Modi = 5, 7 5.2 Für den Fall der Auswertung und des Vergleichs mehrerer KoGra-Abfragen: 5.2.1 Ich verstehe die Daten respektive Auswertungsergebnisse. • R-Code zur Tabellenerzeugung: ○ AM = 5.33, SD = 1.89, Median = 6.0, Modus = 7 • Rohdaten (Tabelle): ○ AM = 6.17, SD = 1.07, Median = 6.5, Modus = 7 • normierte Werte (Tabelle): ○ AM = 6.0, SD = 1.41, Median = 6.5, Modus = 7 • normierte Werte (Diagramm): ○ AM = 6.0, SD = 1.41, Median = 6.5, Modus = 7 • relative Werte (Tabelle): ○ AM = 6.60, SD = 0.49, Median = 7.0, Modus = 7 (nur 5 Antworten) • relative Werte (Diagramm, gestapelt): ○ AM = 5.83, SD = 1.46, Median = 6.5, Modus = 7 Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 354 • relative Werte (Diagramm, gruppiert): ○ AM = 5.5 , SD = 1.61, Median = 6.0, Modus = 7 • Chi-Quadrat-Test: ○ AM = 5.0 , SD = 1.41, Median = 5.0, Modus = 3, 4, 5, 6, 7 (nur 5 Antworten) • Phi Assoziationsstärke/ Cramérs V Assoziationsstärke: ○ AM = 4.33, SD = 1.60, Median = 4.5, Modus = 5 • Chi-Quadrat-Test, erwartete Häufigkeiten (Tabelle): ○ AM = 4.5 , SD = 1.38, Median = 4.5, Modi = 3, 5 • Chi-Quadrat-Test, Residuen (Tabelle): ○ AM = 4.5 , SD = 1.38, Median = 4.5, Modi = 3, 5 • Assoziationsplot (Diagramm): ○ AM = 5.0, SD = 1.30, Median = 5.0, Modus = 5 • Mosaikplot (Diagramm): ○ AM = 4.5, SD = 1.61, Median = 4.0, Modus = 3 • Konfidenzintervalle (Tabelle): ○ AM = 5.17, SD = 1.21, Median = 5.0, Modus = 5 • Konfidenzintervalle (Diagramm): ○ AM = 4.83, SD = 0.90, Median = 5.0, Modus = 5 • Dispersionsmaße: ○ AM = 4.83, SD = 1.67, Median = 4.5, Modi = 3, 7 5.2.2 Die Daten respektive Auswertungsergebnisse sind für meine Arbeit hilfreich. • R-Code zur Tabellenerzeugung: ○ AM = 5.60, SD = 1.74, Median = 7.0, Modus = 7 (nur 5 Antworten) • Rohdaten (Tabelle): ○ AM = 6.40, SD = 0.80, Median = 7.0, Modus = 7 (nur 5 Antworten) • normierte Werte (Tabelle): ○ AM = 6.20, SD = 0.98, Median = 7.0, Modus = 7 (nur 5 Antworten) • normierte Werte (Diagramm): ○ AM = 6.40, SD = 0.80, Median = 7.0, Modus = 7 (nur 5 Antworten) • relative Werte (Tabelle): ○ AM = 6.0, SD = 1.26, Median = 7.0, Modus = 7 (nur 5 Antworten) • relative Werte (Diagramm, gestapelt): ○ AM = 6.02, SD = 1.17, Median = 7.0, Modus = 7 (nur 5 Antworten) KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 355 • relative Werte (Diagramm, gruppiert): ○ AM = 5.60, SD = 1.74, Median = 7.0, Modus = 7 (nur 5 Antworten) • Chi-Quadrat-Test: ○ AM = 6.40, SD = 1.2, Median = 7.0, Modus = 7 (nur 5 Antworten) • Phi Assoziationsstärke/ Cramérs V Assoziationsstärke: ○ AM = 6.40, SD = 1.2, Median = 7.0, Modus = 7 (nur 5 Antworten) • Chi-Quadrat-Test, erwartete Häufigkeiten (Tabelle): ○ AM = 5.60, SD = 1.74, Median = 7.0, Modus = 7 (nur 5 Antworten) • Chi-Quadrat-Test, Residuen (Tabelle): ○ AM = 5.60, SD = 1.74, Median = 7.0, Modus = 7 (nur 5 Antworten) • Assoziationsplot (Diagramm): ○ AM = 6.40, SD = 1.2, Median = 7.0, Modus = 7 (nur 5 Antworten) • Mosaikplot (Diagramm): ○ AM = 5.80, SD = 1.60, Median = 7.0, Modus = 7 (nur 5 Antworten) • Konfidenzintervalle (Tabelle): ○ AM = 6.20, SD = 0.98, Median = 7.0, Modus = 7 (nur 5 Antworten) • Konfidenzintervalle (Diagramm): ○ AM = 6.20, SD = 0.98, Median = 7.0, Modus = 7 (nur 5 Antworten) • Dispersionsmaße: ○ AM = 5.60, SD = 1.74, Median = 7.0, Modus = 7 (nur 5 Antworten) 5.2.3 Die Erläuterungen der Daten respektive der Auswertungsergebnisse sind hilfreich. • R-Code zur Tabellenerzeugung: ○ AM = 5.80, SD = 1.47, Median = 7.0, Modus = 7 (nur 5 Antworten) • Rohdaten (Tabelle): ○ AM = 6.20, SD = 1.17, Median = 7.0, Modus = 7 (nur 5 Antworten) • normierte Werte (Tabelle): ○ AM = 5.80, SD = 1.47, Median = 7.0, Modus = 7 (nur 5 Antworten) • normierte Werte (Diagramm): ○ AM = 5.80, SD = 1.47, Median = 7.0, Modus = 7 (nur 5 Antworten) • relative Werte (Tabelle): ○ AM = 5.60, SD = 1.74, Median = 7.0, Modus = 7 (nur 5 Antworten) • relative Werte (Diagramm, gestapelt): ○ AM = 6.20, SD = 1.17, Median = 7.0, Modus = 7 (nur 5 Antworten) Sandra Hansen - Morath / Hans - Christian Schmitz / Roman Schneider / Sascha Wolfer 356 • relative Werte (Diagramm, gruppiert): ○ AM = 6.0, SD = 1.55, Median = 7.0, Modus = 7 (nur 5 Antworten) • Chi-Quadrat-Test: ○ AM = 5.60, SD = 1.50, Median = 6.0, Modus = 7 (nur 5 Antworten) • Phi Assoziationsstärke/ Cramérs V Assoziationsstärke: ○ AM = 5.20, SD = 1.60, Median = 5.0, Modus = 7 (nur 5 Antworten) • Chi-Quadrat-Test, erwartete Häufigkeiten (Tabelle): ○ AM = 5.0, SD = 1.67, Median = 4.0, Modi = 4, 7 (nur 5 Antworten) • Chi-Quadrat-Test, Residuen (Tabelle): ○ AM = 5.0, SD = 1.67, Median = 4.0, Modi = 4, 7 (nur 5 Antworten) • Assoziationsplot (Diagramm): ○ AM = 5.40, SD = 1.2, Median = 6.0, Modi = 4, 6 (nur 5 Antworten) • Mosaikplot (Diagramm): ○ AM = 4.80, SD = 1.47, Median = 4.0, Modus = 4 (nur 5 Antworten) • Konfidenzintervalle (Tabelle): ○ AM = 5.40, SD = 1.36, Median = 5.0, Modi = 4, 7 (nur 5 Antworten) • Konfidenzintervalle (Diagramm): ○ AM = 4.40, SD = 1.62, Median = 4.0, Modus = 4 (nur 5 Antworten) • Dispersionsmaße: ○ AM = 6.0, SD = 1.55, Median = 7.0, Modus = 7 (nur 5 Antworten) 5.2.4 Die Erläuterungen der Daten respektive der Auswertungsergebnisse erfüllen mein Informationsbedürfnis. • R-Code zur Tabellenerzeugung: ○ AM = 5.60, SD = 1.74, Median = 7.0, Modus = 7 (nur 5 Antworten) • Rohdaten (Tabelle): ○ AM = 5.80, SD = 1.47, Median = 7.0, Modus = 7 (nur 5 Antworten) • normierte Werte (Tabelle): ○ AM = 5.80, SD = 1.47, Median = 7.0, Modus = 7 (nur 5 Antworten) • normierte Werte (Diagramm): ○ AM = 6.20, SD = 1.17, Median = 7.0, Modus = 7 (nur 5 Antworten) • relative Werte (Tabelle): ○ AM = 6.20, SD = 1.17, Median = 7.0, Modus = 7 (nur 5 Antworten) • relative Werte (Diagramm, gestapelt): ○ AM = 6.20, SD = 1.17, Median = 7.0, Modus = 7 (nur 5 Antworten) KoGra - R: Standardisierte statistische Auswertung von Korpusrecherchen 357 • relative Werte (Diagramm, gruppiert): ○ AM = 6.20, SD = 1.17, Median = 7.0, Modus = 7 (nur 5 Antworten) • Chi-Quadrat-Test: ○ AM = 5.0, SD = 1.10, Median = 5.0, Modi = 4, 5 (nur 5 Antworten) • Phi Assoziationsstärke/ Cramérs V Assoziationsstärke: ○ AM = 4.78, SD = 1.33, Median = 5.0, Modus = 5 (nur 5 Antworten) • Chi-Quadrat-Test, erwartete Häufigkeiten (Tabelle): ○ AM = 5.0, SD = 1.10, Median = 5.0, Modi = 4, 5 (nur 5 Antworten) • Chi-Quadrat-Test, Residuen (Tabelle): ○ AM = 5.0, SD = 1.10, Median = 5.0, Modi = 4, 5 (nur 5 Antworten) • Assoziationsplot (Diagramm): ○ AM = 5.0 , SD = 0.63, Median = 5.0, Modus = 5 (nur 5 Antworten) • Mosaikplot (Diagramm): ○ AM = 4.80, SD = 0.75, Median = 5.0, Modi = 4, 5 (nur 5 Antworten) • Konfidenzintervalle (Tabelle): ○ AM = 5.20, SD = 0.75, Median = 5.0, Modi = 5, 6 (nur 5 Antworten) • Konfidenzintervalle (Diagramm): ○ AM = 4.40, SD = 1.36, Median = 5.0, Modus = 5 (nur 5 Antworten) • Dispersionsmaße: ○ AM = 5.20, SD = 1.60, Median = 5.0, Modus = 7 (nur 5 Antworten) Studien zur Deutschen Sprache Forschungen des Instituts für Deutsche Sprache herausgegeben von Arnulf Deppermann, Stefan Engelberg und Angelika Wöllstein Aktuelle Bände: Frühere Bände finden Sie unter: http: / / www.narr-shop.de/ reihen/ s/ studien-zurdeutschen-sprache.html 49 Wolf-Andreas Liebert / Horst Schwinn (Hrsg.) Mit Bezug auf Sprache Festschrift für Rainer Wimmer 2009, 584 Seiten €[D] 98, - ISBN 978-3-8233-6470-2 50 Daniela Heidtmann Multimodalität der Kooperation im Lehr-Lern-Diskurs Wie Ideen für Filme entstehen 2009, 340 Seiten €[D] 78, - ISBN 978-3-8233-6471-9 51 Ibrahim Cindark Migration, Sprache und Rassismus Der kommunikative Sozialstil der Mannheimer „Unmündigen“ als Fallstudie für die „emanzipatorischen Migranten“ 2010, 283 Seiten €[D] 72, - ISBN 978-3-8233-6518-1 52 Arnulf Deppermann / Ulrich Reitemeier / Reinhold Schmitt / Thomas Spranz-Fogasy Verstehen in professionellen Handlungsfeldern 2010, 392 Seiten €[D] 88, - ISBN 978-3-8233-6519-8 53 Gisella Ferraresi Konnektoren im Deutschen und im Sprachvergleich Beschreibung und grammatische Analyse 2011, 350 Seiten €[D] 78, - ISBN 978-3-8233-6558-7 54 Anna Volodina Konditionalität und Kausalität im Deutschen Eine korpuslinguistische Studie zum Einfluss von Syntax und Prosodie auf die Interpretation komplexer Äußerungen 2011, 288 Seiten €[D] 78, - ISBN 978-3-8233-6559-4 55 Annette Klosa (Hrsg.) elexiko Erfahrungsberichte aus der lexikografischen Praxis eines Internetwörterbuchs 2011, 211 Seiten €[D] 72, - ISBN 978-3-8233-6599-0 56 Antje Töpel Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen Anspruch und Wirklichkeit 2011, 432 Seiten €[D] 98, - ISBN 978-3-8233-6631-7 57 Ludwig M. Eichinger / Albrecht Plewnia / Melanie Steinle (Hrsg.) Sprache und Integration Über Mehrsprachigkeit und Migration 2011, 253 Seiten €[D] 72, - ISBN 978-3-8233-6632-4 58 Inken Keim / Necmiye Ceylan / Sibel Ocak / Emran Sirim Heirat und Migration aus der Türkei Biografische Erzählungen junger Frauen 2012, 343 Seiten €[D] 49, - ISBN 978-3-8233-6633-1 59 Magdalena Witwicka-Iwanowska Artikelgebrauch im Deutschen Eine Analyse aus der Perspektive des Polnischen 2012, 230 Seiten 72, - ISBN 978-3-8233-6703-1 60 Kathrin Steyer (Hrsg.) Sprichwörter multilingual Theoretische, empirische und angewandte Aspekte der modernen Parömiologie 2012, 470 Seiten €[D] 98, - ISBN 978-3-8233-6704-8 61 Ludwig M. Eichinger / Albrecht Plewnia / Christiane Schoel / Dagmar Stahlberg (Hrsg.) Sprache und Einstellungen Spracheinstellungen aus sprachwissenschaftlicher und sozialpsychologischer Perspektive. Mit einer Sprachstandserhebung zum Deutschen von Gerhard Stickel 2012, 370 Seiten €[D] 88, - ISBN 978-3-8233-6705-5 62 Heiko Hausendorf / Lorenza Mondada / Reinhold Schmitt (Hrsg.) Raum als interaktive Ressource 2012, 400 Seiten €[D] 88, - ISBN 978-3-8233-6706-2 63 Annette Klosa (Hrsg.) Wortbildung im elektronischen Wörterbuch 2013, 279 Seiten €[D] 78, - ISBN 978-3-8233-6737-6 64 Reinhold Schmitt Körperlich-räumliche Aspekte der Interaktion 2013, II, 334 Seiten €[D] 88, - ISBN 978-3-8233-6738-3 65 Kathrin Steyer Usuelle Wortverbindungen Zentrale Muster des Sprachgebrauchs aus korpusanalytischer Sicht 2014, II, 390 Seiten €[D] 88, - ISBN 978-3-8233-6806-9 66 Iva Kratochvílová / Norbert Richard Wolf (Hrsg.) Grundlagen einer sprachwissenschaftlichen Quellenkunde 2013, 384 Seiten €[D] 88, - ISBN 978-3-8233-6836-6 67 Katrin Hein Phrasenkomposita im Deutschen Empirische Untersuchung und konstruktionsgrammatische Modellierung 2015, 510 Seiten €[D] 98, - ISBN 978-3-8233-6921-9 68 Stefan Engelberg / Meike Meliss / Kristel Proost / Edeltraud Winkler (Hrsg.) Argumentstruktur zwischen Valenz und Konstruktion 2015, 497 Seiten €[D] 128, - ISBN 978-3-8233-6960-8 69 Nofiza Vohidova Lexikalisch-semantische Graduonymie Eine empirisch basierte Arbeit zur lexikalischen Semantik 2016, ca. 340 Seiten €[D] ca. 88, - ISBN 978-3-8233-6959-2 70 Marek Konopka / Eric Fuß Genitiv im Korpus Untersuchungen zur starken Flexion des Nomens im Deutschen 2016, 283 Seiten €[D] 108, - ISBN 978-3-8233-8024-5 71 Eva-Maria Putzier Wissen - Sprache - Raum Zur Multimodalität der Interaktion im Chemieunterricht 2016, 282 Seiten €[D] 108, - ISBN 978-3-8233-8032-0 72 Heiko Hausendorf / Reinhold Schmitt / Wolfgang Kesselheim Interaktionsarchitektur, Sozialtopographie und Interaktionsraum 2016, 452 Seiten €[D] 138, - ISBN 978-3-8233-8070-2 73 Irmtraud Behr / Anja Kern / Albrecht Plewnia / Jürgen Ritte (Hrsg.) Wirtschaft erzählen Narrative Formatierungen von Ökonomie 2017, 278 Seiten €[D] 108, - ISBN 978-3-8233-8072-6 74 Arnulf Deppermann / Nadine Proske / Arne Zeschel (Hrsg.) Verben im interaktiven Kontext Bewegungsverben und mentale Verben im gesprochenen Deutsch 2017, 494 Seiten €[D] 128, - ISBN 978-3-8233-8105-1 75 Nadine Schimmel-Fijalkowytsch Diskurse zur Normierung und Reform der deutschen Rechtschreibung Eine Analyse von Diskursen zur Rechtschreibreform unter soziolinguistischer und textlinguistischer Perspektive 2017, 404 Seiten €[D] 128, - ISBN 978-3-8233-8106-8 76 Eric Fuß / Angelika Wöllstein (Hrsg.) Grammatiktheorie und Grammatikographie 2018, 265 Seiten €[D] 108, - ISBN 978-3-8233-8107-5 77 Jarochna D ą browska-Burkhardt / Ludwig M. Eichinger / Uta Itakura (Hrsg.) Deutsch: lokal - regional - global 2017, 474 Seiten €[D] 138, - ISBN 978-3-8233-8132-7 78 Karoline Kreß Das Verb machen im gesprochenen Deutsch Bedeutungskonstitution und interaktionale Funktionen 2017, 396 Seiten €[D] 128, - ISBN 978-3-8233-8153-2 79 Kathrin Steyer (Hrsg.) Sprachliche Verfestigung Wortverbindungen, Muster, Phrasem- Konstruktionen. 2018, 350 Seiten €[D] 118, - ISBN 978-3-8233-8216-4 ISBN 978-3-8233-8257-7 Die Arbeiten in diesem Band zeigen anhand ausgewählter morphosyntaktischer Phänomene exemplarisch auf, wie ein korpuslinguistischer Zugang genutzt werden kann, um die Vielfalt und Variabilität des Sprachgebrauchs in einer größeren Detailschärfe zu beschreiben, als dies bisher möglich war. Ausgangspunkt ist die Überlegung, dass sprachliche Variation als integraler Bestandteil der (Standard-)Sprache anzusehen ist und somit auch deskriptiv erfasst werden muss. Dabei geht es zunächst um eine möglichst genaue Beschreibung der Verteilung und Häufigkeit verschiedener Ausprägungen ausgewählter Variablen. Eine umfassende Beschreibung eines Variationsphänomens beinhaltet zudem die Ermittlung und Gewichtung der Faktoren, die die Distribution der Varianten steuern. In diesem Zusammenhang werden Hypothesen aus der einschlägigen Forschungsliteratur unter Verwendung moderner statistischer Verfahren überprüft. Darüber hinaus enthalten die vorliegenden Studien eine explorative Komponente, die sich mit der Aufdeckung neuer Muster, Regularitäten und linguistischer Zusammenhänge befasst. Dabei werden verschiedene korpuslinguistische und statistische Ansätze und Verfahren erprobt und evaluiert.