Spanisch: Phonetik und Phonologie
Eine Einführung
0203
2025
978-3-3811-0012-5
978-3-3811-0011-8
Gunter Narr Verlag
Christoph Gabrielhttps://orcid.org/0000-0002-9967-1159
Trudel Meisenburghttps://orcid.org/0000-0003-0582-6605
Maria Selig
10.24053/9783381100125
Diese Einführung bietet einen verständlichen Überblick über die Phonetik und Phonologie des Spanischen. Ein besonderer Fokus liegt auf prosodischen Phänomenen wie Silbe, Akzent, Rhythmus und Intonation sowie auf der Variation zwischen europäischen und amerikanischen Varietäten des Spanischen. Eine Anleitung zum Umgang mit der Sprachanalysesoftware Praat und Ausblicke auf neuere theoretische Ansätze wie Optimalitätstheorie und Autosegmentale Phonologie ergänzen den Überblick. Die Neuauflage wurde um ein Kapitel zu Sprachkontaktsituationen und zum Fremdspracherwerb erweitert.
<?page no="0"?> ISBN 978-3-381-10011-8 Diese Einführung bietet einen verständlichen Überblick über die Phonetik und Phonologie des Spanischen. Ein besonderer Fokus liegt auf prosodischen Phänomenen wie Silbe, Akzent, Rhythmus und Intonation sowie auf der Variation zwischen europäischen und amerikanischen Varietäten des Spanischen. Eine Anleitung zum Umgang mit der Sprachanalysesoftware Praat und Ausblicke auf neuere theoretische Ansätze wie Optimalitätstheorie und Autosegmentale Phonologie ergänzen den Überblick. Die Neuauflage wurde um ein Kapitel zu Sprachkontaktsituationen und zum Fremdspracherwerb erweitert. Gabriel / Meisenburg / Selig Spanisch: Phonetik und Phonologie Spanisch: Phonetik und Phonologie Eine Einführung 2. Auflage Christoph Gabriel / Trudel Meisenburg / Maria Selig <?page no="1"?> Spanisch: Phonetik und Phonologie <?page no="2"?> narr studienbücher <?page no="3"?> Christoph Gabriel / Trudel Meisenburg / Maria Selig Spanisch: Phonetik und Phonologie Eine Einführung 2., neu bearbeitete und erweiterte Auflage <?page no="4"?> DOI: https: / / doi.org/ 10.24053/ 9783381100125 2., neu bearbeitete und erweiterte Auflage 2025 1. Auflage 2013 © 2025 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Alle Informationen in diesem Buch wurden mit großer Sorgfalt erstellt. Fehler können dennoch nicht völlig ausgeschlossen werden. Weder Verlag noch Autor: innen oder Herausgeber: innen übernehmen deshalb eine Gewährleistung für die Korrektheit des Inhaltes und haften nicht für fehlerhafte Angaben und deren Folgen. Diese Publikation enthält gegebenenfalls Links zu externen Inhalten Dritter, auf die weder Verlag noch Autor: innen oder Herausgeber: innen Einfluss haben. Für die Inhalte der verlinkten Seiten sind stets die jeweiligen Anbieter oder Betreibenden der Seiten verantwortlich. Internet: www.narr.de eMail: info@narr.de Druck: Elanders Waiblingen GmbH ISSN 0941-8105 ISBN 978-3-381-10011-8 (Print) ISBN 978-3-381-10012-5 (ePDF) ISBN 978-3-381-10013-2 (ePub) Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http: / / dnb.dnb.de abrufbar. <?page no="5"?> Christoph Gabriel ist Professor für Romanische Sprachwissenschaft an der Johan‐ nes-Gutenberg-Universität Mainz. Trudel Meisenburg ist Professorin i. R. für Romanische Sprachwissenschaft an der Universität Osnabrück. Maria Selig ist Professorin für Romanische Sprachwissenschaft an der Universität Regensburg. <?page no="7"?> 11 12 13 1 18 1.1 18 1.2 20 1.3 23 1.4 26 1.5 29 2 36 2.1 36 2.2 41 2.2.1 41 2.2.2 45 2.2.3 47 2.2.3.1 47 2.2.3.2 48 2.2.3.3 49 2.2.4 49 2.3 51 2.3.1 51 2.3.1.1 51 2.3.1.2 52 2.3.1.3 56 2.3.2 58 2.3.2.1 58 2.3.2.2 59 2.3.3 62 Inhalt Vorbemerkung zur ersten Auflage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vorbemerkung zur zweiten Auflage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Abkürzungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Forschungsgegenstand von Phonetik und Phonologie . . . . Dimensionen und Funktionen lautsprachlicher Kommunikation Gliederungsebenen der Lautsprache . . . . . . . . . . . . . . . . . . . . . . . Phonologische Theoriebildung . . . . . . . . . . . . . . . . . . . . . . . . . . . Variation, Varietäten und Aussprachenormen . . . . . . . . . . . . . . . Die Lautseite sprachlicher Kommunikation: Phonetik . . . . . . . . . . . . . . . . Der Gegenstand der Phonetik . . . . . . . . . . . . . . . . . . . . . . . . . . . . Artikulatorische Phonetik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lautproduktion: Atmung, Phonation, Artikulation . . . . . . . . . . . Artikulatoren und Artikulationsstellen . . . . . . . . . . . . . . . . . . . . . Artikulationsmodi: Vokale, Konsonanten, Approximanten . . . . Vokalische Artikulationsmodi . . . . . . . . . . . . . . . . . . . . . . . . . . . . Konsonantische Artikulationsmodi . . . . . . . . . . . . . . . . . . . . . . . . Approximanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Koartikulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Akustische Phonetik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sprachschall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Parameter der Schallanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grundschallformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Spektren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grundlagen akustischer Analysen . . . . . . . . . . . . . . . . . . . . . . . . . Zur Digitalisierung von Sprachsignalen . . . . . . . . . . . . . . . . . . . . Zur Auswertung von Spektrogrammen . . . . . . . . . . . . . . . . . . . . Akustische Analysen selbst durchführen: Eine kleine Anleitung zum Gebrauch von Praat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . <?page no="8"?> 2.4 68 2.4.1 70 2.4.2 76 2.5 83 2.5.1 83 2.5.1.1 84 2.5.1.2 92 2.5.1.3 100 2.5.1.4 103 2.5.1.5 105 2.5.2 110 2.5.3 111 2.5.3.1 112 2.5.3.2 116 3 125 3.1 125 3.1.1 126 3.1.2 138 3.1.2.1 138 3.1.2.2 140 3.1.2.3 141 3.1.2.4 143 3.1.2.5 145 3.2 149 3.3 154 3.4 158 3.5 161 4 165 4.1 167 4.1.1 168 4.1.2 171 4.2 173 4.2.1 173 4.2.2 175 4.2.3 178 4.2.4 182 4.2.4.1 183 4.2.4.2 187 4.2.4.3 190 Perzeptive Phonetik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Hörvorgang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sprach(laut)hören . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sprachlaute: Spanisch und Deutsch kontrastiv . . . . . . . . . . . . . . Konsonanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Plosive und Frikativapproximanten . . . . . . . . . . . . . . . . . . . . . . . Frikative und Affrikaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nasale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Laterale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vibranten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Approximanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vokale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Monophthonge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diphthonge und Hiate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . System- und Regelhaftigkeit der Laute: Segmentale Phonologie . . . . . . . Strukturalistische Phonologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Phoneme des Spanischen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vokalphoneme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Konsonantenphoneme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Archiphoneme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Phonologisierung und Entphonologisierung . . . . . . . . . . . . . . . . Gleitlaute als Vokalphoneme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Klassische generative Phonologie . . . . . . . . . . . . . . . . . . . . . . . . . Merkmalsgeometrie und Autosegmentale Phonologie . . . . . . . . Optimalitätstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exemplartheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prosodie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prosodische Einheiten und prosodische Hierarchie . . . . . . . . . . Prosodische Einheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prosodische Hierarchie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln . . . . . . . . . Was ist eine Silbe? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Silbenstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Silbenstrukturpräferenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Silbenstrukturen des Spanischen . . . . . . . . . . . . . . . . . . . . . . . . . . Der Onset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Coda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Nukleus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Inhalt <?page no="9"?> 4.2.5 191 4.2.6 193 4.3 195 4.3.1 195 4.3.2 196 4.3.3 197 4.3.4 199 4.3.5 201 4.3.5.1 201 4.3.5.2 203 4.3.5.3 204 4.3.5.4 209 4.3.6 212 4.3.7 213 4.3.8 216 4.4 218 4.4.1 220 4.4.2 223 4.5 233 4.5.1 234 4.5.2 240 4.5.2.1 240 4.5.2.2 243 4.5.3 245 4.5.3.1 246 4.5.3.2 249 4.5.4 255 4.5.4.1 259 4.5.4.2 261 4.5.4.3 264 4.5.5 266 4.5.5.1 269 4.5.5.2 271 4.5.5.3 273 4.5.5.4 276 Syllabierung und Resyllabierung . . . . . . . . . . . . . . . . . . . . . . . . . . Hiate und Silbenkontraktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Akzent und Akzentphonologie . . . . . . . . . . . . . . . . . . . . . . . . . . . Was heißt Akzent? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wortakzent und Satzprominenzen . . . . . . . . . . . . . . . . . . . . . . . . Wortakzent: phonologisch und phonetisch . . . . . . . . . . . . . . . . . Die Funktionen des Akzents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Wortakzent des Spanischen . . . . . . . . . . . . . . . . . . . . . . . . . . Palabras tónicas und palabras átonas . . . . . . . . . . . . . . . . . . . . . . . Das Drei-Silben-Fenster . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Wortakzent bei spanischen Nomina . . . . . . . . . . . . . . . . . . . Der Wortakzent bei spanischen Verben . . . . . . . . . . . . . . . . . . . . Die orthographische Markierung des Wortakzents . . . . . . . . . . . Metrische Phonologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nebenakzente und Akzentverschiebungen . . . . . . . . . . . . . . . . . Rhythmus: Die zeitliche Gliederung der Sprache . . . . . . . . . . . . Die klassische Rhythmustypologie: Silben- und akzentzählende Sprachen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dauerbasierte Rhythmusmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . Intonation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tonsprachen und reine Intonationssprachen . . . . . . . . . . . . . . . . Erfassen und Systematisieren: Konfigurationen und Ebenen . . Das Konfigurationsmodell von Navarro Tomás ( 4 1974) . . . . . . . Das Ebenen-Modell von Quilis (1993) . . . . . . . . . . . . . . . . . . . . . . Phonologisierung und Theoretisierung: Das Autosegmental-Metrische Modell und seine Anwendung auf das Spanische . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bausteine der Intonation im AM-Modell: Tonhöhenakzente und Grenztöne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Notationssystem Spanish ToBI (Sp_ToBI) . . . . . . . . . . . . . . . Toninventare spanischer Varietäten im AM-Modell . . . . . . . . . . Madrid (Kastilisch) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Buenos Aires (Porteño-Spanisch) . . . . . . . . . . . . . . . . . . . . . . . . . Mexiko-Stadt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Schnittstellenphänomene: Prosodische Phrasierung, Informationsstruktur und Diskurs . . . . . . . . . . . . . . . . . . . . . . . . . Prosodische Phrasierung in neutralen Sätzen . . . . . . . . . . . . . . . Intonation und Fokus-Hintergrund-Gliederung . . . . . . . . . . . . . Fokus, Wortstellung und Intonation . . . . . . . . . . . . . . . . . . . . . . . Intonation komplexer Sätze und Diskursintonation . . . . . . . . . . Inhalt 9 <?page no="10"?> 5 281 5.1 289 5.1.1 289 5.1.2 293 5.1.3 297 5.1.4 302 5.1.5 308 5.1.6 315 5.1.7 321 5.2 329 5.2.1 331 5.2.2 337 5.2.3 340 5.3 350 5.3.1 355 5.3.2 363 369 372 405 Spanische Phonetik und Phonologie im Sprachkontakt . . . . . . . . . . . . . . . Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Spanisch und Baskisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Spanisch und Katalanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Spanisch und Galicisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das mexikanische Spanisch im Kontakt mit dem Nahuatl und dem yukatekischen Maya . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Spanisch und Quechua in den Anden . . . . . . . . . . . . . . . . . . . . . . Spanisch und Guaraní in Paraguay . . . . . . . . . . . . . . . . . . . . . . . . Spanisch im Kontakt mit Migrationssprachen: Das Beispiel Argentiniens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Spanisch als Herkunftssprache und Diasporavarietät . . . . . . . . . Das Spanische als Herkunftssprache in den USA . . . . . . . . . . . . Das Spanische als Herkunftssprache in Deutschland . . . . . . . . . Das Judenspanische in Bulgarien und in der Türkei . . . . . . . . . . Spanisch als Fremdsprache im deutschsprachigen Kontext . . . . Segmentale Aspekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prosodie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anhang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Register . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Inhalt <?page no="11"?> Vorbemerkung zur ersten Auflage Unser Lehrbuch wendet sich in erster Linie an Studierende des Spanischen und gibt ihnen ein zugängliches und zugleich anspruchsvolles Grundlagenwerk zur Lautlehre ihres Studienfachs an die Hand. Ziel ist es hierbei, bewährtes Grundlagenwissen zur Phonetik und Phonologie des Spanischen mit aktuellen Methoden phonetischer Datenanalyse und neueren Ansätzen phonologischer Theoriebildung wie der Merk‐ malsgeometrie, der Optimalitätstheorie und dem Autosegmental-Metrischen Modell der Intonationsforschung zu verknüpfen. Ein besonderer Schwerpunkt liegt dabei auf prosodischen Phänomenen wie Silbe, Akzent, Rhythmus und Intonation. Eingeführt wird zudem in den Umgang mit der Sprachanalysesoftware Praat. Aufbauend auf in der universitären Lehre erprobten Konzepten haben wir eine Darstellungsweise angestrebt, die für Studienanfänger nach dem Absolvieren eines Einführungskurses in die Romanische oder Spanische Sprachwissenschaft zugänglich ist, zugleich aber die Nutzung des Bandes für Fortgeschrittene, etwa zur Wiederholung bei der Prüfungsvorbereitung, ermöglicht. Das Spanische wird hierbei nicht als homogene Sprache aufgefasst; die Aussprache amerikanischer und europäischer Varietäten erfährt vielmehr eine gleichberechtigte Darstellung. Bei der Transkription orientieren wir uns am Verbreitungsgrad der Realisierungsvarianten und notieren entsprechend dem zahlenmä‐ ßigen Überwiegen der seseo-Varietäten bei caza ‘Jagd’, cerrar ‘schließen’ etc. durchgehend den alveolaren Frikativ / s/ , also [ ˈ kasa], [se ˈ raɾ]. Ein weiteres Anliegen besteht darin, das Spanische nicht isoliert zu betrachten. Zu diesem Zwecke stellen wir Vergleiche mit anderen romanischen und nichtromanischen Sprachen an, wobei der Kontrastierung mit dem Deutschen ein besonderes Gewicht zukommt. Internetquellen sind nicht mit dem Datum des letzten Abrufs versehen; wir haben alle Links jedoch unmittelbar vor Drucklegung auf ihre Korrektheit hin überprüft. Einführende Werke lassen sich nicht verwirklichen, ohne die Adressaten mit einzu‐ beziehen. So konnten wir auch beim Verfassen des vorliegenden Bands von kritischen und konstruktiven Beiträgen und Fragen von studentischer Seite profitieren. Dafür sind wir sehr dankbar. Unser Dank gilt auch all denjenigen, die uns bei der Durchsicht des Manuskripts, beim Korrekturlesen sowie beim Erstellen der Übungsaufgaben, des Lite‐ raturverzeichnisses und des Registers Hilfestellung geleistet haben. Zu nennen ist hier in erster Linie Carolin Buthke, der wir für ihre umfassende Unterstützung zu großem Dank verpflichtet sind. Weiterhin bedanken wir uns bei Ariadna Benet, Jonas Grünke, Kathrin Kraller, Manuela Kühnle, Henning Mittag, Nils Netz, Annika Reuwand, Julia Rieck, Rafèu Sichel-Bazin und Franziska Stuntebeck. Nicht zuletzt danken wir Kathrin Heyng für die kompetente verlagsseitige Betreuung der Veröffentlichung und dem Narr-Verlag (Tübingen) für die Aufnahme des Bandes in die Reihe narr studienbücher. Hamburg, Osnabrück und Regensburg, im April 2013 Christoph Gabriel, Trudel Meisenburg und Maria Selig <?page no="12"?> Vorbemerkung zur zweiten Auflage Seit dem Erscheinen unseres Lehrbuchs Spanisch: Phonetik und Phonologie. Eine Einführung vor mehr als zehn Jahren ist in zahlreichen Lehrveranstaltungen damit gearbeitet worden; zudem sind zwei Rezensionen erschienen (Elissa Pustka 2015, Romanische Forschungen 127: 411-413; Carolin Patzelt 2015, Zeitschrift für romanische Philologie 131: 1106-1113). Beide haben konstruktive Kritik geübt, die wir im Rahmen der Überarbeitung gerne aufgegriffen haben. Die beständige Weiterentwicklung des Forschungsgebiets hat zudem dazu geführt, dass die hier vorgelegte Neuauflage nicht nur in Bezug auf in den vergangenen zehn Jahren erschienene Literatur aktualisiert, sondern auch in inhaltlicher Hinsicht erweitert wurde. So wurde das Kapitel zum Sprachrhythmus um einen Abschnitt zum sog. Kontroll- und Kompensationsindex ergänzt (4.4.2). Neu hinzugekommen ist das fünfte Kapitel, in dem wir unterschiedliche Szenarien des Sprachkontakts behandeln und neben dem lautlichen Einfluss anderer Sprachen auf das Spanische in mehrsprachigen Gebieten (u. a. Mexiko, Andenraum, Paraguay, Katalonien, Baskenland, Galicien; vgl. 5.1) auch das Spanische als Herkunfts‐ sprache und Diasporavarietät (5.2) und als Fremdsprache (5.3) in den Blick nehmen. Für inhaltliche Anmerkungen und Hinweise auf Errata, die wir gerne korrigiert haben, danken wir Jonas Grünke (Mainz). Bei Bistra Andreeva (Saarbrücken/ Sofia) und Svenja Lippmann (Mainz) bedanken wir uns für ihre Mithilfe bei Recherchear‐ beiten. Für die umsichtige Hilfe bei der Aktualisierung der Literaturliste und bei den Schlusskorrekturen sind wir Birgitta Pees (Mainz) zu großem Dank verpflichtet. Schließlich bedanken wir uns herzlich bei Kathrin Heyng für die gewohnt kompetente verlagsseitige Betreuung des Projekts. Wie bei der Erstauflage wurden alle Links vor der Drucklegung auf ihre Korrektheit überprüft; sie sind deshalb nicht mit dem Datum des letzten Abrufs versehen. Mainz, Berlin/ Osnabrück und Regensburg, im Juni 2024 Christoph Gabriel, Trudel Meisenburg und Maria Selig <?page no="13"?> Abkürzungen - Intonationsphonologie: Kennzeichen für intermediäre Grenztöne % Intonationsphonologie: Kennzeichen für Grenztöne * 1. Ungrammatische Form; 2. Historische Sprachwissenschaft: rekonstruierte Form; 3. Intonationsphonologie: Kennzeichen für Akzenttöne (z. B. H* = hoher Akzentton, L* = tiefer Akzentton) # schwache Wortgrenze ## starke Wortgrenze + Morphemgrenze ] μ Morphemgrenze am Ende des Morphems ] σ Silbengrenze am Ende der Silbe . Silbengrenze ˈ Hauptakzent (zugleich Silbengrenze) ˌ Nebenakzent (zugleich Silbengrenze) ᴗ 1. leichte Silbe (ᴗ); 2. kurzer Vokal (z. B. ĕ) - 1. schwere Silbe (-); 2. langer Vokal (z. B. ē) ΔV Delta-V (Standardabweichung der Dauern vokalischer Intervalle) ΔC Delta-C (Standardabweichung der Dauern konsonantischer Intervalle) μ 1. Morphem; 2. Mittelwert μ [ Morphemgrenze am Anfang des Morphems Σ Summe σ Silbe σ [ Silbengrenze am Anfang der Silbe Φ phonologische Phrase ω phonologisches Wort ! downstep ¡ upstep > “wird zu” < 1. “entstanden aus”; 2. Intonationsphonologie: Tonhöhengipfel außerhalb des Rahmens der metrisch starken Silbe <?page no="14"?> / …/ phonologische Umschrift […] phonetische Umschrift <…> graphische Notation Abb. Abbildung Abs./ A B S Absolutiv Adj. Adjektiv Adv. Adverb afr. Altfranzösisch agr. Altgriechisch Akk./ A K K Akkusativ AM-Modell Autosegmental-Metrisches Modell andal. andalusisches Spanisch bask. Baskisch B E N E F Benefaktiv bg. Bulgarisch BI engl. break index (Grenzmarkierung der ToBI-Notation) BLP engl. Bilingual language profile (Birdsong et al. 2012, vgl. Literaturverzeichnis) C 1. Konsonant; 2. Silbenphonologie: Coda; 3. Prosodische Phonologie: Klitische Gruppe; 4. Optimalitätstheorie: Constraint CCI engl. Control and compensation index (Kontroll- und Kompensationsindex) Cl Klitikon CLP fr. Cercle linguistique de Prague CR engl. continuation rise CRS engl. continuous ranking scale CV Abfolge Konsonant Vokal d sp. débil (schwache/ leichte/ unbetonte Silbe) dB Dezibel DCT engl. discourse completion task dt. Deutsch engl. Englisch Erg./ E R G Ergativ europ. europäisch 14 Abkürzungen <?page no="15"?> F Fokus (informationsstrukturelles Merkmal) f sp. fuerte (starke/ schwere/ betonte Silbe) f./ F Femininum (Genus) F 0 Grundfrequenz F 1 , F 2 etc. erster Formant, zweiter Formant etc. FFT engl. Fast Fourier Transformation FHG Fokus-Hintergrund-Gliederung fMRT Funktionale Magnetresonanztomographie FPR Fokusprominenzregel fr. Französisch F U T Futur G Gleitlaut gal. Galicisch GEN Generator Gen./ G E N Genitiv gr. Griechisch gua. Guaraní H Intonationsphonologie: engl. high tone (Hochton) Hz Hertz IP 1. Intonationsphonologie: Intonationsphrase (prosodische Einheit); 2. Syntax: maximale Projektion der funktionalen Kategorie I (engl. inflection phrase) ip Intermediärphrase (prosodische Einheit) IPA engl. International Phonetic Alphabet it. Italienisch jap. Japanisch jsp. Judenspanisch kanar. kanarisches Spanisch kast. kastilisches Spanisch kat. Katalanisch KF Kontrastfokus (informationsstrukturelles Merkmal) kHz Kilohertz L 1. Liquid; 2. Intonationsphonologie: engl. low tone (Tiefton) Abkürzungen 15 <?page no="16"?> L1 Erstsprache (Muttersprache) L2 Zweitsprache (Fremdsprache) L3 Drittsprache (Fremdsprache) lat. Lateinisch LiLT engl. L2 Intonation Learning Theory (Mennen 2015, vgl. Literaturverzeichnis) M Intonationsphonologie: engl. mid tone (mittlerer Ton) m./ M Maskulinum (Genus) MDH Markedness Differential Hypothesis (Eckman 1977, vgl. Literaturverzeichnis) N 1. Nasal; 2. Nukleus n./ N Neutrum (Genus) nah. Nahuatl NGRAE sp. Nueva gramática de la lengua española (vgl. Literaturverzeichnis) Nom./ N O M Nominativ N O M I N Nominalisierungsmorphem O 1. Obstruent; 2. Onset; 3. Objekt OL Obstruent+Liquid ORTE sp. Ortografía de la lengua española (vgl. Literaturverzeichnis) OT Optimalitätstheorie P Fuß PAM engl. Perception-Assimilation Model (Best 1995, vgl. Literaturverzeichnis) PBL engl. pre-boundary lengthening PET Positron-Emissions-Tomographie Pl./ P L Plural PN Person-Numerus(-Marker) P R O G Progressiv (Verlaufsform) PVI paarweiser Variabilitätsindex Q Frage-/ Interrogativmarker R Reim REA engl. right-ear advantage RFE sp. Revista de filología española rPVI ‘roher’ paarweiser Variabilitätsindex 16 Abkürzungen <?page no="17"?> S 1. Subjekt; 2. Beginn der Stimmhaftigkeit SAMPA engl. Speech Assessment Methods Phonetic Alphabet Sg./ S G Singular SLH engl. strict layer hypothesis SLM engl. Speech Learning Model (Flege 1987, vgl. Literaturverzeichnis) sp. Spanisch SP engl. sustained pitch SPE engl. The sound pattern of English (Chomsky & Halle 1968, vgl. Literaturver‐ zeichnis) T Ton TM Tempus-Modus(-Marker) türk. Türkisch TV Themavokal ToBI engl. Tone and Break Indices UG Universalgrammatik V 1. Vokal; 2. Verb VA Anfang des Vokals VarcoC Variabilitätskoeffizient für konsonantische Intervalle VarcoV Variabilitätskoeffizient für vokalische Intervalle VE Ende des Vokals VOT engl. voice onset time (Stimmeinsatzzeit) W Wurzel Wh Fragewort (vgl. engl. where, what, why etc.) Abkürzungen 17 <?page no="18"?> 1 Einleitung 1.1 Der Forschungsgegenstand von Phonetik und Phonologie In einem Laden, den er nie zuvor betreten hat, richtet ein Kunde - nennen wir ihn Juan - folgende Frage an die Verkäuferin: ¿Tiene mandarinas? ‘Haben Sie Mandarinen? ’. Die Antwort kommt prompt: ¡Claro que sí! ‘Ja, klar’. Diese kurze verbale Interaktion ist ein alltäglicher Kommunikationsvorgang, der in ähnlicher Form immer wieder stattfinden kann: Ein Kunde hat mittels sprachlicher Zeichen einer Verkäuferin mitgeteilt, dass er eine bestimmte Obstsorte sucht (vermutlich, um sie zu kaufen); die Verkäuferin signalisiert ihm, wiederum mit sprachlichen Zeichen, dass sie ihm diese Obstsorte selbstverständlich anbieten kann. Sie hätte auch wortlos auf die Kiste mit Mandarinen deuten können, die der Kunde offensichtlich übersehen hat. Damit wäre zwar das Informationsbedürfnis des Fragenden erfüllt gewesen, doch hätte er vielleicht den Laden verlassen, ohne Mandarinen zu kaufen, und die Interaktion wäre erfolglos geblieben. Alltägliche Gesprächssituationen wie diese scheinen auf den ersten Blick kaum der Rede wert zu sein: Warum soll man auch über eine kommunikative Routine nachdenken, die doch ohne weiteres Überlegen tagtäglich funktioniert? Eine solche Sichtweise ist als Alltagsperspektive durchaus sinnvoll, denn würden wir stets darüber reflektieren, was genau wir sagen wollen und wie wir es ausdrücken, kämen wir vor lauter Nachdenken vermutlich kaum zum Sprechen. Aus wissenschaftlicher Perspek‐ tive ist der kleine Verkaufsdialog jedoch unter unterschiedlichen Aspekten interessant: Man kann ihn inhaltlich-strategisch analysieren und sich z. B. fragen, warum die sprachliche Reaktion der Verkäuferin angemessener ist als eine rein gestische, und ihn als einen bestimmten Typus sozialer Interaktion betrachten. Man kann jedoch auch speziell die von den Gesprächspartnern genutzten sprachlichen Verfahren in den Blick nehmen und diese in Bezug auf Textkohärenz, Satzbau, Wortwahl und Aussprache untersuchen. Mit den lautsprachlichen Aspekten der Kommunikation befassen sich Phonetik und Phonologie, zwei sprachwissenschaftliche Teildisziplinen, die auch mit dem Terminus Lautlehre zusammengefasst werden. Die Tonaufnahme eines solchen Gesprächs dient dann als Datengrundlage zur Untersuchung der Regeln und Gesetzmäßigkeiten, die die Lautseite sprachlicher Zeichen in der verwendeten Sprache - hier im Spanischen - bestimmen. Außerhalb des Untersuchungsbereichs der Lautlehre liegen dagegen alle Ausdrucksformen, die nicht lautsprachlich sind: So wird das uns alltäglich geläufige Nebeneinander von Sprechen und Schreiben (und Hören und Lesen) weitgehend ausgeblendet. Dies ist eine berechtigte Einschränkung, denn sofern keine Beeinträchtigung des Hörvermögens vorliegt, ist die Lautsprache unsere grundlegende Ausdrucks- und Kommunikationsform, und auch beim Erwerb der Muttersprache (L1) werden wir zuerst mit der Lautseite von Sprache konfrontiert. <?page no="19"?> Wie erklärt sich die Aufteilung der Lautlehre in die beiden Subdisziplinen Phonetik und Phonologie? Die Trennung geht zurück auf Nikolaus Sergejewitsch Trubetzkoy (Николай Сергеевич Трубецкой, wiss. Transliterierung: Nikolaj Sergeevič Trubeckoj; 1890-1938). Dieser bezog sich in seinen 1939 erschienenen Grundzügen der Pho‐ nologie (Trubetzkoy 1939/ 7 1989) auf Ferdinand de Saussure (1857-1913), der in seinem Cours de linguistique générale (Saussure 1916/ 2013) vorgeschlagen hatte, zwischen der konkreten Sprachverwendung, der sog. parole, und dem ihr zugrundeliegenden Sprachsystem, der langue, zu differenzieren. Wissenschaftlicher Untersuchungsge‐ genstand ist nach Saussure ausschließlich die langue, verstanden als die Gesamtheit der Regularitäten, die für alle Mitglieder einer Sprachgemeinschaft gelten und die deren sprachliches Wissen ausmachen. Die parole hingegen sei lediglich insofern von Interesse, als man ausgehend von konkret produzierter Sprache auf die Beschaf‐ fenheit des Systems schließen könne. Trubetzkoy übernahm diese Unterscheidung und wandte sie auf den lautsprachlichen Bereich an: Die Phonetik solle sich mit der parole beschäftigen und mittels naturwissenschaftlicher Methoden die konkreten physikalischen und physiologischen Ereignisse des lautsprachlichen Kommunikati‐ onsakts untersuchen. Gegenstand der Phonologie sei hingegen die langue, die der Vielfalt der in einer Sprachgemeinschaft realisierten Lautformen als geordnetes System von Einheiten und Regeln gegenübersteht (vgl. Trubetzkoy 1939/ 7 1989: 6). Die Trennung zweier lautbezogener linguistischer Disziplinen führte in der Folgezeit dazu, dass naturwissenschaftlich ausgerichtete Phonetiker einerseits und geistesbzw. kognitionswissenschaftlich orientierte Phonologen andererseits teilweise getrennt voneinander arbeiteten. Für Trubetzkoy waren beide Disziplinen jedoch untrennbar miteinander verbunden, da die Einheiten und Regeln, die das System konstituieren, aus konkreten Lautungen abgeleitet sind und nur unter Rückgriff auf diese erfasst und verstanden werden können. Phonetik und Phonologie untersuchen die lautlichen Aspekte sprachlicher Kom‐ munikation. Als experimentelle Wissenschaft widmet sich die Phonetik den physikalischen und physiologischen Prozessen lautsprachlicher Kommunikation. Die Phonologie arbeitet das System- und Regelhafte der Lautsprache heraus und sucht, dies modellhaft zu erfassen. Neben dem rein wissenschaftlichen Erkenntnisinteresse lassen sich für die lautsprach‐ liche Forschung anwendungsbezogene Bereiche benennen. Einer davon ist die Verbes‐ serung der Lerneraussprache im Fremdsprachenunterricht, wozu vertiefte Kennt‐ nisse der artikulatorischen und auditorisch-perzeptiven Grundlagen der Lautsprache notwendig sind (vgl. 5.3). Dies gilt auch für die Bereiche Sprecherziehung und Logopädie, die auf Optimierung der artikulatorischen Fähigkeiten bzw. auf die Be‐ handlung physisch oder psychisch bedingter Schwierigkeiten beim Sprechen abzielen (vgl. Lauer & Birner-Janusch 2007, Fiukowski 8 2010). Auch die Therapiemaßnahmen 1.1 Der Forschungsgegenstand von Phonetik und Phonologie 19 <?page no="20"?> 1 Phonetische Transkriptionen, die die Lautung möglichst exakt wiedergeben, setzt man in eckige Klammern; zur Notation mithilfe des International Phonetic Alphabet (IPA) vgl. 2.1. 2 Bei Wörtern mit unterschiedlicher Bedeutung, die sich jeweils nur in einem Lautsegment unterschei‐ den, spricht man von Minimalpaaren, vgl. hierzu genauer 1.3 und 3.1.1. bei Aphasie, d. h. beim pathologisch bedingten Verlust der Sprachfähigkeit, nutzen die Erkenntnisse über die physiologischen und neuronalen Prozesse, die sich beim Sprechen und bei der Sprachwahrnehmung vollziehen (vgl. Lutz 3 2004, Bauer & Auer 2008). Weitere Anwendungsbereiche liegen in der forensischen Phonetik, die mit vorwiegend kriminologischer Zielsetzung technische Verfahren zur Identifizierung von Stimmen entwickelt (vgl. Jessen 2012), sowie in den Bereichen Spracherkennung und Sprachsynthese (vgl. Fellbaum 2 2013). 1.2 Dimensionen und Funktionen lautsprachlicher Kommunikation Wie jede wissenschaftliche Disziplin befassen sich Phonetik und Phonologie mit ausgewählten Aspekten eines komplexen Geschehens. Die Konzentration auf die lautliche Seite sprachlicher Kommunikation zielt auf das Allgemeine; bei konkreten Kommunikationsereignissen werden daher individuelle und pragmatische Aspekte (wer spricht wann und wo mit wem weshalb worüber? ) ausgeblendet. Abstrahiert wird von der Tatsache, dass lautsprachliche Zeichen von Situation zu Situation nie in völlig identischer Form produziert werden, auch nicht, wenn es sich um ein und denselben Sprecher handelt. Dies ist für die Kommunikation auch nicht weiter schlimm, denn die Hörer blenden kleinere Abweichungen, die die Kommunikation nicht stören, automatisch aus. So ist es z. B. unerheblich, ob ein Sprecher des Spanischen den betonten Vokal im Wort pomo ‘Frucht’, der in offenen (d. h. auf einen Vokal endenden) Silben normalerweise als geschlossenes [o] 1 wie in dt. Ofen ausgesprochen wird, etwas offener realisiert und einen Laut produziert, der eher dem [ɔ] wie in dt. offen entspricht (zur Aussprache des spanischen o in unterschiedlichen lautlichen Umgebungen vgl. genauer 2.5.3.1). Die Hörer werden trotzdem pomo ‘Frucht’ verstehen, nicht zuletzt deshalb, weil es im Spanischen keine Wortpaare gibt, die sich nur durch den Kontrast zwischen offenem und geschlossenem o unterscheiden. Dies ist im Deutschen anders (vgl. unser Beispiel [ ˈ oːfən] Ofen vs. [ ˈ ɔfən] offen), ebenso im Französischen (z. B. [pom] paume ‘Handfläche’ vs. [pɔm] pomme ‘Apfel’). 2 Lautliche Variabilität kann aber auch Information vermitteln, die den Hörern ermöglicht, Sprecher in Bezug auf ihre geogra‐ phische Herkunft einzuordnen. Realisiert jemand z. B. in Wörtern wie calle ‘Straße’ und yo ‘ich’ den Laut [ʃ] (der der deutschen sch-Aussprache entspricht) oder [ʒ] wie im Anlaut von Jalousie, d. h. [ ˈ kaʃe]/ [ ˈ kaʒe] bzw. [ʃo]/ [ʒo], so können andere Spanischsprachige daraus schließen, dass sie es mit einem Sprecher aus dem Río de la Plata-Raum (Argentinien, Uruguay) zu tun haben, wo der sog. šeísmo/ žeísmo (vgl. 2.5.1.2) fester Bestandteil der regionalen Aussprache ist. 20 1 Einleitung <?page no="21"?> Aber nicht nur die regionale Zugehörigkeit von Sprechern, sondern auch die spezifischen Kontextbedingungen beeinflussen die lautsprachliche Kommunikation. Dies zeigt der Vergleich zwischen der informellen, spontanen Alltagskommunikation unter vertrauten Gesprächspartnern und dem kontrollierten, reflektierten Sprechen in öffentlichen Situationen oder auch beim Vorlesen. Wenn wir uns mit Freunden unter‐ halten, sind Schnellsprechformen, eine weniger sorgfältige Artikulation sowie häufige Pausen und Wiederholungen normal; es handelt sich dabei um typische Kennzeichen spontanen, ungeplanten Sprechens. Beim Sprechen in offiziellen Kontexten und beim Vorlesen artikulieren wir dagegen sorgfältiger und setzen gegebenenfalls Intonation (Sprachmelodie), Lautstärke und Sprechgeschwindigkeit bewusst zur stilistischen Gestaltung ein. Beim Vorlesen treten i. d. R. auch weniger sog. Sprechunflüssigkeiten (engl. speech disfluencies, sp. disfluencias del habla) auf, da wir bei dieser Form des Sprechens nicht zugleich formulieren müssen. Um derartige situationsbedingte Unter‐ schiede angemessen zu berücksichtigen, untersucht man in der neueren Forschung unterschiedliche Datentypen (spontane Interaktion im freien Gespräch, im Labor erhobene Semi-Spontandaten, Leseaussprache etc.) und arbeitet die entsprechenden lautlichen Unterschiede heraus (vgl. 4.5.4 zur Datenanalyse speziell in der Intonations‐ forschung). Der (sprachliche und außersprachliche) Kontext ist auch insofern wichtig, als er wesentlich zum Gelingen sprachlicher Kommunikation beiträgt: Wenn wir miteinan‐ der sprechen, beruht unsere Verständigung nicht ausschließlich auf der Information, die die sprachlichen Zeichen ausdrücken. Vielmehr bringen die Kommunikationspart‐ ner Vorwissen mit, auf das sie im Gespräch aufbauen können. Dies gilt auch in lautlicher Hinsicht: Sehr häufige Wörter können wir z. B. nachlässig artikulieren und etwa Auslautsilben verschleifen oder weglassen, weil ihr häufiger Gebrauch dazu beiträgt, dass sie von den Hörern auch in reduzierter Form erkannt werden. Wir wissen zudem aus Erfahrung, welche Wörter häufig mit bestimmten anderen Wörtern in der Redekette auftreten, und wir können das Wissen um diese Kombinatorik beim Sprachverstehen nutzen (vgl. 2.4.2). Weiterhin sind für das Sprachverstehen auch visuell wahrnehmbare Informationen relevant, denn außer beim Telefonieren nutzen die Gesprächspartner i. d. R. redebegleitende Gesten, Blickkontakt, mimische Veränderungen und Körperhaltung, um das auszudrücken, was sie mitteilen wollen. Diese Multimedialität der Kommunikation wird deutlich, wenn wir die Mitschrift eines spontanen Gesprächs unter Freunden lesen: Ohne Angaben zu den visuell wahrnehmbaren Ausdrucksverfahren ist dessen Inhalt oft nur schwer zu verstehen. Grundsätzlich ist nicht nur relevant, was gesagt wird, sondern auch, wie es gesagt wird. Zusätzlich zu den bereits erwähnten nichtsprachlichen Mitteln setzen wir auch sog. parasprachliche (< agr. παρά pará ‘dabei, neben’) Mittel ein, d. h. solche, die an Lautsprache gebunden sind, aber über die inhaltliche Informationsvermittlung hinausgehen: So können z. B. Stimmqualität und Lautstärke Emotionen vermitteln oder über die Einstellung des Sprechers zum besprochenen Sachverhalt Auskunft geben. 1.2 Dimensionen und Funktionen lautsprachlicher Kommunikation 21 <?page no="22"?> Die Mehrdimensionalität sprachlicher Kommunikation zeigt sich auch in den un‐ terschiedlichen Funktionen unserer Fähigkeit, Schall zu produzieren und durch unseren Artikulationsapparat zu manipulieren. Wir haben bereits auf sprecherbezo‐ gene Informationen hingewiesen, die wir z. B. durch die Verwendung regionaler Aussprachevarianten erhalten. Man spricht hier von der indexikalischen Funktion lautsprachlicher Phänomene, da sie uns zu Schlüssen auf die Herkunft, die soziale Stellung oder den Charakter des Sprechers veranlassen und unser Verhalten ihm gegenüber bestimmen können. Derartige Stereotype mögen zwar klischeehaft sein, sie sind jedoch konventionalisiert und damit Untersuchungsgegenstand einer an sozialen Normen orientierten Linguistik. Indexikalisch ist auch die Stimmqualität: Sie erlaubt uns nicht nur das Wiedererkennen individueller Sprecher, sondern lässt uns auch auf Persönlichkeitstypen wie ‘energisch’, ‘arrogant’, ‘vulgär’ etc. schließen, und zwar unabhängig davon, ob ein Sprecher bewusst zu dieser Stilisierung greift oder nicht. Lautsprachliche Phänomene wie Sprechtempo, (absolute) Tonhöhe, Lautstärke oder Sorgfalt der Artikulation haben keine bedeutungsunterscheidende Funktion: Man kann ein Wort schnell oder langsam, laut oder leise, auf hohem oder tiefem Tonniveau aussprechen - die Wortbedeutung bleibt unverändert. Wie bereits erwähnt, kommt solchen parasprachlichen Phänomenen aber eine expressive Funktion zu, denn sie können Emotionen wie Verwunderung, Zweifel, Empörung, Begeisterung etc. ausdrücken. Hierbei handelt es sich oftmals um konventionalisierte Muster, die mit typisierten Emotionen verbunden in unserem Regelwissen inventarisiert sind. Hinzu kommt die regulative Funktion von Sprechtempo, Lautstärke, Pausenset‐ zung und Intonation, die zusammen mit nichtsprachlichen Mitteln den Sprecherwechsel (engl. turn taking) in der Kommunikation regelt. Dass diese Funktion laut‐ sprachlicher Phänomene lange Zeit wenig beachtet wurde, liegt u. a. am bis weit ins 20. Jahrhundert unangefochtenen Primat des Geschriebenen in der sprachwissen‐ schaftlichen Forschung: In geschriebener Sprache stellt sich die Frage, wer als nächster das Wort ergreift, schlichtweg nicht; nur in der spontanen Interaktion muss der Sprecherwechsel im Gespräch selbst geregelt werden. Auch kann man spontane Ge‐ spräche erst analysieren, seit sie mithilfe akustischer Speicher- und Wiedergabemedien aufgezeichnet und unbeschränkt wiederholt werden können. Erst allmählich erkennt man, dass bestimmte Phänomene wie etwa das Verlangsamen oder Beschleunigen des Sprechtempos oder die Veränderungen der Lautstärke nicht nur sprecherindividuell und/ oder zufällig sind, sondern auf sozial verbindliche Normen zurückgehen und als Verfahren der Gesprächsregulierung eingesetzt werden. Die wichtigste Aufgabe unserer Fähigkeit, Schall zu manipulieren und zu verändern, ist es aber, eine Unzahl von diskreten, d. h. klar voneinander zu unterscheidenden laut‐ lichen Zeichenaußenseiten als Basis sprachlicher Kommunikation zu erzeugen. Diese bedeutungsunterscheidende oder -differenzierende Funktion ist ein zentraler Gegenstand phonologischer Forschung, v. a. in der strukturalistischen Phonologie, die die Suche nach solchen phonologisch distinktiven Merkmalen im Lautkontinuum zu ihrer Hauptaufgabe gemacht hat. 22 1 Einleitung <?page no="23"?> Unsere Fähigkeit zu artikulieren können wir dazu einsetzen, lautlich diskrete Zeichenformen zu schaffen. Die bedeutungsunterscheidende Funktion ist zentral für die sprachliche Kommunikation und steht im Mittelpunkt phonologi‐ scher Forschung; daneben können lautsprachliche Merkmale indexikalische, expressive und regulative Funktionen übernehmen. Für deren Analyse muss die kontextuelle Einbettung der Kommunikation berücksichtigt werden. 1.3 Gliederungsebenen der Lautsprache Wenn wir die Lautfolge [ʃtuːl] Stuhl äußern, wollen wir die Vorstellung eines bestimm‐ ten Sitzmöbels (mit Rückenlehne, für eine Person, meist ungepolstert) evozieren. Sagen wir dagegen [bɛt] Bett, meinen wir ein Möbelstück, das zum Schlafen gedacht ist, und produzieren wir die Lautkette [ʃtaːl] Stahl, beziehen wir uns auf etwas ganz anderes, nämlich eine metallische Legierung, die hauptsächlich aus Eisen besteht. Unsere Fähigkeit, verschiedene Sprachlaute zu äußern, nutzen wir, um unterschiedli‐ che lautliche Zeichenaußenseiten (Signifikanten) zu produzieren, die es uns erlauben, etwas so zu bezeichnen, dass es als das Gemeinte erkennbar wird. Nun umfasst der Wortschatz einer Sprachgemeinschaft etwa 300.000 verschiedene Einheiten, ein gebildeter Sprecher kennt davon etwa 75.000 und benutzt regelmäßig etwa 30.000. Wie schaffen wir es, für die Vielfalt der zu unterscheidenden Konzepte hinreichend viele diskrete Zeichenaußenseiten zu finden? Der Vergleich der drei zitierten Wörter zeigt, dass wir dabei unterschiedlich vor‐ gehen. Im Falle von [ʃtuːl] und [bɛt] handelt es sich um Signifikanten, die keine lautliche Ähnlichkeit miteinander haben (außer dass es sich jeweils um einsilbige Wörter handelt, die mit einem Konsonanten beginnen und auch auf einen enden). Man sagt, dass sie, lautlich gesehen, maximal different sind. Dies ist ein ‘sicheres’ Verfahren zur Differenzierung, da kaum eine Verwechslungsmöglichkeit zwischen den beiden Signifikanten besteht. Die Gegenüberstellung von [ʃtuːl] und [ʃtaːl] zeigt jedoch, dass der lautliche Unterschied auch auf eine präzise Stelle beschränkt sein kann. In diesem Fall sagt man, dass die jeweiligen Wörter ein Minimalpaar bilden und sich nur in einem bedeutungsdifferenzierenden Segment, hier dem Vokal u bzw. a, unterscheiden. Wie wir noch genauer erläutern werden (vgl. 3.1.1), nennt man die bedeutungsunter‐ scheidenden Lautsegmente Phoneme und setzt sie zwischen Schrägstriche: / u/ vs. / a/ . Den gleichen Kontrast finden wir auch in anderen Wortpaaren, z. B. bei [fuːʁə] Fuhre und [faːʁə] (ich) fahre. Dieses Minimalpaar können wir zum Ausgangspunkt nehmen, um an weiteren Stellen in der Lautkette nach bedeutungsdifferenzierenden Segmenten zu suchen und z. B. den Vokal in [fuːʁə] mit dem in [fiːʁə] viere zu kontrastieren, woraus sich das Phonempaar / u/ vs. / i/ ableiten lässt. In einem nächsten Schritt kann man den Anlautkonsonanten von [fiːʁə] dem von [tiːʁə] Tiere gegenüberstellen, woraus der phonemische Kontrast / f/ vs. / t/ resultiert. Das schrittweise Überprüfen lautlicher 1.3 Gliederungsebenen der Lautsprache 23 <?page no="24"?> 3 Wir vereinfachen die Verhältnisse, denn erstens können neue Signifikanten auch durch die Kom‐ bination bereits bestehender erzeugt werden (Wortbildung); zweitens zeigen Phänomene wie Homonymie oder Polysemie (vgl. Gabriel & Meisenburg 4 2021: 192f.), dass der Grundsatz der Distinktivität lautlicher Signifikanten nicht uneingeschränkt gilt: Nicht jedes Konzept muss einem eigenständigen Signifikanten zugeordnet sein, damit es identifiziert werden kann. In aller Regel hilft uns nämlich hier der Kontext: Während man bei isolierter Verwendung des spanischen Worts llama nicht wissen kann, ob es sich um die 3. Person Sg. Präsens von llamar ‘rufen’ handelt oder ob das Konzept ‘Flamme’ oder ‘Lama’ evoziert werden soll, besteht kaum Verwechslungsmöglichkeit, wenn das Wort in einen größeren Zusammenhang eingebettet ist. 4 Die Grundlagen des Verhältnisses zwischen Lautung und Schreibung im Spanischen besprechen wir in 2.5 (bezogen auf Lautsegmente) bzw. in 4.3.6 (bezogen auf die Akzentuierung). Für Genaueres zum spanischen Schriftsystem vgl. Meisenburg (1996a). Signifikanten zeigt uns, dass diese sich in eine Folge von Phonemen aufgliedern, die wiederum in vielfältigen Oppositionsbeziehungen zu anderen Phonemen stehen. Wenn wir eine solche Suche im gesamten Wortschatz durchführen, stellen wir fest, dass in einer Einzelsprache nur eine begrenzte Anzahl von lautlichen Unter‐ schieden genutzt wird. Im Falle des Deutschen führen derartige Vergleiche je nach Herangehensweise zu einer Anzahl von 36-46 Phonemen (Wiese 1996: 10f., Wiese 2011: 43-59, Pustka & Meisenburg 2016: 131); im Spanischen sind es, wie wir in 3.1.2 noch genauer sehen werden, ca. zwei Dutzend. In den einzelnen Sprachen wird also mithilfe einer begrenzten Zahl von Phonemen eine unendlich viel größere Menge von lautlichen Signifikanten erzeugt. 3 Martinet (1960/ 2008) hat hier ein sprachliches Öko‐ nomieprinzip formuliert, nämlich das der doppelten Gegliedertheit der Sprache (fr. double articulation du langage): Durch die Kombination einer begrenzten Zahl von bedeutungs- oder funktionstragenden Einheiten (Morphemen) lassen sich unendlich viele Sätze mit immer neuen Bedeutungen bilden (erste Gliederungsebene, fr. première articulation). Die lautlichen Signifikanten dieser Morpheme bilden wir wiederum durch die Kombination einer begrenzten Zahl von Phonemen (zweite Gliederungsebene, fr. deuxième articulation). Beide Ebenen folgen dem ökonomischen Prinzip, nur ein begrenztes Inventar von kleineren Einheiten zu unterscheiden, aus diesen aber durch immer neue Kombinationen eine Unmenge von größeren Einheiten zu bilden (vgl. Gabriel & Meisenburg 4 2021: 104ff.). Das Prinzip der Gegliedertheit der lautlichen Signifikanten wurde schon früh er‐ kannt, und in unserer Alphabetschrift machen wir uns diese Erkenntnis zunutze. Die Erfinder des Alphabets waren, so könnte man sagen, die ersten Phonologen, und zwar insofern als sie ein überschaubares Inventar von Buchstaben entwickelten, die einzeln oder in Kombination miteinander jeweils bestimmte lautliche Segmente symbolisieren. Auf diese Weise lässt sich ein lautlicher Signifikant als eine Folge von Buchstaben graphisch darstellen. 4 Die lautliche Analyse ist grundlegend für die alphabetische Verschriftung einer Sprache. Die in den einzelnen Sprachen gültigen Regeln der Zuordnung von Graphemen (Buchstaben) zu Lauten werden aber auch von zahlreichen anderen Faktoren mitbestimmt, sodass es hier keine eindeutigen Entsprechungen gibt. Für die Beschäftigung mit der Lautsprache ist ein kurzer Seitenblick auf die Alphabetschriften vor allem deshalb interessant, weil die jahrtausendelange Prägung 24 1 Einleitung <?page no="25"?> 5 Generell zu neueren sub- und suprasegmentalen Ansätzen vgl. Meisenburg & Selig (2004) sowie Meisenburg et al. (2022: 10-18). der europäischen Kultur durch diese Art der Verschriftung für die Suche nach den Organisationsprinzipien lautsprachlicher Signifikanten nicht folgenlos geblieben ist. Buchstaben sind diskrete graphische Einheiten, die sich beliebig aneinanderfügen lassen. Wenn man Buchstaben mit Lauten gleichsetzt, könnte man zur Auffassung gelangen, dies geschehe auch beim Sprechen, und zwar indem man diskrete Laute wie Perlen auf einer Schnur aneinanderreihe. Dies ist jedoch nicht der Fall: Zu den wichtigsten Erkenntnissen von Phonetik und Phonologie gehört, dass sich unsere Artikulation beim Sprechen kontinuierlich und in Bezug auf mehrere Dimensionen verändert. Auch akustisch gesehen ist ein Sprachsignal ein lautliches Kontinuum. Laute, im Sinne von zeitlich eindeutig abgegrenzten diskreten Segmenten, sind etwas, was wir in das artikulatorisch-akustische Kontinuum ‘hineinhören’. Phonetik und Phonologie haben auf diese Erkenntnisse reagiert und sich zunehmend auf die Untersuchung der artikulatorischen und akustischen Merkmale konzentriert, die sich im lautlichen Kontinuum parallel, aber nicht notwendigerweise zeitlich synchronisiert, verändern. Diese sog. subsegmentalen Ansätze, die sich auf unterhalb der Segment‐ ebene anzusetzende Phänomene konzentrieren, diskutieren wir in 3.3. Noch in einer zweiten Hinsicht haben Phonetik und Phonologie lange gebraucht, um sich von der Prägung durch die Alphabetschrift zu lösen. Die segmentale Gliederung in Laute bzw. Lautklassen stand so eindeutig im Vordergrund des Forschungsinteres‐ ses, dass lautliche Phänomene, die suprasegmental, also oberhalb der Segmente anzusiedeln sind, nur wenig beachtet wurden. Das betrifft die Regeln, die man bei der Verknüpfung von Artikulationsbewegungen beobachten kann, ebenso wie Akzentuierung, Rhythmus und Intonation, also Eigenschaften, die nicht an einzelne Lautsegmente gekoppelt sind, sondern sich auf größere Einheiten wie Silben, Wörter oder Phrasen erstrecken. Zu den neueren Entwicklungen lautsprachlicher Forschung gehört, dass diesen suprasegmentalen oder prosodischen Phänomenen deutlich mehr Aufmerksamkeit geschenkt wird als zuvor. 5 Auf der suprasegmentalen Gliederungsebene kommt zuerst der Silbe eine zentrale Funktion zu: Über Konzepte wie Reim, Versmaß und Silbentrennung ist sie den Sprechern meist intuitiv zugänglich; in Phonetik und Phonologie bildet sie die Basis für zahlreiche lautsprachliche Phänomene: Silben sind Träger des Wortakzents und stellen damit so etwas wie ‘Ankerpunkte’ für Tonkonturen dar; ihre Struktur hat Einfluss auf die Beschaffenheit konkret produzierter Segmente. So macht es z. B. im Deutschen einen Unterschied, ob der mit beiden Lippen produzierte stimmhafte Verschlusslaut [b] am Silbenanfang (auch: Anfangsrand oder Onset) oder im Endrand der Silbe, in der sog. Coda, steht: Während man ihn in (ich) habe stimmhaft artikuliert ([ ˈ ha.bə]), wird er regelhaft entstimmt, wenn er durch das Weglassen des Auslautvokals in die Codaposition der dann einzig verbleibenden Silbe rückt: (ich) hab [hap]. Die Silbe und ihre Struktur besprechen wir genauer in 4.2. 1.3 Gliederungsebenen der Lautsprache 25 <?page no="26"?> Die Strukturierung des lautlichen Kontinuums ist komplex und verläuft auf mehreren Gliederungsebenen. Die segmentale Ebene betrifft die Gliederung in Segmente und ihre Klassifizierung zu minimalen bedeutungsunterscheidenden Einheiten, den Phonemen (2.5, 3.1). Auf einer subsegmentalen Ebene sind die ar‐ tikulatorischen und akustischen Merkmale verortet, die zentral für das Verständnis des lautlichen Kontinuums sind, das wir beim Sprechen produzieren und beim Hören interpretieren (3.3). Silben, Wörter und Phrasen (4.1) sind Einheiten der suprasegmentalen Gliederungsebenen und Träger von prosodischen Merkmalen wie z. B. Akzent (4.3), Sprachrhythmus (4.4) und Intonation (4.5). 1.4 Phonologische Theoriebildung In den letzten Abschnitten haben wir die funktionale Analyse, d. h. die Frage nach dem wozu der lautsprachlichen Phänomene, und die strukturelle Analyse, also die Frage nach dem was und wie, als zwei wichtige Aufgaben lautsprachlicher Forschung herausgestellt. Auch haben wir bereits angedeutet, dass es durchaus verschiedene Antworten auf diese Fragestellungen geben kann, die nicht immer miteinander ver‐ einbar sind. Dieses Nebeneinander unterschiedlicher Ansätze hängt zum einen mit der Herausbildung von Phonetik und Phonologie als zwei Teildisziplinen lautsprachlicher Forschung zusammen; zum anderen bestehen zwischen einzelnen theoretischen Herangehensweisen auch Unterschiede, die auf voneinander abweichende Vorstellungen von der Organisation des menschlichen Sprachwissens zurückgehen. Die Anfänge der wissenschaftlichen Beschäftigung mit der Lautsprache im 19. Jahr‐ hundert wurden maßgeblich durch neue Untersuchungsmethoden bestimmt (vgl. Meisenburg et al. 2022: 1-10): Die Beschäftigung mit der Lautseite der Sprache begann zunächst als ‘Lautphysiologie’, die mithilfe neuer Techniken eine physiologische bzw. physikalische Beschreibung der Artikulation bzw. der Übertragung von Sprachlauten leisten wollte, teils mit praktischen Zielsetzungen wie z. B. Verbesserungen in der Gehörlosendidaktik. Für die weitere Entwicklung war vor allem ein Misserfolg von entscheidender Bedeutung: Es gelang nämlich nicht, den Sprachlaut als diskrete Einheit nachzuweisen. Stattdessen stellte man fest, dass sich die Artikulation kontinuierlich, also ohne Grenzziehungen um die Einzellaute vollzieht und zudem variabel und kei‐ nesfalls bei allen Sprechern identisch ist. Spätestens in den 1930er Jahren zeigten neue Techniken, mit deren Hilfe Schallwellen aufgezeichnet und sichtbar gemacht wurden, dass Lautsprache auch in akustischer Hinsicht keine Abfolge diskreter Lauteinheiten darstellt. Die Ergebnisse der ersten experimentalphonetischen Untersuchungen stellten da‐ mals gängige Vorstellungen von Lautsprache radikal in Frage. Die Problematik, dass die konkrete physische Existenz von kontextstabilen Einzellauten nicht nachgewie‐ sen werden konnte, dass aber sowohl Sprechen als auch Hören offensichtlich auf 26 1 Einleitung <?page no="27"?> solchen Einheiten beruhen, führte zur bereits erwähnten Trennung von Phonetik und Phonologie im Strukturalismus (vgl. 1.1): Man unterschied nun zwischen einer natur‐ wissenschaftlichen Beschäftigung mit Artikulation, Schallwellen und Hörvorgängen einerseits und einer am Systemhaften der Lautsprache und dessen Erfassung interes‐ sierten Forschung auf der Basis geisteswissenschaftlicher Methoden andererseits. Die Entwicklung der phonologischen Theoriebildung wurde nachhaltig von Trubetzkoys Erkenntnis bestimmt, dass Phoneme als Bündel distinktiver Merkmale aufzufassen sind. Verbunden hiermit ist die Vorstellung, dass unser phonologisches Wissen als System organisiert ist: Die Abgrenzung der Phoneme voneinander funktioniere wie in einem mathematischen System, in dem der Stellenwert einer Einheit nur durch den Unterschied zu anderen Einheiten, also durch Relationen innerhalb des Systems, bestimmt ist. Dieses Prinzip der negativen Definition von Phonemen - jedes Phonem ist das, was die anderen nicht sind - führte häufig dazu, dass die Frage der Systemorgani‐ sation quasi zum Selbstzweck wurde; Ziel war es, die phonemischen Oppositionen einer Sprache aus einer möglichst geringen Zahl von distinktiven Merkmalen abzuleiten. Ab Ende der 1960er Jahren erhielt die strukturalistische Phonologie Konkurrenz von der generativen Phonologie. In ihrer Anfangszeit ging diese (wie zuvor der Strukturalismus) von einer segmental bestimmten Strukturierung des lautsprachlichen Wissens aus und wollte lautliche Prozesse, wie sie in der Interaktion der einzelnen Lautsegmente miteinander zu verzeichnen sind, möglichst vollständig durch sog. pho‐ nologische Regeln erfassen (vgl. 3.2). Um auch segmentübergreifende Erscheinungen wie tonale und dauerbasierte Merkmale berücksichtigen zu können (Sprachmelodie, Silbenlängung etc.), wurden in der Folgezeit Ansätze entwickelt, die zusätzlich zur segmentalen Schicht weitere, von den Einzellauten unabhängige Repräsentationsebe‐ nen annehmen. Diese sog. autosegmentalen Ansätze stellen wir exemplarisch in 3.3 vor. Die wesentlichen Neuerungen der generativen Phonologie beruhen v. a. auf den sprachtheoretischen Annahmen, die Noam Chomsky (*1928), der Begründer der generativen Sprachwissenschaft und einer der Autoren des grundlegenden Werks The sound pattern of English (SPE, Chomsky & Halle 1968), in bewusster Abgrenzung vom Strukturalismus formuliert hat. Im Gegensatz zu diesem verlagerte die generative Sprachwissenschaft das Interesse von der Saussureschen langue, der zufolge das Sprachsystem als die Gesamtheit des Sprachwissens aller Mitglieder einer Sprachge‐ meinschaft und damit als soziales Faktum aufzufassen ist, auf die kognitiven Fähigkei‐ ten des Individuums und insbesondere auf dessen sprachliche Kompetenz. Als Folge dieses sog. cognitive turn rückte die mentale Grammatik des Einzelnen ins Zentrum des Interesses. Seine sprachliche Kompetenz wurde verstanden als ein System von Einheiten und Verkettungsregeln, das die Erzeugung oder Generierung komplexer sprachlicher Einheiten wie Phrasen, Sätzen und Lautkombinationen etc. ermöglicht. Dabei ging es zunächst um die Kompetenz des sog. idealen Sprechers/ Hörers, dessen Sprachwissen nicht durch Performanzbedingungen gestört ist. Diese Idealisierung sollte die vollständige Erfassung aller Potentialitäten des Sprachsystems ermöglichen. 1.4 Phonologische Theoriebildung 27 <?page no="28"?> Die Performanz kann nach Chomsky nur eingeschränkt als Repräsentation der Kompetenz angesehen werden, da Faktoren wie Müdigkeit, begrenztes Gedächtnis etc. die konkrete Sprachrealisierung stören und ein vollständiges Ausschöpfen der von der Kompetenz gebotenen Möglichkeiten daher undenkbar ist. Eine weitere Grundannahme des frühen generativen Modells bestand in der Auffas‐ sung, dass das Sprachwissen modular organisiert sei. Nach dieser Annahme bauen die unterschiedlichen sprachlichen Wissensbereiche zwar aufeinander auf, sind aber insofern autonom, als sie weitgehend unabhängig voneinander agieren: So wurde angenommen, dass bei der Produktion einer sprachlichen Äußerung eine von der syntaktischen Komponente erzeugte grammatische Struktur an eine Art ‘Lautgenera‐ tor’, die phonologische Komponente, weitergereicht werde, die dann die im mentalen Lexikon gespeicherten Repräsentationen der in der Konstruktion verwendeten Wörter in konkrete Lautformen überführt. Die Auffassung von der Modularität des Sprachwis‐ sens wird jedoch seit längerer Zeit in Frage gestellt, und es wurden Ansätze entwickelt, die eine enge Interaktion der einzelnen sprachlichen Wissensbereiche annehmen. Als ein Beispiel hierfür besprechen wir die sog. Optimalitätstheorie, die dezidiert von einem Zusammenspiel unterschiedlicher Komponenten wie Syntax, Morphologie, Phonologie, aber auch Informationsstruktur ausgeht (vgl. 3.4, 4.2.5, 4.5.5.3). Die kognitive Verortung des Sprachlichen ist auch methodisch nicht folgenlos geblieben: Wenn es darum geht, das Sprachwissen des Individuums zu erfassen, erscheint es völlig ausreichend, bei der theoretischen Modellierung von den Sprach‐ daten und Grammatikalitätsurteilen eines einzigen kompetenten Muttersprachlers auszugehen. Verbunden damit ist der weitgehende Verzicht auf die Auswertung natürlich produzierter Sprachdaten mehrerer Sprecher (Korpora). Seit einiger Zeit ist hier jedoch eine Wende zu verzeichnen, und auch im Rahmen phonologischer Forschung, die auf generativen Konzepten aufbaut, werden theoretische Annahmen unter Rückgriff auf die Auswertung lautsprachlicher Korpora validiert. Zu nennen ist hier u. a. die Ausrichtung der sog. Laboratory Phonology (Cohn et al. 2012), ein Ensemble neuerer Forschungsaktivitäten, die zwar keine homogene theoretische Ausrichtung repräsentieren, doch von der Überzeugung geeint werden, die Weiter‐ entwicklung phonologischer Theoriebildung müsse in stetiger Interaktion mit der Analyse natürlicher Sprachdaten und insbesondere durch die Auseinandersetzung mit der dort zu konstatierenden sprachlichen Variation vorangetrieben werden (vgl. u. a. Face 2004). Auch im Bereich der sich in den letzten Jahren zunehmend auswei‐ tenden Korpusphonologie spielt die Rückbindung phonologischer Theoriebildung an konkretes sprachliches Material eine zentrale Rolle. Jedoch werden hier, anders als im laborphonologischen Rahmen, phonologische Hypothesen nicht mithilfe von Experimenten getestet, sondern mit den Ergebnissen der Auswertung größerer Samm‐ lungen von lautsprachlichen Daten (sog. Korpora, Sg. das Korpus (n.)) abgeglichen (vgl. Durand et al. 2014, Durand 2017, Eychenne 2022; speziell zum Spanischen Pustka et al. 2018 und Pustka 2021). Die Berücksichtigung von sprachlichen Varianten in ihren konkreten Vorkommensfrequenzen im Sprachgebrauch ist auch ein zentrales Anliegen 28 1 Einleitung <?page no="29"?> 6 Da sich der Ansatz der Konstruktionsgrammatik (sp. Gramática de Construcciones, engl. Construction Grammar), in dem die Untersuchung von Konstruktionen im Vordergrund steht und statt Regeln Schemata angesetzt werden, in der phonologischen Theoriebildung bislang nur wenig niedergeschla‐ gen hat (vgl. etwa Hoffmann & Trousdale 2013 und Hennecke & Wiesinger 2023), bleibt er hier ausgespart. Auf Überlegungen zu melodischen Konstruktionen beim L2-Erwerb gehen wir kurz in 5.3 ein. der sog. Exemplartheorie, die wir in 3.5 kurz skizzieren. 6 Ein knapper Überblick zur Entwicklung der phonologischen Theoriebildung mit Bezug auf die romanischen Sprachen findet sich in Meisenburg et al. (2022: 10-18). 1.5 Variation, Varietäten und Aussprachenormen Bereits mehrfach haben wir darauf hingewiesen, dass die Lautseite der Sprache nicht einheitlich ist, sondern in Abhängigkeit vom Sprecher und der kommunikativen Situa‐ tion mehr oder minder stark variieren kann. Um die unterschiedlichen Dimensionen sprachlicher Variation zu erfassen, wurde eine Vielzahl von Termini geprägt, die wir zunächst kurz besprechen. Dass Sprache nicht homogen ist, wird durch alltägliche Erfahrungen gestützt: Je nach Land und Region klingt das Spanische unterschiedlich, sprachliches Verhalten differiert beispielsweise je nach sozialem Status und Gruppenzugehörigkeit der Spre‐ cher, und diese bedienen sich wiederum entsprechend der jeweiligen kommunikativen Situation (gezielt oder unbewusst) bestimmter Ausdrucksmittel, die ihnen ihre Sprache bereitstellt. Sprachliche Vielfalt, wie sie uns tagtäglich begegnet, ist also nicht beliebig verteilt, sondern vielmehr durch eine Vielfalt an innersprachlichen (d. h. dem System selbst inhärenten) und außersprachlichen (z. B. geographischen, sozialen, situativen) Faktoren geleitet. Jede Einzelsprache stellt damit eine Art Varietätengefüge dar. Um diese Architektur der Sprache zu erfassen, hat Coseriu (1980, 2 1992: 294ff.) die folgenden drei Dimensionen von Variation vorgeschlagen: • Die diatopische Variation betrifft die sprachliche Gliederung im Raum und bezieht sich auf Dialekte bzw. regionale Varianten. • Die diastratische Variation zielt ab auf die soziale Gliederung von Sprache und damit auf gruppen- oder schichtenspezifische Sprachverwendung; entsprechende Gruppensprachen oder Soziolekte lassen sich als sozial ‘hoch’ oder ‘niedrig’ kon‐ notiert einstufen. • Die diaphasische Variation bezieht sich auf die Sprachverwendung in unter‐ schiedlichen kommunikativen Situationen. Auch die entsprechend verwendeten Register oder Sprechstile können zwischen den Polen ‘hoch’ und ‘niedrig’ einge‐ ordnet werden. Dieses dreidimensionale Modell wurde von Koch & Oesterreicher (1985, 2 2011) durch eine vierte Dimension erweitert. Angenommen wird hier ein Kontinuum zwischen konzeptioneller Mündlichkeit und Schriftlichkeit bzw. kommunikativer Nähe 1.5 Variation, Varietäten und Aussprachenormen 29 <?page no="30"?> und Distanz, wobei die mediale Differenzierung ‘graphisch’ vs. ‘phonisch’ den jeweili‐ gen Polen tendenziell entspricht. Dass das Medium der Phonie aber nicht zwangsläufig mit konzeptioneller Mündlichkeit korrelieren muss, kann man sich anhand eines Beispiels leicht verdeutlichen: So wird etwa eine feierliche Rede aus Anlass einer Bibliothekseröffnung mündlich, also im phonischen Medium vorgetragen, doch ist sie mit vermutlich hohem Planungsaufwand entstanden, damit distanzsprachlich konzipiert, und weist in der Verwendung komplexer Satzbaumuster und gehobenen Vokabulars eher die typischen Merkmale des Geschriebenen als die eines nähesprach‐ lichen Alltagsgesprächs auf. Die genannten Dimensionen sprachlicher Variation sind nicht isoliert zu betrachten, sondern sie können auf vielfältige Weise ineinandergreifen. So ist z. B. die sog. aspiración, d. h. die gehauchte Realisierung von / s/ im Silbenauslaut wie in [ ˈ moh.ka] mosca ‘Fliege’, kein Bestandteil der kastilischen Normlautung; sie lässt sich vielmehr diatopisch einordnen und damit als typisches Merkmal des in Andalusien oder auch in großen Teilen Lateinamerikas gesprochenen Spanisch charakterisieren (vgl. 2.5.1.2, 3.5). Auch das Ersetzen des Phonems / θ/ durch / s/ und die daraus resultierende Homophonie (< agr. ὅμος homos ‘gleich’ + φωνή phōnē ‘Laut, Stimme’), also die lautliche Gleichheit von Wörtern wie casa ‘Haus’ und caza ‘Jagd’ (jeweils [ ˈ kasa]), der sog. seseo (vgl. 3.1.2), ist kein Bestandteil der kastilischen Lautung. Die Zuordnung des seseo zu einer bestimmten Region gestaltet sich jedoch schwierig, da er fast den gesamten hispanischen Raum erfasst hat und allein das in Kastilien und Nordspanien gesprochene Spanisch durch die phonemische Unterscheidung zwischen / θ/ und / s/ und damit durch Differenzierung von caza [ ˈ kaθa] und casa [ ˈ kasa] gekennzeichnet ist. Geographisch markierte Aussprachevarianten lassen sich auch im Rahmen der diaphasischen Variation einsetzen, nämlich etwa dann, wenn ein andalusischer Sprecher neben seinem lokal gefärbten Sprechstil auch über ein standardnahes, am kastilischen Spanisch orientiertes Register verfügt und seine Aussprache situationsbe‐ zogen anpasst. Dies wiederum impliziert eine diastratische Komponente, denn die Fähigkeit zum Register- oder Stilwechsel setzt die Beherrschung mehrerer sprachlicher (Sub-)Systeme voraus. Ob ein Sprecher neben einem lokal gefärbten auch ein neutrales Register zur Verfügung hat, ist i. d. R. an soziale Faktoren und insbesondere an den Zugang zu Bildungsinstitutionen gebunden, da zusätzlich zum muttersprachlich erworbenen (geographisch markierten) System eine als neutral empfundene Varietät erlernt werden muss. Welche Varietät als neutral und den verschiedenen Dialekten übergeordnet ein‐ gestuft wird, ist wiederum von Sprache zu Sprache unterschiedlich und wird von zahlreichen außersprachlichen Faktoren mitbestimmt. Für den europäischen Raum gilt das kastilische Spanisch, wie es in der Hauptstadt Madrid gesprochen wird, als prestigeträchtige Referenzvarietät; parallel hierzu haben sich in jüngerer Zeit 30 1 Einleitung <?page no="31"?> 7 Die Aufwertung der zahlreichen Varietäten zeigt sich auch daran, dass die neue Akademiegrammatik (Nueva gramática de la lengua española, NGRAE 2011) von den 22 Sprachakademien des spanisch‐ sprachigen Raums gemeinsam erarbeitet wurde. in Lateinamerika eigene Standardvarietäten herausgebildet (s. u.). 7 Doch auch wenn ein Sprecher bspw. das kastilische Spanisch als L1 erworben hat, muss er die dis‐ tanzsprachlichen Merkmale der habla culta wie komplexe Satzbaumuster, besondere stilistische Figuren, gehobenes und gegebenenfalls fachspezifisches Vokabular etc., gezielt erlernen, um in entsprechenden Situationen angemessen kommunizieren zu können. Bislang war bereits mehrfach von sprachlichen Varietäten die Rede. Wir verwenden diesen Terminus, da er, etwa im Gegensatz zum manchmal negativ konnotierten Begriff des Dialekts, explizit keine soziolinguistische Einordnung in einem Kontinuum zwischen ‘hoch’ und ‘niedrig’ vornimmt, sondern in neutraler Form auf ein wie auch immer beschaffenes Sprachsystem verweist. So lassen sich geographisch unterschied‐ lich gefärbte Sprachformen wie das in Andalusien, in Argentinien oder in Madrid gesprochene Spanisch gleichermaßen als Varietäten erfassen. Mit dem neutralen Terminus lässt sich auch die problematische Abgrenzung zwischen Sprache und Dialekt vermeiden, d. h., es muss keine Entscheidung getroffen werden, welchem Spanisch der Status einer überdachenden Sprache zugesprochen wird, der abweichende Formen als Dialekte unterzuordnen wären. Der Begriff der Varietät bezieht sich jedoch nicht nur auf die Dimension der diatopischen Variation. Man kann ihn gleichermaßen auf gruppenund/ oder berufsspezifische Sprachformen (sp. jergas) oder auf situations‐ bezogene, d. h. nähe- oder distanzsprachliche Register (sp. registros) anwenden und damit sowohl diastratische als auch diaphasische Aspekte mit einbeziehen. Innerhalb einer Sprechergemeinschaft bestehen - zumindest im bildungssprachli‐ chen Kontext - jedoch durchaus Vorstellungen von einer korrekten Sprachverwendung und damit auch von einer normgerechten Aussprache, die als Ergebnis historisch gewachsener Normierungsprozesse aufzufassen ist. Für das Spanische gilt, dass den kastilischen Varietäten aufgrund der politischen Schlüsselposition Kastiliens eine zen‐ trale Rolle zukommt. So wurde bereits im 13. Jahrhundert unter Alfons X. (genannt der Weise, sp. El Sabio, 1221-1284) der Begriff vom castellano drecho, d. h. vom ‘richtigen Spanisch’ geprägt, was auf den als vorbildhaft geltenden Sprachgebrauch am Hof im kastilischen Toledo abzielte (sp. uso cortesano). Auch das anschließend entstandene Konzept des buen uso ist lokal gebunden und nimmt Bezug auf die Sprachverwendung in den habsburgischen Hauptstädten Valladolid und Madrid (vgl. Kabatek & Pusch 2 2011: 258 ff.). Im Zuge der nach dem Vorbild der Académie française 1713 erfolgten Gründung der Real Academia trat die Vorbildfunktion gebildeter Sprecher in den Vordergrund, wobei in diatopischer Hinsicht weiterhin der kastilische Sprachraum maßgeblich war. Die Varietäten anderer Regionen spielten lange Zeit nur als der hauptstädtischen habla culta untergeordnete Dialekte eine Rolle; ihre lautlichen Be‐ sonderheiten wurden unter dem Gesichtspunkt der Abweichung von der kastilischen Norm betrachtet und entsprechend im Rahmen dialektologischer Studien behandelt. 1.5 Variation, Varietäten und Aussprachenormen 31 <?page no="32"?> 8 Zu nennen sind hier z. B. die Verwendung des Pronomens vos für die nähesprachliche Anrede im Singular und die damit korrespondierenden, vom europäischen Spanisch abweichenden Verbformen (z. B. vos contás statt (tú) cuentas) sowie eine deutlich stärkere Tendenz zur sog. klitischen Dopplung, die auch unbelebte direkte Objekte betreffen kann und dann i. d. R. mit der Markierung durch die funktionale Präposition a einhergeht (z. B. y al final me lo compré [ dir. Objekt al auto] statt (me) compré [ dir. Objekt el coche] ‘und schließlich habe ich mir das Auto gekauft’). Dies gilt auch für die in Amerika gesprochenen Varietäten des Spanischen, auch wenn hier inzwischen verstärkt Tendenzen zur Etablierung eigener nationaler Standards und Aussprachenormen zu verzeichnen sind. Als ein Beispiel sei die Situation der Rundfunkanstalten in Argentinien angeführt: Während in den 1930/ 40er Jahren dem Rundfunk eine der Schule gleichgestellte normgebende Kraft zugesprochen wurde und die Aussprache der Radiosprecher per Dekret auf die ‘gepflegte’ Lautung gemäß der kastilischen Norm festgelegt war, wurde dies 1957 dahingehend gelockert, dass umgangssprachliche Ausspracheformen explizit zugelassen wurden. In den entsprechenden Richtlinien von 1980 fand schließlich die Lautung keine Erwähnung mehr, was eine lokal gefärbte Aussprache im Rundfunk de facto ‘legalisierte’ (Vitale & Vázquez Villanueva 2004). Heutzutage werden für das argentinische Spanisch typische lautliche Merkmale wie die bereits erwähnten Phänomene aspiración und šeísmo auch in distanzsprachlichen Kontexten ostentativ verwendet. Damit hat sich ein lokaler Standard herausgebildet, der sich in Bezug auf seine Normen sowohl in lexikalisch-grammatischer 8 als auch in lautlicher Hinsicht deutlich von anderen Varietäten und insbesondere vom kastilischen Spanisch abhebt. Das hier angeführte argentinische Spanisch ist nur ein Beispiel unter vielen: Im gesamten spanischen Sprachraum haben sich divergierende Aussprachemuster her‐ ausgebildet, die wir exemplarisch in den Kapiteln zur segmentalen und prosodischen Phonologie besprechen werden. Welche der zahlreichen Aussprachevarianten sollten aber nun für eine Beschreibung der spanischen Lautung als Bezugspunkt aufgefasst werden, welche als Abweichungen hiervon gelten? Da sich neben dem kastilischen Spanisch eine Vielfalt an regionalen Normen entwickelt hat, erscheint es fragwürdig, die Aussprache einer dieser Varietäten als Referenzlautung anzusetzen und die übrigen als divergierende Unterformen zu charakterisieren. Da eine solche Entscheidung bestenfalls mit Blick auf die Geschichte zu begründen wäre, stellen wir unterschiedliche Varietäten wie kastilisches, andalusisches oder argentinisches Spanisch jeweils gleich‐ berechtigt dar. Hieraus folgt, dass wir bei der Behandlung des spanischen Lautinventars z. B. das (nur in den kastilischen und nordspanischen Varietäten vorkommende) / θ/ als ein varietätenspezifisches Phonem verzeichnen, ebenso wie das Phonem / ʒ/ , das speziell für das argentinische Spanisch (und darüber hinaus für den gesamten Río de la Plata-Raum) charakteristisch ist. Im Folgenden geben wir einen knappen Überblick zum spanischen Varietäten‐ raum (vgl. ausführlicher Hualde 2005: 19-35, 2022: 780-784). Das europäische Sprachgebiet ist grob zweigeteilt und lässt sich in eine nördlich-zentrale und eine südliche Zone aufteilen. Typisch für die Varietäten der ersteren ist neben der 32 1 Einleitung <?page no="33"?> 9 Weiterhin ist das (in Abb. 1.5-1 nicht angezeigte) Okzitanische anzuführen, das als autochthone Sprache im zum spanischen Staatsgebiet zählenden Pyrenäental Val d’Aran (sp. Valle de Arán, kat. Vall d’Aran) gesprochen wird und dort sowohl mit dem Katalanischen als auch mit dem Spanischen in Kontakt steht. 10 Martín Butragueño & Mendoza (2023: 3f.) geben einen Überblick über hiervon leicht abweichende Einteilungen. In Teilen der Literatur werden durch Zusammenfassung des mexikanischen und des zentralamerikanischen sowie des paraguayischen und des rioplatensischen Spanisch zu je einem Dialektgebiet statt sieben nur fünf Zonen angenommen. Beibehaltung der phonemischen Opposition / θ/ vs. / s/ vor allem die postvelare (d. h. weit hinten am Gaumen produzierte) Realisierung des Frikativphonems / x/ in Wörtern wie ajo [ ˈ aχo] ‘Knoblauch’ oder mujer [mu ˈ χeɾ] ‘Frau’ (vgl. 2.5.1.2). Mit dem Katalani‐ schen, dem Baskischen und dem Galicischen werden in Spanien neben Varietäten des Spanischen weitere Sprachen gesprochen, wobei jedoch nicht alle in den jeweiligen Gebieten lebenden Spanischsprecher bilingual sind. Die entsprechenden Gebiete sind in Abb. 1.5-1 farblich hervorgehoben. 9 Die Varietäten der südlichen Zone zeichnen sich u. a. durch die Abwesenheit des Kontrasts / θ/ vs. / s/ (seseo), durch die aspiración von silbenfinalem / s/ sowie durch eine Abschwächung des / x/ zum Hauchlaut (wie in mu[h]er) aus. Das Spanische der kanarischen Inseln teilt die meisten dieser Merkmale mit der südlichen Zone, ist jedoch zusätzlich durch spezielle Eigenheiten charakterisiert (vgl. 2.5.1.2, 3.3). Abb. 1.5-1: Varietäten des europäischen Spanisch (nach Hualde 2005: 19ff.). Für das rein flächenmäßig weitaus größere Sprachgebiet in Mittel- und Südamerika lassen sich mit Hualde (2005: 25ff.) sieben Zonen unterscheiden. 10 Das amerikanische Spanisch steht in unterschiedlich starkem Maße im Kontakt mit autochthonen 1.5 Variation, Varietäten und Aussprachenormen 33 <?page no="34"?> Sprachen, wobei Paraguay den größten Anteil an bilingualen Sprechern aufweist (Spanisch - Guaraní, vgl. Gabriel et al. 2020b: 39-44). Zu nennen sind weiterhin u. a. Nahuatl für das mexikanische Spanisch sowie Quechua und Aymara für die andinen Varietäten (Peru, Ecuador). Eine weitere Kontaktsprache für das im Grenzgebiet zwi‐ schen USA und Mexiko gesprochene Spanisch ist das Englische. Infolge von Migration aus Lateinamerika sind auch in den USA große Hispanic communities entstanden, deren Sprecher neben dem Englischen das Spanische als Herkunftssprache verwenden. Einen Überblick zu den entsprechenden Aussprachebesonderheiten bieten Rao & Ronquest (2015), Ronquest & Rao (2018) und Rao & Amengual (2021); vgl. auch 5.2.1. Für das mexikanische Spanisch, das auch die südlichen Grenzgebiete der USA umfasst, kann als typisches Merkmal die stabile silbenfinale / s/ -Realisierung wie in [ ˈ estos] estos ‘diese’ angeführt werden, die auch in komplexen Konsonantenverbindun‐ gen auftritt ([konstɾu ˈ iɾ] construir ‘bauen, errichten’; vgl. Lewis & Boomershine 2015). Ein weiteres, durch den Kontakt mit mesoamerikanischen Sprachen wie dem Nahuatl bedingtes Merkmal ist die von anderen Varietäten des Spanischen abweichende Silbenaufteilung bei Wörtern wie a.tle.ta ‘Athlet/ in’ (anstelle von at.le.ta); die zweite Silbe beginnt hier mit dem komplexen Onset [tl], ebenso wie der absolute Anlaut des mexikanischen Ortsnamens Tlaxcala (4.2.5, 5.1). In der zentralamerikanischen Zone werden Varietäten zusammengefasst, die sich einerseits vom mexikanischen und andererseits vom karibischen Spanisch abgrenzen (vgl. Quesada Pacheco 2015). Ein besonderes Charakteristikum der in Costa Rica gesprochenen Varietät ist die an das Englische erinnernde r-Realisierung. Die karibischen Varietäten zeichnen sich u. a. durch eine starke Tendenz zur Reduktion stimmhafter intervokalischer Verschlusslaute aus, die bis zur kompletten Tilgung gehen kann. In Kombination mit der aspiración von vorkonsonantischem / s/ ergeben sich hieraus Realisierungen wie [peh ˈ kao̯] pescado ‘Fisch(gericht)’. Dies kommt jedoch auch im andalusischen Spanisch vor. Das andine Spanisch (Peru, Ecuador, Bolivien) ist teils durch Besonderheiten charakterisiert, die sich durch den Kontakt mit dem Quechua erklären lassen. So treten im Hochlandspanischen von Peru bei der Markierung von akzentuierten Silben Tonhöhenbewegungen auf, die denen des Quechua entsprechen (vgl. O’Rourke 2004, 2005). Auch das paraguayische Spanisch ist nachhaltig durch den Sprachkontakt geprägt. Ein vermutlich aus dem Guaraní übernommenes Merkmal, das in anderen Varietäten des Spanischen nicht regelmäßig auftritt, ist der am Wortanfang und auch zwischen Vokalen platzierte Glottisschlag [ʔ], der in ähnlicher Form auch im Deutschen auftritt. Im chilenischen Spanisch ist die bereits für zahlreiche andere Varietäten (Andalusien, Argentinien, Karibik) angeführte / s/ -Aspiration zu verzeichnen. Ein ty‐ pisches Merkmal besteht zudem darin, dass / k ɡ x/ in der Position vor / e/ und / i/ weiter vorne am Gaumen artikuliert werden als in anderen Varietäten. Damit klingt in der chilenischen Aussprache von gente ‘Leute’ die erste Silbe eher so wie dt. -chen (vgl. Hualde 2005: 30). Das Gebiet des rioplatensischen Spanisch umfasst die am Río de la Plata gelegenen Staaten Argentinien und Uruguay, wobei die nördlichen 34 1 Einleitung <?page no="35"?> Provinzen Argentiniens (u. a. Corrientes, Misiones, Formosa) sprachlich eher dem paraguayischen Spanisch zuzuordnen sind. Die bereits erwähnten lautlichen Merk‐ male des argentinischen Spanisch, insbesondere der šeísmo und die starke Tendenz zur / s/ -Aspiration treffen auch weitgehend für Uruguay zu. Abb. 1.5-2: Die sieben Varietätenzonen des amerikanischen Spanisch in unterschiedlichen Farben (nach Hualde 2005: 25ff.). 1.5 Variation, Varietäten und Aussprachenormen 35 <?page no="36"?> 2 Die Lautseite sprachlicher Kommunikation: Phonetik 2.1 Der Gegenstand der Phonetik Dieses Kapitel ist der Phonetik gewidmet, die in ihren Teilbereichen artikulatorische (2.2), akustische (2.3) und auditive bzw. perzeptive Phonetik (2.4) lautsprachliche Kommunikation vornehmlich von ihrer materiellen Seite her untersucht. Sie liefert damit wichtige Grundlagen für die Klassifikation der Sprachlaute, wie sie in 2.5 für das Spanische - kontrastiert mit dem Deutschen - vorgestellt wird. Wir wollen aber zunächst fragen, was tatsächlich passiert, wenn wir in Lautsprache kommunizieren, wenn wir also sprechen und Gesprochenes wahrnehmen. Wir versetzen uns dazu wieder in die Situation von Juan, der wissen will, ob es in einem ihm bislang unbekannten Laden Mandarinen gibt. Ursprung, Ausgang und Steuerungszentrum für sämtliche Kommunikation und damit auch für unser sprachliches Handeln ist unser Gehirn, in dem unser gesamtes sprachliches Wissen gespeichert ist. Dabei können verschiedene Funktionen unter‐ schieden werden, die während des Kommunikationsprozesses eng miteinander koor‐ diniert sind (vgl. Abb. 2.1-1). Im Rahmen der kreativen Funktion hat Juan seinen Entschluss zur Nutzung der Lautsprache für die Kommunikation mit der Verkäuferin getroffen. Auch innerhalb dieses Zeichensystems hat er nun mehrere Möglichkeiten: So kann er beispielsweise das, was er ausdrücken will, als Frage oder als Aussagesatz (etwa mit einer indirekten Frage im Nebensatz) formulieren, er kann komplizierte Umschreibungen einbauen oder einen ganz einfachen Satz konstruieren etc. Derartige Entscheidungen werden meist sehr schnell und weitgehend unbewusst von der entsprechenden Gehirnfunktion getroffen. Mit der kreativen Funktion eng verbunden ist die Sendefunktion. Zur Produktion einer mündlichen Äußerung werden über die Nerven Impulse vom Gehirn zu den Muskeln geschickt, die für den Betrieb der Sprechwerkzeuge zuständig sind, für Lunge, Kehlkopf, Zunge usw. Die Impulse bewirken, dass diese Muskeln verschiedene Bewegungen durchführen: Die Lunge zieht sich zusammen, die Stimmbänder vibrieren, der Unterkiefer geht auf und nieder, Zunge und Lippen verändern laufend ihre Position. Durch all diese Aktivitäten, deren Koordinierung über ständige Rückmeldungen ans Gehirn erfolgt, wird der von der Lunge ausgehende Luftstrom bei seinem Gang durch Kehlkopf, Rachen, Nasen- und Mundraum auf vielfältige Weise gestaltet - unterbrochen, behindert, frei durchgelassen -, sodass er den Mund in Folgen von kom‐ plexen, akustisch als Klänge und Geräusche wahrnehmbaren Druckwellen verlässt: Muskelbewegungen werden in Luftbewegungen - Schallwellen - umgesetzt. Außerhalb des Mundes bewegen sich die Druckwellen in alle Richtungen fort; sie werden immer schwächer, je weiter sie gelangen, und verebben schließlich ganz, wenn ihre ursprüngliche Energie aufgebraucht ist. Doch werden sie für gewöhnlich <?page no="37"?> 1 So können wir beispielsweise hören, dass etwas in einer fremden Sprache gesagt wird, ohne zu verstehen, was gesagt wird. 2 Damit eine Äußerung verstanden wird, muss sie nicht nur dem sprachlichen Wissen des Hörers entsprechen, sondern auch seinem allgemeinen (Welt-)Wissen. produziert, um vor dem Verebben auf ein (oder mehrere) Paar Ohren zu treffen, in unserem Fall auf die Ohren der Verkäuferin. Damit setzt beim Hörer die wiederum vom Gehirn gesteuerte Hörfunktion ein: Im Ohr bewegt sich das sehr empfindliche Trommelfell entsprechend den eintreffenden Druckwellen; diese Bewegungen werden auf Nerven übertragen, die vom inneren Ohr des Hörers zu seinem Gehirn laufen. Dort werden die vom Ohr kommenden Impulse als lautliches Geschehen aufgenommen, das sich in seiner Qualität, Länge, Höhe, Lautstärke etc. laufend ändert. Die Verkäuferin hört Juans Frage. Hören bedeutet jedoch noch nicht verstehen. 1 Um zu einem Verständnis des lautlichen Geschehens zu gelangen, muss der Hörer es interpretieren, und zwar entsprechend seiner im Gehirn gespeicherten Sprachkenntnis. Die Verkäuferin stimmt also das, was sie hört, mit dem ab, was nach ihrem Wissen in ihrer Sprache möglich ist, und entschlüsselt bzw. interpretiert so Juans Äußerung, 2 bevor sie selbst die Rolle der Sprecherin übernimmt. In Abbildung 2.1-1 sind diese lautsprachlichen Produktions- und Rezeptionsprozesse skizziert. Durch die eckigen Klammern ist der Bereich angezeigt, der die Phonetik interessiert, die senkrechten Linien grenzen grob ihre drei klassischen Teilbereiche ab. Es folgt eine an Pompino-Marschall ( 3 2009: 2f.) angelehnte Definition von Phonetik. Abb. 2.1-1: Gegenstand der Phonetik und ihre Teilbereiche. Gegenstand der Phonetik sind die lautlichen Aspekte sprachlicher Kommunika‐ tion. Sie untersucht, wie Schallereignisse artikulatorisch zustandekommen (physi‐ kalische Prozesse bei der Sprachproduktion), wie sie akustisch zu messen und zu 2.1 Der Gegenstand der Phonetik 37 <?page no="38"?> 3 Neben ‘Symbol-’ und ‘Messphonetik’ sind für diese Herangehensweisen auch die Bezeichnun‐ gen ‘deskriptive Phonetik’ gegenüber ‘Signal-’ oder ‘Instrumentalphonetik’ in Gebrauch (vgl. Pom‐ pino-Marschall 3 2009: 2f.). beschreiben sind (akustische Vorgänge der Schallproduktion und -übertragung) und wie sie auditiv wahrgenommen werden (perzeptive Vorgänge bei der Verar‐ beitung über das Gehör). Die kleinsten Analyseeinheiten der Phonetik sind Laute (auch Phone oder Segmente, sp. sonidos, fonos, segmentos), denen man sich ohrenphonetisch/ auditiv beim bewuss‐ ten Nachvollziehen der Artikulationsbewegungen annähern kann - so etwa beim zeitlichen Überdehnen der Aussprache. Diese Minimalereignisse sind jedoch reine Beschreibungskategorien, die nicht als kleinste Bausteine der menschlichen Rede miss‐ verstanden werden dürfen: Beim Sprechen werden nicht einzelne Laute aneinander‐ gefügt, sondern ein ganzer Lautstrom wird durch kontinuierliche Bewegungsabläufe moduliert (Pompino-Marschall 3 2009: 178). Bestimmte Eigenschaften sprachlicher Schallereignisse wie Akzent oder Intonation lassen sich nicht an einzelnen Lautsegmenten festmachen, sondern gehen über diese hinaus. Sie werden daher als suprasegmentale Merkmale gefasst und der Prosodie zugerechnet (vgl. Kap. 4). Eine wichtige Rolle als Trägerin prosodischer Eigenschaften (insbesondere des Akzents) spielt die der Wahrnehmung leicht zugängliche Silbe. Als kleinste supraseg‐ mentale Komponente und elementare Produktionseinheit hat sie wesentlichen Anteil an verschiedenen lautlichen Prozessen sowie an der rhythmischen Strukturierung sprachlicher Äußerungen (vgl. 4.2). Mit Symbolphonetik und Messphonetik werden zwei kategorial verschiedene, doch aufeinander beziehbare Herangehensweisen an den Gegenstandsbereich der Phonetik unterschieden: Während die Messphonetik sich mit den Vorgängen befasst, die bei der Produktion, Übertragung und Rezeption von Sprachsignalen unter Zu‐ hilfenahme von Geräten gemessen und in einer physikalischen Sprache dargestellt werden können, ist die Symbolphonetik durch den Gegenstand ‘Laut’, wie er sich perzeptiv aus komplexen Schallereignissen herauslösen lässt, bestimmt. Mit Hilfe eines begrenzten Zeichenvorrats stellt sie diese Schallereignisse symbolisch dar, sodass die phonetische Information in einer Symbolkette repräsentiert wird (Kohler 2 1995: 17). 3 Die Wiedergabe von Lauten durch (graphische) Symbole einer phonetischen Umschrift wird als Transkription bezeichnet. Auch die uns vertrauten Alphabetschriften zielen auf die Wiedergabe der Lautung ab, doch neben dem Lautbezug vermitteln sie dem Leser noch zahlreiche weitere Informationen, die nur einen mittelbaren oder gar keinen Bezug zur Lautseite aufwei‐ sen, während bestimmte lautliche Erscheinungen nicht oder nicht regelmäßig berück‐ sichtigt werden. Zu letzteren gehört oft (so z. B. im Deutschen) die Kennzeichnung der Betonung, zu ersteren zählen Abstände zwischen Wörtern, Großschreibungen 38 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="39"?> 4 Die für das Spanische relevanten Zeichen des IPA werden in 2.5 ausführlich vorgestellt. Ein Überblick über das gesamte Zeicheninventar findet sich im Anhang. 5 Der Zeichensatz der Revista de Filología española ist (nach RFE 2 (1915), 374ff.) in Kubarth (2009: 331f.) abgebildet. Eine Gegenüberstellung der IPA- und RFE-Zeichen findet sich unter https: / / en.wi kipedia.org/ wiki/ RFE_Phonetic_Alphabet. u. v. a. Auch werden häufig mehrere Schreibungen für ein und denselben Laut genutzt (vgl. im Deutschen <f>/ <v> für [f] wie in Fee/ Vieh oder im Spanischen <b>/ <v> für [b] wie in baca ‘Dachgepäckträger’ / vaca ‘Kuh’, beide [ ˈ baka]). Umgekehrt können verschiedene Laute durch ein einziges Schriftzeichen repräsentiert werden (vgl. [eː]/ [ɛ] durch <e> in dt. Weg/ weg oder [r]/ [ɾ] durch <r> in sp. raro ‘selten’ [ ˈ raɾo]). In der Rechtschreibung zeichnen sich zudem immer wieder Tendenzen ab, das, was inhaltlich zusammengehört, graphisch auch dann einander anzugleichen, wenn die Lautung abweicht, und andererseits das unterschiedlich zu schreiben, was nur zufällig gleich lautet, inhaltlich aber nichts miteinander zu tun hat. So teilen dt. Maus [maʊ̯s] und Mäuse [ ˈmɔɪ ̯ zə ] in der Lautung nur den Anfangskonsonanten, während sie graphisch weitgehend identisch gehalten sind. Dt. Häute und heute lauten dagegen völlig gleich, nämlich [ ˈhɔɪ ̯ tə ], werden aber in der Schreibung deutlich voneinander geschieden. Um die Lautseite einer Sprache genauer und eindeutiger repräsentieren zu können, sind für Phonetik und Phonologie eigene Transkriptionssysteme entwickelt worden. Das bekannteste unter ihnen, das auch wir hier benutzen, ist das International Phonetic Alphabet (IPA, sp. Alfabeto Fonético Internacional bzw. AFI, vgl. https: / / www.inte rnationalphoneticassociation.org/ IPAcharts/ IPA_chart_orig/ pdfs/ IPA_Kiel_2020_full. pdf). Nach dem Prinzip, dass zumindest jeder Laut, der in einer der Sprachen der Welt zur Bedeutungsunterscheidung beiträgt, durch ein eigenes Transkriptionszeichen repräsentiert sein soll, kommen in ihm alle Buchstaben des lateinischen Alphabets (mit einer in vielen Sprachen verbreiteten lautlichen Entsprechung) zum Einsatz, aber es werden auch die Buchstaben des griechischen und weiterer Alphabete genutzt. Gegebenenfalls werden die Zeichen durch sog. Diakritika (Unterscheidungszeichen) ergänzt. 4 Als maschinenlesbare Lautschrift, die nur die Zeichen der grundlegenden Tastaturbelegung nutzt, ist in den letzten Jahrzehnten SAMPA (Speech Assessment Methods Phonetic Alphabet) entwickelt worden (vgl. https: / / en.wikipedia.org/ wiki/ SA MPA_chart). Für das Spanische wird gelegentlich noch der Zeichensatz der Revista de Filología española (RFE) verwendet. 5 Während eine weite Transkription (sp. transcripción amplia) sich auf das symboli‐ sche Minimum zur eindeutigen segmentellen Differenzierung der transkribierten Ein‐ heiten beschränkt (und damit eher einer phonologischen Transkription gleichkommt, vgl. 3.1.2), symbolisiert eine enge Transkription (sp. transcripción estrecha) auch darüber hinausgehende phonetische Information. Da Letzteres in unterschiedlichem Ausmaß geschehen kann, gibt es zwischen weiter und enger Transkription zahlreiche Zwischenstufen. 2.1 Der Gegenstand der Phonetik 39 <?page no="40"?> Behandelte (Sprach-)Formen, Äußerungen, Wörter, Laute sind im laufenden Text graphisch stets auszuzeichnen. Für gewöhnlich geschieht das durch Kursivsetzung. Wird speziell auf die (Ortho-)Graphie abgezielt, so stehen die entsprechenden Einheiten zwischen spitzen Klammern. Phonetische Transkriptionen stehen immer zwischen eckigen Klam‐ mern. Beispiele: ¿Tiene mandarinas? Beispielsatz - <¿Tiene mandarinas? > graphische Repräsentation - [ ˈ tjenemanda ˈ ɾinas] IPA-Transkription - [ ˈ tjẽ.nẽ. ˌ m-n.da. ˈ ɾı̃.nas] IPA-Transkription (relativ eng) - ["tjenemanda"4inas] SAMPA-Transkription - [tjénemandarínas] RFE-Transkription Unter https: / / software.sil.org/ doulos/ download/ lassen sich die unicode-basierten (und damit zwischen verschiedenen Rechnersystemen kompatiblen) phonetischen Zeichen der IPA-Schrift Doulos SIL kostenlos herunterladen. Unter https: / / www.international phoneticassociation.org/ IPAcharts/ inter_chart_2018/ IPA_2018.html kann man die den jeweiligen Zeichen entsprechenden Laute anhören. Weitere Darstellungen der Phonetik des Spanischen finden sich u. a. in Quilis (1993), Quilis & Fernández ( 15 1996), Martínez Celdrán ( 2 2003), Hualde (2005), Gil Fernández (2007), Martínez Celdrán & Fernández Planas (2007), Kubarth (2009), Cloonan Cortez de Andersen (2010), Schwegler et al. ( 4 2010), Blaser ( 2 2011: 33-53), NGRAE (2011), Hidalgo Navarro & Quilis Merín (2012), Pustka (2021: 147-164) und Gabriel (2022). Eine auf das Lautsystem des Spanischen bezogene Einführung in die Verwendung des IPA findet sich in Face (2008). 40 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="41"?> 6 Die Darstellung in diesem Abschnitt folgt in groben Zügen Pompino-Marschall ( 3 2009: 17ff.). 2.2 Artikulatorische Phonetik Die artikulatorische Phonetik beschreibt die physiologischen Prozesse, die zur Produktion lautsprachlicher Äußerungen führen. Dieses Unterkapitel gilt den Grundlagen der artikulatorischen Phonetik. Dazu stellen wir mit Atmung, Phonation und Artikulation zunächst die drei Funktionskreise der Lautproduktion vor (2.2.1), bevor wir uns gründlicher mit der Artikulation beschäfti‐ gen: In 2.2.2 gehen wir auf Artikulatoren und Artikulationsstellen ein, in 2.2.3 auf verschiedene Artikulationsmodi, in 2.2.4 auf das Phänomen der Koartikulation. 2.2.1 Lautproduktion: Atmung, Phonation, Artikulation Alle an der Sprachproduktion beteiligten Organe haben primär andere, vitale Funktio‐ nen: sie dienen der Sauerstoffzufuhr, der Nahrungsaufnahme u. ä. Die Sprachproduk‐ tion stellt lediglich eine Sekundärfunktion dar, die der Primärfunktion entwicklungs‐ geschichtlich nachgeordnet ist. 6 Voraussetzung für das Sprechen ist das Atmen. Zur Lautproduktion muss zunächst ein Luftstrom erzeugt werden, wie er durch die Aktivitäten des Atmungssystems (Lunge, Zwerchfell, Luftröhre etc.) entsteht. Die Lunge ist durch ein System von Flüssigkeiten und Geweben mit dem Brustkorb und dem Zwerchfell verbunden. Beim Einatmen bewegt sich das Zwerchfell nach unten, der Brustraum wird vergrößert und das Lungenvolumen erweitert. Der Druck, mit dem die Luft beim ruhigen Ausatmen nach außen gepresst wird, ist allerdings für die Sprachproduktion zu hoch; deshalb müssen beim Sprechen die Muskeln dem natürlichen Ausatmungsdruck entgegenwir‐ ken und einen gleichmäßigen subglottalen Druck garantieren. 2.2 Artikulatorische Phonetik 41 <?page no="42"?> Abb. 2.2-1: Das Atmungssystem. Von der Lunge kommend trifft die Atemluft am Ende der Luftröhre auf den Kehlkopf (sp. laringe; Adj. laryngal). Der Kehlkopf ist ein komplexes Ventil, das primär zum Verschließen der unteren Atemwege gegenüber dem Eindringen von Nahrung oder sonstigen Fremdstoffen dient. In der lautsprachlichen Kommunikation besteht seine Funktion in der kontrollierten Stimmtonerzeugung oder Phonation: Im Kehlkopf befinden sich, an beweglichen Knorpeln befestigt, die sog. Stimmlippen (sp. cuerdas vocales), die einen von komplettem Verschluss bis zu weiter Öffnung regulierbaren Spalt, die Stimmritze oder Glottis (sp. glotis; Adj. glottal), umschließen. Durch die Kehlkopfmuskulatur wird die Glottis an die Erfordernisse von Atmung und Stimmbildung angepasst. So sind die Stimmlippen bei der Ruheatmung weit geöffnet, und die Atemluft kann ungehindert passieren. Zur Stimmbildung dagegen wird die Glottis geschlossen und durch den subglottalen Druck so auseinandergepresst, dass die Stimmlippen durch die entweichende Luft in Schwingungen versetzt werden. Sie vollführen rasche Öffnungs- und Schließbewegungen, die den kontinuierlichen Luftstrom in eine Folge kleiner Luftstöße zerteilen (vgl. Abb. 2.2-3c). Das daraus resultierende Rohschallsignal ist ein Klanggemisch, das unterschiedlich ausfällt, je 42 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="43"?> 7 Männer haben in der Regel längere Stimmlippen als Frauen (17-24 mm gegenüber 13-17 mm), weshalb ihre Stimmen tiefer klingen. 8 Durch unterschiedlich starke Spannung der Stimmlippen lässt sich die Höhe der Stimme innerhalb einer bestimmten Spannbreite steuern. Das wird zum Singen genutzt, ermöglicht aber auch beim Sprechen einen unterschiedlichen Tonhöhenverlauf. 9 Je stärker der subglottale Druck ist, desto lauter erscheint die Stimme. nachdem, wie lang die Stimmlippen sind, 7 wie stark sie gespannt werden, 8 wie stark der subglottale Druck ist 9 etc. Das Vibrieren der Stimmlippen ist Voraussetzung für alle stimmhaften Laute (Vokale und stimmhafte Konsonanten). Bei der Artikulation stimmloser Konsonanten schwingen die Stimmlippen nicht. Abb. 2.2-2: Der Kehlkopf. Links: Spiegelbild, rechts: Querschnitt oberhalb der Stimmlippen (schema‐ tisch) (Fiukowski 8 2010: 36). Abb. 2.2-3: a) Glottis mit Stimmlippen (nach Schwegler et al. 4 2010: 136), b) Momentaufnahmen der Glottis während der Phonation (http: / / www.fb10.uni-bremen.de/ khwagner/ phonetik/ kapitel4.aspx), c) schematische Darstellung eines Phonationszyklus. 2.2 Artikulatorische Phonetik 43 <?page no="44"?> 10 Eine mit behauchter Stimme gesprochene Äußerung ist auf der folgenden Internetseite anzuhören: http: / / www.ims.uni-stuttgart.de/ phonetik/ EGG/ breathy.wav. 11 Auch durch die Position des Kehlkopfes, der auf und ab bewegt werden kann, wird die Länge des Ansatzrohres ständig verändert. Durch die Sprengung des Glottisverschlusses kann ein Geräusch erzeugt werden, wie es in verstärkter Form beim Husten auftritt. Die ‘Normalform’, der sog. Glottisschlag oder Knacklaut (sp. oclusión glotal) [ʔ], ist als Sprachlaut verbreitet, so etwa im Deutschen, wo er für gewöhnlich jedes vokalisch anlautende Wort einleitet (z. B. dt. [ ˈ ʔabənt]/ [ ˈ ʔabm̩t] Abend). Ein Hauchlaut (sp. sonido aspirado) [h] entsteht, wenn sich die ausströmende Luft an den nicht völlig geöffneten Stimmlippen reibt. Wird während der Phonation zu viel Luft durch die Glottis gelassen, so klingt die Stimme insgesamt behaucht. 10 Als Aspiration (sp. aspiración) wird die behauchte Produktion bestimmter Lautpha‐ sen durch eine (noch) nicht schwingende teilgeöffnete Glottis bezeichnet (wie z. B. bei den Plosiven in dt. [t h aːl] Tal, [p h as] Pass, [k h am] Kamm, vgl. 2.5.1.1). Glottisschlag und Behauchung von Plosiven sind im Spanischen nicht vertreten. Ihre Vermeidung muss von deutschen Muttersprachlern bewusst erlernt werden. Eine besondere Stimmlippenstellung ermöglicht schließlich das Flüstern, bei dem die Stimmlippen geschlossen sind und die Luft nur durch das sog. Flüsterdreieck der Stellknorpel entweichen kann: Flüstern ist immer stimmlos. Abb. 2.2-4: Stellungen der Stimmlippen (Formen der Stimmritze): a) Vitalatmungs- oder Ruhestellung, b) weite Atemstellung, c) Hauchstellung, d) Stimmstellung, e) Vollverschlussstellung, f) Flüsterstellung (nach Fiukowski 8 2010: 37). Die eigentliche Artikulation geschieht supraglottal (also oberhalb der Glottis) im sog. Ansatzrohr (sp. tracto vocal), das vom Kehlkopf bis zu den Lippen reicht und Rachenraum (sp. faringe; Adj. pharyngal), Mundraum (sp. cavidad bucal; Adj. oral) und Nasenraum (sp. cavidad nasal; Adj. nasal) umfasst. Hier wird der vom Kehlkopf kommende Rohschall durch den Einsatz der verschiedenen Sprechwerkzeuge oder Artikulatoren moduliert und modifiziert (vgl. Abb. 2.2-5). 11 44 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="45"?> 2.2.2 Artikulatoren und Artikulationsstellen Als Artikulatoren werden die beweglichen Teile des Ansatzrohres bezeichnet, durch die dessen Form verändert wird, sodass an verschiedenen (Artikulations-)Stellen Enge- oder Verschlussbildungen erfolgen können. Zu den Artikulatoren zählen: • Das Velum, auch Gaumensegel (sp. velo de paladar) oder weicher Gaumen (sp. paladar blando) genannt, schließt sich als dünner Lappen hinten an den harten Gaumen an. In normaler Sprechstellung ist es angehoben und verschließt so den Nasenraum gegenüber dem Mundraum. Nur zur Bildung von nasalen (oder nasalisierten) Lauten wird es abgesenkt, sodass der aus dem Kehlkopf kommende Luftstrom (auch) durch die Nasenhöhle entweichen kann, z. B. [n], [m], fr. [ ɑ̃ ]. • Die Uvula (oder Zäpfchen, sp. úvula) hängt als muskulöser Fortsatz am Velum und dient als artikulierendes Organ zur Bildung uvularer Laute, z. B. [ʀ]. • Die Zunge (lat. LIN G UA , sp. lengua), die im Wesentlichen aus hoch beweglichem Muskelgewebe besteht, ermöglicht als wichtigster Artikulator durch zahlreiche unterschiedliche Positionen eine vielfältige Gestaltung des Mundraums. Ihre obere Fläche wird zu Beschreibungszwecken von vorn nach hinten unterteilt in Zungenspitze (lat. A P E X > Adj. apikal, sp. ápice), Zungenblatt (lat. LAMINA > Adj. laminal, sp. lámina), Zungenrücken (lat. DO R S UM > Adj. dorsal, sp. dorso) und Zungenwurzel (lat. R ADIX ). Zungenspitze und -blatt werden oft als Zungenkranz oder -saum (lat. C O R O NA > Adj. koronal, sp. corona) zusammengefasst. • Auch durch die Hebung und Senkung des Unterkiefers (lat. MANDIB ULA , sp. mandíbula) wird das Ansatzrohr in seiner Größe verändert. • Die Lippen (lat. LABIA (Pl.) > Adj. labial, sp. labios) schließlich dienen sowohl zur Verlängerung bzw. Verkürzung des Ansatzrohres als auch zur Bildung von Hindernissen für den Luftstrom. 2.2 Artikulatorische Phonetik 45 <?page no="46"?> Abb. 2.2-5: Die Sprechwerkzeuge: Sagittalschnitt durch Kehlkopf und Ansatzrohr. Als Artikulationsstellen werden die eher fixen Strukturen des Ansatzrohres bezeich‐ net: • Außer als Artikulator für nasale Laute dient das Velum auch als Artikulations‐ stelle, an der mittels Zunge als Artikulator velare Laute gebildet werden, z. B. [k]. • Am Palatum, dem harten Gaumen (lat. P ALATUM , Adj. palatal, sp. paladar duro), der sich vor dem Velum wölbt, werden - wiederum mit Hilfe der Zunge - palatale Laute gebildet, z. B. [ç] (wie in dt. [ɪç] ich oder [çe ˈ miː] Chemie). • Die Alveolen (oder Zahndamm > Adj. alveolar, sp. alvéolos) befinden sich am Übergang vom harten Gaumen zu den oberen Schneidezähnen. An ihnen entstehen - ebenfalls mit der Zunge als Artikulator - alveolare Laute, z. B. [d]. • Die oberen Schneidezähne (lat. D E NT E S (Pl.) > Adj. dental, sp. dientes) können sowohl in Kontakt mit der Zunge als auch mit der Unterlippe als Artikulationsstelle fungieren. Die so gebildeten dentalen Laute lassen sich als labiodentale und (inter-)dentale weiter beschreiben, z. B. [f], [θ] (wie in engl. [θɛft] theft ‘Diebstahl’ oder kast. [ ˈ θine] cine ‘Kino’, vgl. 2.5.1.2). Wenn [d] und [t] weit vorne an den 46 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="47"?> Schneidezähnen produziert werden, wie es im Spanischen der Fall ist (Martínez Celdrán et al. 2003: 257, Hualde 2005: 47), werden auch sie zu den (apiko)dentalen Lauten gezählt. Dies kann man mit dem IPA-Diakritikon [ ̪] deutlich machen, z. B. [d̪ ]. • Im Zusammenspiel der Oberlippe mit der Unterlippe entstehen (bi-)labiale Laute, z. B. [p]. Unter https: / / soundsofspeech.uiowa.edu/ spanish bzw. https: / / soundsofspeech.uiowa.e du/ german kann die Anatomie der Artikulation einzelner Laute durch Klicken auf die jeweiligen IPA-Symbole in interaktiven Diagrammen nachvollzogen werden. 2.2.3 Artikulationsmodi: Vokale, Konsonanten, Approximanten Als Artikulationsmodus wird die Art und Weise der Schallproduktion bzw. -modifi‐ kation im Ansatzrohr bezeichnet. Die Namen der einzelnen Modi dienen zugleich als Oberbegriff zur Zusammenfassung der in ihnen produzierten Laute. 2.2.3.1 Vokalische Artikulationsmodi Bei der Phonation versetzt der von den Lungen kommende Luftstrom die Stimmlippen in Schwingungen und wird dabei zu komplexen Druckwellen umgestaltet. Können diese nach Verlassen des Kehlkopfes den Rachen- und Mundraum ohne weitere Be‐ hinderung passieren, so erscheinen die entsprechenden Schallereignisse als Vokale (sp. vocales). Diese erhalten ihre spezifische Klangfärbung allein durch die jeweilige Konfiguration des Ansatzrohres, das als Resonanzraum dient. Entscheidend sind hier die folgenden Parameter: • Hebung der Zunge bzw. Grad der Kieferöffnung (vertikal): hoch, mittel, tief bzw. geschlossen, halb geschlossen, halb offen, offen. [i] ist ein hoher (oder geschlossener), [a] ein tiefer (oder offener) Vokal. • Lage der Zunge bzw. des höchsten Zungenpunktes (horizontal): vorn (bzw. palatal), zentral, hinten (bzw. velar). [i] ist ein vorderer, [ə] (wie in dt. [ ˈ bıtə] bitte) ein zentraler, [u] ein hinterer Vokal. • Stellung der Lippen: gerundet (bzw. vorgestülpt) vs. ungerundet (bzw. ge‐ spreizt). [u] ist ein gerundeter, [i] ein ungerundeter Vokal. • Stellung des Velums: Wird durch die Senkung des Velums auch die Nasenhöhle als Resonanzraum miteinbezogen, so entstehen nasalisierte oder Nasalvokale, bei gehobenem Velum und damit Verschluss des Nasenraums Oralvokale. [ɛ̃] (wie in fr. [mɛ̃] main ‘Hand’) ist ein Nasal-, [ɛ] (wie in fr. [mɛ] mais ‘aber’) ein Oralvokal. • Grad der Muskelspannung: Vokale können mit mehr oder weniger Muskel‐ spannung artikuliert werden und gelten entsprechend als gespannt gegenüber ungespannt. [i] (wie in dt. [ ˈ biːtə] biete) ist ein gespannter, [ı] (wie in dt. [ ˈ bıtə] bitte) ein ungespannter Vokal. 2.2 Artikulatorische Phonetik 47 <?page no="48"?> 12 Da bei der Artikulation von Nasalen oral ein Verschluss gebildet wird, werden Nasale mit Plosiven und Affrikaten auch zur Klasse der Verschlusslaute gerechnet. • Dauer bzw. Quantität: lang vs. kurz. [aː] (wie in dt. [ ˈ ʁaːtə] Rate) ist ein langer, [a] (wie in dt. [ ˈ ʁatə] Ratte) ein kurzer Vokal. Abb. 2.2-6: Parameter der Vokalartikulation. Gehen zwei Vokalstellungen in einer Silbe artikulatorisch unmittelbar ineinander über, so wird der betreffende Laut als Diphthong (sp. diptongo) bezeichnet (vgl. 2.5.3.2). 2.2.3.2 Konsonantische Artikulationsmodi Kommt es im Ansatzrohr zu irgendwie gearteten Behinderungen des Luftstroms, so ist der Artikulationsmodus konsonantisch, es werden also Konsonanten (sp. consonantes) produziert. Innerhalb der Konsonanten werden die folgenden Artikulati‐ onsmodi unterschieden: • Verschluss zwischen Artikulator und Artikulationsstelle: Durch einen bei der Artikulation zu sprengenden Verschluss entstehen Verschlussbzw. Spreng‐ laute oder Plosive (sp. oclusivas), z. B. [k]. • Engpass zwischen Artikulator und Artikulationsstelle: Muss der Luftstrom auf seinem Weg durch Rachen- und Mundraum einen Engpass durchlaufen, so entsteht beim Passieren dieser Stelle ein Reibegeräusch, wie es für Reibelaute oder Frikative (sp. fricativas) charakteristisch ist, z. B. [f]. • Abfolge von Verschluss und Engpass: Geht ein Verschluss unmittelbar in einen Engpass über, sodass Plosiv und Frikativ zeitlich eng miteinander koordiniert sind, entstehen sog. Affrikaten (sp. africadas), z. B. [ʧ]. • Verschluss im Mundraum bei Zuschaltung des Nasenraums: Wird der Durchgang zum Nasenraum durch Senken des Velums freigegeben, sodass der Verschluss im Mundraum nicht wie bei den Plosiven gesprengt werden muss, son‐ dern die Luft durch die Nase entweichen kann, bezeichnen wir die entsprechenden Laute als Nasale (sp. nasales), z. B. [n]. 12 48 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="49"?> 13 Da r-Laute nicht alle durch einen raschen Wechsel zwischen Verschluss und Öffnung charakterisiert sind, sie aber dennoch ähnliches Verhalten aufweisen, werden sie nach dem griechischen r-Buchsta‐ ben <ρ> rho auch als rhotische Laute (engl. rhotics, sp. (consonantes) róticas) bezeichnet. 14 Da der Luftstrom bei den Lateralen den Mundraum weitgehend ungehindert passieren kann, werden sie auch (als Lateralapproximanten) den Approximanten (vgl. 2.2.3.3) zugeschlagen. • Wechsel zwischen Verschluss und Öffnung: Ein rascher Wechsel zwischen Verschluss und Öffnung ist charakteristisch für Vibranten (sp. vibrantes), zu denen vor allem r-Laute gehören. 13 Ein Vibrant entsteht bspw., wenn die Zungenspitze gegen die Alveolen oder die Uvula gegen die Hinterzunge vibriert: [r] bzw. [ʀ]. • Gleichzeitigkeit von Verschluss und Öffnung (im Mundraum): Wird mit der Zunge mittig an den Alveolen oder am harten Gaumen ein Verschluss gebildet, sodass die Luft an der Seite vorbeiströmen kann, entstehen Laterale (sp. laterales), z. B. [l]. 14 Innerhalb der Konsonanten lassen sich weitere Gruppierungen vornehmen: • Frikative, Plosive und Affrikaten bilden gemeinsam die Klasse der echten Konsonanten oder Obstruenten (sp. obstruyentes), denn bei ihrer Artikulation muss ein tatsächliches Hindernis, eine Obstruktion, überwunden werden. Sie zeichnen sich auch dadurch aus, dass sie entweder stimmlos (sp. sordo), d. h. ohne Beteiligung der Stimmlippen, oder stimmhaft (sp. sonoro), also mit vibrierenden Stimmlippen artikuliert werden können, z. B. [p] vs. [b]. • Alle anderen Sprachlaute gehören zur Klasse der Sonoranten (sp. sonorantes, resonantes), denn die Unterscheidung zwischen stimmlos und stimmhaft ist für sie nicht relevant. Sie zeichnen sich vielmehr durch sog. spontane Stimmhaftigkeit aus, da bei ihrer Artikulation die Stimmlippen immer vibrieren. • Da Laterale und Vibranten oft ein ähnliches Verhalten aufweisen, werden sie zur Gruppe der Liquide (‘Fließlaute’, sp. líquidas) zusammengefasst. 2.2.3.3 Approximanten An der Schwelle zwischen Konsonanten und Vokalen stehen die Approximanten, die auch als Halbkonsonanten, Halbvokale oder Gleitlaute bezeichnet werden (engl. glides, sp. aproximantes, semiconsonantes, semivocales, deslizadas). Sie nehmen eine Zwischenposition zwischen vokalischem und frikativischem Modus ein: Die Zunge wird weiter angehoben als für den entsprechenden Vokal, doch diese Engebildung erfolgt ohne die für Frikative typische Geräuschbildung, z. B. [j]. 2.2.4 Koartikulation Wenn wir im Vorangegangenen dargestellt haben, wie Sprachlaute an diversen Arti‐ kulationsstellen und in unterschiedlichen Artikulationsmodi produziert werden, so darf daraus nicht geschlossen werden, dass die beschriebenen Produktionsphasen 2.2 Artikulatorische Phonetik 49 <?page no="50"?> 15 Diese Bewegungen lassen sich sehr gut in Sprechaufnahmen mit dem Verfahren der Magnetreso‐ nanztomographie (MRT, auch Kernspintomographie) beobachten. Ein Beispiel findet sich unter https: / / www.youtube.com/ watch? v=6dAEE7FYQfc. 16 Zur Koartikulation vgl. Fowler & Saltzman (1993) sowie die Arbeiten in Hardcastle & Hewlett (1999) und Pompino-Marschall ( 3 2009: 237ff.). beim Sprechen eine nach der anderen und unabhängig voneinander ablaufen würden. Wie eingangs bereits angemerkt (vgl. 1.3 und 2.1), werden Laute keineswegs einzeln aneinandergereiht. Lautliche Äußerungen sind vielmehr kontinuierlich; die Phone, die wir für unsere Analysen aus dem Lautstrom isolieren, sind keine diskreten Lautereignisse, sondern nachträglich ausgegrenzte Momente eines fortwährenden Bewegungsablaufs, in dem es keine konstanten Abschnitte gibt. Die Bewegungen unserer Sprechwerkzeuge sind bei der Produktion der einzelnen Lautphasen so eng miteinander koordiniert, dass diese sich gegenseitig überlappen bzw. unmittelbar in‐ einander übergehen. 15 In der Phonetik wird dies als Koartikulation (sp. coarticulación) bezeichnet, letzteres auch als Steuerung (Pompino-Marschall 3 2009: 237ff.). Unter Koartikulation versteht man die gegenseitige Beeinflussung lautlicher Segmente, wie sie durch die gleichzeitige Ausführung von Artikulationsbewegun‐ gen für benachbarte Sprachlaute verursacht wird. Verzahnung und Überlappung artikulatorischer Gesten lassen sich leicht an der Aussprache des deutschen Worts [ɡlʏk] Glück (im Vergleich etwa zu [ɡast] Gast) nachvollziehen: • Die für [ɡ], [l] und [k] irrelevante Lippenrundung des Vokals [ʏ] ist schon während des [ɡ]-Verschlusses präsent und wird bis zum Ende des Wortes beibehalten. • Die Öffnung des velaren Verschlusses [ɡ] erfolgt in den bereits vorher gebildeten Lateral [l]. • Aus der für [ʏ] typischen hohen Vorderlage bewegt sich der Zungenrücken kontinuierlich in Richtung des velaren Verschlusses [k]. • [k] ‘steuert’ [ʏ]: Der Verschluss löst den Vokal in seiner kritischen Position ab. Durch Koartikulation können Artikulationsgesten also antizipatorisch vorweggenommen werden (‘regressive Koartikulation’) und/ oder persistent über das eigentliche Ziel hinaus erhalten bleiben (‘progressive Koartikulation’). Koartikula‐ tionseffekte werden nicht nur durch die lautliche Umgebung bedingt, sondern sie hängen auch von der jeweiligen Sprache, der Kommunikationssituation, der Sprech‐ geschwindigkeit und vom einzelnen Sprecher ab. In der Sprachentwicklung führen sie immer wieder zu Assimilationen, d. h. zur Angleichung zwischen benachbarten Segmenten. 16 50 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="51"?> 17 Dieses Teilkapitel folgt über weite Strecken den Ausführungen in Reetz (2003: 3ff.) und Mayer (2010: 73ff.), die hier allerdings für unsere Zwecke stark vereinfacht werden. 2.3 Akustische Phonetik Die akustische Phonetik untersucht die physikalischen Vorgänge bei der Pro‐ duktion und Übertragung von Sprachschall. In diesem Unterkapitel werden wir uns mit einigen Aspekten der akustischen Phonetik befassen. Dazu fragen wir, was Schallwellen sind und welche Typen akustischer (Sprach-)Signale wir unterscheiden (2.3.1). Wir beschäftigen uns mit grundlegenden akustischen Analysen und untersuchen in diesem Zusammenhang, wie Schallwellen digitalisiert werden (2.3.2). Im Rahmen einer kleinen Einführung in die Benutzung der Sprachanalysesoftware Praat (Boersma & Weenink 2023) erproben wir schließlich, wie wir Oszillogramme und Sonagramme selbst erstellen und auswerten können (2.3.3). 17 2.3.1 Sprachschall Schall ist die auditive Wahrnehmung minimaler Luftdruckschwankungen, die sich wellenförmig im Raum ausbreiten. Solche Schallwellen entstehen, wenn elasti‐ sche Körper in Schwingungen versetzt werden: Die dadurch angeregten Luftmoleküle bewegen sich den Schwingungen entsprechend hin und her, wobei sie benachbarte Luftmoleküle ebenfalls in Bewegung versetzen, sodass der Schalldruck sich ausbreitet - vergleichbar den Wellenbewegungen, die von einer Reihe schunkelnder Menschen ausgelöst werden. Im Fall lautsprachlicher Äußerungen entstehen die Schallwellen durch die Schwingungen der Stimmlippen und des Ansatzrohrs. 2.3.1.1 Parameter der Schallanalyse Um Schall zu untersuchen, muss man ihn mit geeigneten technischen Einrichtungen messen. Das kann beispielsweise ein Mikrofon sein, das Luftdruckschwankungen in elektrische Signale umwandelt. Bei einem Mikrofon spannt sich eine flexible Membran über einem quasi luftdicht abgeschlossenen Raum (vgl. Abb. 2.3-1a). Entsprechend den eintreffenden Schallwellen verbiegt sich diese Membran, und zwar bei höherem Druck in den abgeschlossenen Raum hinein (b), bei niedrigerem Druck nach außen (c). Befestigt man an der Mitte der Membran einen Stift (d) und lässt ein Papierband gleichmäßig schnell an diesem Stift vorbeilaufen, so werden die Schwingungen auf dem Papier abgebildet (e). Auf diese Weise erhalten wir eine vertikale Darstellung des Schalldrucks gegen die Zeit; das akustische Ereignis wird sichtbar gemacht. Ein solches Bild eines Schwingungsvorgangs nennen wir Oszillogramm (sp. oscilograma). 2.3 Akustische Phonetik 51 <?page no="52"?> Abb. 2.3-1: Messen und Aufzeichnen von Schallwellen mithilfe eines Mikrofons (nach Reetz 2003: 11). Ein wichtiger Parameter zur Analyse von Sprachschall ist die Häufigkeit der Schwin‐ gungen auf der Zeitachse, also die Häufigkeit der Verdichtung und Verdünnung der Luft. Sie bezeichnet man als Frequenz (sp. frecuencia). Die Frequenz wird in Hertz (Hz) gemessen; das Maß gibt die Zahl der Schwingungszyklen pro Sekunde an. Je schneller ein Körper schwingt, desto höher ist die Frequenz des Tones, und er wird auch als höher wahrgenommen; je langsamer die Schwingungen, desto niedriger die Frequenz und desto tiefer erscheint der Ton. Die für das menschliche Ohr wahrnehmbaren Frequenzen liegen zwischen 20 und 20.000 Hz (= 20 kHz). Sie bilden das hörbare Frequenzband. Die Intensität (sp. intensidad) eines Tons wird durch die Weite der Schwingung, durch ihre Amplitude, bestimmt. Bei einer großen Amplitude hören wir einen intensiven, lauten Ton, bei einer kleinen Amplitude einen schwachen, leisen Ton. Gemessen wird die Intensität in Dezibel (dB, sp. decibel). Im mittleren Frequenzbereich (ca. 500-5.000 Hz) beträgt der Abstand von der Hörschwelle bis zur Schmerzgrenze ca. 130 dB. 2.3.1.2 Grundschallformen Die einfachste Schallform ist der reine (Sinus-)Ton, eine mit einer Pendelbewegung vergleichbare, einfache periodische Schwingung (Abb. 2.3-2). Periodische Schwin‐ gungen zeichnen sich durch ihren regelmäßigen Verlauf aus, d. h., sie wiederholen sich kontinuierlich mit exakt derselben Dauer. In der Praxis nimmt die Energie jedoch durch Faktoren wie Reibung und Luftwiderstand ab, sodass die Amplitude mit der Zeit kleiner wird. 52 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="53"?> 18 Benannt nach dem französischen Mathematiker Joseph Fourier (1768-1830). Abb. 2.3-2: Einfache Sinusschwingung auf der Zeitachse (nach Reetz 2003: 13). Reine Töne begegnen uns allerdings nur selten. Die meisten Schallquellen - und so auch der menschliche Stimmapparat - führen keine einfachen, sondern komplexe Schwin‐ gungen verschiedener Frequenzen aus, die in Klänge und Geräusche differenziert werden. Sind die komplexen Schwingungen (quasi-)periodisch, so verschmelzen sie zu Klängen oder Klangphasen, die sich mithilfe der Fourier-Analyse 18 in arithmetisch aufgebaute Teil- oder Partialtöne zerlegen lassen. Als Grundfrequenz oder F 0 (sp. frecuencia fundamental) bezeichnen wir die Frequenz des tiefsten Partialtons, durch die die Höhe des Signals bestimmt wird (bei Männern meist zwischen 80 und 200 Hz, bei Frauen zwischen 150 und 300 Hz). Die Frequenzen aller übrigen Partial- oder Obertöne (auch: Harmonische, sp. armónicos) sind jeweils ganzzahlige Vielfache von F 0 . Abb. 2.3-3 zeigt in a) die komplexe periodische Schwingung eines Klangs, die in b), c) und d) in ihre Einzelschwingungen zerlegt ist. Die Periodendauer des 100-Hz-Signals in b) beträgt mit 10 ms ein ganzzahliges Vielfaches des 200-Hz-Signals (5 ms) in c) und des 300-Hz-Signals (3,3̅ ms) in d). Das Summensignal a) hat die Periodendauer des kleinsten gemeinsamen Vielfachen von 3,3̅ ms, 5 ms und 10 ms, also 10 ms. Die Grundfrequenz F 0 des Klangs in a) beträgt folglich 100 Hz. 2.3 Akustische Phonetik 53 <?page no="54"?> Abb. 2.3-3: Summe (a) eines 100-Hz- (b), 200-Hz- (c) und 300-Hz-Sinussignals (d); nach Clark et al. ( 3 2007: 214). Auch wenn unsere Stimmlippen schwingen, entstehen derartige Klangphasen. Da ihre Perioden sich nur in annähernd gleicher Form wiederholen, sprechen wir von quasi-periodischen Schwingungen (sp. vibraciones casi-periódicas). Sie sind kenn‐ zeichnend für die Artikulation von Vokalen, Approximanten und Nasalen. Abb. 2.3-4 zeigt die komplexen Schwingungen der Lautfolge [ma] in [ ˈ masa] masa. Abb. 2.3-4: Oszillogramm der Lautfolge [ma] in [ ˈ masa] masa. Außer quasi-periodischen Klangphasen werden beim Sprechen Geräuschphasen produziert, die durch aperiodische Schwingungen (sp. vibraciones aperiódicas) gekennzeichnet sind; hier lassen sich keine arithmetischen Relationen zwischen den 54 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="55"?> einzelnen Schwingungsbestandteilen ausmachen. Zu den Geräuschphasen gehört das Friktionsrauschen, das immer dann entsteht, wenn die Luft, wie bei Frikativen, durch eine Engebildung strömt. Abb. 2.3-5 zeigt das Oszillogramm einer solchen Geräuschphase (Frikativ [s] in [ ˈ masa] masa). Abb. 2.3-5: Oszillogramm des Frikativs [s] in [ ˈ masa] masa. Zu den übrigen Grundschallformen, die sich im Sprachsignal unterscheiden lassen, gehört der Explosionsschall (auch Transiente oder Knall, sp. explosión), der bei der Sprengung eines oralen oder glottalen Verschlusses (also bei der Artikulation von Plosiven) entsteht; ihm folgt unmittelbar nach der Verschlusslösung ein kurzes Friktionsrauschen. Während der Verschlussphase sind Plosive dagegen durch sog. stummen Schall charakterisiert. Eine Kombination von Klang und Friktionsrauschen ergibt sich bei stimmhaften Frikativen, da hier die Stimmlippen zugleich vibrieren (vgl. Abb. 2.3-6, Mayer 2010: 79, Reetz 2003: 64). Abb. 2.3-6: Oszillogramm der Lautfolge [ ˈ vatə] in dt. Krawatte. 2.3 Akustische Phonetik 55 <?page no="56"?> 2.3.1.3 Spektren Wir können jetzt verschiedene Schallformen nicht nur artikulatorisch (und perzeptiv), sondern mithilfe der oszillographischen Aufzeichnungen auch anhand akustischer Eigenschaften voneinander unterscheiden. Für andere Analysen sind Oszillogramme allerdings weniger geeignet. So können wir uns die akustischen Unterschiede zwischen verschiedenen Vokalen besser vergegenwärtigen, wenn wir die Schallwellen spektral auflösen. Wir haben oben schon gesehen, dass sich komplexe periodische Klänge mit‐ hilfe der Fourier-Analyse in einzelne Sinuskomponenten oder Harmonische zerlegen lassen (Abb. 2.3-3). Für die Darstellung in einem sog. (Linien-)Spektrum werden die in der Fourier-Analyse ermittelten Frequenzwerte der einzelnen Harmonischen durch Linien auf der horizontalen x-Achse abgetragen, die Amplitudenwerte sind auf der vertikalen y-Achse angezeigt. Abb. 2.3-7 zeigt das Linienspektrum der komplexen periodischen Schwingung aus Abb. 2.3-3. Abb. 2.3-7: Linienspektrum des Klangs a) aus Abb. 2.3-3 (nach Clark et al. 3 2007: 225). Wir wissen bereits, dass bei der Phonation durch das Vibrieren der Stimmlippen quasi-periodische Luftdruckschwankungen entstehen. Der Hohlraum zwischen Glottis und Lippen, das sog. Ansatzrohr, wirkt nun als akustisches Filter (fachsprachlich neutrum), durch das die meisten Frequenzen des Quell- oder Rohschallsignals ge‐ dämpft, bestimmte Frequenzbereiche jedoch selektiv verstärkt werden. Dies sind die sog. Eigen- oder Resonanzfrequenzen des Ansatzrohrs. Wo sie genau liegen, hängt von dessen Gestaltung ab: Wie in 2.2.3 behandelt, verändern wir durch die Bewegung von Zunge, Kiefer, Lippen etc. die Konstellationen von Mund- und Rachenraum laufend, und entsprechend variiert auch die Filterwirkung dieser Räume, sodass jeweils andere Frequenzbereiche verstärkt werden. Diese variablen Resonanz- oder Eigenfrequenzen des Vokaltrakts heißen Formanten. Sie geben der Stimme ihr Timbre oder ihre Klangfarbe. Die Position der Formanten, die im Linienspektrum durch (Energie-)Gipfel in der Amplitude, die sog. Maxima, gekennzeichnet ist, liefert das entscheidende Kriterium zur akustischen Differenzierung von Vokalen. Außer 56 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="57"?> Vokalen weisen auch Nasale und Liquide eine charakteristische Formantstruktur auf. In Abb. 2.3-8 sind diese Zusammenhänge im Rahmen des auf Fant (1960) zurückgehenden Quelle-Filter-Modells dargestellt. Mit den Formanten werden wir uns in 2.3.2 genauer befassen. Abb. 2.3-8: Schematische Darstellung der Veränderungen im Spektrum durch die Filterwirkung des Ansatzrohrs (Mayer 2010: 84). Auch aperiodische Schwingungen lassen sich spektral auflösen. Sie bilden jedoch keine Linien-, sondern kontinuierliche (Geräusch-)Spektren, denn ihre Frequenz‐ komponenten liegen so dicht beieinander, dass sie nicht als einzelne Linien dargestellt werden können. Abb. 2.3-9 zeigt (nach Mayer 2010: 78) Spektren der Frikative [ʃ] und [s]. Wie zu erkennen ist, sind bei [ʃ] die Frequenzen zwischen 2 kHz und 4 kHz (hier grau unterlegt) stärker vertreten, denn die Amplitude ist in diesem Frequenzbereich bei [ʃ] deutlich größer als bei [s] - ein typisches Charakteristikum, durch das sich postalveolare und alveolare Frikative voneinander unterscheiden. 2.3 Akustische Phonetik 57 <?page no="58"?> 19 Eine vergleichbare Frage stellt sich bei der Darstellung der Zeit durch digitale gegenüber analogen Uhren: Während eine analoge Uhr den Zeitverlauf kontinuierlich nachbildet, kann eine digitale Uhr immer nur diskrete, d. h. einzelne, nicht zusammenhängende Zeitschritte angeben, gleich ob sie die Zeit in Stunden, Minuten, Sekunden, Millisekunden oder noch genauer misst. Abb. 2.3-9: Spektraldarstellung der Frikative [ʃ] (oben) und [s] (unten) (nach Mayer 2010: 78). 2.3.2 Grundlagen akustischer Analysen Während man für phonetische Analysen früher teure Spezialgeräte brauchte, lassen sich die meisten heute am Computer durchführen. Dazu muss das Sprachsignal jedoch zunächst einmal digitalisiert werden. 2.3.2.1 Zur Digitalisierung von Sprachsignalen Der simple Schwingungsschreiber, den wir in Abb. 2.3-1e kennengelernt haben, zeichnet die Schwingungen des Sinustons analog, also ihrem Verlauf gemäß, auf. Computer, wie sie heute für akustische Analysen verwendet werden, können al‐ lerdings nur endlich viele diskrete Zustände darstellen. Daher muss das analoge, kontinuierliche Signal, wie es vom menschlichen Sprechapparat erzeugt wird, in abzählbare digitale Werte überführt werden. Luftdruckwerte werden also zu dis‐ kreten Zeitpunkten in diskrete Zahlenwerte übersetzt. Dabei stellt sich die Frage, wie häufig das Signal gemessen oder abgetastet werden sollte, also welche Mess- oder Abtastrate (engl. sampling rate) sinnvollerweise benutzt wird. 19 Soll das Signal möglichst detailgetreu repräsentiert werden, so empfiehlt sich eine hohe Abtastrate, die jedoch viel Speicherplatz benötigt. Als Faustregel gilt, dass die Abtastrate mindestens 58 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="59"?> 20 Wie die Häufigkeit der Schwingungen berechnet sich auch die Abtastrate (als Anzahl sich wieder‐ holender Vorgänge, d. h. Messpunkte bzw. Abtastintervalle) in der Einheit Hertz. Diese steht hier also für die Anzahl der Abtastintervalle pro Sekunde. 21 Die sampling rate für CDs beträgt bspw. 44,1 kHz. Da die für die akustischen Eigenschaften von Sprachlauten relevante Bandbreite etwa von 50 Hz bis 10 kHz reicht, ist für phonetische Analysen eine Abtastrate von 22 kHz empfehlenswert. Für das Telefon, das nur Frequenzen bis 4 kHz überträgt, begnügt man sich mit einer Abtastrate von 8 kHz. Aus der Beschränkung auf diesen Frequenzbereich resultiert die schlechtere Qualität der Telefonsignale. 22 Genauer gesagt handelt es sich um die Fast Fourier Transformation (FFT), einen Algorithmus, der die Fourier-Analyse diskreter Signale besonders effizient implementiert (Mayer 2010: 91). etwas mehr als das Doppelte der höchsten auftretenden Frequenz betragen sollte. 20 Da das menschliche Gehör Frequenzen über 20 kHz nicht wahrnehmen kann, wird, wenn alle Frequenzkomponenten bis zur Wahrnehmungsgrenze im digitalen Signal repräsentiert sein sollen, eine Abtastrate von ca. 40 kHz gewählt. 21 Auch die Fourier-Analyse wird heute von Computerprogrammen mit digitalisierten Aufnahmen durchgeführt. 22 Während bei den Spektren, die wir bisher betrachtet haben, der Faktor Zeit ausgeklammert ist, wir also eine statische Darstellung erhalten, werden im Spektrogramm (auch Sonagramm, sp. espectrograma) mehrere Spektren anein‐ andergereiht und damit ein längerer Signalabschnitt in seine Frequenzbestandteile aufgelöst; wir können so beobachten, wie sich das Signal im Zeitverlauf verändert. Dabei gilt es, drei Dimensionen, nämlich Zeit, Frequenz und Amplitude, in einer zweidimensionalen Graphik unterzubringen. Die Zeit wird, wie im Oszillogramm, auf der x-Achse von links nach rechts abgetragen, während die Frequenzwerte auf der y-Achse von unten nach oben ‘hochgestapelt’ werden. Die Amplitudenwerte schließlich sind durch Graustufen repräsentiert: Je höher die Amplitude, desto dunkler (bis zu tiefem Schwarz) erscheint der entsprechende Grauton; je geringer die Amplitude, desto heller ist er. Zwischen der Frequenzauflösung und der zeitlichen Auflösung besteht im Spektrogramm ein gegenseitiges Abhängigkeitsverhältnis. Je kürzer die Signal‐ abschnitte, die der spektralen Analyse unterzogen werden, desto feiner wird die zeitliche Auflösung, und die artikulatorische Dynamik im Signal wird sichtbar. Die Frequenzauflösung ist in einem solchen Breitbandspektrogramm jedoch gröber, da dem Umwandlungsalgorithmus in den kurzen Abschnitten weniger Analysepunkte zur Verfügung stehen. Wählt man dagegen größere Signalabschnitte für die spektrale Analyse, so gibt es zwar genug Informationen, um die Frequenzen fein aufzulösen, doch die dynamischen Aspekte gehen im sog. Schmalbandspektrogramm verloren: Die zeitliche Auflösung wird ungenau. 2.3.2.2 Zur Auswertung von Spektrogrammen Abb. 2.3-10 zeigt in a) ein Breitbandspektrogramm der Frage ¿Tiene mandarinas? Die Transkriptionszeichen sind den entsprechenden Signalabschnitten näherungsweise zugeordnet. Bei der Segmentierung wird deutlich, dass beim Sprechen nicht einzelne, 2.3 Akustische Phonetik 59 <?page no="60"?> 23 Diesen Schließungen entspricht jeweils ein weiter Ausschlag im Oszillogramm (vgl. auch Abb. 2.3-13). unveränderliche Laute aneinandergereiht werden, sondern dass diese aufgrund der Koartikulation (vgl. 2.2.4) ineinander übergehen und sich kontinuierlich verändern, sodass eine exakte Abgrenzung oft nicht möglich ist. Abb. 2.3-10: a) Breitbandspektrogramm, b) Schmalbandspektrogramm und c) Schmalbandspektro‐ gramm im Bereich 50-300 Hz der Frage ¿Tiene mandarinas? Die Fenstergröße (engl. window length), also die Länge des jeweils analysierten Signalstücks, beträgt beim Breitbandspektrogramm in Abb. 2.3-10a 5 ms (bei einer Abtastrate von 48 kHz). Die zeitliche Auflösung ist hier sehr fein, sodass in den stimmhaften Abschnitten jede Schließung der Stimmlippen eine senkrechte Linie erzeugt. 23 Die harmonischen Strukturen dagegen verschmelzen, und es werden nur größere Energiekonzentrationen sichtbar. Dies sind - wiederum in den stimmhaften Abschnitten - die durch die verstärkten Resonanzfrequenzen bedingten Formanten, die als Bereiche stärkster Schwärzung gut zu erkennen sind. Jeder Sonorant hat mehrere solcher Formanten, die, mit der niedrigsten Frequenz beginnend, als F 1 , F 2 usw. durchnummeriert werden. Für die Beschreibung der Qualität von Vokalen sind vor allem die beiden untersten Formanten, also F 1 und F 2 , ein Stück weit auch F 3 , 60 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="61"?> 24 In den höheren Formanten (F 3 -F n ) liegen vor allem die klanglichen Eigenschaften der Individual‐ stimme begründet. wichtig. 24 Dabei korreliert F 1 negativ mit der Zungenhöhe, d. h., je höher die Zunge, desto niedriger ist der Frequenzbereich von F 1 . F 2 korreliert dagegen positiv mit der horizontalen Zungenposition von hinten nach vorn: Je weiter vorn ein Vokal artikuliert wird, desto höher ist der Frequenzbereich von F 2 . So lässt sich in Abb. 2.3-10a erkennen, dass die Werte für F 1 und F 2 bei [a] näher beieinander sind als bei [e] oder [i]. Da [a] ein tiefer Vokal ist, liegt sein erster Formant höher als bei dem mittleren Vokal [e] und dem hohen Vokal [i]. In Bezug auf die horizontale Zungenposition nimmt [a] eine zentrale Position ein, deshalb ist sein zweiter Formant tiefer als der der vorderen Vokale [e] und [i]. In der Abfolge [je] in tiene lässt sich (durch zusätzliche Striche in Abb. 2.3-10a gekennzeichnet) erkennen, wie der Wert von F 1 beim Übergang vom hohen Approximanten [j] zum mittleren Vokal [e] ansteigt; der Wert von F 2 dagegen sinkt hier, weil der höchste Zungenpunkt bei [e] weniger weit vorn ist als bei [j]. Veränderungen im Verlauf der Formanten zeigen nicht nur die Dynamik beim Übergang zwischen Approximanten und Vokalen an, sondern sie sind als sog. For‐ manttransitionen oder -abbiegungen auch ein wichtiges Merkmal zur Identifi‐ zierung benachbarter Konsonanten. Besonders deutlich wird dies vor oder nach (stimmhaften) Plosiven. In Abb. 2.3-10a lassen sich z. B. Transitionen in den durch Rechtecke markierten Formanten des zweiten [a] in mandarinas erkennen: Während der vorangehende Plosiv [d] im Spektrogramm kaum auszumachen ist, weist F 1 zu Beginn des [a] einen Anstieg, F 2 dagegen einen Abfall der Frequenzwerte auf. Durch diese charakteristische Bewegung der Formanten klingt das [d] sozusagen im [a] nach. Folgt der gleiche Vokal dagegen auf [b] oder [ɡ], so fallen die Abbiegungen aufgrund der anders gearteten Artikulationsbewegungen entsprechend anders aus; dann klingen [b] bzw. [ɡ] in diesem Vokal nach. Abb. 2.3-11 zeigt die spiegelbildlichen Formanttran‐ sitionen vor und nach stimmhaften Plosiven in Abhängigkeit vom Artikulationsort. Abb. 2.3-11: Formanttransitionen in Abhängigkeit vom Artikulationsort (Mayer 2010: 102). Außer dem ersten und dem letzten Konsonanten sind alle Segmente in Abb. 2.3-10 stimmhaft. Während der Verschlussphase des Plosivs am Anfang ist das Spektro‐ 2.3 Akustische Phonetik 61 <?page no="62"?> 25 Wie in Abb. 2.3-9 zu sehen, steigt die Amplitude von [s] bis ca. 6.000 Hz noch deutlich an. 26 Das Programm wird ständig aktualisiert und verbessert. Die hier genutzte Version ist 6.3.13 (Boersma & Weenink 2023) und frühere. Eine ausführliche deutschsprachige Einführung, an der wir uns u. a. orientieren, liefert Mayer (2017), vgl. auch https: / / praatpfanne.lingphon.net. gramm in a) weiß (stummer Schall). Das auf den Explosionsschall (senkrechter Strich) folgende Friktionsrauschen weist eine unstrukturierte Schwärzung im hö‐ heren Frequenzbereich auf. In viel deutlicherer Ausprägung kennzeichnet eine solche unstrukturierte Schwärzung bei den höheren Frequenzen auch den Frikativ [s], der die Äußerung abschließt. 25 Da es sich um einen stimmlosen Konsonanten handelt, gibt es hier auch keine voice bar: So heißt der schwache horizontale graue Balken, der sich während der stimmhaften Abschnitte ganz unten im Bereich der Grundfrequenz des Sprechers abzeichnet. Abb. 2.3-10b zeigt denselben Signalabschnitt in einem Schmalbandspektro‐ gramm. Hier ist die Fenstergröße mit 29 ms deutlich größer als im Breitbandspektro‐ gramm, und die Stimmlippenschließungen werden nicht sichtbar. Dafür erscheinen jedoch in den stimmhaften Abschnitten die Harmonischen: ganz unten die Grundfrequenz und darüber, arithmetisch angeordnet, die weiteren Harmoni‐ schen oder Obertöne. Der Verlauf der Tonhöhe wird in Abb. 2.3-10b bei den höheren Harmonischen deutlicher als bei der Grundfrequenz, was an der Größe des betrachteten Frequenz‐ spektrums liegt: wie im Breitbandspektrogramm umfasst es hier den Frequenzbereich von 0-5.000 Hz (Skala links). Reduziert man diesen auf den für eine Männerstimme relevanten Höhenbereich, nämlich 50-300 Hz (Abb. 2.3-10c), so lässt sich der Tonhö‐ henverlauf, der die Sprachmelodie oder Intonation anzeigt, sehr gut erkennen. Daran können wir auch sehen, wo der Sprecher tonal markierte Akzente realisiert und welcher Stimmumfang ihm ungefähr zur Verfügung steht. In seiner Frage wird eine Besonderheit des argentinischen Spanisch deutlich: Sie endet nämlich nicht mit einem Tonanstieg, wie er im europäischen Spanisch (und auch im Deutschen) zu erwarten wäre, sondern die Interrogativkontur ist fallend. Aspekte der Intonation werden in 4.5 ausführlich behandelt. 2.3.3 Akustische Analysen selbst durchführen: Eine kleine Anleitung zum Gebrauch von Praat In diesem Abschnitt werden wir anhand einer elementaren Einführung in das von Paul Boersma und David Weenink an der Universität Amsterdam entwickelte Sprachanalyseprogramm Praat 26 erkunden, wie wir selbst Oszillogramme und Spektrogramme erstellen und somit Sprachsignale phonetisch analysieren können. Während wir dafür so weit wie möglich unseren Musterdialog benutzen werden, empfiehlt es sich, die vorgestellten Analysen anhand eigener kleiner Aufnahmen jeweils selbst auszuprobie‐ ren. 62 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="63"?> 27 Rechts erscheint das Graphikfenster (Praat Picture), mit dem Graphiken wie die in Abb. 2.3-10 erstellt werden können. Auf diese Möglichkeiten werden wir hier nicht weiter eingehen, sondern verweisen auf die ausführliche Anleitung in Mayer (2017: 153-172). Unter http: / / www.praat.org lässt sich das Sprachanalyseprogramm Praat kostenlos herunterladen. Wenn Sie Praat öffnen, erscheint links das sog. Objektfenster (Praat Objects, vgl. Abb. 2.3-12). 27 Alles, was Sie in Praat tun, tun Sie mit Objekten, die in diesem Fenster erschei‐ nen müssen. Wenn Sie also ein Tondokument, das Sie auf Ihrer Festplatte gespeichert haben, mit Praat analysieren wollen, müssen Sie es zuerst in das Objektfenster laden. Aufnahmen, die Sie in Praat analysieren wollen, sollten nach Möglichkeit im wav-Format gespeichert sein. Wenn Sie selbst eine Aufnahme erstellen wollen, klicken Sie in New > Record mono Sound. Dann öffnet sich der SoundRecorder. Wenn Sie einen leisen Rechner haben, können Sie für einfache Übungsaufnahmen das eingebaute Mikro benutzen, sonst schließen Sie eins an Ihren Rechner an. Die Sampling Frequency ist standardmäßig auf 44.100 Hz eingestellt. Um die Aufnahme zu beginnen, drücken Sie auf Record; wenn Sie fertig sind, auf Stop. Dann klicken Sie auf Save to list: Ihre Aufnahme, die Sie beliebig benennen (Befehl Rename…, unten) und auch auf Ihrer Festplatte speichern können (Befehl Save > Save as…, oben), erscheint im Objektfenster. 2.3 Akustische Phonetik 63 <?page no="64"?> Abb. 2.3-12: Das Objektfenster (Praat Objects). Wir wollen mit Juans Frage einen schon auf der Festplatte vorhandenen Soundfile in Praat laden. Dazu klicken wir oben auf den Knopf Open > Read from file… und wäh‐ len den Soundfile aus, der als 1. Sound Parte5_Pers23 INT im Objektfenster erscheint. Während oberhalb und unterhalb der Objektliste Knöpfe für die Objektverwaltung angebracht sind (oben New, Open, Save; unten Rename…, Remove etc.), finden Sie rechts neben den Objekten die Knöpfe für die verschiedenen Aktionen, die Sie mit den Objekten durchführen können (Anhören, Editieren, Annotieren, Manipulieren etc.). Wenn Sie ein Objekt ansehen und editieren wollen, wählen Sie es aus und klicken dann rechts auf View & Edit (vgl. Abb. 2.3-12). Dann öffnet sich das Editorfenster, in dem das Signal in Form eines Oszillogramms und eines Breitbandspektrogramms angezeigt wird. In diesem Editorfenster, dessen Größe Sie beliebig verändern können, erledigen Sie alle interaktiven Arbeiten mit dem Objekt. Sie können einen Teil des Signals durch Mauszug auswählen und durch Klicken auf sel (unten links) hineinzoomen (bzw. durch Klicken auf out oder all wieder heraus). Sie können Zeitdauern messen: In den drei Balken unten finden Sie die Längenangaben für markierte Abschnitte, für den sichtbaren Abschnitt und für die gesamte Aufnahme. Wenn Sie diese Balken anklicken, können Sie den jeweiligen Teil anhören (vgl. Abb. 2.3-13). 64 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="65"?> Abb. 2.3-13: Editorfenster mit Praat-Analysen der Frage ¿Tiene mandarinas? Von besonderem Interesse sind die Analysen, die Sie durch Betätigen der Knöpfe links oben im Editorfenster in Angriff nehmen können. Die betrachtete Frequenzskala des Spektrogramms (View range) beträgt in der Standardeinstellung 0-5.000 Hz, die Fens‐ terlänge (Window length) 0,005 s. Diese Werte (und noch viele weitere) können unter Spectrum > Spectrogram settings… (bzw. Advanced spectrogram settings…) verändert werden. Um die Grundfrequenz zu sehen, ist es nicht nötig, die Einstellungen wie in Abb. 2.3-10 auf ein Schmalbandspektrogramm umzustellen, sondern der Verlauf von F 0 ist standardmäßig als blaue Linie im Breitbandspektrogramm bereits eingeblendet (und kann über Pitch > Show pitch ausgeblendet werden). Die entsprechende Fre‐ quenzskala befindet sich ebenfalls in blau auf der rechten Seite des Spektrogramms. Die Standardeinstellung ist hier 75-500 Hz und damit eher für eine Frauenstimme 2.3 Akustische Phonetik 65 <?page no="66"?> passend. Für unsere Frage können wir sie über Pitch > Pitch settings… auf für eine Männerstimme günstigere 50-300 Hz (Pitch range) ändern. Wenn Sie auf Intensity > Show intensity klicken, erscheint im Spektrogramm eine gelbe Linie, die den Verlauf der Lautstärke anzeigt. Rechts ist in grün eine entsprechende Skala zu sehen, die von 50-100 dB reicht. Auch den Formantenverlauf kann man sich in Praat anzeigen lassen. Gehen Sie dazu auf Formant > Show formants, und rote Punkte deuten im Spektrogramm die Formantenkontur an. Abschließend wollen wir uns damit befassen, wie wir ein Sound-Objekt in Praat annotieren können. In Abb. 2.3-12 haben wir im dynamischen Aktionsmenü des Ob‐ jektfensters schon den Knopf Annotate - und in der Objektliste ein TextGrid-Objekt als Ergebnis einer solchen Annotierungsaktion gesehen. Nach Mayer (2017: 45) handelt es sich bei der Annotation um “eine zeitlich ausgerichtete (time aligned), symbolische Beschreibung eines Signals […]”. Das bedeutet, dass ein bestimmter Zeitabschnitt oder ein Zeitpunkt des Signals mit einer Schilderung (einem Label oder Etikett) assoziiert wird. Das kann auf verschiedenen Ebenen geschehen: auf der Segmentebene, wenn wir das Signal in einzelne Lautphasen segmentieren und diesen Transkriptionszeichen zuordnen; auf der Silbenebene, wenn wir Silbengrenzen setzen; auf der Wortebene, wenn wir eine orthographische Transkription einbringen; auf der syntaktischen Ebene, wenn wir Konstituentengrenzen setzen etc. All diese Annotierungsarten zielen auf Zeitabschnitte ab: Es müssen Intervalle mit einem Anfangs- und einem Endpunkt ermittelt werden. Aber auch punktuelle Ereignisse können annotiert werden, etwa wenn wir den Gipfel eines Tonanstiegs kennzeichnen wollen. Für diese unterschiedlichen Arten der Annotierung hält Praat zwei verschiedene Typen von tiers vor (wie die Annotierungszeilen genannt werden): interval tiers (für Intervalle) und point tiers (für punktuelle Ereignisse). Um tiers zu erzeugen, müssen Sie im Objektfenster ein Sound-Objekt auswählen und dann auf Annotate - > To TextGrid… klicken. In die erste Zeile des Fensters, das sich daraufhin öffnet, schreiben Sie (an die Stelle von Mary John bell) die Namen der TextGrids, die Sie verwenden möchten, also z. B. IPA (für phonetische Transkription), Silben (für die Markierung von Silbengrenzen), Orth. (für die orthographische Wiedergabe), HL (für Hoch- und Tiefpunkte - high bzw. low - im Grundfrequenzverlauf) - jeweils mit einfachem Abstand, aber ohne Kommata. Da es sich bei dem letzten tier um Zeitpunkte handelt, schreiben Sie hinter die Frage Which of these are point tiers? HL. Alle anderen tiers sind automatisch interval tiers. Wenn Sie nun auf OK klicken, erscheint im Objektfenster ein TextGrid-Objekt, das denselben Namen wie das zu annotierende Sound-Objekt trägt, also in unserem Fall 2. TextGrid Parte5_Pers 23INT. Um Sound- und TextGrid-Objekt in einem Editorfenster zu öffnen, müssen Sie beide gemeinsam durch Klicken auf das Sound-Objekt und STRG+Klicken (bzw. cmd/ command+Klicken beim Mac) auf das TextGrid-Objekt auswählen und anschlie‐ ßend in View & Edit gehen. Das neue Editorfenster enthält außer den bereits bekannten Bestandteilen drei zusätzliche Menüs in der Menüzeile, nämlich Interval, Boundary und Tier. Sie dienen zur Bearbeitung der tiers, die sich zwischen 66 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="67"?> dem Spektrogramm (und/ oder dem Oszillogramm) und den Abspielbalken in der unteren Hälfte des Fensters aneinanderreihen. Außerdem gibt es noch den sog. Label-Editor, eine weiße Fläche zwischen Menüzeile und Oszillogramm, in die Sie die Signalbeschreibung eingeben (vgl. Abb. 2.3-14). Zunächst müssen die Grenzen der Intervalle eingefügt werden. Beginnen wir mit der Grenze zwischen tiene und mandarinas. Dazu klicken wir einfach an der Stelle in das Signal, an der wir den Übergang zwischen den beiden Wörtern vermuten. Dort erscheint eine senkrechte, oben rot gestrichelte, unten graue Linie, die am oberen Rand eines jeden tiers einen kleinen Kreis aufweist. Hören Sie sich unten auf dem obersten Abspielbalken die Signalteile vor und nach dieser provisorischen Grenze an und korrigieren Sie Ihre Setzung durch einen genaueren Klick. Wenn Sie meinen, die korrekten Intervalle ermittelt zu haben, klicken Sie in die ersten drei Kreise (denn hier fallen Segment-, Silben- und Wortgrenze zusammen), um für die drei interval tiers aus der provisorischen eine feste Grenze zu machen. Gesetzte Grenzen können Sie jederzeit durch Mauszug verschieben; über Boundary > Remove oder kürzer durch ALT+Rücktaste können Sie sie auch wieder entfernen. Die ALT-Taste (auch Wahl- oder Optionstaste) erkennen Sie auf Apple-Tastaturen an folgendem Symbol: . Wenn Sie nun im Orth.-tier in den Abschnitt links der Grenze klicken, färbt dieser sich gelb, und das, was Sie tippen (in unserem Fall ¿Tiene) erscheint sowohl oben im Label-Editor als auch in der gelben Fläche. Dann klicken Sie in die Fläche rechts der Grenze (die sich nun gelb färbt) und schreiben mandarinas. Genauso verfahren Sie, um im IPA- und im Silben-tier die Silbengrenzen und schließlich im IPA-tier die verbleibenden Segmentgrenzen zu setzen. Abb. 2.3-14: TextGrid-Editor mit verschiedenen Annotierungen der Frage ¿Tiene mandarinas? 2.3 Akustische Phonetik 67 <?page no="68"?> 28 Eine Alternative zu EasyAlign ist das vom Münchner Institut für Phonetik entwickelte Tool MAUS (Munich Automatic Segmentation), das die automatisierte Segmentierung spanischer (und anderer) Daten über eine Web-Oberfläche erlaubt, vgl. https: / / clarin.phonetik.uni-muenchen.de/ BASWebSer vices/ interface/ WebMAUSBasic. Wenn Sie die Schrift Doulos SIL auf Ihrem Rechner installiert haben, können Sie in Praat auch IPA-Zeichen verwenden. Klicken Sie in das rosa Dreieck rechts unter der Schreibfläche, und es erscheint dort neben dem Signal und den TextGrids eine weiße Fläche, die all die IPA-Symbole enthält, die keinen gängigen Buchstaben des lateinischen Alphabets entsprechen und die Sie durch einfaches Anklicken in Ihre Transkription einbringen können. Durch Klicken auf das rote ‘x’ (an der Stelle des Dreiecks) verschwindet diese Fläche, und das Editorfenster erscheint wieder in voller Größe. Im point tier HL wollen wir nun noch die Hoch- und Tiefpunkte des Intonationsver‐ laufs kennzeichnen. Dazu wählen wir durch Mauszug einen Teil des Signals aus und gehen in Pitch > Move cursor to maximum pitch bzw. Move cursor to minimum pitch. An der Stelle klicken Sie dann im point tier in den Kreis, um so die ‘Grenze’ (die hier ein Punkt ist) zu bestätigen. Im Label-Editor können Sie diesen Punkt mit H bzw. L etikettieren. Wie alle in Praat neu erstellten oder veränderten Objekte existiert auch unser TextGrid-Objekt erst einmal nur im Praat-Arbeitsspeicher. Um es auch nach dem Beenden von Praat weiterverwenden zu können, müssen Sie es auf Ihrer Festplatte speichern. Dazu gehen Sie im TextGrid-Editor unter File > Save whole TextGrid as text file. Im gewünschten Ordner wird dann eine Datei mit der Endung TextGrid, in unserem Fall Parte5_Pers23_INT.TextGrid abgespeichert, die Sie bei Bedarf wieder in Praat öffnen können. Praat hat noch unendlich viele weitere Optionen und Funktionen. So lassen sich mit‐ hilfe von Skripten Analysen automatisieren, und Praat kann auch mit verschiedenen Tools kombiniert werden - so z. B. mit dem allerdings nur unter Windows laufenden Plugin EasyAlign, das auch für Spanisch eine halbautomatische Segmentierung des Signals erlaubt (Goldman 2011; Goldman & Schwab 2014) 28 oder mit dem Programm Correlatore, das Rhythmusanalysen unterstützt (vgl. 4.4). Auf die eine oder andere Funktion werden wir im Laufe des Buchs zurückkommen, ansonsten verweisen wir auf die in Praat eingebaute Hilfe und auf die deutschsprachige Einführung von Mayer (2017). 2.4 Perzeptive Phonetik Die Phonetik analysiert nicht nur die Produktion und Übertragung von Sprachlauten, sondern auch deren Wahrnehmung und Verarbeitung durch das menschliche Ohr und Gehirn. Als perzeptive Phonetik (sp. fonética perceptiva) konzentriert sie sich auf die physiologischen und neuronalen Vorgänge beim Hörer, wenn dieser die lautsprachliche 68 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="69"?> 29 Zusammenfassende Darstellungen zur lautsprachlichen Perzeption finden sich bei Neppert & Pétursson ( 3 2002: 167-206), Clark et al. ( 3 2007: 297-324), McQueen (2007), Pisoni & Levi (2007), Goldstein ( 7 2008: 257-332), Kubarth (2009: 50-58) und Pompino-Marschall ( 3 2009: 143-175). Vgl. auch die Beiträge in Pisoni & Remez (2005). 30 Ein weiterer wichtiger Unterschied ist, dass die symbolische Repräsentation lautsprachlicher Signi‐ fikanten (durch Phoneme oder Merkmalkonfigurationen) von den konnektionistischen Ansätzen in Frage gestellt wird. Deshalb werden Indizien dafür gesammelt, dass nicht-analytische, ganzheitliche Repräsentationen, sog. Exemplare, Ziel des Perzeptionsvorgangs sind (vgl. 3.5). Äußerung des Sprechers wahrnimmt und interpretiert. 29 Die Tatsache, dass die Be‐ zeichnung ‘perzeptive Phonetik’ mit der Bezeichnung ‘auditive Phonetik’ (sp. fonética auditiva) konkurriert, zeigt, dass in diesem Forschungsgebiet die Grundannahmen über menschliche Sprache eine besonders wichtige Rolle spielen. Nach dem modularen Modell (vgl. etwa Kingston 2005 und 1.4) verläuft die Sprachverarbeitung linear, und die unterschiedlichen Bereiche (Hören, Sprachlauter‐ kennung, syntaktische und lexikalische Verarbeitung, pragmatische Interpretation) werden nacheinander und in hierarchischer Folge durchlaufen. Nach diesem Ansatz kann man den Forschungsgegenstand einer Phonetik des Hörens als auditiv abgren‐ zen: Es geht um die Wahrnehmung des akustischen Ereignisses und die Extraktion der Phoneme bzw. der (distinktiven) Merkmale, die abschließend der phonologischen Repräsentation einer lexikalischen Einheit zugeordnet werden. Das Hören und die damit verbundene Kategorisierungsarbeit verlaufen nach dem modularen Modell autonom, also unabhängig von den späteren sprachlichen Verarbeitungsstufen, aber auch unabhängig von anderen kognitiven Aktivitäten (Sehen, Fühlen, Erwarten etc.). Außerdem sind, so dieser Ansatz, in unserem Gedächtnis lautliche Zeichenaußenseiten symbolisch und diskret, also entweder als Phonemketten (3.1) oder als Merkmalskon‐ figurationen (3.2), repräsentiert. Deshalb ist die Aufgabe des Moduls Hören phonolo‐ gisch. Wir müssen aus der äußerst variablen und kontinualen lautsprachlichen Realität alles Irrelevante und ausschließlich Individuelle ausfiltern, um diese mit der abstrakten phonologischen Repräsentation gleichsetzen zu können. Eine Alternative zu diesem auditiven Ansatz sind mehrdimensionale Modellie‐ rungen des Hörens, die dieses als perzeptives Zuhören definieren. Solche Modelle werden von konnektionistischen, multimodalen und funktional ausgerichteten Ansät‐ zen angeboten. Sie gehen davon aus, dass bei der Verarbeitung des Sprachsignals alle Bereiche der Kognition (Hören, Sehen, Fühlen etc.) und alle Bereiche des Wissens (sprachliches, nicht-sprachliches, kategoriales, analoges etc.) gleichzeitig aktiviert sind. Nach diesem Modell ist deshalb das Sprachhören mit anderen kognitiven Aktivitäten systematisch vernetzt. Wenn wir hören, stellen wir aufgrund unseres Erfahrungswissens immer schon Vermutungen darüber an, was als nächstes kommen kann, und identifizieren deshalb die lautsprachlichen Ereignisse nicht ausschließlich über auditive Mechanismen. 30 Wir werden im Folgenden sehen, dass es eine ganze Reihe von Evidenzen dafür gibt, dass das Hören nicht autonom, sondern verflochten mit anderen kognitiven Aktivitäten ist. Das bedeutet aber natürlich nicht, dass das Hören nicht trotzdem ein 2.4 Perzeptive Phonetik 69 <?page no="70"?> physiologischer Vorgang ist und als solcher analysiert werden muss. In einem ersten Schritt werden wir uns daher mit dem Ohr und seiner Anatomie sowie den neuronalen, also gehirnphysiologischen Aspekten des Hörvorgangs beschäftigen (2.4.1). Erst dann werden wir uns dem Sprachhören, also der Wahrnehmung sprachlicher Signale und ihrer Verarbeitung, zuwenden (2.4.2). Die perzeptive Phonetik untersucht die physiologischen, neuronalen und kogni‐ tiven Vorgänge bei der Wahrnehmung und Verarbeitung von Lautsprache. Es gibt zwei unterschiedliche Ansätze bei der Interpretation dieser Vorgänge: Der modulare und auditive Ansatz betont die Autonomie der Lautwahrnehmung und geht von einer linearen Abfolge von Hören, Kategorisieren und Worterkennen aus. Der mehrdimensionale und perzeptive Ansatz betont dagegen die Vernetzung mehrerer kognitiver Aktivitäten bei der Lautspracherkennung. 2.4.1 Der Hörvorgang Das menschliche Gehörorgan kann in drei anatomische Bereiche aufgeteilt werden. Äußerlich sichtbar ist das Außenohr mit der Ohrmuschel, dem äußeren Gehörgang und mit dem ihn abschließenden Trommelfell. Das Mittelohr umfasst die an das Trommelfell anschließenden Gehörknöchelchen Hammer, Amboss und Steigbügel. Im Innenohr liegt die Hörschnecke oder Cochlea, das eigentliche Hörorgan. Abb. 2.4-1 zeigt die unterschiedlichen Bereiche des menschlichen Ohrs. Abb. 2.4-1: Das menschliche Gehörorgan (nach Reetz & Jongman 2009: 227). 70 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="71"?> Die knorpelige Muschel des Außenohrs unterstützt das Richtungshören, denn die akustische Information, die von vorne kommt, wird reflektiert und verstärkt, während die von hinten ankommenden Schallwellen gedämpft werden. Das Richtungshören wird außerdem dadurch ermöglicht, dass wir mit zwei Ohren hören und daher zwei zeitlich leicht verschobene und unterschiedlich laute akustische Signale emp‐ fangen, wenn der Schall von der Seite kommt. Aus dem Abgleich der Differenzen zwischen diesen akustischen Impulsen können wir dann die räumliche Situierung des Schallereignisses erschließen. Der äußere Gehörgang, der etwa 2,5 cm lang ist, dient dem Schutz des Trommelfells. Außerdem verstärkt er durch seine Resonanz genau den Frequenzbereich um 3,4 kHz, der im menschlichen Sprechen besonders in Anspruch genommen wird. Am Ende des Gehörgangs liegt das Trommelfell, eine trichterförmige Membran, etwa 0,85 cm 2 groß und 0,1 mm dick, die auf einer Fläche von 0,55 cm 2 in Schwingungen versetzt werden kann. Das Mittelohr ist eine kleine Höhle in unserer Schädelstruktur. Da sie durch die Eustachische Röhre mit dem Mundraum verbunden ist, können Luftdruckunterschiede zwischen Außenohr und Mittelohr durch Schluckbewegungen ausgeglichen werden. Das ist wichtig, weil nur so die freie Beweglichkeit des Trommelfells und damit ein optimales Hören sichergestellt ist. An das Trommelfell schließen im Mittelohr die Gehörknöchelchen an: Unmittelbar am Trommelfell befindet sich der Hammer, der über den Amboss mit dem Steigbügel verbunden ist. Der Steigbügel wiederum liegt an dem nur 0,03 cm 2 großen ovalen Fenster an; das ist eine der beiden Membranen, die sich zwischen Mittelohr und Innenohr befinden. Die Gehörknöchelchen geben die Schwingungen des Trommelfells mechanisch an das ovale Fenster weiter. Da der Flächenunterschied zwischen Trommelfell und ovalem Fenster sehr groß ist, werden die Schwingungen durch die Gehörknöchelchen verstärkt. Gleichzeitig regeln die mit den Knöchelchen verbundenen Muskeln deren Beweglichkeit und sorgen dafür, dass sie bei einem zu lauten Schallereignis nicht den vollen Druck übertragen müssen. Das eigentliche Hörorgan liegt im Innenohr. Es ist die Schnecke oder Cochlea, ein mit Lymphflüssigkeit gefülltes, schneckenförmig gewundenes Schlauchsystem, das in einen Hohlraum, das knöcherne Labyrinth, eingebettet ist. Die Schnecke besteht aus zwei Schläuchen, die ausgerollt etwa 3,5 cm lang sind. An der Spitze der Schnecke sind sie miteinander verbunden, aber am anderen Ende erreichen sie nur jeweils eine der beiden Membranen, die den Übergang zwischen Mittel- und Innenohr sichern. An das bereits genannte ovale Fenster, an dem die Schwingungen der Gehörknöchelchen ankommen, schließt der Schlauch an, der Vorhoftreppe genannt wird; die zweite Membran, das runde Fenster, ist der Endpunkt der sog. Paukentreppe. Zwischen Vorhof- und Paukentreppe liegt die Basilarmembran, die das Cortische Organ, unser eigentliches Hörorgan, trägt. Dieses besteht aus tausenden von Haarzellen (etwa 3.500 innere Haarzellen und etwa 15.000 bis 20.000 äußere Haarzellen), die durch die Bewegungen der Lymphflüssigkeit in den Schläuchen aktiviert werden. In diesem Zustand veranlassen sie die Rezeptorzellen in der Basilarmembran zum Feuern, d. h. zum Weitergeben neuronaler Information über den Hörnerv an das Gehirn. Das Cor‐ 2.4 Perzeptive Phonetik 71 <?page no="72"?> tische Organ verwandelt also die mechanischen Schwingungen der Lymphflüssigkeit in neuronale Information. Abb. 2.4-2: Das Cortische Organ in schematischer Schnittdarstellung (nach Pompino-Marschall 3 2009: 146). Fassen wir hier kurz zusammen: Die am Außenohr eintreffenden Luftdruckunter‐ schiede werden durch die Resonanz des Gehörgangs in bestimmten sprachrelevanten Frequenzen verstärkt und in Schwingungen des Trommelfells umgewandelt. Diese versetzen die Gehörknöchelchen, d. h. Hammer, Amboss und schließlich Steigbügel, in Bewegung. Als letzter gibt der Steigbügel, der an der Membran des ovalen Fensters anliegt, die Schwingungen an die Lymphflüssigkeiten der Schnecke weiter. In der Schnecke nun vollzieht sich ein Prozess, der sich mit der Fourier-Analyse vergleichen lässt (vgl. 2.3). Die Schwingungen werden nämlich nicht undifferenziert als Ganzes weitergegeben, sondern gemäß ihrer komplexen spektralen Zusammensetzung in unterschiedlich weit reichende Wellen, sog. Wanderwellen, zerlegt. Jede Teilfrequenz eines Schallereignisses aktiviert eine unterschiedlich weit reichende Welle. Deshalb werden auch unterschiedliche Stellen der Basilarmembran berührt und folglich unter‐ schiedliche Haarzellen aktiviert. Beispielsweise verebben hohe Frequenzen bereits am Beginn der Lymphschläuche, während niedrigere Frequenzen zu weiter reichen‐ den Wanderwellen führen. Das Innenohr, so könnte man sagen, nimmt den Schall zeitlich-linear auf, ‘zerlegt’ ihn aber auch so, dass seine spektrale Zusammensetzung transparent wird. Die neuronale Information, die das Gehirn vom Hörnerv erhält, ist 72 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="73"?> 31 Die Lautstärke wird in der Hörschnecke vermutlich dadurch widergespiegelt, dass mehr Nervenzel‐ len reagieren und die verstärkte Reaktion den erhöhten Dezibelwert weitergibt (Kubarth 2009: 34). 32 Vor allem die neuen bildgebenden Verfahren der funktionalen Magnetresonanztomographie (fMRT) und der Positron-Emissions-Tomographie (PET) haben diese Erkenntnis ermöglicht. Sie können neuronale Reaktionen direkt, als körperliche Reaktionen im Gehirn, sichtbar machen. Vgl. dazu genauer Goldstein ( 7 2008: 75-100), Pulvermüller (2007) und Idsardi & Poeppel (2012). sowohl hinsichtlich des zeitlichen Verlaufs als auch hinsichtlich der Frequenzen, die im Schallereignis vereint sind, spezifiziert. 31 Die neuronale Information des Hörnervs wird an die Großhirnrinde und dort an den cortex auditivus (im rechten und im linken Temporallappen) weitergeleitet. Jedes Ohr ist über zwei auditorische Bahnen mit der Großhirnrinde verbunden. Es gibt eine ventrale auditorische Bahn aus nacheinander geschalteten Nervenzellen, bei der die neuronale Information in der jeweiligen Gehirnhälfte bleibt, also gleichseitig vermittelt wird. Bei der zweiten auditorischen Bahn, der dorsalen, wird die Information dagegen zur gegenüberliegenden Gehirnhälfte weitergeleitet. Die ventrale Bahn ist für das Richtungshören zentral (Goldstein 7 2008: 291-313), die dorsale Bahn dagegen mit dem kategorialen Hören assoziiert. Wichtig ist außerdem, dass die neuronale Information auf ihrem Wege vom Cortischen Organ zur Großhirnrinde nicht unverändert bleibt, sondern mit anderen Informationen zusammengeführt wird: Die Reize der beiden Ohren werden in einer frühen Phase miteinander vernetzt. Bereits hier beginnt die Verrechnung der Informationen zur Lokalisierung der Schallquelle. Außerdem ist die ventrale Bahn mit dem visuellen System gekoppelt, sodass das Richtungshören auch durch visuelle Signale gestützt wird. Nach dem bisher Gesagten könnte es scheinen, dass die Verarbeitung der neuronalen Information aus dem Ohr linear, durch nacheinander geschaltete Reaktionen, und punktuell, also nur durch wenige spezialisierte Nervenzellen, erfolgt. Das ist nach neueren Erkenntnissen über menschliche Wahrnehmung und Kognition nicht der Fall. Man weiß inzwischen, dass es drei auditive Areale gibt. Um einen primären Kernbereich des cortex auditivus sind konzentrisch der sekundäre (‘Gürtel’) und der tertiäre auditive Kortex (‘erweiterter Gürtel’) angeordnet. Der Kernbereich erhält die neuronale Information zuerst und ist auf die Feststellung der Tonhöhe, also auf die reine Frequenz, ausgelegt. Die peripheren Bereiche, an die die Information weitergegeben wird, scheinen dagegen auf komplexere Schallereignisse spezialisiert zu sein (Rauschen, d. h. mehrere übereinanderliegende Frequenzen, menschliche Stimmen etc.). Außerdem hat man nachgewiesen, dass nicht nur der cortex auditivus, sondern auch andere Gehirnregionen bei der Lautwahrnehmung aktiviert werden. 32 Diese Beobachtung spricht dafür, dass im Hörvorgang nicht nur eine Nervenbahn zu einem präzisen Gehirnareal verfolgt wird, sondern dass neuronale Reaktionen an mehre‐ ren Stellen auftreten und im Wahrnehmungsvorgang synchronisiert sind. In Bezug auf die visuelle Wahrnehmung ist man sich inzwischen sogar ziemlich sicher, dass die Synthetisierung der analytischen Einzeldaten, in die das Gesehene im Auge aufgelöst wird (Konturen, Helligkeits- oder Farbkontraste etc.), nicht dadurch erfolgt, dass eine 2.4 Perzeptive Phonetik 73 <?page no="74"?> 33 Zur Organisation des Gehirns und der kognitiven Prozesse vgl. etwa Goldstein ( 7 2008: 47-100), zur Synchronisation der perzeptiven und kognitiven Prozesse Goldstein ( 7 2008: 101-130); vgl. auch Hawkins (2010). Die inzwischen gesicherte Erkenntnis, dass viele Gehirnareale gleichzeitig aktiv sind, lässt auch die umstrittene motor theory der Sprachwahrnehmung (Liberman et al. 1967) in einem neuen Licht erscheinen. Nach der motor theory wird die kategorielle Interpretation des akus‐ tischen Signals durch die Verknüpfung mit abgespeicherten Artikulationsbewegungen ermöglicht. Inzwischen ist nachgewiesen, dass bei der auditiven Wahrnehmung auch ganze Ensembles an Zellen aktiviert werden, die bei der Sprachartikulation beteiligt sind (Goldstein 7 2008: 331f.). Die Frage, welche Rolle abgespeicherte artikulatorische Bewegungsmuster bei der Perzeption von Lautsprache spielen, ist also weiterhin offen (Fowler & Galantucci 2005). 34 Zum Cocktail-Party-Effekt vgl. genauer Pompino-Marschall ( 3 2009: 151). Zur Figur-Grund-Bezie‐ hung in der Gestaltpsychologie vgl. Krefeld (1999: 127ff.). Vgl. außerdem Teixeira Kalkhoff (2021: 25-57). präzise, hierarchisch übergeordnete Nervenzelle aktiviert wird, die die Daten mit einer schematischen Repräsentation in Beziehung setzt (lokale Repräsentation bzw. Ein‐ zelzellenkodierung). Eine weitaus plausiblere Erklärung ist, dass die Synthetisierung der Einzeldaten zu einer Gesamtheit durch die Gleichzeitigkeit des Feuerns der vielen Nervenzellen, die am Wahrnehmungsvorgang beteiligt sind, erzeugt wird. Man könnte sagen, dass die Wahrnehmung einer Gestalt nicht durch die eine Nervenzelle am Ende des Wahrnehmungsvorgangs gesichert wird, sondern durch das Muster aus den vielen Nervenzellen, die von Anfang an parallel aktiviert sind (verteilte Repräsentation bzw. Ensemblekodierung). 33 Die Frage, welches dieser beiden Wahrnehmungsmodelle zutreffend ist, ist in Bezug auf die auditive Wahrnehmung noch nicht abschließend geklärt (Bernstein 2005). Gegen die Annahme, die Kognition sei eine streng linear geordnete Folge von verschiedenen Verarbeitungsschritten, spricht auch, dass bei der Übertragung der auditiven Information nicht nur afferent, vom Hörorgan zu den oberen Verarbeitungs‐ zentren in der Großhirnrinde (bottom-up), Information weitergegeben wird. Auch efferent, also vom Cortex nach unten (top-down), beeinflusst neuronale Information den Hörvorgang. Denn neuronale Signale aus dem Großhirn können bestimmte Nervenzellen inhibieren, also bei der Reizannahme behindern, bei anderen dagegen die Reaktionszeit beschleunigen. Ein bekannter Nachweis einer solchen efferenten Beein‐ flussung des Hörens ist der sog. Cocktail-Party-Effekt. Wir können nämlich selektiv hören, also unsere Aufmerksamkeit so steuern, dass bestimmte Nervenzellen und damit die Aufnahme bestimmter akustischer Reize privilegiert sind. Ein selektives Hören liegt beispielsweise vor, wenn wir uns auf die Äußerungen eines Gesprächspartners konzentrieren. Wir können diese auch trotz des sonstigen Lärms einer Veranstaltung verstehen, weil wir sie, wie die Gestaltpsychologie sagt, als Figur vor dem Hintergrund der übrigen akustischen Phänomene prägnant machen - selbstverständlich ohne dass wir aufhören, die übrigen Geräusche zu hören. Deshalb können wir diese bei Bedarf auch in den Vordergrund rücken und ihrerseits fokussieren. 34 Bevor wir uns im nächsten Abschnitt auf die Sprachschallverarbeitung konzen‐ trieren (2.4.2), noch einige Anmerkungen zur Psychoakustik. Als Psychoakustik werden die Bereiche der Akustik bezeichnet, die sich speziell mit der menschlichen 74 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="75"?> Wahrnehmung von Schall beschäftigen (Zwicker 1982). Hier spielt die Beobachtung eine wichtige Rolle, dass das menschliche Hören anderen Regularitäten folgt als das Registrieren akustischer Signale durch technische Apparate. Beispielsweise hören Menschen nicht immer das, was die Apparate ‘hören’ können. Oft liegt nämlich die Reizschwelle für den Menschen höher als für die Maschine, so dass wir zwar nach der Analyse wissen, dass ein akustisches Ereignis vorgelegen hat, wir dieses aber selbst nicht wahrgenommen haben. Bekannt ist zum Beispiel, dass menschliches Hören nur bestimmte Frequenzbereiche erkennen kann. Unser Hörvermögen beginnt bei 16-20 Hz und endet bei 16-20 kHz. Wenn man die Frequenzen, die wir wahrnehmen können, zusätzlich daraufhin untersucht, ab welchem Schallpegel wir sie hören, dann zeichnet sich die Hörfläche des menschlichen Ohres ab. Sehr tiefe Frequenzen hören wir erst ab einer bestimmten Lautstärke, genauso sehr hohe Töne. Im mittleren Fre‐ quenzbereich, der auch genau den vom Sprachschall besetzten Frequenzen entspricht, hören wir dagegen gleichmäßig gut; bei geringem Schallpegel, wenn leise gesprochen wird, genauso wie bei mittlerer und hoher Lautstärke. Im Laufe der menschlichen Evolution haben sich also offensichtlich die Ohren den menschlichen Stimmen oder umgekehrt die Stimmen den Ohren angepasst (Neppert & Pétursson 3 2002: 59ff.). Das menschliche Hörorgan nimmt nicht wie eine Maschine gleichmäßig alles wahr, sondern präferiert bestimmte Frequenzbereiche. Auch hinsichtlich der Veränderungen akustischer Signale gibt es Reizschwellen. Bestimmte Dauerunterschiede sind zu gering, als dass wir sie identifizieren können. Erst ab einer bestimmten zeitlichen Ausdehnung der Dauerdifferenz können wir entscheiden, ob etwas gleich lang, länger oder kürzer als etwas anderes ist. Auch Unterschiede in der Lautstärke oder Frequenzunterschiede nehmen wir erst ab einer bestimmten Größe wahr (Meisenburg & Selig 1998: 39). Zu diesen Begrenzungen hinsichtlich der menschlichen Wahrnehmungs- und Unterscheidungsfähigkeit kommt noch ein weiterer Unterschied zwischen dem ‘Hören’ der Apparate und dem Hören der Menschen hinzu, nämlich der der Kategorisierung. Die physikalischen Messskalen stimmen nur bedingt mit den Maßstäben überein, die Menschen an das wahrgenom‐ mene akustische Ereignis anlegen. Wir sehen das bereits daran, dass wir die Lautstärke eines Signals nur grob (laut oder leise) oder nur in Bezug zu einem anderen Signal (lauter oder leiser) einordnen können, jedoch über keine Messgröße verfügen, die dem physikalischen Dezibel (dB) vergleichbar ist. Auch hinsichtlich der Frequenz gilt dieser Unterschied zwischen physikalischer und perzeptiver Einordnung. Einige Menschen, nämlich solche mit absolutem Gehör, verfügen zwar über die Fähigkeit, Töne auf einer quasi-physikalischen Skala, der Tonleiter, einzuordnen. Die meisten Menschen können aber nur sagen, ob ein Ton höher oder tiefer als ein anderer ist - und manchmal hören sie auch nur, dass er anders ist. Diese Unterschiede zwischen Mensch und Maschine müssen bedacht werden, wenn man akustische Daten erhebt und analysiert. Man kann Sonagramme nicht ohne weiteres gleichsetzen mit dem, was ein normal veranlagter Hörer hört. Zuvor muss man sich vergewissern, dass die von 2.4 Perzeptive Phonetik 75 <?page no="76"?> den technischen Apparaturen registrierten Veränderungen des akustischen Signals auch solche sind, die vom Menschen bemerkt und ähnlich kategorisiert werden. 2.4.2 Sprach(laut)hören In diesem Abschnitt wollen wir uns genauer damit beschäftigen, wie das Hören von sprachlichen Signalen vor sich geht. Es ist eine immer noch offene Frage, ob die Wahrnehmung von Lautsprache anders verläuft als das Wahrnehmen sonstiger akustischer Ereignisse (Kingston 2005). Nach dem modularen Ansatz geht man davon aus, dass beide Signalarten zunächst gleich verarbeitet werden. Vertreter perzeptiver Ansätze nehmen dagegen an, dass das Hören von sprachlichen Zeichen von Anfang an durch sprachliches Wissen beeinflusst und gelenkt ist. Diese Debatte spiegelt sich auch in den Experimenten wider, die in der Psycholinguistik zur Lautsprachwahrnehmung gemacht wurden. Für die Gleichheit oder Ähnlichkeit der Wahrnehmung aller akustischen Signalarten spricht die Beobachtung, dass der Mensch von Geburt an die Fähigkeit zum katego‐ rialen Hören besitzt; eine Fähigkeit, die er mit einer Reihe von Tieren (Chinchillas, Makaken, Wellensittiche, Zebrafinken, japanische Wachteln) teilt (vgl. Kingston 2005: 178f.). Es handelt sich damit um eine biologisch-physiologisch begründete auditive Fähigkeit, die nicht vom sprachlichen Wissen und vom Sprachgebrauch abhängen kann. Entdeckt wurde das kategoriale Hören bei Experimenten mit synthetisch erzeug‐ ten Sprachlauten. In den 1950er Jahren hatte man in den Haskins-Laboratorien in New York eine Apparatur entwickelt, die Sonagramme, also visuelle Darstellungen von Sprachlauten (vgl. 2.3.2), in akustische Signale umwandeln kann. Damit war die Möglichkeit gegeben, lautsprachliche Signifikanten künstlich zu synthetisieren und gleichzeitig zu überprüfen, welche Manipulationen sich auf die Wahrnehmung der Signale auswirken und welche nicht. Berühmt geworden sind die Versuche mit der Wahrnehmung von Plosiv-Vokal-Silben. Wir haben gesehen, dass sich die einzelnen Plosive durch die Formanttransitionen zum folgenden Vokal, und zwar vor allem beim zweiten Formanten, voneinander unterscheiden (2.3.2.2). Diese Beobachtung nutzte man, um durch die Manipulation von Sonagrammen ein Kontinuum zwischen [b] und [ɡ] zu simulieren, indem man die Transition des zweiten Formanten zwischen der Artikulation des labialen [b] bis zur Artikulation des velaren [ɡ] in 13 Einzelschritten veränderte (Abb. 2.4-3). Als man Versuchspersonen mit diesen künstlichen auditiven Stimuli konfrontierte, nahmen diese aber gerade nicht 13 verschiedene Schallereignisse wahr. Übereinstimmend hörten alle Versuchspersonen die ersten drei Stimuli als [bæ], den fünften bis neunten Stimulus als [dæ], die Stimuli elf bis dreizehn als [ɡæ]. Die da‐ zwischen liegenden Stimuli ordneten sie unterschiedlich ein; der vierte Stimulus wurde also von einigen als [bæ], von anderen als [dæ] interpretiert. Gleich war aber, dass die Wahrnehmung bei allen Probanden ‘kippte’. Sie hörten nie eine Art ‘Zwischending’ zwischen [b] und [d], sondern ordneten die Stimuli immer eindeutig einer der beiden Kategorien zu. Die Hörer unterteilten das dargebotene akustische Kontinuum also 76 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="77"?> in klar getrennte Wahrnehmungskategorien (Pompino-Marschall 3 2009: 162ff.). Anzu‐ merken ist, dass das ‘Kippen’ der kategorialen Zuordnung bei den Vokalen geringer ausgeprägt ist und sich hier Anzeichen für eine kontinuale Wahrnehmung finden (Pompino-Marschall 3 2009: 163). Die kategoriale Wahrnehmung ist aber zweifellos ein sehr wichtiges Charakteristikum unseres Sprachhörens. Abb. 2.4-3: Versuchsanordnung zur kategorialen Wahrnehmung (nach Pompino-Marschall 3 2009: 163): 13-stelliges Kontinuum zwischen [bæ] und [ɡæ] (links), kategoriale Wahrnehmung des Kontinuums als [bæ], [dæ] und [ɡæ] (rechts). Die Kurven geben die Identifizierungsleistungen bei den jeweiligen Phonemen wieder. Eine weitere Experimentreihe versuchte nachzuweisen, dass die Lateralität des Gehirns auch für die Sprachschallwahrnehmung eine Rolle spielt. Als Lateralität bezeichnet man die Tatsache, dass die einzelnen Gehirnhälften für unterschiedliche Aufgaben spezialisiert sind (Hemisphärendominanz). Eine Gehirnhälfte, bei den meisten Menschen die linke, ist dominant für die Sprachverarbeitung zuständig. Der Nachweis, dass bereits beim Hören die Hemisphärendominanz greift, gelang Anfang der 60er Jahre des letzten Jahrhunderts. Bei Versuchspersonen, denen über Kopfhörer auf dem rechten und dem linken Ohr Zahlen, allerdings auf jedem Ohr unterschiedliche, vorgesprochen wurden, zeigte sich ein Vorteil des rechten Ohrs (REA, engl. right-ear advantage). Die Stimuli, die die Probanden auf dem rechten Ohr gehört hatten, konnten sie verlässlicher wiedergeben als die gleichzeitig links dargebotenen. Da sich die dorsalen Hörbahnen kreuzen und das rechte Ohr die neuronale Information direkt an die linke, also an die sprachverarbeitende Hemisphäre weiterleitet, entspricht dieses Ergebnis den Erwartungen. Denn die Informationen des linken Ohrs werden erst später über den sogenannten Balken von der rechten an die linke Gehirnhälfte weitergegeben, die Stimuli auf dem rechten Ohr haben also einen zeitlichen Vorsprung und können mehr Aufmerksamkeit beanspruchen. Wurden den Versuchspersonen dagegen Melodien oder ähnliche nicht-sprachliche akustische Stimuli angeboten, war das linke Ohr im Vorteil. Es ist direkt mit der rechten Gehirnhälfte verbunden, die im Bereich der Verarbeitung von Rhythmus oder Melodien dominant ist: Hier werden 2.4 Perzeptive Phonetik 77 <?page no="78"?> daher bevorzugt Phänomene erfasst, die kontinual und nicht kategoriell strukturiert sind (Pompino-Marschall 3 2009: 168ff.). Die Beobachtungen zur Hemisphärendominanz sprechen dafür, dass wir früh im Wahrnehmungsvorgang zwischen sprachlichen und nicht-sprachlichen akustischen Ereignissen trennen. Auch die Beobachtungen zur Normalisierung von akustischen Daten, die wir beim Sprachhören vollziehen, sind in diesem Zusammenhang auf‐ schlussreich. Wichtig beim Hören von sprachlichen Äußerungen ist ja, dass wir die sprachlichen Zeichen erkennen, unabhängig davon, von wem und in welcher Situation sie ausgesprochen werden. Angesichts der immensen lautlichen Varianz sind dafür eine Reihe von Abstraktionsleistungen erforderlich, die wir vollziehen, ohne dass sie uns bewusst werden. Dies gilt beispielsweise für die sehr große Variation zwischen den einzelnen Sprechern bzw. Sprechertypen. Vergleicht man die Vokalrealisierungen von erwachsenen Männern und Frauen sowie von Kindern, fällt auf, dass die Formanten für ein [a], gesprochen von einem erwachsenen Mann, mit denen des [ɔ], gesprochen von einem Kind, identisch sind. Hier hilft uns unsere Fähigkeit zur Normalisierung. Beim Hören ‘überspringen’ wir die Uneindeutigkeit der akustischen Information; wir hören die gleichen akustischen Daten sofort korrekt als [a], wenn ein Mann spricht, und als [ɔ], wenn stattdessen ein Kind unser Gesprächspartner ist. Wir beurteilen die Informationen also nicht immer gleichbleibend nach absoluten Frequenzwerten, sondern ordnen sie in unterschiedliche Referenzsysteme ein, je nachdem, ob wir einem Kind, einem Mann oder einer Frau zuhören (Abb. 2.4-4). Die bisher angeführten Experimente und ihre Ergebnisse lassen sich sehr gut mit der Vorstellung des modularen Ansatzes in Einklang bringen, Aufgabe des Hörens sei es, schnell und effektiv das variable und kontinuale akustische Ereignis in diskrete und kontextstabile Wahrnehmungskategorien wie beispielsweise Phoneme zu über‐ führen und dabei die kontingenten, also zufälligen, von den phonologisch relevanten lautlichen Eigenschaften zu trennen. In Bezug auf unseren kleinen Verkaufsdialog könnten wir also sagen, dass es die Aufgabe des Käufers ist, die Äußerung der Verkäuferin, die gerade ¡Claro que sí! gesagt hat, zu normalisieren, um die spanischen Phoneme / k/ , / l/ , / a/ usw. korrekt identifizieren zu können. Der Käufer müsste auch da‐ von absehen, dass die Verkäuferin stark erkältet ist und deshalb die ganze Äußerung na‐ salisiert erscheint. Auch die Beobachtung, dass sie mit erhöhter Sprechgeschwindigkeit artikuliert, würde vom Käufer ausgeblendet werden. Beides, die krankheitsbedingte Nasalisierung und das vielleicht persönlichkeitsbedingte Tempo sind nämlich nicht für die Identifizierung der sprachlichen Zeichen relevant. Diese, so der modulare Ansatz, erfolgt ausschließlich durch die Überführung der akustischen Varianz in invariante phonologische Einheiten, in unserem Fall in die Phonemfolgen / klaɾo/ , / ke/ und / si/ , die die Identifizierung der gemeinten Wörter claro, que und sí erlaubt. Derartige Vor‐ stellungen vom Hörvorgang werden aber zunehmend kritisiert. Ein erster Kritikpunkt ist, dass Wahrnehmung und Verarbeitung von kontextueller Varianz durchaus ökonomisch sein können. Es gibt eine Reihe von Experimenten, die zeigen, dass wir das akustische Ereignis im Wahrnehmungsvorgang nicht so drastisch reduzieren, dass 78 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="79"?> nur noch phonologische Information übrigbleibt. Wir verarbeiten und speichern auch individuelle Stimmmerkmale der Sprecher, indexikalische und expressive Merkmale, die für die Interpretation der Äußerung relevant sein können, vor allem aber auch zahlreiche kontextbedingte Variationen der Lautformen. Bei den Plosiven ist dies besonders auffällig. Plosive treten, ausgelöst durch die Koartikulation mit dem folgenden Vokal, in sehr unterschiedlichen Formen auf (2.2.4). Außerdem können Plosive gar nicht wahrgenommen werden, wenn man das folgende Vokalsegment wegschneidet - sie hören sich dann an wie ein nicht sprachliches Glissando bzw. Zirpen (Pompino-Marschall 3 2009: 161). All dies spricht dafür, dass wir Plosive, zusammen mit den Folgevokalen, in mehreren kontextspezifizierten Varianten wahrnehmen bzw. me‐ morieren. Die Speicherung der kontextuellen Varianz bzw. der Koartikulationseffekte zwischen Plosiven und folgenden Vokalen kann sogar strategisch eingesetzt werden. Bereits bei der Konsonantenartikulation hört und sieht man nämlich, welcher der folgende Vokal sein wird, und kann dieses Wissen zur schnelleren Worterkennung nutzen. Abb. 2.4-4: Durchschnittliche Formantwerte englischer Vokale bei Männern (durchgezogen), Frauen (gestrichelt) und Kindern (gedoppelt). Auf der Abszisse sind die F 1 -Werte, auf der Ordinate die F 2 -Werte abgetragen, jeweils in logarithmischer Skalierung (nach Lieberman & Blumstein 1988: 178). Auch das im Spanischen phonologisch nicht relevante Merkmal der Vokallängung können wir strategisch ausdeuten. Vor größeren syntaktischen Einschnitten sind 2.4 Perzeptive Phonetik 79 <?page no="80"?> 35 Unter http: / / www.youtube.com/ watch? v=jtsfidRq2tw&NR=1 lässt sich der sog. McGurk-Effekt sehr gut nachvollziehen. Vokale als Silbenkerne häufig, wenn auch nicht systematisch, länger als gewöhnlich. Es lohnt sich deshalb, Information zur Dauer der lautlichen Segmente zu verarbeiten, auch wenn diese phonologisch gesehen irrelevant ist. Viele Untersuchungen zu den neuronalen Aktivitäten bei der Lautwahrnehmung haben gezeigt, dass wir sehr viele Informationen parallel und vernetzt verarbeiten können. Die Annahme, die Aufgabe des Hörens sei es, irrelevante lautliche Information auszusondern und nur das übrig zu lassen, was zur Identifizierung der Phoneme wichtig ist, muss deshalb hinterfragt werden (Pisoni & Levi 2007, Nguyen 2012). Mit der Beobachtung, dass wir beim Wahrnehmen von Sprachschall nicht aus‐ schließlich nach phonologisch relevanter Information suchen, stimmt auch die Tat‐ sache überein, dass unsere Perzeption in der face-to-face-Interaktion systematisch multimodal ist und nicht nur akustische, sondern auch andere Wahrnehmungsdaten bei der Interpretation des Gehörten verwendet (Rosenbaum 2005). In einem Experi‐ ment stellte man fest, dass Versuchspersonen, die die Silbe [ba] hörten, die aber auf dem Bildschirm einen stumm geschalteten Sprecher sahen, der die Silbe [ɡa] äußerte, beide Wahrnehmungsdaten weiterverarbeiteten. Sie reagierten gleichzeitig auf die auditive und die visuelle Information und ‘hörten’ deshalb den zwischen dem akustischen und optischen Stimulus liegenden Plosiv [da] (McGurk & MacDonald 1976). 35 Selbstverständlich handelt es sich um eine künstliche Versuchsanordnung. Aber auch unser Alltagswissen sagt uns, dass wir die Mundbewegungen unserer Kommunikationspartner als Informationsquelle nutzen, um das Gesagte zu erkennen. Wir sind als Hörer auch ohne weiteres imstande, defektive lautsprachliche Stimuli korrekt zu verarbeiten. Wir können Stimuli, in denen essentielle Bestand‐ teile, etwa distinktive Merkmale, ganze Segmente oder sogar die Grundfrequenz F 0 , fehlen, trotz dieser akustischen Unvollständigkeit interpretieren. In einer bekannten Versuchsanordnung ließ man Probanden englische Wörter hören, in denen eines der Segmente durch eine Pause oder durch Hüsteln ersetzt war. Die Probanden identifizierten das Wort dennoch. Auffälliger war, dass ihnen das Fehlen eines Lauts gar nicht bewusst wurde. Sie waren vielmehr der Überzeugung, ein vollständiges Wort gehört zu haben (Samuel 1981). Solche perzeptiven Ergänzungen und Reparaturen nehmen wir übrigens nicht nur im Laborversuch vor. Auch Daten, die über das Telefon übertragen werden, sind im Vergleich zu normalen lautsprachlichen Daten akustisch gesehen defektiv. Aus Kostengründen ist das übertragene Frequenzspektrum reduziert und endet im oberen und unteren Bereich früher als das Spektrum, das in der Lautproduktion ausgenutzt wird. Was den unteren Frequenzbereich anbelangt, hat dies zur Konsequenz, dass wir am Telefon keine F 0 -Frequenzen hören. Automatisch und unbewusst erschließen wir aber dennoch aus den übrigen akustischen Informationen den Verlauf des Grundtons, der ja für das Erkennen der Intonation zentral ist (4.5). Genauso wenig können wir am Telefon die beiden Frikative [s] und [f] voneinander 80 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="81"?> trennen, da sich diese ausschließlich durch die unterschiedlichen Friktionskonzentra‐ tionen im ausgeblendeten oberen Frequenzbereich unterscheiden. Wir sind deshalb auf unser semantisches Wissen angewiesen, um Reif und Reis am Telefon richtig zu interpretieren (Goldstein 7 2008: 285). Zahlreiche Experimente haben außerdem nachgewiesen, dass eine lexikalische Beeinflussung des Hörvorgangs auch bei normalen, nicht-defektiven Stimuli die Regel ist. Dies zeigten Experimente, in denen man englischsprachige Probanden ein akustisches Kontinuum zwischen dem stimmhaften und dem stimmlosen Plosiv [d] und [t] zusammen mit zwei alternativen Fortsetzungen, nämlich [æʃ] wie in dash und [ɑːsk] wie in task, hören ließ. Die lautlichen Kategorisierungen, die die Probanden vornahmen, waren durch den Wunsch bestimmt, als Ergebnis ein sinnvolles Lexem angeben zu können. Bei der Präsentation des Stimulus [æʃ] wurden signifikant mehr [d] und bei der Präsentation des Stimulus [ɑːsk] signifikant mehr [t] identifiziert (Ganong 1980). Man stellte außerdem fest, dass die Probanden dann, wenn die dargebotenen Fortsetzungen zu unterschiedlich häufig gebrauchten Lexemen gehörten, genau die lautliche Einordnung wählten, deren Ergebnis das frequentere Lexem war, also dasje‐ nige, das in normaler Sprache häufiger vorkommt. Auch die Frage, ob es sich bei der abgefragten Lautfolge um eine häufige Kombination handelte oder nicht, oder die Frage, ob das von den Probanden erzielte Perzeptionsergebnis mit den grammatischen Regeln der betreffenden Sprache übereinstimmte, beeinflusste die Einordnung der dargebotenen lautlichen Stimuli (Kingston 2005: 187, Pierrehumbert 2012). In anderen Perzeptionstests, in denen es um die Wahrnehmung von wortähnlichen Lautketten vor einem komplexen lautlichen Hintergrund ging, stellte man fest, dass die Identifikation echter Lexeme wesentlich leichter ist als die von Nonsenswörtern. Ebenso werden unter schlechten akustischen Bedingungen häufig vorkommende Lexeme schneller und sicherer identifiziert als selten gebrauchte (Kingston 2005: 187). Diese Experimente belegen, dass unsere lautliche Wahrnehmung auch durch die Frequenz, also durch die Vorkommenshäufigkeit der jeweiligen Formen geprägt ist. Formen mit einer höheren Gebrauchsfrequenz können schneller und sicherer aufgerufen werden, sind also anders ‘präsent’ als seltene Lexeme. Auch was den Zeitpunkt der Worterkennung betrifft, stellte man eine Beeinflus‐ sung des Hörvorgangs durch lexikalisches Wissen fest. Viele Experimente konnten nachweisen, dass es nicht notwendig ist, die gesamte Lautfolge zu hören, bevor die Identifikation des Lexems einsetzt. In vielen Fällen reichen der Anfang bzw. die Anfangssilbe des Wortes aus, um die Probanden zu einem Identifizierungsvorschlag - und zwar einem richtigen - zu veranlassen. Auf der Grundlage dieser Daten formulierte William Marslen-Wilson sein berühmtes Kohortenmodell, in dem er vorschlug, dass der Hörer, sobald das oder die ersten Phoneme identifiziert sind, sofort Kohorten von Lexemen mit derselben Phonemfolge aktiviert und nur solange mit der Phonemanalyse 2.4 Perzeptive Phonetik 81 <?page no="82"?> 36 Zu einer Neuformulierung des Modells, bei der nicht mehr vom Erkennen von Phonemen, sondern vom Erkennen von Merkmalen ausgegangen wird, vgl. Lahiri (2012). fortfährt, bis nur noch ein Kandidat übrigbleibt (Marslen-Wilson 1989). 36 Auch andere Worterkennungsmodelle, etwa das bekannte TRACE-Modell von James McClelland und Jeffrey Elman, gehen von einer frühen Vernetzung akustischer und lexikalischer Informationen aus (McClelland & Elman 1986, Gaskell 2007). Die angesprochenen Experimente zeigen, dass ein akustisches weniger die Kommu‐ nikation nicht gefährdet, weil die kontextuelle Einbettung des Sprachsignals bereits sehr früh Inferenzen und Reparaturen ermöglicht. Viele Perzeptionsdaten deuten außerdem darauf hin, dass bereits vor der vollständigen Identifikation der Phonem‐ kette Hypothesenbildungen über die ausgesprochenen Lexeme einsetzen. In diese Richtung weisen auch funktionale Überlegungen. Primäres Ziel des Hörens muss sein, dem Gesagten Bedeutung zuschreiben zu können, nicht, das lautliche Ereignis zweifelsfrei zu identifizieren (McMurray & Farris-Trimble 2012: 373). Wenn wir diese funktionale Zielbestimmung berücksichtigen, wird klar, dass Kommunikation auch ohne eine explizite Phonemerkennung erfolgreich sein kann. Bereits Karl Bühler hat diesen Gedanken geäußert. Er hat zwei Herangehensweisen an die akustischen Daten nebeneinandergestellt: eine erste, die ausgehend von einigen besonders prägnanten Lautmerkmalen und unter Rückgriff auf die kontextuellen Informationen eine schnelle lexikalische Identifizierung vornimmt, die so lange gilt, wie der weitere Verlauf des Gesprächs mit dieser Identifizierung zu vereinen ist. Erst wenn Schwierigkeiten auftreten, wird eine zweite Strategie gewählt, die auf dem sorgfältigeren Zuhören und der intensiven Nutzung aller verfügbaren akustischen Information beruht und in eine eindeutige Identifizierung der Phonemkette mündet (Bühler 1934: 271ff., Krefeld 1999: 129-144). Ein solches Nebeneinander unterschiedlicher kognitiver Strategien würde bedeuten, dass bei gesteigerter Aufmerksamkeit (wie im Laborversuch) eine phonematische Analyse und die Identifikation vollständiger Phonemketten Ziel unse‐ res Hörens ist, dass aber in zahlreichen anderen Routinekontexten eine approximative auditive Analyse und eine spekulative lexikalische Identifizierung ausreichen. Es ist ein Kennzeichen menschlichen Wahrnehmens und Erkennens, dass es nicht oder nicht nur nach den Maßgaben eines algorithmischen Modells verläuft, bei dem in hierarchisch aufeinander aufbauenden Verarbeitungsstufen Ergebnisse erzielt werden, die durch das Durchlaufen zahlreicher Verarbeitungs- und Kontrollschritte vereindeu‐ tigt sind. Menschen benutzen auch und vielleicht sogar häufiger probabilistische Heuristiken, schnelle Schlüsse auf etwas, von dem wir zwar nicht sicher sind, dass es richtig ist, bei dem wir aber aufgrund unserer Erfahrung quasi sicher sein können (Goldstein 7 2008: 112). Derartige schnelle, vorläufige - und natürlich auch revidierbare - Schlüsse können wir bei der Sprachwahrnehmung ziehen, weil uns auch in frühen Verarbeitungsstufen sprachliches Wissen zur Verfügung steht, das wir aus unserer Erfahrung abgeleitet haben. 82 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="83"?> 37 Dieses Teilkapitel folgt über weite Strecken den entsprechenden Ausführungen in Hualde (2005) und Kubarth (2009), ohne dass dies jeweils gesondert angezeigt wird. 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv In diesem Unterkapitel wollen wir die Sprachlaute des Spanischen unter Einbeziehung regionaler Variation anhand phonetischer Kriterien beschreiben und sie mit denen des Deutschen vergleichen. Dafür müssen wir große Abstraktionen vornehmen: Wie wir in den vorangehenden Abschnitten gesehen haben, fallen zwei Lautereignisse, auch wenn sie als gleich intendiert werden, nie völlig identisch aus, und Laute, die wir aufgrund unserer kategorialen Wahrnehmung auditiv als gleich empfinden, können durch die Erscheinung der Koartikulation (vgl. 2.2.4) artikulatorisch und akustisch sogar erhebliche Unterschiede aufweisen. Von all dieser individuellen und umgebungs‐ bedingten Variation der einzelnen Laute sehen wir ab und fassen phonetisch ähnliche Realisierungen zusammen. Bei dem, was wir - untergliedert in Konsonanten (2.5.1), Approximanten (2.5.2) und Vokale (2.5.3) - hier als Sprachlaute vorstellen, handelt es sich folglich um ganze Klassen von ähnlichen Lauten, die wir einheitlich transkribieren und in einer ‘normalisierten’ Form beschreiben. Auch wenn die Phoneme des Spani‐ schen erst in Abschnitt 3.1.2 systematisch behandelt werden, weisen wir bereits hier - u. a. durch die Notierung in Schrägstrichen bzw. eckigen Klammern - darauf hin, welche dieser Lautklassen welchen Phonemen zuzuschlagen sind. 37 2.5.1 Konsonanten In Abb. 2.5-1 sind die Konsonanten des Spanischen, des Deutschen sowie weiterer (vor‐ nehmlich romanischer) Sprachen zusammengestellt. Segmente, die in allen Varietäten des Spanischen mit Phonemstatus vertreten sind, erscheinen groß, fett und schwarz. Für die ebenfalls groß, aber nicht fett gedruckten Symbole gilt dieser Status nur in bestimmten Regionen des spanischen Sprachraums. Die kleineren schwarzen Zeichen stehen für allophonische Varianten. Nicht oder nur marginal im Spanischen, dafür aber in anderen (romanischen) Sprachen und/ oder im Deutschen auftretende Konsonanten erscheinen kleiner und grau. 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 83 <?page no="84"?> 38 Da bei der Artikulation von sp. [t] und [d] die Zungenspitze die Rückseite der oberen Schneidezähne berührt, werden sie oft als (apiko)dental charakterisiert (vgl. z. B. Hualde 2005: 47). Unter Berufung auf Ladefoged & Maddieson (1996: 21) und Navarro Tomás ( 19 1977: 97) weist Martínez Celdrán (2008: 43f.) darauf hin, dass der Kontaktbereich die Alveolen miteinschließe, sodass die korrekte Beschreibung der Artikulationsstelle ‘lamino-denti-alveolar’ sei. Abb. 2.5-1: Konsonanten des Spanischen (und einiger anderer Sprachen). 2.5.1.1 Plosive und Frikativapproximanten Wie viele andere Sprachen (u. a. das Deutsche) verfügt das Spanische über drei Reihen von Plosiven, die nach der Artikulationsstelle in (bi-)labiale, alveolare (bzw. denti-alveolare 38 ) und velare Verschlusslaute unterteilt werden. Aus der Perspektive der beteiligten Zungenpartie (Zungenkranz oder Zungenrücken) werden die beiden letzteren auch als koronale bzw. dorsale Plosive gefasst. Alle drei können jeweils stimmlos und stimmhaft auftreten: / p t k/ und / b d ɡ/ . Die stimmlosen Plosive des Spanischen kommen vornehmlich am Wort- und Silbenanfang vor. Gemeinsam mit einem Liquid (/ l/ oder / ɾ/ , nach / t/ nur / ɾ/ ) können sie auch einen komplexen Anfangsrand bilden. In der Schreibung entsprechen ihnen in der Regel die Buchstaben <p>, <t>, <c>. Für / k/ steht vor <e> und <i> das Digraphem <qu>. 84 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="85"?> 39 Traditionell zählen die approximantischen Realisierungen der stimmhaften Plosive des Spanischen zu den Frikativen (vgl. Navarro Tomás 19 1977: 80 u. v. a.). Um den Approximantenstatus in der Transkription deutlich zu machen, wird ihrem IPA-Symbol bisweilen das (sub- oder supraskribierte) Diakritikon [˕] hinzugefügt, das für Senkung steht (so z. B. in NGRAE 2011). Der Einfachheit halber verzichten wir hier auf dieses zusätzliche Zeichen, haben [β ð ɣ] in Abb. 2.5-1 jedoch auch unter den Approximanten aufgeführt. stimmlose Plosive / p/ [p] [pan] pan ‘Brot’ [ ˈ sopa] sopa ‘Suppe’ - - [plan] plan ‘Höhe’ [ ˈ kompɾa] compra ‘Einkauf ’ / t/ [t] [tan] tan ‘so’ [ ˈ lata] lata ‘Dose’ - - [ ˈ tɾaxe] traje ‘Anzug’ [ ˈ letɾa] letra ‘Buchstabe’ / k/ [k] [kal] cal ‘Kalk’ [a ˈ ki] aquí ‘hier’ - - [kɾwel] cruel ‘grausam’ [ ˈ tekla] tecla ‘Taste’ Die Distribution der stimmhaften Plosive des Spanischen ist stark eingeschränkt. Als Plosive [b d ɡ] kommen sie nur nach Pause (d. h. im absoluten Anlaut) oder aber nach Nasalkonsonant vor, [d] außerdem nach Lateral (vgl. Abb. 2.5-3, links und Mitte). In allen anderen Positionen - wenn ihnen also weder eine Pause noch ein homorganer, d. h. an derselben Artikulationsstelle gebildeter Konsonant vorangeht - unterliegen sie der sog. Spirantisierung (sp. espirantización): Lippen oder Zunge bilden kei‐ nen kompletten Verschluss, sondern nur eine mehr oder weniger eingeschränkte Enge, durch die die Luft wie im frikativischen Artikulationsmodus ausströmt. Dies geschieht jedoch in der Regel ohne Erzeugung des für Frikative charakteristischen Reibegeräuschs, was sich anhand von spektrographischen Analysen demonstrieren lässt: Das aperiodische Friktionsrauschen der Frikative fehlt hier; stattdessen wird eine deutliche Formantstruktur sichtbar (vgl. Abb. 2.5-3, rechts). Es erscheint daher sinnvoll, diese allophonischen Varianten der stimmhaften Plosive als Approximanten zu klassifizieren (vgl. Martínez Celdrán 1991, 2008). Um die phonetische Nähe zu den Frikativen aufzuzeigen, schlagen wir in Anlehnung an sp. aproximantes espirantes das Kompositum ‘Frikativapproximanten’ vor, denn zur Transkription dieser Laute werden die IPA-Zeichen für Frikative verwendet: [β ð ɣ]. 39 Während [β] und [ɣ] dieselben Artikulationsstellen aufweisen wie [b] und [ɡ], wird die Enge bei der approximantischen Realisierung von / d/ zwischen Zungenspitze und Zähnen gebildet; es handelt sich also um einen (inter)dentalen Laut. Auch / b d ɡ/ können zusammen mit den Liquiden / ɾ/ oder / l/ (/ d/ nur mit / ɾ/ ) einen komplexen Onset bilden. Wie aus den folgenden Beispielen ersichtlich wird, ist im Fall von [b]/ [β] die Schreibung mit <b> oder <v> für die Aussprache völlig irrelevant; entscheidend für die Lautung ist allein der Kontext: Ein vorn mit <v> geschriebenes Wort wird nach einer Pause oder nach einem unmittelbar vorangehenden Nasalkonsonanten genauso mit anlautendem [b] gesprochen wie ein mit dem Buchstaben <b> beginnendes. Im 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 85 <?page no="86"?> 40 Im neuesten Regelwerk zur spanischen Orthographie wird empfohlen, den Namen des Buchstabens <v> zu uve zu vereinheitlichen (ORTE 2010: 69). Fall des vorangehenden Nasalkonsonanten erfolgt - wiederum unabhängig von der Schreibung - seine automatische Anpassung an den bilabialen Plosiv: Er wird folglich immer bilabial (als [m]) gesprochen (vgl. 2.5.1.3). In allen anderen Fällen werden <b> und <v> unterschiedslos als [β] realisiert. Spanischsprachige Kinder können also hier die Schreibung nicht aus der Aussprache herleiten, sondern müssen für jedes Wort lernen, ob es mit <b> (b [be] alta, b de burro) oder <v> (v [be] 40 baja oder corta, v de vaca) geschrieben wird. / d/ wird durch <d> wiedergegeben und / ɡ/ durch <g>, außer vor <e> und <i>, wo das Digraphem <gu> stehen muss. stimmhafte Plosive / b/ [b] nach Pause nach Nasalkonsonant - - [ban] van ‘sie gehen’ [um ˈ baso] un vaso ‘ein Glas’ - - [ ˈ bote] bote ‘Schlag’ [um ˈ bote] un bote ‘ein Schlag’ - - [ ˈ bɾasa] brasa ‘Glut’ [tam ˈ blaŋko] tan blanco ‘so weiß’ - [β] in allen anderen Positionen - - [se ˈ βan] se van ‘sie gehen fort’ [dez ˈ βan] desván ‘Speicher’ - - [la ˈ βata] la bata ‘der Kittel’ [ ˈ aɾβol] árbol ‘Baum’ - - [ ˈ koβɾe] cobre ‘Kupfer’ [a ˈ βlaɾ] hablar ‘sprechen’ / d/ [d] nach Pause nach Nasalkonsonant, nach Lateral - - [dan] dan ‘sie geben’ [un ˈ disko] un disco ‘eine Scheibe’ - - [ ˈ dɾama] drama ‘Drama’ [el ˈ disko] el disco ‘die Scheibe’ - [ð] in allen anderen Positionen - - [lo ˈ ðan] lo dan ‘sie geben es’ [loz ˈ ðan] los dan ‘sie geben sie’ - - [ ˈ paðɾe] padre ‘Vater’ [ez ˈ ðɾuxulo] esdrújulo ‘drittletztbe‐ tont’ 86 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="87"?> 41 [ɡ] entsteht auch, wenn der Gleitlaut [w] nach Pause oder nach Nasal verstärkt wird wie z. B. in [ ˈ weso] ~ [ ˈ ɡweso], [koŋ ˈ ɡweso] (con) hueso ‘(mit) Knochen’, [ ˈ wiski] ~ [ ˈ ɡwiski] whisky/ güis‐ qui ‘Whisky’ oder [ ˈ wa(t)sa(p)] ~ [ ˈ ɡwa(t)sa(p)] WhatsApp (vgl. 2.5.2). / ɡ/ [ɡ] nach Pause 41 nach Nasalkonsonant - - [ɡi ˈ sante] guisante ‘Erbse’ [uŋɡi ˈ sante] un guisante ‘eine Erbse’ - - [ ˈ ɡɾato] grato ‘angenehm’ [koŋ ˈ ɡlosas] con glosas ‘mit Glossen’ - [ɣ] in allen anderen Positionen - - [ ˈ aɣo] hago ‘ich mache’ [ ˈ alɣo] algo ‘etwas’ - - [ ˈ loɣɾo] logro ‘Gewinn’ [aɣluti ˈ naɾ] aglutinar ‘aufkleben’ Abb. 2.5-2 zeigt in sog. Sagittalschnitten die Stellung der Sprechwerkzeuge bei der Artikulation der spanischen Plosive und Frikativapproximanten. Abb. 2.5-2: Sagittalschnitte der Artikulation spanischer Plosive und Frikativapproximanten (nach Kubarth 2009: 99, 102, 108). In Abb. 2.5-3 werden Spektrogramme von spanischen Äußerungen mit den verschie‐ denen Realisierungen der stimmhaften Plosive vorgestellt. Während [b] in bueno (nach Pause) und [d] in cual de ellos (nach Lateral) als stimmhafte Plosive den charakteristischen schmalen senkrechten Streifen der Verschlusslösung (engl. burst) aufweisen, setzt sich das Signal während des [β] in der Flexionsendung der Verbform soplaba unter leichter Absenkung und Schwächung der Formanten kontinuierlich fort. Vergleicht man die stimmhaften Plosive [b] und [d] mit den stimmlosen Plosiven [k] und [p] in cual und soplaba, so fällt auf, dass sich letztere nicht nur durch das Fehlen der voice bar von ersteren unterscheiden, sondern dass ihre Verschlussphase auch deutlich länger ist. 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 87 <?page no="88"?> Abb. 2.5-3: Spektrogramme, links: sp. bueno (nach Pause), Mitte: sp. cual de ellos, rechts: sp. soplaba. Festzuhalten ist, dass die komplementäre Distribution, das Auftreten in einander ausschließenden Kontexten, wie wir es soeben für die Allophone [b d ɡ] und [β ð ɣ] der stimmhaften Plosive präsentiert haben, eine (für Lerner hilfreiche) Vereinfachung darstellt. In der Realität haben wir es eher mit einem Kontinuum zu tun, das vom kompletten Verschluss bis zur vollständigen Tilgung reicht. Neben der lautlichen Umgebung steuern auch diatopische, diastratische und diaphasische Faktoren die tatsächliche Realisierung (vgl. dazu ausführlich NGRAE 2011: 144ff.). Da offene Silben im Spanischen bevorzugt werden (vgl. 4.2.4), sind Plosive in der Coda prinzipiell in einer schwachen Position, in der sie Neutralisierungs- und Tilgungsprozessen unterliegen. Den Tendenzen zur Öffnung der Silbe stehen jedoch etymologisierende Normierungsbestrebungen entgegen, wie sie zumindest teilweise für die Arbeit der Real Academia Española kennzeichnend sind. Sie haben dazu geführt, dass in der spanischen Orthographie viele der bereits im Schwinden begriffenen Konsonanten am wortinternen Silbenende ‘festgeschrieben’ wurden, weshalb sie heute - zumindest in einer gepflegten Aussprache - auch in der Lautung wieder präsent sind. Allerdings ist der Kontrast zwischen den stimmlosen und den stimmhaften Plosiven in der wortinternen Coda neutralisiert; als Standardaussprache kann - unabhängig von der Schreibung - der stimmhafte Frikativapproximant gelten, doch auch der stimmhafte oder, in emphatischer Sprechsituation, der stimmlose Plosiv sind möglich. Plosive in der wortinternen Coda [β ~ p] óptimo [ ˈ oβtimo] ~ [ ˈ obtimo] ~ [ ˈ optimo] ‘optimal’ - obtiene [oβ ˈ tjene] ~ [ob ˈ tjene] ~ [op ˈ tjene] ‘er/ sie erhält’ [ð ~ t] étnico [ ˈ eðniko] ~ [ ˈ edniko] ~ [ ˈ etniko] ‘ethnisch’ - admirar [aðmi ˈ ɾaɾ] ~ [admi ˈ ɾaɾ] ~ [atmi ˈ ɾaɾ] ‘bewundern’ [ɣ ~ k] signo [ ˈ siɣno] ~ [ ˈ siɡno] ~ [ ˈ sikno] ‘Zeichen’ - pacto [ ˈ paɣto] ~ [ ˈ paɡto] ~ [ ˈ pakto] ‘Pakt’ Am Wortende ist im Spanischen nur der Plosiv / d/ möglich, der auch in dieser Position meist als Frikativapproximant [ð] realisiert wird. Vor allem umgangssprachlich und 88 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="89"?> in mehrsilbigen Wörtern ist aber auch die komplette Tilgung verbreitet, während in Nordspanien hier oft der stimmlose interdentale Frikativ [θ] artikuliert wird. Andere Plosive treten wortfinal nur in Entlehnungen auf, und zwar wenn eine ausgangssprach‐ liche - schriftorientierte - Aussprache angestrebt wird. Aber auch hier kommt es häufig zu Neutralisierungen oder vollständigen Tilgungen, die teilweise auch in die Schreibung eingegangen sind. Plosive in der wortfinalen Coda / d/ <-d> [ð ~ θ ~ 0̷] [sa ˈ luð] ~ [sa ˈ luθ] ~ [sa ˈ lu] salud ‘Gesund‐ heit’ - <-t> [t ~ ð ~ 0̷] [ʧa ˈ let] ~ [ʧa ˈ leð] ~ [ʧa ˈ le] chalet/ chalé ‘Landhaus’ - <-g> [ɣ ~ x ~ k ~ 0̷] [ise ˈ βeɾɣ] ~ [- ˈ βeɾx] ~ [- ˈ βeɾk] ~ [- ˈ βeɾ] iceberg ‘Eisberg’ - <-c/ -k> [k ~ ɣ ~ 0̷] [ko ˈ ɲak] ~ [ko ˈ ɲaɣ] ~ [ko ˈ ɲa] coñac/ coñá ‘Cognac’ - <-b> [β ~ b ~ 0̷] [kluβ] ~ [klub] ~ [klu] club ‘Club’ - <-p> [p ~ b ~ β ~ 0̷] [ ˈ keʧup] ~ [ ˈ keʧub] ~ [ ˈ keʧuβ] ~ [ ˈ keʧu] kétchup ‘Ketchup’ Abgesehen davon, dass das Deutsche keine Frikativapproximanten kennt, unterschei‐ den sich deutsche und spanische Plosive vor allem durch die Erscheinungen der Aspiration und der Entstimmung. Beides wird heute meist durch die Ermittlung der VOT [viː.oʊ̯.tiː] genauer erfasst. Diese Abkürzung steht für voice onset time; gemeint ist damit die in Millisekunden (ms) gemessene Zeit, die nach - oder auch vor - der Lösung eines Verschlusses und dem Einsetzen der Stimmlippenschwingung vergeht. Die Verschlusslösung stellt dabei für die VOT immer den Nullpunkt dar. Die Zeit von der Lösung des Verschlusses bis zum Schwingen der Stimmlippen wird als positive VOT bezeichnet (rechts vom Nullpunkt); der Zeitraum, in dem die Stimmlippen vor der Lösung des Verschlusses bereits schwingen (also links vom Nullpunkt), gilt als negative VOT (vgl. Abb. 2.5-4). Bei der Artikulation der stimmlosen Plosive im Spanischen beginnen die Stimm‐ lippen im Moment der Verschlusslösung zum Vokal oder ganz kurz darauf zu vibrieren. Im Deutschen dagegen wird dieser Prozess in der Regel verzögert, sodass zwischen Plosiv und Vokal noch ein Geräuschlaut hörbar wird: Die stimmlosen Plosive werden in fast allen Positionen mehr oder weniger stark aspiriert. In enger Transkription des Deutschen wird die Aspiration durch ein kleines hochgestelltes [ h ] nach dem Zeichen für den Plosiv symbolisiert. Die stimmlosen Plosive des Spanischen haben folglich eine kurze positive VOT (zwischen null und ca. 30 ms) - man spricht hier auch von einer kurzen Verzögerung (engl. short lag). Die stimmlosen Plosive des Deutschen haben hingegen eine deutlich längere positive VOT (zwischen 40 und 100 ms) und damit eine lange Verzögerung (engl. long lag) (vgl. Abb. 2.5-4). 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 89 <?page no="90"?> Bei voll stimmhaften Plosiven beginnt die Schwingung der Stimmlippen gleich‐ zeitig mit der Verschlussbildung. Die Stimmhaftigkeit setzt also bereits vor der Ver‐ schlusslösung und dem Vokaleinsatz ein, und es ergibt sich folglich eine (relativ lange) negative VOT (auch als pre-voicing bezeichnet). Verzögert sich dagegen der Schwingungseinsatz, wird die negative VOT kürzer, und die Plosive sind nur partiell stimmhaft; sie werden mehr oder weniger stark desonorisiert. Im Extremfall erfolgt der Stimmeinsatz erst mit dem Beginn des Vokals. Dann sind diese stimmhaften Plosive eigentlich nicht mehr stimmhaft, sondern vollständig desonorisiert; die VOT liegt bei null oder gar etwas darüber, was dazu führt, dass sich für dt. Gatte ähnlich kurze positive VOT-Werte ergeben können wie bei sp. cama. Die Entstimmung wird in der Transkription durch einen kleinen Kreis unter oder über dem Zeichen für den stimmhaften Plosiv angezeigt: [b̥ d̥ ɡ̊ ] . Von den stimmlosen Plosiven des Deutschen unterscheiden sich solche desonorisierten Plosive nur durch die fehlende Aspiration. In Abb. 2.5-4 ist die zeitliche Koordination der Stimmlippen für diese Erscheinungen am Beispiel der bilabialen Plosive schematisch dargestellt. Abb. 2.5-4: Schematische Darstellung der Realisierung stimmloser und stimmhafter Plosive im Deut‐ schen und im Spanischen am Beispiel von / p/ und / b/ . In Oszillogramm und Spektrogramm ist die lange positive VOT (long lag), die auditiv als Behauchung wahrgenommen wird, als aperiodisches Friktionsrauschen zu erkennen. In Abb. 2.5-5 (rechts oben) wird dies anhand des anlautenden / k/ von dt. Kappe deutlich: Die VOT beträgt 91 ms; es handelt sich also um eine für die stimmlosen Plosive des Deutschen typische aspirierte Realisierung ([k h ]). Hält man sich ein Stück dünnes Papier, eine Feder oder die Flamme einer brennenden Kerze dicht vor den Mund, während man Wörter wie dt. Panne, Tal oder Kappe ausspricht, werden Papier, Feder 90 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="91"?> 42 Allerdings sind auch im Deutschen nicht alle Realisierungen der stimmlosen Plosive / p t k/ aspiriert: Nach anlautendem [ʃ], also in Wörtern wie [ʃtaːl] Stahl (gegenüber [t h aːl] Tal) oder [ ˈ ʃpanə] Spanne (gegenüber [ ˈ p h anə] Panne) liegt auch hier keine lange positive VOT und damit auch keine Behauchung vor. Solche Wörter sind also ein guter Ausgangspunkt, um die Artikulation der nicht-aspirierten stimmlosen Plosive des Spanischen zu üben. Auf die Herausforderungen der VOT-bedingten Unterschiede zwischen den spanischen und den deutschen Plosiven beim Fremdsprachenlernen kommen wir in 5.3.1 zurück. oder Flamme durch die Aspiration in viel stärkere Bewegung versetzt, als es bei den nicht-aspirierten spanischen Plosiven wie in pan, tapas oder cama der Fall ist. Wie in Abb. 2.5-5 (Mitte links) zu sehen ist, beträgt die VOT des anlautenden / k/ von sp. cama hier nur 25 ms. Verglichen mit der long lag-Realisierung des Deutschen ist die deutlich kürzere Verzögerung des Stimmeinsatzes im Spanischen als short lag einzustufen. 42 Betrachten wir nun die Aussprache der stimmhaften Verschlusslaute am Beispiel von dt. Gatte und sp. gama in Abb. 2.5-5 etwas genauer: Der deutsche Muttersprachler realisiert das anlautende / ɡ/ mit einer kurzen positiven VOT von 30 ms (Mitte rechts), also als entstimmtes [ ɡ̊ ], was auf phonetischer Ebene ungefähr der Aussprache des / k/ in sp. cama durch den spanischen Muttersprachler entspricht (jeweils: short lag). Die / ɡ/ -Aussprache des spanischen Muttersprachlers ist hingehen durch volle Stimmhaftigkeit (pre-voicing) gekennzeichnet, was anhand der negativen VOT von -117 ms und der deutlich erkennbaren voice bar ersichtlich wird (links unten). Wir haben bereits angesprochen, dass der Unterschied zwischen stimmlosen und stimmhaften Plosiven im Deutschen anders als im Spanischen nicht in der Aktivität der Stimmlippen begründet ist, sondern aufgrund der An- oder Abwesenheit der Aspiration wahrgenommen wird: Einen nicht aspirierten Plosiv (mit kurzer positiver VOT, short lag) hören wir als stimmhaft, auch wenn die Stimmlippen gar nicht schwingen. Das wird auch in Abb. 2.5-6 deutlich, wo der Unterschied zwischen / p/ in Tanzpaar und / b/ in Tanzbar allein in der Aspiration des ersteren liegt. Beim / b/ in Tanzbar gibt es keine voice bar, und auch das Oszillogramm zeigt keine Schwingungen an; es ist also völlig entstimmt. 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 91 <?page no="92"?> Abb. 2.5-5: Oszillo- und Spektrogramme der ersten Silben / ka/ von sp. cama und / ɡa/ von sp. gama (links) sowie / ka/ von dt. Kappe und / ɡa/ dt. Gatte (rechts). Die VOT ist jeweils in der zweiten Zeile der TextGrids in Millisekunden (ms) angegeben. S = Beginn der Stimmhaftigkeit, VL = Verschlusslösung. Abb. 2.5-6: Oszillo- und Spektrogramme, links: dt. Tanzpaar, rechts: dt. Tanzbar. 2.5.1.2 Frikative und Affrikaten Bei den Frikativen zeichnen sich die verschiedenen Dialekte des Spanischen durch vielfältige Variation aus. Während das kastilische Spanisch, das oft als europäischer Standard gilt, mit / f θ s x/ über vier stimmlose Frikativphoneme verfügt, kennt der lateinamerikanisch-südspanische Standard mit / f s x/ nur drei davon. Gemeinsam ha‐ 92 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="93"?> 43 In ländlichen Gebieten Spaniens und Lateinamerikas kommt daneben auch die Realisierung als stimmloser bilabialer Frikativ [ɸ] vor, den Pompino-Marschall ( 3 2009: 101) als ‘Suppenblaselaut’ bezeichnet hat. ben alle Varietäten, dass die entsprechenden stimmhaften Frikative zwar aufgrund von Assimilationen, also Anpassungen an die lautliche Umgebung, vorkommen können, aber nirgends als Phoneme des Spanischen vertreten sind. Von den stimmlosen Frikativphonemen wird nur / f/ überall relativ einheitlich als labiodentaler Frikativ [f] realisiert. 43 Außer in Lehnwörtern tritt dieser Konsonant nur am Wort- und Silbenanfang auf, wo ihm noch ein Liquid folgen kann. Kommt er in der Coda vor, so gibt es auch hier Schwächungsprozesse, die bis zu vollständiger Tilgung gehen können. Vor einem stimmhaften Konsonanten wird / f/ in der Coda sonorisiert: Dies ist die einzige Konstellation, in der im Spanischen der stimmhafte labiodentale Frikativ [v] (vgl. dt. [vas] was) möglich ist. In der Graphie steht für / f/ immer <f>. labiodentaler Frikativ / f/ [f] [ ˈ feo] feo ‘hässlich’ [fo ˈ netika] fonética ‘Phonetik’ - - [floɾ] flor ‘Blume’ [ ˈ kofɾe] cofre ‘Kiste’ - - [roz ˈ βi f ] rosbif ‘Roastbeef ’ [av ˈ ɣano] Afgano ‘Afghane’ Die übrigen stimmlosen Frikative weisen deutliche regionale Unterschiede auf: Bei der Aussprache von / s/ im kastilischen Spanisch wird die Enge zwischen der Spitze der längsgerillten Zunge und dem Zahndamm gebildet; der Konsonant ist also apikoalveolar, was in enger Transkription durch ein nach oben offenes Rechteck (für apikal) unter dem Zeichen angezeigt werden kann: [ s ̺ ]. Wegen der nach unten durchgebogenen Zunge wird dieses [ s ̺ ] im Spanischen auch als ese cóncava bezeichnet. Im lateinamerikanischen (und südeuropäischen) Spanisch wird / s/ dagegen mit stärker vorgeschobenem längsgerillten Zungenkörper artikuliert, sodass die Enge, wie in der Regel auch im Deutschen, zwischen Alveolen und Zungenblatt gebildet wird. Dieser s-Laut wird als prädorsoalveolar vom apikoalveolaren kastilischen [ s ̺ ] unterschieden; wegen der nach oben gewölbten Zunge heißt er im Spanischen auch ese convexa. In enger Transkription kann diese Artikulationsstelle durch ein komplett geschlossenes Rechteck (für laminal) unter dem Lautsymbol genauer gekennzeichnet werden: [ s ̻ ]. Bei der Artikulation des stimmlosen (inter)dentalen Frikativs / θ/ ist die Zunge nicht gerillt, sondern flach. Dieser Laut, der der Aussprache des englischen <th> in think [θɪŋk] oder teeth [tiːθ] entspricht, ist neben dem alveolaren Frikativ nur im Konsonantensystem Nord- und Zentralspaniens sowie in kleineren Teilen Andalusiens verankert. Das sind die Gebiete, in denen folglich distinción, also eine Unterscheidung zwischen / θ/ und / s/ , praktiziert wird. Im lateinamerikanischen Spanisch wie auch auf 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 93 <?page no="94"?> 44 In südlichen Varietäten des Deutschen, wie sie u. a. in Bayern und Österreich gesprochen werden, findet sich am Wortanlaut häufig stimmloses [s]. den Kanarischen Inseln und im Großteil Andalusiens und der Extremadura wird / θ/ durchgehend durch den prädorsoalveolaren Frikativ ersetzt, sodass hier nur ein einzi‐ ges Phonem vorhanden ist. In der spanischen Dialektologie wird dieser Zusammenfall von / θ/ und / s/ zu / s/ als seseo bezeichnet. In Teilen Andalusiens (vornehmlich im Südwesten dieser Region) sind / θ/ und / s/ ebenfalls zu einem Phonem zusammengefallen, doch dies wird dental artikuliert, sodass es eher wie das kastilische [θ] klingt. Diese als ceceo bezeichnete Aussprache gilt als rustikal und ist damit nicht nur diatopisch, sondern auch diastratisch markiert. Dort, wo eine Opposition zwischen / θ/ und / s/ fortbesteht, also distinción praktiziert wird, können beide Konsonanten sowohl im Anfangsrand als auch in der Coda von wortinitialen, -finalen und -internen Silben auftreten, während die Opposition in den seseo-Gebieten zu [ s ̻ ] neutralisiert wird (in den ceceo-Gebieten entsprechend zu [θ]). Vor dem alveolaren Plosiv / t/ und dem dentalen Frikativ / θ/ wird silbenfinales / s/ immer prädorsoalveolar als [ s ̻ ] artikuliert. Vor einem stimmhaften Konsonanten können beide Frikative auch stimmhaft auftreten. Die Stimmhaftigkeit des folgenden Konsonanten breitet sich dann auf den vorangehenden Frikativ aus und assimiliert ihn in diesem Merkmal, sodass [ð] bzw. [z] statt [θ] bzw. [ s ̺ ] gesprochen wird. Um den stimmhaften Frikativ [ð] vom entsprechenden Approximanten zu unterscheiden, kann unter das Symbol ein kleines [˔] gesetzt werden, das für Anhebung steht und deutlich macht, dass der Abstand zwischen Zunge und Zähnen so eng ist, dass ein echter Frikativ entsteht: [ð̝]. Alternativ kann unter das Symbol für den stimmlosen Konsonanten ein kleines, oben offenes Dreieck gesetzt werden, das Stimmhaftigkeit anzeigt: [s̬] bzw. [ θ̬ ]. In allen anderen Positionen sind diese Frikative immer stimmlos, und deutschsprachige Lernende, die am norddeutschen Standard orientierte Varietäten sprechen, sollten darauf achten, am Wortanfang nicht automatisch stimmhaftes [z] zu verwenden (vgl. dt. [ ˈ zʊpə] Suppe vs. sp. [ ˈ sopa] sopa). 44 In der Schreibung des Spanischen wird / s/ durch den Buchstaben <s> wiedergege‐ ben, / θ/ durch den Buchstaben <z>; nur vor <e> und <i> wird für / θ/ fast immer der Buchstabe <c> gesetzt. In den Regionen, in denen der Kontrast zwischen / θ/ und / s/ neutralisiert wurde, kann aus der Lautung nicht auf die Schreibung (<s> oder <c>/ <z>) geschlossen werden. dentaler Frikativ / θ/ distinción / θ/ [θ] [ ˈ θine] cine ‘Kino’ [ ˈ kaθa] caza ‘Jagd’ - - [paθ] paz ‘Friede’ [ ˈ meθkla] mezcla ‘Mischung’ - [ð̝] ~ [ θ̬ ] ~[θ] [xuð̝ ˈ ɣaɾ] ~ [xu θ̬ ˈ ɣaɾ] ~ [xuθ ˈ ɣaɾ] juzgar ‘richten’ - - - 94 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="95"?> 45 Ein diesbezüglich interessanter Fall ist das argentinische Spanisch: Hier wurde die (ursprünglich sozial niedrig eingestufte) Aspiration des Coda-/ s/ von Mitgliedern wohlhabenderer Klassen einge‐ setzt, um sich von (weniger wohlhabenden) italienischen Einwanderern abzugrenzen, die dieses Merkmal wegen des Nicht-Vorhandenseins eines vergleichbaren Prozesses im Italienischen auch in ihrem Spanisch nicht aufwiesen. Heutzutage ist die / s/ -Aspiration, zumindest in Buenos Aires, Bestandteil der kultivierten Normaussprache (vgl. Pešková et al. 2012b: 367). (apiko)alveolarer Frikativ / s/ distinción / s/ [ s ̺ ] [ s ̺ in] sin ‘ohne’ [ ˈ ka s ̺ a] casa ‘Haus’ - - [ma s ̺ ] mas ‘mehr’ - - - - [ s ̺ ]~[z]~[s̬] [ ˈ a s ̺ no] ~ [ ˈ azno] ~ [ ˈ as̬no] asno ‘Esel’ - - - - [ s ̻ ] [e s ̻ ˈ θena] escena ‘Szene’ [ ˈ a s ̻ ta] hasta ‘bis’ (prädorso)alveolarer Frikativ / s/ Zusammenfall von / θ/ und / s/ , seseo / s/ [ s ̻ ] [ ˈs ̻ ine]/ [ s ̻ in] cine/ sin ‘Kino/ ohne’ [ ˈ ka s ̻ a] caza/ casa ‘Jagd/ Haus’ - - [ma s ̻ ]/ [pa s ̻ ] mas/ paz ‘mehr/ Friede’ [ ˈ a s ̻ ta] hasta ‘bis’ - - [e ˈs ̻ ena] escena ‘Szene’ - - - - - [ ˈ azno] ~ [ ˈ as̬no] ~ [ ˈ a s ̻ no] asno ‘Esel’ - - - - - [xuz ˈ ɣaɾ] ~ [xus̬ ˈ ɣaɾ] ~ [xu s ̻ ˈ ɣaɾ] juzgar ‘richten’ - - - In zahlreichen Varietäten des Spanischen unterliegt / s/ in der Coda allerdings noch viel weitergehenden Assimilationsprozessen, die neben genereller Schwächung vor allem die Aspiration (Artikulation als glottaler Frikativ [h]) und die völlige Tilgung einschließen (4.2.4.2). Nur in den nördlichen Regionen Spaniens und im Hochland Lateinamerikas ist / s/ in der Coda meist als alveolarer Frikativ bewahrt. Dort, wo Coda-s geschwächt wird, geschieht dies nicht einheitlich, sondern ist vielfältig variiert. Die Variation wird durch soziale Faktoren gesteuert, wenn Aspiration oder Tilgung verstärkt in informellen Sprechstilen und/ oder bei weniger gebildeten Sprechern auftreten. 45 Doch auch der phonologische Kontext spielt eine wichtige Rolle: So ist die Schwächung des Coda-s in vorkonsonantischer Position am stärksten ausgeprägt, wobei es meist keinen Unterschied macht, ob die folgende Silbe innerhalb des Wortes oder am Anfang des nächsten Wortes mit einem Konsonanten beginnt. In den betroffenen Varietäten wird / s/ in diesen Fällen besonders häufig aspiriert. Im andalusischen Spanisch kann die Schwächung auch bewirken, dass der folgende Konsonant gelängt und gegebenenfalls (teil)entstimmt wird. Im kanarischen Spanisch 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 95 <?page no="96"?> 46 Zur Realisierung der Plosive im kanarischen Spanisch vgl. auch Broś et al. (2021) und Broś & Krause (2024). dagegen werden / sb sd sɡ/ als lange stimmhafte Plosive [bː dː ɡː] realisiert. 46 Die zweithäufigste Schwächungsposition ist der Auslaut vor einer Pause; hier finden sich sowohl Aspiration als auch Tilgung. Seltener tritt Schwächung von wortfinalem -s vor einem vokalisch anlautenden Wort auf, da der Konsonant hier normalerweise die Codaposition verlässt und als Anfangsrand der folgenden Silbe resyllabiert wird (vgl. 4.2.5). Aspiration und Tilgung von / s/ in Codaposition vor Konsonant __.(#)C - [pah ˈ tel] ~ [pa ˈ tel] pastel ‘Kuchen’ - - - - - [mah ˈ taɾðe] ~ [ma ˈ taɾðe] más tarde ‘später’ - - - - andal. [ ˈ a h kːo] asco ‘Ekel’ [ ˈ mim̥mo] mismo ‘selbe’ - - [lɔ ˈ xːatɔ] los gatos ‘die Katzen’ - - - - kanar. [la ˈ bːela] las velas ‘die Kerzen’ vs. [la ˈ βela] la vela ‘die Ker‐ ze’ vor Pause __‖ - [ ˈ bamoh] ~ [ ˈ bamo] ¡vamos! ‘gehen wir! ’ vor Vokal __#V - [lo ˈ sotɾoh] ~ [lo ˈ sotɾo] ~ [loh ˈ otɾoh] ~ [lo ˈ hotɾoh] los otros ‘die an‐ deren’ Der velare Frikativ / x/ , im Spanischen nach dem Namen des Buchstaben <j> auch jota genannt, wird im europäischen Standard eher postvelar bzw. uvular als [χ] realisiert (wie in dt. Dach [daχ]), in Andalusien und auf den kanarischen Inseln dagegen oft als glottaler Frikativ [h] (wie in dt. hat [hat]). Auch im lateinamerikanischen Spanisch kommt [h] als Realisierung vor (so in der Karibik und in zentralamerikanischen und kolumbianischen Varietäten), während in Mexiko, Peru, Chile und Argentinien die Realisierung als velarer Frikativ [x] (wie in dt. [hoːx] hoch) vorherrscht. Vor den vorderen Vokalen / i/ und / e/ wird die Aussprache dieses Frikativs etwas weiter nach vorn verlagert. Im chilenischen Spanisch ist diese Anpassung an die Artikulation der vorderen Vokale so weit gegangen, dass der Frikativ hier palatal realisiert wird, also als [ç] (wie in dt. [ɪç] ich). / x/ tritt fast ausschließlich wort- und silbeninitial auf und wird in der (wortfinalen) Coda vorzugsweise getilgt. 96 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="97"?> 47 Vgl. Martínez Celdrán & Fernández Planas (2007: 166). Sie transkribieren diesen Approximanten mit einem subskribierten [˕], also als [ ʝ ̞ ], um ihn vom Halbvokal [j] zu unterscheiden. In der Schreibung steht für / x/ vornehmlich der Buchstabe <j>, vor <e> und <i> auch <g>, wenn die lateinische Ausgangsform (das Etymon) ein <g> aufweist. velarer Frikativ / x/ [χ] [ ˈ χiɾo] giro < G Y R U ( M ) ‘Kreis- (linie)’ [χi ˈ nete] jinete < ar. zeneti ‘Reiter’ - - [mu ˈ χeɾ] mujer < M U L I E R E ( M ) ‘Frau’ [ ˈ χente] gente < G E N T E ( M ) ‘Leute’ - - [χa ˈ mas] jamás - ‘nie’ [ ˈ baχo] bajo - ‘niedrig’ - - [re ˈ loχ] ~ [re ˈ lo] reloj - ‘Uhr’ - - - - - [h] [ ˈ hiɾo]/ [hi ˈ nete]/ [mu ˈ heɾ]/ [ ˈ hente]/ [ha ˈ mas]/ [ ˈ baho]/ [re ˈ loh] ~ [re ˈ lo] - [x] [ ˈ xiɾo]/ [xi ˈ nete]/ [mu ˈ xeɾ]/ [ ˈ xente]/ [xa ˈ mas]/ [ ˈ baxo]/ [re ˈ lox] ~ [re ˈ lo] - [ç] [ ˈ çiɾo]/ [çi ˈ nete]/ [mu ˈ çeɾ]/ [ ˈ çente] Mit dem Phonem / ʝ/ soll hier unter den Frikativen ein weiterer Laut des Spanischen behandelt werden, dessen Realisierung als stimmhaft und (dorso)palatal eindeutig ist, dessen Artikulationsmodus jedoch je nach Kontext und Varietät mehr oder weniger stark changiert: Der Frikativ [ʝ] entsteht, wenn der Zungenrücken so dicht an den harten Gaumen angenähert wird, dass bei der Artikulation aufgrund der Engebildung ein Reibegeräusch erfolgt. Ist die Annäherung weniger ausgeprägt, ertönt statt des Frikativs der entsprechende Approximant [j] und damit ein weiterer Frikativapproxi‐ mant. 47 Geht die Annäherung dagegen bis zum völligen Kontakt, der gesprengt werden muss, so erhalten wir den palatalen Plosiv [ɟ]. Dieser geht in der Regel gleich in den Frikativ [ʝ] über, sodass in solchen Fällen meist die Affrikate [ɟ͡ʝ] realisiert wird. Fast überall im spanischsprachigen Raum hat / ʝ/ heute den palatalen Lateral / ʎ/ (vgl. 2.5.1.4) ersetzt - ein Lautwandel, dessen Ergebnis auch als yeísmo bezeichnet wird. / ʝ/ ist in seiner Distribution auf den Anfangsrand von Wörtern und Silben be‐ schränkt, und es muss ihm immer unmittelbar ein Vokal folgen. Als kastilische Stan‐ dardrealisierung gilt [ʝ]; nach Nasal oder Lateral (die in diesem Kontext palatalisiert erscheinen) wird die Affrikate [ɟ͡ʝ] artikuliert. Diese ist jedoch auch oft am Anfang einer Äußerung zu finden, und umgangssprachlich kann sie - wohl ausgehend von emphatischer Verstärkung - in allen Positionen auftreten (vgl. 4.2.4.1). Im nördlichen Mexiko, in US- und zentralamerikanischen Varietäten sowie im Judenspanischen ist es dagegen üblich, / ʝ/ ganz ohne Reibegeräusch als [j] zu artikulieren; nach vorderem Vokal kann der Approximant sogar ganz entfallen. Im argentinischen Spanisch (und auch in anderen lateinamerikanischen Varietäten) finden wir statt (dorso)palatalem / ʝ/ den postalveolaren Frikativ / ʒ/ . Hier hat sich also auch die Artikulationsstelle verän‐ 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 97 <?page no="98"?> dert. / ʒ/ wird im heutigen Argentinien nicht nur als stimmhaftes [ʒ] (žeísmo), sondern vor allem von jüngeren Leuten bevorzugt als stimmloser Frikativ [ʃ] artikuliert (šeísmo); zur neueren Entwicklung und zur entsprechenden regionalen Variation vgl. Lang-Rigal (2015). Geschrieben wird / ʝ/ mit dem Buchstaben <y> oder, wenn aus / ʎ/ hervorgegangen, mit dem Doppelgraphem <ll>. Vor <e> (seltener vor <a>) kann ihm auch die Buchsta‐ benfolge <hi> entsprechen. (dorso)palataler Frikativ / ʝ/ [ʝ] [ ˈ ʝeso] yeso ‘Gips’ [ ˈ ʝeno] lleno ‘voll’ [ ˈ ʝelo] hielo ‘Eis’ - - [ ˈ maʝo] mayo ‘Mai’ [ ˈ maʝa] malla ‘Masche’ [dez ˈ ʝelo] deshielo ‘Tau‐ wetter’ - [ɟ͡ʝ] [en j ɟ͡ʝe ˈ saɾ] enye‐ sar ‘ein‐ gipsen’ [el j ˈ ɟ͡ ʝeso] el yeso ‘der Gips’ [un j ˈ ɟ͡ ʝuŋke] un yun‐ que ‘ein Am‐ boss’ - - [ ˈ ɟ͡ʝolo ˈ se] yo lo sé (vs. [lo ˌ se ˈ ʝo] lo sé yo) ‘ich weiß es’ aber auch: [ ˈ oɟ͡ʝe] -¡oye! -‘hör’ - [j] [ ˈ pojo] pollo ‘Huhn’ - - - [ ˈ sija] ~ [ ˈ sia] silla ‘Stuhl’ Postalveolarer Frikativ (Argentinien, Urugay) / ʒ/ [ʒ] [ ˈ ʒeso] yeso - [ ˈ ʒeno] lleno aber: [ ˈ ʝelo] ~ [ ˈ jelo] hielo - - - [ ˈ maʒo] mayo - [ ˈ maʒa] malla aber: [dez ˈ ʝelo] ~ [dez ˈ jelo] -deshielo - - [d͡ʒ] [en̪d͡ʒe ˈ saɾ] enyesar [e l ̪ ˈ d͡ ʒeso] el yeso - [un̪ ˈ d͡ ʒuŋke] un yunque - [ʃ] [ ˈ ʃeso]/ [ ˈ ʃeno]/ [ ˈ maʃo]/ [ ˈ maʃa] Wie wir in 2.2.3.2 gesehen haben, bestehen Affrikaten aus zwei Phasen: Die Ver‐ schlusslösung eines Plosivs geht an derselben Artikulationsstelle unmittelbar in das Reibegeräusch eines Frikativs über. Neben der Affrikate [ɟ͡ʝ], die wir als eine mögliche Realisierung des palatalen Frikativs / ʝ/ kennengelernt haben, besitzt das Spanische mit postalveolarem (oder präpalatalem) / t͡ʃ/ nur eine Affrikate, die zu den Phonemen gezählt wird. Sowohl Ort als auch Modus der Realisierung können je nach Region variieren. So wird im kanarischen und kubanischen Spanisch häufig statt der Affrikate der palatale Verschlusslaut [c] artikuliert, der auch stimmhaft (als [ɟ]) auftreten kann. In Teilen Mexikos ist dagegen Deaffrizierung üblich: Die Affrikate verliert ihren Plosivanteil und wird zum einfachen Frikativ. Außer in Entlehnungen kommt / t͡ʃ/ nur im Anfangsrand von Silben oder Wörtern vor; ein vorangehender Nasal oder Lateral wird in seiner Artikulationsstelle an die Affrikate angepasst und palatalisiert. In der Schreibung wird / t͡ʃ/ konsequent durch das Digraphem <ch> repräsentiert. 98 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="99"?> postalveolare Affrikate / t͡ʃ/ [t͡ʃ] [ ˈ t͡ʃiko] chico ‘Junge’ [mu ˈ t͡ʃat͡ʃo] muchacho ‘Junge’ - - [ ˈ an j t͡ʃa] ancha ‘weit’ f. [kat͡ʃ] catch ‘Catch’ palataler Plosiv - [c] [ ˈ ciko]/ [mu ˈ caco] ~ [mu ˈ ɟaɟo] postalveolarer Frikativ (Deaffrifizierung) - [ʃ] [ ˈ ʃiko]/ [mu ˈ ʃaʃo] Abb. 2.5-7 zeigt Sagittalschnitte von spanischen Frikativen und Affrikaten. Abb. 2.5-7: Sagittalschnitte der Artikulation spanischer Frikative und Affrikaten (nach Kubarth 2009: 99, 102, 107f.). In Abb. 2.5-8 werden Oszillo- und Spektrogramme spanischer Äußerungen mit der Affrikate [t͡ʃ] und den Frikativen [s] und [x] vorgestellt. Bei [t͡ʃ] lässt sich gut die Abfolge von Verschluss (stummer Schall), Explosionsschall und unmittelbar folgendem Friktionsrauschen erkennen (vgl. 2.3.1.2). [s] und [x] unterscheiden sich deutlich in der Intensität der Friktion (unstrukturierte Schwärzung in höheren Frequenzbereichen). Abb. 2.5-8: Oszillo- und Spektrogramme, links: sp. en ancha (capa), rechts: sp. se despojó. 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 99 <?page no="100"?> 48 Das nach unten offene Rechteck zeigt in der Transkription dentale Artikulation an. 49 Der palatalisierte Nasal [n j ] - in der Transkription zeigt hochgestelltes [ j ] die palatalisierte Aus‐ sprache an - unterscheidet sich artikulatorisch und akustisch vom palatalen Nasal [ɲ], denn der Verschluss wird hier nur präpalatal gebildet (vgl. Abb. 2.5-9f sowie Quilis 1993: 229f. und Martínez Celdrán & Fernández Planas 2007: 129ff.). 2.5.1.3 Nasale Mit Plosiven, Frikativen und Affrikaten haben wir die große Gruppe der Ob‐ struenten oder echten Konsonanten nun abgeschlossen und wenden uns mit den Nasalen der Gruppe der Sonoranten zu. Sie unterscheiden sich von den Obstruenten dadurch, dass es hier keine Paare gibt, die sich - wie etwa / p/ und / b/ - allein durch das Merkmal der Stimmhaftigkeit voneinander abgrenzen lassen. Sonoranten sind spontan stimmhaft, d. h., sie werden mit Beteiligung der schwingenden Stimmlippen artikuliert. Außerdem ist die Behinderung des Luftstroms, durch die sich Konsonan‐ ten prinzipiell von Vokalen unterscheiden, hier stärker eingeschränkt: Wie wir in 2.2.3.2 gesehen haben, wird bei Nasalen zwar ein Verschluss im Mundraum gebildet, doch dieser wird nicht wie bei den Plosiven durch den Luftstrom aus der Lunge gesprengt. Die Luft entweicht vielmehr relativ ungehindert durch den Nasenraum, denn das Velum ist bei Nasalen abgesenkt und die Passage zur Nasenhöhle damit frei (vgl. Abb. 2.5-9). Mit bilabialem / m/ und alveolarem bzw. koronalem / n/ kennt das Spanische zwei Nasalkonsonanten, die auch im Deutschen vertreten sind. Mit palatalem / ɲ/ kommt wie in den meisten anderen romanischen Sprachen noch ein Nasalkonsonant hinzu, der im Deutschen nur in Entlehnungen aus diesen Sprachen auftritt, z. B. in Cañon oder Cognac. Während die Aussprache im Deutschen hier meist in die Abfolge [nj] zerlegt wird, repräsentiert / ɲ/ im Spanischen einen einzigen Laut, bei dessen Artikulation der Zungenrücken sich auf breiter Fläche an den harten Gaumen legt und die Zungenspitze die Rückseite der unteren Schneidezähne berührt (vgl. Abb. 2.5-9c). Im Silbenanfangsrand werden diese spanischen Nasale regelmäßig als [m], [n] bzw. [ɲ] realisiert; wortinitial tritt [ɲ] allerdings nur in einigen wenigen Entlehnungen und expressiven Bildungen auf. In der Codaposition kommt es zu Neutralisierungen und Assimilationen (4.2.4.2). In der wortinternen Coda - aber auch in der wortfinalen Coda, wenn unmit‐ telbar ein weiteres konsonantisch anlautendes Wort folgt - passen die spanischen Nasalkonsonanten ihre Artikulationsstelle grundsätzlich an die des nächsten Konso‐ nanten an; sie werden also homorgan mit diesem realisiert. Vor bilabialen Plosiven (oder auch Nasalen) wird ein Nasalkonsonant also automatisch als bilabiales [m] gesprochen (wie in dt. [lʊmp] Lump), vor labiodentalen Frikativen als labiodentales [ɱ] (wie umgangssprachlich in dt. [zɛɱf] Senf), vor denti-alveolaren Plosiven oder (inter)dentalen Frikativen als dentales [n̪] 48 , vor alveolaren Frikativen als alveolares [n] (wie in dt. [ɡans] Gans), vor postalveolaren und palatalen Affrikaten sowie vor dem palatalen Lateral des Kastilischen als palatalisiertes [n j ] 49 und vor velaren Plosiven oder Frikativen als velares [ŋ] (wie in dt. [baŋk] Bank). Die einzige Ausnahme stellt silbenfinales [m] vor [n] dar: hier erfolgt keine Anpassung des ersten an den Ort des 100 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="101"?> 50 Bedingt durch Sprachkontakt ist es in manchen Varietäten auch zur Labialisierung wortfinaler Nasale gekommen, so zum Beispiel im yukatekischen Spanisch, wo bien und Yucatán als [bjɛm] bzw. [ʝuka ˈ tam] realisiert werden (Michnowicz 2008, Uth 2022). Wichtig ist aber, dass der Kontrast zwischen / m/ , / n/ und / ɲ/ in allen spanischen Varietäten im Auslaut neutralisiert wird. 51 Auf ähnliche Weise sind die Nasalvokale des Französischen entstanden (Rothe 2 1978: 153ff.). zweiten Nasalkonsonanten, sondern es wird die Abfolge [mn] artikuliert (wie in dt. [ ˈ hʏmnə] Hymne). Wenn nicht unmittelbar ein konsonantisch anlautendes Wort folgt, ist in wortfi‐ naler Position im Spanischen nur / n/ möglich. Sowohl / m/ als auch / ɲ/ sind hier ausgeschlossen, wie sich in der Entwicklung aus dem Lateinischen oder anhand von Entlehnungen zeigen lässt. In diesen wird finales [m] oder [ɲ] meist als [n] ausgesprochen, auch wenn für ersteres in der Schreibung bisweilen <-m> bewahrt ist. In vielen Varietäten des Spanischen wird finales / n/ velar artikuliert, also als [ŋ] gesprochen (wie in dt. [laŋ] lang), so z. B. in Andalusien, auf den Kanarischen Inseln, in der Karibik und an der südamerikanischen Pazifikküste. Dieser als Velarisierung bezeichnete Prozess, bei dem durch antizipierte Senkung des Velums oft auch der vorangehende Vokal nasalisiert wird, kann als Schwächung des Codakonsonanten gesehen werden. 50 Geht die Schwächung bis zur Tilgung des Nasalkonsonanten, so bleibt die Nasalität in der Regel im vorangehenden Vokal erhalten, der folglich als (finaler) nasalisierter Vokal erscheint. 51 Folgt ein vokalisch anlautendes Wort (oder wird ein vokalisch anlautendes Suffix angefügt), so tritt der finale Nasalkonsonant in den Anfangsrand der nächsten Silbe und wird dort als [n] realisiert. In der Schreibung stehen prinzipiell <m> für / m/ , <n> für / n/ und <ñ> für / ɲ/ . Die angesprochenen Anpassungen der Nasalkonsonanten in der Coda gehen nur wortintern und auch dort nur selektiv in die Schreibung ein: So wird der vor <p> und <b> bilabial gesprochene Nasal in dieser Position durch <m> wiedergegeben; vor <v>, <m> oder <f>, wo ebenfalls [m] bzw. [ɱ] artikuliert wird, steht dagegen immer der Buchstabe <n>, der auch alle anderen Neutralisierungen und Assimilationen abdeckt. Nasale im Onset / m/ [m] [ ˈ kama] cama ‘Bett’ [ ˈ mata] mata ‘Strauch’ / n/ [n] [ ˈ kana] cana ‘weißes Haar’ [ ˈ nata] nata ‘Sahne’ / ɲ/ [ɲ] [ ˈ kaɲa] caña ‘Rohr’ ([ɲan ˈ du] ñandú ‘Nandu’) Nasale in vorkonsonantischer Position vor bilabialem Plosiv [p] bzw. [b] und vor bilabialem Nasal [m] / n/ [m] [ ˈ kampo] campo ‘Feld’ [kom ˈ palo] con palo ‘mit Stock’ - - [sjem ˈ pjes] ciempiés ‘Tausendfüßler’ [sjem ˈ pjes] cien pies ‘hundert Füße’ 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 101 <?page no="102"?> [ ˈ kambjo] cambio ‘Wechsel’ [um ˈ bote] un bote ‘ein Schlag’ - - [em ˈ bes] envés ‘Kehrseite’ [um ˈ baso] un vaso ‘ein Glas’ - - [immo ˈ ɾal] inmoral ‘unsittlich’ [um ˈ mes] un mes ‘ein Monat’ vor labiodentalem Frikativ [f] / n/ [ɱ] [eɱ ˈ feɾmo] enfermo ‘krank’ [eɱ ˈ fjesta] en fiesta ‘beim Feiern’ vor denti-alveolarem Plosiv [t] bzw. [d] und vor dentalem Frikativ [θ] / n/ [n̪] [ ˈ kan̪to] canto ‘ich singe’ [un̪ ˈ tio] un tío ‘ein Typ’ - - [ ˈ an̪do] ando ‘ich gehe’ [un̪ ˈ dia] un día ‘ein Tag’ - - [en̪ ˈ θima] encima ‘oben’ [en̪ ˈ θiɾkulo] en círculo ‘kreisförmig’ vor alveolarem Frikativ [s] / n/ [n] [ ˈ manso] manso ‘zahm’ [un ˈ sweɲo] un sueño ‘ein Traum’ - - [en ˈ sima] encima ‘oben’ [en ˈ siɾkulo] en círculo ‘kreisförmig’ vor postalveolarer Affrikate [t͡ʃ], vor palataler Affrikate [ɟ͡ʝ], vor palatalem Lateral [ʎ] / n/ [n j ] [ ˈ an j t͡ʃa] ancha ‘weit’ f. [un j ˈ t͡ʃiko] un chico ‘ein Junge’ - - [en j ɟ͡ʝe ˈ saɾ] enyesar ‘eingipsen’ [un j ˈ ɟ͡ʝuɣo] un yugo ‘ein Joch’ - - [en j ʎan̪ ˈ taɾ] enllantar ‘mit Felgen ver‐ sehen’ [kon j ˈ ʎaβe] con llave ‘mit Schlüssel’ vor velarem Plosiv [k/ ɡ] und vor velarem Frikativ [x] / n/ [ŋ] [ ˈ baŋko] banco ‘Bank’ [uŋ ˈ kampo] un campo ‘ein Feld’ - - [ ˈ teŋɡo] tengo ‘ich habe’ [uŋ ˈ ɡato] un gato ‘eine Katze’ - - [ ˈ aŋxel] angel ‘Engel’ [koŋ ˈ xuɣo] con jugo ‘mit Saft’ Ausnahme: vor alveolarem Nasal [n] / m/ [m] [a ˈ lumno] alumno ‘Schüler’ - - - Nasale in wortfinaler Position / n/ [n] [pan] pan ‘Brot’ [ ˈ komen] comen ‘sie essen’ - - [kon] con < C U M ‘mit’ [ron] ron < engl. rum ‘Rum’ - - [ ˈ alβun] ~ [ ˈ alβum] álbum ‘Album’ - - - - - [t͡ʃam ˈ pan] champán < fr. champagne [ʃ ɑ̃ ˈ paɲ] ‘Champagner’ - - - 102 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="103"?> wortfinale Velarisierung / n/ [ŋ] [paŋ], [ ˈ komeŋ], [roŋ] etc. - - - - - - häufig mit Nasalisierung des vorangehenden Vokals, gegebenenfalls Tilgung des Nasals: - - [ ˈ komẽŋ] ~ [ ˈ komẽ] vor Vokal / n/ [n] [paŋ], aber: Pl. [ ˈ pa.nes] panes ‘Brote’ - - [koŋ ˈ keso] con queso ‘mit Käse’ - - aber: [ko ˈ naɣwa] con agua ‘mit Wasser’ Abb. 2.5-9 zeigt abschließend Sagittalschnitte der verschiedenen Artikulationen spa‐ nischer Nasalkonsonanten. Abb. 2.5-9: Sagittalschnitte der Artikulation spanischer Nasale (nach Kubarth 2009: 111). 2.5.1.4 Laterale Bei der Artikulation von Lateralen wird zwar mittig im Mundraum ein Verschluss gebildet, doch die Luft kann ungehindert an einer oder beiden Seiten vorbeiströmen (weshalb Laterale oft auch zu den Approximanten gerechnet werden). Die meisten Varietäten des Spanischen kennen heute nur noch einen Lateralkonsonanten, und zwar (apiko)alveolares / l/ , das dem / l/ des Deutschen vergleichbar ist. / l/ kann für sich allein den Anfangsrand einer Silbe besetzen oder gemeinsam mit den Plosiven / p b/ und / k ɡ/ bzw. mit dem Frikativ / f/ den zweiten Bestandteil eines komplexen Onset bilden. / l/ kann auch in Codaposition auftreten, wobei es auch hier zu Anpassungen an den folgenden Konsonanten kommt; diese sind jedoch stärker eingeschränkt als im Fall der unter 2.5.1.3 behandelten Nasale: Vor denti-alveolaren Plosiven und vor dem (inter)dentalen Frikativ erscheint der Lateral dental als [ l ̪ ], vor postalveolarer und palataler Affrikate (und vor palatalem Lateral) wird er zu [l j ] palatalisiert. In einigen Dialekten, so in Andalusien und in der Karibik, wird der Lateral in der Coda und im komplexen Onset auch als [ɾ] realisiert. Umgekehrt kann [ɾ] in der Coda als 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 103 <?page no="104"?> 52 Abgeleitet von gr. rho (<ρ>) für <r> bzw. gr. lambda (<λ>) für <l> nennt man solche Vertauschungen auch Rhotazismus (sp. rotacismo) bzw. Lambdazismus (sp. lambdacismo). 53 Zur Velarisierung von / l/ durch bilinguale Sprecher in Katalonien vgl. Kap. 5.1.2. 54 Ein ähnlicher Wandel von / ʎ/ zu / j/ hat etwas früher im Französischen stattgefunden, wo Schreibun‐ gen mit <ll> bis heute an den palatalen Lateral erinnern: z. B. fr. [ ˈ fiʎə] > [fij] fille ‘Tochter’. Im Italienischen ist / ʎ/ dagegen bis heute bewahrt: [ ˈ fiʎa] figlia ‘Tochter’. [l] erscheinen, 52 weshalb wir beide Phänomene gemeinsam im nächsten Abschnitt behandeln werden. In der Schreibung steht für / l/ immer der Buchstabe <l>. 53 alveolarer Lateral im Onset / l/ [l] [ ˈ loβo] lobo ‘Wolf ’ [ ˈ palo] palo ‘Stock’ - - [ ˈ plomo] plomo ‘Blei’ [a ˈ βlaɾ] hablar ‘sprechen’ - - [ ˈ klaɾo] claro ‘klar’ [ ˈ ɡloβo] globo ‘Kugel’ - - [ ˈ floɾ] flor ‘Blume’ [ ˈ t͡ʃufla] chufla ‘Spaß’ alveolarer Lateral in der Coda / l/ [l] [ ˈ ɡolpe] golpe ‘Schlag’ [ ˈ kalβo] calvo ‘kahl’ - - [ ˈ salsa] salsa ‘Soße’ [ ˈ alɣo] algo ‘etwas’ - - [ ˈ alma] alma ‘Seele’ [mil] mil ‘tausend’ vor denti-alveolarem Plosiv [t] bzw. [d] und vor dentalem Frikativ [θ] / l/ [ l ̪ ] [ ˈ a l ̪ to] alto ‘hoch’ [e l ̪ ˈ tio] el tío ‘der Typ’ - - [ ˈ ka l ̪ do] caldo ‘Brühe’ [e l ̪ ˈ dia] el día ‘der Tag’ - - [a l ̪ ˈ θaɾ] alzar ‘erhöhen’ [e l ̪ ˈ θiɾkulo] el círculo ‘der Kreis’ vor postalveolarer Affrikate [t͡ʃ], vor palataler Affrikate [ɟ͡ʝ], vor palatalem Lateral [ʎ] / l/ [l j ] [ ˈ kol j t͡ʃa] colcha ‘Bettdecke’ [el j ˈ t͡ʃiko] el chico ‘der Junge’ - - [el j ˈ ɟ͡ʝeso] el yeso ‘der Gips’ [el j ˈ ʎanto] el llanto ‘die Klage’ In ländlichen Gebieten im Nordosten Spaniens sowie in einigen wenigen lateinameri‐ kanischen Varietäten gibt es mit dem palatalen / ʎ/ noch einen weiteren Lateralkonso‐ nanten, der ursprünglich zum standardspanischen Inventar gehörte, inzwischen aber, wie in 2.5.1.2 bereits angesprochen, fast überall zum palatalen Frikativ / ʝ/ geworden ist. Der mittige Verschluss wird dazu so weit gelockert, dass ein palataler Reibelaut oder Approximant entsteht. Der Wandel von / ʎ/ zu / ʝ/ wird auch als yeísmo bezeichnet, während die Bewahrung des / ʎ/ als lleísmo gilt. 54 Ähnlich wie der palatale Nasal / ɲ/ wird / ʎ/ , das nur im Anfangsrand von Silben auftreten kann, mit großflächigem Kontakt zwischen Zungenrücken und hartem Gaumen realisiert (vgl. Abb. 2.5-10d). In der Schreibung wird / ʎ/ durch das Doppelgraphem <ll> repräsentiert. 104 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="105"?> 55 Der Einfachheit halber deutschen wir im Weiteren die englischen Bezeichnungen trill und tap zu Trill und Tap ein. Dass im IPA [r], also der einfache kleine <r>-Buchstabe, als Transkriptionszeichen für einen vergleichsweise markierten r-Laut wie den gerollten Zungenspitzenvibranten dient, ist verschiedentlich kritisiert worden (vgl. Whitley 2003). In der spanischen Tradition wird der Trill, wenn nicht gleich Doppelschreibung ([rr]) gewählt wird, meist durch einen waagerechten Strich über dem Buchstaben wiedergegeben, also durch [r̄], wodurch [r] für den Tap frei wird (vgl. etwa Navarro Tomás 19 1977: 121). Hualde (2005: 16) folgt Whitleys (2003) Vorschlag und transkribiert den Trill durch [r̄], den Tap durch [ɾ]. Wie Kubarth (2009), NGRAE (2011) u. v. a. folgen wir der IPA-Transkription. 56 Wegen dieser Ungenauigkeit empfiehlt NGRAE (2011: 245), den Terminus vibrante nur für den gerollten r-Laut zu verwenden und das geschlagene r als percusiva zu bezeichnen (vgl. auch Blecua 2001: 14). palataler Lateral (lleísmo) / ʎ/ [ʎ] [ ˈ ʎaβe] llave ‘Schlüssel’ [pa ˈ eʎa] paella ‘Paella’ palataler Frikativ (yeísmo) / ʝ/ [ʝ] [ ˈ ʝaβe] llave - [pa ˈ eʝa] paella - Abb. 2.5-10 zeigt abschließend Sagittalschnitte der spanischen Laterale. Abb. 2.5-10: Sagittalschnitte der Artikulation spanischer Laterale (nach Kubarth 2009: 113). 2.5.1.5 Vibranten Den Terminus ‘Vibrant’ verwenden wir hier als Oberbegriff für die Klasse der r-Laute (engl. rhotics, sp. consonantes róticas), die sich in den Sprachen der Welt durch deutlich verschiedene Artikulationsorte und -modi auszeichnen, aber perzeptiv als ‘r-artig’ wahrgenommen und meist auch mit einem (oder zwei) <r>-Buchstaben geschrieben werden. Aufgrund häufig ähnlichen Verhaltens werden Vibranten oder r-Laute mit den Lateralen zur Gruppe der Liquide zusammengefasst. Mit dem alveolar geschlagenen / ɾ/ (engl. tap, sp. vibrante simple) und dem ebenfalls an den Alveolen gebildeten, aber mehrfach gerollten / r/ (engl. trill, sp. vibrante múltiple) kennt das Spanische zwei Vertreter aus der Gruppe der Vibranten. 55 Dabei ist allerdings nur der Trill ein ‘echter’ Vibrant, denn hier wird die Zungenspitze in Vibration versetzt, sodass sie wiederholt - also mindestens zweimal, häufig öfter - gegen die Alveolen flattert. Beim Tap kommt es dagegen nur zu einem einzigen raschen Kontakt zwischen Zungenspitze und Alveolen: Die Zunge schlägt einmal ganz kurz gegen den Zahndamm; deshalb spricht man hier von einem geschlagenen Laut. 56 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 105 <?page no="106"?> 57 Das ist der Grund, weshalb die beiden r-Laute verschiedenen Phonemen zugeordnet werden, vgl. dazu genauer 3.1. 58 Da diese Konsonanten einer anderen Silbe angehören (als der Trill, um den es uns hier geht), bezeichnet man sie auch als heterosyllabisch. 59 Konsonanten, die zu derselben Silbe gehören wie der behandelte Laut, werden auch tautosyllabisch genannt. Nur im Wortinneren zwischen Vokalen kann der Austausch von Tap und Trill zu einer neuen Bedeutung führen. 57 Der Wortanfang ist für den Tap gesperrt; hier erscheint automatisch immer der Trill. Das gilt auch für den Anfangsrand wortinterner Silben, wenn die vorangehende Silbe auf einen Konsonanten endet - wofür nur der Nasal / n/ und der Lateral / l/ infrage kommen. 58 In 2.5.1.2 haben wir gesehen, dass der Frikativ / s/ in der Coda oft getilgt wird. Vor dem Trill ist diese Tilgung die Regel - unabhängig davon, ob zwischen / s/ und Trill nur eine Silben- oder zugleich auch eine Wortgrenze verläuft. Dabei kann jedoch ein approximantischer r-Laut [ɹ] vor dem Trill verbleiben. In allen anderen Positionen, d. h. an zweiter Stelle innerhalb eines komplexen Onset 59 (in der Kombination OL (Obstruent-Liquid) nach / p b/ , / t d/ , / k ɡ/ und / f/ ) und in der Coda, erscheint im Normalfall der Tap. In der Coda kann der r-Laut jedoch auch gerollt werden, ohne dass dies Auswirkungen auf die Bedeutung des Wortes nehmen würde. Mit einem Trill wird hier oft ein höherer Grad an Emphase ausgedrückt. Nur in der (wortinternen) Position zwischen Vokalen, wo durch Tap vs. Trill Bedeutungen differenziert werden können, wird der Unterschied zwischen den beiden r-Lauten auch in der Orthographie abgebildet. Während für den Tap immer der einfache <r>-Buchstabe steht, wird für den Trill hier die Doppelschreibung <rr> eingesetzt. In allen anderen Positionen wird auch der Trill durch einfaches <r> wiedergegeben, denn seine Realisierung als Trill ist hier jeweils vorhersagbar. alveolar gerollter Vibrant (Trill) / r/ vs. alveolar geschlagener Vibrant (Tap) / ɾ/ V_V zwischen Vokalen (Kontrast) / r/ [r] [ ˈ karo] carro ‘Wagen’ [ ˈ pera] perra ‘Hündin’ - - [ke ˈ ria] querría ‘ich würde wollen’ [bi ˈ rej] virrey ‘Vizekönig’ / ɾ/ [ɾ] [ ˈ kaɾo] caro ‘teuer’ [ ˈ peɾa] pera ‘Birne’ - - [ke ˈ ɾia] quería ‘ich wollte’ [ba ˈ ɾato] barato ‘billig’ 106 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="107"?> immer Trill / r/ am Wortanfang #_ [r] [ ˈ roka] roca ‘Felsen’ [rej] rey ‘König’ im Silbenonset nach heterosyllabischem Konsonanten (/ n/ , / l/ , / s/ ) C._ [r] [ ˈ onra] honra ‘Ehre’ [alreðe ˈ ðoɾ] alrededor ‘ringsherum’ - - [irae ˈ lita] ~ [iɹrae ˈ lita] (~ [izrae ˈ lita]) israelita ‘Israeli’ - - [do ˈ rokas] ~ [doɹ ˈ rokas] (~ [doz ˈ rokas]) dos rocas ‘zwei Felsen’ immer Tap / ɾ/ an zweiter Position im Silbenonset (nach tautosyllabischem Konsonanten, OL) C_ [ɾ] [ ˈ bɾoma] broma ‘Scherz’ [ ˈ fɾente] frente ‘Stirn’ - - [ ˈ kaβɾa] cabra ‘Ziege’ [la ˈ ðɾon] ladrón ‘Dieb’ am Wortende vor vokalischem Anlaut V_#V[ɾ] [ ˈ se.ɾa ˈ miɣos] ser amigos ‘Freunde sein’ - vorwiegend Tap / ɾ/ (Trill möglich) in Codaposition V_. [ɾ] [ ˈ paɾ.te] ~ [ ˈ par.te] parte ‘Teil’ - - [a ˈ moɾ] ~ [a ˈ mor] ~ [a ˈ morː] amor ~ ¡amorrr! ‘Liebe’ Wir haben bislang eine Norm beschrieben, die für den gesamten spanischsprachigen Raum angesetzt werden kann und für Lerner eine gute Orientierung bietet. Aber auch bei den r-Lauten ist Variation zu beobachten, die wir kurz skizzieren wollen. So werden Tap und Trill nicht immer mit tatsächlichem Kontakt zwischen Zungenspitze und Alveolen produziert, sondern es kann stattdessen auch hier nur zu einer Engebildung kommen. Wenn die Luft diese Enge relativ ungehindert passiert, werden Tap bzw. Trill zu Approximanten; kommt es dabei zu einem Reibegeräusch, so entstehen Frikative. In diesen Realisierungsarten, die in IPA durch [ɹ] (für den Approximanten) bzw. [ ɹ ̝ ] (für den Frikativ) symbolisiert werden, unterscheidet sich der Trill vom Tap nur durch seine größere Länge ([ɹː] bzw. [ ɹ ̝ ː ]). Bei der Artikulation als Frikativ entsteht durch die gerillte Zunge schnell eine Art Zischlaut: der alveolare Vibrant wird dann assibiliert, d. h. als Frikativ mit einem intensiven hohen Geräuschanteil (so die Definition von ‘Sibilant’) produziert. So erscheint beispielsweise in den zentralen Regionen Mexikos der wortfinale r-Laut vor einer Pause häufig als stimmloser Sibilant, was in IPA durch das Symbol [ɕ] (für einen stimmlosen, alveolo-palatalen Frikativ) ausgedrückt werden kann. In Teilen Zentralamerikas, in der Andenregion, in Ecuador 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 107 <?page no="108"?> 60 In der Tradition der spanischen Dialektologie wird der assibilierte r-Laut als [ř] transkribiert. Für die stimmlose Variante kann [ř̥] stehen (vgl. Hualde 2005: 186). und im nördlichen Argentinien wird dagegen der Trill oft als - diesmal stimmhafter - Sibilant realisiert (in IPA [ʑ]). 60 Wie bei den Lateralen in 2.5.1.4 bereits angesprochen, gibt es in Teilen Andalusiens und der Extremadura sowie auf den Kanarischen Inseln und in der Karibik Tendenzen, den Kontrast zwischen den Liquiden / l/ und / ɾ/ in der Coda zu neutralisieren. Die tatsächliche Realisierung schwankt dabei je nach Region zwischen dem Lateral [l] (Lambdazismus) und dem Tap [ɾ] (Rhotazismus). Durch Absenken der Zunge kann es daneben zu Vokalisierungen kommen, sodass der Liquid zum Gleitlaut [j] wird und mit dem vorangehenden Vokal einen Diphthong bildet. Mitunter erfolgt auch völlige Elision des Liquids in der Coda, was wortintern oft die Geminierung, also ‘Dopplung’ bzw. Längung des folgenden Konsonanten nach sich zieht. r-Laute als Approximanten / r/ [ɹː] [ ˈ kaɹːo] carro [ ˈ ɹːiko] rico [ ˈ onɹːa] honra / ɾ/ [ɹ] [ ˈ kaɹo] caro [ ˈ bɹoma] broma [ ˈ paɹte] parte r-Laute als Sibilanten / r/ [ʑ] ~ [ɕ] [ ˈ kaʑo] ~ [ ˈ kaɕo] carro - - / ɾ/ [ɕ] ~ [ʑ] [ko ˈ meɕ] ~ [ko ˈ meʑ] comer ‘essen’ - Neutralisierung von Liquiden (L) in der Coda (V_.) ‘Vertauschung’: Lambdazismus/ Rhotazismus [Vɾ.] ~ [Vl.] [ ˈ kaɾne] ~ [ ˈ kalne] carne ‘Fleisch’ [ko ˈ meɾ] ~ [ko ˈ mel] comer - [Vl.] ~ [Vɾ.] [ ˈ alto] ~ [ ˈ aɾto] alto ‘hoch’ [delan ˈ tal] ~ [delan ˈ taɾ] delantal ‘Schürze’ Vokalisierung [VL.] ~ [Vj.] [ ˈ poɾke] ~ [ ˈ pojke] porque ‘weil’ [ ˈ ɡolpe] ~ [ ˈ ɡojpe] golpe ‘Schlag’ Elision [VL.] ~ [V0̷.] [kan ˈ taɾ] ~ [kan ˈ ta] cantar ‘sin‐ gen’ [ ˈ alma] ~ [ ˈ ama] alma ‘Seele’ Elision mit Geminierung des folgenden Konsonanten [VL.C] ~ [VC.C] [ ˈ kaɾne] ~ [ ˈ kanne] carne - [ ˈ ɡolpe] ~ [ ˈ ɡoppe] golpe - 108 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="109"?> Anders als im Spanischen gibt es im Deutschen nur ein r-Phonem, und das wird in der Regel uvular realisiert: als stimmhafter uvularer Frikativ [ʁ] (bzw. Approximant [ʁ̞]), wenn der Luftstrom einen Engpass zwischen Zäpfchen und Hinterzunge passieren muss; als uvularer Vibrant [ʀ], wenn der Luftstrom das Zäpfchen in Schwingungen versetzt, sodass es gegen die Hinterzunge vibriert. Die Realisierung als alveolarer Vibrant [r] (oder als Tap [ɾ]) ist heute auf regionale (vor allem süddeutsche) Varietäten beschränkt. In der Coda wird der r-Laut im Deutschen zudem in der Regel vokalisiert (vgl. Wiese 1996: 252-258, Becker 2012: 39); er bildet dann zusammen mit dem vorangehenden Vokal einen Diphthong (wie in [ ˈ ʔeːɐ̯də] Erde, [ʔoːɐ̯] Ohr, [ʔuːɐ̯] Uhr), ein sog. r-Schwa (wie in [ ˈ leːʁɐ] Lehrer) oder er geht in dem Vokal auf (wie in [ʃɑːf] scharf, was gleichlautend mit Schaf ist). Auf das Spanische übertragen, stellen solche Aussprachegewohnheiten markante Charakteristika eines typisch deutschen Akzents dar. Um diesen zu vermeiden und auch um besser verstanden zu werden, lohnt es sich, einige Mühe auf das Erlernen von Tap und Trill zu verwenden. In 5.3.1 kommen wir hierauf zurück und stellen auch entsprechende Ausspracheübungen vor. Abb. 2.5-11 zeigt einen spanischen Trill und verschiedene Tap-Realisierungen in Oszillo- und Sonagrammen. Beim Trill in real(mente) (a) lassen sich deutlich drei Unterbrechungen des Luftstroms durch den Kontakt zwischen Zungenspitze und Alveolen erkennen. In den Öffnungsphasen sind im Oszillogramm kleine quasi-periodi‐ sche Schwingungen mit geringer Intensität auszumachen. Beim Tap in (b) gibt es dagegen nur eine einzige kurze Unterbrechung des Luftstroms. Der Tap in (c) ist als Approximant realisiert worden, denn hier ist gar keine Unterbrechung zu verzeichnen. In (d) sind zwischen Plosiv und Tap die Ausschläge eines kleinen Sprossvokals (sp. elemento esvarabático) zu erkennen, der in seiner Formantstruktur dem folgenden Vokal ähnelt. Abb. 2.5-11: Oszillo- und Spektrogramme von spanischen r-Lauten: a) real(mente), b) a pasar un (viajero), c) era, d) se trata. Abb. 2.5-12 zeigt abschließend Sagittalschnitte von der Artikulation spanischer und im Vergleich dazu deutscher r-Laute. 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 109 <?page no="110"?> Abb. 2.5-12: Sagittalschnitte der Artikulation der spanischen und deutschen r-Laute (a) und b) nach Kubarth 2009: 116, c) und d) nach Fiukowski 8 2010: 228). 2.5.2 Approximanten In 2.2.3 haben wir Approximanten oder Gleitlaute als Klasse von Lauten definiert, die zwischen dem konsonantischen (genauer frikativischen) und dem vokalischen Artikulationsmodus anzusiedeln sind: Sie weisen eine größere Engebildung als ein Vokal, aber eine geringere als ein Frikativ auf, und die Artikulation erfolgt ohne Friktionsgeräusch. Akustisch sind Approximanten durch eine deutliche For‐ mantstruktur gekennzeichnet, die jedoch raschere Transitionen aufweist, als das bei Vokalen der Fall ist. Trotz dieser gemeinsamen Charakteristika ist es sinnvoll, die Klasse der Approximanten mit Martínez Celdrán & Fernández Planas (2007: 170) nach ihrer jeweiligen Nähe zu anderen Lautklassen in vier Untergruppen zu unterteilen. Die Frikativapproximanten (sp. aproximantes espirantes) [β ð ɣ], zu denen wir auch die approximantische Realisierung des Frikativs / ʝ/ als [j] zählen können, haben wir in 2.5.1.1 und 2.5.1.2 bei der Behandlung der Obstruenten bereits kennengelernt. Die zweite Gruppe bilden die der Klasse der Sonoranten angehörenden Laterale [l] und [ʎ], die wegen fehlenden Friktionsgeräuschs zu den Approximanten gerechnet werden können. Zu den Sonoranten gehören auch die approximantischen Realisierungen der spanischen r-Laute als [ɹ], die wir in 2.5.1.5 behandelt haben. Aus silbenstruktureller Sicht lassen sich die Mitglieder dieser drei Untergruppen klar den Konsonanten zuordnen: Sie treten im Onset oder in der Coda von Silben auf und können oft auch gemeinsam mit anderen Konsonanten einen komplexen Anfangsrand bilden (vgl. auch 4.2.4.1). Dies gilt nicht für die vierte Untergruppe der Approximanten, die als die eigentlichen Gleitlaute oder Halbvokale zu den vokalischen Segmenten gehören: Sie kommen nur in unmittelbarer Nachbarschaft eines Vokals vor, mit dem sie gemeinsam den Nukleus der Silbe bilden und so einen Diphthong konstituieren (4.2.4.3). Dieser ist steigend, wenn der Gleitlaut dem Vokal vorangeht; fallend, wenn er ihm folgt (vgl. 2.5.3.2). Mit [j] und [w] kennt das Spanische zwei derartige Gleitlaute (oder Halbvokale), die in engem Bezug zu den hohen Vokalen [i] und [u] stehen. In Abb. 2.5-1 haben wir [j] und [w] zwar in Anlehnung an die IPA-Darstellungen als palatalen bzw. labiovelaren Approximanten in unsere Konsonantentabelle aufgenommen, doch es wäre auch denkbar, sie in einem 110 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="111"?> 61 Wort- und silbeninitial zählt [j] allerdings zu den konsonantischen (Frikativ-)Approximanten, die in der Silbe die Onsetposition einnehmen, denn hier findet keine Resyllabierung vorangehender wortfinaler Konsonanten statt. [j] wird vielmehr in dieser Position oft zu [ʝ] oder [ɟ͡ʝ] verstärkt. Bei [w] resultiert die silben- oder wortinitiale Verstärkung dagegen in den Abfolgen [ɣw] oder [ɡw] (vgl. [kam ˈ bjaɾ] cambiar ‘wechseln’ vs. [paɾa ˈ no.ja] ~ [paɾa ˈ no.ʝa] paranoia ‘Paranoia’, [dez ˈ ʝelo] deshielo ‘Tauwetter’, [kon j ˈ ɟ͡ʝelo] con hielo ‘mit Eis’; [ ˈ bweno] bueno ‘gut’ vs. [si ˈ weɲa] ~ [si ˈ ɣweɲa] cigüeña ‘Storch’, [de ˈ weβo] ~ [de ˈ ɣweβo] de huevo ‘aus Ei’, [koŋ ˈ ɡweβo] con huevo ‘mit Ei’). Eine ausführliche Behandlung dieser Differenzierungen findet sich in Hualde (2005: 89, 165ff.), vgl. auch Martínez Celdrán & Fernández Planas (2007: 166ff.). Zur phonologischen Wertung vgl. 3.1.2. 62 So verfahren z. B. Hualde (2005: 16) und NGRAE (2011: 25). Letztere fasst diese Untergruppe der Approximanten als vocales satélites zusammen. Durch den Unterbogen kann symbolphonetisch jeder Vokal als Gleitlaut dargestellt werden, und diese Wiedergabe wird meist auch für die Diphthonge des Deutschen genutzt (vgl. Becker 2012: 35 und 2.5.1.5 für das sog. r-Schwa). In der spanischen Tradition ist es üblich, den Gleitlaut vor einem Vokal als Halbkonsonanten durch [j] bzw. [w] zu transkribieren, den auf den Vokal folgenden dagegen als Halbvokal durch [ i ̯ ] bzw. [u̯]. Vokaltrapez im Umfeld der hohen Vokale unterzubringen, wo sie eine geringfügig zentralere Position einnehmen würden als diese (vgl. Martínez Celdrán & Fernández Planas 2007: 165). Gleitlaute unterscheiden sich von den Vokalen nur dadurch, dass sie keinen eigenen Silbenkern bilden und nicht gelängt werden können. 61 Um die Nähe zu den Vokalen auch in der Transkription deutlich zu machen, werden statt [j] und [w] oft die mit einem Unterbogen versehenen Zeichen für die hohen Vokale verwendet, also [ i ̯ ] und [u̯]. 62 Der Einfachheit halber gebrauchen wir im Normalfall die Symbole [j] und [w]. Welche Diphthonge durch die Kombination dieser Gleitlaute mit den Vokalen des Spanischen gebildet werden können, wird in Abschnitt 2.5.3.2 erörtert. Abb. 2.5-13 zeigt die Untergruppen der spanischen Approximanten nach Martínez Celdrán & Fernández Planas (2007: 170). Abb. 2.5-13: Klassifizierung der spanischen Approximanten (nach Martínez Celdrán & Fernández Planas 2007: 170). 2.5.3 Vokale Bei der Artikulation von Vokalen passiert der durch die Phonation in periodische Schwingungen versetzte Luftstrom den Mund- (und gegebenenfalls Nasen-)Raum, ohne dass er durch Engebildungen oder Verschlüsse irgendwelcher Art behindert wird. 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 111 <?page no="112"?> 63 Vgl. hierzu auch die Tendenz zu einer nicht-kategoriellen Wahrnehmung der Vokale (2.4.2). Der Referenzrahmen für die Erstellung von Vokaltrapezen, auf den wir auch hier zurückgreifen, ist das von dem englischen Phonetiker Daniel Jones (1881-1967) entwickelte System von Kardinalvokalen, das auf einer Kombination von artikulatorischen und auditiven Kriterien beruht (vgl. hierzu Kohler 2 1995: 67ff.). Vokale sind friktionslose, stimmhafte Laute, deren unterschiedliche Klangfarbe durch die jeweilige Konfiguration des Ansatzrohres entsteht; akustisch zeigt sich dies in der spezifischen Formantstruktur. Als Sonoritätsmaxima wirken Vokale zudem silbenbildend: Sie sind präferierte Silbenkerne, und im Spanischen stimmt die Zahl der Vokale einer Äußerung mit der Zahl der Silben, in die diese sich untergliedern lässt, überein (4.2.2). In vielen Sprachen kann nicht nur ein Vokal allein den Kern der Silbe bilden, sondern es kommen auch Verbindungen aus zwei oder sogar drei vokalischen Segmenten dafür infrage. Wir werden zuerst die einfachen Vokale oder Monophthonge des Spanischen behandeln (2.5.3.1), bevor wir in 2.5.3.2 auf die Di- und Triphthonge eingehen und sie Vokalsequenzen gegenüberstellen, die auf zwei Silben verteilt sind und deshalb einen Hiatus darstellen. 2.5.3.1 Monophthonge Anders als die artikulatorisch leichter zu erfassenden Konsonanten können selbst die einfachen Vokale symbolphonetisch nicht in einer Tabelle mit den Koordinaten Artikulationsstelle und -modus präsentiert werden. Wie wir in 2.2.3 schon gesehen haben, erfolgt ihre Veranschaulichung in der Regel in einem trapezartigen oder dreieckigen Gebilde, das den Mundraum und die ungefähre Position der Zunge darin wiederzugeben sucht. Dabei zeigen die Eckpunkte für gewöhnlich links oben die höchste bzw. links unten die tiefste Position der Vorderzunge, rechts oben die höchste bzw. rechts unten die tiefste Position der Hinterzunge an. Zur Zungenhöhe (mit drei bis fünf verschiedenen Stufen) und dem artikulierenden Zungenteil (mit drei Unterteilungen) kommt als dritter Parameter die Lippenstellung, bei der gerundet (oder vorgestülpt, sp. (vocal) redondeada) und ungerundet (oder gespreizt, sp. (vocal) no redondeada) unterschieden werden. Wenn anhand dieser Parameter die Positionen für Vokale verschiedener Sprachen durch Punkte im Trapez oder Dreieck markiert werden, ist dies als Untergliederung artikulatorischer Kontinua auf jeden Fall arbiträr und kann jeweils nur eine ungefähre Annäherung an die lautsprachliche Realität darstellen, die zudem durch breite Streuung und vielfältige Koartikulationseffekte charakterisiert ist. 63 112 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="113"?> Abb. 2.5-14: Links: Trapezdarstellung der Vokale des Spanischen und des Deutschen; rechts: Dreiecks‐ darstellung der Vokalphoneme des Spanischen. In Abb. 2.5-14 sind links die Vokale des Spanischen und des Deutschen in einem solchen Vokaltrapez zusammengestellt. Vokale, denen im Spanischen (und im Deut‐ schen) Phonemstatus zuerkannt wird, sind hier groß und fett eingekreist, potentielle Allophone erscheinen etwas kleiner, und die Pfeile deuten an, welche Vokalphoneme sie im Spanischen gegebenenfalls vertreten. Vokale, die sowohl im Spanischen als auch im Deutschen vorkommen, sind grau eingekreist; die spezifisch deutschen Vokale sind grau und einige nur im Spanischen auftretende Allophone schwarz. Trotz der Vielfalt der hier (nach NGRAE 2011: 92) erfassten potentiellen Variation bleibt festzuhalten, dass das Vokalsystem des Spanischen sehr einfach strukturiert ist und eine vergleichsweise große Stabilität aufweist. Deshalb ist die auf Variation verzichtende rechte Darstellung im Vokaldreieck für die meisten Zwecke völlig ausreichend. In Bezug auf die vertikale Dimension (Höhe der Zunge) hat das Spanische mit / i u/ , / e o/ und / a/ zwei hohe, zwei mittlere und einen tiefen Vokal. Es werden also nur drei Öffnungsgrade unterschieden - gegenüber vier im Portugiesischen, Katalanischen, Französischen, Italienischen, Deutschen und vielen anderen Sprachen. Vor dem Vibranten / r/ und dem velaren Frikativ / x/ werden die mittleren Vokale / e/ und / o/ in der Regel halboffen anstatt wie sonst halbgeschlossen artikuliert, als [ɛ] und [ɔ] also. Tendenzen zu ihrer Öffnung gibt es auch in geschlossener Silbe, doch sind diese im spanischen Sprachraum nicht durchgehend auszumachen. Sie werden deshalb - wie auch die Öffnung vor / r/ und / x/ - nur in den Beispielen zu den mittleren Vokalen unten berücksichtigt und entfallen ansonsten in unseren Transkriptionen. Systematisch ist die Öffnung der mittleren Vokale vor einem silbenschließenden Konsonanten jedoch in einigen ostandalusischen Varietäten. Da der offene Charakter der Vokale hier auch nach dem üblichen Wegfall von silbenschließendem / s/ erhalten bleibt (vgl. 3.1.2.1), 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 113 <?page no="114"?> 64 Der tiefe Vokal / a/ wird hier in offener Silbe als [ɑ] realisiert und in geschlossener Silbe zu [æ] angehoben. Außerdem wird der Öffnungsgrad des finalen Vokals auf die vorangehenden Vokale übertragen, die entsprechend umgelautet werden (vgl. dazu genauer Penny 2000: 125f. und Hualde 2005: 130 sowie 3.1.2.1). 65 Nur für die Konjunktion [i] ‘und’ wird der Buchstabe <y> verwendet. 66 Außer im Digraphem <ch>, das konsequent für die Affrikate / t͡ʃ/ steht (vgl. 2.5.1.2), erscheint der Buchstabe <h> vornehmlich in zwei verschiedenen etymologischen Zusammenhängen: einmal setzt er - wie in historia oder hora - lateinisches < H > fort, das seinen Lautwert [h] schon in der Antike verloren hatte; zum anderen repräsentiert er den altkastilischen [h]-Laut, der sich - vermutlich unter baskischem Einfluss - seit dem 11. Jahrhundert aus wort- und silbeninitialem [f] entwickelt hat (Alarcos Llorach 4 1986: 254ff.). Aus der spanischen Phonie ist dieses [h] spätestens seit dem 16. Jahrhundert wieder verschwunden, sodass auch hier die Schreibung nur aus historischen Gründen erfolgt. kann der Unterschied in der Realisierung (geschlossener vs. offener Vokal) letztlich zur Differenzierung von Singular und Plural in der Nominalflexion (Davis & Pollock 2024: 3-8) bzw. von 3. und 2. Person Singular in der Verbflexion genutzt werden, sodass ein komplexeres Vokalsystem resultiert. 64 In der horizontalen Dimension lassen sich mit / i e/ , / a/ und / u o/ zwei vordere, ein mittlerer und zwei hintere Vokale unterscheiden (wobei die beiden letzteren zugleich gerundet sind). Vordere gerundete Vokale, wie sie etwa das Französische und das Deutsche mit / y ø œ/ aufweisen (vgl. fr. [myʁ] mur ‘Mauer’, [fø] feu ‘Feuer’, [pœʁ] peur ‘Angst’), kennt das Spanische nicht. Auch der Gegensatz zwischen gespannten bzw. langen und ungespannten bzw. kurzen Vokalen, wie er das Deutsche kennzeichnet (vgl. dt. [ ˈ biːtə] biete vs. [ ˈ bɪtə] bitte, [ ˈ hyːtə] Hüte vs. [ ˈ hʏtə] Hütte, [ ˈ puːtə] Pute vs. [ ˈ pʊtə] Putte, [ ˈ høːlə] Höhle vs. [ ˈ hœlə] Hölle etc.), ist im Spanischen nicht vertreten. Allerdings sind unbetonte Vokale hier für gewöhnlich etwas weniger gespannt und auch kürzer als betonte. Gelängte Vokale treten dagegen im Spanischen oft bei Emphase auf. Auch wenn es in nachlässiger Aussprache zu Zentralisierungen kommen kann, bei denen in unbetonter Silbe / e/ zu [ə] und / a/ zu [ɐ] tendiert (vgl. NGRAE 2011: 99f.), entspricht das Ergebnis in aller Regel nicht den Schwalauten [ə] und [ɐ], wie sie in den sog. Reduktionssilben des Deutschen auftreten (vgl. dt. [ ˈ bɪtə] bitte, [ ˈ bɪtɐ] bitter). Anders als im Deutschen wird ein vokalischer Anlaut im Spanischen nicht mit einem Glottisschlag oder Knacklaut eingeleitet (vgl. etwa dt. [ ˈ ʔaχtʊŋ] Achtung mit sp. [aten ˈ sjon] atención ‘Achtung’). Zur Schreibung der spanischen Vokale dienen die fünf Vokalbuchstaben <i>, 65 <u>, <e>, <o> und <a>. Aus etymologischen Gründen kann ihnen gegebenenfalls ein <h> (ohne Lautwert) vorangehen. 66 hohe Vokale / i/ [i] [ ˈ piso] piso ‘Stockwerk’ [is ˈ toɾja] historia H I S T O R I A ‘Geschichte’ / u/ [u] [ ˈ puso] puso ‘er/ sie stellte’ [ume ˈ aɾ] humear F U M A R E ‘qualmen’ 114 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="115"?> mittlere Vokale / e/ [e] [ ˈ peso] peso ‘Gewicht’ [e ˈ ðoɾ] hedor F O E T O R ‘Gestank’ _r, _x [ɛ] [ ˈ pɛra] perra ‘Hündin’ [ ˈ kɛxa] queja - ‘Klage’ _C. - [pa ˈ pɛl] papel ‘Papier’ [ ˈ tɛsta] testa - ‘Haupt’ / o/ [o] [ ˈ poso] pozo ‘Brunnen’ [ ˈ oɾa] hora H O R A ‘Stunde’ _r, _x [ɔ] [ ˈ ɡɔra] gorra ‘Mütze’ [ ˈ ɔxo] ojo - ‘Auge’ _C. - [ ˈ kɔsta] costa ‘Küste’ [mɔn ˈ tɔn] montón - ‘Unmenge’ tiefer Vokal / a/ [a] [ ˈ paso] paso ‘Schritt’ [a ˈ βeɾ] haber H A B E R E ‘haben’ mittlere und tiefe ostandalusische Vokale / e/ [e] - - [ ˈ bjene] viene ‘er/ sie kommt’ - - / ɛ/ [ɛ] ([ ˈ bjenɛs] >) [ ˈ bjɛnɛ] vienes ‘du kommst’ - - / o/ [o] - - [ ˈ toɾo] toro ‘Stier’ - - / ɔ/ [ɔ] ([ ˈ toɾɔs] >) [ ˈ tɔɾɔ] toros ‘Stiere’ - - / a/ [a] - - [ ˈ pala] pala ‘Schaufel’ - - / æ/ [æ] ([ ˈ palæs] >) [ ˈ pælæ] palas ‘Schaufeln’ - - In 2.2.3 und 2.3.2 haben wir gesehen, dass Vokale ihre spezifische Klangfärbung durch die jeweilige Konfiguration des Mundraums erhalten, denn dadurch werden bestimmte Resonanzfrequenzen, die Formanten, verstärkt. In Abb. 2.5-15 sind typische Frequenz‐ werte der beiden ersten Formanten spanischer und deutscher Vokale, wie sie von männlichen Muttersprachlern produziert wurden, in ein Koordinatensystem eingetra‐ gen: auf der y-Achse sehen wir die Werte für F 1 (die negativ mit der Zungenhöhe korrelieren), auf der x-Achse die Werte für F 2 (die der horizontalen Zungenposition von hinten nach vorn entsprechen). Verbindet man die Schnittpunkte für die einzelnen Vokale, so erhält man die akustische Entsprechung des oben eher impressionistisch erstellten Vokaltrapezes bzw. -dreiecks. Die Abbildung lässt zugleich gewichtige Unterschiede zwischen spanischen und deutschen Vokalen deutlich werden. So ist das spanische [e] offener als das deutsche; es ist etwa auf halbem Weg zwischen deutschem [e] und [ɛ] angesiedelt. Noch augenfälliger sind die Unterschiede beim spanischen [o], das dem deutschen [ɔ] nahekommt, während spanisches [u] in etwa die gleiche Zungenhöhe aufweist wie das deutsche [o], aber weiter vorn artikuliert wird. 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 115 <?page no="116"?> Abb. 2.5-15: Typische Frequenzwerte der beiden ersten Formanten spanischer und deutscher Vokale, männliche Sprecher (nach Martínez Celdrán & Fernández Planas 2007: 175 für die spanischen, Mayer 2010: 114 und 116 für die deutschen Werte). Abb. 2.5-16 zeigt abschließend Sagittalschnitte von der Artikulation der spanischen Vokale. Abb. 2.5-16: Sagittalschnitte der Artikulation von sp. a) [i], b) [e], c) [a], d) [o], e) [u] (nach Kubarth 2009: 85). 2.5.3.2 Diphthonge und Hiate Wenn zwei Vokalstellungen innerhalb einer Silbe (also tautosyllabisch) unmit‐ telbar ineinander übergehen, so bilden sie einen Diphthong (4.2.4.3). Die beiden Bestandteile dieses ‘Doppellauts’ sind dabei in der Regel nicht gleichwertig; vielmehr behält einer der Vokale seine Klangfülle und stellt das Sonoritätsmaximum dar, während der andere zum Approximanten (bzw. Gleitlaut oder Halbvokal) wird. Im Spanischen (wie in vielen anderen Sprachen) sind es vornehmlich die hohen Vokale / i/ und / u/ , die in Diphthongen als Gleitlaute [j] und [w] (bzw. [ i ̯ ] und [u̯], vgl. 2.5.2) erscheinen. Gehen diese dem vollen Vokal voran, so spricht man wegen der zunehmenden Klangfülle von einem steigenden Diphthong (sp. diptongo creciente); folgt der Gleitlaut dem Vokal, so ist der Diphthong fallend (sp. diptongo decreciente). 116 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="117"?> 67 Allerdings ist im paraguayischen Spanisch, das in Kontakt mit dem Guaraní steht, der Glottisschlag in intervokalischer Position verbreitet. Auf diese Art wird das Aufeinandertreffen zweier Vokale wie beispielsweise in mi [ʔ]hijo ‘mein Sohn’ vermieden, vgl. Gabriel et al. (2020b: 42). 68 Hualde (2005: 80ff.) diskutiert die Regelmäßigkeiten dieser Variation ausführlich (vgl. auch Kubarth 2009: 93ff.). Zu den sprachlichen Faktoren, die einen Hiatus begünstigen, gehört etwa eine Morphem‐ grenze zwischen den betreffenden Vokalen oder die Nähe der Vokale zum Wortanfang sowie ein geringer Abstand zur folgenden Akzentsilbe. Die Tendenz, Hiate zugunsten von Diphthongen zu vermeiden, ist im lateinamerikanischen Spanisch stärker ausgeprägt als im europäischen. Sie kann zudem schnelles und/ oder informelles bzw. nachlässiges Sprechen kennzeichnen. In einem Triphthong (wörtlich ‘Dreilaut’, sp. triptongo) ist der volle Vokal auf beiden Seiten von Gleitlauten umgeben, der Nukleus ist hier also steigend-fallend. Im Spanischen können [j] und [w] mit den Vokalen [e], [a] und [o] jeweils die steigenden Diphthonge [je]/ [we], [ja]/ [wa], [jo]/ [wo] (z. B. [ ˈ fweɾa] fuera ‘raus’) und die fallenden Diphthonge [ej]/ [ew], [aj]/ [aw], [oj]/ [ow] (z. B. [ ˈ rejna] reina ‘Königin’) bilden (wobei [ow] wortintern nur in Entlehnungen - vornehmlich aus dem Katala‐ nischen - vorkommt). Steigende Diphthonge werden im Spanischen prinzipiell bevorzugt, und das gilt auch, wenn die hohen Vokale / i/ und / u/ gemeinsam in einem Diphthong auftreten (vgl. NGRAE 2011: 333). Die Position des Approximanten kann hier jedoch regional schwanken, weshalb wir mit Kubarth (2009: 88) in diesen Fällen variable Diphthonge ansetzen: Sie werden als [ju] oder [iw] und andersherum als [wi] oder [uj] realisiert (z. B. [ ˈ bjuða] ~ [ ˈ biwða] viuda ‘Witwe’). Eine Verbindung von [j] mit [i] oder [w] mit [u] ist im Spanischen nicht möglich, da sie praktisch alle Merkmale teilen und einander deshalb sehr ähnlich sind. Triphthonge werden nur mit / e/ oder / a/ als Vollvokal gebildet. Sie treten vornehmlich in der 2. Person Plural spanischer Verben auf (z. B. [estu ˈ ðjajs] estudiáis ‘ihr studiert’); in anderen Wörtern haben sie meist eine lautmalerische Funktion. Gehören unmittelbar benachbarte Vokale zwei verschiedenen Silben an, sind sie also heterosyllabisch, so bezeichnet man ihr Zusammentreffen an der Silbengrenze als Hiatus oder Hiat (sp. hiato). Im Spanischen (wie auch im Deutschen) sind Abfolgen von nicht hohen Vokalen, also Kombinationen aus / e/ , / a/ und / o/ in der Regel hetero‐ syllabisch, so etwa die Vokale in sp./ dt. real. Anders als in der deutschen Aussprache, wo die betroffenen Vokale meist durch einen Knacklaut (Glottisschlag) voneinander getrennt werden ([ʁe ˈ ʔɑːl]), gehen sie im Spanischen ohne Absetzen ineinander über (vgl. für ein Sonagramm dieses Hiatus im Spanischen Abb. 2.5-11a). 67 Doch auch die Kombination von Vokal mit hohem Vokal ergibt nicht zwangsläufig einen Diphthong, sondern wird gegebenenfalls als Hiatus syllabiert. Das ist z. B. immer dann der Fall, wenn der hohe Vokal den Wortakzent trägt und wegen seiner daraus resultierenden größeren Klangfülle nicht als Gleitlaut realisiert wird. Bei allen anderen Vokalsequenzen, für die zumindest die kastilische Norm einen Hiatus ansetzt, lässt sich große Variation zwischen hetero- und tautosyllabischer Gruppierung der Vokale ausmachen, die durch sprachliche und außersprachliche Faktoren mitbestimmt wird. 68 Prinzipiell ist jedoch die Tendenz, Vokalfolgen tautosyllabisch in einer Silbe zusam‐ menzuführen, im Spanischen weit verbreitet (4.2.6). Während bei gleichen Vokalen 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 117 <?page no="118"?> 69 In nachlässigem Sprechen können diese weiter zu [j] oder [w] angehoben werden: [te ˈ atɾo] ~ [ ˈ t e ̯ atɾo] ~ [ ˈ tjatɾo] teatro ‘Theater’, [almo ˈ aða] ~ [al ˈ mo̯aða] ~ [al ˈ mwaða] almohada ‘Kissen’ (vgl. NGRAE 2011: 339). 70 Dieses <h-> (wie in <huevo> ‘Ei’) diente in mittelalterlichen Texten dazu, wortinitiales <u> als (halb)vokalisch zu kennzeichnen und damit eine konsonantische Lesart (als [b] o. ä.) zu verhindern. Auch nach der Ausdifferenzierung der Buchstaben in <u> und <v> ist diese graphotaktische Schreibung beibehalten worden. normalerweise die Kontraktion zu einem Monophthong erfolgt (z. B. [kɾe ˈ emos] ~ [ ˈ kɾemos] creemos ‘wir glauben’, [alko ˈ ol] ~ [al ˈ kol] alcohol ‘Alkohol’, [alβa ˈ aka] ~ [al ˈ βaka] albahaca ‘Basilikum’), werden in mehr oder weniger informellem Sprechen auch Sequenzen mit den mittleren Vokalen / e/ und / o/ , die eigentlich einen Hiatus bilden, diphthongisch realisiert, wobei die Gleitlaute [ e ̯ ] und [o̯] entstehen. 69 Zu derartigen Kontraktionen kommt es auch über Wortgrenzen hinweg, wenn innerhalb einer Wortgruppe der letzte Vokal des vorangehenden mit dem ersten des folgenden Wortes in einer Silbe realisiert wird - was besonders häufig geschieht, wenn beide Vokale unbetont sind. Auch hier resultieren also Diphthonge, in denen sowohl hohe als auch mittlere Vokale als Gleitlaute fungieren ([mjeɾ ˈ mana] mi hermana ‘meine Schwester’, su hermano [sweɾ ˈ mano] ‘sein/ ihr Bruder’, [s e ̯ a ˈ kaβa] se acaba ‘(es) endet’), während gleiche Vokale wiederum zu Monophthongen zusammengezogen werden ([es ˈ taβa ˈ ki] estaba aquí ‘es war hier’). Dieses Phänomen der wortübergreifenden Verschmelzung aufeinandertreffender Vokale nennt man Synalöphe (von gr. σύν/ syn ‘zusammen (mit)’ + ἀλείφω/ aleipho ‘salben, schmieren’, sp. sinalefa; vgl. 4.2.6). In der spanischen Graphie werden Vollvokale und Gleitlaute in Diphthongen durch die üblichen Vokalbuchstaben repräsentiert. Für [j] und [w] in Diphthongen stehen also in der Regel die Buchstaben <i> und <u>. Nur am Wortende wird <y> für [j] gesetzt. In 2.5.1.1 und 2.5.2 (Fußnoten 41 und 61) haben wir schon darauf hingewiesen, dass wort- und silbeninitiales [w] häufig durch [ɡ] verstärkt wird, was in der Schreibung nur sehr selektiv durch <g-> eine Entsprechung findet. Steht jedoch <g> am Wort- oder Silbenanfang, so ist [w] in [we] und [wi] durch <ü> wiederzugeben (z. B. <cigüeña> ‘Storch’): Das Trema zeigt hier an, dass die Abfolge <gu> vor <e> und <i> nicht wie sonst für [ɡ] oder [ɣ], sondern für [ɡw] oder [ɣw] steht. In all den Wörtern, in denen für das potentielle [ɡ] vor initialem [w] kein <g-> geschrieben wird, steht aus historischen Gründen vor dem <u> ein <h->. 70 Trägt in einer Vokalsequenz der hohe Vokal den Wortakzent, sodass diese als Hiatus realisiert wird, muss der entsprechende Vokalbuchstabe mit dem Akut (sp. tilde) als <í> oder <ú> gekennzeichnet werden (<día> ‘Tag’). Ist die Tonstelle auf einem nur aus hohen Vokalen bestehenden Diphthong graphisch anzuzeigen, so wird der Akut entsprechend der Präferenz für steigende Diphthonge auf den Buchstaben für den zweiten Vokal gesetzt (<interviú> ‘Interview’, NGRAE 2011: 333). Unabhängig davon, ob sie Diphthonge oder Hiate repräsentieren, darf im Spanischen zwischen Vokalbuchstaben keine Silbentrennung am Zeilenende erfolgen (ORTE 2010: 405). 118 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="119"?> steigende Diphthonge (und Hiate) [je] [ ˈ sjete] siete ‘sieben’ [ ˈ naðje] nadie ‘nie‐ mand’ [ ˈ i.e] [ ˈ ri.e] ríe ‘er/ sie lacht’ - - - [i.e] ~ [je] [kli ˈ ente] ~ [ ˈ kljente] cliente ‘Kunde’ - - - - [mi.eɾ ˈ mana] ~ [mjeɾ ˈ mana] mi her‐ mana ‘meine Schwester’ - - - [we] [ ˈ nweβe] nueve ‘neun’ [ ˈ tenwe] tenue ‘zart’ - [ ˈ (ɡ)weβo] huevo ‘Ei’ [si ˈ (ɣ)weɲa] cigüeña ‘Storch’ [ ˈ u.e] [ta ˈ βu.es] tabúes ‘Tabus’ - - - [u.e] ~ [we] [kɾu ˈ el] ~ [kɾwel] cruel ‘grausam’ - - - - [tu.eɾ ˈ mana] ~ [tweɾ ˈ mana] tu her‐ mana ‘deine Schwester’ - - - [ja] [o ˈ ðjaɾ] odiar ‘hassen’ [ ˈ ɡɾasjas] gracias ‘danke’ [ ˈ i.a] [ ˈ di.a] día ‘Tag’ - - - [i.a] ~ [ja] [di ˈ aβlo] ~ [ ˈ djaβlo] diablo ‘Teufel’ - - - - [mi.a ˈ βwela] ~ [mja ˈ βwela] mi abuela ‘meine Groß‐ mutter’ - - - [wa] [ ˈ kwatɾo] cuatro ‘vier’ [ ˈ rekwa] recua ‘Menge’ - [ ˈ (ɡ)wante] guante ‘Handschuh’ [ ˈ a(ɣ)wa] agua ‘Wasser’ [ ˈ u.a] [konti ˈ nu.a] continúa ‘er/ sie fährt fort’ - - - [u.a] ~ [wa] [anu ˈ al] ~ [a ˈ nwal] anual ‘jährlich’ - - - - [tu.a ˈ βwela] ~ [twa ˈ βwela] tu abuela ‘deine Groß‐ mutter’ - - - [jo] [ra ˈ sjon] ración ‘Portion’ [ ˈ laβjo] labio ‘Lippe’ [ ˈ i.o] [ ˈ ri.o] río ‘Fluss’ - - - [i.o] ~ [jo] [bi ˈ om.bo] ~ [ ˈ bjombo] biombo ‘Schirm’ - - - - [mi. ˈ ombɾe] ~ [ ˈ mjombɾe] mi hombre ‘mein Mann’ - - - [wo] [sun ˈ twoso] suntuoso ‘prächtig’ [ ˈ bakwo] vacuo ‘leer’ [ ˈ u.o] [ ˈ bu.o] búho ‘Uhu’ - - - 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 119 <?page no="120"?> [u.o] ~ [wo] [ku ˈ ota] ~ [ ˈ kwota] cuota ‘Quote’ - [tu ˈ ombɾe] ~ [ ˈ twombɾe] tu hombre ‘dein Mann’ - - - fallende Diphthonge (und Hiate) [ej] [ ˈ bejnte] veinte ‘zwanzig’ [ ˈ rej] rey ‘König’ [e. ˈ i] [re ˈ iɾ] reír ‘lachen’ - - - [e.i] ~ [ej] [re.i ˈ ɾe] ~ [rej ˈ ɾe] reiré ‘ich werde la‐ chen’ - - - - [kan ˈ te.i.βaj ˈ le] ~ [kan ˈ tejβaj ˈ le] canté y bailé ‘ich sang und tanzte’ - - - [ew] [ ˈ dewða] deuda ‘Schuld’ [ew ˈ ɾopa] Europa ‘Europa’ [e. ˈ u] [re ˈ usa] rehusa ‘er/ sie lehnt ab’ - - - [e.u] ~ [ew] [re ˈ uma] ~ [ ˈ rewma] reúma/ reuma ‘Rheuma’ - - - - [baj ˈ le.umbo ˈ leɾo] ~ [baj ˈ lewmbo ˈ leɾo] bailé un bolero ‘ich tanzte ei‐ nen Bolero’ - - - [aj] [ ˈ bajle] baile ‘Tanz’ [baj ˈ niʝa] vainilla ‘Vanille’ - [ka ˈ ɾaj] ¡caray! ‘Donnerwet‐ ter! ’ - - - [a. ˈ i] [ka ˈ iða] caída ‘Sturz’ - - - [a.i] ~ [aj] [ka.i ˈ mjento] ~ [kaj ˈ mjento] caimiento ‘Fall’ - - - - [ ˈ kanta.i. ˈ βajla] ~ [ ˈ kantaj ˈ βajla] canta y baila ‘er/ sie singt und tanzt’ - - - [aw] [ ˈ kawsa] causa ‘Ursache’ [kaw ˈ ðal] caudal ‘reichhal‐ tig’ [a. ˈ u] [ba ˈ ul] baúl ‘Koffer’ [a ˈ uʝa] aúlla ‘er/ sie heult’ [a.u] ~ [aw] [a.uʝa ˈ ɾa] ~ [awʝa ˈ ɾa] aullará ‘er/ sie wird heulen’ - - - - [ ˈ da.ummen ˈ saxe] ~ [ ˈ dawmmen ˈ saxe] da un mensaje ‘er/ sie gibt eine Nachricht’ - - - [oj] [ ˈ bojna] boina ‘Baskenmütze’ [oj] hoy ‘heute’ [o. ˈ i] [o ˈ iðo] oído ‘Gehör’ - - - [o.i] ~ [oj] [o.i ˈ ɾe] ~ [oj ˈ ɾe] oiré ‘ich werde hören’ - - - 120 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="121"?> [lo.in ˈ tuʝe] ~ [lojn ˈ tuʝe] lo intuye ‘er/ sie ahnt es’ [ow] [bow] bou (kat.) ‘Fischtrawler’ - - - [o.u] ~ [ow] [lo.uti ˈ lisa] ~ [lowti ˈ lisa] lo utiliza ‘er/ sie benutzt es’ - - - (variable) Diphthonge (und Hiate) aus hohen Vokalen [ju] ~ [iw] [ ˈ bjuða] ~ [ ˈ biwða] viuda ‘Witwe’ - - - - [dju ˈ ɾetiko] ~ [diw ˈ ɾetiko] diurético ‘harntreibend’ - - - - [inteɾ ˈ βju] ~ [inteɾ ˈ βiw] interviú ‘Interview’ - - - [i.u] ~ [ju] [di ˈ uɾno] ~ [ ˈ djuɾno] diurno ‘täglich’ - - - - [mi.uni ˈ ðað] ~ [mjuni ˈ ðað] mi unidad ‘meine Einheit’ - - - [wi] ~ [uj] [ ˈ kwita] ~ [ ˈ kujta] cuita ‘Sorge’ [kwi ˈ ðaɾ] ~ [kuj ˈ ðaɾ] cui‐ dar ‘sorgen’ - [ ˈ (ɡ)wito] ~ [ ˈ (ɡ)ujto] güito ‘Aprikosen‐ kern’ [mwi] ~ [muj] muy ‘sehr’ - [a ˈ kwifeɾo] ~ [a ˈ kujfeɾo] acuífero ‘wasserführend’ - - - [u.i] ~ [wi] [koŋklu ˈ iðo] ~ [koŋ ˈ klwiðo] concluido ‘abgeschlossen’ - - - - [tu.is ˈ toɾja] ~ [twis ˈ toɾja] tu historia ‘deine Ge‐ schichte’ - - - 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 121 <?page no="122"?> Triphthonge [jej] [estu ˈ ðjejs] estudiéis ‘ihr möget studieren’ - - - [wej] [aβeɾi ˈ ɣwejs] averigüéis ‘ihr möget ermitteln’ [bwej] buey ‘Ochse’ [jaj] [kam ˈ bjajs] cambiáis ‘ihr wechselt’ [i.aj] ~ [jaj] y hay ‘und es gibt’ [waj] [aβeɾi ˈ (ɣ)wajs] averiguáis ‘ihr ermittelt’ [o.aj] ~ [o̯aj] ~ [waj] o hay ‘oder es gibt’ [jaw] [mjaw] miau ‘miau’ - - - [waw] [(ɡ)waw] guau ‘wau’ - - - Im Deutschen gibt es - von Entlehnungen wie [ɡ̊ eˈnɪ ̯ al] genial, [ paɐ̯ ˈʦɪ ̯ ɛl] partiell, [n ɑ ˈʦɪ ̯ oːn] Nation, [liŋ ˈ ɡʊ̯ɪstɪk] Linguistik u. ä. abgesehen - keine steigenden Diphthonge, und auch die Zahl der fallenden Diphthonge ist stärker eingeschränkt als im Spani‐ schen: Es treten nur [ aɪ ̯ ], [aʊ̯] und [ ɔɪ ̯ ] wie in [ ˈlaɪ ̯ tə ] leite, [ ˈ laʊ̯tə] Laute, [ ˈlɔɪ ̯ tə ] Leute/ läute auf. Dass zur Transkription der Gleitlaute hier die ungespannten Vokale [ɪ] und [ʊ] mit dem Diakritikon versehen werden, macht deutlich, dass diese deutschen Diphthonge weniger geschlossen sind als ihre spanischen Entsprechungen. Es ist also beim Erlernen des Spanischen auf eine geschlossene Aussprache der Diphthonge zu achten. In 2.5.1.5 haben wir schon darauf hingewiesen, dass r-Laute in der Coda im Deutschen häufig (halb)vokalisch realisiert werden (sog. r-Vokalisierung), wodurch hier weitere (fallende) Diphthonge entstehen (vgl. z. B. dt. [iːɐ̯] ihr, [meːɐ̯] mehr/ Meer, [nuːɐ̯] nur). Eine Übertragung dieser Aussprachegewohnheit ins Spanische sollte vermieden werden (vgl. 5.3.1). Übungsaufgaben 1. Welches sind die drei Teilbereiche der Phonetik? Charakterisieren Sie diese kurz. 2. Was unterscheidet das International Phonetic Alphabet (IPA) von einer gewöhnli‐ chen Alphabetschrift? 3. Charakterisieren Sie die drei Funktionskreise der Lautproduktion. 4. Wie lassen sich Vokale gegenüber Konsonanten und Approximanten charakteri‐ sieren? 122 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="123"?> 5. Kreuzen Sie die Merkmale der folgenden Vokale an. - +vorne +gerundet +(halb)geschlossen [u] ☐ ☐ ☐ [e] ☐ ☐ ☐ [i] ☐ ☐ ☐ [y] ☐ ☐ ☐ [ɛ] ☐ ☐ ☐ 6. Ordnen Sie die Lautklassen den entsprechenden Artikulationsmodi zu. Lautklassen Artikulationsmodi A Plosiv - zentrale Enge ohne Geräuschbildung B Nasal E seitliche Enge ohne Geräuschbildung C Vibrant - kompletter Verschluss, Velum abgesenkt D Frikativ - kompletter Verschluss, Velum angehoben E Lateraler Approximant - zentrale Enge mit Geräuschbildung F Approximant - intermittierende orale Verschlüsse 7. Wie sich die Formanten am eigenen Leibe erfahren lassen … Aufgabe a) - Bringen Sie Ihre Artikulatoren in die Position eines [a] (lautlos! ). - Klopfen Sie mit einem Stift oder dem Finger gegen die Seitenwand des Schildknorpels (in der Höhe des Adamsapfels). - Was hören Sie? - Gehen Sie nun - unter stetigem Klopfen - langsam von der Stellung des [a] zu der eines [i] über. - Was hören Sie? ‘Lösung’ - Die Tonhöhe des Klopfgeräuschs wandert mit der Aufwärtsbewegung des Unterkiefers nach unten. - Sie entspricht der Frequenz von F 1 , die von ca. 850 Hz für [a] auf ca. 240 Hz bei [i] heruntergeht. Aufgabe b) - Beobachten Sie Ihre Artikulationsbewegungen beim Übergang von [u] zu [y] und wieder zurück etc. - Welche Lageveränderung der hochgewölbten Zunge stellen Sie fest? 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv 123 <?page no="124"?> - Wo hat die Zunge jeweils den kleinsten Abstand? - Wiederholen Sie die Verschiebung von [u] zu [y] und wieder zurück mit Flüsterstimme. - Was hören Sie? ‘Lösung’ - Die Tonhöhe des Flüstergeräuschs wandert mit der Zungenbewegung von oben (beim [y]) nach unten (beim [u]). - Sie entspricht der Frequenz von F 2 , die von ca. 600 Hz für [u] auf über 2.000 Hz für [y] ansteigt. Aufgabe c) - Wiederholen Sie das Flüsterexperiment mit dem Übergang von [i] zu [y] und zurück. - Was hören Sie? ‘Lösung’ - Lippenrundung und -vorstülpung führt ebenfalls zu einem Absenken des zweiten Formanten. 8. Nehmen Sie sich in Praat mit der Äußerung Die Damen und die Diener auf und editieren Sie das Signal. Versuchen Sie nun, das [d] aus Damen möglichst genau zu markieren. Hören Sie dann den unmittelbar folgenden Abschnitt (oberster Abspielbalken unter dem Spektrogramm) an. Auch wenn das [d] als Plosiv gar nicht mehr im Signal präsent ist, müssten Sie trotzdem weiterhin Damen und nicht etwa Amen hören. Woran liegt das? Vergleichen Sie Formanten und Formanttransitionen in Damen und Diener. 9. Nehmen Sie eine kleine Äußerung auf (z. B. die Frage Haben Sie Mandarinen? ) und erproben Sie in Praat alle in 3.3.3 vorgestellten Analysen und Annotationen. 10. Das Ohr unterzieht den Sprachschall einer Fourier-Analyse. Erläutern Sie, was eine Fourier-Analyse ist. Wo findet diese Fourier-Analyse statt? Wie vollzieht sie sich genau? 11. Nehmen Sie sich mit den deutschen Wörtern Panne, Tal und Kappe sowie Spanne, Stahl und Skat auf. Sehen Sie sich in Praat Oszillo- und Spektrogramm an und vergleichen Sie die voice onset time bei den anlautenden Plosiven mit der bei den Plosiven nach <S>. 12. Nehmen Sie Muttersprachler aus verschiedenen spanischsprachigen Regionen Europas und Lateinamerikas mit den spanischen Sprichwörtern No hay dolor que la mujer no sepa hacer meno und Corazón alegre hace fuego de la nieve auf. Transkribieren Sie die Aufnahmen, analysieren Sie alle Plosive, Frikative und Approximanten so genau wie möglich und klassifizieren Sie diese nach artikulatorischen und akustischen Kriterien. 124 2 Die Lautseite sprachlicher Kommunikation: Phonetik <?page no="125"?> 1 Phonologie wird aus diesem Grunde bisweilen auch als ‘funktionale Phonetik’ bezeichnet, vgl. etwa Maas ( 2 2006). 2 Unter diesem Gesichtspunkt werden nachstrukturalistische Ansätze oft auch unter dem Stich‐ wort ‘Prozessphonologie’ zusammengefasst (vgl. Krefeld 2001). 3 Trubetzkoys Hauptwerk, seine auf Deutsch verfassten Grundzüge der Phonologie, ist 1939 posthum erschienen und seitdem mehrfach neu aufgelegt worden (zuletzt 7 1989). 4 Der CLP, der auch als Prager Schule bekannt wurde, organisierte 1930 eine erste phonologische Konferenz in Prag und rief eine internationale Arbeitsgemeinschaft für phonologische Forschung ins Leben. Innerhalb des amerikanischen Strukturalismus mit seinem Hauptvertreter Leonard Bloom‐ field (1887-1949) hat die Phonologie (bzw. Phonemik) eine eigenständige Entwicklung genommen, die wir hier nicht gesondert behandeln. 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie Phonetik und Phonologie untersuchen beide die lautliche Seite der sprachlichen Kommunikation, doch sie tun dies mit unterschiedlichen Interessensschwerpunkten: Wie wir in Kapitel 2 gesehen haben, befasst sich die Phonetik mit der Materialität des Sprachschalls und untersucht, wie dieser artikulatorisch zustandekommt, wie er physikalisch/ akustisch gemessen und beschrieben werden kann und wie er auditiv wahrgenommen wird. Die Phonologie dagegen interessiert sich für die lautliche Seite ausschließlich unter dem Aspekt ihrer Systembzw. Regelhaftigkeit: Sie will die Strukturen, Prinzipien und Beschränkungen (constraints) ermitteln, nach denen die Lautseite von Sprachen funktioniert. 1 Phonologie als sprachwissenschaftliche Teildisziplin ist im Rahmen des Struktura‐ lismus (3.1) entwickelt worden, und wir stellen ihre Grundbegriffe (3.1.1) und die Phoneme des Spanischen (3.1.2) zunächst vor diesem Hintergrund vor. Es folgt in 3.2 eine Einführung in die klassische generative Phonologie, bevor mit Merkmals‐ geometrie und Autosegmentaler Phonologie (3.3), Optimalitätstheorie (3.4) und Exemplartheorie (3.5) neuere Ansätze behandelt werden. All diesen nachstruktu‐ ralistischen Theorien ist gemein, dass sie in größerem Maße phonologische Prozesse in den Blick nehmen. 2 3.1 Strukturalistische Phonologie Das Konzept der Phonologie (sp. fonología), wie es im Rahmen des 1926 gegründeten Cercle Linguistique de Prague (CLP) von dem russischen Sprachwissenschaftler Niko‐ laus S. Trubetzkoy (1890-1938) entworfen 3 und u. a. von Roman Jakobson (1896- 1982) fortgeführt worden ist, gilt als wichtigste Leistung des sprachwissenschaft‐ lichen Strukturalismus: 4 Es etabliert die Phonologie als eigene Teildisziplin <?page no="126"?> 5 1950 erscheint mit der Fonología española von Emilio Alarcos Llorach (1922-1998) eine erste Anwendung der strukturalistischen Prinzipien auf das Spanische ( 4 1986). In den strukturalistischen Rahmen gehören u. a. auch die Arbeiten von Antonio Quilis (1933-2003), vgl. insbesondere Quilis (1993). 6 Sprechakt und Sprachgebilde sind die von Trubetzkoy verwendeten deutschen Ausdrücke für Saussures parole und langue. der Linguistik und macht sie zugleich zur Grundlagendisziplin strukturalistischer Sprachanalyse. 5 3.1.1 Grundbegriffe Ausgangspunkt für die strukturalistische Phonologie sind Daten aus konkreten sprachlichen Äußerungen als Einheiten der parole oder des Sprechakts (sp. habla), durch deren Analyse die phonologischen Strukturen der abstrakten langue oder des Sprachgebildes 6 (sp. lengua) ermittelt und beschrieben werden sollen. Das grundle‐ gende Kriterium, um aus der enormen Vielfalt der konkreten lautlichen Realisierungen das Allgemeine oder Konstante als Eigenschaften der langue herauszufiltern, liegt in der Möglichkeit zur Bedeutungsdifferenzierung (sp. capacidad diferenciadora): Die Laute, mit deren Hilfe in einer bestimmten Sprache Bedeutungen unterschieden werden und die damit in distinktiver Opposition (sp. oposición distintiva) zu anderen Lauten stehen, gehören als Phoneme (sp. fonemas) zum Phonemsystem dieser Spra‐ che. Von allen anderen Eigenschaften dieser Laute kann dagegen abstrahiert werden. Ziel der strukturalistischen Phonologie ist es, diese bedeutungsdifferenzierenden Ein‐ heiten oder Phoneme für die Sprachen der Welt zu ermitteln und zu inventarisieren, um das einem solchen Inventar zugrundeliegende System als intern strukturiertes, durch Oppositionsrelationen gegliedertes Ganzes zu beschreiben. In 2.5 haben wir Sprachlaute des Spanischen und des Deutschen nach artikulatori‐ schen Eigenschaften unter Berücksichtigung der akustischen und auditiven Korrelate phonetisch beschrieben und klassifiziert. Dabei haben wir bereits große Abstraktionen vorgenommen, denn obwohl zwei Laute nie völlig gleich artikuliert werden, haben wir aus der Vielfalt möglicher Lautbildungen diejenigen, die wir aufgrund unserer kategorialen Wahrnehmung (vgl. 2.4.2) als gleich einstufen und die ähnliche artikula‐ torische und akustische Merkmale aufweisen, zu Lautklassen zusammengefasst. Wir haben also alle zufälligen oder individuellen Eigenschaften ausgeblendet und nur noch diejenigen berücksichtigt, die das typische Klanggepräge einer solchen Lautklasse ausmachen, sodass wir sie anhand weniger Merkmale charakterisieren können - z. B. als palatalen Nasal [ɲ] oder als hohen vorderen Vokal [i]. Die Phonologie (in ihrer strukturalistischen Ausprägung) interessiert sich nun dafür, welche dieser Laute oder besser Lautklassen in einzelnen Sprachen genutzt werden, um Bedeutungen zu differenzieren, und damit als Phoneme dieser Sprache gefasst werden können. Um diese Phoneme (als Einheiten der langue) zu bestimmen, geht sie also in der Abstraktion vom Laut (sp. sonido) oder Phon (sp. 126 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="127"?> fono) als Segment (sp. segmento) konkreter individueller parole-Äußerungen zum Laut (bzw. zur Lautklasse) als Ergebnis (symbol)phonetischer Analyse noch einen Schritt weiter: Als Merkmale der phonologisch relevanten Lautklassen bleiben nur noch diejenigen Eigenschaften erhalten, die in einer Sprache distinktiv, weil bedeutungsunterscheidend sind. Diese Eigenschaften kennzeichnen die Phoneme als kleinste bedeutungsdifferenzierende Einheiten einer Sprache. Das Phonem als minimale Einheit der langue ist zwar nicht in noch kleinere auf‐ einander folgende Segmente unterteilbar, es lässt sich jedoch als Bündel der distink‐ tiven Merkmale (sp. rasgos pertinentes/ distintivos) verstehen, die der betreffenden Lautklasse beim Abstraktionsprozess zum Phonem als Charakteristika verblieben sind. Durch die Inventarisierung der Phoneme anhand dieser distinktiven Merkmale wird die Struktur des Phonemsystems einer Sprache deutlich. Alle Phoneme teilen eine Reihe von distinktiven Merkmalen mit einigen anderen Phonemen, sie müssen sich jedoch mindestens in jeweils einem Merkmal von allen anderen Phonemen derselben Sprache unterscheiden. Phoneme sind die kleinsten bedeutungsdifferenzierenden Einheiten innerhalb eines Sprachsystems. Sie stellen zugleich Bündel distinktiver Merkmale dar. Um die Phoneme einer Sprache zu ermitteln, bedient man sich des Verfahrens der Kommutation (sp. conmutación), was soviel wie ‘Austausch’ bedeutet: Man tauscht in einem Wort einen Laut gegen einen anderen aus und schaut, ob dadurch ein anderes Wort (mit einer anderen Bedeutung) entsteht. Wir wollen das zunächst am Beispiel der r-Laute im Deutschen und im Spanischen verdeutlichen (vgl. 2.5.1.5) und dazu auch das Japanische heranziehen. Ob wir den r-Laut in deutschen Wörtern wie Ratte oder führe uvular (als Frikativ, Vibrant oder Approximant) oder alveolar (als Tap, Trill oder Approximant) artikulieren, ob wir also [ ˈ ʁatə]/ [ ˈ fyːʁə], [ ˈ ʀatə]/ [ ˈ fyːʀə], [ ˈ ʁ̞atə]/ [ ˈ fyːʁ̞ə], [ ˈ ɾatə]/ [ ˈ fyːɾə], [ ˈ ratə]/ [ ˈ fyːrə] oder [ ˈ ɹatə]/ [ ˈ fyːɹə] aussprechen, sagt zwar eventuell etwas über unsere Herkunft aus und mag je nach Region ungewöhnlich klingen, doch es ändert nichts an der Bedeutung dieser Wörter, die eindeutig als Ratte oder führe identifizierbar bleiben. Erst wenn wir den r-Laut bspw. durch einen Lateral ersetzen, also [ ˈ latə] und [ ˈ fyːlə] sagen, bedeuten diese Wörter (nun Latte und fühle) etwas anderes. Während sich also [ʁ], [ʀ], [ʁ̞], [ɾ], [r] und [ɹ] im Deutschen als mehr oder weniger gebräuchliche Varianten einem einzigen Phonem zuordnen lassen, das man beispielsweise/ r/ nennen kann, sind wir mit dem Wechsel zum Lateral [l] in den Bereich eines anderen Phonems geraten, denn hier führt der Austausch zu einer Bedeutungsveränderung; der Unterschied zwischen den beiden Lauten ist im Deutschen distinktiv, sie stehen zueinander in (phonologischer) Opposition (sp. oposición distintiva/ fonológica). Es lässt sich auch sagen, dass hier das Merkmal 3.1 Strukturalistische Phonologie 127 <?page no="128"?> 7 Merkmale als Eigenschaften phonologischer Einheiten werden in eckigen Klammern notiert. Zur systematischen Erfassung distinktiver Merkmale siehe unten in diesem Abschnitt (3.1.1). 8 Der japanische r-Laut wird für gewöhnlich als apikoalveolarer (oder postalveolarer) Schlag realisiert. Da zwischen den Merkmalen [zentral] und [lateral] nicht unterschieden wird, kann seine Aussprache zumindest für westliche Ohren auch lateral erscheinen. In japanischen Entlehnungen wird [l] regelmäßig durch [ɾ] ersetzt, z. B. engl. lemonade > jap. [ɾemoneːdo] (Crawford 2009: 15). [lateral] 7 , das / l/ kennzeichnet, gegenüber dem Merkmal [vibrant] des / r/ distinktiv ist. Die Merkmale [alveolar] gegenüber [uvular] (also die Artikulationsstelle) oder [gerollt] gegenüber [geschlagen], [frikativ] oder [approximantisch] (als weitere Artikulations‐ modi), sind dagegen für die r-Laute des Deutschen nicht distinktiv, sondern irrelevant oder redundant und damit für die phonologische Betrachtung uninteressant. Wörter wie dt. [ ˈ ʁatə] Ratte und [ ˈ latə] Latte, in denen man durch den Austausch eines einzigen Lauts eine andere Bedeutung erhält und dadurch die Zugehörigkeit dieser Laute zu verschiedenen Phonemen nachweisen kann, nennen wir Minimalpaare (sp. pares mínimos). [r] und [l] vertreten nun keineswegs in allen Sprachen verschiedene Phoneme. So gibt es beispielsweise im Japanischen nur ein einziges Liquidphonem / r/ . Seine Realisierung als [l] würde automatisch diesem Phonem zugeschlagen, denn die [r] und [l] charakterisierenden Merkmale sind hier nicht distinktiv. Die beiden Laute können keine Minimalpaare differenzieren. Vertauscht man sie, so ändert sich die Bedeutung japanischer Wörter dadurch nicht; die Aussprache [kalate] anstelle von [kaɾate] wird ebenso als Karate identifiziert. 8 Aus diesem Grunde fällt es Menschen mit Japanisch als Muttersprache auch oft schwer, diese Laute in Sprachen, in denen sie, wie im Deutschen oder im Englischen, verschiedene Phoneme repräsentieren, korrekt zu verwenden. Selbst perzeptiv sind Laute, denen in der eigenen Sprache kein Phonemunterschied entspricht, nicht leicht zu unterscheiden. Wie wir in 2.5.1.5 gesehen haben, müssen dagegen im Spanischen bereits die mög‐ lichen r-Realisierungen zwei verschiedenen Phonemen zugeordnet werden, und zwar entweder dem Trill / r/ oder dem Tap / ɾ/ . Der Artikulationsmodus [gerollt] : [geschlagen] ist hier ein distinktives Merkmal, denn durch den Austausch dieser beiden Konsonanten in wortmedialer Position zwischen Vokalen können Bedeutungen verändert werden: [ ˈ pero] perro mit gerolltem Vibranten bedeutet ‘Hund’, [ ˈ peɾo] pero mit geschlagenem Konsonanten bedeutet ‘aber’. Wie im Deutschen - und anders als im Japanischen - repräsentiert der alveolare Lateral [l] auch im Spanischen wiederum ein eigenes Phonem: [ ˈ pelo] pelo bedeutet ‘Haar’. / r/ , / ɾ/ und / l/ können wir demnach als Phoneme des Spanischen registrieren, denn es gibt zahlreiche Wörter, die eine andere Bedeutung allein dadurch erhalten, dass man in ihnen / r/ gegen / ɾ/ oder / l/ vertauscht. Wenn wir uns auf Laute in ihrer Eigenschaft als Phoneme beziehen, setzen wir die sie vertretenden Symbole zur Unterscheidung von der phonetischen Notation in Schrägstriche: sp. / r/ , / ɾ/ , / l/ vs. dt. / r/ , / l/ vs. jap. / r/ . 128 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="129"?> 9 Bei äquipollenten Oppositionen besitzt dagegen jedes der beiden Phoneme ein Merkmal, das das andere nicht hat, so z. B. dt. / r/ : / l/ mit den Merkmalen [vibrant] : [lateral]. 10 Als Beispiel für eine isolierte Opposition kann wiederum / r/ : / l/ im Deutschen angeführt werden, denn kein weiteres Oppositionspaar teilt die sie unterscheidenden Merkmale. Welche Lautunterschiede auch Phonemunterschieden entsprechen, welche Merk‐ male demnach distinktiv sind, ist also von Sprache zu Sprache verschieden. Aus der potentiell unbegrenzten Zahl artikulatorischer oder akustischer Möglichkeiten trifft jede Sprache eine begrenzte, für sie spezifische Auswahl, die das Phonemsystem dieser Sprache strukturiert. Das Inventar der Phoneme und der sie konstituierenden Merkmale muss daher für jede Sprache gesondert erstellt werden. Je nach Beziehung der Oppositionsglieder untereinander und zum phonologischen Gesamtsystem können auf der Basis der distinktiven Merkmale verschiedene Ar‐ ten von Oppositionen unterschieden werden (vgl. Trubetzkoy 1939/ 7 1989: 59ff.). So spricht man von graduellen Oppositionen, wenn ihre Glieder durch verschie‐ dene Grade derselben Eigenschaft gekennzeichnet sind, etwa durch verschiedene Öffnungsgrade bei den Vokalen. Dabei lassen sich im Unterschied zu binären Oppo‐ sitionen ganze Relationsketten ausmachen, deren Glieder sich jeweils um einen Grad gegeneinander absetzen (z. B. sp. / u/ : / o/ : / a/ wie in / ˈ puso/ puso ‘er/ sie legte’ : / ˈ poso/ poso ‘ich lege’ : / ˈ paso/ paso ‘ich übergebe’). Mehrdimensionale Oppositionen zeichnen sich dadurch aus, dass die Merkmale, die beiden Elementen gemeinsam sind, auch noch bei anderen Phonemen auftreten: So stehen / p/ : / t/ im Spanischen (wie im Minimalpaar / pan/ pan ‘Brot’ : / tan/ tan ‘so’) in mehrdimensionaler Opposi‐ tion, da sie die Merkmale [plosiv] und [stimmlos] (bzw. [-stimmhaft]) mit / k/ (wie in / kal/ cal ‘Kalk’ : / tal/ tal ‘solch’ etc.) teilen. Die Opposition / p/ : / b/ (wie im Minimal‐ paar / ˈ polo/ polo ‘Pol’ : / ˈ bolo/ bolo ‘Kegel’) ist dagegen eindimensional, denn kein weiteres Phonempaar weist die Merkmale [plosiv] und [bilabial] auf. Sie ist zugleich privativ (im Gegensatz zu äquipollent), denn die beiden Elemente unterscheiden sich voneinander nur durch ein einziges Merkmal, nämlich durch die Anbzw. Abwesenheit der Stimmbeteiligung: bei der Artikulation von / b/ schwingen die Stimmlippen, es ist daher [+stimmhaft], bei / p/ schwingen sie nicht, folglich ist es [-stimmhaft]. 9 Die Opposition zwischen / b/ und / p/ ist außerdem proportional (im Gegensatz zu isoliert), denn das für dieses Phonempaar geltende distinktive Merkmal [±stimmhaft] wiederholt sich bei anderen Phonempaaren des Spanischen, so bei / d/ : / t/ und / ɡ/ : / k/ , die sich ebenfalls einzig durch die Stimmbeteiligung voneinander unterscheiden. 10 Der Bezug zwischen Reihen von Phonempaaren, die auf proportionalen Oppositionen beruhen, wird auch als Korrelation bezeichnet. Die Plosive / p t k/ : / b d ɡ/ sind im Spanischen durch die Stimmbeteiligungskorrelation aufeinander bezogen. In strukturalistischer Tradition bezieht sich der Terminus ‘Opposition’ auf die pa‐ radigmatische Achse, auf der die Austauschbarkeit von bedeutungsdifferenzierenden Segmenten untersucht wird (z. B. sp. / p/ : / t/ in dem Minimalpaar / pan/ : / tan/ ). Für die syntagmatische Achse, also für die Relationen zwischen Segmenten, die innerhalb sprachlicher Äußerungen miteinander vorkommen (beispielsweise die Phoneme / t/ , / a/ 3.1 Strukturalistische Phonologie 129 <?page no="130"?> 11 Pseudowörter oder Logatome (sp. pseudo-palabras), die allen phonotaktischen Beschränkungen entsprechen, werden gern in (psycho)linguistischen Experimenten genutzt, um beispielsweise bestimmte Hypothesen zur Sprachverarbeitung zu testen. So haben Carreiras & Perea (2004) ermittelt, dass spanische Probanden Pseudowörter mit im Spanischen häufig vorkommenden Silbenstrukturen schneller vorlesen können als solche mit selteneren (vgl. auch 4.3.5.3). 12 Kontaktvarietäten des Spanischen können sich diesbezüglich anders verhalten. So sind im mexikanischen Spanisch durch den Kontakt mit der autochthonen Sprache Nahuatl, die den An‐ fangsrand / tl/ erlaubt, Wörter wie tlaconete ‘Nacktschnecke’ möglich. Auch beginnen zahlreiche mexikanische Ortsnamen mit / tl/ , z. B. der zentralmexikanische Bundesstaat Tlaxcala (vgl. Pustka 2022: 522f.). Zum Einfluss dieses Phänomens auf die Festlegung der Silbengrenzen (Syllabierung) im mexikanischen Spanisch vgl. 4.2.5 und 5.1.4. und / n/ in sp. / tan/ ), waren die Termini ‘Kontrast’ und ‘kontrastieren’ vorgesehen. Heute werden Kontrast und Opposition jedoch weitgehend synonym gebraucht (vgl. Hall 2 2011: 37f. sowie die Diskussion in Kleber 2023: 27), und wir schließen uns dieser Praxis an. Folglich muss gegebenenfalls spezifiziert werden, auf welche der beiden Ebenen man sich bezieht. Auf der syntagmatischen Achse spielt die Distribution (sp. distribución) der Laute, ihre Verteilung in Silbe, Wort und Morphem, eine herausragende Rolle. Jede Sprache hat nicht nur einen festen Satz von Phonemen, sondern es sind auch immer nur ganz bestimmte Abfolgen dieser Phoneme im Wort bzw. in der Wortgruppe zugelassen; der Bau von Silben, Morphemen und Wörtern verläuft nach vorgegebenen Gesetzmäßigkeiten. Hier gibt es universelle Bedingungen (solche, die in allen Sprachen befolgt werden), aber auch viele einzelsprachspezifische Regularitäten. Die Beschrän‐ kungen, die in einer Sprache für die Verbindungen ihrer Phoneme zu Lautgruppen gelten, werden auch als Phonotaktik (sp. fonotáctica) bezeichnet (4.2.1). Keine Sprache nutzt alle durch ihre Phonotaktik gegebenen Kombinationsmög‐ lichkeiten tatsächlich zur Bildung von sprachlichen Signifikanten. In 2.5.1.1 haben wir beispielsweise gesehen, dass im Spanischen ein Plosiv gemeinsam mit einem Liquid einen komplexen Silbenanfangsrand bilden kann, was sich an Wörtern wie sp. [ ˈ plano] plano ‘eben’ oder [ ˈ ɡɾano] grano ‘Korn’ nachweisen lässt. Diese Bedingung erfüllt auch ein Wort wie [ ˈ tɾano] trano, das aufgrund seiner Bauweise durchaus ein spanisches Wort sein könnte. Es fehlt ihm zwar eine Bedeutung, und deshalb ist es im Lexikon des Spanischen nicht verzeichnet, doch das ist dem Zufall geschuldet; wir haben es mit einer zufälligen Lücke, einem accidental gap (sp. vacío accidental) zu tun. 11 Die Lautfolge [ ˈ tlano] tlano dagegen ist kein potentielles, sondern ein unmögliches Wort des Spanischen, denn anders als die übrigen Plosive können / t/ und / d/ mit einem Lateral keinen gemeinsamen Anfangsrand bilden. 12 Hier ist also keine zufällige, sondern eine systematische Lücke, ein systematic gap (sp. vacío sistemático) zu verzeichnen. Eine systematische Lücke oder Kombinationsbe‐ schränkung im Anfangsrand besteht - im Spanischen wie im Deutschen - auch für die umgekehrte Abfolge Liquid+Plosiv: Wörter, deren Silben mit / rt-/ , / lk-/ o. ä. beginnen, sind hier nicht vorgesehen. Was die Coda angeht, so verhalten Spanisch und Deutsch sich allerdings unterschiedlich: Coda-Abfolgen aus Liquid+Plosiv sind im Deutschen durchaus geläufig wie z. B. in / fɔrt/ fort, wo der r-Laut allerdings in 130 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="131"?> 13 Manchmal wird in solchen Fällen auch von einer defektiven Distribution oder Verteilung gesprochen (vgl. Hall 2 2011: 38). Vgl. dazu genauer 3.1.2.3. der Regel vokalisiert wird ([fɔɐ̯t]), oder in / kalk/ Kalk; im Spanischen existieren sie hingegen nicht. Aber nicht nur für die Kombination von Lauten gibt es Beschränkungen, sondern über die Distribution wird generell geregelt, wo welche Phoneme in Silbe, Morphem und/ oder Wort vorkommen können. So haben wir oben aufgrund von Minimalpaaren wie [ ˈ pero] perro : [ ˈ peɾo] pero ermittelt, dass für das Spanische mit Tap / ɾ/ und Trill / r/ zwei verschiedene r-Phoneme anzusetzen sind. Wie wir in 2.5.1.5 gesehen haben, ist die Opposition zwischen / ɾ/ und / r/ aber auf die wortinterne Position zwischen Vokalen beschränkt. Am Wortanfang (und silbeninitial nach Konsonant) kann nur der Trill vorkommen, an zweiter Stelle im Onset nur der Tap. 13 In der Coda sind zwar beide möglich, aber sie können hier keine Bedeutungen differenzieren. Die Opposition zwischen Tap und Trill ist also in allen anderen Positionen neutralisiert. Wird eine phonologische Opposition (bzw. ein Kontrast) in bestimmten Kontexten aufgegeben, bezeichnen wir dies als Neutralisierung (sp. neutralización). Der im Falle der Neutralisierung verbleibende Laut, der die Gesamtheit der distink‐ tiven Eigenschaften beider Phoneme vertritt, wird in der Terminologie der Prager Schule als Archiphonem (sp. archifonema) bezeichnet und in der phonologischen Notation durch einen Großbuchstaben wiedergegeben. Bei der Neutralisierung der Opposition zwischen Tap und Trill würde man in dieser Tradition also phonologisch beispielsweise / ˈ Roka/ roca ‘Felsen’, / ˈ bRoma/ broma ‘Scherz’ und / ˈ paR.te/ parte ‘Teil’ notieren (Alarcos Llorach 4 1986: 98, 183f.). Da man dabei wissen muss, dass die Neutralisierung je nach Position zu unterschiedlichen Ergebnissen führt, wird in anderen strukturalistischen Ansätzen die Existenz eines Archiphonems / R/ auf die wort- und silbenfinale Position beschränkt, während im Anlaut defektive Distribution zu verzeichnen wäre (Quilis 1993: 42, Hidalgo Navarro & Quilis Merín 2012: 216, 234). Ein weiteres Beispiel für die Neutralisierung von phonologischen Oppositionen haben wir bei der Behandlung der spanischen Nasale in 2.5.1.3 kennengelernt: Wäh‐ rend [m], [n] und [ɲ] im Onset kontrastieren und deshalb als Phoneme des Spanischen zu werten sind (/ ˈ kama/ cama ‘Bett’, / ˈ kana/ cana ‘weißes Haar’, / ˈ kaɲa/ caña ‘Rohr’), ist dieser Kontrast in der Coda neutralisiert. Als einziges distinktives Merkmal bleibt [nasal], sodass hier für die phonologische Notation ein Archiphonem / N/ angesetzt werden kann: / ˈ kaNpo/ campo ‘Feld’, / iNmo ˈ ɾal/ inmoral ‘unsittlich’, / ˈ kaNto/ canto ‘ich singe’, / ˈ baNko/ banco ‘Bank’ etc. Manchmal lassen sich jedoch für zwei (oder mehr) Laute einer bestimmten Sprache in keiner der möglichen Positionen Minimalpaare finden; sie kontrastieren nie mitein‐ ander. Sind diese Laute zudem einander phonetisch ähnlich (s. u.), so können sie einem 3.1 Strukturalistische Phonologie 131 <?page no="132"?> einzigen Phonem zugeordnet werden und gelten dann als Allophone (sp. alófonos) dieses Phonems. Es werden zwei Gruppen von Allophonen unterschieden: Diejenigen Allophone, die sich, wie die verschiedenen Realisierungen des Pho‐ nems / r/ im Deutschen, unabhängig von der Position beliebig miteinander vertauschen lassen, werden auch als Allophone in freier oder fakultativer Variation (sp. variación/ alternancia libre) bezeichnet. Dabei bezieht sich ‘frei’ bzw. ‘fakultativ’ nur auf die prinzipielle Möglichkeit der Vertauschung (ohne dass eine Bedeutungsveränderung erfolgt). Es soll damit keineswegs geleugnet werden, dass die Variation in aller Regel nicht nur durch diatopische, sondern auch durch diastratische und/ oder diaphasische Faktoren gesteuert wird, in dieser Hinsicht also nicht ‘frei’ ist. Als Beispiel für Allo‐ phone in freier Variation soll uns hier die aspiración dienen, das Schwanken zwischen [s] und [h] in der Codaposition, wie es in verschiedenen Dialekten des Spanischen verbreitet ist: [pas ˈ tel] ~ [pah ˈ tel] pastel ‘Kuchen’ (vgl. 2.5.1.2). Oft können aber Allophone eines Phonems nicht einfach miteinander vertauscht werden - nicht, weil sich eine andere Bedeutung ergeben würde (dann hätten wir es nicht mit Allophonen, sondern mit Phonemen zu tun), sondern weil unsere Sprachen in bestimmten lautlichen Umgebungen bestimmte Restriktionen aufweisen, die die Vertauschung unmöglich machen. So bilden wir z. B. sowohl im Deutschen als auch im Spanischen den Verschluss, um ein [k] zu artikulieren, entsprechend dem jeweils folgenden Laut an unterschiedlichen Stellen des weichen und auch des harten Gau‐ mens. Das wird deutlich, wenn wir etwa die spanischen Wörter [ ˈ kupo] cupo ‘Beitrag’, [ ˈ komo] como ‘wie’, [ ˈ kaso] caso ‘Fall’, [ ˈ keso] queso ‘Käse’, [ ˈ kita] quita ‘er/ sie zieht ab’ hintereinander artikulieren. Unzweifelhaft velar ist der Verschluss nur vor den Vokalen [u], [o] und [a]; je weiter vorn die Vokale artikuliert werden, desto weiter schiebt sich auch die Artikulationsstelle für [k] nach vorn, sodass vor [e] und [i] eher ein palataler (oder prävelarer) Verschlusslaut resultiert, der in enger Transkription durch [k j ] wiedergegeben wird. In 2.2.4 haben wir gesehen, dass dies aus phonetischer Sicht als Koartikulationseffekt erklärt werden kann: Laute sind eng miteinander verzahnt und beeinflussen sich gegenseitig. Aus phonologischer Perspektive können wir sagen, dass es sich bei velarem und palatalem [k] um Allophone des Phonems / k/ handelt, die diesmal nicht frei vertauschbar sind, sondern sich in komplementärer Distribution (sp. distribución complementaria) befinden: Dort, wo das eine vorkommt, kann das an‐ dere nicht vorkommen und umgekehrt. Die Variation wird also durch die Umgebung determiniert; sie ist kombinatorisch bzw. kontextbedingt (sp. variación/ alternancia condicionada). Ein spezifisch deutsches Beispiel für solche kombinatorischen Varianten oder Allophone in komplementärer Distribution stellen der palatale, der velare und der uvulare Frikativ, also [ç], [x] und [χ], dar. Als ich- und ach-Laute auditiv, artikula‐ torisch und akustisch deutlich zu unterscheiden, tragen sie dennoch untereinander nicht zur Bedeutungsdifferenzierung bei, sondern lassen sich einem einzigen Phonem 132 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="133"?> 14 Hall ( 2 2011: 64f.) argumentiert dafür, dass / ç/ statt / x/ als Phonem anzusetzen sei. 15 Generalisierung des ach-Lauts finden wir dagegen im Alemannischen (Südwestdeutschland, deutsch‐ sprachige Schweiz), das sich z. B. durch diese Erscheinung von der Standardaussprache des Deut‐ schen absetzt. 16 Eine exakte Definition phonetischer Ähnlichkeit, insbesondere die Feststellung, wo Ähnlichkeit aufhört und Unähnlichkeit beginnt, ist jedoch schwierig. Vgl. dazu Kohler ( 2 1995: 89ff.). zuordnen, das meist als / x/ bezeichnet wird. 14 Sie sind auch keine freien Varianten, unter denen wir beliebig auswählen könnten, sondern ihre Distribution ist von der Qualität des vorangehenden Lauts abhängig: [ç], das auch am Wort- und Morpheman‐ fang auftritt, folgt morphemintern auf mittlere und hohe Vorderzungenvokale sowie auf sonorante Konsonanten, z. B. [-çən] -chen, [ɪç] ich, [ɛçt] echt, [ ˈ byːçɐ] Bücher, [dɔlç] Dolch; [x] folgt auf hohe und mittlere Hinterzungenvokale, z. B. [buːx] Buch, [hoːx] hoch; [χ] auf tiefe (hintere) Vokale, z. B. [daχ] Dach, [dɔχ] doch. 15 Laute als Allophone eines Phonems aufzufassen ist jedoch nur sinnvoll, wenn sie phonetisch ähnlich (oder verwandt) sind. So ließen sich allein nach dem Distri‐ butionskriterium dt. [ŋ] und [h] als Allophone eines Phonems ansehen, da sie komple‐ mentär verteilt sind: [ŋ] kann wort- und morpheminitial gar nicht vorkommen, im Wortinnern können ihm die Vokale [ə] und [ɐ] folgen (z. B. [ ˈ lɛŋə] Länge, [ ˈ lɛŋɐ] länger). Das sind genau die Vokale, vor denen [h], das vornehmlich wort- und morpheminitial erscheint, im Wortinnern nicht auftreten kann. Doch ist die Zuordnung von dt. [ŋ] und [h] zu einem einzigen Phonem, die schon intuitiv abwegig erscheint, aufgrund der mangelnden phonetischen Ähnlichkeit zwischen den beiden Lauten abzulehnen, denn sie besitzen keine gemeinsamen phonetischen Merkmale. Die Allophone [ç], [x] und [χ] des Phonems / x/ teilen dagegen die Merkmale [stimmlos], [frikativ] und [dorsal]. 16 In komplementärer Distribution stehen auch die stimmhaften Plosive und die entsprechenden Frikativapproximanten des Spanischen, mit denen wir uns in 2.5.1.1 befasst haben: [b d ɡ] kommen nur im absoluten Anlaut und nach Nasal vor ([d] auch nach Lateral), in allen anderen Positionen werden für gewöhnlich [β ð ɣ] artikuliert. Ein Vertauschen von [b] und [β], [d] und [ð], [ɡ] und [ɣ] kann also niemals zu einer anderen Bedeutung führen; es entsteht dadurch vielmehr eine Aussprache, die Hualde (2005: 9) am Beispiel von intervokalischem [d] ([ ˈ lado] statt [ ˈ laðo] lado ‘Seite’) zumindest in nicht-emphatischem Kontext als “funny” charakterisiert hat. [b ~ β], [d ~ ð], [ɡ ~ ɣ] können demnach als kontextbedingte Allophone den Phonemen / b d ɡ/ zugeschlagen werden. Man könnte jetzt fragen, warum / b d ɡ/ als Phoneme des Spanischen angesetzt werden und nicht etwa / β ð ɣ/ . Der Grund liegt in der Plausibilität der Erklärung für die damit verbundenen Prozesse: es ist eher nachzuvollziehen, dass stimmhafte Plosive zwischen Vokalen (bzw. zwischen Liquiden und Vokalen) als Approximanten realisiert werden, als umgekehrt, dass Frikativapproximanten im absoluten Anlaut und nach Nasal als Plosive erscheinen. Die Realisierung in intervokalischer Position lässt sich nämlich im weitesten Sinne als Assimilation oder Angleichung (sp. asimilación) fassen und damit phonetisch erklären: Dadurch dass der Verschluss in eine (frikti‐ 3.1 Strukturalistische Phonologie 133 <?page no="134"?> 17 Als phonetischer Prozess kann die Assimilation oft als eine Intensivierung von Koartikulations‐ effekten gesehen werden (vgl. 2.2.4). 18 Eine Schwächung, die in intervokalischer Position von einem ursprünglich stimmlosen Plosiv bis zum völligen Schwund gehen kann, lässt sich auch historisch in der Entwicklung der romanischen Sprachen nachzeichnen: Auf dem Weg zum Spanischen ist in lat. A M Ī C A [a ˈ miːka] ‘Freundin’ der Plo‐ siv zwischen den Vokalen zunächst stimmhaft geworden ([a ˈ miɡa]), bevor die weitere Veränderung zum Frikativapproximanten eintrat: [a ˈ miɣa]. Im Französischen ist der (intervokalisch geschwächte) Konsonant schon früh völlig ausgefallen, und das Wort ist zweisilbig geworden: afr. [a ˈ miə], mfr. [a ˈ miː], fr. [a ˈ mi] amie. Eine ähnliche Entwicklung zeichnet sich im umgangssprachlichen Spanisch für die Endungen des Partizips Perfekt -ado/ -ada ab: lat. A M Ā T U ( M ) [a ˈ maːtu(m)] ‘geliebt’ > [a ˈ mado] > [a ˈ maðo] > [a ˈ mao] > [a ˈ mao̯] > [a ˈ maw] (vgl. Hualde 2005: 111f.). 19 Das phonetische Symbol, durch das ein Phonem repräsentiert wird, kann demnach als Kurzform verstanden werden, die die Auflistung der das Phonem charakterisierenden Merkmale ersetzt. onslose) Enge geöffnet wird, gleichen sich die stimmhaften Plosive ein gutes Stück weit an die sie umgebenden Vokale an. 17 Im absoluten Anlaut, einer starken Position, findet eine solche Angleichung (die sich auch als Schwächung fassen lässt) nicht statt, sodass der Konsonant weiterhin als Plosiv realisiert wird. 18 In 3.2 werden wir sehen, wie sich solche Prozesse mithilfe phonologischer Regeln formalisieren lassen. Wir haben oben das Phonem als Bündel distinktiver Merkmale definiert. Es stellt also keine Letztgröße dar, sondern ist in sich strukturiert und daher weiter analysierbar. Das Phonemsystem einer Sprache ist durch Oppositionen bzw. Oppositionsreihen oder Korrelationen gegliedert, die wiederum auf den distinktiven Merkmalen der Phoneme beruhen. 19 In der Weiterentwicklung der Phonologie hat sich das Forschungsinteresse auf die systematische Erfassung und Inventarisierung der distinktiven Merk‐ male gerichtet: Es sollte die (kleinstmögliche) Anzahl Merkmale ermittelt werden, die notwendig sind, um die Phoneme aller Sprachen vollständig zu charakterisieren und so alle potentiellen Kontraste zu erfassen. Anhand der distinktiven Merkmale lassen sich zudem die Phoneme in natürliche Klassen untergliedern, in Gruppen, die sich etwa in Bezug auf bestimmte phonotaktische Beschränkungen oder andere Regelmäßigkeiten gleich verhalten (wie wir es beispielsweise oben bei den Obstruenten und Liquiden des Spanischen und des Deutschen gesehen haben). In den 50er Jahren des 20. Jahrhunderts hatten Roman Jakobson und seine Kollegen (vor allem Morris Halle und Gunnar Fant) ein Merkmalsinventar vorgeschlagen, für das sie universelle Gültigkeit postulierten. Die von ihnen ermittelten zwölf Merk‐ male bilden binäre Oppositionen, bei denen es nur um das Vorhandensein oder Nichtvorhandensein (+/ -) einer bestimmten lautlichen Eigenschaft geht. Die Merkmale beruhen vornehmlich auf akustischer Basis, doch lassen sich ihnen artikulatorische Korrelate zuordnen (vgl. Jakobson et al. 1952, Jakobson & Halle 1956 sowie Jakobson & Waugh 1979). Zum Jakobsonschen Merkmalsinventar gehören etwa die grundlegenden Schallquellenmerkmale [±vokalisch] und [±konsonantisch], die in ihrer Binarität bereits eine vierfache Gliederung von Lautsystemen ermöglichen. In der Folgezeit ist dieses Inventar immer wieder revidiert und verfeinert worden (z. B. von Chomsky & Halle 1968, Halle & Clements 1983, McCarthy 1988), wobei erneut artikulatorische 134 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="135"?> 20 Daneben ist auch eine informelle Notation der Merkmale weiterhin verbreitet, und auch wir greifen je nach Bedarf darauf zurück. 21 Neben der deutschen (und vor der spanischen) wird hier wegen der internationalen Verbreitung jeweils auch die englische Bezeichnung der Merkmale und Merkmalsklassen aufgeführt; gegebenen‐ falls folgt auch die englische Abkürzung. Die spanischen Namen der Merkmale stammen größtenteils aus der NGRAE (2011: 56ff.). Definitionen in den Vordergrund getreten sind. In Anlehnung an Hall ( 2 2011: 101ff.) stellen wir im Folgenden die Merkmale vor, die nach dem heutigen Wissensstand in den Sprachen der Welt distinktiv sein können. 20 Sie lassen sich in Oberklassenmerkmale (zur Erfassung ‘großer’ Segmentklassen), laryngale Merkmale (zu den verschiedenen Stellungen der Stimmbänder), Merkmale der Artikulationsart (zur Art und Weise der Behinderung des Luftstroms) und Ortsmerkmale (zur Erfassung der Artikulationsstel‐ len und Zungenpositionen von Konsonanten und Vokalen) unterteilen. Oberklassenmerkmale (major class features, sp. rasgos principales) 21 • Konsonantisch (consonantal, sp. consonante) [±kons] [±cons]: (friktionsbil‐ dende) Enge oder völliger Verschluss im Ansatzrohr. Vokale, Approximanten (und auch Laryngale) sind [-kons]. • Sonorantisch (sonorant, sp. sonante) [±son]: spontane Stimmhaftigkeit (Reso‐ nanzqualität). Obstruenten (und Laryngale) sind [-son]. • Approximantisch (approximant, sp. aproximante) [±appr]: keine Behinderung bzw. friktionslose Engebildung im Ansatzrohr. Vokale, Laterale, Gleitlaute sind [+appr], alle sonstigen [-appr]. Laryngale Merkmale (laryngeal features, sp. rasgos de laringalización) • Stimmhaft (voiced, sp. sonoro) [±sth] [±voice]: Stimmlippen schwingen. • Aspiriert (aspirated/ spread glottis, sp. glotis dilatada) [±asp] [±spread gl]: Stimm‐ lippen sind gespreizt, z. B. [h]. • Glottalisiert (glottalized/ constricted glottis, sp. constricción glotal) [±glottal] [±constr gl]: Stimmlippen bilden einen Verschluss, z. B. [ʔ]. Merkmale der Artikulationsart (manner features, sp. rasgos de modo de articulación) • Kontinuierlich/ Dauernd (continuant, sp. continuo) [±kont]/ [±dnd] [±cont]: kein völliger Verschluss im mediosagittalen (mittigen) Bereich des Ansatzrohrs. Plosive, Affrikaten, Nasalkonsonanten, Laterale, geschlagene Vibranten sind [-kont] bzw. [-dnd]. • Nasal (nasal, sp. nasal) [±nas]: Velum ist gesenkt, Luftstrom entweicht durch den Nasenraum. • Lateral (lateral, sp. lateral) [±lat]: zentraler oraler Verschluss, seitlich keine Blockierung. 3.1 Strukturalistische Phonologie 135 <?page no="136"?> • Sibilantisch/ Gerillt/ Geräuschstark (strident, sp. estridente) [±sibil]: (Zisch-)Laute mit intensivem hochfrequenten Geräuschanteil. Die Zunge ist dabei in Längsrich‐ tung gefurcht (engl. grooved) (Kubarth 2009: 32f.). [s] ist [+sibil], [θ] ist [-sibil]. • Verteilt/ Distribuiert (distributed, sp. distribuido) [±distr]: Ausmaß der Fläche, auf der sich Kontakt bzw. Enge ausbreiten. Laute mit großflächigem Kontakt in der Länge des Ansatzrohres (wie [ʃ ç]) sind [+distr]; Laute wie [s t] sind [-distr]. • Verzögert gelöst (delayed release, sp. relajación retardada) [±del rel]: Verzögerte Lösung eines Verschlusses. Affrikaten sind [+del rel]. Ortsmerkmale (place features) • Labial (labial, sp. labial) [ LAB ]: Artikulation mit einer oder beiden Lippen. • Rund (round, sp. redondeado) [±rnd]: Lippen sind gerundet. • Koronal (coronal, sp. coronal) [ KOR ] [cor]: Artikulation mit Zungenspitze oder Zungenblatt. • Anterior (anterior, sp. anterior) [±ant]: Hindernis im vorderen Teil des Ansatz‐ rohres (alveolar, dental). Am (vorderen) harten Gaumen artikulierte Laute sind [-ant]. • Apikal (apical, sp. apical) [±apik] [±apic]: Artikulation mit der Zungenspitze. Die Artikulation mit dem Zungenblatt ist [-apik]. • Dorsal (dorsal, sp. dorsal) [ DOR S ]: Artikulation mit dem Zungenrücken (Dorsum). • Hinten (back, sp. retraído) [±hint] [±back]: Zungenkörper wird von neutraler Position aus zurückgezogen. Mit vorverlagertem Dorsum artikulierte Laute sind [-hint]. • Hoch (high, sp. alto) [±hoch] [±high]: Zungenkörper wird über die neutrale Position hinaus angehoben. Bei nicht angehobenem Dorsum sind Laute [-hoch]. • Tief/ Niedrig (low, sp. bajo) [±tief]/ [±niedr] [±low]: Zungenkörper wird über die neutrale Position hinaus gesenkt. Bei nicht gesenktem Dorsum sind Laute [-tief]/ [-niedr]. • Vorgeschobene Zungenwurzel (advanced tongue root (ATR), sp. raíz lingual avanzada (RLA)) [±ATR]: Zungenwurzel ist bei der Artikulation weiter vorn. • Gespannt (tense, sp. tenso) [±gesp] [±tense]: Zusätzliche Anspannung der supra‐ glottalen Muskulatur. • Radikal (radical/ pharyngeal/ guttural, sp. radical) [ RAD ]: Artikulation mit der Zungenwurzel, pharyngale Laute. Die Ortsmerkmale [ LAB ], [ C O R ], [ DO R S ] und [ R AD ], die den vier Artikulatoren Lippen, Zungenkranz, Zungenrücken und Zungenwurzel entsprechen, sind nach neueren Auf‐ fassungen nicht wie alle übrigen Merkmale als binär, sondern als einwertige oder pri‐ vative (Kategorial-)Merkmale aufzufassen, denn sie implizieren kein Entweder/ Oder, sondern stehen für einen mehrdimensionalen Gegensatz. Zur Unterscheidung von den 136 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="137"?> 22 In der einflussreichen Darstellung von Chomsky & Halle (1968), an der sich auch Hall ( 2 2011) orientiert, galten jedoch alle Merkmale als binär, sodass auch Ortsmerkmale wie [±lab] weiterhin benutzt werden. binären Merkmalen werden sie deshalb meist mit Kapitälchen geschrieben (vgl. Hall 2 2011: 103f., 111, 125f.; Kleber 2023: 209f.). 22 Mit Hilfe der distinktiven Merkmale lassen sich Laute und Lautklassen in Form von Merkmalsmatrizen darstellen. Abb. 3.1-1 zeigt, wie sich die großen Lautgruppen anhand der Oberklassenmerkmale spezifizieren lassen. Abb. 3.1-2 verdeutlicht, dass vier Ortsmerkmale ausreichen, um zehn Vokalphoneme eindeutig zu charakterisieren und gegeneinander abzugrenzen. Für die fünf Vokalphoneme des Spanischen genügen die Merkmale [±hoch], [±tief], [±hint] (vgl. NGRAE 2011: 79). - Obstruenten Nasale Liquide Laryngale Vokale [kons] + + + - - [son] - + + - + [appr] - - + - + Abb. 3.1-1: Spezifizierung durch Oberklassenmerkmale. - i y u ə ø o ɛ œ ɔ a [hoch] + + + - - - - - - - [tief] - - - - - - + + + + [hint] - - + - - + - - + + [rnd] - + + - + + - + + - Abb. 3.1-2: Darstellung von Oralvokalen in einer Merkmalsmatrix. Auf die Prager Schule geht auch der Begriff der Markiertheit (engl. markedness, sp. marcación oder marcadez) zurück, der in der Phonologie und darüber hinaus in allen sprachwissenschaftlichen Teildisziplinen eine wichtige Rolle spielt. So hat schon Trubetzkoy (1939/ 7 1989: 67) die Glieder bestimmter Oppositionen danach unterschieden, ob sie merkmallos oder merkmalhaltig sind: In der privativen Opposition / t/ : / d/ etwa besitzt / d/ das Merkmal [+sth], denn zusätzlich zu den Merk‐ malen, die beide Konsonanten teilen, schwingen bei der Realisierung von / d/ die Stimmlippen, bei / t/ dagegen nicht. / t/ ist damit das merkmallose oder unmarkierte Glied dieser Opposition, / d/ das markierte (sp. no marcado / marcado). Die Existenz eines markierten Lauts wie / d/ impliziert, dass es ein unmarkiertes Gegenstück wie / t/ gibt, während die Umkehrung nicht gilt. Unmarkierte Laute repräsentieren nämlich in den Sprachen der Welt das Gewöhnliche, Unauffällige, Häufige und Weitverbreitete; markierte Laute sind dagegen in weniger Sprachen vertreten, 3.1 Strukturalistische Phonologie 137 <?page no="138"?> 23 Zum Vokalphonemsystem des Spanischen vgl. z. B. Alarcos Llorach ( 4 1986: 145-160), Quilis (1993: 141-193, 6 2005: 37-45), Hualde (2005: 120-137, 2022: 784-787), Blaser 2 2011: 23-31), NGRAE (2011: 73-114), Campos-Astorkiza (2012), Pustka (2021: 166-173), Gabriel (2022: 29-32). und dort, wo sie vorkommen, ist ihre Distribution gegenüber ihren unmarkierten Gegenstücken stärker eingeschränkt. Markierte Laute werden von Kindern später erworben als unmarkierte, und sie gehen im Fall von Aphasien, also bei Sprachstörun‐ gen, eher verloren. Auch gegenüber Sprachwandel sind markierte Laute anfälliger. Bei Neutralisierungen ist es in der Regel der unmarkierte Laut, der als Ergebnis eines solchen Prozesses bestehen bleibt. Um auf unser Beispiel / t/ : / d/ zurückzukom‐ men: / t/ ist in den Sprachen der Welt häufiger als / d/ , und alle Sprachen, in deren Phonemsystem / d/ vertreten ist, haben zwangsläufig auch / t/ . Im Deutschen kommt / t/ in allen Positionen vor, in denen auch / d/ realisiert werden kann (z. B. [ ˈ daŋkə] danke, [ ˈ taŋkə] tanke, [ ˈ boːdən] Boden, [ ˈ boːtən] Boten); darüber hinaus kann / t/ aber auch in der Silbencoda auftreten, die für / d/ gesperrt ist; hier findet Neutralisierung zum stimmlosen, unmarkierten Konsonanten statt ([ ˈ ʁaːtən] raten, [ ˈ ʁɛːdɐ] Räder, aber [ʁaːt] Rat, Rad). Das Konzept der Markiertheit gilt nicht nur für Laute, sondern es erlaubt sprachübergreifende Generalisierungen für alle Arten von sprachlichen Einheiten und bildet damit eine wichtige Grundlage der Sprachtypologie (vgl. Ludwig 2001, De Lacy 2006). In 4.2.4 werden wir die Silbenstrukturen des Spanischen unter dem Aspekt ihrer (Un-)Markiertheit betrachten. Zur Rolle der Markiertheit im Zweitspracherwerb vgl. 5.3.1. 3.1.2 Die Phoneme des Spanischen Nachdem wir in 2.5 die Sprachlaute des Spanischen vorgestellt haben, konzentrieren wir uns in diesem Abschnitt auf deren phonologische Wertung. Wir folgen damit dem zentralen Anliegen des Strukturalismus, die Phoneme einer Sprache zu ermitteln und ihre Beziehungen im einzelsprachlichen Phonemsystem zu klären (3.1.1). Die Analyse der spanischen Phoneme gibt uns die Gelegenheit, mit Phonologisierung (sp. fonologización) und Entphonologisierung (sp. desfonologización) (3.1.2.4) weitere zentrale Begriffe der strukturalistischen Phonologie vorzustellen sowie das Konzept der Archiphoneme (3.1.2.3) und die Einordnung der Gleitlaute als Allophone der Vokalphoneme / i u/ (3.1.2.5) zu diskutieren. Zuvor gehen wir jedoch in 3.1.2.1 auf das Vokalsystem des Spanischen ein und stellen in 3.1.2.2 das konsonantische Phoneminventar vor, bei dem eine starke Abhängigkeit von der Silbenstruktur zu beobachten ist. 3.1.2.1 Vokalphoneme 23 Mit nur fünf Vokalphonemen, die sich durch Minimalpaarreihen wie / ˈ piso/ piso ‘Stock(werk)’ : / ˈ peso/ peso ‘Gewicht’ : / ˈ paso/ paso ‘Schritt’: / ˈ poso/ pozo ‘Brun‐ 138 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="139"?> 24 Die geschlossenen Vokale / i/ und / u/ kommen in (betonten oder unbetonten) Auslautsilben allerdings selten vor. Unbetont erscheinen sie in Entlehnungen wie tribu ‘Stamm’ oder crisis ‘Krise’ sowie in Kosewörtern und Spitznamen, sog. Hypokoristika wie Luci, Maru etc. (Alarcos Llorach 4 1986: 150). 25 Im Italienischen ist die phonologische Opposition zwischen / e/ : / ɛ/ und / o/ : / ɔ/ nur unter dem Hauptton, also in der Silbe mit dem Wortakzent, möglich (it. / ˈ venti/ venti ‘Winde’ : / ˈ vɛnti/ venti ‘zwanzig’; / ˈ korso/ corso ‘korsisch’ : / ˈ kɔrso/ corso ‘Lauf ’). Noch größer ist die Differenz zwischen dem Vokalismus in betonten und unbetonten Silben in Sprachen wie dem Englischen (vgl. 4.3.3, 4.4.1) oder dem Bulgarischen (vgl. 5.2.3). 26 Auch in der französischen Normaussprache ist der Unterschied zwischen mittelhohen und mitteltiefen Vokalen phonologisch distinktiv, sodass / e/ und / ɛ/ bzw. / o/ und / ɔ/ Phoneme sind (fr. / epe/ épée ‘Schwert’ vs. / epɛ/ épais ‘dicht’; / pom/ paume ‘Handfläche’ vs. / pɔm/ pomme ‘Apfel’). 27 Dass die Öffnung phonetisch auch auf die vorangehenden Vokale übertragen wird, ist der sog. Vokalharmonie (sp. armonía vocálica), also der Angleichung von Vokalen in benachbarten Silben, geschuldet: [ ˈ lɔβɔ], [ ˈ kæntæ]. Eine optimalitätstheoretische Analyse (3.4) ostandalusischer Pluralformen unter Rückgriff auf das Merkmal ATR (Advanced Tongue Root, 3.1.1) schlagen Davis & Pollock (2024) vor. nen’: / ˈ puso/ puso ‘er/ sie legte’ nachweisen lassen, hat das Spanische ein relativ einfa‐ ches Vokalsystem, das typologisch, also im Sprachvergleich, unmarkiert ist (Hualde 2005: 120f., NGRAE 2011: 74). Dieselben Oppositionen sind auch in unbetonten Silben möglich (vgl. / pi ˈ so/ pisó ‘er/ sie betrat’ : / pe ˈ so/ pesó ‘er/ sie wog’ : / pa ˈ so/ pasó ‘er/ sie verbrachte’ : / po ˈ so/ posó ‘er/ sie posierte’ und unbetonte einsilbige Funktionswörter wie / si/ si ‘wenn’ : / se/ se ‘sich’ : / su/ su ‘sein/ ihr’). 24 Im Unterschied zu vielen anderen Sprachen spielt also die Akzentposition (4.3) für die Zahl und die Art der Vokalphoneme keine Rolle. 25 Wie ein solches Vokalsystem umstrukturiert werden kann, wollen wir exempla‐ risch anhand ostandalusischer und andenspanischer Varietäten vorstellen. In den ersteren ist infolge der Tilgung von Coda-s der unterschiedliche Öffnungsgrad der mittleren sowie die divergierende Position der tiefen Vokale phonologisiert worden (vgl. Penny 2000: 122ff.; 2.5.3.1 und 3.1.2.4). 26 Damit sind acht Vokalphoneme anzusetzen, die u. a. zur Differenzierung von Numerus in der Nominal- und Person in der Verbalflexion herangezogen werden (z. B. / ˈ lobo/ Sg. : / ˈ lobɔ/ Pl. lobo/ s ‘Wolf/ Wölfe’, / ˈ kɑntɑ/ 3. Sg : / ˈ kɑntæ/ 2. Sg. canta/ s ‘er/ sie singt / du singst’). 27 In den peruanischen Anden hat der Sprachkontakt mit den autochthonen Sprachen ein entgegengesetztes Ergebnis gezeitigt: Da Quechua und Aymara jeweils nur über ein dreigliedriges Vokalsystem verfügen (/ ɪ a ʊ/ ), ist der Unterschied zwischen hohen und mittleren Vokalen stellenweise auch in der spanischen Kontaktvarietät aufgege‐ ben worden, sodass sich die Zahl der Vokalphoneme hier auf drei reduziert (NGRAE 2011: 96; vgl. auch 5.1.5). In Abb. 3.1-3 sind die Vokalsysteme dieser Varietäten in einer informellen Merkmalsmatrix einander gegenübergestellt: 3.1 Strukturalistische Phonologie 139 <?page no="140"?> 28 Zu den Konsonantenphonemen des Spanischen vgl. Alarcos Llorach ( 4 1986: 161-179), Quilis (1993: 194-359, 6 2005: 46-66), Hualde (2005: 138-189, 2022: 787-793), Blaser ( 2 2011: 23-31), Campos-Astorkiza (2012), Pustka (2021: 174-180), Gabriel (2022: 32-36), NGRAE (2011: 115-263). 29 Für weitere Beispiele verweisen wir auf die entsprechenden Abschnitte in 2.5. 30 / ɲ/ kommt im Wortanlaut nur in Entlehnungen und expressiven Bildungen wie / ɲu/ ñu ‘Gnu’ und / ɲiki ˈ ɲake/ ñiquiñaque ‘nutzloses Zeug’ vor, sodass dort nur die Opposition zwischen / m/ und / n/ übrigbleibt. vorn hinten vorn hinten vorn hinten hoch i u - hoch i u - hoch i u mittel e o - mittelhoch e o - mitteltief ɛ ɔ - tief a - tief æ a - tief a Abb. 3.1-3: Das spanische Vokalsystem (links) in Gegenüberstellung mit dem System ostandalusischer (Mitte) und andenspanischer Varietäten (rechts). 3.1.2.2 Konsonantenphoneme 28 Auch das konsonantische Phoneminventar des Spanischen ist mit unter 20 Pho‐ nemen vergleichsweise klein. Je nach Position in der Silbe ist zudem die Variation beträchtlich, denn zahlreiche Kontraste sind auf den Silbenanfangsrand oder Onset beschränkt. Das gilt für die Plosive, die nur im Onset an den drei Artikulationsorten labial, alveolar und velar jeweils über die Stimmtonopposition [±sth] kontras‐ tieren / ˈ pasta/ pasta ‘Paste’ : / ˈ basta/ basta ‘es reicht’ etc., 29 während Frikative und Affrikaten bis auf / s/ (bzw. / θ/ ) und marginal / x/ von vornherein nur in der Onsetpo‐ sition erscheinen können. Die drei Nasalphoneme sind lediglich im Anfangsrand wortinterner Silben phonologisch distinktiv, 30 während der Kontrast in der Coda neutralisiert wird. Eine Opposition zwischen Tap und Trill schließlich besteht nur wortintern zwischen Vokalen. Abb. 3.1-4 präsentiert die Konsonantenphoneme des Spanischen. Phoneme, die nur eine beschränkte regionale Verbreitung haben, sind in der Tabelle in Klammern gesetzt. 140 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="141"?> labial dental alveolar postalveo‐ lar palatal velar Plosive -sth / p/ - / t/ - - / k/ +sth / b/ - / d/ - - / ɡ/ Affrikaten -sth - - - - / t͡ʃ/ - +sth - - - - - - Frikative -sth / f/ (/ θ/ ) / s/ - - / x/ +sth - - - (/ ʒ/ ) / ʝ/ - Nasale +sth / m/ - / n/ - / ɲ/ - Laterale +sth - - / l/ - (/ ʎ/ ) - Vibranten Tap +sth - - / ɾ/ - - - Trill +sth - - / r/ - - - Abb. 3.1-4: Konsonantenphoneme des Spanischen. 3.1.2.3 Archiphoneme Wie in 3.1.1 bereits dargestellt, hat die strukturalistische Phonologie das Konzept des Archiphonems entwickelt, um damit das Ergebnis von Neutralisierungen zu notieren. Das Archiphonem zeichnet sich durch die Gesamtheit der distinktiven Eigenschaften aus, die den von der Neutralisierung betroffenen Phonemen gemein sind. Die distink‐ tiven Merkmale, durch die sich die Phoneme in den übrigen Kontexten voneinander unterscheiden, sind dagegen neutralisiert. In diesem Abschnitt wollen wir untersuchen, wie das Konzept des Archiphonems die Strukturen des spanischen Phonemsystems besser erfassbar machen kann. Neutralisierungen finden im Spanischen vorzugsweise in der Coda statt. Hier wird beispielsweise die Stimmtonkorrelation ([±sth]), die für die Plosivphoneme im Onset distinktiv ist (/ p t k/ : / b d ɡ/ ), zugunsten eines breiten Spektrums allophonischer Variation aufgegeben (z. B. [ ˈ apto] ~ [ ˈ abto] ~ [ ˈ aβto] ~ [ ˈ a β to] ~ [ ˈ ato] apto ‘geeignet’). Diese kann also zwischen stimmlosem und stimmhaftem Plosiv, Frikativapproximant und Tilgung frei variieren, wobei die Realisierung als stimmhafter Frikativapproximant die geläufige ist (2.5.1.1). Aus diesen quantitativen Überlegungen heraus werden in zahlreichen traditionellen Beschreibungen der spanischen Phonologie für Plosive in der Coda die Archiphoneme / B D G/ angesetzt (so etwa von Alarcos Llorach 4 1986: 184, Quilis 1993: 50ff.). Wenn man jedoch bedenkt, dass ein Archiphonem das unmarkierte Glied der Opposition sein sollte, scheint es sinnvoller, hier / P T K/ anzusetzen (Kubarth 2009: 100f.), um anzuzeigen, dass die Stimmtonopposition in der Silbencoda aufgehoben ist. Wir notieren deshalb phonologisch / aPto/ . 3.1 Strukturalistische Phonologie 141 <?page no="142"?> Die bereits mehrfach angesprochene Neutralisierung der Oppositionen zwischen den Nasalen, die sich sowohl in der wortinternen als auch in der wortfinalen Coda beobachten lässt, betrifft mit [labial], [alveolar] und [palatal] die Ortsmerkmale dieser Konsonanten. Sie sind hier aufgrund der Nasalassimilation einzig durch den Folgekonsonanten determiniert, während im absoluten Auslaut nur die alveolare (bzw. in velarisierenden Varietäten die velare) Realisierung möglich ist. Um dem gerecht zu werden, setzen wir das Archiphonem / N/ an. Es signalisiert, dass als Gesamtheit der distinktiven Eigenschaften nur das Merkmal [+nas] übrig ist (2.5.1.3, 3.1.1, 3.3). In generativen Ansätzen geht man in solchen Fällen vom Konzept der Unterspezifi‐ kation (engl. underspecification, sp. subespecificación) aus. Danach sind die Nasalkon‐ sonanten in der Codaposition hinsichtlich ihres Artikulationsorts nicht determiniert (vgl. Harris 1984); für Plosive gibt es hier bezüglich des Merkmals [±sth] keine Festlegung. Die Codakonsonanten gelten in solchen Fällen als unterspezifiziert (vgl. zu diesem Konzept Archangeli 1988). Verschiedentlich wird für die Codaposition auch ein Archiphonem / L/ angesetzt (Kubarth 2009: 114), da der palatale Lateral / ʎ/ nur im Onset auftreten kann. Es scheint jedoch sinnvoller, hier eine defektive Distribution von / ʎ/ zu postulieren, dessen Stellenwert im spanischen Phonemsystem inzwischen marginal ist. Wir gehen deshalb auch für die Codaposition von / l/ aus. Wir haben schon mehrfach auf die besondere Situation der Opposition zwischen dem Tap / ɾ/ und dem Trill / r/ hingewiesen, die auf die wortinterne intervokalische Position beschränkt ist. Im Wortanlaut und im wortinternen Onset nach Konsonant ist nur der Trill möglich, in den übrigen Positionen ist der Tap die normale Realisierung. In emphatischer Rede kann in der Coda jedoch auch der Trill / r/ auftreten. Da der Trill eindeutig das markierte Glied in der Opposition darstellt, scheint es nicht sehr sinnvoll, für den Anlaut eine Neutralisierung zum Trill anzusetzen; hier ist eher von einer systematischen Stärkung des Wortanfangs auszugehen (Baković 1994), der für den unmarkierten Tap folglich gesperrt ist. Mit Quilis (1993: 42) und Hidalgo Navarro & Quilis Merín (2012: 216, 234) können wir hier auch von einer defektiven Distribution sprechen und transkribieren mit dem Trill / r/ . Die defektive Distribution ist übrigens nicht direkt sichtbar, sondern muss gesondert in den Distributionsregeln für das Phonem / ɾ/ vermerkt werden. Die phonologische Transkription mit / r/ macht aber klar, dass die Realisierung anders als im Silben- und Wortauslaut bzw. im komplexen Onset nicht frei variieren kann, sondern auf den Trill festgelegt ist. Trotz der potentiellen Variation in der Silbencoda scheint es auch hier nicht sinnvoll, ein Archiphonem / R/ anzusetzen, denn wie Hualde (2005: 182f.) vermerkt hat, würde dies im Widerspruch zu der Tatsache stehen, dass der wortfinale r-Laut bei der Resyllabierung mit einem folgenden vokalisch anlautenden Wort nur als [ɾ], nie aber als [r] realisiert werden kann ([a ˈ maɾa ˈ ese] amar a ese ‘diesen lieben’ vs. [a ˈ mara ˈ ese] amarra ese ‘er/ sie verbindet das’). Hier wie in der komplexen Coda transkribieren wir deshalb phonologisch / ɾ/ . 142 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="143"?> 31 / t͡ʃ/ , / f/ und / x/ , die als Codakonsonanten nur im Wortauslaut bzw. nur in Entlehnungen vorkommen, sind nicht in die Tabelle aufgenommen (vgl. 4.2.4.2). Abb. 3.1-5 fasst Phoneme und Archiphoneme, die in der Coda des Spanischen auftreten können, zusammen. 31 - labial dental alveolar velar Plosive / P/ - / T/ / K/ Frikative - (/ θ/ ) / s/ - Nasale - - / N/ - Laterale - - / l/ - Vibranten - - / ɾ/ - Abb. 3.1-5: Phoneme und Archiphoneme in der einfachen Coda. 3.1.2.4 Phonologisierung und Entphonologisierung In allen Varietäten des Spanischen gibt es nasalisierte Vokale als kombinatorische Varianten der Vokalphoneme. Das artikulatorische Merkmal der Nasalität ([+nas]) wird durch das Phänomen der Assimilation von den Nasalkonsonanten auf die benachbarten Vokale übertragen, und zwar in folgenden Kontexten (NGRAE 2011: 100-103): • im Wortinnern zwischen zwei Nasalkonsonanten ([m- ˈ ɲ-na] mañana ‘morgen’), • zu Beginn einer Intonationsphrase (ip/ IP; vgl. 4.1.1) vor einem Nasalkonsonanten in der Coda, wenn die nächste Silbe mit Konsonant beginnt ([ ˈ ẽntɾen] ¡Entren! ‘Tre‐ ten Sie ein! ’), • in einigen diatopischen Varietäten auch vor [n] und [ŋ] am Wortende ([p-n] oder [p-ŋ] pan ‘Brot’). Solange die Nasalkonsonanten artikuliert werden, handelt es sich bei den nasalisierten Vokalen um kombinatorische Varianten in komplementärer Distribution (vgl. 3.1.1). Wird jedoch nach einer Tilgung der Nasalkonsonanten die Nasalisierung der Vokale beibehalten, so können die nasalisierten Allophone den Status von Phonemen erlangen. Dies ist in der französischen Sprachgeschichte eingetreten. In der Coda des Altfranzösi‐ schen gab es Nasalkonsonanten, deren Reflex wir heute nur noch in der Graphie finden: afr. [t͡ʃ-nt] chant ‘Gesang’ und [t͡ʃat] chat ‘Katze’ waren also keine Minimalpaare, weil sie bereits durch die unterschiedliche Zahl von Segmenten unterschieden wurden. Seit gegen Ende der altfranzösischen Periode die Nasalkonsonanten (und meist auch alle weiteren Konsonanten) in der Silbencoda getilgt wurden, beruht der lautliche Unterschied zwischen fr. [ʃ-] chant vs. [ʃa] chat jedoch nur noch auf der nasalen vs. oralen Qualität der Vokale; die Nasalvokale sind also phonologisiert worden. Ein 3.1 Strukturalistische Phonologie 143 <?page no="144"?> 32 Auch die in 3.1.2.1 bereits angesprochene Entwicklung im Vokalsystem ostandalusischer Varietäten stellt eine Phonologisierung von Allophonen in komplementärer Distribution dar. solcher Prozess der Phonologisierung (sp. fonologización) von Nasalvokalen kann heute im karibischen Spanisch und in einigen weiteren Regionen Lateinamerikas beobachtet werden. Hier wird der wortfinale Nasalkonsonant elidiert, ohne dass die Nasalisierung des vorangehenden Vokals aufgegeben wird. In Minimalpaaren wie [ ˈ ẽntɾa] entra ‘er/ sie tritt ein’ vs. [ ˈ ẽntɾ-] entran ‘sie treten ein’ hat die Nasalisierung der Vokale bedeutungsunterscheidende Funktion (NGRAE 2011: 104), und das Inventar der Vokalphoneme müsste hier folglich um die Nasalvokale erweitert werden. 32 Die Zahl der Frikativphoneme variiert in den spanischen Varietäten. Im kastili‐ schen Standard und im Nordspanischen, wo die Opposition zwischen dentalem / θ/ und alveolarem / s/ weiter aufrechterhalten wird, gibt es mit / f θ s ʝ x/ fünf Frikativphoneme (sistema distinguidor, distinción). In Lateinamerika, großen Teilen Andalusiens und der Extremadura sowie im kanarischen Spanisch hat das alveolare / s/ den dentalen Frikativ / θ/ ersetzt (seseo), sodass in diesen Varietäten mit / f s ʝ x/ nur noch vier Frikativphoneme vertreten sind. In kleineren ländlichen Gebieten Südspaniens hat der Ersetzungsprozess in umgekehrter Reihenfolge stattgefunden. Der dentale Frikativ / θ/ hat hier den alveolaren Frikativ / s/ ersetzt (ceceo). Auch diese Varietäten haben nur ein vierstufiges System von Frikativphonemen (/ f θ ʝ x/ ). distinción labial dental alveolar palatal velar -sth / f/ / θ/ / s/ - / x/ +sth - - - / ʝ/ - seseo labial koronal palatal velar -sth / f/ / s/ - / x/ +sth - - - / ʝ/ - ceceo labial koronal palatal velar -sth / f/ / θ/ - / x/ +sth - - / ʝ/ - Abb. 3.1-6: Frikative Konsonantenphoneme im Spanischen. Wenn wir von den wenigen ceceo-Varietäten absehen, kommt der stimmlose den‐ tale Frikativ / θ/ nur im sistema distinguidor, also im kastilischen Standard und in nordspanischen Varietäten vor. Dort hat er, genauso wie der alveolare Frikativ / s/ , Pho‐ nemstatus; / ˈ sieNto/ siento und / ˈ θieNto/ ciento bilden beispielsweise ein Minimalpaar. In seseo- und ceceo-Varietäten ist dies nicht der Fall, weil die beiden Wörter hier die gleiche zugrundeliegende Form aufweisen und damit in der phonetischen Realisierung homophon sind; im seseo gilt jeweils die Realisierung [ ˈ sjento], im ceceo [ ˈ θjento] (siento 144 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="145"?> 33 Die Opposition kann auch auf den Kontrast zwischen zwei unterschiedlichen Artikulationsarten, nämlich [±sibil], zurückgeführt werden (3.1.1). Für die phonologische Argumentation ist es nicht relevant, welches Merkmal angesetzt wird. Ausschlaggebend ist allein, dass aufgrund einer einschlä‐ gigen Merkmalkombination die Distinktivität der Phoneme gewährleistet ist. 34 Ein Beispiel hierfür ist das paraguayische Spanisch, das die phonemische Unterscheidung zwi‐ schen / ʎ/ und / ʝ/ vor allem in gelesener Sprache bewahrt hat (vgl. Gabriel et al. 2020b und 5.1.6). 35 Der žeísmo bzw. šeísmo des argentinischen Spanisch stellt eine Weiterentwicklung des yeísmo dar: / ʝ/ ist hier vom palatalen zum postalveolaren Frikativ geworden. ~ ciento). Sowohl seseo als auch ceceo sind aufgrund einer Entphonologisierung ent‐ standen, weil die lautliche Distinktion zwischen dentalem und alveolarem 33 stimmlosen Frikativ - mit jeweils unterschiedlichem Ergebnis - aufgegeben wurde. Zu einer weiteren Entphonologisierung kommt es durch das Phänomen des yeísmo (2.5.1.4). So nennen wir eine bereits im Mittelalter einsetzende Lautentwick‐ lung, die dazu geführt hat, dass der palatale Lateral [ʎ] heute fast überall in der spanischsprachigen Welt durch den palatalen Frikativ [ʝ] ersetzt worden ist. Die meisten spanischen Varietäten kennen folglich nur noch ein Lateralphonem, nämlich alveolares / l/ (Hualde 2005: 178-181, Alonso-Cortés 2010, NGRAE 2011: 223). Das lleísmo genannte konservativere Phonemsystem (sp. subsistema lleísta/ distinguidor) mit der Unterscheidung zweier Lateralphoneme / l/ und / ʎ/ (z. B. / ˈ polo/ polo ‘Pol’ : / ˈ poʎo/ pollo ‘Hähnchen’) hat nur noch sehr beschränkte Gültigkeit. 34 Im System des yeísmo gibt es nur ein Lateralphonem, nämlich das alveolare / l/ . Die Opposition im gerade angeführten Minimalpaar ist aber weiterhin gewährleistet. Zwar stehen sich nicht mehr zwei laterale Phoneme gegenüber, sondern der Lateral / l/ kontrastiert mit dem Frikativ / ʝ/ / ˈ polo/ : / ˈ poʝo/ . 35 lleísmo yeísmo - / ʝ/ - / ʝ/ / l/ / ʎ/ / l/ Abb. 3.1-7: Phonemoppositionen im lleísmo und im yéismo. Wie die Gegenüberstellung der beiden Systeme in Abb. 3.1-7 zeigt, ist durch den yeísmo aber eine andere Opposition aufgehoben, nämlich die zwischen / ʎ/ und / ʝ/ . / ˈ poʝo/ [ ˈ poʝo] pollo ‘Huhn’ und / ˈ poʝo/ [ ˈ poʝo] poyo ‘Steinbank’ sind, anders als im lleísmo, homophon. Der yeísmo hat zur Entphonologisierung der Opposition zwischen dem Lateralphonem / ʎ/ und dem Frikativphonem / ʝ/ geführt. 3.1.2.5 Gleitlaute als Vokalphoneme Im Spanischen gibt es mit [j] und [w] zwei Gleitlaute (engl. glides, sp. semiconsonan‐ tes/ semivocales/ deslizadas / vocales satélites), deren phonologische Wertung teilweise kontrovers diskutiert wird. Sie entstehen, wenn die geschlossenen Vokale / i/ und / u/ 3.1 Strukturalistische Phonologie 145 <?page no="146"?> 36 Die lexikalischen Diphthonge des Deutschen werden wie einfache Vokale behandelt und als Phoneme gewertet (Wiese 2011: 48). 37 Gerade in diesem zweiten Punkt unterscheiden sich das Spanische und das Deutsche deutlich, denn ein Diphthong wie in dt. Schaum kann nur als lexikalischer Diphthong auftreten. Ein Hiatus, wie er in der Folge Sascha umgarnen entsteht, führt im Deutschen dagegen nie zu einer diphthongischen Artikulation, weil vokalisch anlautende Silben vor der Tilgung der Silbengrenze geschützt sind. Ein weiterer Unterschied zum Deutschen liegt in der Syllabierung: Im Spanischen werden fallende Diphthonge, wenn sie in Kontakt mit einer vokalisch anlautenden Folgesilbe kommen, auf zwei Silben verteilt: [lej] ley ‘Gesetz’ vs. [ ˈ le.jes] leyes ‘Gesetze’; [ ˈ o.jes. ˈ taɾ.ðe] hoy es tarde ‘heute ist es spät’ (Alarcos Llorach 4 1986: 151). Im Deutschen bleiben die lexikalischen Diphthonge dagegen immer in einer Silbe vereint (blau.er). mit einer größeren Engebildung artikuliert werden. Dies geschieht in komplexen vokalischen Silbenkernen, also in Diphthongen (sp. diptongos) und Triphthongen (sp. triptongos), wie sie aus der Verbindung von zwei bzw. drei vokalischen Artikula‐ tionsstellungen in einem Silbenkern resultieren. Sie unterscheiden sich darin vom Hiat(us) (sp. hiato), bei dem zwei Vollvokale aufeinandertreffen und jeweils eigene Silbenkerne bilden. Während [aj] hay einsilbig ist und als Diphthong artikuliert wird, bilden die Vokale in [a ˈ i] ahí zwei eigenständige Silbenkerne, die im Hiatus stehen (vgl. 2.5.3.2). Bei lexikalischen Diphthongen (bzw. lexikalisch-morphologischen Triph‐ thongen) ist die einsilbige Artikulation fest in der phonologischen Form der Lexeme (/ mui/ [muj] ~ [mwi] muy) bzw. Flexionsmorpheme (/ estu ˈ diais/ [estu ˈ ðjajs] estudiais) verankert. Darüber hinaus werden Diphthonge und Triphthonge in der parole, bei‐ spielsweise in Schnellsprechformen wie / di ˈ ablo/ [ ˈ djaβlo] diablo spontan gebildet. Vor allem aber die Resyllabierung in der phonologischen Phrase führt zu einer Vielzahl von neuen Diphthongen und Triphthongen. Hiate stellen markierte Silbenkontakte dar und werden deshalb in vielen Sprachen der Welt eher vermieden. Auch das Spanische hat eine starke Tendenz zur Vermeidung von Hiaten (sp. tendencia antihiática) (vgl. 4.2.3), und Vokale, die an Wortgrenzen aufeinandertreffen, werden daher in aller Regel zu Diphthongen oder Triphthongen verschmolzen (/ a#es ˈ tado/ [ajs ˈ taðo] ha estado ‘er/ sie ist gewesen’) (vgl. 4.2.6). Bevor die Frage beantwortet werden kann, welche phonologische Wertung die Gleitlaute erhalten sollen, muss zunächst geklärt werden, ob die spanischen Dibzw. Triphthonge als ein Phonem oder als Folge von Phonemen angesehen werden sollen. 36 Für eine bibzw. triphonematische Lösung spricht, dass im Spanischen (anders als im Deutschen) in einem Diphthong Gleitlaut und Vollvokal unabhängig voneinander ausgetauscht werden können ([pjes] pies ‘Füße’ : [pwes] pues ‘dann’, [sejs] seis ‘sechs’ : [sojs] sois ‘ihr seid’). Auch können in phonologischen Phrasen immer neue Kombinationen aus Gleitlaut und Vokal entstehen, sodass eine Wertung des Diphthongs als ein Phonem - und nicht als eine Kombination von mehreren Phonemen - wenig angebracht scheint. 37 Was nun die phonologische Einordnung der Gleitlaute angeht, so ließen [j] und [w] sich ausgehend von Minimalpaaren wie [pjes] pies : [pwes] pues als oppositions‐ 146 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="147"?> 38 Hualde (2005: 78, 80), der die Regel zur Gleitlautbildung formuliert hat, umgeht diese Sonderregelung für die betonten Vokale, indem er den Akzent unmittelbar am Vokalzeichen festmacht, also / péine/ ([ ˈ pej.ne] peine ‘Kamm’), / piérna/ ([ ˈ pjeɾna] pierna ‘Bein’) bzw. / tía/ ([ ˈ ti.a] tía ‘Tante’), / aí/ ([a ˈ i] ahí ‘da’) schreibt. In der spanischen Orthographie muss die Betonung des hohen Vokals immer durch einen Akut auf dem Vokalbuchstaben gekennzeichnet werden (vgl. 4.3.6). bildende Segmente, also als eigenständige Phoneme / j/ bzw. / w/ , bewerten (Kubarth 2009: 92f.). Für diese Lösung spricht, dass in Minimalpaaren wie [oj] hoy vs. [o ˈ i] oí oder [aj] hay vs. [a ˈ i] ahí der Gleitlaut dem ihm zugeordneten Vokal gegenübersteht. Die genaue Analyse dieser Minimalpaare zeigt aber, dass die lautliche Opposition besser mit einem prosodischen Phänomen, nämlich dem Wortakzent, erklärt werden kann. Wenn die Vokale / i/ und / u/ den Akzent tragen, werden sie immer als Vollvokale realisiert. Deshalb sind oí und ahí zweisilbig und nicht diphthongisch. Es ist also ein silbenstruktureller und kein segmentaler Gegensatz, der durch die Wortpaare exemplifiziert wird. Überlegungen wie diese haben dazu geführt, die Gleitlaute [j] und [w] als Allo‐ phone der Vokalphoneme / i/ und / u/ einzuordnen (Alarcos Llorach 4 1986: 152f., Hualde 2005: 54f., NGRAE 2011: 332). Genauer handelt es sich bei den Gleitlauten um kombinatorische Varianten, die dann auftreten, wenn / i/ bzw. / u/ unmittelbar vor oder nach einem Vokal stehen und nicht betont sind, was in der Umgebung eines nicht hohen Vokals als Default gelten kann (Hualde 2005: 80). Ist der hohe Vokal dagegen betont, so muss in der phonologischen Transkription die ihm folgende Silbengrenze markiert werden, um seine Herabstufung zum Gleitlaut zu verhindern. 38 In der phonologischen Form werden die Vokalphoneme / i/ und / u/ angegeben und die Gleitlautrealisierung an der phonetischen Oberfläche nach der gerade formulierten Regel abgeleitet: Gleitlaute im Spanischen Gleitlaut / ˈ tiera/ [ ˈ tjera] tierra ‘Erde’ - / lei/ [lej] ley ‘Gesetz’ - / ˈ pueNte/ [ ˈ pwente] puente ‘Brücke’ - / ˈ deuda/ [ ˈ dewða] deuda ‘Schuld’ kein Gleitlaut, sondern Hiatus / o ˈ i/ [o ˈ i] oí ‘ich hörte’ - / le ˈ i/ [le ˈ i] leí ‘ich las’ - / a ˈ i/ [a ˈ i] ahí ‘hier’ - / ˈ ti.a/ [ ˈ tia] tía ‘Tante’ Die Einordnung der Gleitlaute als Allophone der Vokalphoneme / i/ und / u/ ist eine elegante, beschreibungsökonomische Lösung. Sie führt dazu, dass das Inventar der spanischen Vokalphoneme weiterhin auf fünf beschränkt bleibt, weil die Gleitlaute 3.1 Strukturalistische Phonologie 147 <?page no="148"?> 39 Im nähesprachlichen Madrider Spanisch kommen jedoch auch Formen wie [ ˈ oɟe] ¡Oye! ‘Höre! ’ vor (Hualde 2005: 166). mittels der genannten Regel aus den bereits vorhandenen Vokalphonemen / i/ und / u/ abgeleitet werden. Es reicht, in die phonologische Repräsentation der Lexeme die prosodische Information über die Stelle des Wortakzents einzufügen. Ein Lexem wie tierra hat also die phonologische Form / ˈ tiera/ , die mittels der Gleitlautbildungsregel in die phonetische Oberfläche [ ˈ tjera] überführt wird. Diese Regel gilt allerdings nicht ausnahmslos, denn in Lexemen wie piar / pi ˈ aɾ/ [pi ˈ aɾ] wird der unbetonte Vokal / i/ nicht zum Gleitlaut [j] herabgestuft. Dieser und die wenigen anderen Fälle, in denen auch bei unbetontem / i/ und / u/ zumindest nach der traditionellen Normaussprache ein Hiatus artikuliert werden soll, machen in der phonologischen Form ebenfalls die Markierung einer Silbengrenze zwischen den Vokalen erforderlich, um auf diese Weise zu signalisieren, dass ein lexikalisch verankerter Hiatus vorliegt und die Vokale nicht zu einem Diphthong verschmolzen werden sollen (Hualde 2005: 81-86). lexikalischer Hiatus / pi ˈ aɾ/ [pi ˈ aɾ] piar ‘piepsen, zirpen’ / pɾo.i ˈ biɾ/ [pɾoi ˈ βiɾ] prohibir ‘verbieten’ / u ˈ iɾ/ [u ˈ iɾ] huir ‘fliehen’ Auch für den stimmhaften palatalen Frikativ / ʝ/ ist die phonologische Wertung als Allophon von / i/ vorgeschlagen worden. Dies hängt mit den deutlichen Positi‐ onsbeschränkungen dieses Frikativs zusammen: In phonologischer Opposition zu anderen Konsonantenphonemen steht er nur im einfachen Onset (z. B. [ʝa] ya ‘schon’ vs. [da] da ‘er/ sie gibt’; [ ˈ aʝa] haya ‘es gebe’ vs. [ ˈ aβa] haba ‘Bohne’). Bedingt durch den lautlichen Kontext, aber auch aufgrund diasystematischer Fak‐ toren variiert zudem die lautliche Realisierung dieses Frikativs deutlich. Allein im kastilischen Standard sind als Allophone der Frikativ [ʝ], der Plosiv [ɟ] und die Affri‐ kate [ɟ͡ʝ] belegt; im mexikanischen und US-amerikanischen Spanisch tritt außerdem [j] als Realisierungsvariante auf. Alle diese Allophone sind palatal und stimmhaft, es variiert nur der Grad der konsonantischen Engebildung, der von geringer frikativischer Enge über den völligen Verschluss bis zur Affrikate mit maximaler Konstriktion reicht. Die Verteilung der Allophone ist teilweise kontextuell geregelt: So ist die Artikulation als starker Konsonant, also als Plosiv oder Affrikate, in der Position im absoluten Wortanlaut nach Pause sowie im Silbenanlaut nach Nasal oder Lateral regelmäßig, tritt aber normalerweise nicht wortintern zwischen Vokalen auf. 39 Aber auch in den Positionen, die konsonantische Verstärkungen auslösen können, ist weiterhin die 148 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="149"?> 40 Im argentinischen Spanisch ist der palatale stimmhafte Frikativ [ʝ] zum postalveolaren stimmhaften Frikativ [ʒ] bzw. stimmlosen [ʃ] vorverlagert worden (žeísmo/ šeísmo; 2.5.1.2); hier ist also die phonologische Kontinuität zu [i] ~ [ʝ] abgerissen (vgl. Hualde 2005: 169). 41 Vgl. dazu die Zusammenfassung der Forschungsdiskussion in Kubarth (2009: 90ff.). frikativische Variante zu finden (Hualde 2005: 165f., Kubarth 2009: 108, NGRAE 2011: 193f.). 40 Die Positionsbeschränkungen (nur unmittelbar vor Vokal im einfachen Onset) rücken den Frikativ in die Nähe der Gleitlaute, und mit [j] kann man ihn auch artikulatorisch in Verbindung bringen. Abb. 3.1-8 zeigt das Kontinuum, das durch die unterschiedlichen Grade der Engebildung zwischen Zungenrücken und Palatum gebildet wird; [ʝ] und [j] sind auf dieser Skala unmittelbar benachbart. Vokal Gleitlaut Frikativ Plosiv Affrikate [i] [j] [ʝ] [ɟ] [ɟ͡ʝ] minimal ← Konstriktion → maximal Abb. 3.1-8: Artikulationskontinuum zwischen [i] und [ɟ͡ʝ]. Aufgrund der Nähe zum Gleitlaut [j] könnte [ʝ] also wie dieser als Allophon von / i/ eingeordnet werden. 41 Diese radikale Lösung ist möglich, weil es im Spanischen keine Minimalpaare gibt, in denen / ʝ/ in Opposition zu / i/ steht (Kubarth 2009: 91). Einer solchen maximal ökonomischen Konfiguration des spanischen Phonemsystems widerspricht aber die Sprachgeschichte. Der yeísmo, d. h. der Ersatz des palatalen Laterals / ʎ/ durch / ʝ/ zeigt, dass der palatale Frikativ wie ein konsonantisches Segment behandelt wird. Auch seine Weiterentwicklung zu den alveolaren Frikativen des argentinischen Spanisch wäre mit einer phonologischen Einordnung im Bereich der Vokale nicht vereinbar. 3.2 Klassische generative Phonologie Im einführenden Kapitel haben wir dargestellt, wie sich im Zuge des sog. cognitive turn die Sichtweise von der Saussureschen langue als kollektivem Zeichenvorrat der Sprachgemeinschaft zur Chomskyschen Konzeption der individuellen Kompetenz des einzelnen Sprechers gewandelt hat (vgl. 1.4). Analog zur Grundannahme der generativen Syntaxtheorie, dass sich unterschiedliche Satzmuster durch Regeln aus einer zugrundeliegenden Struktur ableiten lassen (vgl. Chomsky 1957), wurde vor‐ geschlagen, phonologische Prozesse ebenfalls durch Regeln zu erfassen. Diese vermitteln zwischen der im mentalen Lexikon gespeicherten zugrundeliegenden phonologischen Form (auch: phonologische Repräsentation) und den konkret vom Sprecher produzierten Äußerungen, die sich als phonetische Oberfläche (auch: phonetische Repräsentation) fassen lassen. Mit dem Blick auf solche Prozesse wurde 3.2 Klassische generative Phonologie 149 <?page no="150"?> das Konzept vom phonologischen Wissen, das im Strukturalismus vornehmlich auf die Bestandsaufnahme einzelsprachlicher Phoneminventare und die Beschreibung ihrer Distribution ausgerichtet war, dynamisiert. Kurz nach dem Erscheinen des auf das Englische bezogenen Initialwerks The sound pattern of English (abgekürzt als SPE, Chomsky & Halle 1968) wurde dieser als Klassische Generative Phonologie bekannt gewordene Ansatz auch auf romanische Sprachen, darunter das Spanische, angewandt (z. B. Harris 1969, Cressey 1978). Die Klassische Generative Phonologie erfasst den Zusammenhang zwischen zugrundeliegender phonologischer Form und phonetischer Oberfläche mithilfe von Regeln des Formats A → B / C. Dies ist zu lesen als ‘A wird realisiert als B im Kontext C’, wobei mit A das zugrundeliegende Phonem / …/ und mit B der an der phonetischen Oberfläche konkret realisierte Laut […] gemeint ist. Durch den Kontext C wird die Position des betreffenden Elements (angegeben durch den Unterstrich ‘__’) in der Redekette wie folgt spezifiziert: A → B / __ X ‘A wird als B realisiert vor Segment X’ A → B / Y __ ‘… nach Segment Y’ A → B / X __ Y ‘… zwischen Segment X und Segment Y’ A → B / __ Y(Z) ‘… vor Segment Y oder Segment Y und Segment Z’ A → B / __ X Y ‘… vor entweder Segment X oder Segment Y’ Da die Realisierung eines Phonems nicht nur von der segmentalen Umgebung, sondern auch von Wort- und Silbengrenzen abhängen kann, werden diesbezügliche Informationen im Bedarfsfall in die Regelschreibweise integriert. Dabei steht die Raute ‘#’ für eine schwache Wortgrenze wie etwa zwischen Artikel und Substantiv (z. B. la # manzana); die doppelte Raute ‘##’ zeigt eine starke Wortgrenze an, das Pluszeichen ‘+’ eine Morphemgrenze (z. B. com+e ## manzana+s). Silbengrenzen werden i. d. R. durch ‘] σ ’ (am Ende der Silbe) oder ‘ σ [’ (am Anfang der Silbe) markiert. Im Folgenden stellen wir mit der Auslautverhärtung zunächst einen phonologischen Prozess dar, der neben dem Deutschen auch das Katalanische betrifft, bevor wir einige typische Prozesse des Spanischen in Form von generativen Regeln erfassen. Für das Deutsche gilt, dass Obstruenten (d. h. Plosive und Frikative) im Silbenauslaut grundsätzlich stimmlos sind: Während das [d] in Kinder [ ˈ kın.dɐ] und kindisch [ ˈ kın.dıʃ] stimmhaft ([+sth]) ist, wird das entsprechende Segment in Kind [kınt] und kindlich 150 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="151"?> 42 Die Orthographie des Deutschen bleibt unabhängig von der stimmlosen bzw. stimmhaften Realisie‐ rung konsistent, d. h., man notiert z. B. immer <d>, auch wenn ein stimmloses [t] produziert wird, während die stärker an der lautlichen Oberfläche orientierte Schreibung des Katalanischen das Resul‐ tat des Entstimmungsprozesses meistens notiert (vgl. Meisenburg 2009). Auch die Auslautverhärtung der türkischen Verschlusslaute wird oft in der Schrift reflektiert, z. B. kitaplar [kıtap.lar] ‘Buch’ vs. kitabım [kıta.bɯm] ‘mein Buch’ (vgl. Kornfilt 1997: 491f. sowie Özaslan & Gabriel 2019: 183f.). 43 Anders als bei imposible wird die Assimilation des Nasalkonsonanten im Fall von inflexible und incapaz nicht graphisch notiert. [ ˈ kınt.lıç] stimmlos realisiert. Ein Kontrast von stimmlosen vs. stimmhaften Segmenten ist in dieser Position also ausgeschlossen, d. h., es existiert kein Minimalpaar aus zwei Wörtern, die auf [d] vs. [t] auslauten. Trotzdem sind / d/ und / t/ Phoneme des Deutschen, da sich ein entsprechender Kontrast in anderen Positionen feststellen lässt, so etwa im Anlaut der Wörter Dorf / d/ vs. Torf / t/ ). Im Fall der identisch als [ʁaːt] ausgesprochenen Wörter Rad und Rat wird der zugrundeliegende Kontrast hörbar, wenn man ein Suffix wie etwa die Genitivendung -es anfügt: Rades [ ˈ ʁaː.dəs] vs. Rates [ ˈ ʁaː.təs]. Die Neutralisierung (vgl. 3.1.1) des Merkmals [±sth] zeigt sich auch in Ausdrücken wie ein braves [ ˈ bʁaː.vəs] Kind vs. das Kind ist brav [bʁaːf], in Verbformen wie (er) las [laːs] vs. (sie) lasen [ ˈ laː.zən] oder im katalanischen Adjektiv ‘stumm’, das in der maskulinen Form mut [mut], in der längeren femininen Form jedoch muda [ ˈ mu.ðə] lautet. 42 Dies kann man erfassen, indem man für die phonologisch zugrundeliegenden Formen jeweils das stimmhafte Segment ansetzt (z. B. kat. / mud/ , / muda/ ) und eine Entstimmungs- oder Desonorisierungsregel formuliert, die je nach Position des Segments in der Silbe die korrekte Oberflächenform herleitet: Auslautverhärtung [-son] → [-sth] / __] σ Obstruenten werden im Silbenauslaut stimmlos realisiert. Auch Assimilationsprozesse wie die Anpassung des Artikulationsorts eines Nasal‐ konsonanten an das nachfolgende Lautsegment, die sowohl im Deutschen als auch im Spanischen (vgl. 2.5.1.3) und darüber hinaus in einer Vielzahl weiterer Sprachen regelmäßig auftreten, lassen sich mithilfe der generativen Regelschreibweise erfas‐ sen. So wird das Negationsmorphem inwie in sp. intolerable ‘unerträglich’ oder inaceptable ‘unannehmbar’ vor bilabialen Konsonanten mit ebenfalls bilabialem Nasal realisiert ([im]posible ‘unmöglich’); in gleicher Weise erfolgt die Anpassung des Nasals vor labiodentalen und velaren Konsonanten wie in sp. [iɱ]flexible ‘unbiegsam’ bzw. [iŋ]capaz ‘unfähig’. 43 Dasselbe geschieht auch über Wortgrenzen hinweg wie z. B. in en Pamplona, wo die Präposition mit bilabialem Nasal, also als [em] realisiert wird (vgl. dagegen [en] Neuquén). Im klassischen generativen Rahmen wurden hierfür komplexe Regeln postuliert, die die unterschiedlichen Artikulationsorte des potentiell auf den betreffenden Nasal folgenden Konsonanten einzeln auflisten (z. B. dental, koronal etc.; vgl. Kubarth 2009: 139). Dies rührt daher, dass in SPE phonologische Merkmale isoliert betrachtet, nicht jedoch zu Klassen oder Inventaren von Merkmalen zusammen‐ 3.2 Klassische generative Phonologie 151 <?page no="152"?> gefasst wurden, wie dies etwa in der später entstandenen Merkmalsgeometrie der Fall ist (vgl. 3.3). Hält man sich jedoch vor Augen, dass es bei der Nasalassimilation stets um die Anpassung des Nasals an den Artikulationsort des nachfolgenden Konsonanten geht, lässt sich dies in Form einer generativen Regel wie folgt zusammenfassend darstellen (vgl. D’Introno et al. 1995: 344f.). Der griechische Buchstabe α besagt dabei, dass die Merkmalswerte ‘+’ oder ‘-’ bzw. bei einstelligen Merkmalen das Merkmal selbst jeweils identisch sein müssen; ORT fasst alle potentiell möglichen Ortsmerkmale (vgl. 3.1.1) zusammen: Hat der nachfolgende Konsonant bspw. das Merkmal [ LAB ] (wie in posible), muss der Nasalkonsonant auch den Wert [ LAB ] aufweisen (wie in im-). Die Raute gibt an, dass der Prozess, wie z. B. in en # Pamplona [empam ˈ plona], auch über eine schwache Wortgrenze hinweg erfolgt. Nasalassimilation Nasale passen sich in Bezug auf ihr Ortsmerkmal an den folgenden Konsonanten an. In 3.1.1 haben wir die Realisierung intervokalischer Verschlusslaute als Frikativappro‐ ximanten als eine Form von Assimilation im weiteren Sinne charakterisiert, denn in Fällen wie lado ‘Seite’ [ ˈ laðo] wird ein einzelnes Lautsegment (hier: der stimmhafte Plosiv / d/ zwischen zwei Vokalen) durch stärkere artikulatorische Öffnung an seine vokalische Umgebung angepasst. Auch diesen meist als Spirantisierung (sp. espiran‐ tización) bezeichneten Prozess kann man mithilfe der eingeführten Regelnotation darstellen. Wir haben in 2.5.1.1 gesehen, dass die stimmhaften Plosive, die wir durch die Merkmale [-son] (für Obstruenten), [-kont] (wegen des mittigen Verschlusses im Ansatzrohr) und [+sth] erfassen können, nur dann nicht zu Frikativapproximanten werden, wenn der vorangehende Laut ein Nasal ist. Um für die Spirantisierung, die in der Umkehrung des Vorzeichens von [-kont] zu [+kont] besteht, den Kontext zu spezifizieren, reicht also das Merkmal [-nas] aus. 152 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="153"?> 44 Kubarths (2009: 134f.) Vorschlag, den Kontext für die Spirantisierung statt als [-nas] als [+kont] zu fassen, um Nasale und Laterale als Laute mit einem mediosagittalen Verschluss auszuschließen (wobei [+lat] als Bedingung für die nicht koronalen Plosive gesondert eingebracht werden muss), ist insofern problematisch, als der Tap / ɾ/ auch als [-kont] zu charakterisieren ist (vgl. Hall 2 2011: 108, NGRAE 2011: 248), nach dem Tap aber systematisch Spirantisierung erfolgt (árbol [ ˈ aɾβol] ‘Baum’, cuerda [ ˈ kweɾða] ‘Strick’, largo [ ˈ laɾɣo] ‘reichlich; lang(e)’). Spirantisierung Stimmhafte Plosive werden nach allen Lauten außer nach Nasalen spirantisiert. Die Sache hat jedoch einen Haken, und unsere Regel greift zu weit, denn wie wir ebenfalls in 2.5.1.1 gesehen haben, verhalten sich die drei stimmhaften Verschluss‐ laute / b d ɡ/ insofern unterschiedlich, als zwar / b/ und / ɡ/ auch nach dem Lateral / l/ spirantisiert werden (el vaso [el ˈ βaso] ‘das Glas’, el gato [el ˈ ɣato] ‘die Katze’), / d/ jedoch nicht (el disco [el ˈ disko] ‘die Scheibe’). Phonetisch lässt sich das dadurch erklären, dass der Verschluss für [d] durch das homorgane [l] bereits gebildet ist und nur noch gelöst werden muss, was weniger Aufwand bedeutet als hier einen Frikativapproximanten zu realisieren. Da aber in unserer Regel / l/ durch das Merkmal [-nas] ebenfalls erfasst wird, treffen wir für den koronalen Plosiv / d/ eine falsche Vorhersage. Die Frage, wie dieser Prozess in einer einzigen Regel exakt formuliert werden könnte, muss hier offenbleiben, da sich mithilfe der oben angeführten Merkmale keine Möglichkeit einer entsprechenden Gruppierung abzeichnet. 44 Bereits in den 1970er Jahren wurde die generative Phonologie in der hier dargestell‐ ten Form kritisiert. So haben beispielsweise Donegan & Stampe (1979) im Rahmen der sog. Natürlichen Phonologie für eine Unterscheidung zwischen (übereinzelsprach‐ lich gültigen) Prozessen und (sprachspezifischen) Regeln plädiert. Zu ersteren zähle etwa die Nasalassimilation, die über unterschiedlichste Sprachen hinweg generell auftrete; zu den letzteren wird die Spirantisierung gerechnet, die u. a. für das Spanische spezifisch ist, im Französischen oder Italienischen jedoch nicht vorkommt. Wenn man beide Typen von Oberflächenalternanzen mit ein und demselben Regelformat erfasse, könne man nach Donegan & Stampe (1979) dem Unterschied zwischen beiden nicht gerecht werden (vgl. auch Kubarth 2009: 138f.). Fraglich ist allerdings, ob die hier vorgestellte strikte Trennung zwischen Prozessen und Regeln überhaupt möglich und sinnvoll ist: So lässt sich die Anpassung von Nasalen an ihre segmentale Umgebung als 3.2 Klassische generative Phonologie 153 <?page no="154"?> 45 Der Ortsknoten (engl. place node) wird oft auch mit dem Kürzel PA bezeichnet, was für engl. place of articulation (bzw. sp. punto de articulación) steht. In der NGRAE (2011: 10) wird dafür sp. zona de articulación bzw. ZA benutzt. ein Koartikulationsphänomen verstehen, das übereinzelsprachlich auftritt. Ob und bis zu welchem Grade es allerdings phonologisiert wird (also in allen Kontexten systema‐ tisch und regelhaft auftritt) und wie im Spanischen in die Normlautung Eingang findet (e[mp]amplona, i[mb]estigación ‘Forschung’), ist wiederum eine andere Frage. Im Deut‐ schen, wo die Nasale / m/ und / n/ auch vor bilabialen Plosiven kontrastieren können (Unbilden [ ˈ ʊnbɪldn̩] vs. umbilden [ ˈ ʊmbɪldn̩]), ist ihre koartikulatorische Anpassung an den Folgekonsonanten eher ein Phänomen von nachlässiger Aussprache bei schnellem Sprechen (z. B. Unbilden [ ˈ ʊmbɪldn̩]). Davon unberührt war das Hauptanliegen der Natürlichen Phonologie, möglichst oberflächennahe phonologische Repräsentationen zu erstellen, um auf diese Weise die Vermittlung zwischen zugrundeliegender Struktur und phonetischer Realisierung nachvollziehbarer zu gestalten (vgl. auch Hurch & Rhodes 1996). 3.3 Merkmalsgeometrie und Autosegmentale Phonologie Grundlegende Idee der im Wesentlichen von Clements (1985) entwickelten Merk‐ malsgeometrie (sp. geometría de los rasgos) ist, dass phonologische Merkmale nicht voneinander unabhängig in einem Bündel zusammengefasst sind, sondern dass sie hierarchisch organisiert miteinander interagieren. Abb. 3.3-1 repräsentiert die ange‐ nommene Hierarchie in Form eines Merkmalsbaums. Abb. 3.3-1: Modell der Merkmalsgeometrie nach Hall ( 2 2011: 192). Der die gesamte Baumstruktur dominierende Wurzelknoten enthält die Oberklassen‐ merkmale [±kons], [±son] und [±appr] (vgl. 3.1.1) und dominiert den sog. Ortsknoten [ORT]. 45 Dieser steht wiederum in der Hierarchie über den Artikulatorknoten, die den vier Artikulatoren ‘labial’ (mit einer oder beiden Lippen), ‘koronal’ (mit der Zungenspitze oder dem Zungenblatt), ‘dorsal’ (mit dem Dorsum oder Zungenrücken) 154 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="155"?> 46 Die Darstellung in Abb. 3.3-1 enthält nicht alle Merkmale, die zur vollständigen Charakterisierung einzelner Segmente vonnöten sind, so etwa die Merkmale für Stimmhaftigkeit [±sth] und Aspiriert‐ heit [±asp]. Diese werden im merkmalsgeometrischen Rahmen i. d. R. unterhalb des sog. Laryngal‐ knotens [LARYNGAL] angesetzt, der sich hierarchisch auf gleicher Ebene wie der Ortsknoten befindet (vgl. Hall 2 2011: 196ff. und Abb. 3.3-6). und ‘radikal’ (mit der Zungenwurzel, vgl. lat. radix ‘Wurzel’) entsprechen. Eine weitere Spezifizierung ergibt sich durch die von den Artikulatorknoten dominierten binären Ortsmerkmale. Die hierarchische Struktur macht dabei deutlich, dass diese jeweils nur auf das ihnen übergeordnete Merkmal und damit auf eine bestimmte Klasse von Lauten zutreffen: So können nur labiale Laute gerundet oder ungerundet sein ([±rnd]), und nur auf koronal gebildete Laute treffen die Merkmale [±ant] (Hindernis im vorderen Teil des Ansatzrohrs) und [±apik] (Artikulation mit der Zungenspitze) zu. Die artiku‐ latorischen Merkmale [±hoch], [±tief] und [±hint] beziehen sich schließlich allein auf dorsale Laute, während die Zungenwurzel als Artikulator mit der pharyngalen Artikulationsstelle gleichzusetzen ist. 46 Betrachten wir nun anhand von / n/ und / p/ , wie sich einzelne Lautsegmente in Form von Merkmalsbäumen darstellen lassen. Abb. 3.3-2: Darstellung von / n/ und / p/ in Form von Merkmalsbäumen. Der Prozess der Nasalassimilation, den wir in 3.2 mithilfe einer generativen Regel beschrieben haben, lässt sich im merkmalsgeometrischen Rahmen erfassen, indem man annimmt, dass sich die Ortsmerkmale des zweiten Segments auf das vorangehende ausbreiten. Anhand des Beispiels en Pamplona [empam ˈ plona] kann man sich dies so vorstellen, dass sich die Ortsmerkmale von / p/ auf den vorausgehenden Nasalkonso‐ nanten / n/ ausbreiten und diese sozusagen überschreiben. Wie in Abb. 3.3-3 skizziert, wird hierzu angenommen, dass bei / n/ die Verbindung zum Ortsknoten (links) ‘ge‐ kappt’ wird und stattdessen eine neue Assoziationslinie zum Ortsknoten von / p/ entsteht (Mitte). Der Ortsknoten von / n/ wird getilgt; Resultat ist die phonetische Realisierung von en als [em] (rechts). Man spricht hier auch von Merkmalsausbreitung (engl. feature spreading). Zur Vereinfachung verzichten wir auf die Darstellung der spezifischen Ortsmerkmale unterhalb des Artikulatorknotens. 3.3 Merkmalsgeometrie und Autosegmentale Phonologie 155 <?page no="156"?> Abb. 3.3-3: Merkmalsgeometrische Darstellung der Nasalassimilation anhand von e[m] Pamplona. Das Anliegen der Merkmalsgeometrie, subsegmentale Phänomene ohne strikte Anbin‐ dung an die Segmente zu erfassen, lässt sich problemlos mit der bereits Ende der 1970er Jahre entstandenen und kontinuierlich weiterentwickelten Autosegmentalen Phonologie verbinden. Die Grundidee dieses von Goldsmith (1979) erarbeiteten Ansatzes besteht darin, dass über der segmentalen eine weitere Ebene angenommen wird. Diese wurde zunächst mit Blick auf suprasegmentale Eigenschaften (vgl. 1.3 sowie ausführlich Kap. 4) entwickelt, um zu erfassen, welche Prozesse in Tonsprachen ablaufen, die lexikalische Bedeutungskontraste mithilfe von Tonhöhenbewegungen (Verlauf der Grundfrequenz, F 0 ) ausdrücken können. Ein bekanntes Beispiel für eine Tonsprache ist neben zahlreichen afrikanischen Sprachen, anhand derer Goldsmith vornehmlich argumentiert, das Mandarin-Chinesische, auf das wir in 4.5.1 noch genauer eingehen. Es soll uns auch hier zum besseren Verständnis des autosegmentalen Modells dienen: Wenn man im Mandarin-Chinesischen die Segmentabfolge [ma] mit einer hohen F 0 -Kontur produziert (1. Ton), bedeutet das Wort mā 妈 ‘Mutter’. Ist die Tonkontur hingegen steigend (2. Ton), resultiert die Bedeutung ‘Hanf ’ (má 麻 ). Im Rahmen der autosegmentalen Phonologie symbolisiert man die lexikalischen Töne durch Großbuchstaben H (engl. high) bzw. L (engl. low), woraus sich für die beiden genannten Töne die Repräsentationen H (1. Ton, hoch) bzw. LH (2. Ton, steigend) ergeben. Da lexikalische Töne nicht in einem Eins-zu-eins-Verhältnis an einzelne Segmente gebunden sind, sondern wie im Fall von má 麻 mehrere tonale Elemente, nämlich L und H, mit einer einzigen tontragenden Einheit (engl. tone bearing unit) verbunden sein können, werden sie als sog. Autosegmente auf einer gesonderten Ebene (Tonschicht) repräsentiert, vgl. Abb. 3.3-4. 156 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="157"?> Abb. 3.3-4: Repräsentation lexikalischer Töne im autosegmentalen Modell. Die Assoziation zwischen der Ebene der tontragenden Einheiten (hier jeweils die Silbe [ma]) mit den auf der Tonschicht repräsentierten Merkmalen impliziert notwen‐ digerweise eine zeitliche Dimension: So ist etwa bei má die Abfolge aus Tief- und Hochton (LH) vorgegeben, woraus sich eine steigende F 0 -Kontur ergibt. Die Annahme einer von der Segmentebene unabhängigen Zeit- oder Skelettschicht, verstanden als Abfolge diskreter Zeiteinheiten, die mit den Symbolen C (Konsonant) und V (Vokal) oder mithilfe abstrakter X-Positionen repräsentiert werden kann, ermöglicht die Darstellung unterschiedlicher Assoziationsbeziehungen zwischen den Ebenen. So lassen sich Diphthonge wie in sp. bueno (vgl. 2.5.3.2, 3.1.2) als Zuordnung zweier vokalischer Segmente / u/ und / e/ zu ein und derselben X- (bzw. V-)Position interpre‐ tieren; phonetisch realisiert wird dann die Abfolge von Gleitlaut und Vokal [we]. Ebenso lassen sich phonologisch zusammengehörende komplexe Elemente wie die spanische Affrikate / ʧ/ (vgl. 2.5.1.2, 3.1.2) als mit einer einzigen Position assoziiert darstellen. Auch kann umgekehrt die Zuordnung zweier Positionen der Zeitschicht zu ein und demselben Segment sinnvoll sein, z. B. dann, wenn wie im kanarischen Spanisch kompensatorische Längungseffekte auftreten: Wie in 2.5.1.2 gezeigt, wird bei der Abfolge / sb/ wie in las velas ‘die Kerzen’ in dieser Varietät das / s/ getilgt und stattdessen ein gelängtes [b] realisiert, d. h. [la ˈ bːela] (statt [laz ˈ βelas]). Abb. 3.3-5 gibt die Repräsentationen für den Diphthong, die Affrikate und das gelängte / b/ . Abb. 3.3-5: Diphthong / ue/ , Affrikate / tʃ/ und gelängtes / b/ im autosegmentalen Modell. Ein klarer Vorteil des multilinearen Ansatzes besteht darin, dass sich Fälle von Merk‐ malsausbreitung, wie sie bei der Nasalassimilation oder bei der kompensatorischen Längung auftreten, mithilfe der Zeitschicht plausibel darstellen lassen. In Abb. 3.3-6 skizzieren wir die Analyse der kompensatorischen Längung in las velas [la ˈ bːela] im autosegmentalen Rahmen. 3.3 Merkmalsgeometrie und Autosegmentale Phonologie 157 <?page no="158"?> 47 Die optimalitätstheoretische Verwendung des Begriffs entspricht nicht dem Input-Begriff, wie er aus der Spracherwerbsforschung bekannt ist. Dort meint man damit die sprachlichen Daten, mit denen Kinder beim L1-Erwerb konfrontiert werden; hier bezieht er sich auf die zugrundeliegenden Repräsentationen. Abb. 3.3-6: / s/ -Ausfall und kompensatorische Längung in las velas [la ˈ bːela] (kanarisches Spanisch). Nach dem Ausfall des / s/ im Auslaut des Artikels las und des Nomens velas (dargestellt mittels Durchstreichung der Verbindungslinie zur Zeitschicht) assoziiert die segmental nicht mehr gefüllte C-Position (auch engl. slot) mit dem benachbarten Merkmalsbündel (/ b/ ). Dieses breitet sich folglich über zwei C-slots aus (angezeigt durch die gestrichelte Assoziationslinie im grau hinterlegten Kasten). Resultat ist die Längung des Verschluss‐ lauts [bː] auf der Ebene der phonetischen Realisierung (grau umrahmt). 3.4 Optimalitätstheorie Mit der Optimalitätstheorie (OT, engl. optimality theory, sp. teoría de la optimidad) kam zu Beginn der 1990er Jahre ein Ansatz auf, der in Abkehr von der modularen Konzeption des sprachlichen Wissens von einer engen Verzahnung der grammatischen Komponenten (Phonologie, Morphologie, Syntax etc.) ausgeht. Das Initialwerk von Alan Prince und Peter Smolensky Optimality theory. Constraint interaction in generative grammar zirkulierte seit 1993 als sog. ‘graue’ Literatur und wurde erst 2004 in Buch‐ form publiziert (Prince & Smolensky 2004). Anders als in den bisher besprochenen Ansätzen wird in der OT die Vermittlung zwischen zugrundeliegenden phonologischen Repräsentationen und den entsprechenden phonetischen Oberflächenrealisierungen nicht durch Regeln, sondern mithilfe von Beschränkungen, den sog. Constraints (sp. restricciones), erfasst. Es wird angenommen, dass eine Generatorfunktion (GEN) ein Set von potentiell möglichen Outputformen zu einer als Input 47 bezeichneten zugrundeliegenden Form erzeugt und dass im Rahmen einer Evaluation (EVAL) aus 158 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="159"?> diesen Kandidaten die beste (= ‘optimale’) Form ausgewählt wird. Man nimmt an, dass die Constraints, die den Auswahlprozess steuern, übereinzelsprachlich gültig sind und in ihrer hierarchischen Anordnung wie ein Filter wirken. Der Unterschied zwischen Sprachen bzw. Varietäten manifestiert sich allein im jeweiligen Aufbau dieser Constrainthierarchie; einzelsprachliche Grammatiken werden folglich als Beschränkungshierarchien verstanden. Der optimale Kandidat ist derjenige, der als letzter eine der Beschränkungen verletzt und somit in der Evaluation ‘am weitesten kommt’. Grundsätzlich unterscheidet man zwischen unterschiedlichen Arten von Constraints: Eine erste Gruppe, die sog. Treueconstraints (engl. faithfulness constraints, sp. restricciones de fidelidad), sorgt dafür, dass der Abstand zwischen Input- und Outputform möglichst gering bleibt. Hierzu zählt z. B. der Constraint M AX -IO (engl. maximal representation of input segments in the output); er besagt, dass keine als zugrun‐ deliegend angenommenen Segmente weggelassen werden dürfen. Die Beschränkung D E P -IO (engl. dependency between input and output) verbietet umgekehrt das Hinzu‐ fügen zusätzlicher Segmente. Häufig verwendet wird auch der Constraint I D E NT (F), demzufolge die im Input enthaltenen Merkmale in der Outputform nicht verändert sein dürfen. Es ist offensichtlich, dass phonologische Prozesse gegen Treueconstraints verstoßen. So verletzen beispielsweise Assimilationen die Beschränkung I D E NT (F): Auch wenn weder Segmente hinzugefügt noch weggelassen werden, ergeben sich so doch Merkmalsdiskrepanzen zwischen zugrundeliegender phonologischer Form (Input) und phonetischer Oberflächenrealisierung (Output). Eine zweite Gruppe von Beschränkungen stellen die sog. Markiertheitsconstraints (engl. markedness constraints, sp. restricciones de marcación) dar. Diese sorgen für unmarkierte Strukturen, d. h. für solche, die in den Sprachen der Welt häufig auftreten und deswegen als ‘normal’ oder ‘natürlich’ angesehen werden (vgl. 3.1.1). Weit verbreitete Markiertheitsbeschränkungen betreffen die Struktur der Silbe (vgl. 4.2) und verbieten beispielsweise Silben ohne Onset (Anfangsrand) oder solche, die eine Coda (auch: Endrand, also mindestens ein silbenschließendes Segment) aufweisen. Die entsprechenden Beschränkungen O N S E T und N O C ODA werden von einer Form wie dt. oft [ɔft] offensichtlich verletzt. Eine dritte Art von Constraints bezieht sich auf die Übereinstimmung (engl. alignment) zwischen verschiedenen sprachlichen Ebenen. Einer dieser sog. Align‐ mentconstraints (sp. restricciones de alineamiento) betrifft die Übereinstimmung zwischen Wort- und Silbenanfang (A LI G N -L E F T ) − eine Beschränkung, die etwa durch Resyllabierung verletzt wird (4.2.5). Als solche bezeichnet man Umordnungen in der Silbenstruktur, durch die ein wortfinaler Codakonsonant in den Anfangsrand des nachfolgenden, vokalisch anlautenden Worts gerät: So entsprechen in dem Satz Vienen estudiantes [ ˈ bje.ne.nǀes.tu. ˈ ðjan.tes] ‘Es kommen Studierende’ die in der phonetischen Umschrift mit Punkten markierten Silbengrenzen nicht der Wortgrenze zwischen dem Verb und dem postverbalen Subjekt (angezeigt durch den senkrechten Strich). Offensichtlicher Nachteil der Resyllabierung ist, dass Wortanfänge durch andere An‐ 3.4 Optimalitätstheorie 159 <?page no="160"?> lautkonsonanten ‘maskiert’ werden und die Grenzen zwischen den einzelnen Wörtern in der Redekette somit schwerer auszumachen sind. Vorteilhaft ist hingegen, dass auf diese Weise unmarkierte Silbenstrukturen entstehen, d. h. solche, die einen Anfangsrand aufweisen und damit nicht gegen die Beschränkung O N S E T verstoßen. Im Rahmen der OT lassen sich solche unterschiedlichen Präferenzen mithilfe einer Beschränkungshierarchie ausdrücken, in der die Constraints nach ihrer (einzelsprach‐ lichen) Relevanz geordnet werden. Im Falle der spanischen Resyllabierung muss der Constraint O N S E T höher eingestuft werden als die Beschränkung A LI G N -L E F T ; er dominiert diese also, was durch das Zeichen ‘»’ ausgedrückt wird: O N S E T » A LIG N -L E F T . Abb. 3.4-1 gibt eine schematische Darstellung des optimalitätstheoretischen Modells. Abb. 3.4-1: Das optimalitätstheoretische Modell (C = Constraint). Evaluationsprozesse werden in Form von Tableaus dargestellt, wobei in der linken Spalte die Outputformen und in der obersten Tabellenzeile rechts die Constraints stehen. Diese sind von links nach rechts in absteigender Hierarchie angeordnet, sodass die Kandidaten bei der Evaluation zuerst die höherrangigen Constraints passieren müssen. Verletzt ein Kandidat eine Beschränkung, wird dies durch einen Stern (*) markiert; eine fatale Verletzung, die zum Ausschluss des Kandidaten führt, erhält zusätzlich ein Ausrufezeichen (*! ). Nach einer fatalen Verletzung erscheinen die restlichen Tabellenzellen des Kandidaten grau schattiert, um anzuzeigen, dass weitere Constraintverletzungen keinen Einfluss mehr auf das Ergebnis der Evaluation haben. Der ‘Sieger’ des Auswahlprozesses, d. h. der optimale Kandidat, wird durch eine Hand mit ausgestrecktem Zeigefinger markiert; vgl. Abb. 3.4-2. Im Folgenden verdeutlichen wir das Funktionieren der OT anhand der Nasalassi‐ milation, die wir bereits aus strukturalistischer, prozessphonologischer und autoseg‐ mentaler Perspektive dargestellt haben (vgl. 3.1, 3.2, 3.3). Hierzu benötigen wir zunächst die folgenden Beschränkungen, die wir in leicht modifizierter Form von Colina (2009: 34f.) übernehmen: • I D E N T (place) Im Input enthaltene Ortsmerkmale entsprechen den im Output enthaltenen. • C O D A C O N D Eine Coda lizenziert keine Ortsmerkmale. Die erste Beschränkung stellt einen typischen Treueconstraint dar, der sich allge‐ mein auf Ortsmerkmale bezieht. Der Markiertheitsconstraint C ODA C OND (engl. coda 160 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="161"?> 48 Auf die diesbezügliche Ausnahme des yukatekischen Spanisch, wo bei wortfinalen Nasalen nicht das Merkmal [ K O R ], sondern das Merkmal [ L A B ] (‘labial’) generalisiert ist, haben wir in 2.5.1.3 hingewiesen. Auch hier erfolgt also eine Neutralisierung des Ortsmerkmals. condition) erfasst die Tatsache, dass in den Sprachen der Welt Codakonsonanten tendenziell keine eigenen Ortsmerkmale aufweisen, d. h. keine solchen ‘lizenzieren’. Damit ist gemeint, dass Segmente, die in der Coda auftreten, nicht über eine ‘Lizenz’ verfügen, hinsichtlich ihrer Ortsmerkmale spezifiziert zu sein. Dies gilt auch für das Spanische, wo z. B. Nasale entweder koronal sind (Generalisierung des Merkmals [ KO R ] im absoluten Auslaut, vgl. sin [sin] ‘ohne’ oder álbum [ ˈ alβun] ‘Album’) 48 oder an den Nachfolgekonsonanten assimiliert werden. Damit sind in der spanischen Coda keine phonologischen Kontraste möglich, die auf unterschiedlichen Artikulationsorten beruhen, wie etwas im deutschen Minimalpaar [kam] Kamm vs. [kan] kann. Das Tableau in Abb. 3.4-2 stellt die Evaluation dreier möglicher Outputformen für die zugrundeliegende Form / tanɡo/ dar. - - / ˈ tanɡo/ C O D A C O N D I D E N T (place) (1) [ ˈ taŋɡo] - * (2) - [ ˈ tanɡo] *! - (3) - [ ˈ tamɡo] *! * Abb. 3.4-2: OT-Tableau zur Nasalassimilation in / ˈ tanɡo/ [ ˈ taŋɡo] (nach Colina 2009: 35). Die Kandidaten (2) [ ˈ tanɡo] und (3) [ ˈ tamɡo] verletzen aufgrund ihrer ‘eigenen’ Ortsmerkmale die Beschränkung C ODA C OND und sind damit aus dem Rennen; es verbleibt die Form [taŋɡo] (Kandidat 1), die Nasalassimilation aufweist und damit nur gegen den hierarchisch tief angesiedelten Constraint I D E NT (place) verstößt. Diese Beschränkung wird zwar auch von Kandidat (3) verletzt, doch ist dieser aufgrund seiner fatalen Verletzung von C ODA C OND kein Konkurrent mehr. In den Kapiteln zur Silben‐ phonologie (4.2) und Intonation (4.5) werden wir weitere Anwendungsbereiche der OT vorstellen. Weitere optimalitätstheoretische Analysen zur spanischen Phonologie bietet der Sammelband von Martínez-Gil & Colina (2006). 3.5 Exemplartheorie Als ein Gegenmodell zu den bisher behandelten Ansätzen, die auf strukturalistischer bzw. generativer Theoriebildung beruhen, lässt sich die sog. Exemplartheorie (engl. exemplar theory, sp. teoría de los ejemplares) auffassen, die v. a. von Bybee (2001, 2006) und Pierrehumbert (2001) in die phonologische Diskussion eingebracht wurde (für eine zusammenfassende Darstellung vgl. Pustka 2021: 81-84). Die Exemplartheorie lässt sich im Bereich der kognitiven Linguistik verorten. Ihr Interesse ist weniger auf die 3.5 Exemplartheorie 161 <?page no="162"?> 49 In 4.5.4.2 und 5.1.7 gehen wir genauer auf den migrationsbedingten Kontakt zwischen Spanisch und Italienisch in Argentinien ein. Boomershine (2006) befasst sich − ebenfalls im Rahmen der Exemplartheorie − mit der regionalen Aussprache in Puerto Rico und Mexiko und diskutiert dabei auch die aspiración. (abstrakte) Modellierung des sprachlichen Wissens (d. h. der langue bzw. Kompetenz) ausgerichtet, sondern sie setzt die sprachlichen Strukturen in unmittelbare Beziehung zum Sprachgebrauch, den sie folglich auf der Basis umfangreicher Datenkorpora zu rekonstruieren sucht. Grundlegende Idee der Exemplartheorie ist, dass die Repräsen‐ tation eines Ausdrucks im sprachlichen Wissen eines Sprechers in stetiger Interaktion mit den gegebenenfalls stark variierenden Realisierungen steht, mit denen der Sprecher als Hörer tagtäglich konfrontiert wird. Dazu muss man sich vorstellen, dass jede wahrgenommene Realisierung eines Worts (sog. token) auf seine Repräsentation einwirkt und diese beständig verändern kann. Phonologische Formen werden nicht als abstrakte Entitäten verstanden, sondern als Cluster von sog. Exemplaren, die um einen Prototypen herum organisiert sind. Wenn die konkret produzierten Ent‐ sprechungen solcher Exemplare im Sprachgebrauch häufiger vorkommen, gewinnen diese an lexikalischer Stärke; wird umgekehrt eine Realisierungsform immer seltener gebraucht (abnehmende token-Frequenz), rückt auch das ihm entsprechende Exemplar im mentalen Lexikon weiter an die Peripherie und verschwindet gegebenenfalls ganz. Wir verdeutlichen uns die exemplartheoretische Herangehensweise anhand der sog. aspiración, d. h. der Realisierung von / s/ in der Codaposition als glottaler Frikativ [h] (2.5.1.2). Im Spanischen von Buenos Aires ist die [h]-Realisierung insbesondere wortintern vor stimmlosen Verschlusslauten wie in mosca [ ˈ mɔhka] ‘Fliege’ so stark verbreitet, dass dies als die unmarkierte Form gelten kann (ca. 80 %; vgl. Hualde 2005: 162); daneben werden zu 12 % Formen des Typs [ ˈ mɔska] produziert; in 8 % der Fälle schließlich fällt der Frikativ völlig aus (Typ: [ ˈ mɔka]). Man kann davon ausgehen, dass die aspiración in früheren Phasen des argentinischen Spanisch deutlich weniger verbreitet war als heute. Interessant ist, dass gerade Angehörige der sozial höher gestellten Schichten die aspiración vermutlich mehr oder weniger bewusst eingesetzt haben, um sich gegen die [s]-Aussprache der italienischen Einwanderer abzugrenzen. Da in italienischen Varietäten kein der spanischen aspiración vergleichbares Phänomen auftritt, produzierten die Einwanderer in ihrem Lernerspanisch konsequent Formen wie [ ˈ mɔska] mosca, [ ˈ pasta] pasta, [ ˈ kɔsta] costa etc. − was der damaligen zielsprachli‐ chen Normlautung entsprach. Heutzutage ist die [s]-Aussprache in präkonsonantischer Position marginal (vgl. die oben genannten Zahlen); wenn sie auftritt, gilt sie als sozial niedrig markiert (vgl. Pešková et al. 2012b: 367). 49 Die folgende, an Pustka (2021: 83) orientierte Abbildung stellt dar, wie sich der Wandel der Vorkommensfrequenzen von [ ˈ mɔska] und [ ˈ mɔhka] auf die Repräsentation des Worts mosca auswirkt. 162 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="163"?> Abb. 3.5-1: Sprachgebrauch und Repräsentation in der Exemplartheorie am Beispiel von mosca. Solange im Sprachgebrauch (fast) ausschließlich die Realisierung [ ˈ mɔska] auftritt, bleibt die Repräsentation / ˈ moska/ erhalten (Etappe 1). Verwenden einzelne Sprecher zunehmend die aspirierte Form [ ˈ mɔhka], erhält die Repräsentation von mosca einen weiteren Prototypen, nämlich / ˈ mohka/ ; Resultat ist dann / ˈ moska ~ ˈ mohka/ (Etappe 2). Die konkurrierenden Einzelformen können unterschiedlich gewichtet sein: Während in Etappe 2 / ˈ moska/ die maßgebliche Form ist, wird sie in Etappe 3 aufgrund der Zunahme von [ ˈ mɔhka]-Realisierungen im Sprachgebrauch marginalisiert. Übungsaufgaben 1. Überprüfen Sie anhand von Minimalpaaren, welchem Phonem oder welchen Phonemen [s] und [z] im Spanischen und im Deutschen zuzuschlagen sind. Testen Sie Ihre Analyse an verschiedenen Positionen im Wort und begründen Sie Ihre Antwort ausführlich anhand von schlagkräftigen Beispielen aus beiden Sprachen. 2. Diskutieren Sie, warum [s] und [h] ähnlich genug sind, um im Spanischen als Allophone eines Phonems gelten zu können. Lassen sich auch [x] und [h] als Allophone eines Phonems klassifizieren? Welches Phonem wäre dies? Handelt es sich um freie oder kontextbedingte Variation? Erläutern Sie Ihre Antworten anhand von Beispielen. 3. Ermitteln Sie systematische Unterschiede in der Phonotaktik des Spanischen und des Deutschen. 4. Finden Sie heraus, ob es Sprachen gibt, in denen Silben mit der Abfolge Liquid-Plo‐ siv beginnen können, und stellen Sie das Ergebnis Ihrer Suche anhand von Beispielen vor. 3.5 Exemplartheorie 163 <?page no="164"?> 5. Nennen Sie die Allophone von / b/ im Spanischen und begründen Sie, warum die Benutzung unterschiedlicher Allophone in gleicher Position nicht für eine Bedeutungsverschiebung sorgt. 6. Was wird unter eindimensionalen, mehrdimensionalen und binären Oppositionen von austauschbaren, bedeutungsdifferenzierenden Segmenten verstanden? Unter‐ mauern Sie Ihre Erklärung mit unterschiedlichen Beispielen. 7. Erläutern Sie, was unter vacío accidental und vacío sistemático zu verstehen ist, und geben Sie spanische Beispiele, auf die diese Beschreibung zutreffen würde. 8. Beschreiben Sie anhand eines konkreten Lauts, wann die Neutralisierung einer phonologischen Opposition auftreten kann. Sind diese Neutralisierungen sprach‐ abhängig oder sprachunabhängig? Begründen Sie ihre Aussage. 9. Was versteht die Prager Schule unter einem Archiphonem? Beschreiben Sie die phonologische Schreibweise für dieses Phänomen und benennen Sie konkrete Beispiele aus dem Spanischen. 10. Was ist unter der kombinatorischen Variation eines Lauts zu verstehen? 11. Erläutern Sie, was mit den Phonemen / b d ɡ/ in intervokalischer Position passiert und warum dies so ist. Führen Sie Beispiele in Ihrer Erklärung an. 12. Was ist eine Entphonologisierung? Gibt es solche Prozesse in der spanischen Sprachgeschichte? Erläutern Sie einen solchen Prozess anhand eines konkreten Beispiels. 13. Inwiefern ist die Silbenstruktur für das Inventar der spanischen Konsonantenpho‐ neme relevant? 14. Erläutern Sie, warum eine phonologische Wertung des stimmhaften Frikativs / ʝ/ als Allophon des Vokals / i/ vorgeschlagen wurde. Warum ist dieser Vorschlag problematisch? 15. Skizzieren Sie anhand von Minimalpaaren die phonologischen Oppositionen, die im lleísmo möglich sind. Vergleichen Sie damit die Oppositionsmöglichkeiten im yeísmo sowie im žeísmo/ šeísmo. 164 3 System- und Regelhaftigkeit der Laute: Segmentale Phonologie <?page no="165"?> 4 Prosodie Bereits in der Einleitung (1.3) haben wir davon gesprochen, dass Lautsprache nicht als ein Aneinanderreihen von eigenständigen lautlichen Segmenten verstanden werden darf. Sprechen heißt nicht, Laute wie Perlen auf einer Schnur miteinander zu verbinden. Wie wir im letzten Kapitel gesehen haben, berücksichtigt die Phonologie diese Er‐ kenntnis inzwischen in verstärktem Maße. Durch die Konzentration auf subsegmentale Merkmale in der Merkmalsgeometrie und das Einbeziehen segmentunabhängiger Beschreibungsebenen in den autosegmentalen Ansätzen hat sie die phonologischen Erkenntnismöglichkeiten beträchtlich erweitert (3.3). Im Folgenden werden wir die Überwindung einer ausschließlich segmentbezogenen Perspektive in eine andere Rich‐ tung weiterverfolgen. Wir werden uns der suprasegmentalen Phonologie zuwenden, die zeigt, dass es eine ganze Reihe von lautsprachlichen Phänomenen gibt, die nicht an Einzelsegmente, sondern an größere Einheiten gebunden sind. Ihre Beschreibung und Erklärung setzt eine Perspektivierung voraus, die über das Segment hinausgeht, die also suprasegmental ist. Man spricht hier auch von Prosodie bzw. von prosodischer Phonologie. Der Terminus geht auf einen altgriechischen Fachausdruck aus der Rhetorik zurück; προσῳδία (prosodía) heißt ‘(das) Hinzusingen, Betonung, Vortrag’. Dieselbe Bedeutung hat auch das lateinische Wort accentus < lat. ADCANTU S , das in der lateinischen Rhetorik den griechischen Fachausdruck übersetzt und die etymologische Basis für unser Wort ‘Akzent’ ist. Wenn wir hier auf die griechisch-lateinische rhetorische Tradition verweisen, dann nicht nur, um die Etymologie wichtiger Fachtermini der prosodischen Forschung zu klären. Es soll auch ein Hinweis auf eine vorwissenschaftliche Tradition sein, die für Phänomene wie Akzentuierung oder Metrum und Rhythmus Beschrei‐ bungskonzepte entwickelt hat, die die prosodische Phonologie aufnehmen konnte. Dieses ideengeschichtliche Erbe ist allerdings nicht ganz unproblematisch, denn man vergisst leicht, dass der Gegenstand der Rhetorik der Bereich der distanzsprachlichen Kommunikation ist. In der Metrik ist es sogar die gebundene Rede, dichterische Texte also, die einer durchgehenden rhythmischen bzw. akzentuellen Überformung unterworfen werden. Vor diesem Hintergrund ist es verständlich, dass die Prosodie in der antiken Rhetorik als etwas ‘Hinzugesungenes’ definiert wurde; in der Tat handelt es sich ja bei der Dichtung um Kommunikation, in der die prosodischen Dimensionen der Lautsprache über das Normalmaß hinaus reflektiert und funktionalisiert werden. Eines der wichtigsten Ergebnisse neuerer Forschung dürfte sein, dass die Auffas‐ sung von Prosodie als einer allenfalls stilistisch interessanten Dimension revidiert wurde. Man muss hier nur an den kindlichen Erstspracherwerb denken und an die zentrale Rolle, die neuere Studien prosodischen Phänomenen für die ersten Phasen der <?page no="166"?> 1 So haben Ramus et al. (1999) gezeigt, dass Neugeborene ihre Muttersprache (L1) von einer anderen Sprache unterscheiden können, wenn beide verschiedenen rhythmischen Klassen angehören (vgl. 4.4.2). Weiterhin nutzen Kinder vermutlich einzelsprachliche Betonungsmuster, um grammatische Eigenschaften wie die Abfolge von Objekt und Verb zu erwerben (vgl. Guasti et al. 2001). So entspricht das Betonungsmuster ‘stark - schwach’ der Wortstellung Objekt - Verb (z. B. dt. [ O das BUCH][ V lesen], türk. [ O KİTABI][ V okumak]), während ‘schwach - stark’ mit VO korreliert (z. B. sp. [ V leer][ O el LIBRO], fr. [ V lire][ O le LIVRE]). Es wird angenommen, dass Neugeborene in der Lage sind, solche Betonungsmuster voneinander zu unterscheiden, und diese Informationen beim Erwerb der Wortstellungsregeln ihrer Sprache nutzen. Diese Art von ‘Unterstützung’ eines Erwerbsbereichs (hier: Wortstellung) durch Evidenz aus einem anderen (hier: Phonologie) wird oft als bootstrapping (vgl. engl. bootstrap ‘Stiefelschlaufe’) bezeichnet. Die Phonologie dient gemäß dieser Idee also als eine Art Einstiegshilfe in die Grammatik - genauso wie die Schlaufen das Anziehen der Stiefel erleichtern. Sprachwahrnehmung und des Sprachlernens zuweisen. 1 Die Prosodie ist ein integraler Bestandteil der Lautsprache und den segmentalen Phänomenen keinesfalls nachgeord‐ net. Zum Sprechen gehören Silbenmuster (4.2), Akzentkontraste (4.3), rhythmische Dauerunterschiede (4.4) und intonatorische Modulationen (Sprachmelodie, 4.5). Das betrifft nähesprachliche Varietäten ebenso wie im Medium der Phonie realisierte Distanzsprache. Im Alltagsgespräch funktioniert Prosodie allerdings anders als in vor‐ gelesenen schriftlichen Texten oder etwa in der Dichtung. Sie übernimmt im Gespräch wichtige parasprachliche Aufgaben (z. B. die Signalisierung emotionaler Beteiligung), sie unterstützt die Formulierungsarbeit (Regelung des Sprecherwechsels, Bewältigung von Formulierungsschwierigkeiten), und sie signalisiert die informationsstrukturelle Gliederung (Phrasierung, Fokussierung) sowie pragmatische Funktionen (Abtönung) − teils im Zusammenspiel mit, teils auch anstelle von syntaktischen Ausdrucksverfahren. Auf die Rolle der Prosodie in der (phonischen) Nähekommunikation können wir in dieser Einführung nicht detailliert eingehen, nicht zuletzt, weil vertiefte prosodische Analysen nähesprachlicher Korpora erst in Ansätzen vorhanden sind (4.5.5; für einen Überblick zu aktuellen Ansätzen vgl. Teixeira Kalkhoff et al. 2021). Wir werden die kommunikativen Unterschiede zwischen Nähe- und Distanzsprache jedoch berück‐ sichtigen und präzisieren, ob wir uns auf spontansprachliche Interaktion oder auf in Laborsituationen entstandene Daten (Vorleseaussprache, semi-spontansprachliches Material) beziehen. Das Kapitel zur Prosodie ist folgendermaßen aufgebaut: Zunächst wird das Gesamt‐ konzept der prosodischen Einheiten und der prosodischen Hierarchie vorgestellt, die im Rahmen der neuen multilinearen und hierarchischen Modellierung des phonolo‐ gischen Wissens bzw. der phonologischen Kompetenz abgegrenzt werden (4.1). Danach werden wir ausführlich auf die Silbe eingehen, die für die prosodische Organisation grundlegend ist (4.2). Die nächsten Unterkapitel gehen dem Funktionieren der sog. prosodischen Eigenschaften nach: Wir beschäftigen uns mit den lautlichen Phäno‐ menen, die sich auf mehrere Segmente erstrecken und nur in größeren prosodischen Kontexten erkannt werden können. Das sind Tonhöhe, Dauer, Intensität und Artiku‐ lationsgenauigkeit. Wir untersuchen, wie diese im Spanischen als Akzent, genauer als Wortakzent, funktionalisiert werden (4.3), wie sie im Bereich des Rhythmus eingesetzt sind (4.4) und welche Rolle sie für die Sprachmelodie oder Intonation spielen (4.5). 166 4 Prosodie <?page no="167"?> 4.1 Prosodische Einheiten und prosodische Hierarchie Bereits vor und während der Zeit, in der die strukturalistische Phonologie (3.1) und die klassische generative Phonologie (3.2) dominierten, gab es Ansätze, die von mehreren Ebenen der lautlichen Strukturbildung ausgingen und Einheiten wie die Silbe, das Wort oder das Syntagma in die Analyse einbezogen. Das gilt beispielsweise für die vorstrukturalistische Phonetik von Eduard Sievers ( 5 1901) oder für die Untersuchungen von Ernst Pulgram (1970) zur lateinisch-romanischen Lautentwicklung (vgl. hierzu v. a. Vennemann 1986). Seit den späten 80er und 90er Jahren des letzten Jahrhunderts ist eine Abkehr von der vornehmlich segmentalen Perspektive, wie sie in Strukturalismus und klassischer generativer Phonologie vorherrschend war, zu verzeichnen. In 3.3 haben wir gesehen, dass die Analyse von Tonsprachen zur Annahme segmentunabhängiger (autosegmentaler) Strukturebenen geführt hat. Auch die Untersuchung von Akzent und Intonation macht segmentunabhängige Darstellungsebenen und neue supraseg‐ mentale Bezugsgrößen erforderlich. Die Kritik und die daraus folgende Entwicklung der autosegmentalen und der prosodischen Forschungsansätze können wir am Beispiel des Wortakzents genauer nachvollziehen. In der klassischen generativen Phonologie wurde der Wortakzent als Merkmal eines der Segmente aufgefasst, die in der zugrundeliegenden phonolo‐ gischen Repräsentation des Lexems das Merkmal [+vok] (für vokalisch) aufwiesen. Der Wortakzent war, nach dieser Auffassung, ein Merkmal derselben Qualität wie beispielsweise [±hoch] oder [±stimmhaft]. Geht man von einer solchen Interpretation des Akzents aus, kann man aber z. B. nicht erklären, warum in der Entwicklung vom Lateinischen zum Spanischen die Position des Akzents innerhalb der Segmentkette immer gleich bleibt (Menéndez Pidal 1962: 36), obwohl sich das jeweilige Segment, dem es als Merkmal zugeschrieben wird, in seinen anderen Merkmalen deutlich verändert (z. B. lat. DŌR M Ĭ S > duermes ‘du schläfst’). Erklärbar werden solche Phänomene erst, wenn man den Wortakzent unabhängig von der Segmentstruktur definiert. Denn erstens ist seine phonetische Realisierung nicht auf das vokalische Segment beschränkt, sondern erstreckt sich auf die ganze Silbe und oft sogar darüber hinaus (4.5.3.2). Zweitens hat die Akzentverteilung, also die Frage, welche der zur Verfügung stehenden Silben die Betonung erhält, nichts mit den Segmenten zu tun, sondern wird von den suprasegmentalen, prosodischen Verhältnissen bestimmt. Diese können durch lexikalisch-syntaktische Beschreibungskategorien wie etwa durch die von der klassi‐ schen generativen Phonologie berücksichtigten Morphem- und Wortgrenzen nicht hinreichend erfasst werden. Die Kritik am klassischen generativen Modell hat deshalb dazu geführt, dass man prosodische Eigenschaften wie die distinktiven Merkmale unabhängig von den Segmenten auf eigenen Schichten (engl. tiers, sp. niveles) situiert hat und somit von einem unilinearen zu einem multilinearen Modell übergegangen ist. Sie hat aber auch zu einer Rückbesinnung auf die prosodische Tradition geführt, sodass in der Folge weitere suprasegmentale, also prosodische Einheiten wie Silbe oder Fuß für die Beschreibung und Erklärung der lautlichen Strukturierung nutzbar gemacht wurden. 4.1 Prosodische Einheiten und prosodische Hierarchie 167 <?page no="168"?> 2 Leider hat sich noch keine einheitliche Symbolisierung für prosodische Einheiten durchgesetzt; wir werden im Folgenden nur die von uns verwendeten Symbole vorstellen. 4.1.1 Prosodische Einheiten Die Frage nach den prosodischen Einheiten, die bei der Herleitung phonologischer und phonetischer Regularitäten zusätzlich zu den Segmenten angesetzt werden müssen, wird in der Forschung unterschiedlich beantwortet. Es gibt Einheiten, die unumstritten sind; bei anderen bestehen Zweifel, ob sie benötigt werden. Denn während einige Einheiten als Bezugsdomänen für zahlreiche und voneinander unabhängige Regeln dienen - so z. B. die Silbe, ohne die viele lautliche Phänomene weder beschrieben noch hergeleitet werden können (Blevins 1995) -, sind andere - etwa die Klitische Gruppe - manchmal nur auf eine einzige Regel bezogen bzw. nicht für alle Sprachen relevant (4.1.2). Im Folgenden werden wir die Einheiten beschreiben, die in der prosodischen Forschung gängigerweise unterschieden werden. Die erste suprasegmentale Einheit, diejenige, die direkt den Segmenten übergeord‐ net ist, ist die Silbe (sp. sílaba), symbolisiert durch den griechischen Kleinbuchstaben σ (Sigma). 2 Die Silbe ist eine prosodische Einheit, die auch von linguistisch nicht geschulten Sprechern identifiziert werden kann. Außerdem liegen sowohl artikulato‐ rische als auch perzeptive Daten vor, die zeigen, dass sie eine zentrale Rolle in der Sprachproduktion und in der Sprachverarbeitung spielt. In der Silbe sind mehrere Segmente zusammengefasst, oder besser gesagt: Ein Silbenkern, der im Spanischen und in vielen anderen Sprachen immer ein Vokal ist, eröffnet in seinem Vor- und Nachfeld den Platz für konsonantische Segmente. Die prosodische Organisation der Lautkette in Silben kann deshalb erklären, warum Vokale und Konsonanten nicht zufällig, sondern nach bestimmten Mustern verteilt sind. Außerdem ist die Silbe die grundlegende Einheit für eine Reihe phonologischer Prozesse sowie für Dauer-, Ton- und Intensitätsphänomene. Da die Silbe eine zentrale prosodische Einheit ist, werden wir sie in einem eigenen Abschnitt behandeln (4.2). So wie in der Silbe Segmente nach einem bestimmten Muster vereint sind, sind im Fuß (sp. pie) mehrere Silben zusammengefasst. Diese Einheit wird mit dem lateinischen Großbuchstaben P symbolisiert. Die Einheit des Fußes ist aus der klassischen Metrik übernommen; in der altgriechischen und lateinischen Verslehre wird ein regelmäßig wiederkehrendes metrisches Muster aus starken und schwachen Silben als Fuß be‐ zeichnet. Die Unterscheidung zwischen starken (f = sp. fuerte bzw. s = engl. strong) und schwachen (d = sp. débil bzw. w = engl. weak) Silben beruht entweder auf dem Silbengewicht (stark = schwer, schwach = leicht) (vgl. 4.2.2) oder auf der Betonung (stark = betont, schwach = unbetont) (vgl. 4.3). Der Fuß umfasst maximal drei Silben, von denen eine und nur eine stark ist. Schwache Silben stehen entweder vor oder nach einer starken Silbe, sodass sich vier mögliche Fußtypen ergeben: die rechtsdominanten Jambus (σ d σ f ) bzw. Daktylus (σ d σ d σ f ) mit der Silbenabfolge débil - (débil -) fuerte (engl. weak - (weak -) strong) und die linksdominanten Trochäus (σ f σ d ) bzw. Anapäst (σ f σ d σ d ) mit der Abfolge fuerte - (débil -) débil (engl. strong - (weak -) weak). In der 168 4 Prosodie <?page no="169"?> prosodischen Phonologie werden häufig nur Jambus und Trochäus, also die beiden binären Füße eingesetzt (4.3.7). Da der Fuß eine wichtige Rolle bei der Zuweisung des Wortakzents spielt, werden wir im entsprechenden Abschnitt noch genauer auf diese Einheit eingehen (4.3). Die nächste prosodische Einheit, also diejenige, die unmittelbar auf die Struktu‐ rierungsebene der Füße folgt, ist das phonologische Wort. Symbolisiert wird es durch das kleine griechische Omega (ω). Das phonologische Wort steht in einem Spannungsverhältnis zum lexikalischen Wort: Oft fällt es mit diesem zusammen; es gibt jedoch auch Fälle, in denen die prosodischen Verhältnisse nicht mit den lexikalischen übereinstimmen, so beispielsweise, wenn die Bestandteile zusammengesetzter Wörter (Komposita) sich prosodisch eigenständig verhalten, obwohl sie lexikalisch gesehen zu einer Einheit verschmolzen sind wie etwa in lucha de clases ‘Klassenkampf ’, wo zwei Akzentpositionen - nämlich auf den Silben [ ˈ lu] und [ ˈ kla] - realisiert werden (vgl. auch 4.3.8). Das phonologische Wort ist in vielen Sprachen, so auch im Spanischen, die Domäne der Wortakzentzuweisung, d. h., die Silbenbzw. Fußstrukturen der phonolo‐ gischen Wörter zeigen an, welche der Wortsilben stark sind und deshalb betont werden. Im Spanischen bleibt außerdem, wie im Deutschen, die Möglichkeit einer Wortakzen‐ tuierung auch dann erhalten, wenn das phonologische Wort in die übergeordnete prosodische Einheit der phonologischen Phrase eingebettet ist (4.3.3). Das ist nicht in allen Sprachen der Fall: So verlieren im Französischen die phonologischen Wörter ihren Akzent zugunsten eines sog. Phrasenakzents, sodass nur die phonologische Phrase, nicht aber die einzelnen Wörter, einen Akzent erhalten (Delais-Roussarie et al. 2015, Pustka 2 2016: 132, Côté 2022: 700-703). Das phonologische Wort kann außerdem die Domäne von Prozessen wie Konsonantenverstärkung, Entstimmung von Konsonanten etc. sein, durch die die Wortgrenzen, vor allem der Wortanfang, verdeutlicht werden. Weiterhin ist das phonologische Wort in einer Vielzahl von Sprachen außerdem die Domäne für sog. Sandhi-Phänomene. Als Sandhi bezeichnet man in der altindischen Grammatiktradition die lautlichen Angleichungen, die sich beim Verknüpfen von zwei Wortformen bzw. Morphen in der Lautkette ergeben. Sandhi-Phänomene wie z. B. die Assimilation (vgl. 2.5.1.3, 3.2) verstärken in vielen Sprachen die Kohärenz prosodischer Einheiten, weil die Segmente innerhalb der übergeordneten Konstituenten sich gegen‐ seitig beeinflussen. Sandhi-Phänomene sind im Spanischen wortintern (internes Sandhi), aber auch auf der Ebene der phonologischen Phrase (externes Sandhi) belegt. Denn anders als im Deutschen besteht hier die Tendenz, in der Lautkette die Wortgrenzen zugunsten der internen Kohärenz der phonologischen Phrase aufzugeben. Im Spanischen werden in phonologischen Phrasen die Silbengrenzen über die Wortgrenzen hinweg neu bestimmt (Resyllabierung; 4.2.5). Deshalb ist das phonologische Wort nur für die Bestimmung des Wortakzents, nicht aber für segment- und silbenbezogene Sandhi-Prozesse und die Syllabierung relevant. Neben dem phonologischen Wort ist auch die Klitische Gruppe bei der Frage der Akzentzuweisung im Spanischen zu berücksichtigen. Die Klitische Gruppe, die wir 4.1 Prosodische Einheiten und prosodische Hierarchie 169 <?page no="170"?> 3 Eine Zusammenfassung der Diskussion findet sich bei Nespor & Vogel ( 2 2007: XV-XX). 4 So findet man im argentinischen Spanisch bei nachgestellten Klitika in den Imperativformen eine Verlagerung des Akzents auf das Klitikon: [to ˌ ma.te ˈ lo] ¡Tomateló! ‘Nimm es dir! ’ (vgl. 4.3.8). 5 In der NGRAE (2011: 356) ist das Äquivalent der Klitischen Gruppe die Akzentgruppe: “Las palabras átonas se agrupan con las tónicas para formar un G R U P O A C E N T U A L .” in Abb. 4.1-1 mit dem Buchstaben C symbolisieren, ist die prosodische Einheit, deren Notwendigkeit am stärksten angezweifelt wird. 3 Eine Klitische Gruppe besteht aus einem phonologischen Wort und den Klitika, die dieses an sich bindet (Nespor & Vogel 2 2007: 145-163). Viele Forschende sind der Ansicht, dass man hier besser von einem komplexen phonologischen Wort sprechen sollte, wie man es bei Derivationen oder bei manchen Komposita tut (vgl. 4.3.8). Allerdings verhalten sich Klitika in Hinblick auf Akzentuierung und Sandhi-Phänomene anders als Derivationsmorpheme oder lexikalische Bestandteile von zusammengesetzten Wörtern. So können beispielsweise nur die nachgestellten Klitika im Spanischen eine Akzentverschiebung auslösen. 4 Wir werden daher im Folgenden davon ausgehen, dass zumindest bei der Beschreibung der Akzentstruktur des Spanischen neben dem phonologischen Wort auch die Klitische Gruppe eine Rolle spielt. 5 Phonologische Wörter bzw. Klitische Gruppen sind auf einer nächsthöheren Ebene in der phonologischen Phrase zusammengefasst. Die Symbolisierung für diese pro‐ sodische Einheit ist der griechische Buchstabe Phi (φ). Wie wir gesehen haben, ist die phonologische Phrase im Spanischen als Domäne von externen Sandhi-Phänomenen bzw. von Resyllabierungen relevant. Ähnlich wie innerhalb des phonologischen Wortes signalisieren auch die Sandhi-Phänomene innerhalb der phonologischen Phrase die Kohärenz zwischen den Konstituenten. Die Abgrenzung dieser Einheit richtet sich nach syntaktisch-semantischen und informationsstrukturellen Kriterien. Eine phono‐ logische Phrase gruppiert einzelne Wörter zu kohärenten und begrenzt autonomen Einheiten. Sie entspricht deshalb oft einer syntaktischen Konstituente, etwa einer Nominalphrase, einer Adverbialphrase oder einer einfachen Verbalphrase. Die Abgrenzung phonologischer Phrasen berührt das Verhältnis von Syntax und Prosodie, die sog. Syntax-Prosodie-Schnittstelle (engl. syntax-prosody interface, sp. interfaz sintaxis-prosodia; vgl. Selkirk 1984). Die Frage nach den Bezügen zwischen prosodischer Phrasierung und syntaktischer Gliederung wird in der Forschung meist so beantwortet, dass keine vollständige Isomorphie gegeben ist, die prosodische Struktu‐ rierung sich aber an der syntaktischen orientiert, weil dies die semantische Kohärenz begünstigt (vgl. Frota 2012). Phonologische Phrasen können unterschiedlich lang sein und entsprechen somit Konstituenten unterschiedlicher Komplexität. Prosodische Phä‐ nomene wie die Blockierung von Sandhi-Effekten an den Grenzen der phonologischen Phrase, phrasenfinale Intonationsbewegungen, Pausensetzungen und ähnliches sind durch die syntaktische Struktur nicht vollständig determiniert (Truckenbrodt 2007, Gabriel 2007, Dufter & Gabriel 2016). Die Phrasierung wird auch durch pragmatische Faktoren wie Emphase und Expressivität, durch eurhythmische Faktoren wie das Vermeiden von zu langen Phrasen oder durch die Sprechgeschwindigkeit bestimmt. 170 4 Prosodie <?page no="171"?> Das, was zahlreiche prosodische Ansätze als phonologische Phrase abgrenzen und nahe an der syntaktischen Struktur verorten, wird in der autosegmental-metrischen Phonologie als Intermediärphrase direkt aus der Verteilung der Tonbewegungen abgeleitet (vgl. 4.5.3.1, 4.5.5), wodurch die relative Autonomie der prosodischen Strukturierung zum Ausdruck kommt (Frota 2012: 256f.). Intermediärphrasen werden durch das Kürzel ip symbolisiert, um ihre Unterordnung unter die hierarchisch über‐ geordnete Intonationsphrase (IP) auszudrücken. Beide prosodischen Einheiten sind durch spezifische Tonhöhenbewegungen abgegrenzt; durch diese kann der Sprecher signalisieren, dass er eine semantisch-syntaktische Einheit beginnt bzw. beendet. Er kann weiterhin signalisieren, ob es sich um eine Teileinheit - also eine Intermediär‐ phrase (ip) - handelt und die Äußerung noch weitergeht oder ob er am Ende der gesamten Intonationsphrase (IP) und damit am Ende der Sinneinheit angekommen ist. Mit der Intermediär- und Intonationsphrase sind die zentralen Bezugspunkte für die Zuweisung der auf der autosegmentalen Tonschicht verankerten Intonationsbe‐ wegungen genannt. Wir werden auf diese beiden hierarchisch am höchsten stehenden prosodischen Einheiten noch genauer im Abschnitt zur Intonation eingehen (4.5.3). 4.1.2 Prosodische Hierarchie Die bisherige Darstellung der prosodischen Einheiten hat gezeigt, dass diese hierar‐ chisch aufeinander bezogen sind. Ein Fuß umfasst mehrere Silben, ein phonologisches Wort mehrere Füße, eine phonologische Phrase mehrere phonologische Wörter. Das Verhältnis der prosodischen Einheiten kann also als die Relation zwischen den Teilen und dem von ihnen konstituierten Ganzen gesehen werden. Umgekehrt dürfte auch deutlich geworden sein, dass die hierarchisch höheren Einheiten ihren Teilen in dem Sinne vorgeordnet sind, dass sie diese nach bestimmten Regeln miteinander verknüpfen bzw. bestimmte Eigenschaften, etwa Töne oder die Akzentposition, an sie weitergeben. Nach dem Vorbild der syntaktischen Konstituentenstruktur des generativen Modells wurde deshalb eine prosodische Grammatik entwickelt, die alle prosodischen Einheiten, die für lautsprachliche Regularitäten relevant sind, in einer umfassenden prosodischen Hierarchie miteinander in Beziehung bringt (Selkirk 1984, Nespor & Vogel 2 2007). Die prosodische Hierarchie orientiert sich an den syntaktischen Modellen der forma‐ len Grammatik, in erster Linie an Chomskys Prinzipien- und Parametertheorie (vgl. Gabriel et al. 3 2018: 31-101). Sie schlägt einheitliche Strukturierungsprinzipien auf allen Ebenen der prosodischen Hierarchie vor: Auch in den prosodischen Phrasen nimmt eines der Elemente eine besondere Stellung ein, nämlich die des Kopfes der Phrase (Nespor & Vogel 2 2007: 1-25). Als Kopf einer Phrase wird dabei das prominentere Element bezeichnet, etwa die betonte Silbe im Fuß oder der Fuß mit dem Wortakzent innerhalb des phonologischen Wortes. Dabei ‘vererben’ sich die Stärkerelationen von den oberen Knoten zu den untergeordneten, sodass sich durchgehende Linien von der obersten Ebene der Intonationsphrase bis zur untersten, den Silben, ergeben. 4.1 Prosodische Einheiten und prosodische Hierarchie 171 <?page no="172"?> 6 Man kann sich das vergegenwärtigen, wenn man folgenden Satz vorliest: Der, der den, der die Telefonzelle, die an der Brücke, die über die Autobahn führt, steht, beschädigt hat, gesehen hat, soll mir bitte Bescheid sagen (Gabriel & Meisenburg 4 2021: 38). Die einzelnen Phrasen werden hier in der Regel durch ein leichtes Heben der Stimme abgegrenzt (sog. Komma-Intonation) - und zwar weitgehend unabhängig davon, wie tief die jeweiligen Nebensätze in die syntaktische Gesamtstruktur eingebettet sind. Solche durchgehenden Stärkelinien sind beispielsweise wichtig, wenn es darum geht, die Assoziation der Töne mit den Wortsilben zu regeln. Die in der prosodischen Hierarchie als metrisch stark ausgezeichneten Silben sind der Ankerpunkt für die Verknüpfung der autosegmentalen Tonschicht mit der silbischen Struktur (4.5.3). In Abb. 4.1-1 exemplifizieren wir anhand des Beispielsatzes Las chicas comen manzanas die einzelnen prosodischen Einheiten und zeigen, in welcher Beziehung sie zueinander stehen. Metrisch starke (betonte) Silben sind durch Unterstreichung gekennzeichnet (σ). Abb. 4.1-1: Konstituenten der prosodischen Hierarchie (nach Kubarth 2009: 76). Die Orientierung an den syntaktischen Modellen geht nicht so weit, dass die Unter‐ schiede zwischen syntaktischer und prosodischer Strukturierung ignoriert würden. Die prosodische Hierarchie ist wesentlich flacher als die syntaktische, weil rekursive Strukturen in der Prosodie problematisch sind: Eine prosodische Einheit wie die Silbe kann nicht eine Silbe als eine ihrer Konstituenten einschließen. Sie setzt sich ausschließlich aus Konstituenten der unmittelbar darunterliegenden Strukturierungs‐ ebene, in diesem Falle aus Segmenten, zusammen. Auch auf die übergeordneten prosodischen Einheiten ist die syntaktische Rekursivität nicht unmittelbar übertragbar. Ein Satz, der aus mehrfach eingebetteten Sätzen besteht, wird prosodisch gesehen zu einer Aneinanderreihung von Intermediär- (bzw. phonologischen) Phrasen, die die unterschiedlichen Einbettungsgrade nicht erkennen lassen. 6 In der Prosodie kommt es 172 4 Prosodie <?page no="173"?> 7 Vgl. hier auch die Überlegungen von Delais-Roussarie (2022) zu einer funktionalen Herleitung der prosodischen Strukturierungsebenen aus der Interaktion von Rhythmus und Intonation. also zu einer einfachen Reihung von Konstituenten derselben Strukturierungsebene, nicht zu mehrfacher Subordination (Unterordnung). Die Erkenntnis, dass sich in Bezug auf die Rekursivität syntaktische und prosodische Strukturierung unterscheiden, führte zur Strict Layer Hypothesis (sp. hipótesis de estratificación rigurosa/ uniforme), d. h. zu dem Postulat, dass alle prosodischen Struk‐ turierungsebenen in einer unveränderbaren Reihenfolge aufeinander aufbauen. Dies bedeutet, dass jede prosodische Konstituente einer Ebene x n nur Konstituenten der unmittelbar darunterliegenden prosodischen Ebene x n-1 dominieren kann und selbst wiederum vollständig in einer Konstituente auf der Ebene x n+1 aufgehen muss (Nespor 1993: 168). Ein phonologisches Wort könnte demnach keine Silben dominieren, weil dazwischen die Ebene der Fußstruktur liegt etc. Die Strict Layer Hypothesis ist allerdings inzwischen in die Diskussion geraten (Frota 2012, Truckenbrodt 2007). Gerade die Klitische Gruppe (C) hat zu der Frage Anlass gegeben, ob es nicht sinnvoller ist, die Silben von Klitika direkt dem Wortknoten unterzuordnen (vgl. Abb. 4.1-1). In der Intonationsphonologie werden von einigen Forschenden inzwischen rekursive Strukturen für die oberen Ebenen der prosodischen Hierarchie vorgeschlagen (Ladd 2 2008: 297f., Féry 2017: 78ff.). Das Modell wird heute flexibel gehandhabt und den einzelsprachlichen Gegebenheiten angepasst. 7 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln Im Folgenden erläutern wir zunächst, was unter einer Silbe zu verstehen ist (4.2.1), und stellen ihre interne Struktur vor (4.2.2). Anschließend gehen wir auf die Silbenstruk‐ turpräferenzen ein, die die Verkettung der Segmente zu Silben und deren Verkettung zu Wörtern und Phrasen regulieren (4.2.3). Wir erläutern die Silbenstrukturen des Spanischen und den Einfluss der Silbenposition auf die Segmente (4.2.4) und skizzieren dann, wie sich eine wichtige prosodische Charakteristik des Spanischen, nämlich die Neubestimmung der Silbengrenzen in der Äußerung (Resyllabierung), auswirkt (4.2.5). Im letzten Abschnitt gehen wir darauf ein, wie im Spanischen das Aufeinandertreffen zweier Vokale im Silbenkontakt (Hiatus) behandelt wird (4.2.6). 4.2.1 Was ist eine Silbe? Die Silbe (σ) ist eine prosodische Einheit, die jeder Sprecher ohne Schwierigkeiten identifizieren kann. Bereits kleine Kinder sind dazu in der Lage: In Abzählreimen verbinden sie leicht und sicher ihre Zeigegesten mit den einzelnen Silben; auch in Kinderliedern werden die einzelnen Töne der Melodie ohne Schwierigkeiten mit Wortsilben verknüpft. Dieses spontane und problemlose Identifizieren von Silben zeigt, dass man als Kind nicht mühsam lernen muss, was Silben sind. Dass die 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln 173 <?page no="174"?> 8 Die Silbengrenze wird im Bedarfsfall durch einen Punkt markiert. 9 Am Zeilenende spielt hier der Wortakzent eine Rolle, weil die vorletzte (siebte) Silbe der Haupt‐ tonsilbe eines Wortes entsprechen muss. Da nicht alle spanischen Wörter dem paroxytonen Betonungsmuster entsprechen, bei dem eine unbetonte Silbe dem Hauptton folgt, kann es bei endbetonten (oxytonen) Wörtern zu Versen mit nur sieben Silben kommen; vgl. das folgende Beispiel aus den Rimas (‘Reime’) von Gustavo Adolfo Bécquer (1836-1879), eines bedeutenden Vertreters der spanischen Romantik: Por una mirada un mundo (8 σ) Für einen Blick, eine Welt por una sonrisa un cielo (8 σ) für ein Lächeln, einen Himmel por un beso … yo no sé (7 σ) für einen Kuss … ich weiß nicht qué te diera por un beso. (8 σ) was ich Dir gäbe, für einen Kuss. (Rima XXII; Bécquer 2013: 60f.) Man beachte, dass zwei an der Wortgrenze aufeinandertreffende Vokale wie in mirada un zu einer Silbe gerechnet werden (sog. sinalefa, vgl. 4.2.6); der Abfolge mi.ra.da‿un kommen somit drei und nicht vier Silben zu. Schließlich können bei Wörtern, die auf der vorvorletzten Silbe betont sind (Proparoxytona), auch Verse mit neun Silben entstehen. intuitive Kenntnis auch später nicht verloren geht, sieht man an silbenbasierten Sprachspielen wie dem vesre (abgeleitet aus (al) re.vés ‘umgekehrt’ > ves.re) 8 , das in der argentinischen Jugendsprache verbreitet ist. Dort wird die Reihenfolge der Wortsilben vertauscht, um neue Signifikanten zu bilden: So wird z. B. das Wort pa.trón ‘Chef ’ zu trom.pa umgestaltet, wobei aufgrund der veränderten segmentalen Kombinatorik die Nasalassimilation von / n/ zu [m] auftritt (vgl. 3.2). Auch in der Lyrik spielt die Silbe eine wichtige Rolle; ein häufig gewähltes Versmaß im Spanischen ist der octosílabo (‘Achtsilbler’; vgl. Baehr 1962: 67-73). 9 Wenn wir über die Prinzipien unserer Artikulation und unserer Perzeption nach‐ denken, können wir auch begründen, warum die silbische Gliederung der Lautkette ein anthropologisches Universale ist. Silben sind eine Kombination von artikulatori‐ schen Schließ- und Öffnungsbewegungen. In perzeptiver Hinsicht sind sie durch die Verknüpfung auditiver Kontraste gekennzeichnet. Die Silbe vereint ein Sonoritäts‐ maximum (Vokal) und darum herum geordnete Sonoritätsminima (Konsonanten). Beide Phänomene kommen unseren Artikulationsmöglichkeiten und unserer Perzep‐ tion entgegen. Die Sprechwerkzeuge sind auf das kontrastreiche Abwechseln zwischen Vokalen und Konsonanten besser eingestellt als auf eine Reihung von Segmenten, die artikulatorisch gesehen nur geringfügig untereinander differieren. Außerdem können wir leichter die starken Kontraste zwischen Vokalen und Konsonanten wahrnehmen als innerhalb eines relativ gleichbleibenden Sonoritätsverlaufs einzelne Vokale oder einzelne Konsonanten voneinander unterscheiden (Pompino-Marschall 3 2009: 237ff.). Auch der Erstspracherwerb spricht für die wichtige Rolle der Silbe. Er beginnt mit der sog. Lallphase, in der die Kleinkinder durch das ständige Abwechseln von konsonantischer Schließung und vokalischer Öffnung in Silbenfolgen wie [papapa] ihre Artikulationswerkzeuge erproben und langsam für komplexere Artikulationen vorbereiten. Das intuitive Verständnis der Silbe seitens der Laien kontrastiert mit der Tatsache, dass es keine eindeutigen phonetischen Entsprechungen der Silbe im Sinne einer abgeschlossenen Einheit gibt (Ladefoged & Maddieson 1996: 281f.). Silbengrenzen sind 174 4 Prosodie <?page no="175"?> 10 Zu weiteren Evidenzen für die Existenz der Silbe als Bestandteil des phonologischen Wissens der Sprecher vgl. Blevins (1995), Zec (2007: 162) und Hall ( 2 2011: 205-211). weder im akustischen Signal noch in der artikulatorischen Bewegung klar erkennbar, und Assimilationsprozesse zwischen Segmenten wirken über die Silbengrenze hinweg (vgl. 3.2, 4.2.1). Es gibt aber zahlreiche Evidenzen dafür, dass die Silbenstruktur ein wichtiger Faktor bei der Lautproduktion und -rezeption der Sprecher ist und deshalb in der phonologischen Theoriebildung und Beschreibung berücksichtigt werden muss. Beispielsweise ist im Spanischen im akustischen Signal ein deutlicher Unterschied zwischen der Realisierung eines konsonantischen Segments am Anfang und am Ende einer Silbe zu erkennen (NGRAE 2011: 284ff.). Auch sprachgeschichtliche Daten zeigen, dass für Konsonanten die unterschiedlichen Positionen innerhalb der Silbe wichtig sind. Am Silbenanfang, in der Onsetposition, entwickeln sich Konsonanten anders als in der Coda nach dem vokalischen Silbenkern. In der Synchronie sind die unterschied‐ lichen Silbenpositionen die Basis für die Phonotaktik, d. h. die Regeln, die bestimmen, wo die einzelnen Segmente stehen können und wie sie miteinander kombiniert werden. So kann etwa das Phonem / ʎ/ im Spanischen nie in der Codaposition auftreten, sondern ist auf den Onset (am Wortanfang oder innerhalb eines Wortes) eingeschränkt (z. B. [ʎa ˈ maɾ] llamar ‘rufen’, [ ˈ kaʎe] calle ‘Straße’, vgl. 4.2.4.2). Auch wenn wir keine phonetischen Indizien für die Silbe im Sinne einer artikulatorisch und/ oder akustisch abgeschlossenen Einheit finden, spielt die Silbe dennoch eine wichtige Rolle als Konstruktionsmuster, nach dem wir Laute beim Sprechen verbinden. Wir verketten die Segmente nicht nach den vielen Möglichkeiten, die sich rein rechnerisch aus ihrer Zahl ergeben. Stattdessen folgen wir einem silbischen Muster. Erst dieses Muster lässt Segmentfolgen zu einer artikulatorisch und lautlich angemessenen Einheit werden. Zec (2007) nennt deshalb die Silbe “an organizing principle for grouping segments into sequences” (162). 10 4.2.2 Silbenstruktur Die Hinweise auf die Relevanz der Silbe für Artikulation und Perzeption haben gezeigt, dass die Lautklasse der Vokale eine zentrale Rolle spielt, denn durch sie wird die interne Struktur der Silbe bestimmt: Jeder Vokal ist automatisch ein Silbenkern (auch: Nukleus, Plural Nuklei, sp. núcleo) und damit der Sonoritätsgipfel der Silbe, also das Segment, das die größte Schallfülle hat. Um diesen vokalischen Gipfel herum gruppieren sich konsonantische Segmente im Vorfeld (Silbenkopf oder Onset, sp. ataque oder inicio) und/ oder Nachfeld (Silbenendrand oder Coda, sp. coda). Nukleus und Coda bilden gemeinsam den Reim (sp. rima). Alle Silbenkonstituenten können einfach oder komplex sein, d. h. potenziell aus einem oder mehreren Segmenten bestehen. Die folgende Tabelle verdeutlicht dies anhand von Beispielen. 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln 175 <?page no="176"?> 11 In einigen Ansätzen werden [j] und [w] als (Halb-)Konsonanten zum Onset (2. Position) bzw. zur Coda gerechnet, vgl. etwa Bowen & Stockwell (1955). Harris & Kaisse (1999) und Kaisse (2019) argumentieren jedoch überzeugend, dass die prävokalischen Gleitlaute im Spanischen Teil des Nukleus sind, solange die Onsetposition von einem (oder zwei) weniger sonoranten Segment(en) besetzt ist. Nur intervokalisch oder wortinitial treten Gleitlaute in die Onsetposition und werden dann häufig verstärkt (vgl. 2.5.2). Silbe (σ) Onset Reim - Nukleus Coda - - a - á.ra.be ‘arabisch’ ɾ a - á.ra.be - - a l al.to ‘hoch’ m a s más ‘mehr’ fl a - fla.co ‘dünn’ tɾ e s tres ‘drei’ p e ɾs pers.pi.caz ‘scharf(sinnig)’ b je n bien ‘gut’ (Adverb) b jaj 11 s cam.biáis ‘ihr ändert’ Abb. 4.2-1: Silbenstrukturen des Spanischen (vgl. Hualde 2005: 71). Obligatorischer Silbenbestandteil ist nur der Nukleus, und er allein kann bereits eine Silbe bilden (z. B. [a] in [ ˈ a.ɾa.be] árabe). Fakultativ sind dagegen sowohl der Onset als auch die Coda. Silben, die keine Coda aufweisen (a, tú, á.ra.be, fla.co), nennt man offene Silben (sp. sílabas abiertas/ libres) (V, CV, CCV etc.), Silben mit Konsonant(en) in der Codaposition (al.to, más, tres, pers.pi.caz) geschlossene Silben (sp. sílabas cerradas/ trabadas) (VC, CVC, CVCC etc.). Silben, die keinen Onset haben (a, á.ra.be, al.to), sind nackt (V, VC etc.), Silben mit Onset (tú, á.ra.be, al.to, fla.co, más, tres) bedeckt (CV, CCV, CVC, CCVC etc.). Die folgende Tabelle fasst diese unterschiedlichen Silbentypen zusammen. - offen geschlossen nackt a, árabe al.to bedeckt tú, á.ra.be, fla.co más, tres, pers.pi.caz Abb. 4.2-2: Silbentypen. 176 4 Prosodie <?page no="177"?> 12 Fasst man die Affrikaten des Deutschen als zugrundeliegend feste Kombinationen (Plosive mit frikativischer Verschlusslösung) auf, ergibt sich für Strumpfs auf phonemischer Ebene eine Coda mit drei anstelle von vier Segmenten (CCC/ mp͡fs/ ; vgl. Wiese 1996: 42). Bei Herbsts (das fünf Konsonantgrapheme am Wortende aufweist) vermindert sich die Coda auf phonetischer Ebene auf vier Segmente, wenn man die r-Vokalisierung mit einbezieht, die im heutigen Standarddeutsch als unmarkierte Aussprache gilt (vgl. 2.5.1.5): [hɛɐ̯ psts]. Vollkonsonantische Realisierungen von vorkonsonantischem r in Codaposition, z. B. als stimmloser uvularer Frikativ [χ], sind jedoch in zahlreichen Dialekten des deutschen Sprachraums belegt, vgl. die Karten im Atlas zur Aussprache des deutschen Gebrauchsstandards (AADG) (Kleiner 2011; http: / / prowiki.ids-mannheim.de/ bin/ view / AADG/ RvorK). Wie Abb. 4.2-3 zeigt, lässt sich die Silbe auch als Konstituentenstruktur repräsen‐ tieren; wir stellen hier das Wort más in Form eines solchen Silbenstrukturbaums dar. Abb. 4.2-3: Silbenstrukturbaum von sp. más. Wir haben bereits gesagt, dass Silbenpositionen einfach oder komplex, d. h. mit nur einem oder mehreren Segment/ en besetzt sein können; im letzteren Fall sagt man auch, dass die betreffende Konstituente verzweigt. In den Beispielen aus Abb. 4.2-1 ist der Nukleus von más (V) einfach bzw. unverzweigt, der aus Gleitlaut (G) und Vokal (V) bestehende von bien (GV) ist dagegen komplex bzw. verzweigt. Auch der Onset kann einfach oder komplex sein: So besteht er in der zweiten und dritten Silbe von [ ˈ a.ɾa.βe] árabe nur aus den einfachen Konsonanten [ɾ] bzw. [β] (V.CV.CV), der Onset von [tɾes] tres dagegen besteht aus den zwei Konsonanten [tɾ] (CCVC). Silben mit einer einfachen Coda liegen in [ ˈ al.to] alto oder [mas] más vor, in denen [l] bzw. [s] Coda-Konsonanten sind (VC.CV bzw. CVC). Eine komplexe Coda findet sich in der ersten Silbe von [peɾs.pi ˈ kas] perspicaz (CVCC.CV.CVC). Wir werden weiter unten sehen, dass im Spanischen maximal zwei Konsonanten im Onset und in der Coda zugelassen sind. In anderen Sprachen, etwa im Deutschen oder Französischen, ist die Zahl der Segmente, die in diesen beiden Positionen auftreten können, höher (dt. (des) Strumpfs: CCCVCCCC, (des) Herbsts: CVCCCCC 12 ; fr. stress: CCCVC, mixte: CVCCC). Eine Einordnung der Silbenstrukturen des Spanischen in den gesamtromanischen Kontext sowie eine diachrone Einbettung bietet Heinz (2023). 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln 177 <?page no="178"?> 13 Falls auf die betonte Wortsilbe weitere unbetonte Silben folgen, müssen auch diese, zumindest bei der rima consonante, phonetisch gleich sein (z. B. rayo : mayo; válido : cálido). Zur spanischen Metrik und zum Reim vgl. genauer Baehr (1962). 14 Wie das Lateinische zeigt, ist eine Silbe auch dann schwer, wenn sie einen Langvokal als Nukleus hat. Die Silbenschwere kann man daraus ableiten, dass der Nukleusvokal sich gewissermaßen selbst verdoppelt. Im Spanischen spielen Langvokale jedoch keine Rolle. Die Argumente dafür, Nukleus und Coda zum Reim zusammenzufassen, sind i. d. R. auch Nicht-Linguisten geläufig. Im Deutschen reimen sich Haus und Maus, im Spani‐ schen ver und placer. Wörter reimen sich also, wenn Nukleus und Coda der betonten Wortsilbe gleich sind. 13 Der Onset der Silben kann dagegen variieren, ohne dass der Reim davon betroffen ist. Ein weiteres Indiz für die engere Zusammengehörigkeit von Nukleus und Coda sind die Kombinationsbeschränkungen, die hier gelten. Im Spanischen kann nach einem komplexen Nukleus (Diphthong oder Triphthong) nur eine einfache Coda stehen; der Onset unterliegt dagegen keinen derartigen Kom‐ binationsbeschränkungen. Ein komplexer Nukleus kann sowohl auf einen einfachen als auch auf einen komplexen Onset folgen (4.2.4.1). Ein drittes Argument kommt aus der Metrischen Phonologie (4.3.7), die festgestellt hat, dass der Wortakzent in vielen Sprachen durch das Silbengewicht (Unterscheidung leichter und schwerer Silben) geregelt wird, und zwar insofern als der Wortakzent i. d. R. auf schwere Silben fällt (“stress to weight”). Die Bestimmung des Silbengewichts ist einfach: Eine Silbe ist leicht, wenn sie keine Coda und einen unverzweigten Nukleus hat. Schwere Silben haben entweder einen verzweigten Nukleus, im Spanischen also einen Diphthong oder Triphthong, 14 oder einen verzweigten Reim, enthalten also Nukleus und Coda. Dagegen ist der Onset für das Silbengewicht irrelevant: Ob ein einfacher, ein komplexer oder gar kein Onset vorliegt, hat darauf keinen Einfluss. Abb. 4.2-4 fasst dies zusammen. Abb. 4.2-4: Struktur leichter und schwerer Silben. 4.2.3 Silbenstrukturpräferenzen Die silbische Strukturierung ist durch den artikulatorischen Gegensatz zwischen vo‐ kalischer Öffnung und konsonantischem Verschluss und durch den auditiven Kontrast zwischen Sonoritätsmaximum und -minimum bestimmt. Der Nukleus wird von dem Segment besetzt, das den höchsten Öffnungsgrad und die höchste Sonorität aufweist. 178 4 Prosodie <?page no="179"?> 15 Für andere Sprachen gilt diese Beschränkung nicht. So kommt die Sequenz / rt/ im Russischen in manchen Flexionsformen durchaus im Onset vor, vgl. [rot] рот rot ‘Mund’ (Nom./ Akk. Sg.), aber [rta] рта rta (Gen. Sg.). Die Silbenränder (Onset und Coda) umfassen dagegen Segmente, die geschlossener bzw. weniger sonor sind. Vom Onset bis zum Nukleus ergibt sich deshalb eine Zunahme von Öffnung und Sonorität, umgekehrt nehmen Öffnungsgrad und Sonorität vom Nukleus zur Coda ab. Man kann diesen Sonoritätsverlauf wie folgt darstellen. Abb. 4.2-5: Präferierter Sonoritätsverlauf in der Silbe. Diese präferierte Sonoritätsbewegung kann bestimmte distributionelle Beschrän‐ kungen von Segmenten erklären. Beispielsweise erscheint die Folge / rt/ weder im Spanischen noch im Deutschen im Onset einer Silbe. 15 Im Deutschen ist sie aber als komplexe Coda ohne weiteres möglich (Hort / hɔrt/ [hɔɐ̯t]). Die umgekehrte Reihenfolge der Segmente / tr/ ist sowohl im Spanischen als auch im Deutschen ein geläufiger Onset (sp. tres, dt. treten), aber in beiden Sprachen ist / tr/ als Coda ausgeschlossen. Ausgehend von der Beobachtung, dass der Sonoritätsverlauf am Silbenende gegenläufig (abnehmend) zum Verlauf am Silbenanfang (ansteigend) ist, kann man folgende Regelmäßigkeit formulieren: Der Liquid / r/ muss sonorer als der Plosiv / t/ sein, denn / rt/ passt in die Position mit der abnehmenden, / tr/ dagegen in die mit der ansteigenden Sonorität. Dafür spricht, dass Plosive artikulatorisch gesehen ein Maximum an Verschluss/ Obstruktion aufweisen; Liquide als Sonoranten liegen dagegen näher an der vokalischen Artikulation und können in einigen Sprachen sogar silbenbildend sein, so etwa im Tschechischen (prst ‘Finger’, vlk ‘Wolf ’) oder im Kroatischen (vrt ‘Garten’, vgl. auch 2.5.1.5). Wenn man die vielfältigen Beobachtungen zusammenfasst, die die Reihenfolge und die Kombinationsmöglichkeiten der Segmente zu Silben betreffen, kann man eine Sonoritätshierarchie der Lautklassen erstellen. Diese kann von Sprache zu Sprache verschieden sein; für das Spanische ist folgende Reihung der Lautklassen sinnvoll: 7 offene Vokale a 6 mittlere Vokale e o 5 geschlossene Vokale i u 4 Gleitlaute j w 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln 179 <?page no="180"?> 16 In der Coda gilt diese Beobachtung nur eingeschränkt. Komplexe Codas können auch die Kombination von Plosiv + Frikativ / s/ enthalten (bíceps, clubs). Da / s/ aber in silbenphonologischer Hinsicht eine Sonderrolle einnimmt (4.2.4.1), ist es sinnvoll, zwischen der Lautklasse Frikativ und dem Segment / s/ zu unterscheiden. 3 Liquide l (ʎ) ɾ r 2 Nasale m n ɲ 1 Obstruenten f (θ) s x ʝ ʧ b d ɡ p t k Abb. 4.2-6: Sonoritätshierarchie der spanischen Lautklassen (mit steigender Sonorität von unten nach oben) (nach Hualde 2005: 72). Die Anordnung der Lautklassen nach ihrem Sonoritätsgrad resultiert aus den folgenden Beobachtungen: Zunächst werden die Lautklassen auf einer Stufe eingeordnet, die im Spanischen nicht miteinander in einer Silbenposition kombiniert werden können. Da Kombinationen von Plosiven und Frikativen im Onset ausgeschlossen sind, erhalten beide Lautklassen einen einheitlichen Sonoritätswert. 16 Liquide und Nasale werden un‐ terschiedlich bewertet, denn als zweite Bestandteile von verzweigten Onsets kommen nur Liquide, nicht Nasale, vor (tres). In der Coda ist die Kombination der beiden Lautklassen nur in Entlehnungen möglich (film). Es ist daher sinnvoll, die Liquide mit einem höheren Sonoritätswert einzustufen. Was die Vokale betrifft, könnte man einen einheitlichen Sonoritätswert ansetzen, da jeder Vokal eine eigenständige Silbe bilden kann und seine Kombinationsmöglichkeiten mit den konsonantischen Segmenten unbeschränkt sind. Doch bedeutet größere Öffnung auch mehr Schallfülle und damit mehr Sonorität, sodass auch hier eine Abstufung sinnvoll ist. Das wird deutlich, wenn man das Verhalten von Vokalen betrachtet, die an Silbengrenzen im Hiatus aufeinandertreffen. Derartige Hiate werden im Spanischen häufig durch die Herabstufung eines der Vokale zum Gleitlaut getilgt (4.2.6). Der offene Vokal / a/ bleibt auch bei hiatischem Silbenkontakt immer ein Vollvokal und erhält deshalb den höchsten Sonoritätsgrad. Dagegen werden die geschlossenen Vokale / i/ und / u/ fast immer zu Gleitlauten herabgestuft und erhalten folglich einen niedrigeren Sonoritätsgrad, der für die Gleitlaute [j] und [w] noch einmal herabgestuft wird. Die mittleren Vokale / e/ und / o/ verhalten sich bei der Gleitlautbildung je nach Varietät unterschiedlich und werden deshalb auf einer mittleren Position eingeordnet. Auf diese Weise können wir die obligatorische Stellung der Gleitlaute zwischen Nukleus und Onset bzw. Nukleus und Coda erklären und berücksichtigen, dass sie auch mit den geschlossenen Vokalen in diphthongischen Nuklei kombiniert werden können (viuda ‘Witwe’, muy ‘sehr’; vgl. 2.5.3.2). Auch wenn es für die unterschiedliche Sonorität der Lautklassen (ähnlich wie für die Silbengrenzen) keine unmittelbare artikulatorische oder akustische Entspre‐ chung gibt und wir es also mit einer phonologischen Hierarchisierung zu tun haben, kann dieses Konzept sowohl zahlreiche Fälle von diachronem Wandel als auch eine Reihe von synchronen phonologischen Prozessen plausibel erklären. 180 4 Prosodie <?page no="181"?> 17 Auch der kindliche Erstspracherwerb zeigt die Präferenz für CV-Silben. Wenn die ersten Wörter erworben werden, formen Kleinkinder diese oft so um, dass einfache CV.CV-Folgen entstehen wie z. B. bei Spiegel [piː.be] (vgl. Wiese 2011: 69). 18 Dies gilt uneingeschränkt für wortinterne Silben. Stimmen die Silbengrenzen nicht mit Morphem- oder Wortgrenzen überein, kommt es zu einem Konflikt zwischen den prosodischen Maximen, die auf gute Silbenstrukturen hinarbeiten, und den lexikalischen Maximen, die die lautliche Identität der sprachlichen Signifikanten sichern sollen (vgl. 4.2.5). Wenn man die Silbeninventare unterschiedlicher Sprachen analysiert, zeigt sich, dass auch hinsichtlich des Komplexitätsgrades von Silben universelle Tendenzen erkennbar sind. Im Sprachvergleich lässt sich eine deutliche Präferenz für einfache Silbenstrukturen ausmachen. Dies betrifft sowohl die Anzahl der Segmente, die in den einzelnen Silbenpositionen auftreten, als auch die Positionen selbst. Wie wir schon gesehen haben, gibt es in jeder Sprache den Silbentypus CV, und einige Sprachen (wie etwa das Hawaiische) erlauben nur diesen; weitaus weniger Sprachen lassen den Typus CCCVCCC zu. Wichtig ist außerdem, dass in einer Sprache, die Silbentypen wie CCCVCCC mit dreifachem Onset und dreifacher Coda erlaubt, auch die CV-Struktur mit einfachem Onset und unverzweigtem Reim möglich sein muss, was umgekehrt nicht gilt. In einem solchen Falle spricht man von einer Implikationshierarchie. Wenn in einer Sprache komplexe Silbenstrukturen vorkommen, impliziert dies, dass auch einfachere Silbenstrukturen möglich sind. Dagegen implizieren einfache Silben‐ strukturen nicht, dass auch komplexe Strukturen vorkommen. Das Komplexe setzt das Einfache voraus, aber nicht umgekehrt. 17 Mit der Präferenz für einfache Silbenstrukturen ist die Präferenz für starke So‐ noritätskontraste verknüpft. Idealerweise folgen konsonantische und vokalische Segmente unmittelbar aufeinander, denn dann ist ein maximaler Kontrast zwischen So‐ noritätsminima und -maxima gegeben. Die Präferenz für eine klare Sonoritätsdifferenz gilt auch im Silbenkontakt. Sind hier Vokale und Konsonanten direkt miteinander verknüpft, so garantieren sie auf diese Weise klare Sonoritätskontraste. Diese Präferenz führt zu zwei Kandidaten für die ideale Silbenstruktur, denn sowohl CVals auch VC-Silben gewährleisten, dass Vokale und Konsonanten im Silbenkontakt unmittelbar aufeinandertreffen (CV.CV bzw. VC.VC). Sprachtypologische Untersuchungen zeigen aber, dass die CV-Silbe, also eine Silbe mit Onset, aber ohne Coda, präferiert ist. Bevorzugt wird damit eine Silbenstruktur, bei der die maximale Obstruktion bzw. die minimale Sonorität zuerst und die Öffnung bzw. der Sonoritätsanstieg danach kommt. Auch bei der Syllabierung, also bei der Festlegung der Silbengrenzen, gilt diese Maxime. Bei der Syllabierung der Folge VCV wird die Grenze immer vor dem Konsonanten angesetzt (V.CV). 18 Die Regel, dass jede Silbe mit einem Onset beginnen sollte, impliziert, dass die Coda nicht präferiert ist: In jeder VCV-Folge wird der Konsonant automatisch in die Position des Onset verschoben (V.CV), und in VC.CV-Sequenzen verringert der Konsonant in der Codaposition den präferierten starken Sonoritätskontrast zwischen Vokal und Onsetkonsonant. Die angeführten Beobachtungen können zu folgenden Silbenstrukturpräferenzen zusammengeführt werden: 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln 181 <?page no="182"?> • Die präferierte Silbe hat a) einen Onset und b) keine Coda. In der präferierten Silbe sind c) alle Konstituenten einfach. • Der präferierte Onset umfasst a) nur ein Segment. Umfasst der Onset mehrere Segmente, sollte b) die Sonorität vom ersten zu den weiteren Segmenten zunehmen. • Die Coda ist a) nicht präferiert. Wenn eine Silbe eine Coda hat, enthält die präferierte Coda b) nur ein Segment. Umfasst die Coda mehrere Segmente, sollte c) die Sonorität vom ersten zum zweiten Segment abnehmen. Silbentypen, die den Silbenstrukturpräferenzen widersprechen, sind nicht falsch, denn diese sind keine Gesetze; sie geben vielmehr die Rahmenbedingungen für eine Bewertung der Silbenstrukturen ab. Insbesondere in der Optimalitätstheorie (3.4) lässt sich gut zeigen, dass Sprachen unterschiedliche Silbenstrukturen zulassen können, die Auswahl und die Frequenz dieser Strukturen aber nicht zufällig ist, sondern sich an universellen Beschränkungen (engl. constraints) wie den angeführten Silbenstrukturpräferenzen orientiert (Colina 2009). 4.2.4 Silbenstrukturen des Spanischen Im Spanischen ist im Unterschied zum Deutschen die Präferenz für einfache Silben‐ strukturen deutlich ausgeprägt. Dennoch sind komplexe Silbenstrukturen zulässig. Die Maximalsilbe umfasst fünf Segmente (transportar ‘transportieren’, CCVCC; claustro ‘Kloster, Kreuzgang’, CCVGC; industrial ‘industriell, Gewerbe-’, CCGVC). Durch Hiatustilgung (4.2.6) können im spontanen Sprechen sogar noch komplexere Silben entstehen (piedra instalada [ ˈ pje.ðɾajns.talaða] ‘eingebauter Stein’, CCVGCC; NGRAE 2011: 297). Komplexe Silben sind im Spanischen aber in der Minderzahl. Wesentlich häufiger sind Silben, die nur zwei oder drei Segmente umfassen. Mehrheitlich handelt es sich um CV-Silben, also um den Silbentypus, der typologisch gesehen unmarkiert und in allen Sprachen vertreten ist (NGRAE 2011: 294f.). Die starke Präferenz des Spanischen für die CV-Silbe zeigt sich nicht nur in deren hoher Frequenz. Es gibt außerdem eine Reihe von segmentalen und prosodischen Verfahren, die darauf ausgerichtet sind, die CV-Struktur in der Äußerung auch dann zu erzeugen, wenn sie in der lexikalischen Repräsentation der Lexeme nicht angelegt ist. Dazu gehören Abschwächungs- und Tilgungsprozesse bei Codakonsonanten (4.2.4.2) und die Resyllabierung (4.2.5). Gerade Letztere zeigt den hohen Stellenwert, den die silbenstrukturelle Optimierung im Spanischen einnimmt. Bei der erneuten Festlegung der Silbengrenzen in der Äußerung werden die Maximen, die zu unmarkierten Silbenstrukturen führen, höher eingestuft als diejenigen, die die Konstanz der phonischen Signifikanten und damit die Wiedererkennbarkeit der Lexeme betreffen. Deshalb werden Wortgrenzen bei der Resyllabierung ignoriert und eine Folge wie más adelante ‘später’ als má.sa.de.lan.te syllabiert. Alle drei Silbenpositionen können im Spanischen einfach oder komplex sein. In der Position des Nukleus ist neben den Verbindungen von Gleitlaut und Vokal, den Diphthongen (GV, VG; bien ‘gut’ (Adv.), vais ‘ihr geht’), auch die Verbindung eines Vokals mit zwei Gleitlauten, ein Triphthong (GVG; cambiáis ‘ihr wechselt’), 182 4 Prosodie <?page no="183"?> 19 Nach einem Konsonanten sind nackte Silben wortintern dagegen fast ausgeschlossen. Anders als im Deutschen werden im Spanischen bei der Syllabierung Morphemgrenzen nur bedingt beachtet. Nos + otros wird daher als no.so.tros ‘wir’ mit dem Codakonsonanten im Onset der Folgesilbe syllabiert. In reflektierter Aussprache kann die Morphemgrenze zwar wieder hörbar gemacht werden, aber diese Syllabierung ist im Spanischen hochgradig markiert (Hualde 2005: 73). möglich. Im Onset und in der Coda können maximal zwei Konsonanten auf‐ treten (pra.do ‘Weide, Wiese’, glo.bo ‘Kugel, Globus’ etc., ads.cribir ‘zuschreiben’, ins.truc.tor ‘Ausbilder’ etc.). Komplexe Onsets mit zwei Konsonanten und diph‐ thongischen Nuklei können miteinander kombiniert werden (claus.tro, CCVGC; indus.tria ‘Industrie’, CCGV). Nach einem komplexen Nukleus ist dagegen nur die einfache Coda möglich (muer.te ‘Tod’, CGVC; aus.tral ‘südlich’, VGC; vgl. 4.2.4.3). 4.2.4.1 Der Onset Obwohl das Spanische CV-Silben bevorzugt, sind Silben ohne Onset, also nackte Silben, am Wortanfang und wortintern im Hiatus 19 möglich. Der Nukleus einer nackten Silbe kann ein einfacher Vokal, aber auch ein Diphthong sein; Triphthonge sind ausgeschlossen (NGRAE 2011: 293f.). Abb. 4.2-7: Silben ohne Onset (nackte Silben): amor ‘Liebe’, real ‘wirklich; königlich’, austral ‘südlich’. Silben mit Onset überwiegen allerdings deutlich. Der bevorzugte Onset im Spani‐ schen ist unverzweigt (C). Es gibt keine Kombinationsrestriktionen zwischen Onset und Reim. Daher sind z. B. folgende Silbentypen möglich: Abb. 4.2-8: Silben mit unverzweigtem Onset: truco ‘Trick’, perspicaz ‘scharf(sinnig)’, bien ‘gut’ (Adv.). 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln 183 <?page no="184"?> 20 Verzweigte Onsets werden häufig durch Einfügen eines zusätzlichen Vokals, eines sog. Sprossvokals (sp. vocal protética/ esvarabática), aufgespalten (CCV > CV.CV). Diese Tendenz zur Vereinfachung komplexer Silbenanfangsränder (sog. Anaptyxe, von agr. ἀνάπτυξις anáptyxis ‘Entfaltung’) haben wir bereits in Abb. 2.5-11d kennengelernt, wo se trata ‘(es) handelt sich (um)’ als [set a ɾata] realisiert wird (vgl. auch Bradley 2006). Aus dem mittelalterlichen Spanisch sind auch Verschriftungen solcher Aussprachevarianten belegt: So ist neben cró.ni.ca ‘Chronik’ (mit verzweigtem Onset) auch co.ró.ni.ca (mit zwei einfachen Onsets) nachgewiesen (NGRAE 2011: 303). Der unverzweigte Onset ist die Silbenposition, in der der Differenzierungsgrad zwi‐ schen den verschiedenen konsonantischen Artikulationen am höchsten ist: alle Kon‐ sonanten des Spanischen können dort auftreten. Dies gilt ausnahmslos für den Onset wortinterner Silben. Der Wortanlaut ist für das Konsonantphonem / ɾ/ gesperrt. Zudem ist das Auftreten des palatalen Nasals / ɲ/ im Wortanlaut auf wenige, stilistisch markierte Lexeme und auf Entlehnungen beschränkt. Die folgende Tabelle zeigt Beispiele für unverzweigte Onsets im Wortanlaut und im wortinternen Silbenanlaut: - labial dental alveolar palatal velar Plosive pe.so ‘Ge‐ wicht’ co.po ‘Flo‐ cke’ - - tu ‘du’ co.to ‘Grenze’ - - ca.sa ‘Haus’ chi.co ‘Jun‐ ge’ be.so ‘Kuss’ lla.ve ‘Schlüssel’ - - da.ma ‘Da‐ me’ la.do ‘Seite’ - - ga.ma ‘Ton‐ leiter’ la.go ‘See’ Affri‐ katen - - - - - - chi.co ‘Junge’ co.che ‘Auto’ - - Frika‐ tive fi.no ‘fein’ so.fá ‘Sofa’ ce.ro ‘Null’ ca.za ‘Jagd’ su ‘sein’ ca.sa ‘Haus’ - - jo.ta ‘J’ o.jo ‘Au‐ ge’ - - - - - - ya ‘schon’ po.yo ‘Stein‐ bank’ - - Nasale ma.ta ‘er/ sie tötet’ ca.ma ‘Bett’ - - na.ta ‘Sah‐ ne’ to.no ‘Ton’ (ñu) ‘Gnu’ ca.ña ‘Rohr’ - - Late‐ rale - - - - lo.ro ‘Papa‐ gei’ po.lo ‘Pol’ llo.ro ‘ich weine’ po.llo ‘Huhn’ - - Vibran‐ ten - - - - ri.co ‘reich’ pe.rro ‘Hund’ - - - - - - - - - pe.ro ‘aber’ - - - - Abb. 4.2-9: Konsonanten im unverzweigten Onset (Wortanlaut und wortinterner Silbenanlaut). Auch der verzweigte Onset kommt im Spanischen vor; allerdings sind hier mit der Folge Obstruent + Liquid (OL) maximal zwei Segmente möglich. 20 184 4 Prosodie <?page no="185"?> 21 Dies gilt zumindest für das europäische und die meisten Varietäten des amerikanischen Spanisch. Wie wir in 3.1.1 (Fußnote 12) bereits gesagt haben, ist im mexikanischen Spanisch in Lehnwör‐ tern die Folge [tl] im Wortanlaut (tlaconete ‘Nacktschnecke’) und im wortinternen Silbenanlaut (a.tleta ‘Athlet’) durch den Kontakt mit der mesoamerikanischen Sprache Nahuatl möglich geworden (vgl. auch NGRAE 2011: 302f. und Pustka 2022: 522f.). Für Genaueres zur Syllabierung dieser Konsonantenverbindung vgl. 4.2.5 und 5.1.4. 22 Im Spanischen repräsentiert die Graphie von Lehnwörtern teilweise noch die komplexen Onsets der Gebersprachen, so in den (direkt oder indirekt durch Vermittlung des Neulateinischen) aus dem Altgriechischen entlehnten psique ‘Psyche’ (< ψυχή psychē) oder gnomo ‘Zwerg’ (< G N O M U S < γνώμη gnōmē ‘Verstand, erkennender Geist’). Die betreffenden Wörter werden aber lautlich stets mit vereinfachtem Onset, also als [sike] und [nomo], realisiert (NGRAE 2011: 303ff.). labial alveolar velar Plosiv + Liquid pra.do ‘Wiese’ pla.no ‘flach’ tru.co ‘Trick’ - cru.do ‘roh’ cla.ve ‘Schlüs‐ sel-’ com.pra ‘Einkauf ’ em.pleo ‘Anstellung’ le.tra ‘Buchstabe’ - ma.cro- ‘makro-’ te.cla ‘Taste’ bra.vo ‘tapfer’ blu.sa ‘Bluse’ dro.ga ‘Droge’ - gru.po ‘Gruppe’ glo.bo ‘Globus’ co.bre ‘Kupfer’ ha.blar ‘sprechen’ pie.dra ‘Stein’ - ma.gro ‘mager’ in.glés ‘englisch’ Frikativ + Liquid frí.o ‘kalt’ fla.co ‘dünn’ - - - - ci.fra ‘Ziffer’ mu.fla ‘Muffel(ofen)’ - - - - Abb. 4.2-10: OL-Sequenzen in verzweigten Onsets wortanlautender und wortinterner Silben. Wie die Tabelle zeigt, sind nicht alle Obstruenten in OL-Sequenzen erlaubt: Nur die Plosive sowie der labiodentale stimmlose Frikativ / f/ können als erster Konsonant auftreten. Alle anderen Frikative sowie die Affrikate / ʧ/ sind für komplexe Onsets gesperrt. Die dentalen Plosive können außerdem nicht mit / l/ kombiniert werden. 21 Im Deutschen ist der Komplexitätsgrad verzweigter Onsets wesentlich höher. Silben‐ anfangsränder mit drei Konsonanten sind möglich und geläufig (Strumpf; Wiese 2011: 73). Außerdem treten neben OL-Sequenzen (draußen, fleißig) auch die Kombinationen Frikativ+Plosiv (Skelett, Stelle), Plosiv+Nasal (Knecht) und Nasal+Nasal (Mnemotechnik) auf. 22 Im Vergleich zu OL liegt bei derartigen Onsets aber ein nicht optimaler Sonori‐ tätsverlauf vor, weil der Kontrast zwischen den beiden Onsetkonsonanten gering ist. Abb. 4.2-11 zeigt die unterschiedliche Sonoritätsbewegung in einer spanischen und einer deutschen Silbe anhand der in Abb. 4.2-6 vorgestellten Sonoritätshierarchie an. 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln 185 <?page no="186"?> 23 Der Einfachheit halber übernehmen wir hier die Sonoritätsgrade der spanischen Sonoritätshierar‐ chie; im Deutschen müssten Plosive und Frikative zwei unterschiedliche Sonoritätsgrade erhalten (vgl. Wiese 2011: 71f.). 24 Der Konsonant [s] hat eine Sonderstellung in der Sonoritätshierarchie, da er ein lokales Sono‐ ritätsmaximum erzeugt. Eine Folge wie engl. [stɒp] hat einen Onset mit einem abnehmenden (! ) Sonoritätsverlauf. Das silbenstrukturelle Verhalten von [s] ist deshalb in mehreren Sprachen abweichend in dem Sinne, dass es in Kombinationen auftritt, die nicht dem ansonsten gültigen Sonoritätsverlauf entsprechen (vgl. Hall 2 2011: 247f. und Pustka 2 2016: 114). t ɾ e s k n ɛ ç t 1 3 6 1 - 1 2 6 1 1 Abb. 4.2-11: Sonoritätsbewegung in der spanischen Silbe tres ‘drei’ und in der deutschen Silbe Knecht. 23 Der hohe Stellenwert, den Sonoritätskontraste und ein kontinuierlicher Sonoritätsver‐ lauf im Spanischen haben, lässt sich auch daran erkennen, dass die Kombination des Frikativs [s] mit einem weiteren konsonantischen Segment im Onset (sC(C)V) nicht möglich ist. 24 Eine solche tautosyllabische Sequenz (sp. secuencia tautosilá‐ bica) ist aber in anderen Sprachen, unter anderem im Lateinischen, erlaubt. Bei der Weiterentwicklung lateinischer Wörter zum Altspanischen tritt zur Optimierung des Sonoritätsverlaufs ein sog. Sprossvokal (sp. vocal protética/ esvarabática) auf, und die zunächst tautosyllabische Konsonantensequenz wird auf zwei Silben verteilt und damit heterosyllabisch (sp. heterosilábico): (Vs.C(C)V), so z. B. in lat. S CHO LA > sp. es.cue.la. Auch heute ist das Einfügen eines prothetischen Vokals produktiv. Engl. stress wird zu sp. es.trés, ebenso engl. standard zu sp. es.tán.dar. Bei diesen Wörtern wird das Einfügen des Sprossvokals durch die Schreibung reflektiert; in anderen Fällen manifestiert sich der Sprossvokal nur in der Aussprache, so z. B. in sp. stop [es ˈ top] (Hualde 2005: 77). Der Onset kann als eine prinzipiell starke Konsonantenposition eingestuft werden. Dies gilt besonders für den Wortanlaut. Da dieser für die Worterkennung eine zentrale Rolle spielt (2.4.2), sind Konsonanten in dieser Position nicht den Abschwä‐ chungsprozessen (sp. debilitamiento) unterworfen, die für Codakonsonanten sowohl in der Synchronie als auch in der Diachronie im Spanischen typisch sind (4.2.4.2). Im Wortanlaut, teilweise auch im wortinternen Silbenanlaut, ist beim (dorso)palata‐ len Frikativ / ʝ/ sogar die Tendenz zu einem konsonantischen Stärkungsprozess (sp. reforzamiento) festzustellen. / ʝ/ wird im Anlaut zur palatalen Affrikate [ɟ͡ʝ], in lateinamerikanischen Varietäten zur postalveolaren Affrikate [ʤ], im argentinischen Spanisch zu [ʒ] bzw. [ʃ], verstärkt (yo ‘ich’ [ɟ͡ʝo] ~ [ʤo] ~ [ʒo] ~ [ʃo]; vgl. genauer 2.5.1.2). Auch die Tatsache, dass steigende Diphthonge im Wort- oder Silbenanlaut dazu tendieren, den Gleitlaut zu einem Konsonanten weiterzuentwickeln (2.5.3.2), zeigt, dass die Onsetposition die Verstärkung der artikulatorischen Obstruktionsbewegungen bzw. die Minimierung der Sonorität begünstigt. Die Allophonie der stimmhaften Plosive ist allerdings ein Hinweis darauf, dass man noch genauer zwischen den 186 4 Prosodie <?page no="187"?> 25 Die spanische Aussprache geht auf die falsche Interpretation des Digraphen <ch> zurück, der im Katalanischen für [k] und nicht wie im Spanischen für die Affrikate [ʧ] steht. 26 Entlehnte Wörter werden manchmal durch das Einfügen eines Vokals an die spanischen Silbenbe‐ dingungen angepasst, wodurch Doppelformen wie frac [fɾak] − fraque [ ˈ fɾake] ‘Frack’ entstehen können (vgl. NGRAE 2011: 312ff.). verschiedenen Kontexten unterscheiden muss, in die die betreffende Silbe eingebettet ist. Für den Onset einer Silbe im Phrasenanlaut gilt die Einordnung als starke Konsonantenposition ohne jede Einschränkung. Im Wortanlaut nach Pause, also zu Beginn einer phonologischen Phrase, werden / b d ɡ/ als Plosive, d. h. mit maximaler Obstruktion, ausgesprochen (¡vamos! [ ˈ bamos] ‘Gehen wir! ’). Im phraseninternen Wortanlaut und im wortinternen Silbenanlaut werden sie dagegen meist als Frikativapproximanten mit einem deutlich geringeren Grad an Obstruktion realisiert (se van [se ˈ βan] ‘sie gehen weg’; vgl. 2.5.1.1). In einigen Varietäten des Spanischen ist der Onset wortinterner Silben nach Vokal (im Falle von -ado/ -ada) durch Tilgungspro‐ zesse (sp. elisión) gefährdet: So werden etwa im karibischen Spanisch, das sich durch eine starke Tendenz zur Konsonantenschwächung auszeichnet (consonantismo débil), Formen wie encantado ‘angenehm’ und pescado ‘Fisch(gericht)’ mit auslautendem [ao̯] ~ [aw] realisiert (NGRAE 2011: 146ff.). 4.2.4.2 Die Coda Die im Spanischen häufigste Silbenstruktur ist die (C)CV-Silbe, also die offene Silbe ohne Coda (NGRAE 2011: 296f., Quilis 1992: 62). Bei dieser Präferenz handelt es sich nicht ausschließlich um ein quantitatives Phänomen. Weitere Hinweise auf die starke Bevorzugung offener Silben geben die verbreiteten Abschwächungsbzw. Tilgungs‐ prozesse in der Coda, die eingeschränkte Distribution sowie die Assimilationen der Konsonanten in dieser Position. Die folgende Tabelle gibt jeweils Beispiele für die Konsonanten, die in der einfachen Coda in wortinternen und wortfinalen Silben auftreten können. Dieses Inventar zeigt, dass die Distribution der Konsonanten in der einfachen Coda von der im einfachen Onset abweicht; Hualde (2005: 76) spricht hier von einer “clear imbalance”. Im Onset sind alle Konsonanten des Spanischen zugelassen (4.2.4.1); die Codaposition ist dagegen durch eine Reihe von Einschränkungen gekennzeichnet: • Palatale Konsonantphoneme wie / ʝ/ , / ɲ/ und / ʎ/ sind für die Codaposition gesperrt. Bei den Lateralen kann nur / l/ auftreten. Die palatale (bzw. postalveolare) Affrikate / ʧ/ ist zwar in Lehnwörtern in der wortfinalen Coda belegt wie in sándwich oder in katalanischen Eigennamen wie Roig [roʧ] oder Blanch [blan j ʧ] 25 ; häufig wird aber durch das Einfügen eines Sprossvokals die Affrikate zum Onset einer zweiten Silbe, z. B. [ ˈ roʧe], sodass / ʧ/ als Codakonsonant peripher bleibt. • Nur dentale und alveolare Konsonanten treten regelmäßig in der Codaposi‐ tion auf, labiale und velare Konsonanten jedoch nur in Lehnwörtern. 26 In der wortinternen Coda kommen / s/ , / θ/ , / N/ , / l/ und / ɾ/ vor. Im Wortauslaut ist der 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln 187 <?page no="188"?> 27 In den Varietäten, in denen der Nasalkonsonant in wortauslautender Position velarisiert bzw. labialisiert wird, erscheint hier [ŋ] bzw. [m] (vgl. 2.5.1.3 bzw. 5.1.4). Plosiv / d/ möglich, der phonetisch zumeist als Frikativapproximant [ð] realisiert oder ganz getilgt wird (2.5.1.1). Schwächung (Aspiration) bis Tilgung ist auch bei Coda-s in zahlreichen Varietäten zu beobachten. Dieses Phänomen ist u. a. für das andalusische und das argentinische Spanisch typisch (vgl. 1.5, 2.5.1.2, 3.1.2.2). • In der Coda sind zahlreiche phonologische Oppositionen neutralisiert. Bei den Plosiven betrifft dies die Opposition stimmlos/ stimmhaft, d. h., es gibt keine Minimalpaare, in denen in der Coda / p t k/ und / b d ɡ/ kontrastieren. Diese Neutralisierung kann phonologisch mithilfe der Archiphoneme / P T K/ gekenn‐ zeichnet werden, z. B. apto / ˈ aP.to/ ‘geeignet’, abdomen / aP ˈ do.meN/ ‘Unterleib’ (vgl. 3.1.1). In der Lautung reichen die Realisierungen vom stimmhaften Frikativapproximanten bis zum stimmlosen Plosiv bzw. bis zur Tilgung (2.5.1.1). • Bei Nasalen ist die Opposition im Artikulationsort neutralisiert. In der wortin‐ ternen Coda übernimmt der Nasal den Artikulationsort des folgenden silbenini‐ tialen Konsonanten (2.5.1.3). Da deshalb der Artikulationsort vorhersagbar ist und nicht mehr oppositionsbildend eingesetzt werden kann, lässt sich phonologisch das Archiphonem / N/ ansetzen (/ ˈ aN.bos/ [ ˈ ambos] ambos ‘beide’, / ˈ kaN.to/ [ ˈ kan̪to] canto ‘Gesang’, / ˈ aN.ʧo/ [ ˈ an j ʧo] ancho ‘breit’, / ˈ aN.xel/ [ ˈ aŋxel] ángel ‘Engel’). Im Wortauslaut kann (phrasenfinal bzw. phrasenintern vor Vokal) ohnehin nur der dentale Nasal / n/ auftreten. 27 • Auch bei Vibranten und Lateralen gibt es in der Codaposition keine phonolo‐ gischen Oppositionen. Der palatale Lateral / ʎ/ kann silben- und wortfinal nicht auftreten, und während bei den r-Lauten sowohl Tap als auch Trill vorkommen können, ist der Tap die verbreitete und vergleichsweise unmarkierte Realisierung, weshalb hier die Phoneme / l/ und / ɾ/ angesetzt werden können (/ ˈ al.to/ [ ˈ a l ̪ to] alto ‘hoch’, / kaɾ.ta/ [ ˈ kaɾta] ~ [ ˈ karta] carta ‘Brief ’). Im andalusischen, kanarischen und karibischen Spanisch geht die Schwächung der artikulatorischen Distinktivität noch weiter. Die Opposition zwischen den Liquiden ist in diesen Varietäten in der Silbenkoda neutralisiert (2.5.1.5). • Bei den Frikativen können hinsichtlich der Stimmhaftigkeit Assimilierungs‐ prozesse an den folgenden Konsonanten auftreten, z. B. asno / ˈ as.no/ [ ˈ azno] ‘Esel’ (2.5.1.2). 188 4 Prosodie <?page no="189"?> 28 Corps und karst sind Ausnahmen und werden nur bei sorgfältiger Aussprache mit drei Konsonanten im Auslaut realisiert. labial (dental) alveolar palatal velar / P T K/ ap.to ‘geeignet’ - ét.ni.co ‘ethnisch’ - ac.to ‘Handlung, Tat’ crep ‘Krepp’ - dé.fi.cit ‘Defizit’ sánd.wich ‘Sandwich’ frac ‘Frack’ ab.do.men ‘Unterleib’ - ad.jun.to ‘beiliegend’ - sig.no ‘(An-)Zeichen’ club ‘Klub’ - ver.dad ‘Wahrheit’ - grog ‘Grog’ / f (θ) s x/ af.ga.no ‘afghanisch’ mez.cla ‘Mischung’ as.no ‘Esel’ - - chef ‘Küchenchef ’ na.riz ‘Nase’ tres ‘drei’ - reloj ‘Armbanduhr’ / N/ am.bos ‘beide’ - can.to ‘Gesang’ - - al.bum ‘Album’ - pan ‘Brot’ - - / l/ - - al.to ‘hoch’ - - - - sal ‘Salz’ - - / ɾ/ - - car.ta ‘Brief ’ - - - - mar ‘Meer’ - - Abb. 4.2-12: Konsonanten in der unverzweigten Coda wortinterner und wortfinaler Silben. / θ/ und das Merkmal [dental] sind geklammert, weil der dentale Frikativ in den verbreiteten seseo-Varietäten durch / s/ ersetzt wird. Die Einschränkungen für Konsonanten in der Codaposition und die vielfältigen Schwächungs- und Tilgungsprozesse machen die starke Präferenz des Spanischen für offene Silben deutlich. So treten verzweigte Codas ausschließlich in Lehnwörtern wie z. B. pers.picaz, ads.cribir, cons.tancia ‘Beständigkeit’ etc. auf (NGRAE 2011: 319). In der verzweigten Coda können, wie in Abb. 4.2-13 illustriert, maximal zwei Konso‐ nanten stehen. 28 Bei sorgfältiger, an der Schreibung orientierter Aussprache werden beide Codakonsonanten ausgesprochen; oft werden komplexe Codas jedoch durch Tilgungsprozesse vereinfacht. In der Verbindung Plosiv+/ s/ wird der Plosiv getilgt 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln 189 <?page no="190"?> 29 Plosive werden auch in den Verbindungen Sonorant+Plosiv (folk ‘Folkmusik’, récord ‘Rekord’) und / s/ +Plosiv (postdata ‘Nachschrift’, test ‘Test’) getilgt; gleiches gilt für die dreikonsonantigen Codas in karst ‘Karst’ und (sumiller de) corps ‘Kammerherr’. 30 Silbenbildende Konsonanten werden in der IPA-Transkription mit einem kleinen Strich unter dem betreffenden Konsonantensymbol markiert. (/ bi.seps/ [ ˈ bises] bíceps ‘Bizeps’). 29 Die Sequenz Nasal+/ s/ wird durch Nasaltilgung vereinfacht (/ trans/ [tɾas] trans-). Die Kombinationen [ls], [lf], [ɾs] und [ɾf] sind dagegen relativ stabil, was mit dem klaren Sonoritätskontrast zwischen Frikativ und Liquid erklärt werden kann (NGRAE 2011: 324). - labial dental velar Plosive - bí.ceps [ ˈ bises] ‘Bi‐ zeps’ - ro.bots [ro ˈ βos] ‘Roboter (Pl.)’ ex.tra [ ˈ estɾa] ‘Extra’ tó.rax [ ˈ toɾas] ‘Brustkorb’ abs.ten.ción [asten ˈ sjon] ‘Enthal‐ tung’ clubs [klus] ‘Klubs’ ads.cri.bir [askɾi ˈ βiɾ] ‘zuschreiben’ - - - Frikative - - pos(t).data [pos ˈ ðata] ‘Nachschrift’ test [tes] ‘Test’ - - Nasale - - ins.truc.tor [i n struk ˈ toɾ] ‘Ausbilder’ trans.cri.bir [tɾa n skɾi ˈ βiɾ] ‘transkribie‐ ren’ - - Laterale - - sols.ti.cio [sols ˈ tisjo] ‘Sonnenwen‐ de’ vals [bals] ‘Walzer’ - - Vibranten - - pers.pi.caz [peɾspi ˈ kas] ‘scharf(sin‐ nig)’ surf [suɾf] ‘Surfing’ - - Abb. 4.2-13: Verzweigte Codas in wortinterner und wortfinaler Position (gebräuchliche Aussprache). 4.2.4.3 Der Nukleus Im Spanischen muss der Nukleus einer Silbe immer ein Vokal sein. Dies ist nicht in allen Sprachen der Fall. So können im Deutschen unbetonte Vokale in Auslautsilben dann getilgt werden, wenn ein Sonorant als Silbenkern übrigbleibt, z. B. haben [ ˈ habən] > [ ˈ habm̩]. 30 Im Spanischen muss dagegen jede Silbe einen vokalischen Nukleus enthalten. Der Nukleus kann einfach (V) oder verzweigt sein und einen steigenden 190 4 Prosodie <?page no="191"?> 31 Durch die Hiatustilgung beim spontanen Sprechen ist diese Regel teilweise aufgehoben, vgl. [ ˈ pje.ðɾajns.ta ˈ la.ða] piedra instalada. (GV) oder fallenden (VG) Diphthong umfassen. Möglich sind auch verzweigte Nuklei mit drei Segmenten (GVG), also triphthongische Nuklei (2.5.3.2). Abb. 4.2-14: Einfache und verzweigte Nuklei: más ‘mehr’, bien ‘gut’ (Adv.), buey ‘Ochse’. Ist der Nukleus verzweigt, kann die Codaposition nur einfach besetzt sein (muer.te ‘Tod’, sies.ta ‘Mittagsruhe’ vs. trans.cribir ‘transkribieren’). 31 Diese phono‐ taktische Regularität ist ein weiterer Hinweis darauf, dass Nukleus und Coda eng zusammengehören und in einer übergeordneten Konstituente, dem Reim, zusammen‐ gefasst werden können (4.2.2). Bei den triphthongischen Nuklei gilt die zusätzliche Einschränkung, dass danach nur eine einfache Coda mit / s/ als flexivischem Konsonan‐ ten (2. Person Plural im europäischen Spanisch) möglich ist (cam.biáis ‘ihr wechselt’, con.ti.nuáis ‘ihr setzt fort’). 4.2.5 Syllabierung und Resyllabierung Unter Syllabierung (sp. silabación oder silabificación) versteht man das Bestimmen der Silbengrenzen in einer Folge von Segmenten. Da jeder Vokal automatisch ein Nukleus ist, geht es hierbei um die Verteilung der konsonantischen Segmente auf die einzelnen Silben. Die Syllabierung orientiert sich an den beiden Prinzipien, die wir bereits als maßgebend für die Silbenstruktur angeführt haben: an einem guten Sono‐ ritätsverlauf und an starken Sonoritätskontrasten. Eine Segmentfolge VCV wird daher so syllabiert, dass der Konsonant als Onset der zweiten Silbe zugewiesen wird (V.CV, 4.2.3). Bei einer Folge VCCV ergeben sich zwei Möglichkeiten, weil die Silben‐ grenze entweder zwischen den beiden Konsonanten oder vor den beiden Konsonanten liegen kann. Welche Möglichkeit gewählt wird, hängt vom Sonoritätsverlauf innerhalb der Konsonantenfolge ab. Die Silbengrenze wird vor dem Konsonanten angesetzt, der die geringste Sonorität hat. Auf diese Weise entsteht ein optimaler Sonoritätsverlauf: alto mit dem Sonoritätsverlauf 7316 (vgl. Abb. 4.2-11) wird al.to (73.16) syllabiert, sodass die abnehmende Sonorität von der Coda zum Onset garantiert bleibt; abrir ‘öffnen’ 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln 191 <?page no="192"?> 32 Der Glottisverschluss, der jedem vokalisch anlautenden Wort automatisch vorangeht, wird nicht als Phonem des Deutschen gewertet, sondern hat lediglich eine delimitative Funktion, da er die Wortgrenze signalisiert (vgl. Kohler 2 1995: 100ff., Kleber 2023: 135ff.). 33 Die Resyllabierung erfolgt in den Grenzen der phonologischen Phrase (φ) (4.1.1). Da diese i. d. R. einer Sinneinheit entspricht, ist ihr Umfang bei der spontanen Sprachproduktion gut vorhersehbar, sodass sowohl die Vorgängerals auch die Folgesilbe beim Sprechen gleichermaßen präsent sein können. Gleichzeitig trägt das Fehlen der Resyllabierung an den Phrasengrenzen dazu bei, die Abgrenzung der Phrasen lautlich prägnanter zu machen. mit der Konsonantenfolge OL wird dagegen als a.brir (7.1353) syllabiert, sodass beide Konsonanten den verzweigten Onset der zweiten Silbe bilden. Auch bei Folgen von mehr als zwei zwischenvokalischen Konsonanten wird die Silbengrenze nach diesem Prinzip festgelegt, z. B. in mons.truo ‘Monster’ (2621.1346). Eine Ausnahme bilden die Folgen [dl] und [tl] sowie die Verbindung von [s] oder [z] mit Sonoranten. Obwohl die Plosive [d] und [t] sowie die Frikative [s] und [z] den geringeren Sonoritätsgrad aufweisen, werden sie als Codakonsonanten der vorhergehenden Silbe zugeordnet (ad.lá.te.re ‘Adlatus’, at.las ‘Atlas’, is.la ‘Insel’, as.no ‘Esel’). Grund hierfür ist, dass diese Konsonantensequenzen nicht im Wortanlaut auftreten. Zusätzlich zum Sonori‐ tätsverlauf muss bei der Syllabierung also auch beachtet werden, ob die Onsets, die aus der Syllabierung resultieren, geläufige Anlautkombinationen sind. Auf die davon abweichende Tatsache, dass im mexikanischen Spanisch [tl] aufgrund des Kontakts zum Nahuatl, wo diese Anlautverbindung geläufig ist, häufig als Onset syllabiert wird (a.tlas), haben wir bereits in 1.5 und 3.1.1 (Fußnote 12) hingewiesen (vgl. auch NGRAE 2011: 326 und 5.1.4). Bisher haben wir die Frage der Syllabierung nur für einzelne Wörter betrachtet. Für das Deutsche ist dies auch ausreichend, da Silbengrenzen hier nur innerhalb von Wörtern gesetzt werden und Wort- und Silbengrenzen miteinander korrelieren: Die isoliert geltenden Syllabierungen werden auch dann beibehalten, wenn diese Wörter zu komplexeren Konstruktionen verknüpft werden und sich im Silbenkontakt neue Silbenstrukturen ergeben könnten, wie z. B. in der Präpositionalphrase mit einem Auto [ ˌ mıt. ʔ aı ̯ .nəm ˈ ʔ aʊ̯.to]. Markierte Silbenstrukturen wie die beiden nackten Silben [ ʔ a ı ̯ ] und [ ʔ aʊ̯] werden in Kauf genommen, um die Wortgrenzen intakt zu halten. 32 Das Spanische wählt die entgegengesetzte Lösung: Die entsprechende Sequenz con un auto wird hier [ ˌ ko.nu ˈ naw.to] syllabiert; durch die Verschiebung des Codakonsonanten von con in den Onset der ersten Silbe von auto entsteht eine CV-Silbe. Nicht die Bewahrung der Wort- oder Morphemgrenzen ist hier also das primäre Ziel; wichtiger ist es, in der Lautkette gute Silbenstrukturen zu haben. Jede Äußerung wird daher einer erneuten Syllabierung, der sog. Resyllabierung (sp. resilabación), unterworfen, bei der die Prinzipien der Silbenbildung über die Wortgrenzen hinweg zur Anwendung kommen. 33 Im optimalitätstheoretischen Rahmen (3.4) lässt sich der Unterschied zwischen dem Deutschen und dem Spanischen mithilfe der folgenden Constraints modellieren: 192 4 Prosodie <?page no="193"?> • O N S E T Eine Silbe hat einen Onset (Anfangsrand). • A L I G N -L E F T Der linke Rand eines grammatischen Wortes (d. h. einer in der kon‐ kreten Rede produzierten Wortform) stimmt mit dem linken Rand einer Silbe überein. Um den Unterschied zwischen dem Deutschen und dem Spanischen zu erfassen, muss man davon ausgehen, dass A LI G N -L E F T im Deutschen in der Beschränkungshierarchie höher steht als im Spanischen. Betrachten wir hierzu die folgenden Tableaus: - - / koN#uN#auto/ O N S E T A L I G N - L E F T (1) ☞ [ko.nu.naw.to] - ** (2) - [kon.un.aw.to] **! - - - / mɪt#aɪ ̯ nəm#aʊ̯to/ A L I G N - L E F T O N S E T (1) - [mɪ.taɪ ̯ nə.maʊ̯.to] **! - (2) ☞ [mɪt. ʔ aɪ ̯ nəm . ʔ aʊ̯.to] - ** Abb. 4.2-15: OT-Tableau zur (Re-)Syllabierung im Spanischen (oben) und im Deutschen (unten). Im Spanischen verstößt Kandidat (2) [kon.un.aw.to] zweimal gegen den in der Hierar‐ chie höher stehenden Constraint O N S E T und scheidet damit zugunsten von Kandidat (1) [ko.nu.naw.to] aus. Im Deutschen ist der Fall umgekehrt: Hier steht A LIG N -L E F T in der Beschränkungshierarchie höher, weshalb Kandidat (1) [mı.ta ı ̯ .nə.maʊ̯.to] wegen der zweifachen Verletzung dieses Constraints ausscheidet. Mit der Optimalitätstheorie lässt sich darstellen, wie Konflikte zwischen mitein‐ ander konkurrierenden Maximen geregelt werden. Ein solcher Fall liegt bei der Resyllabierung vor: Bei der Festlegung von Silbengrenzen steht die Präferenz für gute Silbenstrukturen der Präferenz für ein leichtes Wiedererkennen der Signifikanten in allen Kontexten gegenüber. 4.2.6 Hiate und Silbenkontraktion An der Silbengrenze können auch zwei Vokale miteinander in Kontakt kommen ((C)V.V(C)). Dann spricht man von einem Hiatus (auch: Hiat, sp. hiato). Hiate sind im Spanischen sowohl wortals auch phrasenintern prinzipiell möglich. Bei ihrer lautlichen Realisierung muss man darauf achten, dass anders als im Deutschen die Vokale nicht durch den sog. Knacklaut (Glottisverschluss) voneinander getrennt werden, vgl. ein Auto [ ʔ aı ̯ nˈ ʔ aʊ̯.to]. Die beiden Vokale sind sowohl artikulatorisch als auch im Schallereignis durch nahtlose Übergänge miteinander verbunden, so z. B. in real [re ˈ al] ‘real, königlich’ oder in la hora [la ˈ oɾa] ‘die Stunde’). 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln 193 <?page no="194"?> 34 Auch beim Kontakt zweier identischer Konsonanten an einer Silbengrenze kann eine gelängte Artikulation entstehen (obwohl das Spanische phonologisch gesehen weder gelängte Vokale noch gelängte Konsonanten kennt). Die Längung wird, wie Hualde (2005: 97) schreibt, aber nur bei [n] (comen nueces ‘sie essen Nüsse’) und [l] (mal lago ‘schlechter See’) deutlich. Andere Sprachen wie das Lateinische oder das Italienische verfügen über phonologische Langkonsonanten (Geminaten), die mit den entsprechenden kurzen Gegenstücken kontrastieren, z. B. lat. P A L A ([l]) ‘Spaten’ vs. P A L L A ([lː]) ‘Mantel’, it. tono [n] ‘Ton’ vs. tonno [nː] ‘Thunfisch’ (vgl. Heinz & Schmid 2021: 177-182). Der Hiatus ist silbenphonologisch gesehen ein nicht präferierter Silbenkontakt. Bevorzugt sind Silbenkontakte mit einem eindeutigen Sonoritätsgefälle zwischen den Segmenten (4.2.3). Wenn zwei Vokale an der Silbengrenze aufeinandertreffen, entsteht aber nur ein geringer artikulatorischer Kontrast und kein bzw. ein minimales Sono‐ ritätsgefälle. Das Spanische hat deshalb eine ausgeprägte Tendenz zur Hiatustilgung (sp. tendencia antihiática, NGRAE 2011: 353ff.). Es gibt eine Reihe von Prozessen, die zur Verschmelzung der Vokale in einem Nukleus und damit zur Silbenkontraktion führen. Diese können sowohl phrasenintern, d. h. an Wortgrenzen wie in ocho horas [ ˈ oʧoɾas] ‘acht Stunden’, als auch wortintern auftreten (área [ ˈ aɾ e ̯ a] ‘Fläche, Gelände’). Mit dem Terminus Synalöphe (auch: Synaloiphe, sp. sinalefa) bezeichnet man die phraseninterne Hiatustilgung; werden Hiate im Wortinnern getilgt, spricht man von Synärese (sp. sinéresis). Wie viele und welche Hiate getilgt werden, wird durch varietätenlinguistische Faktoren beeinflusst. Hiatustilgungen treten häufig im informellen Alltagssprechen auf; manche sind jedoch diastratisch markiert und sollten in gepflegter Aussprache vermieden werden (Kubarth 2009: 94-97). Auch phonetische Faktoren nehmen hier Einfluss. So spielt der Grad der Differenz zwischen den Vokalen eine Rolle: Treffen an der Silbengrenze zwei identische Vokale aufeinander, werden sie in aller Regel kontrahiert, d. h. in Sequenzen wie coordinar ‘koordinieren’ oder la amiga ‘die Freundin’ werden nur bei sehr sorgfältiger Artikulation zwei Vokale mit dazwischen liegender Silbengrenze realisiert. Die normalerweise erfolgende Vokalkontraktion lässt sich allenfalls in der Dauer erkennen ([koɾði ˈ naɾ], [la ˈ miɣa], [ ˈ laːnʧa ˈ mesa] la ancha mesa ‘der breite Tisch’), wobei phonologisch gesehen zwei vokalische Nuklei vorliegen (vgl. Hualde 2005: 90f. und NGRAE 2011: 340f.). 34 Treffen unterschiedliche Vokale an den Silbengrenzen aufeinander, ist die Sil‐ benkontraktion durch Vokalverschmelzung ausgeschlossen. Um eine tautosyllabische Artikulation der Vokale möglich zu machen, wird daher einer der Vokale zum Gleitlaut abgeschwächt. Auf diese Weise entstehen komplexe diphthongische, teilweise sogar triphthongische Nuklei (VV > GV, VG; VVV > GVG). Die Frage, ob eine Hiatustilgung eintritt und welcher der Vokale dabei abgeschwächt wird, hängt vom Wortakzent, dem Sonoritätsgrad der Vokale und deren Reihenfolge ab. Generell gelten folgende Prinzipien (2.5.3.2): • Eine Hiatustilgung tritt fast immer auf, wenn beide Vokale unbetont sind wie in [mjeɾ ˈ ma.no] mi hermano ‘mein Bruder’. 194 4 Prosodie <?page no="195"?> • Zum Gleitlaut abgeschwächt wird der Vokal mit dem geringeren Öffnungsgrad bzw. der geringeren Sonorität, vgl. [twa ˈ βwe.lo] tu abuelo ‘dein Großvater’, [law ˈ njon] la unión ‘die Verbindung’. Die geschlossenen Vokale [i] und [u] werden, wenn unbetont, fast immer zu Gleitlauten. In informellen Sprechstilen werden teilweise auch die halb geschlossenen Vokale [e] und [o] zu den Halbvokalen [ e ̯ ] und [o̯] bzw. den Gleitlauten [j] und [w] abgeschwächt, vgl. [sja ˈ kaβa] se acaba ‘(es) endet’; [ ˈ tja.tɾo] teatro ‘Theater’ (Hualde 2005: 70). • Bei gleichem Öffnungsgrad wird der erste der Vokale abgeschwächt, vgl. [ ˈ est e ̯ oɾna ˈ men̪to] este ornamento ‘dieses Ornament’, aber: [ ˈ kamaɾao̯s ˈ kuɾa] cá‐ mara oscura ‘Dunkelkammer’. • Bei auslautendem unbetontem / e/ kann statt Abschwächung zum Halbvokal auch Tilgung erfolgen, z. B. [ ˌ estindi ˈ βiðwo] este individuo ‘dieses Individuum’. Die Hiatustilgung kann auch zu triphthongischen Nuklei führen. Dies ist aber nur dann möglich, wenn die Folge der Vokale einem ansteigenden und dann fallenden Sonoritätsverlauf mit nur einem Sonoritätsgipfel entspricht, z. B. [ ˈ aɾ e ̯ a e ̯ s ˈ tɾeʧa] area estrecha ‘schmaler Bereich’. Dagegen wird in einer Folge wie [ ˈ sale ˈ jentɾa] sale y entra ‘er/ sie geht raus und kommt rein’ nur der zweite Hiatus getilgt, da die Sonorität vom ersten zum zweiten Vokal abfällt. 4.3 Akzent und Akzentphonologie In diesem Unterkapitel beschäftigen wir uns mit dem spanischen Wortakzent und seinem Verhältnis zur Prominenzgebung im Satz bzw. in der Äußerung. Wir klären zunächst die Trennung zwischen Wortakzentuierung und Satzprominenzen (4.3.2) und die zwischen dem phonologischen Akzent und dessen phonetischer Realisierung (4.3.3). Um die Funktionen des Akzents geht es in 4.3.4. Anschließend erläutern wir die phonologischen Regeln, die die Position des Wortakzents im Spanischen bestimmen (4.3.5), und behandeln die Frage, wie der Wortakzent graphisch wiedergegeben wird (4.3.6). In den letzten beiden Abschnitten gehen wir auf die Metrische Phonologie ein, die einen einheitlichen Beschreibungsrahmen für die Akzentuierung auf Wort- und Satzebene vorschlägt (4.3.7). Dieser ist bei der Beschreibung von Nebenakzenten und Akzentverschiebungen wichtig (4.3.8). 4.3.1 Was heißt Akzent? Das Wort Akzent ist polysem. Bevor wir beginnen, mit diesem Begriff zu arbeiten, müssen wir daher klären, auf welche der Bedeutungen dieses auch alltagssprachlich verwendeten Worts wir uns beziehen werden. Eine der Verwendungen können wir ausschließen: Wir werden uns nicht auf die Ausspracheeigenheiten beziehen, die Fremdsprachenlerner fälschlich von ihrer Muttersprache auf die Zielsprache über‐ tragen und die dann als Akzent bezeichnet werden (vgl. aber 5.3). Eine weitere 4.3 Akzent und Akzentphonologie 195 <?page no="196"?> 35 Im Französischen werden diese Diakritika dagegen (u. a.) zur Angabe der Vokalqualität genutzt (<père> ‘Vater’ [ɛ] vs. <épée> ‘Schwert’ [e]). Bedeutung zeigt sich in der Bezeichnung von Diakritika wie Akut <á> oder Gravis <à> als (graphische) Akzente. Auch in der spanischen Orthographie wird eines dieser diakritischen Zeichen verwendet, nämlich der Akut <á> (sp. acento ortográfico oder tilde). Dieser wird unter anderem zur graphischen Repräsentation der Wortbetonung eingesetzt, wie z. B. in <entonación> ‘Intonation’; <esdrújula> ‘drittletztbetont’. 35 Wir werden später noch genauer auf die Regeln eingehen, nach denen die Wortbetonung im Spanischen graphisch markiert wird (4.3.6). Im Zentrum dieses Kapitels steht aber der Akzent im Sinne der Betonung als lautliches, d. h. phonologisches und phonetisches Phänomen. Als Akzent bezeichnet man in der Phonologie und Phonetik die lautliche Her‐ vorhebung (Prominenz, sp. prominencia) einer prosodischen Einheit gegenüber den benachbarten. Der Akzent ist ein relationales Phänomen: Eine betonte Silbe wird nur durch den Kontrast zu den unbetonten oder schwächer betonten Silben in der unmittelbaren Nachbarschaft erkennbar. Weiterhin ist der Akzent kein binäres, sondern ein gra‐ duelles Phänomen; man unterscheidet normalerweise drei Betonungsgrade. Neben den unbetonten Silben gibt es den Hauptakzent und den schwächeren Nebenak‐ zent. In der IPA-Umschrift wird ersterer durch einen hochgestellten, letzterer durch einen tiefgestellten geraden Strich vor der betonten Silbe angezeigt: [ ˌ maɾi ˈ neɾo] marinero ‘Matrose’. 4.3.2 Wortakzent und Satzprominenzen In einigen neueren phonologischen Ansätzen wird das Prinzip des unterschiedlichen Prominenzgrades benachbarter prosodischer Einheiten gleichermaßen auf alle Ebenen der prosodischen Hierarchie übertragen (4.1.1). Diese Ansätze behandeln dann das Wort, die phonologische Phrase und die Äußerung bzw. die Intonationsphrase als Domänen der Akzentzuweisung gleich (4.3.7). Wir schließen uns dieser Auffassung nicht an, sondern beschränken unsere Überlegungen auf das Phänomen des Wortak‐ zentes, denn es gibt deutliche sachliche Unterschiede zwischen der Prominenz von Silben innerhalb von Wörtern oder Füßen und der Prominenz von Konstituenten in der Äußerung, sodass eine Trennung der beiden Untersuchungsgegenstände angebracht erscheint (vgl. Hualde 2006). Auf den oberen Ebenen der prosodischen Hierarchie (phonologische Phrase oder Intermediärphrase, Intonationsphrase) wird die Prominenzgebung von semantischen und pragmatischen Gesichtspunkten, also von inhaltlichen Faktoren, bestimmt. Ob ein 196 4 Prosodie <?page no="197"?> Wort als Konstituente einer Phrase bzw. einer Äußerung betont wird und welche Art der Betonung der Sprecher dafür wählt, hängt mit seinem Stellenwert in der Informa‐ tionsstruktur bzw. mit seinem Fokussierungsgrad zusammen. Die Prominenzgebung ist folglich von der kommunikativen Funktion der jeweiligen Konstituente innerhalb der kontextuell determinierten Äußerung bestimmt. Dagegen wird die Frage, welche der Silben eines Worts den Hauptton tragen kann, nicht durch inhaltliche, sondern durch formale Faktoren determiniert. Die feste Position des Wortakzents erleichtert uns das Erkennen der Wortsignifikanten im Lautstrom. Ausschließlich signifikantenbezogen ist auch die rhythmische Funktion der Akzentuierung, das Abwechseln starker und schwacher Silben zur Optimierung der Artikulation und Perzeption von Lautsprache. Innerhalb des Worts bzw. innerhalb der Fußstrukturen ist die Prominenzzuweisung also formal, auf der Phrasen- und Äußerungsebene dagegen semantisch-pragmatisch motiviert. Aufgrund dieser unterschiedlichen Funktion werden wir Wortakzent und Satzprominenzen getrennt behandeln. Im Folgenden konzentrieren wir uns auf den Wortakzent als Bestandteil unseres lexikalischen Wissens. In 4.5.5 werden wir Satz‐ prominenzen und ihr Zusammenspiel mit den Wortakzenten genauer behandeln. 4.3.3 Wortakzent: phonologisch und phonetisch Eine weitere wichtige Unterscheidung ist die zwischen der phonologischen und der phonetischen Dimension des Akzents. Wenn man untersucht, welche der möglichen Konstituenten in einer prosodischen Einheit regelhaft den Akzent erhalten kann, geht es um die virtuelle Akzentposition, also um die phonologische Positionierung des Akzents in prosodischen Einheiten, die noch nicht pragmatisch eingebettet sind (Akzentpositionierung). Wenn man dagegen die lautsprachlichen Phänomene meint, mit denen die Betonung der betreffenden Konstituente in einer Äußerung erreicht wird, interessiert man sich für die Realisierung des Akzents, also für dessen phonetische Korrelate (Akzentrealisierung). Die Unterscheidung zwischen der phonologischen Frage der Akzentpositionierung und der phonetischen der Akzentrealisierung ist wichtig, weil die phonetische Reali‐ sierung des Wortakzents davon abhängt, an welcher Stelle das betreffende lexikalische Wort in der Äußerung auftritt. Ist es beispielsweise Bestandteil der syntaktischen Konstituente, die den neutralen Satzfokus bildet, so ist seine akzentuierte Silbe der Ankerpunkt für die F 0 -Bewegung des Nuklearakzents (4.5.5). Steht es dagegen in einer defokalisierten Konstituente, kann seine Akzentsilbe in tonaler Hinsicht unrealisiert bleiben, sich aber dennoch durch Dauer- oder Intensitätssteigerung von den anderen unbetonten Wortsilben unterscheiden. Kontextfrei lässt sich nur die Akzentposition, nicht aber die konkrete Akzentrealisierung bestimmen. Diese ergibt sich erst aus dem Zusammenspiel zwischen Wortakzentpositionen und Intonationsstruktur der Äußerung. Man darf sich nicht davon täuschen lassen, dass wir Wörter isolieren und in metasprachlicher Absicht zitieren können, denn auch in diesem Fall weisen wir ihnen 4.3 Akzent und Akzentphonologie 197 <?page no="198"?> 36 Die entsprechende Diskussion referieren Quilis (1981: 319-332), D’Introno et al. (1995: 125-129), Hidalgo Navarro & Quilis Merín ( 2 2004: 222-225) und Kubarth (2009: 188). Im Spanischen ist der Kontrast zwischen normalen Silben und den Silben, die unter dem Akzent gelängt sind, deutlich geringer als etwa im Italienischen oder Französischen (vgl. 4.4.1). 37 Vgl. Hidalgo Navarro & Quilis Merín ( 2 2004: 221), die von einer “mayor energía articulatoria, mayor abertura en las vocales, mayor tensión y mayor cierre de los órganos articulatorios en las consonantes que rodean al núcleo silábico, mayor sonoridad y mayor perceptibilidad” sprechen. in der betreffenden Äußerung eine bestimmte Funktion und damit eine bestimmte intonatorische Kontur zu. Eine solche isoliert geäußerte Nennform ist deshalb eine spezifische Verwendung eines Lexems. Aus ihr kann nicht auf die Realisierung des Wortakzents in anderen syntaktischen, semantischen und pragmatischen Kontexten geschlossen werden (Kim, M. 2011). Die Trennung zwischen dem virtuellen Wortakzent und den Realisierungstypen ist für die Bestimmung der phonetischen Korrelate des Wortakzents wichtig. Lange Zeit war man sich darüber uneinig, ob der spanische Wortakzent eher tonal oder quantitativ ist, ob er also eher über Bewegungen der Grundfrequenz (F 0 , sp. frecuencia fundamental) oder über die längere Dauer (sp. duración) der vokalischen Nuklei signalisiert wird. 36 Diese Frage kann nicht eindeutig beantwortet werden, denn in einigen Fällen tragen beide prosodischen Variationsdimensionen zur Signalisierung der prominenten Silbe bei, in anderen Fällen dagegen nur eine. In isolierten Zitierformen dominiert beispielsweise die Veränderung von F 0 in Gestalt einer deutlichen Bewegung nach oben (Kubarth 2009: 188f.). Auch bei der kontrastiven Hervorhebung eines Worts wird die akzentuierte Silbe mit einer steigenden oder steigend-fallenden F 0 -Bewegung markiert (vgl. genauer 4.5.5). In den Positionen am Ende der Intermediärbzw. der In‐ tonationsphrase sowie in defokalisierten Kontexten mit flachen Intonationsverläufen wird die Wortakzentsilbe dagegen fast ausschließlich durch Längung markiert (Hualde 2005: 242-245, Ortega-Llebaria & Prieto 2009). Noch zwei weitere phonetische Korrelate des Wortakzents müssen in Betracht gezogen werden. Dies sind die Intensität bzw. Lautstärke (sp. intensidad) und der Artikulationsaufwand (sp. energía articulatoria). Die Vorstellung, betonte Silben würden mit größeren Amplituden und damit mit höherer Lautstärke geäußert, ist im Einzelfall jedoch nur bedingt nachzuweisen (Kubarth 2009: 215f., Kim, M. 2011). Auch ein größerer artikulatorischer Aufwand kann betonte Wortsilben kennzeichnen. Die Segmente der betonten Silbe werden deutlicher artikuliert, d. h., die mit den Segmenten verbundenen Konfigurationen des Ansatzrohrs werden vollständig ausgeführt und stärker voneinander getrennt. Akustisch lässt sich diese deutlichere Artikulation an der klareren spektralen Trennung zwischen den einzelnen Vokalen und Konsonanten ablesen. 37 Die Möglichkeit, die Artikulation zur Differenzierung zwischen betonten und unbetonten Silben zu nutzen, wird vor allem in sog. akzentzählenden Sprachen wie dem Englischen oder dem Deutschen genutzt (vgl. 4.4.1). In diesen Sprachen treten Vollvokale prinzipiell nur in betonten Silben auf, während unbetonte Silben durch 198 4 Prosodie <?page no="199"?> 38 Für das Deutsche nimmt man innerhalb der unbetonten Silben die Reduktionssilbe als einen weiteren Subtypus an, vgl. [ ˈ papa] Papa, [ ˈ koːla] Cola (unbetont) vs. [ ˈ papə] Pappe, [ ˈ koːlə] Kohle (unbetont und reduziert). In Reduktionssilben können keine Vollvokale vorkommen, sondern nur die Reduktionsvokale [ə] und [ɐ]. Diese können hier auch Minimalpaare bilden, vgl. Lehre [ ˈ leːʁə] vs. Lehrer [ ˈ leːʁɐ]. 39 Hualde (2005: 240) vergleicht die Sonagramme je einer Realisierung des spanischen Worts hipopótamo [ipo ˈ potamo] und der engl. Entsprechung hippopotamus [hɪpə ˈ pʰɑɾəməs] (nordamerikanischer Spre‐ cher). Die englische Äußerung zeigt deutlich die akustischen Konsequenzen der nicht vollständig ausgeführten artikulatorischen Bewegungen in den unbetonten Silben im Gegensatz zu der artiku‐ latorischen Intensität, mit der dieselben Segmente / p/ und / o/ in der betonten Silbe geäußert werden. Dagegen sind die akustischen Korrelate von/ p/ und/ o/ in der spanischen Äußerung in der unbetonten und der betonten Silbe nahezu identisch. Reduktionsvokale bzw. ein reduziertes vokalisches Inventar gekennzeichnet sind. 38 Im Spanischen als silbenzählender Sprache sind dagegen auch in unbetonten Silben die Artikulationsintensität und die Distinktivität der Segmente hoch. 39 Phonetische Untersuchungen haben aber gezeigt, dass auch im Spanischen in betonten Silben eine Steigerung der Artikulationsgenauigkeit zu beobachten ist. Im Unterschied zur Kennzeichnung der Betonung durch Tonhöhenbewegungen oder durch Längung scheint die artikulatorische Ungleichbehandlung betonter und unbetonter Silben sogar unabhängig von der Position bzw. vom Fokussierungsgrad des betreffenden Worts zu sein (Kim, M. 2011). Die akzenttragende Silbe kann im Spanischen durch F 0 -Bewegung, durch längere Dauer, durch höhere Intensität und/ oder durch größere Artikulationsgenau‐ igkeit von den umgebenden unbetonten Silben abgehoben werden. Die genannten prosodischen Dimensionen tragen in unterschiedlichem Maße zur Hervorhebung der Akzentsilbe bei, wobei v. a. F 0 und Dauer relevant zu sein scheinen. Auf welche prosodischen Variationsmöglichkeiten zurückgegriffen wird, hängt davon ab, welche informationsstrukturelle, pragmatische und stilistische Funktion das Wort in der Äußerung hat. 4.3.4 Die Funktionen des Akzents Es ist vermutlich eine prosodische Universalie, dass betonte und unbetonte Silben miteinander alternieren. Ebenso wie sich Sonoritätsmaxima (vokalische Nuklei) und -minima (konsonantische Silbenränder) abwechseln und auf diese Weise eine Silben‐ struktur schaffen, die sowohl an die Artikulation als auch an die Perzeption optimal an‐ gepasst ist (4.2.1), kann man davon ausgehen, dass auch das Abwechseln prominenter mit nicht prominenten Silben unseren artikulatorischen und auditiven Möglichkeiten besser entspricht, als wenn Silben von gleichem Stärkegrad aneinandergereiht würden. Aus dieser Beobachtung leitet man die rhythmische Funktion des Akzents ab (Hayes 1995): Der Wechsel zwischen starken und schwachen Silben hat die Aufgabe, in 4.3 Akzent und Akzentphonologie 199 <?page no="200"?> 40 Dies ist z. B. auch im Französischen der Fall. Allerdings ist hier nicht das einzelne Wort, sondern die phonologische Phrase die Domäne der Akzentzuweisung. Wenn wir vom fakultativen Initialakzent absehen (Delais-Roussarie et al. 2015), wird deshalb die letzte Silbe einer phonologischen Phrase betont − vorausgesetzt, sie hat einen Vollvokal als Nukleus (vgl. Meisenburg & Selig 1998: 148-160). 41 Im Folgenden markieren wir die betonte Silbe durch Fettdruck in der zitierten Form. lautlichen Äußerungen Kontraste zu schaffen, die diese gliedern und besser produzier- und wahrnehmbar machen. Einige Ansätze gehen sogar so weit zu sagen, dass es eine anthropologische Konstante sei, Äußerungen eurhythmisch zu gliedern, also auf die regelmäßige Wiederkehr gleicher Abfolgen von starken und schwachen Silben zu achten. Diese Auffassung vertritt beispielsweise die Metrische Phonologie (4.3.7). Mit dem relationalen Charakter des Akzents, der erst im Nebeneinander von starken und schwachen Einheiten realisiert werden kann, ist außerdem seine kulminative Funktion verbunden. Bereits Trubetzkoy (1939/ 7 1989: 180, 185ff.) hat darauf aufmerk‐ sam gemacht, dass die gipfelbildende starke Silbe die schwachen Silben um sich herum gruppiert. Diese sind entweder vortonig und führen damit auf den Prominenzgipfel hin oder nachtonig, d. h. vom Prominenzgipfel wegführend. So wird durch jede prominente Silbe eine Akzentdomäne abgegrenzt (Van der Hulst 1999: 5). Die nächsten beiden Funktionen des Akzents sind komplementär zu denken und hängen mit den Regeln der Positionierung der akzentuierten Silbe zusammen. Eine delimitative Funktion hat der Akzent dann, wenn er immer dieselbe Position im Verhältnis zum Anfang oder Ende der Akzentdomäne einnimmt. So wird etwa im Polnischen regelhaft die vorletzte, im Tschechischen dagegen die erste Wortsilbe akzentuiert (Dogil et al. 1999). Aus der Position des Akzents kann der Hörer in diesen Sprachen daher auf das Wortende bzw. den Wortanfang schließen. Eine solche delimitative Funktion hat der Akzent aber nur, wenn seine Position innerhalb der Akzentdomäne nach einfachen positionsbezogenen Regeln vorhersagbar ist. 40 In vielen Sprachen - und auch im Spanischen - ist die Akzentzuweisung aber nicht ausschließlich durch die Position der Silbe im Wort bzw. der Phrase bestimmt. Da die Akzentverteilung auch nicht vollständig von anderen Faktoren, etwa vom Silbengewicht, determiniert wird, hat das Spanische einen sog. freien Akzent. Der Akzent hat deshalb eine distinktive Funktion. Im Spanischen können Wörter, die die gleichen Phoneme in der gleichen Reihenfolge aufweisen, allein durch die Position der prominenten Silbe unterschieden werden. Dies ist etwa bei número ‘Nummer’ und numero ‘ich zähle’ der Fall. 41 Diese bedeutungsunterscheidende Funktion des freien Akzents wird im Spanischen im Bereich der Verbflexion systematisch eingesetzt: Der Unterschied in Person und Tempus zwischen numero ‘ich zähle’ und numeró ‘er/ sie zählte’ wird lautlich allein durch die Akzentuierung signalisiert (4.3.5.4). Die bisher angeführten Funktionen sind ausschließlich auf die Formseite der Sprache bezogen (Eurhythmie, Distinktivität der lautlichen Signifikanten etc.) und betreffen die Prominenz von Silben innerhalb von Einheiten, die in der prosodischen Hierarchie am unteren Ende der Skala stehen (Fuß, Wort). Inhaltlich begründet ist dagegen die Fokussierung von Wörtern durch eine von der normalen Realisierung abweichende, 200 4 Prosodie <?page no="201"?> 42 Dass es sich um einen deakzentuierenden Kontext handelt, erkennt man daran, dass sich in diesen Anredesyntagmen Schwundformen (señor > so) oder Kurzformen wie don entwickelt haben (don ist eine Weiterentwicklung von lat. D O M I N U S ‘Herr’, das in betonter Entwicklung dueño ergeben hat, vgl. NGRAE 2011: 374). besondere Betonung. Die Domäne eines solchen acento enfático o de insistencia (Quilis 6 2005: 75) ist die Äußerung; als semantisch-pragmatisches Phänomen hat er die Funktion, eine Konstituente kontrastiv hervorzuheben. Wir werden deshalb in 4.5.5 genauer auf diesen Typus von Prominenzgebung eingehen. 4.3.5 Der Wortakzent des Spanischen Über den Wortakzent im Spanischen ist viel nachgedacht worden (Harris 1995: 867). Ein Grund dafür ist, dass die spanische Orthographie bereits seit mehreren Jahrhunderten den Wortakzent in bestimmten Fällen mit dem Akut markiert (4.3.6). Die deskripti‐ ven Grammatiken des Spanischen mussten sich daher im Rahmen orthographischer Überlegungen immer wieder mit den Regeln der Wortakzentsetzung befassen. Ein zweiter Grund dürfte sein, dass der Wortakzent im Spanischen Regularitäten folgt, die vom phonologischen Standpunkt her komplex und damit interessant sind. Es stellt sich nämlich die Frage, ob hinter der Verteilung der Akzentsilben ein bestimmtes phonologisches Regelwissen steht oder ob die Position des Wortakzents so wie die Phonemfolge der lautlichen Signifikanten zum idiosynkratischen Bestandteil unseres sprachlichen Wissens gehört. Zu fragen ist also, ob wir spanische Wörter korrekt betonen können, weil wir Regeln beachten oder weil wir die korrekte Betonung mit jedem einzelnen Wort gelernt haben. 4.3.5.1 Palabras tónicas und palabras átonas Als erste Frage muss im Zusammenhang mit dem spanischen Wortakzent geklärt werden, welche Wörter betonbar sind und welche nicht (NGRAE 2011: 370ff.). Diese beiden Gruppen werden als palabras tónicas (betonbar) und palabras átonas (nicht betonbar) unterschieden. Da das Spanische beide Worttypen kennt, kann die Akzentdomäne, die durch einen Wortakzent abgegrenzt wird, folglich über das einzelne Wort hinausgehen. Wenn außer der palabra tónica auch palabras átonas wie Artikel oder Objektpronomina zu dem betreffenden Syntagma gehören, grenzt der Wortakzent aufgrund seiner kulminativen Funktion eine Klitische Gruppe ab (4.3.4). Die Unterscheidung zwischen palabras tónicas und átonas ist eine phonologische, denn in der konkreten Äußerung können abweichende Akzentuierungen auftreten. Es gibt beispielsweise Kontexte, in denen palabras tónicas regelmäßig ohne Wortakzent realisiert werden: So sind in Anredesyntagmen vorangestellte Titel wie señor i. d. R. deakzentuiert, und nur das zweite Element, der Name, erhält einen Akzent (NGRAE 2011: 373ff.). 42 Umgekehrt können die palabras átonas etwa im Falle eines Kontrastfokus eine Akzentuierung erhalten. So sind definite Artikel zwar normalerweise nicht 4.3 Akzent und Akzentphonologie 201 <?page no="202"?> 43 Allerdings bemerkt Hualde (2005: 233), dass auch in solchen Fällen die Akzentuierung der Klitika selten auftritt und der Kontrast eher mit anderen sprachlichen Mitteln ausgedrückt wird. 44 Quilis (1981: 315), Hidalgo Navarro & Quilis Merín ( 2 2004: 232), Hualde (2005: 234) und die NGRAE (2011: 410f.) gehen davon aus, dass die zweisilbigen Formen des indefiniten Artikels, also unos und una(s), im Unterschied zum definiten auch in unmarkierten Verwendungen zusätzlich zum Substantiv akzentuiert sind. betonbar, sie können aber in einer Äußerung wie Dije “LA capital”, no “EL capital” metasprachlichen Kontrastfokus erhalten. 43 Die Trennung von palabras tónicas und átonas kann mit der Unterscheidung zwischen Inhalts- oder lexikalischen Wörtern (sp. palabras léxicas: Substantive, Adjektive, Adverbien, Verben) und Funktions- oder grammatischen Wörtern (sp. palabras gramaticales: Determinanten, Pronomina, Präpositionen, Konjunktionen) in Verbindung gebracht werden (NGRAE 2011: 371). Inhaltswörter haben einen eigenen Wortakzent, während Funktionswörter in die Akzentdomäne des syntaktisch und inhaltlich zugeordneten lexikalischen Wortes eingegliedert werden. Dazu passt die Beobachtung, dass zahlreiche Funktionswörter im Spanischen nicht isoliert verwendet werden können, sondern immer zusammen mit einem anderen akzentuierbaren Wort auftreten. Bei den Nominaldeterminanten und den Objektpronomina spricht man von Klitika, d. h. von Formen, die nicht akzentogen/ betonbar sind und die nicht isoliert vorkommen, sondern immer zusammen mit einem lexikalischen ‘Wirt’ auftreten (Gabriel & Meisenburg 4 2021: 180f.). Bei den Klitika sind die Verhältnisse im Spanischen komplex. In einem Nominal- oder Verbalsyntagma werden Determinanten und Objektpronomina normalerweise nicht betont; einen Akzent erhält nur das lexikalische Wort, also das Substantiv wie in el amigo ‘der Freund’ / un amigo ‘ein Freund’ 44 bzw. das Verb wie in lo veo ‘ich sehe ihn’. Es gibt jedoch pragmatische Bedingungen, unter denen Determinanten bzw. Pronomina akzentuiert werden, und zwar unabhängig vom bereits genannten metasprachlichen Kontrastfokus. Allerdings muss man in solchen Fällen auf einen betonbaren Demonstrativdeterminanten oder ein betonbares Objektpronomen ausweichen, wie etwa in el amigo → este amigo ‘dieser (und nicht jener) Freund’ oder in lo veo → lo veo a él ‘ich sehe ihn (und nicht sie)’. Deshalb gibt es bei bestimmten Nominaldeterminanten bzw. Objektpronomina zwei parallele Paradigmen, eine erste Reihe von Formen, die nicht betont werden können, und eine zweite Reihe von Formen, die in betonten Positionen auftreten. Als Beispiel seien hier die unbetonten und betonten Objektpronomina angeführt. unbetonte Objektpronomina betonte Objektpronomina me nos (a) mí (a) nosotros, -as te os (a) ti/ vos (a) usted (a) vosotros, -as (a) ustedes lo, la los, las (a) él, (a) ella (a) ellos, (a) ellas 202 4 Prosodie <?page no="203"?> 45 Es gibt zwei Terminologien, die bei der Beschreibung der Akzentregeln in der Phonologie verwendet werden. Die Akzentposition wird entweder mit Adjektiven bezeichnet, die auf das Altgriechische zurückgehen (oxyton, paroxyton, proparoxyton), oder mit Bezeichnungen, die aus dem Lateinischen stammen (Ultima, Pänultima, Antepänultima). Wir werden im Folgenden v. a. die aus dem Lateini‐ schen stammende Terminologie verwenden. le les (a) él, (a) ella (a) ellos, (a) ellas se (a) sí (mismo) etc. Abb. 4.3-1: Unbetonte und betonte Objektpronomina des Spanischen. Auch bei den Possessiva ist eine solche Doppelung von unbetonten und betonten For‐ men zu beobachten (unbetontes vorangestelltes mi, tu etc.; betontes nachgestelltes mío, tuyo etc.). Die Subjektpronomina (yo, tú/ vos, él etc.) sind im Spanischen dagegen immer betont, da in allen pragmatisch unmarkierten Kontexten die flektierten Verbformen zur Subjektkennzeichnung ausreichen. Die Objektpronomina schließen sich proklitisch, d. h. vorangestellt (te lo digo), oder enklitisch, d. h. nachgestellt (dígamelo), an die Verbform an. In diesen klitischen Gruppen verändern die unbetonbaren Klitika die Position des Wortakzents nicht. So können bei den enklitischen Pronomina in Formen wie dígamelo oder contándoselo auf die Akzentsilbe mehr als zwei unbetonte Silben folgen, doch die Regel des Drei-Sil‐ ben-Fensters (4.3.5.2) wird nicht verletzt, da die unbetonbaren klitischen Pronomina bei der Akzentzuweisung nicht berücksichtigt werden; die Regel ist sozusagen ‘blind’ gegenüber den Klitika (vgl. aber 4.3.8). 4.3.5.2 Das Drei-Silben-Fenster Eine Regel zur Bestimmung des Wortakzents gilt im Spanischen ausnahmslos: Er fällt immer auf eine der letzten drei Silben eines Worts. Innerhalb dieses Drei-Silben-Fens‐ ters (sp. ventana de las tres sílabas) kann die Akzentposition allerdings wechseln. Somit gibt es drei Typen von Wortbetonung, nämlich Wörter mit dem Akzent • auf der vorletzten Silbe, der Pänultima ((x)x́x) (paroxytone Wörter), • auf der letzten Silbe, der Ultima ((x)x́) (oxytone Wörter), • auf der vorvorletzten Silbe, der Antepänultima ((x)x́xx) (proparoxytone Wör‐ ter). 45 Die Wortakzentmuster treten mit unterschiedlicher Frequenz auf: Nach den Auswer‐ tungen von Quilis (1981: 333ff.) kommen im gesprochenen Spanisch Wörter mit Betonung auf der vorletzten Silbe, sog. palabras llanas, am häufigsten vor (79,50 %); danach folgen endbetonte Wörter, sog. palabras agudas (17,68 %), schließlich Wörter mit Betonung auf der vorvorletzten Silbe, sog. palabras esdrújulas (2,76 %). Die folgende Tabelle illustriert die unterschiedlichen Akzentpositionen: 4.3 Akzent und Akzentphonologie 203 <?page no="204"?> 46 Man kann daher nur bedingt von einem freien Akzent im Spanischen sprechen (Van der Hulst 1999: 16f.). Für Kager (1995: 368) haben Sprachen wie das Spanische ein “bounded system”, da die Akzentposition aufgrund des Drei-Silben-Fensters bereits fest geregelt sei. 47 Anders als Flexionsmorpheme beeinflussen Wortbildungsmorpheme auch bei den Nomina die Akzentposition (vgl. dazu weiter unten). Zur Akzentzuweisung bei Komposita vgl. 4.3.8. palabras … llanas agudas esdrújulas Substan‐ tive mesa ‘Tisch’ orden ‘Ordnung, Reihenfolge’ señora ‘Frau, Dame’ rigor ‘Strenge’ canción ‘Lied’ obstáculo ‘Hindernis’ helicóptero ‘Hub‐ schrauber’ régimen ‘Regime’ Adjektive triste ‘traurig’ móvil ‘beweglich, Handy (europ.)’ feliz ‘glücklich’ francés ‘französisch’ múltiple ‘mehrfach’ excéntrico ‘exzentrisch’ Adver‐ bien adelante ‘vorwärts’ allí ‘dort, da’ máxime ‘vor allem’ Verbfor‐ men hablo ‘ich spreche’ hablé ‘ich sprach’ dominó ‘er/ sie be‐ herrschte’ hablábamos ‘wir spra‐ chen’ Abb. 4.3-2: Akzentmuster des Spanischen. Die Tabelle könnte den Eindruck vermitteln, die Akzentposition innerhalb des Drei-Sil‐ ben-Fensters könne frei gewählt werden und es sei eine Sache des Zufalls, welches Akzentmuster bei einem Wort jeweils vorliegt. Für eine solche Auffassung spricht, dass es im Spanischen im Rahmen des Drei-Silben-Fensters einen freien Akzent mit distinktiver Funktion gibt (hablo ‘ich spreche’ vs. habló ‘er/ sie sprach’ etc.; vgl. 4.3.4). Doch die Akzentposition ist nicht völlig beliebig. Je nach Wortart lassen sich eine Reihe von Faktoren erkennen, die die Position des Akzents beeinflussen: 46 Bei den Nomina sind es phonologische Faktoren, nämlich Silbenstruktur und Silbengewicht, aus denen Regularitäten für die Akzentposition abgeleitet werden können (4.3.5.3). Die Akzentpositionierung bei den Verbformen wird dagegen durch morphologische Faktoren bestimmt, nämlich dadurch, dass die einzelnen Flexionsparadigmen fest mit bestimmten Akzentverteilungsmustern verknüpft sind, die für alle Verben gelten (4.3.5.4). 4.3.5.3 Der Wortakzent bei spanischen Nomina Anders als bei Verben spielen bei Nomina (Substantiven und Adjektiven) morpholo‐ gische Faktoren (der Flexion) bei der Bestimmung der akzenttragenden Silbe keine Rolle. Die flexivische Pluralmarkierung, also das Suffix -s bzw. -es, wird bei der Akzentzuweisung nicht berücksichtigt. 47 Die Akzentsilbe ist in der Singular- und in der Pluralform dieselbe. 204 4 Prosodie <?page no="205"?> 48 Die sechs (! ) Lexeme, die von der Regel abweichen, beeinträchtigen deren Gültigkeit nicht. Zum großen Teil erklärt sich die abweichende Akzentuierung der Pluralform durch die Regel des Drei-Silben-Fensters: espécimen/ especímenes ‘Exemplar (Sg./ Pl.)’; régimen/ regímenes ‘Regime (Sg./ Pl.)’; hipérbaton/ hiperbatones ‘Hyperbaton (Sg./ Pl.)’, auch: hipérbatos; ómicron/ omicrones ‘Omikron (Sg./ Pl.)’, auch: (las) ómicron; carácter/ caracteres ‘Charakter (Sg./ Pl.)’; júnior/ juniores ‘Junior (Sg./ Pl.)’. 49 Im Rahmen der Metrischen Phonologie wurde versucht, auch die unbetonten Auslautvokale von Nomina, die lateinische Etyma fortsetzen, flexivisch zu interpretieren und ihre Auslautsilben daher als extrametrisch, d. h. als ‘akzentuell irrelevant’, einzustufen. In diesem Ansatz geht man von For‐ men wie me<sa> (eine extrametrische Silbe <sa>), señor (ohne extrametrische Silbe) und ví<bo><ra> (zwei extrametrische Silben <bo> und <ra>) aus und bestimmt die Position des Akzents durch die Regel ‘Betone die letzte Silbe des Stamms’ (Roca 1999). Allerdings muss auch bei dieser Herleitung die Antepänultimabetonung (víbora ‘Viper’) durch die Annahme prosodischer Markierungen im Lexikon begründet werden. Singular mesa ‘Tisch’ ciudad ‘Stadt’ título ‘Titel’ móvil ‘beweglich, Handy (europ.)’ Plural mesas ciudades títulos móviles Abb. 4.3-3: Akzentuierung der Singular- und Pluralformen von Nomina. Die Akzentzuweisung orientiert sich hier also an der Einheit des Lexems. 48 Wir können bei den folgenden Überlegungen zur Akzentuierung der Nomina daher vom lexikalischen Wort ausgehen, das mit der Singularform übereinstimmt. 49 Nachdem wir die Flexionsmorphologie als Faktor bei der Akzentzuweisung ausge‐ schlossen haben, müssen wir die Relevanz von phonologischen Faktoren überprü‐ fen. Ein möglicher Faktor bei der Zuweisung der Akzentposition bei Nomina ist die Silbenstruktur bzw. das Silbengewicht (“stress to weight”, vgl. 4.2.2 und Abb. 4.2-4). Eine Silbe ist schwer, wenn ihr Reim bzw. ihr Nukleus verzweigt, sie also auf einen Konsonanten oder auf einen Diphthong endet. Eine leichte Silbe hat dagegen einen unverzweigten Reim mit einem einfachen vokalischen Nukleus. Die Frage ist, ob das Silbengewicht bei der Akzentzuweisung eine Rolle spielt. Bei der Betonung von mujer ‘Frau’ und virrey ‘Vizekönig’ einerseits und mesa ‘Tisch’ oder (palabra) aguda ‘endbetont(es Wort)’ andererseits spielt das Sil‐ bengewicht offensichtlich eine Rolle: mujer und virrey haben eine schwere, weil auf Konsonant bzw. Gleitlaut endende Ultimasilbe, die deshalb den Wortakzent auf sich zieht. Dagegen ist in mesa oder aguda die Ultimasilbe leicht, und der Akzent fällt auf die vorangehende Pänultima (Hayes 1995: 50). Auch die Betonung von señores ‘Herren’ wird durch das Silbengewicht richtig bestimmt, denn die Flexionsendung -es geht, wie wir oben gesehen haben, nicht in die Akzentberechnung ein. Die Ultima- und die Pänultimabetonung der Nomina kann man also mit dem Silbengewicht in Verbindung bringen. Etwa 95 % der Akzentpositionen bei spanischen Nomina können durch das Silben‐ gewicht erklärt werden (Hualde 2005: 223). Die Regel, dass eine schwere Ultima betont wird, eine leichte dagegen die Akzentposition nach links ‘weiterreicht’, gilt somit in der überwiegenden Mehrzahl der spanischen Nomina. Allerdings gibt es 4.3 Akzent und Akzentphonologie 205 <?page no="206"?> Ausnahmen zu dieser Regel. So finden sich Pänultimabetonungen trotz schwerer Ultima (joven ‘jung’, lápiz ‘Bleistift’, difícil ‘schwierig’, vóley ‘Volleyball’, yóquey ‘Jo‐ ckey’) und Ultimabetonungen trotz leichter Ultima (papá ‘Papa’, canesú ‘Leibchen’). Dennoch ist es angesichts des klaren Überwiegens regelkonformer Fälle nicht verwun‐ derlich, dass aus dieser häufigen und damit unmarkierten Akzentverteilung die Regeln abgeleitet werden, die bei Neuschöpfungen die Position der betonten Silbe bestimmen. Wie eine Reihe von Experimenten gezeigt hat, ist dies bei Logatomen, also nach den phonologischen Regeln des Spanischen konstruierten Pseudowörtern, und Akronymen, Wortbildungen aus Anfangsbuchstaben oder Anfangssilben eines Namenssyntagmas, der Fall. Solche Wortneuschöpfungen werden von spanischen Mut‐ tersprachlern in der Mehrzahl nach der Silbengewichtsregel betont. Ultimabetonung wird dann gewählt, wenn die letzte Silbe auf Konsonant endet wie z. B. im Logatom panaquil oder im Akronym IMER = Instituto Mexicano de la Radio. Bei leichter Ultima fällt die Entscheidung dagegen zugunsten der Pänultimabetonung (Logatom bochaca, CONAPO = Consejo Nacional de Población). Auch für den vesre, bei dem die Wortsilben ihre Position vertauschen (vgl. 4.2.1), sowie für die in der Jugendsprache häufigen Wortkürzungen gilt die Regel, dass in den neu entstandenen Wörtern Betonung der letzten Silbe bei schwerer, der vorletzten bei leichter Ultima gewählt wird (trabajo > jotraba ‘Arbeit’; tango > gotán ‘Tango’; profesor > profe ‘Prof(essor)’; Antonio > Antón etc., vgl. Hualde 2005: 227f., Kubarth 2009: 178f., NGRAE 2011: 400f.). Aber die Positionierung des Wortakzents auf einer der beiden letzten Silben ist nicht für alle spanischen Nomina verbindlich. Für einen Teil, nämlich die palabras esdrújulas, gilt, dass sie nach einem dritten Akzentmuster betont werden, nämlich nach der Antepänultimabetonung. Wörter wie (palabra) esdrújula ‘auf der vorletzten Silbe betont(es Wort)’ oder águila ‘Adler’, retórica ‘Rhetorik’ oder éxito ‘Erfolg’ haben den Wortakzent auf der vorvorletzten Silbe, nutzen also die ventana de las tres sílabas vollständig aus. Dieses Akzentmuster kann man allerdings nicht mit den synchronen phonologischen Regeln, sondern nur historisch erklären. Wie bereits in 4.1.1 und 4.2.2 gesagt, wurde der Wortakzent im Lateinischen durch das Silbengewicht, und zwar durch das Gewicht der Pänultimasilbe, bestimmt. Anders als im Spanischen konnte im Lateinischen die Ultima, also die letzte Wortsilbe, nicht betont werden. Alle zweisilbigen Wörter wurden daher prinzipiell auf der vorletzten Silbe akzentuiert. Hatte ein Wort mehr als zwei Silben, kamen zwei Akzentpositionen in Frage, nämlich die Pänultima und die Antepänultima, die zweite mögliche Akzentsilbe. Der Akzent fiel auf die Pänultima, wenn diese schwer war, also entweder eine konsonantische Coda oder einen verzweigten Nukleus (Diphthong oder Langvokal) aufwies. Eine leichte Pänultima führte dagegen zur Weitergabe des Akzents nach links, also zur Betonung 206 4 Prosodie <?page no="207"?> 50 Der Zusammenhang zwischen Silbengewicht und Wortakzent wird beispielsweise sichtbar in A M Ī C A ‘Freundin’. Der Vokal der Pänultimasilbe ist lang, weshalb die Silbe als schwer gewertet wird und den Akzent erhält (→ A M Ī C A ). Auch in A U G U S T U S ‘geweiht’ ist die Pänultimasilbe schwer, weil der Reim verzweigt ist (VC) (→ A U G U S T U S ). In L A C R Ĭ M A ‘Träne’ ist der Vokal der Pänultimasilbe ein Kurzvokal; daher verschiebt sich der Wortakzent auf die Antepänultimasilbe (→ L A C R Ĭ M A ). Da die Akzentstelle im Laufe der lateinisch-romanischen Entwicklung in aller Regel unverändert blieb, ist auch sp. lágrima ein Proparoxytonon, wird also auf der vorvorletzten Silbe betont. 51 Dass sich, trotz der Vererbung der lateinischen Akzentstelle, auch neue Betonungsmuster ergeben können, zeigt A N Ĭ M A ‘Seele’. Im Lateinischen ist es ein Proparoxytonon ( A N I M A ). Da das Wort im Laufe der lateinisch-romanischen Entwicklung synkopiert, also durch den Wegfall des nachtonigen Vokals auf zwei Silben verkürzt wurde, ist die spanische Fortführung alma zum Paroxytonon geworden (lat. A N Ĭ M A > *anma > sp. alma). der Antepänultima. Deshalb gab es im Lateinischen zahlreiche Wörter, die regelhaft Antepänultimabetonung zeigten. 50 Als sich das (Vulgär-)Lateinische zum Altspanischen weiterentwickelte, wurde die Unterscheidung zwischen langen und kurzen Vokalen aufgegeben. Dies bedeutete auch, dass die lateinischen Silbengewichtsregeln nicht mehr gelten konnten. Die Akzentstellen der Nomina wurden aber nicht neu berechnet, sondern die Lexeme, auch die Lexeme mit einer Antepänultimabetonung, behielten ihre Akzentuierung bei und ‘vererbten’ sie an das Spanische weiter (Menéndez Pidal 1962: 36). 51 Zudem gab es im Laufe der Sprachgeschichte immer wieder Entlehnungen aus dem lateini‐ schen Kulturadstrat (sog. cultismos), und zwar ohne dass die Wortbetonung an die Empfängersprache Spanisch angepasst wurde. Deshalb existieren auch im modernen Spanisch Nomina, die eine Antepänultimabetonung aufweisen, obwohl diese aus den synchronen phonologischen Regeln nicht mehr hergeleitet werden kann (vgl. Meisenburg 2005). Die Antepänultimabetonung ist im Gegensatz zur Pänultima- und Ultimabetonung ein markiertes Akzentmuster. Der Akzent auf der drittletzten Wortsilbe tritt zu selten auf, um noch Ausgangspunkt einer allgemeingültigen produktiven Akzentregel sein zu können. Die Antepänultimabetonung hat inzwischen sogar die Konnotation ei‐ nes cultismo erhalten. Im Substandard wird bei Wörtern, die nach der Normaussprache eine Pänultimabetonung haben, manchmal hyperkorrekt die Antepänultimabetonung gewählt. Es scheint ‘gelehrter’ zu klingen, wenn man *intervalo statt intervalo ‘Inter‐ vall’ sagt (NGRAE 2011: 385f.). Wir können die Regularitäten bei der Betonung der spanischen Nomina folgendermaßen zusammenfassen: • Betone die Auslautsilbe (Ultima), wenn diese schwer ist. • Ist die Ultimasilbe leicht, betone die vorletzte Silbe (Pänultima). • Beachte, dass manche Nomina auf der Antepänultima betont werden. • Beachte außerdem, dass es zu den ersten beiden Regeln Ausnahmen gibt. Auch Abb. 4.3-4 verdeutlicht diese Regularitäten. 4.3 Akzent und Akzentphonologie 207 <?page no="208"?> 52 Auch die Wortbildung interagiert mit der Akzentuierung. Dies gilt nicht für die Präfigierung, die die Akzentstelle nicht beeinflusst (popular/ impopular; vgl. NGRAE 2011: 391). Bei der Suffigierung verlagern betonbare Suffixe (sufijos tónicos) die Akzentstelle auf eine der Silben des Suffixes (leche ‘Milch’ > lechero ‘Milch-’, nación ‘Nation’ > nacional ‘national’); nicht betonbare Suffixe (sufijos átonos) können nicht den Wortakzent tragen, lösen aber die Anwendung der Drei-Silben-Re‐ gel aus, die unter Umständen eine Verlagerung der Akzentsilbe bewirkt (árabe ‘Araber(in)’ > arábico ‘arabisch’; Hércules ‘Herkules’ > hercúleo ‘herkulisch’). Vgl. dazu genauer NGRAE (2011: 390-402). Zur Akzentuierung bei der Wortbildung vgl. außerdem D’Introno et al. (1995: 421ff.), Hualde (2006), Kubarth (2009: 198f.). Zur spanischen Wortbildung vgl. Rainer (1993), Schpak-Dolt ( 2 2012: 68-133); zur Akzentuierung von Komposita vgl. 4.3.8. A: Unmarkierte und regelhafte Akzentmuster Pänultima-Akzentuierung bei leichter Ultima (-V) Ultima-Akzentuierung bei schwerer Ultima (-VC/ VG) acuerdo ‘Abkommen’, abeja ‘Biene’, mesa ‘Tisch’ etc. mujer ‘Frau’, cristal ‘Glas’, jardín ‘Garten’, ¡caray! ‘Donnerwetter! ’ etc. B: Markierte Akzentuierung Antepänultima-Akzentuierung - águila ‘Adler’, éxito ‘Erfolg’, índole ‘(We‐ sens-)Art’ etc. - C: Ausnahmen Pänultima-Akzentuierung bei schwerer Ultima (-VC) Ultima-Akzentuierung bei leichter Ultima (-V) árbol ‘Baum’, crisis ‘Krise’, origen ‘Herkunft’, huésped ‘Wirt, Gast’ etc. café ‘Kaffee’, mamá ‘Mama’, menú ‘Menü’, ojalá ‘hoffentlich’ etc. Abb. 4.3-4: Regeln und Ausnahmen bei der Akzentuierung spanischer Nomina (nach NGRAE 2011: 380). Insgesamt bleibt die Akzentuierung der Nomina im Spanischen komplex. 52 Es gibt Regeln, es gibt markierte und unmarkierte Betonungsmuster, und es gibt Ausnahmen. Weiterhin liegen bei zahlreichen Wörtern konkurrierende Betonungsmuster vor, die durch diaphasische oder diatopische Variation bedingt sind (diastratisch: kilómetro (Norm) / kilometro (Substandard); diatopisch: fútbol (europäisches und südliches lateinamerikanisches Spanisch) / futbol (mexikanisches und zentralamerikanisches Spanisch; vgl. NGRAE 2011: 383-390). Die Nueva gramática de la lengua española schreibt: La heterogeneidad de los hechos relacionados con la acentuación se origina porque al núcleo de voces patrimoniales que constituye la base fundamental del léxico, se añaden a lo largo de los siglos elementos periféricos de historia compleja y de estructuras fónicas procedentes de otras lenguas, además de un importante grupo de cultismos y de nombres propios, antropónimos y topónimos. Todos estos elementos aparecen en el léxico del español y alteran en mayor o menor medida las tendencias generales (NGRAE 2011: 390). 208 4 Prosodie <?page no="209"?> 53 Einen vollständigen Überblick über alle drei Konjugationsklassen (-ar, -er, -ir) und alle Modi und Tempora geben Kubarth (2009: 184) und Schpak-Dolt ( 2 2012: 52f.). 4.3.5.4 Der Wortakzent bei spanischen Verben Während sich bei den Nomina die Zuweisung des Wortakzents auf das kontextfreie lexikalische Wort bezieht, ist sie in spanischen Verbformen morphologisch geregelt und auf das grammatische Wort bezogen, also auf die hinsichtlich der syntaktischen Funktionen durch das Anfügen von Flexionsmorphemen spezifizierte Wortform. Die Möglichkeit, die Akzentposition innerhalb der letzten drei Silben eines Worts zu vari‐ ieren, wird im Spanischen dazu genutzt, bestimmte Tempora und Modi mit bestimmten Betonungsmustern zu verknüpfen. Um die Akzentverteilungsmuster besser zu verstehen, ist es zunächst notwendig, die morphologische Struktur spanischer Verben zu rekapitulieren. Eine flektierte Verb‐ form kann im Spanischen in Stamm und Endung aufgegliedert werden. Dabei besteht der Stamm aus Wurzel (W) und Themavokal (TV) bzw. Stammerweiterungsaffix, die Endung aus Tempus-Modus- (TM) und Person-Numerus-Marker (PN); vgl. Schpak-Dolt ( 2 2012: 47-52) und Abb. 4.3-5. Abb. 4.3-5: Die morphologische Binnenstruktur spanischer Verben. Die morphologische Steuerung des Akzents äußert sich in einem spezifischen Akzent‐ muster für jedes Tempus-Modus-Paradigma, das für dieses in allen Konjugationsklas‐ sen einheitlich gilt. So fällt der Akzent im futuro simple und im condicional simple auf den Tempus-Modus-Marker (TM) -rabzw. -rí-, und dies durchgehend für alle Personen und Numeri. Auch im pretérito imperfecto indicativo und subjuntivo (-se und -ra) fällt der Akzent immer auf eine einheitliche Position; im Unterschied zum Futur und Konditional ist das aber das Stammerweiterungsaffix bzw. der Themavokal (TV). Diese säulenartige Akzentverteilung sieht in der a-Konjugation folgendermaßen aus: 53 4.3 Akzent und Akzentphonologie 209 <?page no="210"?> 54 Im pretérito simple der Verben mit sog. starken Perfekt (andar, estar, haber, hacer, poder, tener etc.) liegt ebenfalls eine Alternanz von Wurzel- und Endungsbetonung vor, jedoch mit anderer Verteilung. Wurzelbetont sind die 1. und 3. Singular (pude, pudo), endungsbetont die 2. Singular und das Pluralparadigma (pudiste, pudimos etc.). futuro simple condicional simple W TV TM PN W TV TM PN - - - - habl a ré - habl a ría - - - - - habl a rá s habl a ría s - - - - habl a rá - habl a ría - - - - - habl a re mos habl a ría mos - - - - (habl a ré is) (habl a ría is) - - - - habl a rá n habl a ría n - - - - pretérito imperfecto simple indicativo pretérito imperfecto simple subjuntivo (-se) pretérito imperfecto simple subjuntivo (-ra) W TV TM PN W TV TM PN W TV TM PN habl a ba - habl a se - habl a ra - habl a ba s habl a se s habl a ra s habl a ba - habl a se - habl a ra - habl á ba mos habl á se mos habl á ra mos (habl a ba is) (habl a se is) (habl a rá is) habl a ba n habl a se n habl a ra n Abb. 4.3-6: Akzentmuster im futuro simple, condicional, imperfecto indicativo und subjuntivo. Die Tabellen in Abb. 4.3-6 zeigen die einheitliche Akzentpositionierung. Im futuro simple und im condicional ist die Silbe unmittelbar nach dem Themavokal (TV) betont, in den drei Paradigmen des imperfecto die TV-Silbe. Die Anzahl der Silben, die auf die betreffende Bezugssilbe folgen, spielt für die Akzentzuweisung dagegen keine Rolle (hablaba ‘ich/ er/ sie sprach’ und hablábamos ‘wir sprachen’); irrelevant ist auch das Silbengewicht (hablabais ‘ihr spracht’ trotz schwerer Endsilbe). Dem Muster einer solchen einheitlichen Bezugssilbe folgt auch das pretérito simple (auch: pretérito perfecto simple, indefinido) der regelmäßigen Verben. Allerdings ist hier die genaue morphologische Kennzeichnung der Akzentsilbe nicht mehr transparent, da sich Themavokal, TM- und PN-Marker überlagern (Kubarth 2009: 185f.). Morpholo‐ gisch reguliert bleibt das Akzentmuster trotzdem, da die Positionierung der Akzentsilbe innerhalb der Verbform das Paradigma eint. 54 210 4 Prosodie <?page no="211"?> 55 Auch die voseo-Form der 2. Person Singular (vos) hablás, die von der 2. Person Plural abgeleitet ist, folgt dem endungsbetonten Muster. pretérito simple habl é habl aste habl ó habl amos (habl asteis) habl aron Abb. 4.3-7: Akzentmuster im pretérito simple der regelmäßigen Verben. Einem anderen Muster folgen dagegen presente indicativo und subjuntivo bei allen Ver‐ ben. In diesen Paradigmen gibt es keine einheitliche Akzentposition. Dies hängt damit zusammen, dass sich hier die lateinische Unterscheidung zwischen stammbetonten und endungsbetonten Formen fortsetzt. Aber auch dieses Muster ist morphologisch reguliert, da der Akzentsilbenwechsel mit dem Wechsel der Personen verknüpft ist. presente indicativo presente subjuntivo habl o habl e habl as habl es habl a habl e habl amos habl emos (habl áis) (habl éis) habl an habl en Abb. 4.3-8: Akzentmuster im presente indicativo und subjuntivo. Den Akzent auf der Wurzelsilbe haben die 1., 2. und 3. Singular und Plural; endungs‐ betont sind dagegen die 1. und 2. Plural (mit einer Akzentverteilung, die wiederum unabhängig von der Silbenzahl der Endung ist). 55 Die Akzentalternanz wird in einer Reihe von Verben durch das Abwechseln von diphthongierten Formen bei Wurzelbe‐ tonung (pienso ‘ich denke’) und nicht diphthongierten Formen bei Endungsbetonung (pensamos ‘wir denken’) gestützt. 4.3 Akzent und Akzentphonologie 211 <?page no="212"?> 56 Wortformen wie ¡Cántamelo! oder mecánicamente ‘mechanisch (Adv.)’ die auf einer der Antepänul‐ tima vorangehenden Silbe betont werden, nennt man palabras sobreesdrújulas. Im argentinischen Spanisch kommt dieses Betonungsmuster bei den Imperativen nicht vor, da diese in der Grundform endbetont sind, z. B. ¡Cantá! ‘Sing! ’, ¡Cantalo! ‘Sing es! ’, ¡Cantámelo! ‘Sing es mir (vor)! ’; vgl. auch 4.3.8. 57 <y> zur Wiedergabe des wortfinalen Gleitlauts zählt nicht zu den Vokalbuchstaben. Die regelkon‐ forme Betonung der Ultima bei virrey ‘Vizekönig’ wird daher nicht markiert, wohl aber die nicht regelkonforme paroxytone Betonung bei yóckey ‘Jockey’. <i> wird dagegen als Vokalgraphem gewertet, auch wenn es einen Approximanten wiedergibt. Deshalb wird die mit der halbvokalischen Realisierung verbundene Betonung des finalen Diphthongs in samurái ‘Samurai’ und bonsái ‘Bonsai’ mit dem Akut markiert (Hualde 2005: 247f.). 4.3.6 Die orthographische Markierung des Wortakzents Die spanische Orthographie kennzeichnet die Akzentposition nur dann, wenn sie nicht den beiden regelhaft gewichtssensitiven Akzentverteilungen bei den palabras llanas und agudas entspricht. Immer im Fall der markierten Antepänultimabetonung und bei den Ausnahmen zur gewichtssensitiven Betonung von Pänultima und Ultima wird die Akzentposition durch einen graphischen Akut angezeigt. Nicht gekennzeichnet werden also Fälle wie mesa (paroxyton bei leichter, auf Vokal endender Ultima) oder señor (oxyton bei schwerer, auf Konsonant endender Ultima). Da die Flexionssuffixe die Akzentverteilung nicht verändern, sind auf <-s>, <-n> bzw. <-es> endende Wörter fest mit dem paroxytonen Betonungsmuster assoziiert und werden deshalb graphisch nicht gekennzeichnet (hablan, señores: paroxyton bei flexivischem Endkonsonanten bzw. flexivischer Ultimasilbe). Dies gilt auch dann, wenn die betreffenden Grapheme nicht zu einer Flexionsendung gehören. Deshalb wird bei phonologisch nicht regelhaft betontem crisis oder origen (paroxyton trotz konsonantisch auslautender Ultima) kein Akut gesetzt. Mit einem Akut gekennzeichnet wird die Wortakzentsilbe: • bei allen palabras esdrújulas: fábrica ‘Fabrik’, fórmula ‘Formel’, depósito ‘Depot’, Aristóteles (Eigenname), amábamos ‘wir liebten’ etc.; auch bei Verbformen mit nachgestellten Klitika wird die Akzentstelle markiert, sobald sich durch die Silben der Klitika Antepänultimabetonung oder eine noch weiter nach links verschobene Betonung ergibt: ¡Cántalo! ‘Sing es! ’, ¡Cántamelo! ‘Sing es mir (vor)! ’; 56 • bei den palabras agudas nur dann, wenn die Ultima auf einen Vokalbuchstaben oder auf <-s> oder <-n> endet: dominó ‘Domino’, bungaló ‘Bungalow’, cantó ‘er/ sie sang’, hablé ‘ich sprach’, ahí ‘hier’, allá ‘dort’; ebenso francés ‘französisch’, entona‐ ción ‘Intonation’, comerán ‘sie werden essen’ etc.; • bei den palabras llanas nur dann, wenn die Ultima auf einen anderen Konsonant‐ buchstaben als <-s> oder <-n> endet: árbol ‘Baum’, fútbol (vs. mex. futbol) ‘Fußball’, lápiz ‘Bleistift’, útil ‘nützlich’, ágil ‘flink’ etc. 57 Außerdem kennzeichnet der Akut betonbare Funktionswörter bzw. homophone lexi‐ kalische Formen. Dadurch werden bestimmte Homophone graphisch differenziert: 212 4 Prosodie <?page no="213"?> 58 Zur Metrischen Phonologie vgl. Nespor (1993: 149-185, 235-263; 1999), Hammond (1995), Kager (1995, 2007), Van der Hulst (2000), Dufter (2003: 58-80), Kubarth (2009: 190-196) und Hall ( 2 2011: 271-290). el definiter Artikel él betonbares Pronomen este Demonstrativdeterminant éste Demonstrativpronomen se unbetontes Reflexivpronomen sé 1. Sing. Präs. von saber tu Possessivdeterminant tú betonbares Pronomen mi Possessivdeterminant mí betonbares Pronomen si Konjunktion sí Partikel, betonbares Pronomen mas Konjunktion más Steigerungspartikel que Konjunktion qué Fragepronomen quien Relativpronomen quién Fragepronomen Abb. 4.3-9: Graphische Homophonendifferenzierung durch den Akut. 4.3.7 Metrische Phonologie Die Beschreibung des spanischen Wortakzents, die wir vorgestellt haben, berücksich‐ tigt zwei prosodische Ebenen: die der Silbe und die des phonologischen Wortes. In dieser Hinsicht orientieren wir uns an traditionellen Beschreibungen, die den Akzent direkt an der silbischen Struktur des Wortes festmachen. Im Bereich der Akzentpho‐ nologie gibt es mit der Metrischen Phonologie aber auch eine alternative Theorie. Diese vertritt wie die autosegmentale Phonologie (3.3) einen nicht-linearen Ansatz. Beide Forschungsrichtungen haben sich von der Beschränkung phonologischer Regeln auf die Segmentebene gelöst und schlagen übergeordnete prosodische Strukturierungsebenen wie den Fuß (P), das phonologische Wort (ω) oder die phonologische Phrase (φ) vor (4.1.2). Während die autosegmentale Phonologie sich u. a. mit der Zuweisung von Tönen beschäftigt, stellt die Metrische Phonologie die Frage nach den Regeln der Akzentuierung. 58 Wie ihr Name zeigt, orientiert sie sich dabei an Konzepten der klassischen Verslehre, der Metrik. Sie geht davon aus, dass die Akzentzuweisung durch das Zusammenwirken übergeordneter prosodischer Ebenen mit der Ebene des Fußes erfolgt. Wie bereits in 4.1.1 gesagt, ist der Fuß eine maximal dreigliedrige Folge von Silben, von denen eine stärker (f = fuerte bzw. s = engl. strong) ist als die andere(n) (d = débil bzw. w = engl. weak). Die Metrische Phonologie postuliert, dass nicht nur die gebundene Rede, sondern Lautsprache allgemein die prosodische Gliederung nach dem Fußprinzip respektiert. Sie geht davon aus, dass wir uns beim Sprechen an universellen rhythmischen Prinzipien orientieren, nämlich am Wechsel zwischen starken und schwachen Silben. 4.3 Akzent und Akzentphonologie 213 <?page no="214"?> In Einklang mit diesem Grundsatz postuliert die Metrische Phonologie, dass die Zuweisung des Wortakzents im Spanischen auf der Grundlage von phonologischen Regeln erfolgt und nicht idiosynkratisch mit jedem Lexem abgespeichert wird. Da sie außerdem davon ausgeht, dass alle Ebenen der prosodischen Strukturierung durch dieselben Regularitäten bestimmt sind, können die phonologischen Regeln, nach denen der Wortakzent determiniert wird, mit bestimmten eurhythmischen Regeln in Verbindung gebracht werden, die auch für die Zuweisung von Nebenakzenten oder für Akzentverschiebungen gelten. Diese zweite Fragestellung, die der Setzung von Nebenakzenten sowie Akzentverschiebungen und Deakzentuierungen in der Äußerung nachgeht, werden wir in 4.3.8 weiterverfolgen. Die Zuweisung des Wortakzents im Spanischen geschieht auf der Basis universeller Prinzipien, die einzelsprachlich parametrisiert sind. Folgende Parameter bzw. Parame‐ terwerte werden vorgeschlagen (Kager 1995: 370-373, Kubarth 2009: 192f.): • Gebundenheit: Nach der Option gebundener Fußstrukturen umfassen Füße maximal zwei Silben. Ungebunden sind Füße dagegen, wenn in der betreffenden Sprache keine maximale Silbenzahl festgelegt ist. Für das Spanische gilt: Füße sind gebunden, d. h. auf maximal zwei Silben beschränkt. • Dominanz auf Fußebene: Füße sind je nach Sprache entweder linksdominant (betonte Silbe zuerst, Trochäus) oder rechtsdominant (betonte Silbe zuletzt, Jam‐ bus). Das Spanische hat linksdominante zweisilbige Füße. • Gewichtssensitivität: Sprachen, die gewichtssensitiv sind, erlauben in der beton‐ ten Position nur schwere Silben. Das Spanische ist bedingt gewichtssensitiv, da zwar die Silbenschwere eine Rolle bei der Akzentzuweisung spielt, der Wortakzent aber auch leichten Silben zugewiesen werden kann. • Konstruktionsrichtung: Die Silben eines Wortes werden ausgehend vom rech‐ ten oder vom linken Rand zu Füßen geordnet. Das Spanische weist Fußstrukturen von rechts nach links zu, beginnt also am Wortende. • Dominanz auf Wortebene: Der Fuß, dessen dominante Silbe den Wortakzent erhält, kann am linken Wortrand (Wortanfang) oder am rechten (Wortende) liegen. Im Spanischen erhält die betonte Silbe des letzten Fußes die Wortakzentzuweisung. Der Wortakzent ist also am Wortende lokalisiert. Wir verdeutlichen die genannten Regularitäten im Folgenden anhand eines Beispiels und präsentieren die metrische Struktur des Worts inescrupuloso ‘skrupellos’ gemäß den beiden Darstellungsverfahren der Metrischen Phonologie, dem Strukturbaum (sp. árbol métrico, engl. metrical tree) und dem Gitter (sp. red métrica, engl. metrical grid). 214 4 Prosodie <?page no="215"?> 59 ᴗ steht für eine leichte, - für eine schwere Silbe. Abb. 4.3-10: Metrischer Baum zu inescrupuloso. Im metrischen Baum (Abb. 4.3-10) werden die Konstituenten auf den einzelnen prosodischen Ebenen angegeben. Gleichzeitig werden die Köpfe der einzelnen Konsti‐ tuenten, also die starken Positionen, markiert. Der Wortakzent ergibt sich aus den Stärkerelationen innerhalb der prosodischen Hierarchie. Er fällt auf die Silbe, die direkt unter den dominanten Verzweigungen steht. Im metrischen Gitter (Abb. 4.3-11) erhalten alle betonbaren Silben einen Schlag (angezeigt durch ‘*’). Dann beginnt die Fußzuweisung, und zwar, wie oben präzisiert, am rechten Wortrand mit der letzten Wortsilbe. Sie führt zu drei Trochäen, deren jeweils erste Silben einen weiteren Schlag, also einen Fußakzent, erhalten. Der Wortakzent wird der betonten Silbe des Trochäus am Wortende zugewiesen, die damit die höchste Zahl an Schlägen aufweist und als Akzentposition gewählt wird. - - - - * - * - * - * - * * * * * * inescrupuloso Abb. 4.3-11: Metrisches Gitter zu inescrupuloso. Das analysierte Lexem ist bewusst gewählt, da die Analyse nach den vorgeschlagenen Parametrisierungen hier unproblematisch ist: Der metrische Algorithmus errechnet nach beiden Modellen die korrekte Position des Wortakzents. Nicht so einfach ist die Zuweisung des Wortakzents bei Ultimabetonung, denn am Wortende kann kein vollständiger Trochäus stehen; eine unbetonte Silbe nach dem Akzent fehlt, und die Fußstruktur ist daher unvollständig. Kubarth (2009: 196ff.) schlägt deshalb vor, für das Spanische von der Gleichwertigkeit des Trochäus (σᴗ) 59 mit einer schweren Silbe (-) auszugehen. Bei Ultimabetonung wird dann ein eigenständiger, nur eine schwere Silbe umfassender Fuß am Wortende angesetzt, der wie die starke Silbe des Trochäus 4.3 Akzent und Akzentphonologie 215 <?page no="216"?> den Wortakzent erhält. Die Gitterstrukturen zu den Wörtern taberna ‘Kneipe’ und perejil ‘Petersilie’ sollen diesen Ansatz verdeutlichen. - * - - - - * * * * - * * * σ (σ ᴗ) - σ σ (-) taberna - perejil Abb. 4.3-12: Verfußung und Wortakzentzuweisung bei taberna ‘Kneipe’ und perejil ‘Petersilie’ (nach Kubarth 2009: 197). Ob die Position des Wortakzents, wie in der Metrischen Phonologie angenommen, durch Verfußung jedes Mal aufs Neue errechnet wird oder ob sie Bestandteil unseres lexikalischen Wissens ist, bedarf noch weiterer Klärung. 4.3.8 Nebenakzente und Akzentverschiebungen Wie bereits gesagt, spielt die Fußstruktur im Rahmen der Metrischen Phonologie eine zentrale Rolle. Man geht davon aus, dass die Sprecher auf den gleichmäßigen Wechsel zwischen starken und schwachen Silben sowohl auf Wortals auch auf Phrasenebene achten (Nespor 1993: 235-263). Dieses eurhythmische Prinzip erklärt, warum im Englischen oder Deutschen beim unmittelbaren Aufeinandertreffen zweier Wortakzentsilben (engl. accent clash, sp. choque acentual) eine Akzentverschiebung auftritt: So verschiebt sich im engl. Wort thirteen [ ˌ θɜː ˈ tiːn] der Wortakzent von der letzten auf die vorletzte Silbe, wenn eine betonte Silbe nachfolgt wie in thirteen+men [ ˌ θɜːtiːn ˈ men]. Gleiches gilt für dt. Bahnhof [ ˈ baːn ˌ hoːf]: Im Kompositum mit Haupt wird die Akzentstelle auf die Ultima verschoben und dort als Nebenakzent realisiert, d. h. Haupt+Bahnhof [ ˈ haʊ̯ptbaːn ˌ hoːf] (vgl. Nespor 1993: 242ff., Visch 1999: 188-196). Mit eurhythmischen Prinzipien begründet die Metrische Phonologie weiterhin die Tatsache, dass eine längere Folge von unbetonten Silben durch die zusätzliche Setzung von Nebenakzenten (sp. acento secundario) intern differenziert wird, damit eine gleichmäßig abwechselnde Prominenzkontur zwischen starken und schwachen Silben auch unabhängig vom Hauptakzent gewährleistet werden kann. Im Spanischen scheinen diese eurhythmischen Prinzipien bei der Akzentkollision eine geringere Rolle zu spielen als im Englischen und Deutschen (NGRAE 2011: 423f.). In einem Kompositum wie cartón piedra ‘Pappmaschee’ werden trotz des Aufeinandertreffens zweier akzenttragender Silben beide Wortakzente realisiert; der Akzent fällt jedoch im ersten Teil des Kompositums (cartón) schwächer aus. Die Verschiebung des Akzents ist hingegen selten und scheint nur zusammengesetzte Eigennamen zu betreffen wie z. B. José Mari [ ˌ xose ˈ maɾi] (vgl. Hualde 2006, NGRAE 2011: 424). 216 4 Prosodie <?page no="217"?> Anders verhält es sich bei zusätzlichen Nebenakzenten, die auch in traditionellen Ansätzen angenommen werden (Navarro Tomás 19 1977: 195ff.; vgl. auch Hualde 2010). Längere Abfolgen unbetonter Silben werden im Spanischen i. d. R. durch die Setzung von Nebenakzenten intern weiter differenziert: So ist etwa bei isolierter Aussprache von bienvenido ‘willkommen’ auf der ersten Silbe bienmeist ein F 0 -Gipfel zu verzeichnen, der zwar nicht den mit der Hauptakzenttonstelle -niassoziierten übertrifft, andererseits aber prominent genug ist, um die erste Silbe deutlich von der folgenden, unbetonten Silbe zu unterscheiden. Abb. 4.3-13: Realisierung des Nebenakzents in bienvenido (NGRAE 2011: 369). Die Platzierung von Nebenakzenten ist nicht zufällig (Harris 1983, Roca 1996). Aus der Annahme, die akzentuelle Gliederung erfolge über die Zuweisung von Füßen, folgt die Regel, dass Tonsilben durch mindestens eine unbetonte Silbe voneinander getrennt sein müssen; Akzentverteilungen wie *[bjem ˌ be ˈ niðo] oder *[ ˈ da ˌ melo] ¡dámelo! − als Beispiel für einen nachtonigen Nebenakzent − sind dementsprechend ausgeschlossen. Die Regel, dass Haupt- und Nebenakzent nicht adjazent sein können, gilt also unab‐ hängig von der Position des Nebenakzents (vor oder nach dem Hauptakzent) und betrifft sowohl das phonologische Wort als auch die Klitische Gruppe (4.3.5.1). Vortonige Nebenakzente können bei Wörtern, die mehr als eine Silbe vor der Akzentsilbe aufweisen, unbeschränkt auftreten. Den Regeln der Verfußung folgend werden sie von rechts nach links auf jeder zweiten Silbe platziert, z. B. (constan) (tino)(poli)(tano) [ ˌ kons.tan ˌ ti.no ˌ po.li ˈ ta.no]. Bleibt bei der Verfußung eine Silbe am Wortanfang übrig, wird diese meist in den ersten Fuß integriert und dieser damit in einen Daktylus umgewandelt, z. B. in(hospi)(tali)dad > (inhospi)(tali)dad [ ˌ i.nos.pi ˌ ta.li ˈ ðað] ‘Ungastlichkeit’ (vgl. Kubarth 2009: 206). Vortonige Nebenakzente werden oft durch einen F 0 -Gipfel ohne Längung der Silbe markiert (Hualde 2005: 246, NGRAE 2011: 369). In distanzsprachlichen Sprechstilen, so z. B. in Rundfunknachrichten oder politischen Reden, wird von dieser Akzentuierung teils so intensiv Gebrauch gemacht, dass der ganze Text hierdurch einen emphatischen Charakter erhält (Hualde 2006, Kubarth 2009: 205). 4.3 Akzent und Akzentphonologie 217 <?page no="218"?> 60 Die Zuordnung zu den beiden Klassen von Komposita ist nicht immer eindeutig; es ist sinnvoll, hier von einem Kontinuum auszugehen. Für weitere Beispiele vgl. Hualde (2005: 226f.), Kubarth (2009: 202ff.) und NGRAE (2011: 392f.); speziell zur Frage der Akzentsetzung in Komposita vgl. Hualde (2006). Die Realisierung eines nachtonigen Nebenakzents in der Klitischen Gruppe ist nur am rechten Rand der Intonationsphrase am Satzende möglich. In dieser Position treten Nebenakzente in einigen amerikanischen Varietäten des Spanischen sowie im Aragonesischen bei Imperativen wie ¡tómatelo! [ ˈ to.ma.te ˌ lo] auf; im informellen Register des argentinischen Spanisch, das bei den Imperativen ohnehin eine von den übrigen Varietäten abweichende Akzentuierung aufweist (¡tomá! anstelle von ¡toma! ), hat sich die Hauptakzentposition sogar vom Verb auf das Klitikon verlagert [to ˌ ma.te ˈ lo] (vgl. NGRAE 2011: 413, Colantoni & Cuervo 2013). Nebenakzente spielen auch bei zusammengesetzten Wörtern eine wichtige Rolle; die Akzentzuweisung in Komposita verläuft nach zwei möglichen Verfahren. Wenn jedes Glied seinen Wortakzent behält, entsteht ein sog. syntagmatisches Kompositum (compuesto sintagmático, NGRAE 2011: 394), das prosodisch gesehen als Verbindung zweier phonologischer Wörter (ω) zu einer Phrase (φ) mit zwei Hauptakzenten aufzufassen ist, z. B. camión cisterna ‘Tankwagen’. Stärker lexikalisierte Komposita (compuestos propios, NGRAE 2011: 392) hingegen werden als eigene phonologische Wörter mit nur einer Akzentstelle aufgefasst, z. B. hierbabuena ‘Minze’ (wörtl.: ‘gutes Gras’). 60 Auch im Falle der Adverbbildungen mit -mente geht die traditionelle Grammatik davon aus, dass ein syntagmatisches Kompositum mit zwei Wortakzenten vorliegt. Daher behalten die Adjektive, deren Akzentsilbe orthographisch mit einem Akut markiert wird, diesen in der Adverbform mit -mente bei (z. B. rápidamente ‘schnell’, cortésmente ‘höflich’). Die syntagmatische Durchsichtigkeit der Adverbbildung ist jedoch umstritten, da der Grammatikalisierungsgrad des Suffixes -mente weit fortge‐ schritten ist. Aus prosodischer Sicht ist es hier sinnvoller, einen Nebenakzent auf der adjektivischen Basis anzunehmen, der in Schnellsprechformen wiederum fehlen kann, während der Hauptakzent auf der Pänultima liegt (und das Drei-Silben-Fenster gewahrt bleibt) (NGRAE 2011: 395f.). 4.4 Rhythmus: Die zeitliche Gliederung der Sprache Der Begriff Rhythmus (gr. ῥυθμός rhythmós ‘gleichmäßige Bewegung, Ebenmaß, Takt’) ist uns aus unterschiedlichen alltagssprachlichen Bereichen geläufig. Grundsätzlich versteht man hierunter das gleichmäßige Wiederkehren zeitlicher Einheiten. So spricht man etwa vom Biorhythmus und meint damit die regelmäßige Wiederkehr von Zu‐ ständen unseres Organismus wie Schlaf- und Wachphasen. Unter dem musikalischen Rhythmus versteht man, wie in Abb. 4.4-1 gezeigt, regelmäßig wiederkehrende Muster langer und kurzer Notenwerte (hier jeweils: punktierte Viertelnote, Achtelnote, Vier‐ 218 4 Prosodie <?page no="219"?> 61 Im Französischen wird im Normalfall immer die letzte Silbe einer Wortgruppe betont, wodurch sich positionsbedingt ein zusätzlicher Längungseffekt ergibt (vgl. Delais-Roussarie et al. 2015: 68f., 81-86, 99f., Pustka 2 2016: 130f.). Zur Längung der Tonsilben im Italienischen vgl. 5.1.7. telnote), die sich von einem gleichbleibenden Grundschlag (auch: Grundpuls) abheben. Da die einzelnen Schläge des Grundpulses nicht als gleich stark wahrgenommen werden, entsteht eine Betonungs- oder Akzentstruktur, die man als Metrum bezeichnet. Die metrische Struktur unseres Beispiels (1. Zählzeit: schwer, 2. Zählzeit: leicht, 3. Zählzeit: leicht) ergibt einen Dreivierteltakt und entspricht dem daktylischen Muster (- ᴗ ᴗ). Wenn man diese Struktur auf spanische Wörter überträgt, erhält man antepänultimabetonte palabras esdrújulas wie z. B. régimen ‘Regime’, múltiple ‘mehrfach’ oder máximo ‘maximal’ (vgl. 4.3.5.2). Abb. 4.4-1: Metrum (hier: Dreivierteltakt, unteres System) und Rhythmus (oberes System) in der Musik. Aus der regelmäßigen Abfolge unterschiedlicher Notenwerte (hier: punktierte Viertelnote, Achtelnote, Viertelnote) ergibt sich ein (wieder)erkennbarer Rhythmus. Im Kapitel zum Akzent haben wir gelernt, dass die Sprachen der Welt unterschiedli‐ che prosodische Parameter nutzen, um betonte Silben (auch: akzentuierte, metrisch starke oder Tonsilben; sp. sílabas acentuadas, métricamente fuertes oder tónicas) von unbetonten abzuheben und sie damit prominenter, also für die Wahrnehmung in irgendeiner Weise auffälliger zu machen. Wir haben bereits gesagt, dass das wichtigste Korrelat der Betonung im Spanischen die mit der akzentuierten Silbe verbundene Tonhöhenbewegung ist (zur Form dieser Tonhöhenbewegungen vgl. 4.5.4). Zusätzlich wird mit der Längung betonter Silben ein zeitliches Kriterium genutzt (4.3.3). Nach Delattre (1966: 189) sind betonte Silben im Spanischen ca. 30 % länger als unbetonte; in anderen Sprachen ist dieser Unterschied noch stärker ausgeprägt (Deutsch: 44 %, Englisch: 60 %, Französisch: 78 %; vgl. auch Delattre 1965). 61 Längungseffekte treten auch bei der prosodischen Gliederung größerer Einheiten auf wie z. B. unmittelbar vor den Grenzen von Intonationsphrasen. Derartige dauerbasierte Charakteristika, wie sie sich u. a. aus den Betonungsmustern (Verteilung von Prominenzen in Wort und Satz, vgl. 4.3.2) und dem systematischen Gebrauch von Längungen ergeben, bestimmen neben der Sprachmelodie (Intonation, vgl. 4.5) die Prosodie einer Sprache maßgeblich. Man fasst sie unter dem Begriff des ‘Sprachrhythmus’ (engl. speech rhythm, sp. ritmo del habla) zusammen. 4.4 Rhythmus: Die zeitliche Gliederung der Sprache 219 <?page no="220"?> Unter Sprachrhythmus versteht man die zeitliche Gliederung der Sprache, wie sie sich aus der systematischen Verteilung kürzerer und längerer Einheiten und aus der wiederkehrenden Abfolge von Prominenzen ergibt. Den Sprechern selbst sind die rhythmischen Eigenschaften ihrer Sprache oft nur wenig bewusst; diese bestimmen jedoch die Wahrnehmung des besonderen Klanges einer Sprache maßgeblich. Wenn man beispielsweise als Zuhörer aus der Ferne bereits erkennt, welche Sprache oder Varietät eine Gruppe von Personen spricht, bevor man einzelne Wörter oder gar Sätze heraushören und verstehen kann, so liegt dies oft daran, dass man die betreffende Sprache aufgrund ihrer prosodischen und insbesondere rhythmischen Besonderheiten identifiziert. Ebenso ist der Sprachrhythmus oft dafür verantwortlich, dass fortgeschrittene Lernende einer Fremdsprache als Nicht-Mutter‐ sprachler zu erkennen sind − selbst wenn sie flüssig und idiomatisch sprechen, keine grammatischen Fehler machen, auf der Lautebene die einzelnen Segmente der Zielsprache perfekt produzieren und sogar deren Sprachmelodie erfolgreich ‘imitieren’ können (vgl. 5.3.2). Mit der prosodischen Eigenschaft des Sprachrhythmus befassen wir uns in diesem Kapitel genauer. Dabei konzentrieren wir uns auf den Rhythmus als dauerbasiertes Phänomen, wie er sich aus der systematischen Verteilung längerer und kürzerer Einheiten des Sprachsignals (entsprechend den langen und kurzen Notenwerten in Abb. 4.4-1) ergibt und auch in der neueren Rhythmusforschung (4.4.2) im Mittelpunkt des Interesses steht. In einem ersten Schritt besprechen wir zunächst die sog. klassische Rhythmustypologie (4.4.1). 4.4.1 Die klassische Rhythmustypologie: Silben- und akzentzählende Sprachen Das Bewusstsein darüber, dass die Gestaltung der lautlichen Oberfläche einer Sprache ebenso wie die Musik maßgeblich von zeitlichen Verhältnissen bestimmt wird, ist nicht neu. Entsprechende Zeugnisse stammen bereits aus dem späten 18. Jahrhundert (Steele 1775/ 1969) und wurden u. a. von Lloyd James (1940) aufgegriffen, der in einer Abhandlung über die Übermittlung von Sprachsignalen mittels der neuen Telefontech‐ nik feststellte, dass manche Sprachen dem Englischen in Bezug auf wiederkehrende zeitliche Muster ähnlich sind und manche nicht. Für die dem Englischen gleichenden Sprachen prägte er den Terminus morse code rhythm. Sie sind dadurch gekennzeichnet, dass die Abstände zwischen akzentuierten Silben gleich lang erscheinen, während zwischen diesen Tonsilben eine jeweils unterschiedliche Anzahl von unbetonten Silben platziert sein kann. Hieraus ergibt sich ein klanglicher Eindruck, der an ein Morsesignal erinnert. In anderen Sprachen wie etwa dem Spanischen erscheinen die Abstände zwi‐ schen den Anfangsrändern (Onsets, vgl. 4.2.4.1) aller Silben − also der betonten wie der unbetonten − ungefähr gleich lang; eine solche Abfolge tendenziell gleichlanger Silben 220 4 Prosodie <?page no="221"?> 62 Neben den silben- und akzentzählenden Sprachen wurde mit den sog. morenzählenden Sprachen ein dritter Typ identifiziert, als dessen Prototyp das Japanische gilt. Hierbei ist die Grundeinheit die Mora, eine Art ‘Gewichtsmaß’ für Sprachen, die zwischen ‘leichten’ (einmorigen) und ‘schweren’ (zweimorigen) Silben unterscheiden (vgl. Pompino-Marschall 3 2009: 248). Zur Anwendung des Konzepts der Silbenschwere auf die Akzentuierungsmuster des Spanischen vgl. 4.1.1 und 4.2.2. erinnerte Lloyd James an eine Maschinengewehrsalve − daher der Terminus machine gun rhythm. Der Phonetiker Pike (1945) übernahm diese Einteilung der Sprachen in zwei rhythmische Klassen und prägte hierfür die heute geläufige Terminologie der ak‐ zentzählenden und silbenzählenden Sprachen (engl. stress-timed vs. syllable-timed languages, sp. lenguas de ritmo acentual vs. silábico). Beiden Sprachengruppen gemein sei − so Pike −, dass sie entweder in Bezug auf die Abstände zwischen betonten Silben oder zwischen allen Silbenonsets nach Gleichförmigkeit streben. Diese grundlegende Idee ist als sog. Isochroniehypothese (agr. ἴσος ísos ‘gleich’ + χρόνος chrónos ‘Zeit’) bekannt geworden. Der Ansatz, die rhythmischen Eigenschaften der Sprachen der Welt mithilfe einer solchen Dichotomie zu erfassen, wurde von Abercrombie (1967) in seinen Elements of General Phonetics übernommen: Every language […] is spoken with one kind of rhythm or with the other. In the one kind, known as a syllable-timed rhythm, the periodic recurrence of movement is supplied by the syllable-producing process […] the syllables recur at equal intervals of time − they are isochronous […]. In the other kind, known as a stress-timed rhythm, the periodic recurrence is supplied by the stressproducing process […] the stressed syllables are isochronous (Abercrombie 1967: 96f.). Zu den silbenzählenden Sprachen werden die meisten romanischen Sprachen wie das Spanische, das Französische, das Italienische und das brasilianische Portugiesisch (Payne 2022) sowie auch typologisch weit entfernte Sprachen wie Chinesisch oder Tür‐ kisch gerechnet. Der Gruppe der akzentzählenden Sprachen schlägt man neben dem Deutschen und dem Englischen u. a. das Niederländische, das Arabische und auch viele slawische Sprachen wie z. B. das Russische und das Ukrainische zu. Das europäische Portugiesisch, das Katalanische, das Polnische und das Bulgarische lassen sich nicht eindeutig dem silbenbzw. akzentzählenden Typus zuordnen; diesen Sprachen wird in der neueren Forschung ein Mischrhythmus zugesprochen (Dimitrova 1998, Prieto et al. 2012, Wagner 2014, Payne 2022: 284-287, Vigário 2022: 870). Dieser Befund deutet bereits darauf hin, dass das Konzept des Sprachrhythmus dynamischer gefasst werden muss, als es die klassische Rhythmustypologie erlaubt (zu entsprechenden Lösungs‐ möglichkeiten vgl. 4.4.2). Abb. 4.4-2 stellt die unterschiedlichen Isochronietendenzen schematisch dar. Die grau schattierten Felder repräsentieren akzentuierte Silben (σ), die weißen entsprechen unbetonten (σ); die Pfeile verweisen auf tendenziell gleiche Abstände. 62 4.4 Rhythmus: Die zeitliche Gliederung der Sprache 221 <?page no="222"?> 63 Das (traditionell oft als silbenzählend klassifizierte) Katalanische weist allerdings regelmäßige Vokalreduktion auf. So wird im Zentralkatalanischen zugrundeliegendes / a/ in unbetonter Position als Schwa realisiert, z. B. bany ‘Bad’/ baɲ/ → [baɲ] vs. banyar ‘baden’/ baɲa/ → [bə ˈ ɲa]. Aus diesem Grund wird, wie oben bereits gesagt, sein Rhythmus aktuell eher als gemischt aufgefasst. Abb. 4.4-2: Silbenzählende (oben) und akzentzählende Sprachen (unten). Hält man sich vor Augen, durch welche phonologischen Eigenschaften silbenbzw. akzentzählende Sprachen charakterisiert sind, fällt auf, dass in letzteren die Vokale in unbetonten Silben regelhaft reduziert werden (zum Deutschen vgl. 2.5.3.1), oft sogar bis zur völligen Tilgung, während in silbenzählenden Sprachen keine oder kaum Vokalreduktion erfolgt. 63 Zugleich zeichnen sich akzentzählende Sprachen dadurch aus, dass sie meist deutlich komplexere Silben erlauben (z. B. CVCCCCC wie in dt. (du) schimpfst) als silbenzählende Sprachen, die wie das Spanische eine starke Tendenz zu regelmäßigen Abfolgen von CV-Silben aufweisen (vgl. 4.2). Wie das folgende Beispiel zeigt, wird die Komplexität der Silbenstrukturen in akzentzählenden Sprachen durch die Eigenschaft der Vokalreduktion noch verstärkt. sp. fonología [ ˌ fo.no.lo ˈ xi.a] engl. phonology [fə ˈ nɒ.lə.dʒi] oder (Schnellsprechform) [ ˈ fnɒ.lə.dʒi] Während im spanischen Wort fonología sowohl die Vokale der metrisch starken Silbe -gíals auch die der unbetonten Silben als Vollvokale realisiert werden, tritt im englischen Pendant hierzu in den unbetonten Silben Vokalreduktion auf: So wird der Vokal der vorletzten Silbe (oder Pänultima, vgl. 4.3) normalerweise zum Schwa-Laut [ə] reduziert, und der Vokal in der vortonigen Silbe phokann sogar vollkommen getilgt werden. Hierdurch entsteht in der Schnellsprechform [ ˈ fnɒ.lə.dʒi] ein komplexer Onset [fn], eine Konsonantenkombination, die im Spanischen auch bei hoher Sprech‐ geschwindigkeit eher nicht vorkommt. Die Zugehörigkeit einer Sprache zum silben- oder zum akzentzählenden Typ korre‐ liert also mit phonologischen Faktoren wie Vokalreduktion und Silbenstruktur. Dauer (1983) hat diese Erkenntnis zum Anlass genommen, die klassische Rhythmustypologie durch entsprechende Messungen zu überprüfen: Auf der Basis von u. a. spanischen, italienischen und englischen Daten hat sie gezeigt, dass die postulierte, auf der Isochroniehypothese basierende Dichotomie empirisch nicht haltbar ist. Anstelle 222 4 Prosodie <?page no="223"?> 64 Damit ist gemeint, dass sich in akzentzählenden Sprachen bei hoher Sprechgeschwindigkeit Silben‐ grenzen oft verschieben, z. B. wenn Vokale elidiert werden wie in unserem englischen Beispiel: vier Silben bei langsamem ([fə ˈ nɒ.lə.dʒi]), drei Silben bei schnellem Sprechtempo ([ ˈ fnɒ.lə.dʒi]). In silbenzählenden Sprachen wie dem Spanischen bleiben Silbengrenzen und -anzahl eher konstant; jedoch sind entsprechende Verschiebungen auch hier nicht ausgeschlossen, vgl. die sog. sinalefa (Zusammenziehen aufeinanderfolgender Vokale) und die in schnellem Sprechtempo auftretende Gleitlautbildung bei Vokalabfolgen, die normgemäß als Hiatus realisiert werden, z. B. Va al teatro / baalteatɾo/ → [bal ˈ tja.tɾo] (vgl. 2.5.3.2 und 4.2). der Klassifizierung als akzent- oder silbenzählend schlug sie vor, die verschiedenen Sprachen auf einem Kontinuum zwischen zwei Polen zu situieren, die durch phonolo‐ gische Eigenschaften wie die genannten bestimmt sind. Auer & Uhmann (1988: 253) haben neben Vokalreduktion und Silbenstruktur weitere Faktoren wie die Komplexität der Akzentregeln und die Stabilität der Silbengrenzen bei unterschiedlicher Sprechge‐ schwindigkeit 64 hinzugenommen und auf dieser Basis eine Typologie prototypischer akzent- und silbenzählender Sprachen aufgestellt. Zwischen diesen beiden Polen lassen sich beispielsweise die Sprachen Spanisch und Italienisch, die im Sinne der klassischen Rhythmustypologie lapidar dem silbenzählenden Typus zugeschlagen wurden, diffe‐ renzierter einordnen, wobei das Spanische wegen der geringeren Längungseffekte und der weniger komplexen Silbenstrukturen näher am silbenzählenden Pol anzusiedeln ist (vgl. auch Bertinetto 1989, Auer 2001). Nachdem klar geworden war, dass weder die ursprüngliche Isochroniehypothese noch die damit verbundene Dichotomie empirisch haltbar sind, hat sich die Rhyth‐ musforschung in unterschiedliche Richtungen weiterentwickelt. Zum einen wurde die u. a. von Dauer (1983) und Auer & Uhmann (1988) vorgeschlagene Herangehens‐ weise weitergeführt, die auf Korrelationen zwischen phonologischen Eigenschaften (Silbenstruktur, Vokalreduktion) abzielt. Ein anderer Forschungszweig nimmt die phonetische Oberfläche stärker in den Blick und setzt die Dauern bestimmter Einheiten des Sprachsignals zueinander in Relation (vgl. Schafroth & Selig 2012: 7ff.). Einige der sich hieraus ergebenden Rhythmusmaße (engl. rhythm metrics, sp. métricas rítmicas) werden wir im folgenden Kapitel eingehend besprechen. 4.4.2 Dauerbasierte Rhythmusmaße In einem einflussreichen Aufsatz haben Ramus et al. (1999) gezeigt, dass Neugeborene ihre Umgebungssprache auf der Basis der Dauer von Vokalen erkennen können, und dafür argumentiert, nicht mehr die Silbe als Basis für die Rhythmusanalyse anzusehen, sondern vielmehr die Länge vokalischer und intervokalischer (d. h. konsonantischer) Intervalle im Sprachsignal als grundlegend zu betrachten. Diese Intervalle müssen nicht immer mit Silbengrenzen zusammenfallen: So umfasst etwa in la platea [la.pla ˈ te.a] ‘Parkett (im Theater)’ das dritte vokalische Intervall die beiden Segmente [e.a], obwohl diese in der Regel als Hiatus (vgl. 2.5.3.2 und 4.2) realisiert und durch eine Silbengrenze voneinander getrennt werden. Ebenso gelten die aufeinanderfolgenden Konsonanten [pl] als ein einziges konsonantisches Intervall. 4.4 Rhythmus: Die zeitliche Gliederung der Sprache 223 <?page no="224"?> 65 Die Standardabweichung ist ein Maß für die Streubreite der Werte eines Merkmals (Beispiel: Dauer der vokalischen Intervalle) um dessen Mittelwert; sie drückt damit die durchschnittliche ‘Entfer‐ nung’ der Dauern aller vokalischen Intervalle vom Mittelwert aus. Abb. 4.4-3: Segmentierung von sp. la platea mit Grundfrequenzverlauf. Von oben nach unten: Oszillo‐ gramm; Spektrogramm mit Grundfrequenzverlauf; vokalische (v) und konsonantische (c) Intervalle; Segmente; Silbenstruktur; orthographische Transkription. Laut Ramus et al. (1999) wird der rhythmische Eindruck, den die Hörer von einer Sprache haben, maßgeblich durch zwei Aspekte bestimmt, die sich in Form von dauerbasierten Rhythmusmaßen erfassen lassen: Zum einen durch den prozentualen Gesamtanteil des vokalischen Materials im Sprachsignal (%V), zum anderen durch die Variabilität der vokalischen und konsonantischen Intervalle. Diese wird ausgedrückt durch die Standardabweichung 65 der Dauern vokalischer bzw. konso‐ nantischer Intervalle (ΔV bzw. ΔC, zu lesen als ‘Delta V’ bzw. ‘Delta C’). Abb. 4.4-4 zeigt die Verteilung der von Ramus et al. (1999) untersuchten acht Sprachen in Bezug auf den vokalischen Anteil (%V) und die Variabilität der konsonantischen Intervalle (ΔC); analysiert wurde die Leseaussprache von vier weiblichen Versuchspersonen pro Sprache (je fünf Aussagesätze mit 15-19 Silben). 224 4 Prosodie <?page no="225"?> Abb. 4.4-4: Das Spanische im Vergleich zu anderen Sprachen nach Ramus et al. (1999: 273). Auf der x-Achse ist der prozentuale Gesamtanteil vokalischen Materials aufgetragen (%V), auf der y-Achse der Wert für die Variabilität der konsonantischen Intervalle (ΔC). EN: Englisch; DU: Niederländisch; PO: Polnisch; SP: Spanisch; IT: Italienisch; FR: Französisch; CA: Katalanisch; JA: Japanisch. Wie aus Abb. 4.4-4 hervorgeht, weisen traditionell als akzentzählend charakterisierte Sprachen wie Englisch oder Niederländisch geringere Werte für %V auf, jedoch sind sie durch eine höhere Variabilität konsonantischer Intervalle (ΔC) charakterisiert als die romanischen Sprachen (hier: Spanisch, Italienisch, Französisch und Katalanisch) und auch als das Japanische. Allerdings lassen sich auch innerhalb der Gruppe der silbenzählenden Sprachen gewisse Unterschiede konstatieren: Vergleicht man das Spanische mit dem Italienischen, so liegt letzteres in Bezug auf beide Werte höher. Dies lässt sich u. a. dadurch erklären, dass das Italienische im Vergleich zum Spanischen eine deutlich stärkere Tendenz zur Längung betonter Silben aufweist (vgl. Krämer 2009: 163f. und 5.1.7). Die schematische Darstellung in Abb. 4.4-5 verbindet die klassische Rhythmustypologie mit der intervallbasierten Analyse: Die hellgrauen Flächen in der jeweils zweiten Reihe symbolisieren vokalische Intervalle (v). Diese sind in silbenzählenden Sprachen (oben) in Bezug auf ihre Dauer weniger variabel und machen in akzentzählenden Sprachen (unten) einen geringeren Gesamtanteil im Sprachsignal aus. 4.4 Rhythmus: Die zeitliche Gliederung der Sprache 225 <?page no="226"?> Abb. 4.4-5: Vokalische Intervalle in silbenzählenden (oben) und akzentzählenden Sprachen (unten). Dunkelgrau: betonte Silben (σ), weiß: unbetonte Silben (σ), hellgrau: vokalische Intervalle (v). Ein weiteres Verfahren für die Berechnung der Dauervariabilität ist der sog. Variabi‐ litätskoeffizient für vokalische bzw. konsonantische Intervalle (VarcoV bzw. VarcoC; vgl. Dellwo & Wagner 2003, Dellwo 2006). Es handelt sich um einen in Bezug auf die Sprechgeschwindigkeit normalisierten Wert, der berechnet wird, indem man die Standardabweichung der Intervalle (also den bereits eingeführten Wert für ΔV bzw. ΔC) durch deren gemittelte Dauer teilt und (zur Vermeidung allzu vieler Nachkommastellen) mit 100 multipliziert. Wie White & Mattys (2007: 508) gezeigt haben, unterscheiden sich silben- und akzentzählende Sprachen insbesondere in Bezug auf den VarcoV-Wert, der für ihre Daten (je fünf gelesene Aussagesätze von sechs Sprechern pro Sprache) im Spanischen mit 41 niedriger liegt als etwa im Englischen mit 64 oder im Niederländischen mit 65. Das Französische, eine weitere silbenzählende Sprache, weist hier einen Wert von 50 auf und liegt damit zwar über dem für das Spanische errechneten Wert, jedoch deutlich unter den Werten sog. akzentzählender Sprachen. Grabe & Low (2002) haben dafür argumentiert, dass beim Bemessen der Intervallva‐ riabilität auch die Frage mit einbezogen werden sollte, ob sich aufeinanderfolgende (vokalische bzw. konsonantische) Intervalle in ihrer Dauer stark voneinander unter‐ scheiden oder ob die Längenunterschiede zwischen benachbarten Intervallen eher gering sind. Sie haben deshalb den sog. paarweisen Variabilitätsindex (PVI, engl. pair-wise variability index, sp. índice de variabilidad por pares) vorgeschlagen, der das erste mit dem zweiten Intervall vergleicht, das zweite mit dem dritten, das dritte mit dem vierten etc. Der Vorteil dieser Herangehensweise wird in Abb. 4.4-6 deutlich: Berechnet man für die hypothetischen Sprachen A und B den vokalischen Gesamtanteil und die Standardabweichung oder den Variabilitätskoeffizienten vokalischer Intervall‐ dauern (ΔV bzw. VarcoV), ergeben sich jeweils identische Werte. Die Berechnung des vokalischen PVI bezieht jedoch die jeweils unterschiedliche Distribution (Verteilung) der einzelnen Intervalle im Sprachsignal mit ein und berücksichtigt, dass in Sprache A die aufeinanderfolgenden vokalischen Intervalle tendenziell gleich sind (hier: drei kurze vokalische Intervalle, gefolgt von zwei langen), wohingegen sich in Sprache B lange und kurze vokalische Intervalle abwechseln. Der vokalische PVI-Wert ist damit 226 4 Prosodie <?page no="227"?> für Sprache A niedriger als für Sprache B. Silbenzählende Sprachen wie das Spanische entsprechen dem Typ A, akzentzählende Sprachen wie das Deutsche oder das Englische dem Typ B (vgl. Grabe & Low 2002: 528). Abb. 4.4-6: Schematischer Vergleich der Abfolge vokalischer (dunkelgrau) und konsonantischer Inter‐ valle in einer Sprache A (gleichmäßige Abfolge vokalischer Intervalldauern: niedriger Wert für den vokalischen PVI) und einer Sprache B (unregelmäßige Abfolge vokalischer Intervalldauern: hoher Wert für den vokalischen PVI). Der paarweise Variabilitätsindex variiert nicht nur zwischen Sprachen, sondern auch zwischen unterschiedlichen Varietäten einer Sprache. So haben vergleichende Studien zu spanischen Varietäten gezeigt, dass hier ebenfalls − wenn auch in geringerem Umfang − rhythmische Unterschiede bestehen. Toledo (2010) hat Daten aus den Regionen Aragón, Granada und Canarias miteinander verglichen und für die beiden erstgenannten Varietäten auf der Basis von PVI-Berechnungen eine höhere Variabilität vokalischer Intervalle festgestellt. Auf rhythmische Merkmale spanischer Varietäten, die auf Sprachkontakt zurückzuführen sind, gehen wir in 5.1.7 ein; zum Rhythmus beim Erwerb des Spanischen als Fremdsprache vgl. 5.3.2. Eine Weiterentwicklung des PVI stellt der von Bertinetto & Bertini (2008) vorgeschla‐ gene Kontroll- und Kompensationsindex (engl. control and compensation index, CCI) dar. Wie auch bei den bisher besprochenen Rhythmusmaßen ist die grundlegende Bezugseinheit das silbenübergreifende (vokalische bzw. konsonantische) Intervall, jedoch bezieht der CCI zusätzlich die Anzahl der Segmente pro Intervall mit ein. Hierzu werden die Dauern der vokalischen und konsonantischen Intervalle durch die Anzahl der jeweils zugrundeliegend enthaltenen Segmente geteilt. Ausgangspunkt hierfür ist die folgende Beobachtung: In manchen Sprachen werden alle Segmente unabhängig von ihrer Position in der Redekette tendenziell mit dem immer gleichen artikulatorischen Aufwand produziert, weshalb sie kaum kontextbedingte Dauerun‐ terschiede aufweisen. In anderen Sprachen hingegen führen Koartikulationseffekte und positionsbedingte Alternanzen zu starken qualitativen und quantitativen Verän‐ derungen der Segmente bis hin zur vollständigen Tilgung. Sprachen, die wie das Spanische zur erstgenannten Gruppe zählen, werden als Kontrollsprachen bezeichnet; die Sprachen der zweiten Gruppe, zu denen auch das Deutsche zählt, nennen Berti‐ netto & Bertini (2008) Kompensationssprachen. Hieraus ergibt sich ein Kontinuum zwischen den Polen Kontrolle und Kompensation, auf dem sich die Sprachen der Welt graduell einordnen lassen. Kontroll- und Kompensationssprachen unterscheiden sich unter anderem dahingehend, dass in Kontrollsprachen bei zunehmender Sprech‐ geschwindigkeit die vokalischen und konsonantischen Segmentdauern proportional 4.4 Rhythmus: Die zeitliche Gliederung der Sprache 227 <?page no="228"?> reduziert werden, während in Kompensationssprachen Vokale stärker betroffen sind als Konsonanten. So wird etwa im Deutschen die Abfolge einen schönen Abend bei schnellem Sprechen oft von sechs potenziellen Silben auf drei reduziert, wobei die Vokale der unbetonten Silben -nen, -nen und -bend getilgt und die verbleibenden Konsonanten einander assimilatorisch angeglichen werden: [ aɪ ̯ n ː.ʃøː.na b mt]. Aber auch konsonantische Segmente werden in Schnellsprechformen getilgt, wobei sich die Anzahl der Silben jedoch meist nicht verändert, z. B. einst stritten [ aɪ ̯ n.ʃtʁɪ.tn ̩]. Um den genannten Reduktionsphänomenen gerecht zu werden, wird jeweils die Anzahl der in der zugrundeliegenden Form (und nicht die in der konkreten phonetischen Realisierung) vorhandenen Segmente für die Berechnung des CCI berücksichtigt, d. h., für das erste konsonantische Intervall in einst stritten werden sechs Segmente (und nicht nur die realisierten vier) angesetzt (vgl. Mairano 2011: 67). Der von Bertinetto & Bertini (2008) vorgeschlagene CCI versteht sich also dezidiert als phonologisch basiert und unterscheidet sich damit von den zuvor besprochenen Rhythmusmaßen, die die phonetische Oberfläche in den Blick nehmen. Die Verortung des Spanischen und des Deutschen in Bezug auf das jeweilige Verhältnis zwischen vokalischem und konsonantischen CCI wird in Abb. 4.4-7 dargestellt: Das Spanische erscheint als typische Kontrollsprache im weißen Feld (proportionale Reduktion der vokalischen und konsonantischen Segmentdauern in Abhängigkeit vom Sprechtempo), während das Deutsche als typische Kompensationssprache einen Punkt im hellgrau hinterlegten Feld belegt (stärkere Reduktion der konsonantischen Segmente). Eine stärkere Reduk‐ tion vokalischer Segmente bei schnellerem Sprechtempo gilt nach dem gegenwärtigen Wissensstand zu den Sprachen der Welt als nicht plausibel (dunkelgraues Feld). Die besprochenen Berechnungsverfahren zum Erfassen des Sprachrhythmus auf der Basis dauerbasierter Eigenschaften können allerdings keinen Absolutheitsanspruch erheben. Da sich die Verteilung längerer und kürzerer Intervalle aus der Kombinatorik der einzelnen Wörter eines Textes bzw. einer Äußerung ergibt, hängen die Ergebnisse stark davon ab, welches Sprachmaterial untersucht wird. Damit die Resultate über die untersuchten Sprachen hinweg vergleichbar sind, ist es wichtig, Daten zu ana‐ lysieren, die in Bezug auf das Vorkommen einzelner Silbentypen für die jeweilige Sprache repräsentativ sind. Um den Einfluss segmentaler Kombinatorik so weit wie möglich auszuschließen, wurde in jüngeren Studien auch Material verwendet, das für die untersuchten Sprachen gleichartig bzw. identisch ist (z. B. nur aus CV-Silben bestehende Sätze oder in einzelsprachliche Kontexte eingebettete, für alle Sprachen gleiche Pseudowörter, vgl. etwa Benet et al. 2012, Gabriel & Kireva 2014, Gabriel et al. 2015). Generell kann man nicht erwarten, dass verschiedene Studien mit z. T. sehr unterschiedlichem Testdesign für eine bestimmte Sprache oder Varietät zu exakt den gleichen Ergebnissen kommen. Aussagekräftig sind aber die Relationen zwischen den Werten für unterschiedliche Sprachen bzw. Varietäten innerhalb einer Studie bzw. bei methodisch parallel vorgehenden Studien. 228 4 Prosodie <?page no="229"?> Abb. 4.4-7: Schematische Darstellung von Kontroll- und Kompensationssprachen hinsichtlich des Verhältnisses von vokalischem CCI (x-Achse) und konsonantischem CCI (y-Achse) und diesbezügliche Einordnung des Spanischen und des Deutschen nach Bertinetto & Bertini (2008: 428) und Mairano & Romano (2011: 1321). Zusammenfassend lässt sich sagen, dass die auf den Dauern vokalischer und konso‐ nantischer Intervalle basierenden Rhythmusmaße die Einteilung der Sprachen in rhythmische Klassen flexibler machen, da mögliche Zwischenstufen auf einem Konti‐ nuum zwischen den Polen ‘silbenzählend’ und ‘akzentzählend’ ausgedrückt werden können. Es ergeben sich folgende Korrelationen: • Silbenzählende Sprachen weisen tendenziell einen hohen vokalischen Anteil (%V) und niedrige Werte für den vokalischen und den konsonantischen paarweisen Variabilitätsindex (PVI) sowie für den Variabilitätskoeffizienten für vokalische und konsonantische Intervalle (VarcoV/ C) auf. Hinsichtlich des Verhältnisses zwischen vokalischem und konsonantischem CCI sind sie in Abb. 4.4-7 im weiß hinterlegten Bereich positioniert. • Akzentzählende Sprachen zeichnen sich durch tendenziell niedrige Werte für %V und hohe Werte für den vokalischen und konsonantischen PVI sowie für VarcoV/ C aus. Hinsichtlich des Verhältnisses zwischen vokalischem und konso‐ nantischem CCI sind sie in Abb. 4.4-7 im grau hinterlegten Bereich positioniert. 4.4 Rhythmus: Die zeitliche Gliederung der Sprache 229 <?page no="230"?> Zusammenfassung: Dauerbasierte Rhythmusmaße Die vorgestellten Rhythmusmaße werden im Einzelnen wie folgt berechnet: %V 1. Bilde die Summe aus den Dauern der vokalischen Intervalle des zu analysierenden Sprachsignals. 2. Teile das Ergebnis durch die Gesamtdauer des zu analysierenden Sprachsignals. 3. Multipliziere das Ergebnis mit 100. ∆V/ C 1. Bilde jeweils die Differenz zwischen den einzelnen Dauern der vokalischen bzw. konsonantischen Intervalle und dem Mittelwert aller vokalischen bzw. konsonantischen Intervalle. Der Mittelwert wird berechnet, indem man die Dauern der einzelnen Intervalle aufsummiert und durch die Anzahl der Intervalle teilt. 2. Quadriere jeweils die Einzelergebnisse und summiere sie auf. 3. Teile die sich hieraus ergebende Summe durch die Anzahl der Intervalle. 4. Ziehe aus dem Ergebnis die Quadratwurzel. VarcoV/ C Multipliziere den ermittelten ∆V/ C-Wert (siehe oben) mit 100 und divi‐ diere das Ergebnis durch den Mittelwert aller vokalischen bzw. konso‐ nantischen Intervalle. PVI 1. Bilde jeweils die Differenz zwischen den Dauern von zwei auf‐ einanderfolgenden Intervallen, d. h., subtrahiere die Dauer des zweiten Intervalls von der des ersten, die des dritten von der des zweiten etc. 2. Bilde die Summe aus den einzelnen Dauerdifferenzen. 3. Teile das Ergebnis durch die Anzahl der Paare. Anmerkung: Auf diese Weise berechnet man den sog. ‘rohen’ PVI-Wert (rPVI) für vokalische bzw. konsonantische Intervalle. Darüber hinaus haben Grabe & Low (2002) einen normalisierten PVI (nPVI) vorgeschlagen, bei dem die einzelnen Dauerdifferenzen der Paare (siehe oben, Schritt 1) jeweils durch den Mittelwert der so miteinander verrechneten Intervalldauern des betreffenden Paares geteilt werden. CCI Teile bei der Berechnung des PVI die Dauer jedes Intervalls durch die darin enthaltene Anzahl von Segmenten. 230 4 Prosodie <?page no="231"?> Phonetische Kriterien zur Segmentierung bei der Rhythmusanalyse Abb. 4.4-8 illustriert die Segmentierung und Annotation unseres Beispielsatzes ¿Tiene mandarinas? in einem Praat-TextGrid als Grundlage für die Rhythmusana‐ lyse. Der erste tier enthält die Segmentierung in konsonantische und vokalische Intervalle, jeweils mit Kleinbuchstaben c und v bezeichnet; der zweite beinhaltet die phonetische Transkription der einzelnen Segmente. Im dritten tier werden die einzelnen Silben nach Silbentyp klassifiziert (z. B. Tie- [tje] → CVV, ne- [ne] → CV, man- [man] → CVC etc.); dies kann sinnvoll sein, wenn man das Material in Bezug auf die enthaltenen Silbenstrukturen kontrollieren möchte. Im vierten tier wird der vom Sprecher produzierte Text in Form einer orthographischen Transkription wiedergegeben. Die tiers lassen sich mit Hilfe von EasyAlign oder MAUS automatisch erstellen (vgl. 2.3.3). Für die Analyse mit der kostenfreien Software Correlatore, die wir im folgenden Kasten besprechen, wird allerdings nur der erste tier benötigt. Hierzu dupliziert man am besten das gesamte TextGrid und löscht die nicht benötigten tiers (Menü Tier > zu löschenden tier markieren > Befehl Remove entire tier). Abb. 4.4-8: Segmentierung und Annotation des Beispielsatzes ¿Tiene mandarinas? Die Segmentierung des Sprachsignals in konsonantische (c) und vokalische (v) Intervalle ist im Einzelfall oft weniger trivial als man vielleicht zunächst denkt. Sie erfordert bestimmte Entscheidungen, die bei der Vorbereitung des Materials konsequent durchgehalten werden müssen, um die Ergebnisse konstant zu halten. Folgendes sollte man dabei beachten: • Sprechpausen und durch Sprechunflüssigkeiten gekennzeichnete Passagen werden nicht berücksichtigt. • Gleitlaute werden zum vokalischen Intervall gezählt, wenn im Sonagramm keine Friktion erkennbar ist (Grabe & Low 2002). 4.4 Rhythmus: Die zeitliche Gliederung der Sprache 231 <?page no="232"?> • Grundsätzlich sind die vom Sprecher konkret produzierten Lautsegmente Ausgangspunkt für die Segmentierung, nicht etwa die von der Norm vorge‐ sehene Aussprache oder gar die zugrundeliegenden Phoneme. Wenn das Material beispielsweise den in intervokalischer Position regelhaft spiranti‐ sierten Plosiv / d/ enthält, wird dieser nur dann als konsonantisch gewertet, wenn die Friktion von [ð] im Sonagramm erkennbar ist. Wird das betreffende Segment, wie es normalerweise der Fall ist, als friktionsloser Approximant realisiert (vgl. 2.5.1.1, 4.2.3), zählt es zum vokalischen Intervall. • Beginnt das Sprachsignal nach einer Sprechpause mit einem Plosiv, so wird dessen Beginn einheitlich 0,05 Sekunden vor der (im Sonagramm sichtbaren) Verschlusslösung gesetzt (Mok & Dellwo 2008). Ein Beispiel hierfür ist das mit [t] anlautende Wort tiene in Abb. 4.4-8. • Intervallgrenzen werden an sog. positiven Nulldurchgängen gesetzt, d. h. dort, wo die im Oszillogramm dargestellte Schwingungskurve die Nulllinie von unten durchschreitet. Hierzu muss man mit der Zoom-Funktion in Praat (Knopf in; links unten) das Oszillogramm entsprechend vergrößern; der po‐ sitive Nulldurchgang an der Grenze vom vokalischen zum konsonantischen Intervall in mandarinas [a|nd] ist in Abb. 4.4-9 durch die gestrichelte Linie im Oszillogramm und im Spektrogramm angezeigt. Abb. 4.4-9: Setzung der Intervallgrenze [a|nd] am positiven Nulldurchgang. Berechnung der Rhythmusmaße mit Correlatore Die Berechnung der Rhythmusmaße muss nicht manuell erfolgen, sondern kann auf der Basis entsprechend in Praat vorbereiteter TextGrids (vgl. 2.3.3) mit der von Paolo Mairano entwickelten Software Correlatore vorgenommen werden, die kostenfrei unter http: / / phonetictools.altervista.org/ correlatore/ herunterge‐ 232 4 Prosodie <?page no="233"?> laden werden kann (vgl. Mairano & Romano 2010). Hierzu ist zunächst die (für Windows oder Mac verfügbare) Software auf dem Rechner zu installieren. Befinden sich die TextGrids im selben Ordner wie das Programm, werden sie beim Start automatisch gefunden; andernfalls müssen sie über die Funktion Open file bzw. Open folder in den Arbeitsspeicher geladen werden. Für die Berechnungen benötigt Correlatore TextGrids mit jeweils nur einem interval tier, der die Segmentierung in vokalische und konsonantische Intervalle enthält. Zur deren Vorbereitung kann man Tools wie EasyAlign oder MAUS nutzen, die eine automatische Segmentierung des Sprachsignals ermöglichen (vgl. 2.3.3). Die Intervalle müssen im TextGrid jeweils mit den Kleinbuchstaben c und v bezeichnet werden (der oberste tier in Abb. 4.4-8 gibt ein entsprechendes Beispiel). Sprachliches Material, das für die Analyse nicht berücksichtigt werden soll, z. B. Sprechpausen oder Passagen mit Sprechunflüssigkeiten (engl. hesitation phenomena, sp. disfluencia), kann entweder mit der Raute ‘#’ gekennzeichnet werden oder freibleiben. Um die Rhythmusmaße zu berechnen, müssen die ge‐ ladenen TextGrids markiert werden. Klickt man auf den Befehl Segmentation and rhythm metrics, öffnet sich ein Fenster. Bei der hier beschriebenen Vorgehens‐ weise mittels CV-Segmentierung muss aus einem Dropdown-Menü zunächst die entsprechende Label-Konvention (CV) ausgewählt werden. Beim Klicken auf den Befehl Go! öffnet sich ein weiteres Fenster, in dem die einzelnen Intervalldauern sowie Werte für die unterschiedlichen Rhythmusmaße tabellarisch aufgelistet sind. Diese Werte lassen sich als Textdatei sichern (Save to file) sowie als Grafik darstellen (Draw chart) und dann in allen gängigen Grafikformaten (jpg, gif etc.) abspeichern. Um eine Grafik zu erstellen, müssen die Werte zunächst dem sog. report zugefügt werden, eine Art Zwischenspeicher, auf den das in Correlatore integrierte Grafikprogramm zugreift (Add to report). Es kann jeweils ausgewählt werden, welches Rhythmusmaß auf der xbzw. y-Achse aufgetragen werden soll. Weitere Informationen sind in der Hilfsfunktion des Programms enthalten. 4.5 Intonation Nachdem wir uns mit den dauerbasierten Charakteristika verschiedener Sprachen und insbesondere des Spanischen befasst haben, wenden wir uns mit der Sprachmelodie oder Intonation einer weiteren zentralen prosodischen Eigenschaft von Sprache zu. Unter Intonation versteht man den systematischen Gebrauch des Tonhöhenver‐ laufs (Grundfrequenz; F 0 ) in einem Sprachsystem. Grundsätzlich differenziert man zwischen zwei Sprachtypen, den Tonsprachen (sp. len‐ guas tonales) und den sog. reinen Intonationssprachen (engl. intonation-only languages 4.5 Intonation 233 <?page no="234"?> 66 In der Intonationsforschung ist es üblich, metrisch starke (betonte) Silben durch Unterstreichung hervorzuheben. Deswegen weichen wir in diesem Kapitel von der bisher verwendeten Kennzeich‐ nung durch Fettdruck ab. (Gussenhoven 2004: 12), sp. lenguas entonativas). In einem ersten Schritt skizzieren wir, was diese beiden Typen in Bezug auf die systematische Verwendung von F 0 unterscheidet (4.5.1), bevor wir in einem weiteren Schritt auf das modellhafte Erfassen der Tonalität in den traditionsreichen Ansätzen von Navarro Tomás ( 4 1974) und Quilis (1993) eingehen (4.5.2) und uns anschließend mit dem sog. Autosegmental-Metrischen (AM-)Modell vertraut machen, das insbesondere in der neueren Forschung für die Beschreibung und Analyse des Spanischen nutzbar gemacht wurde (4.5.3). Diesem theoretischen Rahmen ist auch die exemplarische Darstellung der Intonationssysteme des in Madrid, Buenos Aires und Mexiko-Stadt gesprochenen Spanisch verpflichtet (4.5.4). Abschließend behandeln wir mit der prosodischen Phrasierung die Strukturie‐ rung größerer Einheiten durch F 0 und nehmen das Zusammenspiel von Prosodie und Syntax bei der Vermittlung der Informationsstruktur in den Blick (4.5.5). 4.5.1 Tonsprachen und reine Intonationssprachen In 4.3.4 haben wir gezeigt, dass der Wortakzent im Spanischen eine kontrastive Funktion hat und dass er außer durch die (in den meisten Varietäten eher geringe) Längung der Tonsilbe vor allem durch eine Bewegung der Grundfrequenz markiert wird. Wie Abb. 4.5-1 verdeutlicht, manifestiert sich der Unterschied zwischen dem Substantiv número und den Verbformen numero (1. Sg. Präs.) und numeró (3. Sg. Perf.) maßgeblich in der Tonkontur der einzelnen Wörter, genauer gesagt im F 0 -Gipfel, der jeweils die betonte Silbe anzeigt. 66 Auf die spezifische Form dieser als Tonhöhenakzente (auch: Akzenttöne, engl. pitch accents, sp. acentos tonales) bezeichneten F 0 -Gipfel gehen wir in 4.5.3 und 4.5.4 genauer ein. Wichtig ist, dass Tonhöhenakzente nicht immer als Hochpunkte/ Gipfel realisiert werden müssen; ausschlaggebend ist vielmehr die − wie auch immer geartete − Bewegung der Kontur, die sich im Umfeld der betonten Silbe auch als Tiefpunkt/ Tal manifestieren kann. 234 4 Prosodie <?page no="235"?> 67 Neben dem Chinesischen zählen zahlreiche weitere asiatische und auch afrikanische Sprachen zu dieser Sprachgruppe; für einen allgemeinen Überblick vgl. Yip (2002) und speziell zum Chinesischen Duanmu ( 2 2007). 68 Duanmu ( 2 2007: 236) repräsentiert den 3. Ton phonologisch als Tiefton L, wenn sich das entspre‐ chende Wort in nicht-finaler Position befindet. Grund hierfür ist, dass in verbundener Rede - zumindest mittelbar - immer eine Silbe folgt, die einen lexikalisch spezifizierten Hochton enthält (H, LH oder HL) und damit den Tonhöhenanstieg auslöst. Aus Gründen der Vereinfachung nutzen wir hier die oberflächennahe Notation HLH. Abb. 4.5-1: F 0 -Konturen von sp. mi número ‘meine (Telefon-)Nummer’, me numero ‘ich nummeriere mich’, me numeró ‘er/ sie nummerierte mich’ (nach Hualde 2005: 241). Den Ausdruck lexikalischer Kontraste (d. h. unterschiedlicher Wortbedeutungen) durch die unterschiedliche Position der Akzentstelle und die damit verbundene Tonhöhenbewegung in ansonsten lautlich identischen Wörtern kennen wir auch aus anderen Sprachen: So kontrastiert z. B. im Deutschen Tenor ‘hohe Männerstimme’ mit Tenor ‘Inhalt, Duktus (eines Schriftstücks o. ä.)’ oder umfahren ‘fahrend ausweichen’ mit umfahren ‘fahrend anstoßen und zu Boden werfen’, im Englischen content ‘Inhalt’ mit content ‘zufrieden’ oder im Italienischen calamità ‘Niederlage’ mit calamita ‘Magnet’. In sog. Tonsprachen ist es auch möglich, in einsilbigen Wörtern, die segmental identisch sind, lexikalische Kontraste durch Tonhöhenunterschiede auszudrücken. Dies hat zur Folge, dass in diesen Sprachen (fast) jede Silbe für eine bestimmte F 0 -Bewegung spezifiziert ist. Ein Beispiel hierfür ist das Mandarin-Chinesische, 67 das über vier lexikalische Töne sowie einen sog. neutralen Ton verfügt. Wird z. B. die Silbe [ma] mit einer hohen F 0 -Kontur ausgesprochen (1. Ton: H (hoch)), resultiert das Wort 妈 mā ‘Mutter’. Dieselbe segmentale Sequenz mit dem steigenden 2. Ton (LH (tief-hoch)) bedeutet ‘Hanf ’ oder ‘Sesam’ ( 麻 má), mit dem fallend-steigenden 3. Ton (HLH (hoch-tief-hoch) 68 ‘Pferd’ ( 马 mǎ) und mit dem fallenden 4. Ton (HL (hoch-tief)) ‘(be)schimpfen’ ( 骂 mà). In Abb. 4.5-2 sind die F 0 -Konturen der vier lexikalischen Töne dargestellt. 4.5 Intonation 235 <?page no="236"?> 69 Die Beispielsätze sind zwar grammatisch, aber − abgesehen vom konstruierten Inhalt − nicht besonders idiomatisch, da im Chinesischen alle (nicht-zusammengesetzten) Wörter zwar einsilbig sind, in konkreter Rede jedoch nicht immer in ihrer monosyllabischen Grundform auftreten. Ein gängiges Verfahren ist die Verdoppelung der lexikalischen Grundeinheit wie in 妈妈 māma ‘Mutter’. Durch Verwendung des Zweisilbers ergibt sich hier eine Art ‘prosodisches Gleichgewicht’ zwischen Subjekt ( 妈妈 māma) und Verbalphrase ( 马吗 mà mă). Abb. 4.5-2: Die vier lexikalischen Töne des Mandarin-Chinesischen. Tonale Repräsentation nach Duanmu ( 2 2007: 236). Bei der tonal nicht spezifizierten Silbe ma 吗 (neutraler Ton) handelt es sich um eine Interrogativpartikel ( Q ), die aus einem Aussageeinen Fragesatz macht, z. B. 妈骂马 Mā mà mǎ ‘Die Mutter beschimpft das Pferd’ → 妈骂马吗 ? Mā mà mǎ ma? ‘Beschimpft die Mutter das Pferd? ’. 69 In Abb. 4.5-3 geben wir eine mögliche tonale Realisierung dieses Fragesatzes wieder. Während bei den ersten beiden Wörtern die lexikalischen Töne (1. Ton hoch bzw. 4. Ton fallend) gut zu erkennen sind, weist die F 0 -Kontur im Wort mǎ (3. Ton fallend-steigend) eine Unterbrechung auf. Grund hierfür ist die sog. Knarrstimme (engl. creaky voice, sp. voz chirriante), die oft auftritt, wenn − wie für den 3. Ton typisch − die Grundfrequenz ein für den persönlichen Tonumfang der jeweils sprechenden Person besonders tiefes Register erreicht. Deutlich erkennbar ist jedoch der F 0 -Anstieg am Ende der Silbe, der im zeitlichen Rahmen der tonal unspezifizierten Fragepartikel ma 吗 bis zum Ende des Satzes weitergeführt wird. 236 4 Prosodie <?page no="237"?> 70 Der Terminus ‘Wh-Frage’ entstammt der Terminologie der generativen Syntaxforschung und rührt daher, dass englische Fragewörter fast ausnahmslos mit <wh> beginnen (z. B. who, where etc., Ausnahme: how). Im Deutschen ist oft von ‘W-Fragen’ die Rede, da alle deutschen Fragewörter mit <w> beginnen. Abb. 4.5-3: F 0 -Verlauf des chinesischen Fragesatzes 妈骂马吗 ? Mā mà mǎ ma? ‘Beschimpft die Mutter das Pferd? ’ (Sprecherin aus Peking). Die in Abb. 4.5-3 steigende Schlusskontur ergibt sich aus der Kombinatorik der lexikalischen Töne. Befindet sich unmittelbar vor der Fragepartikel ein Wort mit fallendem Ton wie z. B. 大夫 dàifu ‘Arzt’ in 你是大夫吗 ? Nǐ shì dàifu ma? ‘Bist du Arzt? ’, kann die Gesamtkontur des Fragesatzes auch fallend sein. Dies ist möglich, da der interrogative Satzmodus bereits eindeutig durch die Fragepartikel angezeigt wird. Auch im Spanischen weisen Fragesätze, die durch funktionale Elemente eindeutig als solche markiert werden, nicht zwangsläufig eine tonale Markierung auf. Dies ist der Fall bei sog. Teil- oder Ergänzungsfragen (auch: Wort-, Pronominal- oder Wh-Fragen 70 , sp. interrogativas parciales oder pronominales) wie ¿Qué compraste? , wo der Satzmodus durch das Fragewort qué anzeigt wird. Bei spanischen Ja/ Nein-Fragen (auch: absolute oder totale Fragen, sp. interrogativas absolutas oder totales) kann die Intonation jedoch als einzige Markierung des Fragemodus fungieren: So besteht der Unterschied zwischen der Aussage Tienen mandarinas und der Frage ¿Tienen mandarinas? allein darin, dass im Interrogativsatz die Tonkontur nach der letzten betonten Silbe -ri- 4.5 Intonation 237 <?page no="238"?> 71 Dies gilt beispielsweise für das in Madrid gesprochene Spanisch; andere Varietäten wie das argenti‐ nische Spanisch (vgl. Abb. 2.3-10, 2.3-13, 2.3-14) kennen hiervon abweichende Fragekonturen, vgl. auch 4.5.4. 72 Die Intonation ist jedoch selten einziger Ausdruck von Emotionen: So drückt sich eine positive Ein‐ stellung des Sprechers oft durch stärkere Stimmhaftigkeit, eine negative jedoch durch Entstimmung des gesamten Sprachsignals aus (vgl. Kohler & Niebuhr 2007). Einen Überblick zur parasprachlichen Funktion von F 0 gibt Kubarth (2009: 219ff.). 73 Man sollte sich nicht dadurch irritieren lassen, dass der gleiche Terminus in der Morphologie die Fle‐ xion nominaler Kategorien (Substantive, Adjektive, Pronomina) bezeichnet. In der phonologischen Fachliteratur wird nicht immer zwischen Deklination/ downtrend und dem weiter unten erläuterten Phänomen des downstep unterschieden. bis zum rechten Satzrand hin kontinuierlich ansteigt. 71 Neben der Markierung des Satzmodus hat die Intonation eine regulative Funktion: So kann ein Sprecher durch die Modulation der Stimme die Abgeschlossenheit seines Redebeitrags anzeigen und damit im Diskurs einen Sprecherwechsel einleiten oder durch eine steigende Kontur zum Satzende hin deutlich machen, dass er noch weitersprechen möchte. Ferner wird F 0 genutzt, um größere Redeeinheiten intern zu strukturieren und beispielsweise Wichtiges hervorzuheben oder bereits Erwähntes in den Hintergrund zu rücken, also um die sog. informationsstrukturelle Gliederung eines Satzes oder einer größeren Äußerung zu markieren (vgl. 4.5.5). Schließlich ist die parasprachliche Funktion der Intonation zu nennen, wenn sie z. B. zum Ausdruck von Emotionen genutzt wird; bei Freude beispielsweise durch eine Vergrößerung der tonalen Spannweite (auch: Ambi‐ tus, engl. pitch range, sp. campo oder rango tonal), bei Trauer durch ein eingeschränktes, komprimiertes F 0 -Register. 72 Die tonale Markierung lexikalischer Kontraste im Sinne der für das Chinesische typischen Eigenschaft ist im Spanischen jedoch nicht möglich. Das Spanische zählt damit zur Gruppe der reinen Intonationssprachen, also zu den Sprachen, die eine systematisch organisierte Sprachmelodie aufweisen, nicht jedoch über die Möglichkeit verfügen, lexikalische Kontraste in einsilbigen Wörtern durch Tonhöhenkontraste auszudrücken. In reinen Intonationssprachen wird die Tonhöhe systematisch genutzt, um Satzmodus, Sprecherwechsel sowie Informationsstruktur zu markieren und para‐ sprachliche Informationen wie z. B. Emotionen wiederzugeben. Tonsprachen drücken darüber hinaus auch lexikalische Kontraste durch F 0 aus. Eine grundlegende, wahrscheinlich universelle (und damit für Ton- und reine Intona‐ tionssprachen zutreffende) Eigenschaft der Sprachmelodie ist, dass diese über eine Äußerung vom Anfang bis zum Ende hin absinkt. Daraus ergibt sich eine fallende Gesamtkontur, wobei jedes F 0 -Maximum etwas tiefer ist als das ihm vorausgehende. Dieses Phänomen, das vermutlich auf das Absinken des subglottalen Drucks zurück‐ zuführen ist (Pompino-Marschall 3 2009: 246), wird als Deklination 73 oder mit dem englischen Terminus downtrend (sp. escalonamiento descendente) bezeichnet. Dieses Absinken des Referenzpunktes ist den Sprechern nicht bewusst, da es bei der Intonation 238 4 Prosodie <?page no="239"?> ohnehin um relative F 0 -Kontraste und nicht um absolute Tonhöhen geht. Das bedeutet, dass ein am Schluss einer Äußerung platzierter Tonhöhengipfel als solcher wahrge‐ nommen wird, auch wenn er − absolut gesehen − tiefer ist als der Beginn der Äußerung. Manche Sprachen, darunter das Spanische, kennen zusätzlich das Phänomen des finalen Absenkens (engl. final lowering, sp. descenso final, vgl. Prieto et al. 1996), das darin besteht, dass der Grundfrequenzverlauf in einer tonalen Einheit noch stärker absinkt, als regulär vorhergesagt würde. Deklination und finales Absenken sind in der F 0 -Kontur des spanischen Aussagesatzes María está comiendo mandarinas in Abb. 4.5-4 gut zu erkennen. Abb. 4.5-4: Spanischer Aussagesatz mit fallender Gesamtkontur (Deklination und final lowering); Darstellung orientiert an Pompino-Marschall ( 3 2009: 247). Hieraus resultiert jedoch nicht, dass Intonationskonturen in ihrem Gesamtverlauf grundsätzlich fallend sind: So haben wir schon gesehen, dass eine Wortfolge wie Tienen mandarinas durch den finalen Anstieg als Fragesatz markiert werden kann (s. o. ¿Tienen mandarinas? ↑). Auch bei der internen Gliederung größerer Redeeinheiten treten solche Tonhöhenanstiege auf (sog. prosodische Phrasierung, vgl. 4.5.5.1) oder auch einfach dann, wenn ein Sprecher anzeigen möchte, dass er noch nicht zu Ende gesprochen hat und das Wort deshalb nicht an den Gesprächspartner abgeben möchte (regulative Funktion). Neben diesen F 0 -Anstiegen am Schluss einer Äußerung oder vor einer prosodischen Grenze kommt es auch vor, dass aufeinanderfolgende Tonhöhengipfel innerhalb einer prosodischen Einheit heraufbzw. herabgestuft, also höher bzw. tiefer realisiert werden als erwartet. Dieses Phänomen bezeichnet man auch im Deutschen meist mit den englischen Termini upstep bzw. downstep (sp. escalonamiento ascendente bzw. descendente). Da es in verschiedenen Sprachen und Varietäten unterschiedlich verwendet wird, verweisen wir hierzu auf die Darstellung der spanischen Intonation in 4.5.4 und 4.5.5. 4.5 Intonation 239 <?page no="240"?> 4.5.2 Erfassen und Systematisieren: Konfigurationen und Ebenen Bis in die 1980er Jahre war die Intonationsforschung weitgehend der linguistischen Schule des Strukturalismus verpflichtet und vornehmlich auf die Beschreibung, Inventarisierung und Systematisierung wiedererkennbarer Tonmuster in einzelnen Sprachen ausgerichtet. Bolinger (1951) hat in einer zusammenfassenden Darstellung zwischen zwei Typen von Ansätzen unterschieden, die entweder die gesamte tonale Konfiguration einer Äußerung als Grundeinheit der Analyse betrachten oder eine Aufspaltung des Tonhöhenkontinuums in mehrere Ebenen vornehmen. Ziel war jeweils eine Bestandsaufnahme der in der zu beschreibenden Sprache vorliegenden F 0 -Konturen und deren Zuordnung zu bestimmten semantisch-pragmatischen Funktionen bzw. Satzmodi (z. B. steigende Schlusskontur: Fragesatz, fallende Schlusskontur: Aussagesatz etc.). Dabei ging man von der struktura‐ listischen Grundannahme aus, dass nur das sprachwissenschaftlich relevant ist, was eine Funktion im System erfüllt. Die Frage nach der Repräsentation der Tonkonturen im sprachlichen Wissen stand dabei ebenso wenig im Zentrum des Interesses wie die Relation zwischen abstrakter phonologischer Form und konkreter phonetischer Oberflä‐ chenrealisierung. Auch war zunächst keine Einbettung der prosodischen Komponente in den Kontext eines globalen Grammatikmodells angestrebt. Im Folgenden illustrieren wir zunächst die Konfigurationsanalyse anhand der einflussreichen Arbeit zur spanischen Intonation von Navarro Tomás ( 4 1974; vgl. 4.5.2.1); den ebenenbezogenen Ansatz stellen wir anhand der von Quilis (1993) vorgeschlagenen Analyse dar (4.5.2.2). Eine detaillierte Bestandsaufnahme der spanischen Intonation erfolgt dann im autosegmental-metrischen Rahmen (4.5.3, 4.5.4). 4.5.2.1 Das Konfigurationsmodell von Navarro Tomás ( 4 1974) Tomás Navarro Tomás (1884-1979), der Begründer der experimentellen Phonetik in Spanien, hat als erster die Intonation des Spanischen umfassend beschrieben und systematisierend dargestellt. Ansätze dazu sind schon in seinem bereits 1918 erstveröf‐ fentlichten Manual de pronunciación española ( 19 1977: 209-235) enthalten; im erstmals 1944 publizierten und seitdem mehrfach wieder aufgelegten Manual de entonación española ( 4 1974) hat er sie weiter ausgearbeitet. Grundlegend für die Beschreibung der spanischen Tonkonturen ist dabei die Aufteilung des Redekontinuums in sog. grupos melódicos, die wiederum in einzelne Abschnitte unterteilt sein können. Hierin lehnt sich das Modell an die sog. Britische Intonationsschule um Forscher wie Jones (1918), Palmer (1922) und Armstrong & Ward (1926) an, die für das Englische − zunächst mit eher sprachdidaktischem als linguistischem Fokus − eine Aufteilung der Intonationsphrase in prehead, head und nucleus vorgeschlagen haben (vgl. Wells 2006: 207ff.). Obligatorischer Bestandteil eines grupo melódico ist nach Navarro Tomás der sog. Nukleus (dt. Kern, sp. núcleo), der die letzte betonte Silbe als Trägerin des sog. Nuklearakzents (sp. acento 240 4 Prosodie <?page no="241"?> 74 Unter dem Nuklearakzent (auch Satzakzent) versteht man die am stärksten wahrgenommene Tonsilbe in einer größeren prosodischen Einheit (vgl. 4.5.5.1). nuclear) 74 sowie eventuelle nachtonige Silben umfasst. Dass ein grupo melódico nur aus einem Nukleus besteht, ist jedoch eher die Ausnahme. Normalerweise geht ihm ein sog. Kopf (sp. cabeza) voran, der von der ersten betonten Silbe der melodischen Gruppe bis zum linken Rand des als Nukleus bezeichneten Teils reicht. Sind der ersten Tonsilbe des Kopfes unbetonte Silben vorgeschaltet, werden diese nicht dem Kopf zugerechnet, sondern als ein weiterer fakultativer Abschnitt aufgefasst. Diesen dem prehead der Britischen Schule entsprechenden, bei Navarro Tomás jedoch nicht genauer benannten Anfangsteil des grupo melódico hat Kubarth (2009: 236) in seiner Darstellung des Modells als ‘Auftakt’ bezeichnet. Abb. 4.5-5 zeigt eine mögliche Aufteilung des (verkürzten) ersten Satzes aus dem Nordwind-Text in melodische Gruppen, wobei der dritte grupo melódico in Ermangelung einer vortonigen Silbe am Beginn des Kopfes keinen Auftakt aufweist. Auftakt Kopf (cabeza) Nukleus (núcleo) El viento del norte y el sol estaban disputándose - sobre cual de ellos era el más fuerte. Abb. 4.5-5: Aufteilung des Nordwind-Textes in grupos melódicos nach Navarro Tomás ( 4 1974). Die melodische Gestaltung des Nukleus, also der Schlusskontur (sp. inflexión final), ist nach Navarro Tomás für die semantisch-pragmatische Interpretation einer Äußerung maßgeblich. Diese Nuklearkonfiguration wird auch im autosegmental-metrischen Ansatz als zentrale Analyseeinheit wieder aufgegriffen (vgl. 4.5.4). Bei den Aussagesätzen unterscheidet Navarro Tomás zwischen fünf distinktiven F 0 -Verläufen, die er in Anleh‐ nung an den Phonembegriff als Toneme (sp. tonemas) bezeichnet und deren Tonumfang in Form von Halbtönen (sp. semitonos) angegeben wird (vgl. Navarro Tomás 4 1974: 51ff., 69f.). In Abb. 4.5-6 wird der Tonhöhenverlauf der fünf tonemas charakterisiert. tonema Beschreibung der F 0 -Kontur cadencia stark fallend (um 8 Halbtöne) semicadencia leicht fallend (um 2-4 Halbtöne) anticadencia stark ansteigend (um 4-5 Halbtöne) semianticadencia leicht ansteigend (um 2-3 Halbtöne) suspensión gleichbleibend Abb. 4.5-6: Die fünf tonemas nach Navarro Tomás ( 4 1974). 4.5 Intonation 241 <?page no="242"?> Der starke finale F 0 -Abfall der cadencia markiert in der Regel das Ende einer abge‐ schlossenen neutralen Aussage; in der abgeschwächten Form der semicadencia tritt der F 0 -Abfall innerhalb größerer prosodischer Einheiten auf. Die stark steigende anticadencia dient innerhalb längerer Äußerungen zur internen Strukturierung, so etwa zwischen Haupt- und Nebensatz; die leicht steigende semianticadencia zeigt oft das Ende der einzelnen Glieder in Aufzählungen an oder auch die Untergliederung zwischen einzelnen Satzgliedern wie einem komplexen Subjekt und der folgenden Verbalphrase. Die tonal gleichbleibende suspensión ist nach Navarro Tomás auf Ein‐ schübe wie z. B. adverbiale Ergänzungen, Appositionen oder Vokative beschränkt. In Abb. 4.5-7 geben wir ein Beispiel für eine mögliche tonale Beschreibung des oben analysierten Satzes aus dem spanischen Nordwind-Text. Die drei gestrichelten Linien zeigen jeweils approximativ ein tiefes, mittleres bzw. hohes Tonniveau an. Es handelt sich jedoch nicht um eine Einteilung des F 0 -Kontinuums im Sinne des Ebenen-Ansatzes, der unterschiedliche Tonhöhenniveaus dezidiert in die Beschreibung der Konturen mit einbezieht (vgl. 4.5.2.2). Abb. 4.5-7: Tonale Beschreibung einer möglichen Realisierung des ersten Satzes aus dem spanischen Nordwind-Text nach Navarro Tomás ( 4 1974). Die hiermit angesprochene Untergliederung größerer Redeeinheiten durch tonale Signale wird auch als prosodische Phrasierung bezeichnet; in Abschnitt 4.5.5 befassen wir uns im Rahmen des Autosegmental-Metrischen Modells genauer mit diesem Phänomen. Für Fragesätze hat Navarro Tomás ( 4 1974: Kapitel 4) eine umfangreiche Typologie von tonal unterschiedlich markierten Strukturen ausgearbeitet, die hier nicht im Einzelnen dargestellt werden soll (für eine Zusammenfassung vgl. Kubarth 2009: 239-243). Generell unterscheidet er zwischen der Ja/ Nein- und der Ergänzungsfrage. Der erste Fragetyp ist (zumindest in der von Navarro Tomás analysierten kastilischen Standardvarietät) durch eine fallend-steigende Kontur (Kopf: fallend, Nukleus: stei‐ gend) gekennzeichnet (Abb. 4.5-8, links); beim zweiten Typ wird das im Spanischen normalerweise an den Satzanfang gestellte Wh-Wort durch einen F 0 -Gipfel markiert, woraus sich eine fallende Gesamtkontur über Kopf und Nukleus hin ergibt (Abb. 4.5-8, rechts). 242 4 Prosodie <?page no="243"?> 75 In Quilis (1993) sind zahlreiche Arbeiten zusammengefasst; die dort vorgeschlagene Intonationsana‐ lyse geht teils auf deutlich ältere Studien zurück (z. B. Quilis 1975, 1981). Abb. 4.5-8: Tonale Beschreibung der Ja/ Nein-Frage ¿Tienen mandarinas? ‘Haben Sie Mandarinen? ’ (links) und der Ergänzungsfrage ¿Quién trajo el paquete? ‘Wer hat das Paket gebracht? ’ (rechts) nach Navarro Tomás ( 4 1974). Die in Navarro Tomás’ Konfigurationsmodell postulierten Musterkonturen sind jeweils mit bestimmten satzsemantischen und pragmatischen Funktionen verbunden, also im strukturalistischen Sinne als Verbund von Form und Funktion und damit als phonologisch zugrundeliegende Toneinheiten (tonemas) aufzufassen. Letztlich bleibt aber unklar, wie der Zusammenhang zwischen diesen tonemas und der konkret von den Sprechern produzierten Oberfläche (F 0 -Kontur) beschaffen ist, da nur idealisierte Konturen präsentiert werden und somit die potenzielle phonetische Variation tonaler Konturen nicht erfasst wird. 4.5.2.2 Das Ebenen-Modell von Quilis (1993) Während das Konfigurationsmodell in seiner Grundidee der Britischen Intonations‐ schule verpflichtet ist, orientiert sich das im Folgenden darzustellende Modell eher an der US-amerikanischen Tradition und übernimmt die Idee unterschiedlicher tonaler Ebenen von Forschern wie Pike (1945), der für das Englische vier solcher tonal levels angesetzt hat. Antonio Quilis nimmt in seinem Tratado de fonología y fonética españolas (1993) 75 für das Spanische drei niveles tonales an, die wie folgt durchnummeriert werden: / 3/ alto, / 2/ medio und / 1/ bajo; hinzu kommen mit der fallenden (↓) und der steigenden (↑) Schlusskontur zwei sog. junturas terminales (Quilis 1993: 422f.). In seinem Analyseverfahren greift Quilis (1993: 447-453) auf real produzierte F 0 -Konturen zurück und versieht einzelne Silben mit einer das Tonniveau bezeichnenden Ziffer / 1- 3/ . Dabei ist Niveau / 3/ weitgehend auf emphatische Sprechweise beschränkt, so etwa auf die afirmación enfática, die pregunta pronominal enfática und die exclamación. Das Ende einer jeden Intonationseinheit wird mit dem Symbol für die fallende oder steigende Schlusskontur versehen (↓ bzw. ↑). Die einzelnen Grundelemente fasst Quilis (1993: 424) als fonemas prosódicos oder suprasegmentales auf; die sich hieraus ergebenden kontrastierenden Tonkombinationen werden als morfemas de entonación verstanden, die den segmentalen Phonemen übergeordnet sind. In Abb. 4.5-9 wird die distinktive Funktion solcher Intonationsmorpheme anhand der Gegenüberstellung eines Aussagesatzes und des syntaktisch und segmental identischen Fragesatzes in der von Quilis (1993) vorgeschlagenen Analyse illustriert. 4.5 Intonation 243 <?page no="244"?> 76 Mit Großbuchstaben wie / N/ und / R/ verweist Quilis auf die entsprechenden Archiphoneme (vgl. 3.1.1); betonte Silben werden gemäß der Transkriptionskonvention der Revista de filología española (RFE) durch den Akut angezeigt. Abb. 4.5-9: Tonale Beschreibung des Deklarativsatzes Estuvieron esperando ‘Sie haben gewartet’ (links) und der Ja/ Nein-Frage ¿Estuvieron esperando? ‘Haben sie gewartet? ’ (rechts) (Quilis 1993: 429f.). 76 Als konstitutiv für den satzsemantischen Unterschied zwischen Aussage und Frage führt Quilis die Schlusskonturen / 2 1 ↓/ bzw. / 1 2 ↑/ an. Diese werden − wie die Notation in Schrägstrichen deutlich macht − als phonologisch zugrundeliegende Einheiten aufgefasst. Kubarth (2009: 246f.) hat zu Recht auf die Problematik des Ansatzes hinge‐ wiesen: Die Ebenennotation steht oft in deutlichem Widerspruch zur produzierten F 0 -Kontur, so etwa bei der mit / 1 2/ bezifferten Silbenabfolge -peránin Abb. 4.5-9 (links). Zwar ist eine Diskrepanz zwischen konkret produzierter Oberfläche und zu‐ grundeliegender phonologischer Struktur durchaus nichts Ungewöhnliches, doch wird hier nicht explizit gemacht, weshalb ein und dieselbe Tonsilbe, nämlich die Nuklearsilbe -ránim Falle des Aussagesatzes zugrundeliegend mit einem mittleren Ton / 2/ , im Fragesatz jedoch mit einem Tiefton / 1/ verbunden sein soll. Nachvollziehbarer wäre die Annahme, dass der mit der Nuklearsilbe verbundene Ton zugrundeliegend jeweils identisch ist. Die unterschiedlichen F 0 -Konturen könnten dann als Oberflächenvaria‐ tion interpretiert werden, die durch die nachfolgende juntura terminal (↓ vs. ↑) bedingt wird. Auch ist bei den einzelnen Analysen nicht immer nachvollziehbar, welche Silben überhaupt tonal spezifiziert sind: So werden bei den in Abb. 4.5-9 wiedergegebenen Beispielen in esperando sowohl die Tonsilbe -ranals auch die vor- und nachtonigen Silben (-pe-, -do) mit einem eigenen nivel tonal versehen, während dies im Fall von estuvieron nur für die haupt- und nebenakzenttragenden Silben (es-, -vie-) gilt. Zudem werden einige Silben mit zwei niveles tonales versehen, ohne dass dies unmittelbar einleuchtet. Betrachten wir hierzu die von Quilis (1993: 432, 453) vorgeschlagene Analyse zweier Wh- und einer Ja/ Nein-Frage in Abb. 4.5-10. 244 4 Prosodie <?page no="245"?> Abb. 4.5-10: Tonale Beschreibung der Wh-Fragen ¿Cuándo vienes? ‘Wann kommst du? ’ (links) und ¿Qué vas a hacer? ‘Was wirst du tun? ’ (Mitte) sowie der Ja/ Nein-Frage ¿Quieres venir? ‘Willst du kommen? ’ (rechts) (Quilis 1993: 432). Während in ¿Cuándo vienes? (Abb. 4.5-10, links) die letzte Silbe der Äußerung mit / 1/ tonal einfach spezifiziert ist, trägt die Endsilbe in ¿Qué vas a hacer? (Abb. 4.5-10, Mitte) eine Art ‘doppelten’ Ton / 21/ , obwohl die F 0 -Kontur keinen Unterschied aufweist. Auf den ersten Blick könnte dies zwar der Tatsache geschuldet sein, dass hacer im Gegensatz zu vienes endbetont ist, doch trägt auch das gleichfalls oxytone venir in (Abb. 4.5-10, rechts) nur einen einfachen Ton. Ein grundsätzlicher Vorteil der Spezifizierung ein und derselben Silbe mit mehreren tonalen Grundelementen ist jedoch darin zu sehen, dass dies ein differenzierteres Erfassen der im zeitlichen Rahmen der betreffenden Silbe konstatierten F 0 -Bewegung ermöglicht. Im Rahmen des Autosegmental-Metrischen Modells, das wir in den folgenden Abschnitten vorstellen, wird diese Idee konsequent weiterverfolgt. 4.5.3 Phonologisierung und Theoretisierung: Das Autosegmental-Metrische Modell und seine Anwendung auf das Spanische In Abschnitt 4.5.2 haben wir zwei Ansätze zum Erfassen der spanischen Intonation vor‐ gestellt, die von dem seit dem Strukturalismus grundlegenden Unterschied zwischen phonologischer Struktur und phonetischer Oberfläche ausgehen. Wir haben jedoch auch darauf hingewiesen, dass in beiden Ansätzen der Bezug zwischen den Ebenen nicht immer hinreichend präzisiert wird. Das im Folgenden einzuführende Autoseg‐ mental-Metrische (AM-)Modell versteht sich ebenfalls als ein phonologisches Analy‐ semodell, doch lässt sich der Anspruch einer durchgehenden Ebenentrennung hier konsequenter einlösen. Zusätzlich zur Phonologisierung der Intonationsforschung ist ein verstärktes Bemühen um Einbettung in den Kontext umfassender Grammatik‐ modelle zu verzeichnen, also eine stärkere Theoretisierung der Intonationsforschung. Dies zeigt sich unter anderem daran, dass das Verhältnis zwischen unterschiedlichen Analyseebenen, etwa zwischen phonetischer Oberfläche und phonologischer Struktur, aber auch zwischen einzelnen phonologischen Ebenen (Segmentstruktur, Tonstruktur), genauer definiert wird. Zum anderen rücken sog. Schnittstellenphänomene wie etwa der Zusammenhang von Intonation und Wortstellung stärker ins Blickfeld − Aspekte sprachlicher Struktur, die sich weder ausschließlich phonologisch/ prosodisch noch ausschließlich syntaktisch erfassen lassen, sondern als Produkte des komplexen 4.5 Intonation 245 <?page no="246"?> 77 Den Terminus phrase accent hat Pierrehumbert (1980) aus einer Arbeit von Bruce (1977) zum Wort- und Satzakzent des Schwedischen übernommen. In späteren Versionen des AM-Modells wurde er zum mit der Intermediärphrase assoziierten Grenzton uminterpretiert; auch wir sprechen im Folgenden von ip-Grenztönen. Zusammenspiels unterschiedlicher Ebenen (Phonologie, Syntax) zu erklären sind und damit bei der Analyse einen Rückgriff auf mehrere Module des sprachlichen Wissens erfordern (vgl. hierzu 4.5.5). In diesem Abschnitt stellen wir zunächst die Grundannahmen des theoretischen Rahmens dar (4.5.3.1) und führen in die für das Spanische adaptierte Version des AM-basierten Transkriptionssystems ToBI (Tone and Break Indices) ein (4.5.3.2), bevor wir die Intonation dreier spanischer Varietäten in den Blick nehmen (4.5.4) und uns abschließend der Diskursgliederung mittels F 0 und dem Zusammenhang zwischen Syntax, Prosodie und Informationsstruktur widmen. 4.5.3.1 Bausteine der Intonation im AM-Modell: Tonhöhenakzente und Grenztöne Das ursprünglich von Pierrehumbert (1980) für die Analyse der englischen Intonation entwickelte AM-Modell (vgl. auch Ladd 2 2008) stellt derzeit einen in der internatio‐ nalen Intonationsforschung weit verbreiteten Ansatz dar, auf dessen Grundlage in neuerer Zeit auch Vorschläge für die Modellierung der spanischen Intonation erarbeitet wurden. Eine zentrale Annahme ist die Unterscheidung zwischen zwei Typen von tonalen Grundeinheiten, den sog. Tonhöhenakzenten (auch: Akzenttöne, engl. pitch accents, sp. acentos tonales; gekennzeichnet durch den Asterisk ‘*’) und den sog. Grenztönen (engl. boundary tones, sp. tonos de frontera oder de juntura; angezeigt durch das Prozentzeichen ‘%’). Erstere sind mit den metrisch starken (auch: betonten, akzentuierten oder Ton-)Silben (sp. sílabas métricamente fuertes) verbunden, letztere mit den Rändern größerer oder kleinerer prosodischer Einheiten. Man sagt auch, dass die Töne mit akzentuierten Silben bzw. prosodischen Grenzen assoziieren. Gemäß der Prosodischen Hierarchie (Selkirk 1984, Nespor & Vogel 2 2007; vgl. 4.1) wird bei der tonalen Grenzmarkierung zwischen hierarchisch höheren Intonationsphrasen (IP) und den von ihnen dominierten Intermediärphrasen (ip) unterschieden. Entsprechend differenziert man auch zwischen zwei Arten von grenzmarkierenden Tönen, die mit den Rändern dieser Phrasen assoziieren: Während die mit der IP-Ebene verbundenen tonalen Grundelemente in der Regel einfach als Grenztöne bezeichnet werden (L%, H% etc.), spricht man in Bezug auf die hierarchisch tiefer angesiedelten ip-Grenztöne auch von Phrasentönen (engl. phrase accents, sp. acentos de frase; symbolisiert durch das Minuszeichen ‘-’). 77 Weiterhin wird eine terminologische Unterscheidung zwischen zwei Typen von metrisch starken Silben und den mit ihnen assoziierten Tonhöhenakzenten gemacht: Das ist einmal der Nuklearakzent (auch: Satzakzent; engl. nuclear accent, sp. acento nuclear) - die am stärksten wahrgenommene Akzentstelle, die sich im Spanischen normalerweise am 246 4 Prosodie <?page no="247"?> 78 Die (ohnehin umstrittene) Ebene der Klitischen Gruppe wird nicht in die Darstellung mit einbezogen; sie wäre oberhalb der Wortebene anzusetzen und würde eventuelle nicht-akzentogene Funktions‐ wörter wie Artikel oder unbetonte Objektpronomina beinhalten, die in die Akzentdomäne desjenigen lexikalischen Wortes fallen, an das sie klitisch gebunden sind (vgl. die Diskussion in 4.1 und 4.3.5.1). rechten Satzrand befindet (in orthographischer Transkription durch Großbuchstaben hervorgehoben); zum anderen die Pränuklearakzente (engl. prenuclear accents, sp. acentos prenucleares), die diesem vorausgehen. In einer radikalen Vereinfachung des Ebenenmodells (vgl. 4.5.2.2) werden nur zwei relative Tonhöhen angenommen, ein Hochton H (engl. high tone, sp. tono alto) und ein Tiefton L (engl. low tone, sp. tono bajo); in neueren Versionen kommt − allerdings nur in Form eines Grenztons − manchmal ein mittlerer Ton M (engl. mid tone, sp. tono medio) hinzu, der teilweise auch in den nachfolgend diskutierten Analysen der spanischen Intonation eine Rolle spielt. Wichtig ist, dass sowohl Tonhöhenakzente als auch Grenztöne einfach oder komplex, d. h. aus allen potenziell möglichen Kombinationen von Einzeltönen zusammengesetzt sein können (z. B. L, H, LH, HL, LHL, LM etc.). Bei komplexen Tonhöhenakzenten zeigt der Asterisk ‘*’ die sog. Alignierung (engl. alignment, sp. alineamiento) des betreffenden Tons, d. h. die Position des F 0 -Gipfels bzw. -Abfalls im Verhältnis zur metrisch starken Silbe, an (vgl. 4.5.3.2). In Abb. 4.5-11 wird gezeigt, wie die im AM-Modell angenommenen tonalen Basisein‐ heiten mit den Ebenen der Prosodischen Hierarchie verbunden sind. Im Gegensatz zur in 4.1 gegebenen Darstellung handelt es sich um eine reduzierte Fassung der Prosodischen Hierarchie, die auf die hier relevanten Ebenen beschränkt ist: die Silbe (σ) als potentieller Ankerpunkt für Tonhöhenakzente; der Fuß (j) als kombinatorische Einheit unterhalb des phonologischen Wortes (w), das wiederum als Domäne des Wortakzents für die tonale Gestaltung einzelner lexikalischer Einheiten relevant ist; die Intermediärphrase (ip) und die Intonationsphrase (IP). 78 Im AM-Modell sind sowohl die Tonhöhenakzente als auch die Grenztöne auf einer autonomen Tonschicht (engl. tonal tier, sp. nivel tonal) repräsentiert, die von den Ebenen der Prosodischen Hierarchie unabhängig ist. Dies stellt einen wichtigen Unterschied zum Ebenenmodell nach Quilis (1993) dar, der die Töne den Silben direkt zuordnet und damit keine gesonderte Tonschicht annimmt (vgl. 4.5.2.2). Aus der Annahme einer autonomen Tonschicht erklärt sich zum Teil auch der Name des Modells: Die Tonschicht ist autosegmental, d. h. von den auf der Silbenschicht (σ) zu Silben kombinierten Segmenten unabhängig und explizit nicht in die Prosodische Hierarchie eingebunden. Das Modell hat damit sozusagen einen dreidimensionalen Charakter, was in Abb. 4.5-11 durch die Darstel‐ lung der Tonschicht in Form eines grauen Quaders angedeutet wird. Der zweite Teil der Bezeichnung, also der Bestandteil ‘metrisch’, erklärt sich durch die zentrale Bedeutung der metrischen Struktur für die Organisation der Intonation. Gemeint ist damit die Abhängigkeit der Tonkontur von den Akzentstellen der Wörter und damit auch von den Regeln, die die Akzentzuweisung steuern (vgl. 4.3). In Abb. 4.5-11 wird die jeweilige Assoziierung der Töne mit den Ebenen der Prosodischen Hierarchie − hier: Silbe (σ) bzw. ip und IP − durch gestrichelte Linien verdeutlicht; die Klammerung des Grenztons 4.5 Intonation 247 <?page no="248"?> am linken Rand der IP zeigt an, dass dieser optional ist und nur dann vorkommt, wenn ein Sprecher − etwa in emphatischer Rede − eine Äußerung mit einem besonders hohen F 0 -Wert ansetzt. Da es sich um ein allgemeines Modell handelt, werden (mit Ausnahme des fakultativen hohen initialen Grenztons %H) keine spezifischen Töne angegeben; das Symbol T* steht hier für jeden beliebigen Tonhöhenakzent, die Symbole Tbzw. T% für jeden möglichen ipbzw. IP-Grenzton. Der letzte Tonhöhenakzent in der IP ist der Nuklear- oder Satzakzent (durch einen Kreis markiert); metrisch starke Silben sind durch Unterstreichung gekennzeichnet (σ). Abb. 4.5-11: Prosodische Hierarchie und Tonschicht im AM-Modell. Grundlegend für die AM-basierte Intonationsphonologie ist weiterhin die bereits angesprochene strikte Trennung zwischen der phonologisch zugrundeliegenden Ton‐ struktur und der vom Sprecher produzierten F 0 -Kontur. Diese wird aufgefasst als das Resultat sog. phonetischer Interpolation zwischen den tonalen Zielpunkten (engl. tonal targets, sp. metas tonales), die durch die auf der Tonschicht repräsentierten, zugrundeliegenden Tonhöhenakzente und Grenztöne determiniert werden. Anders als im bereits vorgestellten Konfigurationsansatz, der sozusagen ‘fertige’ Musterkonturen als zugrundeliegend annimmt, geht man hier davon aus, dass die phonologische Struktur lediglich die Eck- und Wendepunkte der Kontur determiniert. Wie dies genau funktioniert, erläutern wir in Abschnitt 4.5.3.2. Aus dem Bedürfnis, die Intonation stärker in den Kontext umfassender Gramma‐ tikmodelle einzubinden, folgt auch das Bestreben, die Intonation einer Sprache in Form einer tonalen Grammatik (auch: Intonationsgrammatik, engl. tonal grammar, sp. gramática tonal) zu erfassen. Mit dem Modell der wohlgeformten Intonations‐ phrase haben Beckman & Pierrehumbert (1986) eine übereinzelsprachlich gültige Tongrammatik erarbeitet, die alle in einer IP potentiell möglichen Tonkombinationen 248 4 Prosodie <?page no="249"?> 79 Die wohlgeformte Intonationsphrase nach Beckman & Pierrehumbert (1986) ist auf die Grundele‐ mente L (Tiefton) und H (Hochton) beschränkt und enthält nur monotonale Grenztöne sowie mono- und bitonale Tonhöhenakzente. Der mittlere Ton M wurde erst später eingeführt, ebenso wie komplexere Tonverbindungen bei den Grenztönen und Tonhöhenakzenten. enthält. 79 Das in Abb. 4.5-12 wiedergegebene Modell ist wie folgt zu lesen: Am linken Rand der IP kann fakultativ ein hoher Grenzton erscheinen (%H); der Grenzton am rechten Rand ist hingegen obligatorisch (H% oder L%) und fällt mit einem hohen oder tiefen intermediären Grenzton (H- oder L-) zusammen. Die tiefgestellte Ziffer 1 besagt, dass das in der entsprechend markierten Klammer befindliche Element in jeder IP mindestens einmal vorkommt. So besteht eine Intonationsphrase (IP) aus mindestens einer Intermediärphrase (ip), und diese muss mindestens einen Tonhöhenakzent beinhalten. Abb. 4.5-12: Die wohlgeformte Intonationsphrase nach Beckman & Pierrehumbert (1986). 4.5.3.2 Das Notationssystem Spanish ToBI (Sp_ToBI) Eine der ersten umfassenden Beschreibungen der spanischen Intonation auf autoseg‐ mental-metrischer Basis hat Sosa (1999) mit seiner Monographie La entonación del español vorgelegt, die u. a. auf seiner Dissertation (Sosa 1991) aufbaut. Parallel hierzu wurde in den frühen 1990er Jahren − zunächst für das Englische − auf der Basis des AM-Modells das Notationssystem Tone and Break Indices (ToBI) entwickelt (Silverman et al. 1992, Beckman et al. 2005), das in der Folgezeit für die tonale Analyse zahlreicher Sprachen adaptiert wurde, darunter das Deutsche (Grice & Baumann 2002, Féry 2012), das Französische (Delais-Roussarie et al. 2015), das Italienische (Grice et al. 2006, Gili Fivela et al. 2015) und auch das Spanische. Die erste Version des Spanish ToBI (Sp_ToBI) wurde von Beckman et al. (2002) vorgeschlagen, mehrfach überarbeitet (Face 2002, Hualde 2002, 2003a, Sosa 2003, Face & Prieto 2007, Kubarth 2009: 255-308, Estebas-Vi‐ laplana & Prieto 2009) und für die Analyse der tonalen Besonderheiten verschiedener Varietäten ausdifferenziert (Prieto & Roseano 2010, Hualde & Prieto 2015). Auch das Intonationskapitel im Phonologie-Band der aktuellen Akademiegrammatik richtet sich nach diesem Notationssystem (NGRAE 2011: 435-488). 4.5 Intonation 249 <?page no="250"?> 80 Bei komplexen Tonhöhenakzenten werden die Teiltöne meist durch Pluszeichen miteinander verbunden; es gibt jedoch auch Ansätze wie z. B. Féry (2012), die hierauf verzichten. Anstelle von L+H ist dann einfach LH zu notieren. 81 Hualde & Prieto (2015) verwenden hiervon abweichend das Zeichen ‘<’, d. h. Ton (5) aus Abb. 4.5-13 ist dann als L+<H* (statt L+>H*) zu notieren. Wir stellen nun die jüngste Version der spanischen ToBI-Notation exemplarisch vor; für eine umfassende Dokumentation verweisen wir auf die umfangreiche Internetdo‐ kumentation, die unter dem Titel Sp_ToBI − Training materials neben Informationen zum theoretischen Hintergrund auch umfangreiches Beispielmaterial zum Erlernen und Einüben der Notationsmethode bietet: http: / / prosodia.upf.edu/ sp_tobi/ en (vgl. Aguilar et al. 2009). Ausgangsziel von ToBI ist es, ein einheitliches Notationssystem für konkret produ‐ zierte F 0 -Konturen bereitzustellen, um in einem weiteren Schritt auf die als zugrun‐ deliegend anzunehmenden Töne zu schließen. Bei den Tonhöhenakzenten betrachtet man den (steigenden, fallenden oder gleichbleibenden) F 0 -Verlauf im zeitlichen Rahmen metrisch starker Silben: Ist der F 0 -Verlauf dort gleichbleibend tief bzw. hoch, notiert man L* bzw. H* und bringt damit zum Ausdruck, dass ein tiefer bzw. hoher Ton mit der akzentuierten Silbe assoziiert (vgl. Abb. 4.5-13, Töne 1 und 2). Solche monotonalen Einheiten werden auch als Registertöne (engl. level tones, sp. tonos nivelados, de registro oder puntuales) bezeichnet. Bei komplexen Tönen, die auch Konturtöne (engl. contour tones, sp. tonos modulados oder de contorno) genannt werden, zeigt der Asterisk die Alignierungseigenschaft, also den F 0 -Verlauf im Verhältnis zur Tonsilbe, an. Erfolgt bei einer steigenden Kontur (low-high: L+H) 80 der Anstieg im zeitlichen Rahmen der Tonsilbe und wird der Gipfel innerhalb dieser erreicht, markiert man den hohen Teilton mit dem Asterisk und notiert L+H* (Ton 3); der ihm vorausgehende Teilton L wird als sog. leading tone (von engl. to lead ‘führen, vorangehen’, sp. tono conductor) bezeichnet (vgl. Grice 1995). Handelt es sich um einen heraufgestuften Tonhöhengipfel (upstep, vgl. 4.5.1), zeigt man dies mit dem umgedrehten Ausrufezeichen ‘¡’ an (Ton 4); einen späten Gipfel, der erst nach der Tonsilbe erreicht wird, markiert man mit ‘>’ (Ton 5; vgl. Aguilar et al. 2009, Prieto & Roseano 2010) 81 . Ist bei einer steigenden Kontur der F 0 -Verlauf in der metrisch starken Silbe zunächst flach und erfolgt der Anstieg erst in der nachtonigen Silbe, notiert man L*+H (Abb. 4.5-13, Ton 6); der Teilton H wird dann als trailing tone (von engl. to trail ‘nachfolgen’, sp. tono seguidor) bezeichnet. Ein in der betonten Silbe fallender Tonhöhenverlauf wird mit H+L* wiedergegeben (Ton 7). Ein weiteres zentrales Konzept ist das der sog. elbows (‘Ellbogen’, sp. punto de inflexión), worunter man den Übergang vom flachen zum steigenden bzw. fallenden Teil einer F 0 -Kontur (oder umgekehrt) versteht. In den schematischen Darstellungen in Abb. 4.5-13 sind diese Übergänge jeweils idealisiert als Ecken in der Kontur dargestellt, jedoch ist deren genaue Lokalisierung im Sprachsignal nicht immer einfach, da die konkret produzierte Sprachmelodie fließend ist (Del Giudice et al. 2007). 250 4 Prosodie <?page no="251"?> Abb. 4.5-13: Schematische Darstellung der Tonhöhenakzente des Spanischen (nach Aguilar et al. 2009, Prieto & Roseano 2010). Die metrisch starke Silbe ist grau hervorgehoben; die schwarze Linie zeigt den F 0 -Verlauf an. Das Vorkommen der in Abb. 4.5-13 aufgelisteten Tonhöhenakzente wird im folgenden Abschnitt exemplarisch anhand von drei spanischen Varietäten dokumentiert; in die‐ sem Zusammenhang werden wir auch sehen, wie das (zunächst anhand des kastilischen Spanisch erarbeitete) aus zwei monotonalen und fünf bitonalen Tonhöhenakzenten bestehende Inventar für die Analyse dialektaler Besonderheiten erweitert wurde: Ein Beispiel hierfür ist der als Ton (8) in Abb. 4.5-13 geführte tritonale Tonhöhenakzent L+H*+L, der von Gabriel et al. (2010) für die Analyse des argentinischen Porteño-Spa‐ nisch eingeführt wurde. Da die entsprechende Kontur im Gegensatz zu den bitonalen Akzenten nicht nur durch einen, sondern durch zwei elbows gekennzeichnet ist 4.5 Intonation 251 <?page no="252"?> 82 BI 2 ist für das Spanische nicht relevant; hiermit ist eine Ebene gemeint, die der für manche Sprachen angesetzten Phonologischen Phrase entspricht und die beispielsweise im Italienischen als Domäne für bestimmte phonologische Prozesse wie etwa das raddoppiamento (fono)sintattico angesehen wird (vgl. Krämer 2009: 196f.). (flach-steigend und fallend-flach), sind hierfür drei tonale Zielpunkte anzusetzen (vgl. 4.5.4.2). Neben den Tonhöhenakzenten werden im Rahmen von ToBI sog. Grenzmarkierun‐ gen angenommen und in Form von durchnummerierten break indices (BI) notiert. Dabei wird zwischen stärkeren und schwächeren prosodischen Grenzen unterschieden: Mit BI 4 wird die Grenze der Intonationsphrase (IP) gekennzeichnet, mit BI 3 die einer Intermediärphrase (ip). 82 Weiterhin werden bei der ToBI-Notation Übergänge zwischen phonologischen Wörtern (BI 1) sowie zwischen phonologischem Wort und nicht akzentogenem Funktionswort angegeben (BI 0). Der break index BI 0 steht hier sozusagen für eine ‘Nicht-Grenze’. Ein Beispiel für eine entsprechende Notation findet sich in Abb. 4.5-15. Für die Intonation relevant sind die durch BI 3 und BI 4 bezeichneten Grenzen, von denen angenommen wird, dass sie mit Grenztönen des Typs Tbzw. T% verbunden sind. Aguilar et al. (2009) setzen hier zusätzlich zu den tonalen Grundeinheiten L und H auch einen mittleren Ton M an, um die an den Rändern der Intonations- und Intermediärphrasen zu beobachtenden Tonhöhenbewegungen genauer zu erfassen. Auch hier geht man, wie bei den Tonhöhenakzenten, sowohl von einzelnen als auch von komplexen Tönen aus (z. B. LH für eine tiefe Kontur mit anschließendem Anstieg bis zur Grenze); die Kombination HH bezeichnet jedoch nicht zwei aufeinanderfolgende Hochtöne, sondern einen stärkeren Anstieg als es bei H der Fall ist. Das Inventar von Grenztönen (BI 3 und BI 4) wird in Abb. 4.5-14 zusammengefasst. Grau hinterlegt ist hier die unmittelbar der Grenze vorausgehende Silbe, unabhängig davon, ob sie betont ist oder nicht. Wie aus der Darstellung ersichtlich wird, kommen nicht alle Grenztöne auf beiden Ebenen vor. Auch hier gilt, dass das Inventar tonaler Grenzmarkierungen zunächst anhand des kastilischen Spanisch aufgestellt und zunehmend erweitert wurde, einerseits mit Blick auf die Vielfalt der Oberflächenrealisierungen intermediärer Phrasengrenzen (vgl. 4.5.5.1 und 4.5.5.4), andererseits in Anbetracht dialektaler Unterschiede (vgl. Prieto & Roseano 2010, Hualde & Prieto 2015). Die Tabelle in Abb. 4.5-14 umfasst das von Aguilar et al. (2009) vorgeschlagene Grundrepertoire sowie den hohen Grenzton H% (Ton 3), der im mexikanischen Spanisch in bestimmten Fragesatztypen als BI 4 auftritt (vgl. De-la-Mota et al. 2010: 346 und 4.5.4.3). 252 4 Prosodie <?page no="253"?> Abb. 4.5-14: Schematische Darstellung der Grenztöne des Spanischen (nach Aguilar et al. 2009, Prieto & Roseano 2010). Die Silbe unmittelbar vor der Grenze ist grau hervorgehoben; die schwarze Linie zeigt den F 0 -Verlauf an. Die in Abb. 4.5-13 und 4.5-14 zusammengefassten Tonhöhenakzente und Grenztöne sind zunächst nichts anderes als Labels, die zum schematischen Erfassen der vom Sprecher produzierten F 0 -Kontur dienen. Versieht man eine identifizierte F 0 -Bewegung mit einem bestimmten Tonhöhenakzent oder Grenzton, sagt dies letztlich noch nichts darüber aus, ob der betreffende Ton auch als phonologisch zugrundeliegende Einheit angesehen werden sollte. Hierzu sind weiterführende Überlegungen notwendig, was wir anhand der in Abb. 4.5-15 vorgeschlagenen ToBI-Annotation des Aussagesatzes Está agarrando un gajo de mandarina ‘Sie schnappt sich gerade eine Stück Mandarine’ 4.5 Intonation 253 <?page no="254"?> 83 Die Intonation des Spanischen von Buenos Aires wird in 4.5.4.2 genauer vorgestellt. (produziert von einem Sprecher aus Buenos Aires als Beschreibung des Bildes einer Frau, die gerade eine Mandarine isst) 83 verdeutlichen wollen. Abb. 4.5-15: ToBI-Notation der F 0 -Kontur von Está agarrando un gajo de mandarina (Sprecher aus Buenos Aires). Von oben nach unten: Orthographische und phonetische Transkription der Silben; Break indices (BI); phonetisch realisierte Tonhöhenakzente und Grenztöne; phonologisch zugrundeliegende Tonhöhenakzente und Grenztöne (Tonschicht). Die in Abb. 4.5-15 wiedergegebene Äußerung besteht aus einer Intonationsphrase (IP), die in zwei Intermediärphrasen (ip) aufgeteilt ist; die Phrasengrenze wird durch einen hohen ip-Grenzton (H-) angezeigt. Die beiden metrisch starken Silben in der ersten Intermediärphrase ( ip Está agarrando) werden − wie für alle spanischen Varietäten typisch − durch steigende Tonhöhenakzente markiert, wobei im ersten Fall (está) das F 0 -Maximum am rechten Rand der Tonsilbe erreicht wird (Label: L+H*; vgl. Abb. 4.5-13), während bei agarrando die Kontur über die Grenze der metrisch starken Silbe hin ansteigt und der Tonhöhengipfel am Ende der nachtonigen Silbe platziert ist (nach rechts verlagerter Tonhöhengipfel). Um die vom Sprecher produzierte Kontur korrekt zu erfassen, ist hier gemäß Abb. 4.5-13 der Tonhöhenakzent L+>H* anzusetzen. Die zweite Intermediärphrase ( ip un gajo de mandarina) beinhaltet ebenfalls zwei metrisch starke Silben, wobei die erste als steigender Tonhöhenakzent L+H* realisiert wird (gajo), die zweite als Tiefton L* (mandarina). Der fundamentale Unterschied zwischen dem Nuklear- oder Satzakzent und den ihm vorausgehenden Pränuklearakzenten rechtfertigt die Annahme zweier phonologisch zugrundeliegender Töne: So erfüllt der Nuklearakzent (hier: L*) eine pragmatische Funktion, und zwar insofern als er 254 4 Prosodie <?page no="255"?> 84 Dies entspricht der kontextbedingten Allophonie, die wir in 3.1 kennengelernt haben, wie z. B. beim Phonem / d/ , das je nach Position als eines seiner Allophone [d] oder [ð] realisiert wird. Weiterhin ist auch in der Intonation freie Variation möglich: So wird z. B. im Spanischen von Buenos Aires der Nuklearakzent in einigen Fällen fallend als [H+L*] realisiert, ohne dass ein kontextueller oder pragmatischer Unterschied nachweisbar ist (vgl. 4.5.4.2). 85 Für einen Überblick über die prosodischen Eigenschaften amerikanischer Varietäten vgl. Gabriel (2021). obligatorisch mit neuer Information verbunden ist (sog. Fokus). Dies gilt nicht für Pränuklearakzente, denn diese können auch bereits bekannte Information markieren (genauer hierzu in Abschnitt 4.5.5). In der ersten ip liegt kein vergleichbarer Kontrast vor; es handelt sich um zwei aufeinander folgende Pränuklearakzente. Hier kann also von kontextbedingter Oberflächenvariation ausgegangen werden, die durch den hohen ip-Grenzton Hbedingt ist. Ein Analysevorschlag kann also wie folgt lauten: Pränuklearakzente sind im Spanischen von Buenos Aires zugrundeliegend immer / L+H*/ , in der Position vor Hwerden sie jedoch phonetisch als [L+>H*] realisiert. 84 Ein weiterer Hinweis soll der Schlusskontur und deren Analyse in Abb. 4.5-15 gelten: Entsprechend der aus der Prosodischen Hierarchie resultierenden Strict Layer Hypothesis (sp. hipótesis de estratificación rigurosa, vgl. 4.1) fällt die Grenze einer Intonationsphrase (IP) stets mit einer ip-Grenze zusammen. Daraus ergibt sich, dass am Schluss einer IP immer zwei zugrundeliegende Töne, nämlich ein ip-Grenzton (Phrasenton) und ein IP-Grenzton, anzunehmen sind. In der linearen Darstellung der Tonschicht (vgl. den grau schraffierten Quader in Abb. 4.5-15) erscheinen diese nachei‐ nander (hier: L-L%); in der konkret produzierten F 0 -Kontur werden beide Töne jedoch sozusagen ‘in einem’ realisiert, weshalb wir in der oberflächennahen ToBI-Annotation der Kontur in Abb. 4.5-15 nur den Grenzton L% notiert haben. Theoretisch lässt sich dies erfassen, indem man annimmt, dass sich die in Bezug auf ihre tonale Spezifizierung identischen Grenztöne der ip und der IP überlagern und nur einen einzigen tonalen Zielpunkt L bilden. Durch die Verbindung zwischen diesem und dem vorausgehenden, ebenfalls tiefen Nuklearakzent (L*) auf der Silbe -riergibt sich eine gleichbleibend tiefe Kontur über die nachtonige Silbe -na hinweg bis zum Ende der IP. 4.5.4 Toninventare spanischer Varietäten im AM-Modell Die meisten Studien zur spanischen Intonation legen die kastilische Varietät von Madrid zugrunde (u. a. Face 2002, Kubarth 2009, Estebas-Vilaplana & Prieto 2010). Wir kontrastieren im Folgenden das Kastilische mit einer süd- und einer mittelamerikani‐ schen Varietät (Buenos Aires und Mexiko-Stadt) und folgen dabei im Wesentlichen dem von Prieto & Roseano (2010) herausgegebenen Handbuch, in dem die Intonation zehn amerikanischer und europäischer Varietäten analysiert wird. Aus Platzgründen können wir jeweils nur besonders charakteristische Aspekte hervorheben; umfassende Beschreibungen der Tonsysteme finden sich in den Einzelkapiteln in Prieto & Roseano (2010). 85 Die dort vorgeschlagenen ToBI-basierten Analysen nehmen eine zentrale 4.5 Intonation 255 <?page no="256"?> Idee des Konfigurationsansatzes nach Navarro Tomás ( 4 1974) auf, nach dem die Into‐ nation unterschiedlicher Satztypen vornehmlich an deren Nuklearkonfiguration (vgl. 4.5.2.1) festgemacht wird. Im Rahmen des AM-Modells versteht man darunter die Kombination aus Nuklearakzent und darauffolgendem IP-Grenzton. Die einzelnen Darstellungen der Intonation spanischer Dialekte in Prieto & Roseano (2010) nutzen jeweils vergleichbare Korpora aus semi-spontansprachlichen Daten (vgl. den nachstehenden Kasten). Entsprechende Hörbeispiele finden sich auf der Website des Atlas interactivo de la entonación del español unter http: / / prosodia.upf.edu/ atlasen tonacion/ . Datentypen in der Intonationsforschung Je nach Untersuchungsinteresse kann es sinnvoll sein, unterschiedliches Sprach‐ material zu analysieren. Generell können drei Datentypen unterschieden wer‐ den: • spontansprachlich • semi-spontansprachlich • gelesen Spontansprachliche Daten sind solche, die in natürlicher Umgebung und ohne jegliche Anweisung erhoben wurden, z. B. im Rahmen von ungesteuerten Gesprächen. Da lautsprachliches Material jedoch aus datenschutzrechtlichen Gründen nur mit Zustimmung der Sprecher aufgenommen und für die Forschung verwendet werden darf, ist die Natürlichkeit der erhobenen Daten schon allein aufgrund der künstlichen Aufnahmesituation in gewissem Maße eingeschränkt. Allerdings kann sich auch in Aufnahmen freier Konversation nach geringer Zeit eine natürliche Gesprächsatmosphäre einstellen. Dies gilt sowohl für (soziolinguistische oder sprachbiographische) Einzelinterviews, die aus Gründen der Vergleichbarkeit über mehrere Aufnahmen hinweg gemäß einem konstanten Interviewleitfragen geführt werden sollten, als auch für Gruppengespräche, bei denen i. d. R. ein bestimmtes Thema vorgegeben wird, das sich in der zu untersuchenden Sprechergruppe als Kommunikationsanlass eignet. Ein Nachteil von spontansprachlichem Material besteht allerdings darin, dass die Daten nicht kontrolliert sind und die aus solchen Erhebungen resultierende Korpora bestimmte zu untersuchende Strukturen gegebenenfalls in nur geringer Anzahl oder gar nicht enthalten. Zudem ist die Vergleichbarkeit von verschiedenen spontansprachlichen Aufnahmen nur sehr eingeschränkt, da die Bedingungen der Datenerhebung naturgemäß von Mal zu Mal anders sind. Unter semi-spontansprachlichen Daten versteht man solche, die von den Sprechern gezielt evoziert werden. Sie sind damit zwar weniger natürlich als spontansprachliches Material, doch für spezifische Untersuchungsinteressen gegebenenfalls deutlich ergiebiger. In der Intonationsforschung haben sich u. a. die folgenden drei Erhebungsmethoden bewährt: 256 4 Prosodie <?page no="257"?> • Aufbauend auf Kasper & Dahl (1991) hat Prieto (2001) für das Katalanische einen Intonationsfragebogen entwickelt, der dem Prinzip des Discourse Completion Task (DCT) folgt. Es handelt sich dabei um eine induktive Methode, bei der den Probanden verschiedene alltägliche Situationen prä‐ sentiert werden, in denen sie entsprechend verbal reagieren sollen. Auf diese Weise kann der jeweilige pragmatische Kontext kontrolliert werden; die erhobenen Daten variieren jedoch von Sprecher zu Sprecher, da keine Vorgaben in Bezug auf die Wortwahl oder die Satzstruktur gemacht werden (für einen Überblick zu dieser Erhebungsmethode vgl. Félix-Brasdefer 2010 und Vanrell et al. 2018). Das nachfolgende Beispiel aus der kastilischen Version eines DCT evoziert eine neutrale Ja/ Nein-Frage. Interviewer: Entras en una tienda y le preguntas al tendero si tiene mandarinas. Proband: (mögliche Äußerungen) ¿Tiene mandarinas? Hola, ¿tienes mandarinas? - Auf der Website des Atlas interactivo de la entonación del español können unter http: / / prosodia.upf.edu/ atlasentonacion/ metodologia/ index.html die in Prieto & Roseano (2010) für die Datenerhebung in zehn spanischen Varietäten verwen‐ deten Versionen des DCT als Word-Dokumente abgerufen werden. Diese sind lexikalisch und grammatisch an die unterschiedlichen Dialekte angepasst. • Mithilfe eines sog. Map Task lassen sich gezielt unterschiedliche Typen von Fragesätzen erheben. Hierzu werden zwei Probanden mit je einer fiktiven Landkarte ausgestattet, wobei auf einer der beiden Karten ein Weg eingezeichnet ist. Einer der Teilnehmer hat die Aufgabe, von seinem Gesprächspartner diesen Weg zu erfragen, und zwar ohne dass die Probanden sich gegenseitig in die Pläne schauen können. Da die Pläne geringfügig von‐ einander abweichen, ergeben sich zahlreiche unterschiedliche Fragesätze. Aufnahmen solcher Map Task-Dialoge in verschiedenen spanischen Varietä‐ ten bietet der Atlas interactivo de la entonación del español. Informationen zum Map Task sowie Vorlagen für Karten finden sich unter http: / / groups.in f.ed.ac.uk/ maptask/ . • Mithilfe von visuellen Stimuli wie Bildergeschichten lassen sich Struktu‐ ren mit unterschiedlicher Informationsverteilung evozieren. Hierzu werden die Sprecher gebeten, Fragen zu einzelnen Bildern zu beantworten. Diese Methode wurde z. B. von Gabriel (2007, 2010) und Gabriel & Grünke (2018a) angewendet, um die tonale (und syntaktische) Markierung neuer Informa‐ 4.5 Intonation 257 <?page no="258"?> tion (Fokus, vgl. 4.5.5) im Spanischen zu untersuchen. In Abb. 4.5-16 wird ein Beispiel gegeben. Abb. 4.5-16: Visueller Stimulus zur Erhebung von unterschiedlichen Fokusstrukturen in Sätzen mit dem Verb secuestrar ‘entführen’ (belebtes Objekt und belebtes Subjekt) nach Gabriel (2007). In den möglichen Antworten ist jeweils der Fokus durch [ F …] hervorgehoben. Gelesene Daten lassen sich schließlich am besten kontrollieren und bieten damit die Möglichkeit des unmittelbaren Vergleichs mit entsprechend erhobenen Korpora. So kann vorher festgelegt werden, welche Strukturen (einfache oder komplexe Sätze, verschiedene Satzmodi etc.) die Probanden produzieren und welches lexikalische Material diese enthalten. Dies kann z. B. von Vorteil sein, wenn man die tonale Realisierung prosodischer Grenzen untersucht: Da sich ip- und IP-Grenztöne am deutlichsten in der phonetischen Oberfläche manifestieren, wenn zwischen der prosodischen Grenze und dem vorausgegangen Tonhöhenakzent ‘möglichst viel Platz ist’, sollte man hierfür Sätze konstruieren, in denen vor einer potentiellen ip-Grenze bzw. am Schluss der IP antepänultimabetonte Wörter auftreten (vgl. D’Imperio et al. 2005, Frota et al. 2007, Gabriel et al. 2011). Ein Nachteil von gelesenen Daten ist jedoch, dass es sich hierbei um eine spezielle Leseaussprache handelt, die von der des natürlichen Gesprächs stark abweichen kann. Sprachmaterial, das unter kontrollierten Laborbedingungen (z. B. in einer schall‐ isolierten Kammer) erhoben wurde, wird auch manchmal als laborphonetisch bezeichnet. In der Forschungspraxis bietet es sich oft an, im Labor und in natür‐ lichem Umfeld erhobene Daten miteinander zu kombinieren und das Korpus so anzulegen, dass beispielsweise gelesene Daten die (semi-)spontansprachlichen ergänzen können, wenn letztere keine oder nicht hinreichend viele Belege für ein bestimmtes Phänomen liefern. Grundsätzlich kann auch auf bereits bestehende Korpora zurückgegriffen werden; der Bestand des Hamburger Zen‐ trums für Sprachkorpora (https: / / www.fdr.uni-hamburg.de/ communities/ hzsk/ ) umfasst auch spanische Sprachdaten, die auf Antrag genutzt werden können. Will man schließlich die diachrone Entwicklung der Intonation untersuchen, ist man darauf angewiesen, verfügbare Daten aus älteren Sprachzuständen (z. B. 258 4 Prosodie <?page no="259"?> 86 Dieser Ton wird bei Hualde (2002, 2005) abweichend von der hier verwendeten Notation als LH* notiert. alte Interviews, historische Aufnahmen politischer Reden etc.) zugrundezulegen, mit vergleichbarem zeitgenössischen Sprachmaterial zu kontrastieren und Un‐ terschiede und Gemeinsamkeiten herauszuarbeiten (vgl. Pešková et al. 2012b als Beispiel für eine solche diachrone Studie). Da diese Methode nur für den begrenzten Zeitraum seit dem Aufkommen der Tonaufzeichnung anwendbar ist, muss man für frühere Jahrhunderte auf das in der diachronen Linguistik übliche Verfahren der Rekonstruktion zurückgreifen. So hat z. B. Hualde (2003b, 2004) die Intonationssysteme heutiger romanischer Sprachen verglichen und auf dieser Basis den Versuch unternommen, die protoromanische Intonation zu rekonstruieren. 4.5.4.1 Madrid (Kastilisch) Die kastilische Intonation ist dadurch gekennzeichnet, dass Pränuklearakzente im Normalfall mit einem späten Tonhöhengipfel realisiert werden (L+>H*), der Nukle‐ arakzent hingegen als Tiefton L* (Estebas-Vilaplana & Prieto 2010: 19). In Verbindung mit dem schließenden Grenzton ergibt sich hieraus für neutrale Aussagesätze wie Bebe una limonada (als Antwort auf eine Frage wie ¿Qué hace la mujer en la foto? ) die Nuklearkonfiguration L* L%. Hualde (2002, 2005: 257) hat für diesen Satztyp gezeigt, dass der Nuklearakzent auch steigend mit frühem F 0 -Gipfel realisiert werden kann (L+H*) 86 , woraus sich als Nuklearkonfiguration L+H* L% ergibt (vgl. auch Hualde & Prieto 2015: 364f.). Diese wiederum tritt nach Estebas-Vilaplana & Prieto (2010: 24, 44) vorwiegend dann auf, wenn der am rechten Rand der IP platzierte Satzteil korrigierend hervorgehoben wird wie in No, quiero limones (als Replik auf eine Äußerung wie Me pidió un par de naranjas, ¿no? ). Man spricht hier auch von kontrastiver Fokussierung (vgl. 4.5.5). Wie bereits in Abschnitt 4.5.1 gesagt, zeichnen sich kastilische Ja/ Nein-Fragen wie ¿Tienen mandarinas? durch eine steigende Schlusskontur aus. Da es sich um einen starken F 0 -Anstieg handelt, setzen Estebas-Vilaplana & Prieto (2010) den Grenzton HH% an; als Nuklearkonfiguration ergibt sich also L* HH%. Bei Wh-Fragen des Typs ¿Qué hora es? sind zwei unterschiedliche Schlusskonturen möglich, wobei die Nuklearkonfiguration entweder der einer Ja/ Nein-Frage gleicht (L* HH%) oder mit der eines neutralen Aussagesatzes identisch ist (L* L%), vgl. Abb. 4.5-17. 4.5 Intonation 259 <?page no="260"?> Abb. 4.5-17: Oben: Wh-Frage ¿Qué hora es? mit fallender Nuklearkonfiguration L* L%. Unten: Dieselbe Struktur mit der Nuklearkonfiguration L* HH% (Estabas-Vilaplana & Prieto 2010: 36). Dass die ansonsten den interrogativen Satzmodus markierende steigende Kontur bei Wh-Fragen nicht zwingend erforderlich ist, lässt sich insofern nachvollziehen, als derartige Sätze durch das Frage- oder Wh-Wort bereits eindeutig als Fragesätze 260 4 Prosodie <?page no="261"?> 87 Allerdings wird der zugrundeliegende Ton / L+H*/ phonetisch als [L+>H*] realisiert, wenn er einer mit Hmarkierten ip-Grenze vorangeht (vgl. Abb. 4.5-15 in 4.5.3.2). erkennbar sind; die tonale Markierung erfolgt somit zusätzlich und ist optional. Wird die Schlusskontur einer Wh-Frage als L* L% realisiert, unterscheidet sich ihre Gesamtkontur dennoch deutlich von der eines Aussagesatzes, und zwar insofern als die metrisch starke Silbe des Wh-Wortes (in diesem Fall das einsilbige qué) nicht mit dem (ansonsten in pränuklearer Position üblichen) steigenden Tonhöhenakzent L+>H* assoziiert, sondern mit einem Hochton H*. Hier zeigt sich auch, dass das Bestimmen der Nuklearkonfiguration nicht ausreichend ist, um die Intonation verschiedener Satztypen in ihrer Gänze erfassen zu können. 4.5.4.2 Buenos Aires (Porteño-Spanisch) Das in der argentinischen Hauptstadt Buenos Aires und mittlerweile in den meis‐ ten Teilen des Landes als Standardvarietät gesprochene Spanisch wird auch als Porteño-Spanisch bezeichnet (abgeleitet von puerto ‘Hafen’ (von Buenos Aires)). Die Prosodie dieser Varietät ist maßgeblich durch den migrationsbedingten Kontakt mit italoromanischen Varietäten geprägt, die im Gegensatz zum in 4.5.4.1 beschriebenen kastilischen Spanisch bei den Pränuklearakzenten keine nach rechts verschobenen (L+>H*) Tonhöhengipfel aufweisen. Die Gipfel der Pränuklearakzente werden viel‐ mehr im zeitlichen Rahmen der betonten Silbe realisiert (L+H*; vgl. Gili Fivela et al. 2015). Diese Alignierungseigenschaft der italoromanischen Varietäten wurde von den zahlreichen Arbeitssuchenden, die ab den 1830er Jahren aus unterschiedlichen Gegenden Italiens nach Argentinien eingewandert sind, beim Erlernen des Spanischen aus ihren jeweiligen L1-Varietäten in die Zielsprache übertragen (Gabriel & Kireva 2012, 2014). Mittlerweile zählt die frühe Alignierung des Tonhöhengipfels beim Prä‐ nuklearakzent zur argentinischen Standardaussprache (L+H*; vgl. Abb. 4.5-15, Gabriel et al. 2010: 289 sowie 5.1.7). 87 Der Nuklearakzent hingegen wird − wie im kastilischen Spanisch − im Normalfall als Tiefton L* realisiert; daneben tritt als fakultative Variante der fallende Tonhöhenakzent H+L* auf. Hieraus ergibt sich für den neutralen Aussa‐ gesatz die Nuklearkonfiguration L* L% bzw. H+L* L%. Auch hier wird deutlich, dass der Unterschied zum kastilischen Dialekt nicht allein in der Schlusskontur begründet ist, sondern dass das der Nuklearkonfiguration vorausgehende Material − hier: die Form der Pränuklearakzente − mit einbezogen werden muss. Eine weitere Besonderheit der porteño-spanischen Intonation zeigt sich, wenn man Aussagesätze mit kontrastiv hervorgehobenen Satzteilen mit einbezieht. In 4.5.4.1 haben wir für das kastilische Spanisch gesehen, dass bei kontrastivem Fokus der Nuklearakzent nicht als Tiefton L*, sondern als steigender Tonhöhenakzent L+H* realisiert wird. Im Porteño-Spanischen wird der F 0 -Gipfel bei kontrastiver Fokussierung nicht erst am rechten Rand der metrisch starken Silbe, sondern schon ungefähr in deren Mitte erreicht. Danach fällt die Kontur wieder steil ab und gelangt am rechten Rand der Tonsilbe erneut auf das 4.5 Intonation 261 <?page no="262"?> Ausgangsniveau. Um eine solche Kontur mit zwei elbows zu erfassen (vgl. 4.5.3.2), müssen drei tonale Zielpunkte angenommen werden; dementsprechend wurde hierfür ein tritonaler Tonhöhenakzent L+H*+L eingeführt (Gabriel et al. 2010, Feldhausen et al. 2011a, Gabriel 2014, Gabriel & Kireva 2014). Die steigend-fallende Kontur dieses Tons, der außer in kontrastiven Kontexten auch in exklamativen Ausdrücken und generell in emphatischer Sprache auftritt (z. B. als Nuklearakzent in begeisterten Ausrufen wie ¡Qué ricas medialunas! ), ist in Abb. 4.5-18 (oben) sehr schön sichtbar. Auch die tonale Gestaltung des neutralen Fragesatzes unterscheidet sich deutlich vom kastilischen Spanisch: Anstelle einer steigenden Schlusskontur finden wir hier eine fallende Nuklearkonfiguration, bestehend aus einem heraufgestuften Nuklearak‐ zent L+¡H* und dem komplexen Grenzton HL%. Die entsprechende Kontur wird im Beispielsatz ¿Tiene mandarinas? deutlich, die wir in Abb. 4.4-8 und 4.4-9 zur Illustration der Rhythmusanalyse verwendet haben. Ein Blick auf die F 0 -Kontur der Frage ¿Es la una? (Abb. 4.5-18, unten) zeigt, dass der F 0 -Gipfel des Nuklearakzents sogar ein höheres Niveau erreichen kann als der des vorausgehenden Pränuklearakzents: Dies entspricht nicht der regulären Deklination (Abfall der Grundfrequenz, vgl. 4.5.1); der Nuklearakzent muss also als heraufgestuft (upstepped) gelten. Der schließende Grenz‐ ton wird als komplexer Ton HL% analysiert, da die Tonkontur nach dem Erreichen des F 0 -Maximums des Nuklearakzents nicht gleich wieder abfällt (in dem Fall würde ein monotonaler Grenzton L% und damit ein einziger tonaler Zielpunkt ausreichen); vor dem Tonhöhenabfall zum rechten Rand der IP hin ergibt sich hier ein kurzes hohes Plateau. 262 4 Prosodie <?page no="263"?> Abb. 4.5-18: Oben: Korrigierende Aussage No. ¡Naranjas! ‘Nein. Orangen! ’ (als Replik auf Me pidió un par de limones ¿no? ‘Sie haben mich um ein paar Zitronen gebeten, nicht wahr? ’) mit der Nuklearkonfiguration L+H*+L L%. Unten: Echo-Fragesatz ¿Es la una? ‘Es ist (wirklich) ein Uhr? ’ mit der Nuklearkonfiguration L+¡H* HL% (Gabriel et al. 2010: 293, 297). 4.5 Intonation 263 <?page no="264"?> Bei den Wh-Fragen unterscheidet sich das Porteño-Spanische nicht nennenswert von der kastilischen Varietät: Auch hier liegt die Nuklearkonfiguration L* L% vor; das Wh-Wort wird ebenfalls durch einen Hochton H* markiert (Gabriel et al. 2010: 303f.). 4.5.4.3 Mexiko-Stadt Das in Mexiko-Stadt gesprochene Spanisch unterscheidet sich in Bezug auf die Alignierungseigenschaften pränuklearer Tonhöhenakzente nicht vom kastilischen Dia‐ lekt, insofern als auch hier im Regelfall ein nach rechts verschobener F 0 -Gipfel auftritt (L+>H*). In neutralen Aussagesätzen wird der Nuklearakzent im Normalfall als Tiefton L* realisiert und alternativ hierzu als steigender Ton L+H*, woraus sich die Nuklearkonfiguration L* L% bzw. L+H* L% ergibt (De-la-Mota et al. 2010: 325). Als ein typisches Kennzeichen mexikanischer Intonation kann die sog. Zirkumflexkontur gelten, eine steigend-fallende Nuklearkonfiguration, die abweichend von anderen spanischen Varietäten nicht nur in pragmatisch markierten Kontexten (z. B. bei kon‐ trastiver Hervorhebung des letzten Satzgliedes, vgl. für das kastilische Spanisch 4.5.4.1), sondern auch in neutralen Aussagesätzen auftritt (Hualde 2005: 266f., De-la-Mota et al. 2010: 324ff.). Abhängig davon, ob der Nuklearakzent das F 0 -Niveau des vorausgehenden Gipfels erreicht bzw. gar übersteigt oder ob die reguläre Deklination eintritt, wird die Nuklearkonfiguration als L+¡H* L% oder L+H* L% analysiert. Die Intonation neutraler Fragesätze ähnelt dem Muster des kastilischen Spanisch insofern, als es auch hier zu einem finalen F 0 -Anstieg kommt, jedoch ist dieser weniger steil und erfolgt auch etwas später, nach einem kurzen tiefen Plateau. Dieser späte Anstieg der Schlusskontur lässt sich durch den komplexen Grenzton LH% wiederge‐ ben (Abb. 4.5-19, oben). In Wh-Fragen wird, ebenfalls wie in den beiden bereits besprochenen Varietäten, das Fragewort durch einen Hochton H* hervorgehoben. Die Gesamtkontur unterscheidet sich jedoch von der des kastilischen und argentinischen Spanisch insofern, als auch hier die oben genannte Zirkumflexkontur auftreten kann. Diese ist in Abb. 4.5-19 (unten) sehr gut sichtbar. 264 4 Prosodie <?page no="265"?> Abb. 4.5-19: Oben: Ja/ Nein-Frage ¿Tiene mermelada? mit der Nuklearkonfiguration L* LH%. Unten: Wh-Frage ¿Y tú de qué pueblo vienes? mit der Nuklearkonfiguration L+H* HL% (Zirkumflexkontur; De-la-Mota et al. 2010: 330, 336). In Abb. 4.5-20 stellen wir abschließend die F 0 -Konturen eines neutralen Deklarativsat‐ zes in den drei behandelten Varietäten einander gegenüber. 4.5 Intonation 265 <?page no="266"?> Abb. 4.5-20: Schematische Darstellung der F 0 -Konturen des neutralen Deklarativsatzes Las niñas comieron peras in den Varietäten von Madrid, Buenos Aires und Mexiko-Stadt. 4.5.5 Schnittstellenphänomene: Prosodische Phrasierung, Informationsstruktur und Diskurs Im Folgenden beschäftigen wir uns mit Aspekten der Intonation, die sich nur erfassen lassen, wenn man neben der phonologischen weitere sprachliche Ebenen, wie etwa die syntaktische Struktur oder die Informationsverteilung im Satz bzw. im Diskurs, mit einbezieht. Aufgrund dieser Interaktion einzelner Teilbereiche des sprachlichen Wissens spricht man hier auch von sog. Schnittstellen (engl. interface, sp. interfaz) zwischen Phonologie und Syntax bzw. zwischen Phonologie und Informationsstruktur (vgl. Dufter & Gabriel 2016). Bevor wir dies im Einzelnen darstellen, machen wir uns mit den wichtigsten Grundbegriffen der Informationsstruktur vertraut. Unter Informationsstruktur (engl. information structure, sp. estructura infor‐ mativa oder informacional) versteht man die Verteilung von alter und neuer Information in einem Satz bzw. in einer größeren Einheit des Diskurses. Eine systematische Auseinandersetzung mit diesem Aspekt begann im ersten Drittel des 20. Jahrhunderts im Prager Strukturalismus, der den Terminus der Funktionalen Satzperspektive geprägt hat. Im Rahmen des sog. Dreiebenenmodells wird hier neben der syntaktischen und der semantischen Beschreibungsebene eine informa‐ tionsstrukturelle Ebene angenommen (vgl. Daneš et al. 1974). Zum Erfassen der informationsstrukturellen Gliederung von Sätzen wurden in der Literatur mehrere Dichotomien (Gegensatzpaare) vorgeschlagen. Nach der Prager Schule ist die Informationsstruktur eines Satzes durch den Kontrast zwischen alter, gegebener Information, dem sog. Thema (sp. tema), und der im Kontext neuen Information, dem sog. Rhema (sp. rema), charakterisiert. Vgl. hierzu den zweiten 266 4 Prosodie <?page no="267"?> Satz im folgenden Beispiel, wo La reina das Thema darstellt, das durch rhematische Information (tenía una hija) ergänzt wird. Érase una vez una reina. [ Thema La reina] [ Rhema tenía una hija.] ‘Es war einmal eine Königin. Die Königin hatte eine Tochter.’ Dem nordamerikanischen Strukturalismus entstammt das Begriffspaar Topic (sp. tópico) und Comment (sp. comentario). Unter Topic ist nach Hockett (1958: 201) der Gegenstand einer Aussage zu verstehen, der den betreffenden Satz inhaltlich an den vorherigen Diskurs anbindet (“what the sentence is about”) und der dann durch weitere Informationen ergänzt bzw. kommentiert wird. Ist das Topic durch besondere syntaktische Konstruktionen als solches markiert, spricht man von Topikalisierung. Ein in vielen Sprachen, u. a. im Spanischen, häufiges Topikalisierungsverfahren ist die sog. Linksversetzung (auch: Linksdislokation, sp. dislocación a la izquierda) von einzelnen Satzgliedern und deren Wiederaufnahme durch entsprechende Pronomina im Kernsatz; vgl. die Beispiele in Abb. 4.5-21. In der neueren Forschung, v. a. in generativ ausgerichteten Arbeiten, wird die Informationsstruktur von Sätzen meist mithilfe der Dichotomie Hintergrund (H) vs. Fokus (F; engl. background vs. focus, sp. fondo vs. foco) als Fokus-Hintergrund-Glie‐ derung (FHG) beschrieben. Dabei bilden die (mutmaßlich) gemeinsamen Annahmen von Sprecher und Hörer zum Zeitpunkt der Äußerung (auch: Präsupposition, engl. presupposition, sp. presuposición) den Hintergrund, von dem sich der Fokus als neue Information abhebt z. B. wie im Satz [ H María] [ F come mandarinas] ‘Maria isst Man‐ darinen’ (als Antwort auf ¿Qué hace María? ‘Was macht Maria? ’). Man spricht hier auch von neutralem oder Informationsfokus. Wird nicht nur neue Information transportiert, sondern zugleich eine (mutmaßlich) falsche Information korrigiert, spricht man von kontrastivem Fokus (KF), z. B. wie in Come [ KF mandarinas] ‘Sie isst Mandarinen’ (als Korrektur zu María come manzanas ¿verdad? ‘Maria isst Äpfel, nicht wahr? ’). Weiterhin unterscheidet man zwischen engem Fokus, der nur ein Satzglied umfasst wie in ¿Qué come María? María come [ F mandarinas], und weitem Fokus, der sich über mehrere Konstituenten erstreckt, z. B. ¿Qué hace María? María [ F come mandarinas y toma agua con gas] ‘Maria isst Mandarinen und trinkt Wasser mit Kohlensäure’. Wenn der gesamte Satz für den Hörer neue Information vermittelt, z. B. bei einer Antwort auf die Frage ¿Qué pasa? ‘Was passiert? ’, spricht man auch von neutralen Sätzen bzw. von gesamtfokaler Lesart oder Satzfokus. Die drei Dichotomien Thema vs. Rhema, Topic vs. Comment und Hintergrund vs. Fokus überschneiden sich inhaltlich teilweise; sie sind jedoch nicht vollkommen austauschbar. Will man komplexere Sätze informationsstrukturell erfassen, kommt man in der Regel nicht mit einem der drei Gegensatzpaare aus. In der neueren Forschung werden, wie in den Beispielen in Abb. 4.5-21 gezeigt, deshalb die beiden letztgenannten Dichotomien meist miteinander kombiniert. 4.5 Intonation 267 <?page no="268"?> 88 In Null-Subjekt-Sprachen (vgl. Gabriel & Meisenburg 4 2021: 43ff., 231f.) kann das Subjekt unausge‐ drückt bleiben, wenn es aus dem Kontext ersichtlich ist. Subjektpronomina werden in der Regel nur verwendet, um einen Kontrast auszudrücken wie z. B. in Juan i y María j toman la merienda. Él i toma café, ella j toma mate cocido ‘Juan und Maria nehmen einen Imbiss zu sich. Er trinkt einen Kaffee, sie trinkt Matetee’. Kontext: ¿Qué compra María en el kiosco? [María, [en el kiosco [compra [ F el peRIÓdico]]]] Topic 1 Topic 2 Comment Hintergrund Fokus - Kontext: ¿Dónde compra María el periódico? [María, [el periódico, [lo compra [ F en el KIOSco]]]] Topic 1 Topic 2 Comment Hintergrund Fokus Abb. 4.5-21: Informationsstrukturelle Gliederung zweier komplexer Sätze gemäß den Dichotomien Topic vs. Comment und Hintergrund vs. Fokus. Im ersten Beispielsatz in Abb. 4.5-21 drückt der Kernsatz compra el periódico ‘sie kauft die Zeitung’ einen Kommentar zu den durch Linksdislokation als Topics markierten Satzgliedern María und en el kiosco ‘am Kiosk’ aus, die jeweils bekannte Information aus dem sprachlichen Kontext aufgreifen. Der Kernsatz selbst ist wiederum zweigeteilt, insofern als die (bereits bekannte) Hintergrundinformation compra mit der neuen Information (Fokus) des Objekts [ F el periódico] kontrastiert. Gleiches gilt für den zwei‐ ten Beispielsatz: Auch hier werden zwei linksversetzte Topics durch einen Comment ergänzt, der in Hintergrund und Fokus aufgeteilt ist. Wir haben bereits gesagt, dass die Topikalisierungsstrategie der Linksdislokation dadurch gekennzeichnet ist, dass die linksversetzten Satzglieder pronominal wiederaufgenommen werden. Ein Beispiel hierfür ist das klitische Objektpronomen lo, das das linksdislozierte (topikalisierte) Objekt el periódico aufgreift. Da das Spanische eine sog. Null-Subjekt-Sprache 88 ist und auch keine Elemente aufweist, die präpositional eingeleitete Konstituenten wie z. B. Ortsangaben ersetzen können, erscheint im Kernsatz lo compra en el kiosco kein weiteres pronominales Element. Im Französischen wäre dies anders: Hier würde ein topikalisiertes Subjekt durch ein klitisches Pronomen und eine Ortsangabe durch das klitische Pronominaladverb y aufgenommen, z. B. Marie i , au marché j , elle i y j achète des pommes ‘Marie, auf dem Markt, die kauft da Äpfel’ (die tiefgestellten Buchstaben geben den Bezug an). Im Folgenden betrachten wir zunächst die prosodische Phrasierung in neutralen Sätzen (4.5.5.1), bevor wir uns mit dem Zusammenhang von Fokus-Hintergrund-Glie‐ 268 4 Prosodie <?page no="269"?> derung und Intonation in syntaktisch einfachen Sätzen (4.5.5.2) und dem Wechselspiel zwischen Informationsstruktur und Syntax befassen (4.5.5.3). In einem weiteren Schritt gehen wir exemplarisch auf die Intonation syntaktisch komplexer Sätze und auf tonale Signale der Diskursgliederung ein (4.5.5.4). 4.5.5.1 Prosodische Phrasierung in neutralen Sätzen In 4.5.3.1 haben wir mit der Intermediärphrase (ip) eine von der Intonationsphrase (IP) dominierte Ebene der Prosodischen Hierarchie eingeführt, die der Unterteilung in kleinere prosodische Einheiten dient. Wie D’Imperio et al. (2005) und Frota et al. (2007) in sprachvergleichenden Studien zur Phrasierung informationsstrukturell neutraler Sätze in verschiedenen romanischen Sprachen gezeigt haben, wird die Einteilung einer IP in mehrere Intermediärphrasen durch verschiedene Faktoren bestimmt. Zu nennen ist hierbei insbesondere das prosodische und syntaktische ‘Gewicht’ der einzelnen Satzglieder: So lässt sich über die Sprachen hinweg eine Tendenz zum Abtrennen von Konstituenten beobachten, die lang und damit prosodisch ‘schwer’ sind, z. B. wenn das Subjekt aus Vor- und Nachnamen besteht wie Verónica Diego Solana (im Gegensatz zu einfach María). Gleiches gilt für syntaktisch komplexe Konstituenten wie z. B. un gajo de mandarina ‘ein Stück Mandarine’ (Nominalphrase mit spezifizierendem Präpositionaladjunkt), un libro increíblemente interesante ‘ein unglaublich interessantes Buch’ (Nominalphrase mit spezifizierender Adjektivphrase) oder el libro que compraste ayer ‘das Buch, das du gestern gekauft hast’ (Nominalphrase mit Relativsatz). Das bereits in Abb. 4.5-15 (Abschnitt 4.5.3.2) analysierte Beispiel weist eine solche ip-Grenze auf, die mit einem hohen intermediären Grenzton (H-) markiert wird (vgl. Abb. 4.5-22), was sich z. B. unter Rückgriff auf die syntaktische Komplexität des Objekts und damit als ein Effekt der Interaktion von Phonologie und Syntax erklären lässt. Abb. 4.5-22: Prosodische Phrasierung des Satzes Está agarrando un gajo de mandarina. Eine ip-Grenze kann sich in unterschiedlicher Weise tonal manifestieren. Die Kontur in Abb. 4.5-15 weist einen kontinuierlichen F 0 -Anstieg vom letzten Tonhöhenakzent bis zur Phrasengrenze auf, den man in der englischen Terminologie als continuation rise (CR, sp. tono continuativo) bezeichnet (Label: H-). Im kastilischen Spanisch werden nach Frota et al. (2007: 153) knapp 90 % der ip-Grenzen in neutralen Aussagesätzen als ein solcher Anstieg realisiert; in den restlichen Fällen tritt ein sog. sustained pitch (SP, sp. tono sostenido) auf, der sich phonetisch als ein gleichbleibend hohes F 0 -Plateau manifestiert. In anderen Sprachen wie etwa dem Italienischen treten CR und SP ungefähr gleich häufig auf. Wichtig ist, dass durch das Einfügen einer ip-Grenze 4.5 Intonation 269 <?page no="270"?> 89 Weitere Grenzsignale werden, mit besonderer Berücksichtigung des argentinischen Spanisch, in Gabriel et al. (2011) diskutiert. die reguläre Deklination (vgl. 4.5.1 und Abb. 4.5-4) unterbrochen wird. Da in den von D’Imperio et al. (2005) und Frota et al. (2007) untersuchten neutralen Sätzen kein pragmatischer Unterschied zwischen CR und SP zu verzeichnen ist, kann man annehmen, dass es sich hierbei um freie Oberflächenvariation handelt. Hier kann also ein phonologisch zugrundeliegender ip-Grenzton / H-/ angesetzt werden, der entweder als CR [H-] oder − sozusagen in ‘herabgestufter’ Form − als SP [! H-] realisiert wird. In Abb. 4.5-23 stellen wir diese auch in anderen Varietäten des Spanischen häufig auftretenden Grenzsignale schematisch dar. 89 Für den letzten Tonhöhenakzent vor der ip-Grenze wird entsprechend dem Toninventar des kastilischen Spanisch / L+>H*/ als zugrundeliegend angesetzt. Abb. 4.5-23: Schematische Darstellung einer ip-Grenze (zugrundeliegend / H-/ ) mit phonetischer Rea‐ lisierung als continuation rise ([H-], links) bzw. sustained pitch ([! H-], rechts). Die metrisch starke Silbe vor der Grenze ist hellgrau, die Tonschicht dunkelgrau hervorgehoben. Zusätzlich zur tonalen Markierung tritt vor prosodischen Grenzen meist auch eine Längung ein, die die letzte Silbe, das gesamte letzte Wort oder auch die letzte metrisch starke Silbe vor der Grenze betreffen kann. Dieser in der englischen Terminologie als pre-boundary lengthening (PBL, sp. alargamiento pre-frontera) bezeichnete Effekt hat bei systematischem Auftreten einen Einfluss auf den Sprachrhythmus (vgl. 4.4.1), da sich hierdurch sowohl der vokalische Gesamtanteil (%V) als auch der Wert für die Variabilität vokalischer Intervalle (VarcoV) erhöht (vgl. 4.4.2). Nach Frota et al. (2007: 135) tritt PBL im Italienischen und im Katalanischen zu 100 % auf, im kastilischen Spanisch hingegen nur zu ca. 40 %. Für die kastilische Varietät lässt sich festhalten, dass neutrale Deklarativsätze in der Regel auch dann eine ip-Grenze nach dem Subjekt aufweisen, wenn das oben besprochene Kriterium der (prosodischen oder syntaktischen) Schwere nicht gegeben ist: Auch einfache neutrale Aussagesätze wie Las niñas comieron peras werden hier normalerweise als ((S)(VO)) phrasiert, während etwa im Italienischen oder im Europäischen Portugiesisch meist keine entsprechende ip-Grenze vorliegt und damit das Phrasierungsmuster (SVO) vorherrschend ist (vgl. Frota et al. 2007). Für das 270 4 Prosodie <?page no="271"?> 90 Übereinzelsprachlich kann man beobachten, dass der Fokus in irgendeiner Weise ‘prominenter’, also sprachlich auffälliger ist als der Hintergrund. Dies lässt sich in der ursprünglich von Chomsky (1971) formulierten Fokusprominenzregel (FPR) zusammenfassen. Entsprechend muss der Nuklearakzent als die am stärksten wahrgenommene Akzentstelle (vgl. 4.5.2.1 und 4.5.3.1) mit dem fokussierten Element einhergehen. Für eine experimentelle Überprüfung der FPR aus der Sicht der Perzeption anhand von argentinischen Sprachdaten vgl. Gabriel & Heidinger (2022). Porteño-Spanische haben Gabriel et al. (2011) gezeigt, dass es in Bezug auf das vorherrschende Phrasierungsmuster dem kastilischen Spanisch entspricht. Bei der phonetischen Realisierung wird zu ungefähr gleichen Teilen CR und SP verwendet, worin sich italienischer Einfluss zeigen könnte. 4.5.5.2 Intonation und Fokus-Hintergrund-Gliederung Weiterhin ist die prosodische Phrasierung eines Satzes durch dessen informations‐ strukturelle Gliederung bestimmt. Wir betrachten dieses Schnittstellenphänomen im Folgenden exemplarisch anhand der Interaktion von Fokus-Hintergrund-Gliederung und Intonation. In 4.5.4.1 und 4.5.4.2 haben wir anhand des Spanischen von Madrid und Buenos Aires gesehen, dass sich Deklarativsätze mit finalem kontrastivem Fokus dadurch auszeich‐ nen, dass der Nuklearakzent durch einen anderen Tonhöhenakzent realisiert wird, als es normalerweise in neutralen Sätzen (und auch bei finalem Informationsfokus) der Fall ist. Wir fassen dies in Abb. 4.5-24 tabellarisch zusammen. - Nuklearkonfiguration Madrid Buenos Aires ¿Qué pasó? [ F Las niñas comieron las PEras]. L* L-L% L* L-L% ¿Qué comieron las niñas? Las niñas comieron [ F las PEras]. L* L-L% L* L-L% Las niñas comieron las manzanas ¿verdad? (No.) Las niñas comieron [ KF las PEras]. L+H* L-L% L+H*+L L-L% Abb. 4.5-24: Nuklearkonfiguration im neutralen Deklarativsatz sowie bei neutralem und kontrastiv fokussiertem Objekt in finaler Position. Wird ein Element fokussiert, das sich typischerweise am Anfang des Satzes befindet wie das Subjekt in ¿Quién le dio el diario a su hermano? [ F María] le dio el diario a su hermano (‘Wer gibt seinem Bruder die Zeitung? Maria gibt ihrem Bruder die Zeitung’), verschiebt sich der Nuklearakzent an den linken Satzrand. 90 Danach erfolgt in der Regel ein steiler F 0 -Abfall mit einer anschließenden flachen Kontur bis zum Ende der IP. Dies lässt sich analysieren, indem man unmittelbar nach dem fokussierten Subjekt einen ip-Grenzton Lansetzt; zwischen diesem und der (ebenfalls tiefen) 4.5 Intonation 271 <?page no="272"?> Nuklearkonfiguration L* L-L% ergibt sich durch Interpolation ein tiefes Plateau. Dabei werden die Tonhöhenakzente im Bereich des Hintergrunds auf der phonetischen Oberfläche reduziert oder gar ganz getilgt. Man spricht hier auch von postfokaler Deakzentuierung. Dies gilt unabhängig davon, ob es sich beim fokussierten Subjekt um (neutralen) Informationsfokus oder um kontrastive Fokussierung handelt. Abb. 4.5-25 zeigt die F 0 -Kontur eines SVO-Satzes mit kontrastiv fokussiertem Subjekt. Abb. 4.5-25: F 0 -Kontur des Deklarativsatzes [ KF María] le dio el diario a su hermano ‘Maria hat die Zeitung ihrem Bruder gegeben’ mit satzinitial kontrastiv fokussiertem Subjekt und postfokaler Deakzentuierung (kastilisches Spanisch). Betrachten wir nun nochmals die ersten beiden Beispiele aus Abb. 4.5-24: Weder die Satzstellung (SVO) noch die Nuklearkonfiguration (L* L-L%) geben Auskunft darüber, ob es sich bei Las niñas comieron las PEras ‘Die Mädchen haben die Birnen gegessen’ um einen Satz mit gesamtfokaler Lesart (Tabellenzeile 1) oder um eine Konstruktion mit neutral fokussiertem Objekt handelt (Zeile 2). Dennoch ist es möglich, den Unterschied zwischen diesen beiden Lesarten tonal zu markieren, und zwar durch Einfügen einer hohen ip-Grenze (H-) an der informationsstrukturellen Grenze zwischen Hintergrund und Fokus, im konkreten Fall unmittelbar vor dem fokussierten Objekt (vgl. Hualde 2005). Dieses ‘Hochziehen’ der F 0 -Kontur bewirkt einen Spannungsaufbau über die präsupponierte Information (Hintergrund) hinweg bis zum Beginn der neuen Informa‐ tion (Fokus). Empirische Studien haben jedoch gezeigt, dass die tonale Markierung der Fokusdomäne nicht von allen Sprechern und auch nicht von ein und demselben Sprecher durchgehend vorgenommen wird (Gabriel 2007, Pešková et al. 2012a). Es handelt sich also um einen fakultativen Effekt, den wir in Abb. 4.5-26 schematisch darstellen. 272 4 Prosodie <?page no="273"?> 91 Einen Überblick zu den prosodischen und syntaktischen Fokussierungsstrategien geben Dufter & Gabriel (2016). 92 In der generativ-syntaktischen Literatur (z. B. Zubizarreta 1998, Ordóñez 2000) wurde vielfach be‐ hauptet, dies sei nur bei kontrastivem Fokus möglich − eine Auffassung, die der Überprüfung anhand von empirischen Daten nicht standhält. Wir wollen diese Diskussion hier nicht weiterverfolgen und verweisen auf Gabriel (2007, 2010), Hoot (2016), Uth (2016) und Leal et al. (2018). Abb. 4.5-26: Schematische Darstellung der F 0 -Kontur des Deklarativsatzes Las niñas comieron [ F las peras] mit neutral fokussiertem Objekt als Antwort auf ¿Qué comieron las niñas? (Buenos-Aires-Spa‐ nisch). In gleicher Weise kann die Fokusdomäne markiert werden, wenn sie sich über die Verbalphrase erstreckt (weiter Fokus), so etwa in der Lesart Las niñas [ F comieron las peras] (als Antwort auf ¿Qué hicieron las niñas? ) durch Einfügen von Hnach dem Subjekt. 4.5.5.3 Fokus, Wortstellung und Intonation Im letzten Abschnitt haben wir uns damit befasst, wie die FHG bei gleichbleibender Wortstellung durch tonale Mittel (besondere Tonhöhenakzente für Kontrastfokus, Verlagerung des Nuklearakzents an den linken Satzrand, Intermediärphrasierung) ausgedrückt werden kann. Im Folgenden wenden wir uns mit der Interaktion von Wortstellung und Intonation einem weiteren phonosyntaktischen Schnittstellenphä‐ nomen zu und betrachten hierzu exemplarisch Sätze mit transitivem Verb und (neu‐ tral) fokussiertem Subjekt. 91 In 4.5.5.2 haben wir gezeigt, dass ein Subjekt in seiner satzinitialen Basisposition durch Verlagerung des Nuklearakzents und postfokale Deakzentuierung als Fokus gekennzeichnet werden kann (vgl. Abb. 4.5-25). Neben dieser tonalen Fokussierungsstrategie, deren Resultat eine prosodisch markierte Struktur mit nicht-finalem Nuklearakzent ist (Beispiele a und b in Abb. 4.5-27), 92 lässt sich im Spanischen die Wortstellung so abändern, dass das fokussierte (und durch den Nuklearakzent hervorgehobene) Element am Schluss des Satzes auftritt. Resultat dieser syntaktischen Strategie ist eine prosodisch unmarkierte Struktur mit dem Nuklearakzent am rechten Rand der Intonationsphrase (Beispiele c und d in Abb. 4.5-27). 4.5 Intonation 273 <?page no="274"?> ¿Quién comió la manzana? (a) [ F MaRÍa] comió la manzana. [ F S]VO (b) [ F MaRÍa] la comió. [ F S]Cl+V (c) Comió la manzana [ F MaRÍa]. VO[ F S] (d) La comió [ F MaRÍa]. Cl+V[ F S] Abb. 4.5-27: Prosodische und syntaktische Fokussierungsstrategien im Spanischen. Empirische Arbeiten zur Fokusmarkierung im Spanischen haben gezeigt, dass die rein prosodische Strategie varietätenübergreifend bevorzugt wird, wenn das Objekt eine volle Nominalphrase ist ([ F S]VO, Abb. 4.5-27a), während die Sprecher zur Verwendung der syntaktischen Strategie tendieren, wenn das Objekt als Klitikon (Cl, hier: la comió) am Verb realisiert wird (Cl+V[ F S], Abb. 4.5-27d). Die Variante VO[ F S] (Abb. 4.5-27c) wird von den Sprechern zwar in der Regel als möglich akzeptiert, aber nur selten produziert (vgl. Gabriel 2007, 2010). Als Beispiel nennen wir hier die Verteilung der in Gabriel (2010: 202) analysierten Produktionsdaten von 25 Sprechern aus Buenos Aires: Während 95 % der Sätze mit voller Objekt-Nominalphrase dem Typus [ F S]VO entsprechen (tonale Markierung), wählen nur 5 % der Probanden die syntaktische Fokussierungsstrategie VO[ F S]. In Sätzen mit klitisch realisiertem Objekt ist das Bild umgekehrt: Nur in 27 % der Fälle befindet sich das Subjekt am Satzanfang, also [ F S]Cl+V, während in 73 % das fokussierte Subjekt in Endstellung auftritt (Cl+V[ F S]). Offensichtlich nehmen die Sprecher eine prosodisch markierte F 0 -Kontur (initialer Nuklearakzent, ip-Grenzton nach dem Fokus, postfokale Deakzentuierung; vgl. Abb. 4.5-25) in Kauf, um den syntaktischen ‘Mehraufwand’ der Umstellung des Subjekts zu vermeiden. Wird das Objekt jedoch als nicht akzentogenes, mit dem Verb verbundenes Element und nicht als volle Nominalphrase realisiert, scheint der syntaktische Aufwand geringer zu sein, sodass das Streben nach prosodisch unmarkierten Strukturen die Oberhand gewinnt. Man kann also sagen, dass Phonologie und Syntax als Komponen‐ ten des sprachlichen Wissens miteinander im Wettstreit liegen. In 3.4 haben wir mit der Optimalitätstheorie (OT) einen theoretischen Rahmen eingeführt, in dem ein solcher ‘Wettstreit’ genuiner Bestandteil der Modellierung ist. Mithilfe des Modells der überlappenden Beschränkungen (engl. overlapping constraints, sp. restricciones en superposición oder solapantes, Boersma & Hayes 2001) lässt sich zudem erfassen, dass bestimmte Oberflächenformen (in unserem Fall die Beispiele b und c in Abb. 4.5-27) zwar möglich sind, im konkreten Sprachgebrauch jedoch weniger oft vorkommen als die konkurrierenden Varianten (Beispiele a bzw. d in Abb. 4.5-27). Wir skizzieren im Folgenden eine mögliche Anwendung des overlapping constraints-Modell auf die in Abb. 4.5-27 gegebenen Beispiele. Hierzu benötigen wir zunächst die folgenden Beschränkungen: 274 4 Prosodie <?page no="275"?> 93 Selbstverständlich kann der Sprecher auch nur die erfragte Konstituente nennen, also mit einem Einwortsatz antworten: ¿Quién comió la manzana? María. 94 Zusätzlich zu den Beispielen a und c aus Abb. 4.5-27 (Kandidaten 1 und 2) wurde ein weiterer Kandidat aufgenommen (3). • S T A Y Satzglieder verbleiben in ihrer Basisposition. • S T R E S S F O C U S (SF) Das fokussierte Satzglied ist prosodisch prominen‐ ter als das präsupponierte Material. • A L I G N F O C U S R I G H T (AFR) Der Fokus befindet sich am rechten Satzrand. Als Input für den Generator (GEN), der die zu bewertenden Kandidaten erstellt, wird die Auswahl lexikalischer Einheiten angenommen, die ein Sprecher benötigt, um seine Äußerungsabsicht zu versprachlichen. Will er z. B. die Frage ¿Quién comió la manzana? beantworten, indem er in einem vollständigen Satz aussagt, 93 dass Maria den Apfel gegessen hat, sind dies im Einzelnen der Eigenname María, das Substantiv manzana nebst dem entsprechenden definiten Artikel (la) sowie die passende Form des Verbs comer, also comió (da die abgeschlossene Handlung in der Vergangenheit ausgedrückt wird). Auf der Basis grundlegender Regeln syntaktischen Strukturaufbaus (vgl. Gabriel et al. 3 2018: 143-154) erstellt GEN aus diesem lexikalischen Material alle potenziellen Stellungsabfolgen und versieht diese mit in der jeweiligen Varietät möglichen F 0 -Kon‐ turen. Auf diese Weise ist der Umfang der zu evaluierenden Strukturen von vornherein beschränkt. Das Tableau in Abb. 4.5-28 zeigt die Evaluation (EVAL) dreier Kandidaten. 94 - - - SF S T A Y AFR (1) ☞ [ F MaRÍa] comió la manzana. - - *(! ) (2) ☞ Comió la manzana [ F MaRÍa]. - *(! ) - (3) - [ F María] comió la manZAna. *! - - Abb. 4.5-28: OT-Tableau für drei mögliche Kandidaten eines Aussagesatzes mit transitivem Verb, no‐ minalem Objekt und fokussiertem Subjekt. Die Position des Nuklearakzents wird durch Großschreibung der entsprechenden Silbe angezeigt. Kandidat (3) scheidet aus, da Nuklearakzent (manZAna) und Fokus ([ F María]) nicht miteinander korrelieren und damit die in der Hierarchie hoch angesiedelte Beschrän‐ kung S T R E S S F O C U S verletzt wird. Diese fatale Verletzung, die zum Ausschluss aus dem Wettbewerb führt, wird im Tableau durch ‘*! ’ markiert. Die Tabellenfelder rechts von der fatalen Verletzung werden grau schraffiert. Die Kandidaten (1) und (2) werden dagegen gleichermaßen als korrekte Formen bewertet (angezeigt durch ‘ ☞ ’), weil S TAY und A LI G N F O C U S R I GHT hierarchisch gleichgeordnet sind (zu erkennen an der gestrichelten Linie zwischen den beiden Constraints). Durch diese Art der Evaluation lässt sich jedoch nicht zum Ausdruck bringen, dass (1) die von den Sprechern häufi‐ 4.5 Intonation 275 <?page no="276"?> ger produzierte Variante ist, während (2) zwar als akzeptabel gilt, aber nur selten vorkommt. Im overlapping constraints-Modell können solche Fälle von freier Variation (Optio‐ nalität) in Bezug auf ihre Vorkommenstendenzen erfasst werden. In unserem konkreten Fall wäre davon auszugehen, dass die Beschränkungen S TAY und A LI G N F O C U S R I GHT auf einer kontinuierlichen Skala (continuous ranking scale, CRS) dicht beieinanderliegen und sich dergestalt überlappen, dass bei der Ableitung der Hierarchie im konkre‐ ten Evaluationsvorgang entweder S TAY oder A LI G N F O C U S R I GHT die jeweils andere Beschränkung dominiert: Liegt das Teilranking S TAY » A LIG N F O C U S R I GHT vor, wird Kandidat (1) als optimale Form bewertet; ist die Hierarchie umgekehrt, also A LI G N F O C U S R I GHT » S TAY , dann ist Kandidat (2) der Sieger. Wie aus Abb. 4.5-29 hervorgeht, ist die Wahrscheinlichkeit, dass Kandidat (1) [ F MaRÍa] comió la manzana als optimale Form gewählt wird, deutlich größer (95 % [ F S]VO, Gabriel 2010: 202): Da S TAY auf der CRS höher angesiedelt ist als A LI G N F O C U S R I GHT und der Überlappungsbereich vergleichsweise gering ist, resultiert nur in wenigen Fällen (5 %) das Teilranking A LI G N F O C U S R I GHT » S TAY und damit die in empirischen Sprachdaten selten auftretende Form Comió la manzana [ F MaRÍa] (Kandidat 2). Abb. 4.5-29: Continuous ranking scale (CRS) mit den überlappenden Beschränkungen S T A Y und A L I G N F O C U S R I G H T (AFR). 4.5.5.4 Intonation komplexer Sätze und Diskursintonation Komplexe Sätze werden durch prosodische Phrasierung in kleinere Einheiten unter‐ gliedert. Je nach Stärke der tonalen Markierung kann es sich hierbei um IP- oder ip-Grenzen handeln. Dabei gilt als Faustregel, dass bei zunehmender Länge und Komplexität der Satzkonstruktion auch mehr satzinterne IP-Grenzen vorkommen. Ne‐ bensätze werden normalerweise getrennt phrasiert; sind diese komplex und wiederum in eine komplexe Satzkonstruktion eingebunden, liegt meist eine IP-Grenze vor. Es ist klar, dass sich hierfür kaum allgemeingültige Regeln aufstellen lassen und dass die konkrete prosodische Phrasierung stark vom Sprechtempo sowie vom individuellen Redestil des Sprechers abhängt. Zudem ist auch nicht immer einfach zu entscheiden, ob eine vorliegende Grenze dem BI-Niveau 3 (ip) oder 4 (IP) entspricht. Nachfolgend 276 4 Prosodie <?page no="277"?> geben wir ein Beispiel für eine mögliche Phrasierung des ersten Satzes aus dem (lateinamerikanischen) Nordwind-Text. ( IP ( ip El viento del norte) ( ip y el sol) ( ip estaban disputándose) ( ip sobre cuál de ellos) ( ip era el más fuerte)), ( ip ( ip cuando pasó un viajero) ( ip envuelto en una gruesa capa)). In Bezug auf die Phrasierung bestimmter Satzkonstruktionen lassen sich allerdings deutliche Tendenzen konstatieren. So werden in segmentierten Sätzen des Typs María, en el kiosco, compra el periódico (Satz 1 aus Abb. 4.5-21) die linksdislozierten Topic-Konstituenten in der Regel durch einen hohen intermediären Grenzton Hvom Kernsatz abgetrennt, wobei die ip-Grenzen wiederum in unterschiedlicher Form phonetisch realisiert werden können (vgl. 4.5.5.1 und Abb. 4.5-22). In Abb. 4.5-30, die die F 0 -Kontur zu diesem Beispiel zeigt, liegen zwei verschiedene Oberflächenformen des ip-Grenztons / H-/ vor, nämlich [H-] (CR) und [! H-] (SP). Weiterhin ist innerhalb des Kernsatzes die ebenfalls bereits diskutierte Phrasengrenze zwischen der Verbform compra und dem neutral fokussierten Objekt el periódico zu sehen, hier realisiert als sustained pitch ([! H-]). Abb. 4.5-30: Phrasierung des segmentierten Satzes María, en el kiosco, compra [ F el periódico] mit zwei linksdislozierten Topics und eng fokussiertem Objekt (kastilisches Spanisch). Zur prosodischen Gliederung und zur Intonation größerer Diskurseinheiten im Spa‐ nischen liegen bislang nur wenige AM-basierte Studien vor. Bisherige Analysen spontansprachlicher Daten im Rahmen des AM-Modells haben u. a. gezeigt, dass sowohl die reguläre Deklination als auch der für das Spanische typische Effekt des final lowering (finales Absenken, vgl. 4.5.1) hier weniger stark ausgeprägt sind als in gelesenen Daten. So ist das finale Absenken im kastilischen Spanisch auf bestimmte pragmatische Kontexte begrenzt und tritt vorzugsweise beim Vermitteln bereits er‐ wähnter oder vorhersagbarer Information (Face 2003) oder in subjektiven Behauptun‐ gen auf (Rao 2006). Erste Untersuchungen zum Porteño-Spanischen haben gezeigt, dass die bisher als freie Variation charakterisierte Alternanz der ip-Grenzmarkierungen continuation rise (CR [H-]) und sustained pitch (SP [! H-]; vgl. 4.5.5.1) möglicherweise 4.5 Intonation 277 <?page no="278"?> vom größeren Kontext im Diskurs bestimmt ist und die beiden Varianten daher tentativ bestimmten pragmatischen Funktionen zuzuordnen sind: Während CR vor allem in Aufzählungen auftritt, wird SP vorwiegend in Aussagen mit narrativem Charakter verwendet (Feldhausen et al. 2011b). Die Analyse spontaner Sprachdaten ermöglicht also, die pragmatische Funktion von tonalen Grenzmarkierungen genauer zu erfassen, als das etwa in gelesenen Daten geschehen kann. In Bezug auf die Realisierung und Distribution von Tonhöhenakzenten treten in der Spontansprache häufiger Fälle von Deakzentuierung auf, als es in laborsprachli‐ chen Daten der Fall ist, und zwar nicht nur in Form von postfokaler Deakzentuierung (vgl. 4.5.5.2), sondern auch in pränuklearer Position, wo nach Rao (2006) ca. 30 % der akzentogenen Wörter keinen Tonhöhenakzent tragen. Auch sind Tonhöhenakzente, die auf der Basis von Labordaten als kontrastiv oder emphatisch charakterisiert wurden (kastilisches Spanisch: L+H*; Porteño-Spanisch: L+H*+L; vgl. 4.5.4.1 bzw. 4.5.4.2), in der Spontansprache nicht auf korrigierende oder exklamative Kontexte beschränkt (Face 2003, Rao 2006, Feldhausen et al. 2011b). Für das Porteño-Spanische wurde zudem gezeigt, dass der tritonale Tonhöhenakzent L+H*+L, abweichend von den Labordaten, auch als Pränuklearakzent auftritt (Pešková et al. 2012b: 376). Das stärkere Vorkommen tonaler Hervorhebungsstrategien in der Spontansprache wird dann plausibel, wenn man sich vor Augen hält, dass hier ganze Passagen einen emphatischen Charakter annehmen können (z. B. wenn der Sprecher begeistert von einem Ereignis berichtet), wohingegen sich dies in der Laborsprache auf gezielt evozierte Hervorhebungen beschränkt (z. B. Korrekturen). Die Beschäftigung mit spontanen Sprachdaten ist also als eine notwendige und wichtige Erweiterung zur Analyse von Labordaten zu sehen, da auf diese Weise ein zuvor unter Laborbedingungen postuliertes Toninventar im Hinblick auf seine Angemessenheit überprüft und die kontextuelle Verteilung von Grenztönen und Tonhöhenakzenten genauer bestimmt werden kann. Übungsaufgaben 1. Was sind prosodische Einheiten? Zählen Sie die prosodischen Einheiten auf, die normalerweise unterschieden werden und definieren Sie diese kurz. 2. Erläutern Sie, warum die CV-Silbe typologisch gesehen die am wenigsten mar‐ kierte Silbenstruktur ist. An welchen Phänomenen erkennt man, dass das Spani‐ sche CV-Silben bevorzugt? 3. Syllabieren Sie den folgenden Satz: Desde el punto de vista acústico, las realizaciones aproximantes presentan algunas características específicas. Welchen Unterschied stellen Sie im Vergleich zur Syllabierung der isolierten Wörter desde, acústico, realizaciones, presentan fest? Warum werden diese innerhalb der Äußerung anders syllabiert als bei isolierter Verwendung? 278 4 Prosodie <?page no="279"?> 4. Welche Formen hat das französische Wort champagne im Spanischen angenom‐ men? Erläutern Sie diese aus silbenphonologischer Sicht. 5. Erläutern Sie die lautliche Anpassung des englischen Worts spleen im Spanischen. 6. Erläutern Sie anhand von Beispielen, was unter palabras esdrújulas zu verstehen ist und stellen Sie einen Bezug zur Akzentphonologie des Spanischen her. 7. Bestimmen Sie die Position des Wortakzents in den folgenden Beispielen: alto, altos, señor, señores, limpieza, limpiaparabrisas, esplendor, esplendorosamente. Welche Regeln haben Sie dabei angewandt? 8. Erläutern Sie, warum in den folgenden Beispielen die Wortakzentsilbe graphisch durch den Akut gekennzeichnet ist: límpido, espléndido, línea, esplín, conclusión, (vos) cantás, buqué, chantillí, cantó, bíceps, biología, ciempiés, espontáneamente, ávidamente. 9. Beschreiben Sie, wann und wofür Längungen bestimmter Silben im Spanischen auftreten. 10. Können Tonhöhenunterschiede für einen Bedeutungsunterschied sorgen? Belegen Sie Ihre Argumentation mit Beispielen aus unterschiedlichen Sprachen. 11. Diskutieren Sie, ob der Tonhöhenverlauf im Spanischen am Ende einer Frage sinkt oder steigt. Geben Sie jeweils Beispielsätze an. 12. Welche unterschiedlichen Funktionen kann die Intonation übernehmen? 13. Das Europäische Portugiesisch wird traditionell als eher akzentzählende Sprache aufgefasst. Welche Hypothese lässt sich für die rhythmische Beschaffenheit des L2-Portugiesischen spanischer Muttersprachler aufstellen? 14. Lesen Sie Absatz 4.5.4.3 erneut und informieren Sie sich in der dort angeführten Literatur eingehender über die Intonation des mexikanischen Spanisch. Wie wird in dieser Varietät die kontrastive Fokussierung eines Objekts in satzfinaler Position markiert? 15. Erstellen Sie einen visuellen Stimulus (Zeichnung), der die folgende Situation zeigt: Verónica le da un libro a Bárbara. Bitten Sie spanische Muttersprachler, hierzu die nachfolgenden Fragen zu beantworten, wobei Antworten, die aus nur einem Satzglied bestehen, vermieden werden sollen. a. ¿Qué pasa en el dibujo? (mögliche Antwort: Verónica le da un libro a BÁRbara.) b. ¿Qué hace Verónica? (mögliche Antwort: Le da un libro a BÁRbara.) c. ¿Qué le da Verónica a Bárbara? (mögliche Antworten: Verónica le da un LIbro a Bárbara. Verónica le da a Bárbara un LIbro. Le da un LIbro. Un LIbro le da a Bárbara etc.) d. ¿A quién le da Verónica un libro? (mögliche Antworten: Le da un libro a BÁRbara. A BÁRbara le da un libro etc.) Analysieren Sie die Daten unter folgenden Gesichtspunkten: Welche Wort‐ stellungsmuster werden verwendet? Wird bei neutraler Wortstellung die Fo‐ 4.5 Intonation 279 <?page no="280"?> kusdomäne (enger vs. weiter Fokus) durch eine intermediäre Phrasengrenze angezeigt? Wenn ja, wie wird diese Grenze phonetisch realisiert? 280 4 Prosodie <?page no="281"?> 5 Spanische Phonetik und Phonologie im Sprachkontakt In Zusammenhang mit der Beschreibung und Analyse des spanischen Lautsystems sind wir in den vorausgegangenen Kapiteln bereits mehrfach darauf zu sprechen ge‐ kommen, dass die segmentalen und prosodischen Eigenschaften zahlreicher Varietäten Merkmale aufweisen, die auf den Kontakt mit anderen Sprachen zurückzuführen sind. So haben wir in 2.5.3.2 erwähnt, dass das paraguayische Spanisch aus der Kontaktspra‐ che Guaraní den Glottisverschluss [ʔ] übernommen hat. Ebenso haben wir gesehen, dass die Intonation des argentinischen Spanisch durch die Sprachmelodie der von Einwandernden gesprochenen italoromanischen Varietäten gekennzeichnet ist (vgl. 4.5.4.2). Schließlich haben wir darauf hingewiesen, dass es in der Regel zu sprachlichen Einflüssen kommt, wenn Menschen das Spanische als Fremdsprache (L2 bzw. L3, vgl. 5.3) sprechen. Als Beispiele für den hieraus resultierenden fremdsprachigem Akzent haben wir mit Blick auf das Sprachenpaar Erstsprache Deutsch - Fremdsprache Spanisch unter anderem die im Spanischen zu vermeidende Aspiration (Behauchung) stimmloser Plosive (2.2.1, 2.5.1.1) und die in beiden Sprachen unterschiedliche Reali‐ sierung der r-Laute (2.5.1.5) angeführt. In diesem Kapitel wollen wir vertieft auf solche Sprachkontaktsituationen eingehen und beispielhaft aufzeigen, wie sich das Lautsystem spanischer Varietäten durch übereinzelsprachlichen Einfluss verändert hat bzw. weiterhin verändert. Dabei gehen wir zunächst auf das Spanische im Kontakt mit autochthonen Sprachen und mit Migrationssprachen ein (5.1) und diskutieren Varietäten des Spanischen, die lautliche Einflüsse aus Sprachen aufweisen, die im entsprechenden Gebiet bereits präsent waren, bevor sich das Spanische dort etabliert hat (z. B. im Baskenland, in Katalonien und in Mittel- und Südamerika (5.1.1-5.1.6). Ein weiterer Unterabschnitt (5.1.7) ist Ausspracheeigenschaften gewidmet, die durch Migration anderssprachiger Menschen in spanischsprachige Gebiete, vor allem nach Argentinien, zustande gekommen sind. In Kap. 5.2 thematisieren wir den umgekehrten Fall und befassen uns mit dem Spanischen als Migrationssprache bzw. Diasporavarietät. In diesem Kontext behandeln wir exemplarisch das in den USA und Deutschland von spanischsprachigen Einwan‐ derern als Herkunftssprache gesprochene Spanisch (5.2.1, 5.2.2) sowie das sogenannte Judenspanische, das von der in der Frühen Neuzeit aus Spanien vertriebenen jüdischen Bevölkerung noch heute - wenn auch nur von wenigen Personen - in den neuen Siedlungsgebieten gesprochen wird (5.2.3). Da jede Form von Sprach- und Kulturkon‐ takt damit verbunden ist, dass Menschen andere Sprachen lernen - sei es in Form von ungesteuertem Zweitspracherwerb oder im Sinne von Fremdsprachenlernen, das durch bestimmte Lehr- und Lernformen gesteuert ist -, wird in 5.3. schließlich das Spanische als Fremdsprache thematisiert. Dabei gehen wir zunächst auf ausgewählte segmentale Phänomene ein (5.3.1), bevor wir uns der prosodischen Ebene zuwenden (5.3.2). <?page no="282"?> An dieser Stelle behandeln wir zunächst einige grundlegende Begriffe, die uns bei der Beschäftigung mit sprachlichen Einflüssen immer wieder begegnen werden. Zu nennen ist hier zunächst der Begriff des Transfers, den Odlin (1989) wie folgt definiert: Transfer is the influence resulting from the similarities and differences between the target language and any other language that has been previously (and perhaps imperfectly) acquired. … The influence arises from a learner’s conscious or unconscious judgment that something in the native language and something in the target language are similar (Odlin 1989: 27f.). Wichtig ist dabei, dass Transfer sowohl unbewusst erfolgen als auch bewusst eingesetzt werden kann. Unbewusster Transfer ist oft dadurch bedingt, dass Fremdsprachenler‐ nende die Unterschiede zwischen ihrer Erstsprache (L1) und der jeweiligen Zielsprache nicht als solche wahrnehmen und deswegen lautliche Kategorien aus ihrer L1 in die Fremdsprache übernehmen. Trubetzkoy (1939/ 7 1989) hat dieses Phänomen in seinen Grundzügen der Phonologie darauf zurückgeführt, dass die lautliche Wahrnehmung einer Fremdsprache durch das “phonologische Sieb” der L1 erfolge, d. h., dass sie sozusagen durch das Phonemsystem der Erstsprache gefiltert sei. In neuerer Zeit wurde diese Beobachtung von Flege (1987) und Flege & Bohn (2021) im Rahmen des sog. Speech Learning Model (SLM) zu einer umfassenderen Modellierung lautsprachlichen Lernens ausgearbeitet (vgl. 5.3). Als Beispiel kann hier die Realisierung anlautender Verschlusslaute genannt werden: Sowohl im Deutschen als auch im Spanischen liegt ein binärer phonologischer Kontrast zwischen / b d ɡ/ auf der einen und / p t k/ auf der anderen Seite vor (dt. backen vs. packen, sp. beso ‘Kuss’ vs. peso ‘Gewicht’). Die in beiden Sprachen unterschiedliche phonetische Realisierung des Kontrasts - im Spanischen: volle Stimmhaftigkeit bzw. negative VOT vs. kurze positive VOT; im Deutschen: kurze vs. lange positive VOT, also entstimmte vs. aspirierte Plosive (vgl. 2.2.1, 2.5.1.1) - wird von deutschsprachigen Spanischlernenden in der Regel nicht als andersartig wahrgenommen, und die Ausspracheeigenschaften des Deutschen werden unbewusst in die Zielsprache übertragen. Anders liegen die Dinge bei der Aussprache der spanischen r-Laute: Den Unterschied zwischen den mit der Zungenspitze gerollten bzw. geschlagenen r-Lauten (Trill / r/ , Tap / ɾ/ ) auf der einen und dem uvularen Reibelaut des Deutschen (/ ʁ/ ) auf der anderen Seite nehmen deutschsprachige Spanischlernende in der Regel bewusst wahr. Allerdings bedeutet dies nicht zwangsläufig, dass die spanischen r-Laute zielsprachlich produziert werden, denn mit zunehmendem Alter fällt es Fremdsprachenlernern in der Regel schwer, Artikulationsbewegungen auszuführen, die im Lautsystem ihrer Erstsprache keine Rolle spielen. Ob bewusst oder unbewusst: In beiden Fällen ist die Folge des Transfers aus der Ausgangssprache eine negative, denn die produzierten Laute entsprechen nicht der zielsprachlichen Norm und tragen zur Wahrnehmung eines fremdsprachigen Akzents bei. Man spricht deswegen von negativem Transfer (auch: Interferenz oder Transferenz). Daneben kann Transfer aus einer Sprache in eine andere auch einen positiven Effekt haben, nämlich dann, wenn sich die betreffenden 282 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="283"?> Sprachen in einem bestimmten Merkmal gleichen. Dies ist etwa der Fall, wenn deutschsprachige Spanischlernende zuvor Italienisch als Fremdsprache gelernt und in diesem Zusammenhang bereits die Artikulation des apiko-alveolaren (gerollten) [r] erworben haben. Dann kann - nach Bewusstmachung der Ähnlichkeiten und Unterschiede der jeweiligen Lautsysteme - die mit der Zungenspitze ausgeführte [r]-Aussprache aus der zuvor gelernten Fremdsprache für die Artikulation des gerollten [r] (Trill) und des geschlagenen Tap [ɾ] in die Zielsprache übernommen werden. In solchen Fällen spricht man von positivem Transfer. Wir kommen in 5.3 auf diese Thematik zurück. Unter Transfer (lat. transferre ‘hinübertragen’) versteht man das Übertragen struktureller Eigenschaften von einer Sprache auf eine andere. Transfer kann auf allen sprachlichen Ebenen erfolgen und sowohl den Wortschatz (Lexik), den For‐ menbestand (Morphologie), die Wortstellung (Syntax), die Bedeutung (Semantik) als auch die segmentale und prosodische Phonologie betreffen. Negativer Transfer lautlicher Eigenheiten ist maßgeblich für die Wahrnehmung eines fremdsprachi‐ gen Akzents. In der Literatur wird in Bezug auf die Übertragung struktureller Eigenschaften in Sprachkontaktsituationen auch häufig von übereinzelsprachlichem oder spra‐ chenübergreifendem Einfluss (engl. cross-linguistic influence, CLI, sp. influencia interlingüística) oder auch von Konvergenz (engl. convergence, sp. convergencia) ge‐ sprochen. Während CLI ähnlich wie der Transferbegriff hinsichtlich der Richtung des Spracheneinflusses neutral ist (Einfluss von Sprache A auf Sprache B oder umgekehrt), ist mit Konvergenz meistens systematischer beidseitiger Einfluss gemeint, was zur Herausbildung intermediärer, also dazwischenliegender Formen führt (vgl. Thomason 2001: 89f., Höder 2014). Dass sich Sprachen im Kontakt mit anderen Sprachen verändern, ist keine neue Erkenntnis. So hob bereits der Sprachwissenschaftler Hugo Schuchardt (1842-1927) hervor, dass es “keine völlig ungemischte Sprache” (1884: 5) gebe und dass die “Mög‐ lichkeit der Sprachmischung … nach keiner Seite hin eine Grenze” (1884: 6) habe. Mehr als ein Jahrhundert später äußert sich Thomason (2001: 63) ähnlich, wenn sie zusammenfassend schreibt: “What can be adopted by one language from another? The short answer is, anything”. Dass übereinzelsprachlicher Einfluss aber nicht auf allen Ebenen mit gleicher Wahrscheinlichkeit eintritt, sondern dass bestimmte Merkmale und Strukturen für kontaktbedingten Wandel anfälliger und andere diesem gegenüber eher resistent sind, kommt in den zahlreichen Entlehnungsskalen zum Ausdruck, die in der einschlägigen Literatur vorgeschlagen wurden (Thomason 2001: 70f.; Matras 2009: 153-165). Unstrittig ist, dass Elemente des Wortschatzes, also Wörter samt ihrer lexikalischen Bedeutung, besonders leicht entlehnbar sind. Sie werden oft auch dann aus anderen Sprachen übernommen, wenn es wenig intensiven Kontakt gibt und nur 5 Spanische Phonetik und Phonologie im Sprachkontakt 283 <?page no="284"?> 1 Zur lautlichen Integration von Lehnwörtern vgl. Pustka (2022). 2 Diese besagt, dass im unabhängigen Aussagesatz das flektierte Verb an der zweiten Position stehen muss, z. B. [Peter] isst einen Apfel, [Einen Apfel] wird Peter essen, [Vor einigen Tagen] hat Peter einen Apfel gegessen (vgl. Gabriel et al. 3 2018: 44f.). ein kleiner Teil der Sprachgemeinschaft zweisprachig ist. Deutlich wird dies etwa anhand von zahlreichen englischen Lehnwörtern wie etwa chequear ‘überprüfen’ (< engl. to check anstelle von comprobar oder verificar) oder estrés ‘Stress’ (< engl. stress statt tensión oder agobio). Zugleich zeigen die Beispiele auch, dass strukturelle Eigenschaften, die die mentale Grammatik mitsamt der Phonologie betreffen, nicht in gleichem Maße aus dem Englischen ins Spanische übertragen werden: Das entlehnte Verb chequear wird genauso konjugiert wie die schon länger im spanischen Wortschatz präsenten Verben comprobar oder verificar, und die Lautform [es ˈ tɾes] des entlehnten Substantivs hat sich der spanischen Phonologie insofern angepasst, als zur Vermeidung des komplexen Onsets ein initialer Sprossvokal hinzugefügt wurde (vgl. 4.2.4.1). Anstelle des retroflexen [ɹ] des Englischen wird zudem der im Spanischen übliche Tap [ɾ] realisiert (vgl. 2.5.1.5). 1 Das ist nicht weiter verwunderlich: Wer mit der Erstsprache Spanisch aufgewachsen ist und diese Sprache im Alltag vorwiegend oder ausschließlich verwendet, also lebensweltlich monolingual ist, wird sich vermutlich kaum englische Ausspracheeigenheiten angewöhnen oder ins Spanische entlehnte Verben plötzlich nach englischem Muster konjugieren, bloß weil sein Wortschatz durch ein paar aus dem Englischen stammende Lexeme erweitert wurde. Allerdings ist nicht ausgeschlossen, dass beim Sprachkontakt auch strukturelle Merkmale übertragen werden. Hierfür muss jedoch eine intensivere Kontaktsituation vorliegen, als für die mehr oder minder zufällige Übernahme einzelner Lexeme vonnöten ist. Als Bedingungen werden in der Literatur meist zwei Faktoren genannt, die wir nachfolgend besprechen: Bilinguismus und strukturelle Ähnlichkeit. Kontaktbedingter Wandel tritt vor allem dann ein, wenn zumindest Teile der Sprach‐ gemeinschaft bilingual sind und damit über zwei (oder mehr) voll ausgebaute mentale Grammatiken verfügen, die im kognitiven System der Sprecher regelmäßig aktiviert sind (Hickey 2013). Nur dann ist es möglich, dass sich die Teilbereiche des sprachlichen Wissens über die Grenzen der einzelsprachlichen Grammatiken hinaus nennenswert beeinflussen. Welche Bereiche des sprachlichen Wissens sind hierfür besonders an‐ fällig? Grob gesagt lässt sich Folgendes festhalten: Sogenannte kerngrammatische Eigenschaften wie etwa die im Erstspracherwerb früh erworbene Grundwortstellung Verb-Objekt (sp. comer una manzana) bzw. Objekt-Verb (dt. einen Apfel essen) oder auch die für das Deutsche typische V2-Eigenschaft 2 haben sich als vergleichsweise resistent gegen kontaktbedingten Wandel erwiesen. So hat etwa Schmid (2002; 2011: 63-66) gezeigt, dass jüdische Deutsche, die zur Zeit des Nationalsozialismus im Kindesalter ins englischsprachige Ausland geflohen waren, auch im hohen Alter im Deutschen keine entsprechenden Wortstellungsfehler machten, auch wenn sie ihre Erstsprache seit Jahrzehnten kaum noch verwendet hatten und in den Bereichen Wortschatz, Flexionsmorphologie und Aussprache deutliche Zeichen von Spracherosion (engl. 284 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="285"?> 3 Hierunter versteht man den Verlust bestimmter Eigenschaften der L1, wenn diese nicht mehr oder kaum noch verwendet wird; für Beispiele aus dem Spanischen vgl. 5.2 sowie Schmid (2011) für einen Überblick. 4 Im Rahmen der neueren generativen Syntaxtheorie spricht man diesbezüglich von der artikulato‐ risch-perzeptuellen Schnittstelle (engl. articulatory-perceptive (A-P) interface, vgl. Gabriel et al. 3 2018: 105ff.). language attrition) 3 an den Tag legten. Sogenannte periphere Bereiche der Grammatik, die im L1-Erwerb später erworben werden als die kerngrammatischen Eigenschaften, wie etwa stilistisch oder bildungssprachlich markierte morphosyntaktische Variation einerseits und informationsstrukturell bedingte Wortstellungsvarianten andererseits (vgl. 4.5.5), gelten hingegen als anfällig für kontaktbedingten Wandel und zudem als im Fremdspracherwerb schwer zu erlernen (zum Spanischen vgl. Lozano 2006, Domínguez 2013, Gabriel & Grünke 2018a). Der Unterschied zwischen kerngramma‐ tischen und peripheren Bereichen der Grammatik im Hinblick auf die Anfälligkeit im kontaktbedingten Wandel wird auch von der von Sorace (2011) und Chamorro & Sorace (2019) vertretenen Schnittstellen-Hypothese (engl. Interface Hypothesis, sp. Hipótesis de la interfaz) vorausgesagt. Wie Abb. 5-1 zeigt, unterscheidet man gemäß dieser Modellierung zwischen internen und externen Schnittstellen: Erstere betreffen die Interaktion zwischen kerngrammatischen Modulen. Das bedeutet, dass die Syntax eine bestimmte Satzstruktur aufbaut, die von der Morphologie in Bezug auf die benötigten Wortformen verarbeitet, von der Phonologie in zugrundeliegende Lautstrukturen umgewandelt und von der Semantik interpretiert werden muss (linker Teil der Grafik). Sind jedoch periphere Faktoren wie Informationsstruktur oder Prag‐ matik beteiligt, wie es in Zusammenhang mit der informationsstrukturell bedingten Wortstellungsvariation der Fall ist, müssen kerngrammatische Module wie Syntax und Phonologie, die das Zusammenspiel von Wortstellung und Prosodie (Platzierung des Nuklearakzents) regeln, mit diesen interagieren, d. h., das sprachliche Wissen muss über die Grenzen der Kerngrammatik hinaus aktiviert werden. Wenn es also zu entscheiden gilt, ob die Antwort auf ¿Quién comió la pera? ‘Wer hat die Birne gegessen? ’ als [ F MaRÍa] la comió (d. h. prosodisch markiert mit initialem Satzakzent) oder als La comió [ F MaRÍa] (d. h. syntaktisch markiert mit postverbalem Subjekt) versprachlicht werden soll, wird eine externe Schnittstelle aktiviert (rechter Teil der Grafik). Gleiches gilt, wenn zugrundeliegende phonologische Strukturen in konkrete phonetische Produktion überführt werden: Während etwa der binäre phonologische Kontrast sowohl der spanischen als auch der deutschen Plosive (/ b d ɡ/ vs. / p t k/ ) Bestandteil der Kerngrammatik (genauer: des phonologischen Moduls) der jeweiligen Sprache ist, betrifft die konkrete Artikulation (sp. [b d ɡ] vs. [p t k]; dt. [b̥ d̥ ɡ̊ ] vs. [p h t h k h ]) die Umsetzung sprachlicher Strukturen in physiologische Vorgänge und damit die Materialisierung phonologischer Kategorien in Form von analysierbaren Schallwellen auf Performanzbzw. parole-Ebene. 4 5 Spanische Phonetik und Phonologie im Sprachkontakt 285 <?page no="286"?> 5 Vgl. jedoch die Ergebnisse von Leal et al. (2018), die keine diesbezüglichen Unterschiede zwischen Herkunftssprechern und monolingual in Mexiko und Chile aufgewachsenen Spanischsprechern festgestellt haben. Hervorzuheben ist aber, dass in dieser Studie der Anteil postverbaler fokussierter Subjekte mit Anteilen von unter 3 % auch bei den Monolingualen gering ist (Leal et al. 2018: 236), was bedeutet, dass die Schnittstellenhypothese auf dieser Basis weder bestätigt noch verworfen werden kann. Abb. 5-1: Interne und externe Schnittstellen. Die gestrichelte Linie in Abb. 5-1 zeigt an, dass die Phonetik nicht losgelöst von der Phonologie mit anderen Modulen interagieren kann: Wenn etwa das Wort María in dem Satz [ KF MaRÍa] la comió (als korrigierende Replik auf die Aussage Julia comió la pera ¿no? ‘Julia hat die Birne gegessen, oder? ’) aufgrund von informationsstrukturellen oder pragmatischen Faktoren wie Fokus oder Emphase besonders stark hervorgehoben werden soll, dann kann die Phonetik dies leisten, indem der Vokal der betonten Silbe [ ˈ ɾi] gelängt und der F 0 -Anstieg des entsprechenden Tonhöhenakzents besonders deutlich realisiert wird. Allerdings muss sie hierzu auf die von der Phonologie bereitge‐ stellten Informationen zu den zugrundeliegenden Segmenten / ɾi/ und auf das jeweilige Toninventar - in den meisten Varietäten / L+H*/ , im argentinischen Spanisch / L+H*+L/ (vgl. 4.5.4.2) - zurückgreifen. Die Anfälligkeit von an externen Schnittstellen angesiedelten Phänomenen hat sich in Studien zu Bilingualen erwiesen: So hat Gondra (2020) gezeigt, dass in den USA lebende Herkunftssprecher des Spanischen signifikant weniger fokussierte postverbale Subjekte produzieren als monolingual aufgewachsene Spanischsprecher. Das spricht dafür, dass die externe Schnittstelle zur Informationsstruktur durch die Dominanz des Englischen (das keine postverbalen fokussierten Subjekte kennt) beeinflusst ist. 5 Auch die externe Schnittstelle zur Phonetik scheint für kontaktbedingten Wandel anfällig zu sein: So haben VOT-Messungen bei spanischen Herkunftssprechern, die in Deutschland leben, für die stimmlosen Plosive / p t k/ Werte ergeben, die über denen von monolingual spanisch aufgewachsenen Kontrollpersonen liegen, was auf den Einfluss der Umgebungssprache Deutsch hindeutet (Ruiz Moreno 2019; vgl. 5.2.2). Als ein weiterer Faktor, der kontaktbedingten Wandel begünstigt, wird in der Literatur die von bilingualen Sprechern wahrgenommene strukturelle Ähnlichkeit zwischen ihren beiden Sprachen diskutiert (Heine & Kuteva 2013). Als ein Beispiel 286 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="287"?> hierfür lassen sich im andinen Spanisch nachgewiesene OV-Strukturen anführen, die in neutralen Kontexten die unmarkierte Wortstellung (OV) der Kontaktsprache Quechua (auch: Kichwa) aufweisen können wie in La casa estaba barriendo ‘Er/ sie war dabei, das Haus zu fegen’ (Muysken 2006: 151; vgl. auch Muntendam 2013). Während in monolingualem Spanisch die Wortstellung in solchen neutralen (beschreibenden) Kontexten eindeutig VO wäre (d. h. Estaba barriendo la casa), ist die Abfolge OV dort auf einen bestimmten informationsstrukturellen Kontext, nämlich auf den der kontrastiven Fokussierung des Objekts, beschränkt: [ KF La casa] estaba barriendo (y no el patio) ‘Er/ sie war dabei, das Haus zu fegen (und nicht den Hof)’. Damit steht den Bilingualen eine Struktur zur Verfügung, die in ihren beiden Sprachen (Spanisch und Quechua) vorkommt, wenn auch in unterschiedlichen Kontexten. Solche parallelen Oberflächenstrukturen scheinen sich als Einfallstor für kontaktbedingten Wandel anzubieten - insbesondere dann, wenn es sich um Phänomene handelt, die an einer grammatikexternen Schnittstelle (hier: zur Informationsstruktur) angesiedelt sind. Auf ein Beispiel aus dem Bereich der Phonologie gehen wir in Zusammenhang mit der Diskussion des Judenspanischen ein (vgl. 5.2.3). Sprachprofile und Sprachdominanz Unter Bilingualen versteht man Menschen, die in früher Kindheit mehr als eine Sprache erworben haben. Dies ist in Gebieten, in denen aufgrund der politischen Bedingungen mehr oder minder stabile Zwei- (oder Mehr-)sprachigkeit herrscht wie z. B. in Katalonien oder in Paraguay, eher der Regelfall als die Ausnahme. Durch Migration wachsen zudem immer mehr Menschen auch in Gebieten, in de‐ nen es nur eine offizielle Sprache gibt (wie etwa in Kastilien oder in Argentinien), mit mehr als einer Sprache auf: Sie erwerben etwa eine Migrations- oder Her‐ kunftssprache im familiären Umfeld zusätzlich zur Umgebungssprache, die im öffentlichen Raum und im Bildungswesen verwendet wird. Aber auch Personen, die keinen Migrationshintergrund haben, sind heutzutage selten im Wortsinn als monolingual zu bezeichnen, da sie meist eine oder mehrere Fremdsprache(n) gelernt haben. Um die unterschiedlichen Formen von Mehrsprachigkeit und die daraus resultierenden Sprachprofile einzelner Sprecher unterscheiden zu können, verwenden wir die folgenden Begriffe (vgl. Gogolin 1988): • Lebensweltlich monolingual oder einsprachig sind Menschen, die in ihrer Kindheit im privaten Umfeld mit nur einer Sprache aufgewachsen sind und deren alltägliches sprachliches Handeln im Wesentlichen durch diese Sprache geprägt ist. • Lebensweltlich bi-/ multilingual oder zwei-/ mehrsprachig sind Men‐ schen, die in ihrer Kindheit im privaten Umfeld mit mehr als einer Sprache aufgewachsen sind und deren alltägliches sprachliches Handeln durch meh‐ rere Sprachen geprägt ist. 5 Spanische Phonetik und Phonologie im Sprachkontakt 287 <?page no="288"?> Sowohl bei lebensweltlich Einsprachigen als auch bei lebensweltlich Mehrspra‐ chigen kommt in der Regel die Verwendung einer oder mehrerer gelernter Fremdsprachen in Schule, Studium und/ oder Beruf dazu. Dass lebensweltlich Bilinguale ihre beiden Sprachen gleich gut beherrschen und sich in ihrer Verwendung in absolut gleichem Maße sicher bzw. wohl fühlen, ist eher selten. In diesem Fall spricht man von ausgeglichener (oder balancier‐ ter) Zweisprachigkeit. Häufiger ist es jedoch, dass bilinguale Personen eine der beiden Sprachen besser beherrschen und/ oder sich bei deren Verwendung sicherer fühlen als in der anderen. Man sagt dann, dass der betreffende Mensch eine starke und eine schwache Sprache hat bzw. dass er in einer der beiden Sprachen dominant ist. Diese Sprachdominanz kann sich im Laufe des Lebens verändern, etwa wenn dieser Mensch in ein anderes Land umzieht und wenn sich sein soziales und/ oder berufliches Umfeld wandelt. In der Forschung wird kontrovers diskutiert, wie man Sprachdominanz im Individuum ermitteln kann (vgl. Treffers-Daller 2016 und Müller et al. 4 2023: 69-101 für einen Überblick). Die nachfolgend genannten sprachlichen und außersprachlichen Faktoren können dabei eine Rolle spielen: • Sprachkompetenz, ermittelt durch Selbsteinschätzung und/ oder Sprachtests (Wortschatz, Grammatik, Aussprache) → Höhere Kompetenz in Sprache A oder B spricht für Dominanz in Sprache A oder B. • Sprachverwendung und Spracheneinstellungen, ermittelt durch Fragebögen oder sprachbiographische Interviews → Häufigere Verwendung von Sprache A oder B und positive Einstellung zu dieser sprechen für Dominanz in Sprache A oder B. • Transfer aus einer der beiden Sprachen in gelernte Fremdsprachen, ermittelt durch die Analyse von fremdsprachlichen Produktionsdaten → Messbarer (positiver oder negativer) Transfer aus Sprache A oder B in die Fremdsprache sprechen für Dominanz in Sprache A oder B. Zur Ermittlung der individuellen Sprachdominanz auf der Basis außersprachli‐ cher und sozialer Variablen haben Birdsong et al. (2012) mit dem Bilingual Language Profile (BLP, https: / / sites.la.utexas.edu/ bilingual/ ) einen Fragebogen entwickelt, der sich den jeweils untersuchten Bedingungen anpassen lässt. Die Probanden beantworten dabei u. a. Fragen zu ihrer persönlichen Einstellung zu ihren Sprachen sowie zu deren Verwendung in unterschiedlichen Domänen, wobei jeweils anzugeben ist, zu welchem Prozentsatz Sprache A oder Sprache B in einem bestimmen Kontext ungefähr verwendet wird. Ein Punktesystem mit positiven und negativen Werten ermöglicht die Einordnung der Probanden als dominant in Sprache A oder B; wird der Wert Null erreicht, gilt die Person als ausgeglichen bilingual (vgl. auch Gertken et al. 2014). 288 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="289"?> 6 Die Ausdehnung des baskischen Sprachgebiets, das sich nicht nur auf das spanische, sondern auch auf das französische Staatsgebiet erstreckt, kann Abb. 1.5-1 (Kap.1) entnommen werden. 7 Eine Ausnahme hiervon stellt das Japanische dar, das mit ca. 125 Millionen die isolierte Sprache mit den meisten Sprechern ist. 8 Hierunter versteht man die Besonderheit, dass das erste Argument eines transitiven Verbs einen speziellen Kasus, nämlich den Ergativ ( E R G ), trägt; intransitive Verben vergeben dagegen den Kasus Absolutiv ( A B S ), der bei Eigennamen nicht morphologisch markiert wird. Das ist derselbe Kasus, den das zweite Argument der transitiven Konstruktion erhält. Vgl. die folgenden baskischen Beispiele. intransitiv: Mutil-a dator ‘Der Junge kommt.’ Junge-ABS komm-3SG transitiv: Mutil-ak ardo-a dakar ‘Der Junge bringt Wein.’ Junge-ERG Wein-ABS bring-3SG In sog. Nominativ-Akkusativ-Sprachen, zu denen auch das Spanische zählt, erhält das Subjekt immer den Kasus Nominativ, und zwar unabhängig davon, ob das Verb transitiv ist wie in [ Subj = N O M El chico] trae vino) ‘Der Junge bringt Wein’ oder ob es kein Objekt haben kann wie in [ Subj = N O M El chico] duerme ‘Der Junge schläft’ oder in Viene [ Subj = N O M el chico] ‘Der Junge kommt’. 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen Im Folgenden befassen wir uns mit der Aussprache spanischer Varietäten, die von Bilingualen gemeinsam mit autochthonen Sprachen und Migrationssprachen gespro‐ chen werden. Dabei behandeln wir zunächst das Spanische in den drei europäischen bilingualen Regionen Baskenland (5.1.1), Katalonien (5.1.2) und Galicien (5.1.3), bevor wir uns exemplarisch mit drei mehrsprachigen Gebieten in Amerika befassen (Mexiko, 5.1.4; Andenraum, 5.1.5; Paraguay, 5.1.6) und schließlich anhand des Beispiels Argenti‐ nien auf das Spanische in Interaktion mit Migrationssprachen eingehen, deren Sprecher in spanischsprachiges Territorium eingewandert sind (5.1.7). 5.1.1 Spanisch und Baskisch Das Baskische 6 (Eigenbezeichnung: euskera [eu s ̺ ˈ kaɾa]) zählt nicht zur indoeuropäi‐ schen Sprachfamilie und ist die einzige isolierte Sprache in Europa. Weltweit gibt es ca. 200 solcher isolierter Sprachen, von denen die meisten in Südamerika von jeweils nur noch wenigen Menschen gesprochen werden. 7 Genealogische Verbindun‐ gen zu anderen Sprachen konnten für das Baskische bislang nicht nachgewiesen werden, wohl jedoch typologische Ähnlichkeiten mit kaukasischen Sprachen wie dem Georgischen, das mit dem Baskischen die grammatische Besonderheit der Ergativität teilt. 8 Allerdings ist es, wie Haase (2003: 74) hervorhebt, für “den Nachweis der Sprachverwandtschaft … nötig, möglichst viele systematische Übereinstimmungen aus verschiedenen Bereichen der Grammatik und des Lexikons zu finden”. Nicht zuletzt aufgrund von antiken Zeugnissen wie den Schriften des Geografen Strabon (‘der Schielende’, *63 v. Chr., † 23 n. Chr.) ist jedoch weitgehend gesichert, dass das Baskische bereits zu vorrömischer Zeit im heutigen Sprachgebiet präsent war 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 289 <?page no="290"?> 9 Titel und Kapitelüberschriften des Werks sind auf Lateinisch, der Text ist jedoch auf Baskisch verfasst; vgl. https: / / archive.org/ details/ linguaeVasconumPrimitiae. 10 Die sprachpflegerische Arbeit ist nicht zuletzt von puristischen Bestrebungen gekennzeichnet, die u. a. dazu geführt haben, dass für spanische Lehnwörter baskische Ersatzwörter vorgeschlagen wurden, z. B. urrutizkin ‘Weit-Wort-Mittel’ anstelle von telefono ‘Telefon’ (Haase 2003: 78). und auch während der Romanisierung nie ganz vom Lateinischen verdrängt wurde. Auch wurden germanische Einfälle ins Baskenland erfolgreich abgewehrt (u. a. in der im Rolandslied beschriebenen Schlacht von Roncesvalles (Pyrenäen) gegen die Truppen Karls des Großen, die mit einem Überfall baskischer Einheiten auf die Nachhut des fränkischen Heeres am 15. August 778 entschieden wurde), und ebenso wenig drang die arabische Eroberung der iberischen Halbinsel (ab 711), abgesehen vom südlichen Teil Navarras, ins baskische Territorium vor. Die sprachliche Situation bis zum Beginn der Neuzeit war dadurch gekennzeichnet, dass das Lateinische bis zur Ablösung durch das Spanische zwar Verwaltungssprache war, das Baskische jedoch unvermindert die weit verbreitete Nähesprache blieb. Aus dieser Zeit stammt auch das erste gedruckte baskische Buch Linguæ Vasconum Primitiæ (‘Die Ursprünge der baskischen Sprache’, 1545) von Bernard Etxepare, der das Baskische vehement gegen das Lateinische verteidigt. 9 In Andres de Poças De la antigua lengva, Poblaciones, y Comarcas de las Españas (Bilbao 1587) wird das Baskische (dort: (Lengua) Vascongada oder Vascuence) gar als Ursprache der iberischen Halbinsel aufgefasst, der zudem eine überaus positive Wertung zukommt: “Destas lenguas q̃ se puedan llamar perfectas y elegantes es vna la Vascongada” (S.-32, ‘Von diesen Sprachen, die man als perfekt und elegant bezeichnen kann, ist eine das Baskische’). Das 18. Jahrhundert ist als Folge der Einheitsbestrebungen nach dem Spanischen Erbfolgekrieg (1701-1714) unter Felipe V. durch eine Zurückdrängung aller Regionalsprachen gekennzeichnet; die Zentralisie‐ rung nach französischem Vorbild und die sprachliche Homogenisierung gipfeln 1716 in einem Dekret, das das Spanische als einzige offizielle Sprache ausweist. Zugleich nimmt aber auch eine kulturelle Gegenbewegung um den Jesuiten Manuel de Larramendi (1690-1766) ihren Anfang, der sich für Sprachpflege und -unterricht einsetzt und 1729 die erste baskische Grammatik vorlegt (El imposible vencido. Arte de la Lengua Bascongada ‘Das Unmögliche besiegt. Baskische Sprachkunst’). Bis zur Gründung der Baskischen Akademie (Euskaltzaindia ‘Gruppe der Baskischhüter’) 1918 sollte es allerdings noch fast zweihundert Jahre dauern. 10 Ein Rückschlag für das Baskische war das weitgehende Verbot der Sprache und insbesondere des Schulunterrichts in baski‐ scher Sprache unter der Franco-Diktatur (1936-1975); dennoch kam es ab den 1960er Jahren zum Aufbau eines halblegalen baskischen Schulwesens. 1959 wurde zudem die Widerstandsbewegung ETA (Euskadi ta Askatasuna ‘Baskenland und Freiheit’) ge‐ gründet, die sich nach anfänglich moderatem Einsatz für die baskische Unabhängigkeit allerdings schnell radikalisierte und zahlreiche Terrorakte verübte. Vier Jahre nach Ende des Franco-Regimes wurde 1979 die Autonome Region Baskenland ausgerufen, 1982 erfolgte eine neue Sprachgesetzgebung, im Zuge derer das Baskische kooffizielle Sprache der Region und zur eigentlichen Sprache des Baskenlandes proklamiert wurde. 290 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="291"?> 11 Die in Frankreich gesprochene baskische Varietät Zuberoa weist zusätzlich den vorderen hohen gerundeten Vokal / y/ auf. 12 Dabei sind die von Souganidis et al. (2024: 384) gemessenen (negativen) VOT-Werte für / b d ɡ/ im Spanischen höher als im Baskischen, d. h., die spanischen stimmhaften Plosive werden mit größerer Stimmhaftigkeit realisiert als die baskischen. Gemäß der 7. Soziolinguistischen Erhebung (Eusko Jaurlaritza 2021: 2ff.) schwankt der Anteil Baskischsprachiger entsprechend den Provinzen stark (z. B. nur 22,4 % in Araba, doch 51,8 % in Gipuzkoa). Die intergenerationelle Weitergabe des Baskischen ist jedoch als insgesamt hoch einzustufen: Kinder von zwei baskischsprachigen Elterntei‐ len wachsen zu 85,5 % mit dem Baskischen als alleiniger L1 und zu 7,8 % bilingual auf, während in nur 6,7 % dieser Fälle das Spanische die alleinige L1 ist. Ist nur ein Elternteil baskischsprachig, liegt der Anteil der bilingual aufwachsenden Kinder bei immerhin 46 %. Der hohe Anteil von Bilingualen im Baskenland hat das dort gesprochene Spanisch in der Aussprache beeinflusst. Auf segmentaler Ebene unterscheiden sich die Lautsysteme beider Sprachen nicht stark: Beide haben ein einfaches Vokalsystem mit den fünf Phonemen / a e i o u/ ; 11 im Bereich des Konsonantismus beschränken sich die Unter‐ schiede darauf, dass das Baskische im Gegensatz zum Spanischen zwei verschiedene s-Phoneme, nämlich das lamino-dentale (vordere) / s ̻ / wie in atzo ‘gestern’ und das apiko-alveolare (hintere) / s ̺ / wie in atso ‘alte Frau’ aufweist. Außerdem verfügt es über den palatalen Frikativ / ʃ/ und die Affrikaten / t ̪ s ̻ / , / t ̺ s ̺ / und / tʃ/ . Hinsichtlich der Laterale und der r-Laute gleicht das Baskische der Kontaktsprache, insofern als es über jeweils zwei phonemische Segmente, nämlich / l/ vs. / ʎ/ bzw. / ɾ/ vs. / r/ , verfügt. Vor diesem Hintergrund ist auf segmentaler Ebene kaum nennenswerter baskischer Einfluss auf das Spanische zu erwarten; entsprechende empirische Studien liegen unseres Wissens nicht vor. Allerdings haben Souganidis et al. (2024) gezeigt, dass Erwachsene, die mit Baskisch (Varietät von Gipuzkoa) und Spanisch aufgewachsen sind, sprachspezifisch unterschiedliche VOT-Werte bei den stimmhaften Plosiven produzieren, obwohl diese in beiden Sprachen voll stimmhaft, d. h. mit negativer VOT realisiert werden. 12 Der Befund zeigt, dass es in mehrsprachigen Situationen nicht unbedingt zu kontaktbedingtem Wandel im Sinne von Transfer oder Konvergenz kommen muss, sondern dass insbesondere ausgeglichen Bilinguale, die mit zwei Erstsprachen aufgewachsen sind und beide Sprachen regelmäßig im Alltag verwenden, die Systeme im sprachlichen Wissen so voneinander trennen können, dass auch feine sprachspezifische Unterschiede gewahrt bleiben. Auf prosodischer Ebene ist im baskisch-spanischen Kontext zwischen dauer- und tonhöhenbasierten Merkmalen zu unterscheiden. Da die baskische Silbenstruktur wie die spanische durch eine deutliche Präferenz für unmarkierte CV-Silben gekennzeich‐ net ist und keine regelmäßige Reduktion unbetonter Vokale erfolgt, ist hinsichtlich des Sprachrhythmus kaum sprachenübergreifende Beeinflussung zu erwarten. Anders liegen die Dinge in den Bereichen Akzentsystem und Intonation. Hier unterscheidet sich das Baskische vom Spanischen, insofern als es nicht in allen Varietäten einen 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 291 <?page no="292"?> kontrastiven Wortakzent aufweist und betonungsbedingte Bedeutungskontraste nur in Zusammenhang mit spanischen Lehnwörtern vorliegen, z. B. bask. basoak ‘Glas- E R G ’ (< sp. vaso) vs. basoak ‘Wald- E R G ’ (Hualde 1986: 871). Auch die Gesamtkonturen von Interrogativsätzen unterscheiden sich in beiden Sprachen: Anders als das europäische Spanisch weist das Baskische bei neutralen Ja/ Nein-Fragen in der Regel fallende F 0 -Konturen mit finalem tiefen Grenzton L% auf; final ansteigende Konturen (mit ho‐ hem Grenzton H%), die sich als Einfluss aus dem (kastilischen) Spanisch interpretieren lassen, sind als Varianten der fallenden Kontur ebenfalls belegt (Elordieta & Hualde 2014: 434). Auch das von baskisch-spanisch Bilingualen gesprochene Spanisch weist bei den Fragesätzen teils global fallende und teils final ansteigende Tonhöhenkonturen auf. Abb. 5.1-1 (links) zeigt eine von einer bilingualen Sprecherin produzierte fallende Fragesatzkontur, die mit der steigenden Kontur einer zentralkastilischen Sprecherin aus Madrid kontrastiert wird (rechts). Die Äußerungen wurden mithilfe eines DCT (vgl. 4.5.4) erhoben; die Testpersonen wurden gebeten zu erfragen, ob Juan bis nachmittags arbeite. Abb. 5.1-1: Ja/ Nein-Frage ¿Juan trabaja hasta tarde? bzw. ¿Trabaja Juan hasta tarde? ‘Arbeitet Juan bis nachmittags? ’ produziert von einer baskisch-spanisch bilingualen Sprecherin (Nuklearkonfiguration H*L%, links) und einer Sprecherin aus Madrid (Nuklearkonfiguration L*HH%, rechts). Aufnahmen: Maria del Mar Vanrell (Universitat de les Illes Balears) und Olga Fernández Soriano (Universidad Autónoma de Madrid). Interessanterweise hängt, wie Elordieta & Romera (2020) und Romera & Elordieta (2020) gezeigt haben, die Verwendung steigender bzw. fallender Fragekonturen nicht vom Sprachprofil der Sprecher ab: So verwenden sowohl baskisch-spanisch Bilinguale als auch monolingual mit L1 Spanisch im Baskenland aufgewachsene Personen zu knapp 80 % die fallende (“baskische”) und ansonsten die (“spanische”) steigende Inter‐ rogativkontur. Allerdings spielen außersprachliche Faktoren bei der Wahl der Kontur eine nicht unerhebliche Rolle: Sprecher, die eine positive Einstellung zur baskischen Sprache und Kultur haben und intensive persönliche Kontakte zur baskischsprachigen Bevölkerung pflegen, verwenden die fallende Kontur signifikant häufiger als Personen 292 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="293"?> 13 Man unterscheidet das Ostkatalanische, zu dem auch die in Barcelona, auf den Balearen und in der sardischen Stadt Alghero (kat. S’Algher) gesprochenen Varietäten zählen, und das Westkatalanische, das auch das in der Comunitat valenciana neben dem Spanischen gesprochene valencià umfasst. mit indifferenter Einstellung zum Baskischen und geringeren Kontakten zu Baskisch‐ sprachigen (vgl. Elordieta & Romera 2020: 306, 308). 5.1.2 Spanisch und Katalanisch Das Katalanische, dessen erste schriftliche Zeugnisse aus dem 12. Jahrhundert stam‐ men, kann auf eine glorreiche Geschichte zurückblicken. So wird es als erste romani‐ sche Sprache in größerem Umfang als Wissenschaftssprache genutzt, so etwa von dem Universalgelehrten Ramon Llull (1232-1316), der in seinem um 1287 verfassten Llibre de les bèsties ‘Buch der Tiere’ Tierfabeln mit naturkundlichen Beschreibungen verbindet. Im späten Mittelalter erlangt das Katalanische infolge der Ausdehnung des katalanisch-aragonesischen Staatenbundes im Mittelmeerraum an Bedeutung, doch mit der Vereinigung von Aragon und Kastilien durch die Heirat der Reyes Católicos Ferdinand von Aragon und Isabella von Kastilien 1479 gewinnt das Kastilische die Vor‐ herrschaft als Literatursprache. Zwar bleibt das Katalanische zunächst Rechts-, Amts- und Umgangssprache, doch sein Niedergang beginnt. Im Spanischen Erbfolgekrieg (1701-1714) verliert Katalonien seine politische Eigenständigkeit, das Spanische wird zur alleinigen Amtssprache und ab 1716 per Gesetz auch zur verbindlichen Unterrichts‐ sprache. 1779 tritt sogar ein gesetzliches Verbot des Katalanischen im Theater in Kraft. Das 18. Jahrhundert lässt sich also als Tiefpunkt der katalanischen Sprachgeschichte bezeichnen, was auch durch das Schlagwort decadència ‘Niedergang’ deutlich wird. Im Kontext der Romantik kommt es im 19. Jahrhundert zur sog. Wiedergeburt (kat. renaixença) des Katalanischen. Sein Aufschwung als Literatursprache nimmt jedoch im spanischen Bürgerkrieg (1936-39) ein jähes Ende: Unter Franco wird die Verwendung des Katalanischen in vielen Situationen unter Strafe gestellt, und Ortsnamen werden hispanisiert (so wird z. B. Eivissa in Ibiza umbenannt). Nach Ende des Franco-Regimes wird Katalonien 1979 zur autonomen Region und das Katalanische zur offiziellen Sprache neben dem Spanischen. Das Gesetz zur sprachlichen Normalisierung (Llei de normalització lingüística, 1983) legt schließlich fest, dass in allen öffentlichen Domänen (Verwaltung, Bildungswesen) Katalanisch zu verwenden ist; zur Förderung und Ver‐ breitung der Sprache wird 1988 der Consorci per a la Normalització Lingüística (CPNL) gegründet (vgl. Brumme 1985 für einen Überblick; zur internen Sprachgeschichte des Katalanischen vgl. Meisenburg 2009). Einen informativen Überblick zur Entwicklung des Katalanischen bietet auch die Internetseite der Generalitat de Catalunya https: / / llengua.gencat.cat/ en/ el-catala/ orig ens-i-historia/ index.html. Je nach Quelle werden für alle katalanischen Varietäten zusammen 13 aktuell zwi‐ schen 8 und 10 Mio. Sprecher angenommen. Die stark divergierenden Zahlen, die in der Regel auf Selbsteinschätzungen beruhen, deuten darauf hin, dass Sprachkom‐ 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 293 <?page no="294"?> petenz und -verwendung je nach Person teilweise stark variieren. So geben ca. 95 % der in den països catalans lebenden Menschen an, Spanisch schreiben zu können, jedoch beherrschen nur ca. 60 % der Bevölkerung die katalanische Schriftsprache. Der geringere Anteil von schriftlichen Kompetenzen im Katalanischen erklärt sich u. a. da‐ durch, dass die ältere (zwar katalanisch-dominante) Generation nicht auf Katalanisch alphabetisiert wurde und deshalb besser auf Spanisch schreiben kann. Ein weiterer Grund ist die spanische Binnenmigration und Einwanderung aus spanischsprachigen Ländern ohne katalanische Schulbildung sowie aus anderen Staaten (z. B. ca. 31.000 Deutsche und 16.000 Briten auf Mallorca). Bei in den letzten Jahrzehnten in Katalonien alphabetisierten Personen ist wegen des zu ca. 90 % in katalanischer Sprache durchge‐ führten Schulunterrichts eine hohe Katalanischkompetenz anzunehmen; die Fähigkeit zur normgerechten Verwendung des Katalanischen gilt als Indiz des Bildungsstandes. Der alltägliche Sprachgebrauch ist durch einen hohen Anteil von Code-Switching und zweisprachiger Kommunikation gekennzeichnet, wobei die Kommunikationspartner aufgrund weit verbreiteter rezeptiver Kenntnisse in derjenigen Sprache kommunizie‐ ren können, in der sie sich am wohlsten fühlen. Tendenziell besteht allerdings bei katalanisch-dominanten Personen eine höhere Tendenz, ins Spanische zu wechseln als umgekehrt (vgl. Woolard 1989). Im Zusammenhang mit der Diskussion des im Baskenland gesprochenen Spanisch (vgl. 5.1.1) haben wir bereits darauf hingewiesen, dass Bilinguale ihre beiden Sprachen oft “akzentfrei” sprechen, vor allem, wenn sie diese schon in früher Kindheit erworben haben. Auch im katalanischen Kontext ist nicht davon auszugehen, dass bei allen Sprechern ein eindeutiger “katalanischer Akzent” im Spanischen zu vernehmen ist. Dennoch lassen sich Aussprachemerkmale identifizieren, die für das Spanische kata‐ lanisch dominanter Personen typisch sind. Im segmentalen Bereich sind hierfür Unterschiede sowohl im Vokalismus als auch im Konsonantismus beider Sprachen relevant. So ist der Vokalismus des Katalanischen in zweierlei Hinsicht komplexer als der des Spanischen: Zum einen ist das katala‐ nische Vokalsystem vierstufig (und nicht wie das des Spanischen dreistufig), d. h., es verfügt im Bereich der mittleren Vokale nicht nur über je ein vorderes und ein hinteres Oralvokalphonem, sondern über je zwei Phoneme (/ e/ , / ɛ/ , / o/ , / ɔ/ ). Zudem kennen die balearischen Varietäten ein phonemisches Schwa / ə/ (c[ə]ba ‘Zwiebel’), dem in anderen Dialekten das geschlossene / e/ (València: c[e]ba) bzw. das offene / ɛ/ entspricht (Barcelona: c[ɛ]ba). Zum anderen weist das Katalanische im Gegensatz zum Spanischen den phonologischen Prozess der Reduktion unbetonter Vokale auf: So werden in den meisten katalanischen Varietäten, darunter im Dialekt von Barcelona, die Vokale / e/ , / ɛ/ und / a/ als Schwa [ə] realisiert und / o/ und / ɔ/ werden zu [u] angehoben. Den Unterschied zwischen der (zentral)katalanischen und der spanischen Aussprache kann man sich leicht anhand der Ortsnamen Barcelona und Barceloneta (ein Stadtteil der katalanischen Hauptstadt) verdeutlichen: Während im Spanischen die jeweiligen Vokale unabhängig vom Betonungsmuster als Vollvokale realisiert werden ([baɾse ˈ lona], [baɾselo ˈ neta]), werden im Katalanischen die unbetonten Vokale 294 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="295"?> 14 Umgekehrt wurde gezeigt, dass das katalanische Vokalsystem unter dem Einfluss des Spanischen reduziert wurde, vor allem in Gebieten, die mehrheitlich von spanisch dominanten Menschen bewohnt werden, wie z. B. in Nou Barris, einem nordwestlichen Bezirk von Barcelona (Cortés et al. 2009). 15 Allerdings kennt das Katalanische im Gegensatz zum kastilischen Spanisch kein / θ/ , weshalb dieser Laut im Spanischen katalanisch dominanter Sprecher oft durch / s/ ersetzt wird (sog. seseo, Zusammenfall von / θ/ und / s/ zu / s/ , vgl. 2.5.1.2). reduziert, und nur der jeweils betonte Vokal erscheint als Vollvokal / ɛ/ bzw. / ɔ/ ([bəɾsə ˈ lɔnə] vs. [bəɾsəlu ˈ nɛtə] (Lloret & Prieto 2022: 745, 751). Auf den (negativen) Transfer der katalanischen Vokalreduktion ins Spanische bei katalanisch-dominanten Bilingualen wurde in der Literatur mehrfach im Sinne anekdotischer Evidenz hingewiesen (z. B. Wesch 1997: 297, Blas-Arroyo 2007: 84, für einen Überblick vgl. Grünke 2022: 33f.); empirische Studien unter Einbezug von Formantenmessungen liegen bislang nicht vor. 14 Hinsichtlich des Konsonantismus unterscheidet sich das Katalanische unter ande‐ rem darin vom Spanischen, dass es über ein deutlich größeres Inventar an alveola‐ ren und postalveolaren Frikativen und Affrikaten (kat. / s z ʃ ʒ t͡s d͡z t͡ʃ d͡ʒ/ vs. sp. / s t͡ʃ/ ) sowie über ein velarisiertes (‘dunkles’) / l/ ([ɫ]) verfügt, wobei die Velarisierung in der Coda und nach hinteren Vokalen am stärksten ist (Lloret & Prieto 2022: 746). Anders als im Spanischen mit seiner starken Tendenz zu CV-Silben (vgl. 4.2.4) können im Katalanischen alle Konsonanten in der Coda auftreten, und insbesondere in der wortfinalen Coda sind auch zahlreiche Kombinationen von zwei oder gar drei Konsonanten möglich (Lloret & Prieto 2022: 748f.). Darüber hinaus weist das Katalanische zwei phonologische Regeln auf, die das Spanische nicht kennt: zum einen die Auslautverhärtung (die das Katalanische mit dem Deutschen teilt; vgl. 3.2 und Lloret & Prieto 2022: 758), und zum anderen die Sonorisierung des intervokalischen / s/ an der Wortgrenze (z. B. gos [ɡos] ‘Hund’ vs. gos [ɡoz] estrany ‘fremder Hund’). Während das größere Frikativrepertoire des Katalanischen keine nennenswerten Spuren in der Kontaktsprache hinterlässt, 15 ist die Verwendung des ‘dunklen’ / l/ im Spanischen (z. B. sol [sɔɫ] ‘Sonne’) ein typisches Zeichen für katalanischen Sprachhintergrund (Davidson 2020). Hinsichtlich des Transfers phonologischer Regeln spielt die Auslautverhärtung keine große Rolle, da das Spanische, das nur wenige Konsonanten in der Coda erlaubt (vgl. 4.2.4.2), kaum über Lautstrukturen verfügt, auf die diese Regel anwendbar wäre: Anders als das Katalanische kennt es die stimmhaften Frikativphoneme / v z ʒ/ nicht, und nur selten treten in der Coda stimmhafte Plosive auf (die dann oft ohnehin elidiert werden wie etwa in amistad [amis ˈ ta] ‘Freundschaft’ oder club [klu] ‘Club’, vgl. 2.5.1.1, 4.2.4.2). Die Sonorisierung von intervokalischem / s/ an der Wortgrenze wird wie etwa in la[z] amigas ‘die Freundinnen’ von katalanisch-dominanten Bilingualen jedoch ins Spanische übertragen. So hat Davidson (2015: 133) bei in Barcelona geborenen und aufgewachsenen Personen, die zu Hause ausschließlich Katalanisch sprechen, im Spanischen hohe Sonorisierungsraten von bis zu 76 % ermittelt. Bezüglich des Sprachrhythmus würde man bei Sprechern, die die katalanische Vokalreduktion in ihr Spanisch transferieren, höhere Werte für Rhythmusmaße er‐ 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 295 <?page no="296"?> 16 Mithilfe des paarweisen Variabilitätsindex (vgl. 4.4.2) wurde gezeigt, dass das Spanische eine geringere Variabilität vokalischer Intervalle aufweist als das Katalanische (Prieto et al. 2012: 692). 17 Aus soziolinguistischer Sicht ist dieser Befund insofern interessant als er der von Labov (2001: 293) konstatierten Tendenz entspricht, der zufolge jüngere Menschen und Frauen eher die “drivers of linguistic change” seien als Männer und ältere Personen. warten, die sich auf die Variabilität vokalischer Intervalle beziehen (VarcoV, V-PVI). Während das Spanische von monolingual in Madrid aufgewachsenen Sprechern bislang hinsichtlich der rhythmischen Merkmale mit dem in Barcelona gesprochenen Katalanisch verglichen wurde (Prieto et al. 2012), 16 steht eine empirische Untersuchung des von spanisch-katalanisch bilingualen Sprechern gesprochenen Spanisch noch aus. Anders ist die Forschungslage bei der Intonation: Hier liegen umfangreiche empirische Studien zu spanisch-katalanisch Bilingualen aus Mallorca (Simonet 2008) und aus Girona/ Zentralkatalonien (Grünke 2022) vor, in denen jeweils die tonalen Eigenschaf‐ ten der beiden Sprachen kontrastiert werden. Für neutrale Deklarativsätze, die im Spanischen meist mit einer konvexen Schlusskontur (Nuklearkonfiguration L+H* L%), im Mallorquiner Katalanischen jedoch tendenziell mit einer konkaven Schlusskontur (H+L* L%) produziert werden (vgl. Abb. 5.1-2), hat Simonet (2008) gezeigt, dass jüngere spanisch-dominante Frauen sich in ihrem Spanisch dem Katalanischen angepasst haben, d. h. die typisch “katalanische” Kontur verwenden, auch wenn sie Spanisch sprechen. Damit liegt bei dieser Gruppe deutliche intonatorische Konvergenz vor. Ältere spanisch-dominante Männer unterscheiden sich hingegen am stärksten vom Katalanischen, d. h., sie erweisen sich als resistenter gegenüber kontaktbedingtem Wandel. 17 Abb. 5.1-2: Neutrale Deklarativsätze sp. Manolo vino con su hermana ‘Manolo kam mit seiner Schwester’ (links) mit konvexer Schlusskontur (L+H* L%) und kat. (Mallorca) En Juan vendrà amb sa germana ‘Juan wird mit seiner Schwester kommen’ (rechts) mit konkaver Schlusskontur (H+L* L%) (nach Simonet 2008: 110). Tonale Konvergenz hat auch Grünke (2022) in umfassender Weise für das von Studie‐ renden (Alter 18-29) der Universität Girona gesprochene Spanisch und Katalanisch festgestellt: Sowohl spanischals auch katalanisch-dominante Sprecher verwenden 296 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="297"?> 18 Aus diesem Grund wird Galicien auch als “Wiege des Portugiesischen” (Schlösser 2 2005: 44) bezeich‐ net. in beiden Sprachen das gleiche Inventar an Tonhöhenakzenten und Grenztönen. Allerdings zeigen sich in Abhängigkeit von der Sprachdominanz gewisse Unterschiede in Bezug auf die Vorkommenshäufigkeiten bestimmter Konturen. So tritt die mit que eingeleitete und mit einer fallenden Intonationskontur (Nuklearkonfiguration H+L* L%) realisierte neutrale Frage, die für das Katalanische typisch, im normativen Spanisch jedoch ungrammatisch ist, fast ausschließlich bei katalanisch-dominanten Personen auf - dann aber in beiden Sprachen (Grünke 2022: 190). Beispiele hierfür zeigen wir in Abb. 5.1-3. Abb. 5.1-3: Neutrale Fragesätze kat. Que teniu mandarines? ‘Haben Sie Mandarinen? ’ (links) und sp. ¿Que tienes mandarinas? ‘Hast du Mandarinen? ’ (rechts) mit der Nuklearkonfiguration H+L* L% (Grünke 2022: 218). 5.1.3 Spanisch und Galicisch Das heutige Galicien wird zwischen 29 und 19 v. Chr. unter Augustus erobert und gehört damit zu den spät romanisierten Gebieten; unter Diokletian wird im 3. Jahr‐ hundert die Provinz Callaecia geschaffen. Die arabische Eroberung im 8. Jahrhundert hinterlässt nur geringe Spuren - nicht zuletzt wegen des begrenzten Interesses der Araber am abgelegenen Gebiet im Nordwesten der Halbinsel. Zu dieser Zeit hat sich schon eine eigene romanische Varietät herausgebildet, die sich durch christliche Rückeroberungen nach Süden ausbreitet (Kabatek 2013: 166) und als historischer Vorläufer sowohl des heutigen Galicisch als auch des heutigen Portugiesisch zu sehen ist. 18 Dem Galicisch-Portugiesischen kommt im Mittelalter ein hohes Prestige zu, was sich u. a. darin zeigt, dass die Sprache auch von Autoren verwendet wird, die mit anderen Volkssprachen als L1 aufgewachsen sind. So verfasst der kastilische König Alfonso el Sabio (Alfons der Weise, 1221-1284) den religiösen Gedichtzyklus Cantigas de Santa Maria ‘Lieder für die heilige Maria’ in galicisch-portugiesischer 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 297 <?page no="298"?> 19 Die Ausdehnung des galicischen Sprachgebiets kann Abb. 1.5-1 (Kap.1) entnommen werden. Sprache. Seit dem Entstehen eines eigenständigen portugiesischen Königreichs südlich von Galicien im 12. Jahrhundert entwickelt sich die Sprache nicht mehr einheitlich, und das Portugiesische bildet sich vor allem in Lissabon und Umgebung als eigene Ausbauvarietät heraus. Ab dem 14. Jahrhundert - Galicien gehört inzwischen zur kastilischen Krone - ist im Galicischen verstärkter kastilischer Einfluss zu verzeichnen, bis es im 16.-18. Jahrhundert fast völlig aus der Schriftproduktion verschwindet (sog. séculos escuros ‘dunkle Jahrhunderte’) und zur reinen Nähesprache wird. Damit bildet sich eine spanisch-galicische Diglossie heraus, die zunehmend zur sozialen Markierung des Galicischen als Sprache der unteren Schichten beiträgt, während Adel, Klerus und Bürgertum Spanisch sprechen. Im Zuge der französischen Invasion (1822) wird das Ga‐ licische schließlich wiederentdeckt und dient als Symbol des nationalen Widerstands, was in der zweiten Hälfte des 19. Jahrhunderts in die galicische Renaissancebewegung, das sog. rexurdimento, mündet. Diese wird nicht zuletzt vom spanischsprachigen gebil‐ deten Bürgertum getragen und schlägt sich neben der Publikation erster Grammatiken (Compendio de gramática gallega-castellana ‘Kompendium galicisch-kastilischer Gram‐ matik’ von Francisco Mirás, 1864) und Wörterbücher (Diccionario gallego-castellano von Francisco Javier Rodríguez, 1863) auch in verstärkter Literaturproduktion nieder (vgl. vor allem die 1863 veröffentlichen Cantares gallegos ‘Galicische Gesänge’ von Rosalía de Castro). 1904 nimmt mit der Gründung der Sprachakademie Real Academia Galega die Standardisierung und öffentlich geförderte Sprachpflege ihren Anfang, und 1936 erhält Galicien per Volksentscheid Autonomiestatus mit zwei offiziellen Sprachen, was wegen des Ausbruchs des Bürgerkriegs jedoch nie zum Tragen kommt. Da Franco selbst Galicier war, wird die Sprache während seiner Herrschaft zwar weniger offensiv unterdrückt als das Baskische und das Katalanische (vgl. 5.1.1, 5.1.2), doch wird sie auch nicht mehr gefördert. Stattdessen wird in allen öffentlichen Domänen das Spanische eingeführt, was dazu führt, dass das Galicische in vielen Familien nicht an die Kinder weitergegeben wird, um ihnen den sozialen Aufstieg zu erleichtern. Die hieraus resultierende interfamiliäre Diglossiesituation und der L1-Erwerb des Spanischen mit Anfangsinput von galicisch-dominanten Bilingualen oder Nicht-Muttersprachlern be‐ wirkt eine starke Prägung des regionalen Spanisch durch galicische Lexik, Grammatik und Aussprache. Die Situation ändert sich erst, als nach Francos Tod Galicien 1981 zur Comunidade autónoma erhoben und das Galicische in Art. 5 der Verfassung als lengua bzw. lingua autóctona de Galicia dem Spanischen gleichgestellt wird. Die Einführung flächendeckenden Schulunterrichts sorgt für mehr oder weniger starke Unterschiede zwischen dem galego jüngerer Sprecher, die entsprechenden Schulunterricht genossen haben, und der Sprache älterer Menschen, die das sprachplanerisch normierte, als Hochsprache empfundene Neogalicisch nicht erworben haben (vgl. Ramallo 2007). Heute hat das Galicische je nach Quelle zwischen 2,4 und 3 Millionen Sprecher. 19 Vergleicht man die Entwicklung der Sprachkenntnisse im Zeitraum von 2003 bis 2018 (Selbsteinschätzung der vom Galicischen Statistikinstitut Befragten, vgl. IGE 298 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="299"?> 20 Dies ist allerdings nicht der Fall, wenn das verwandte Wort des Galicischen einen zugrundeliegenden geschlossenen Vokal aufweist wie in zona [ ˈ sonɐ] ‘Zone’, vgl. gal. z[o]na. 2018), hat sich die Schreibkompetenz der Bevölkerung im Galicischen leicht verbessert (Anstieg von 28,1 auf 29,5 %), während die rezeptiven mündlichen Kompetenzen trotz flächendeckender Schulbildung um knapp 10 Prozentpunkte von 81,1 auf 72,3 % zurückgegangen sind. Unabhängig von der Sprachkompetenz hängt die Sprachverwen‐ dung vom Lebensraum ab: Während in urbanen Gebieten (vor allem in Vigo) der Gebrauch des Galicischen im Alltag nachlässt, sprechen im ländlichen Raum mehr Menschen ausschließlich Galicisch oder mehr Galicisch als Spanisch. Weiterhin ist die Sprachverwendung altersabhängig: 65,5 % der über 65-Jährigen sprechen im Alltag nur Galicisch, während in derselben Altersgruppe nur 10,4 % ausschließlich das Spanische verwenden. Bei den unter 16-Jährigen sind die Verhältnisse umgekehrt: 33,1 % sprechen im Alltag nur Spanisch und 28 % nur Galicisch (vgl. Monteagudo Romero & Lorenzo 2005: 29). Der Anteil der im Alltag ausschließlich Galicisch Sprechenden hat sich in letzter Zeit in allen Altersgruppen verringert: Gemäß der 2018 vom Galicischen Statis‐ tikinstitut durchgeführten Umfrage sprechen nur noch 48,5 % der über 65-Jährigen nur Galicisch (und 13,7 % nur Spanisch); bei den unter 16-Jährigen verwenden 14,3 % nur Galicisch und 44,1 % nur Spanisch (vgl. IGE 2018). Das bedeutet zugleich, dass 37,8 % der Älteren und 41,6 % der Jüngeren regelmäßig im Alltag beide Sprachen verwenden, wobei es häufig zu Code-Switching (gemischter Rede) kommt. In der Literatur wird daher die Frage diskutiert, ob sich in Galicien zunehmend eine spanisch-galicische Mischsprache herausbilde. Die Sprecher scheinen jedoch zwischen einem spanisch beeinflussten Galicisch einerseits und einem galicisch beeinflussten Spanisch anderer‐ seits zu unterscheiden (vgl. Schubert 2015: 341). Im Folgenden besprechen wir typische lautliche Merkmale des sog. castellano interferido, womit nach Schubert (2015: 326) ein “intentionales, stark interferenzgeprägtes, stigmatisiertes Spanisch” gemeint ist. Auf segmentaler Ebene sind für den Vokalismus zwei Unterschiede zwischen dem Galicischen und dem Spanischen zu nennen, die Einfluss auf das castellano interferido nehmen. Erstens ist das Vokalsystem des Galicischen (wie auch das des Katalanischen und des Portugiesischen) vierstufig, d. h., es verfügt über einen phonologischen Kontrast zwischen / e/ und / ɛ/ einerseits und zwischen / o/ und / ɔ/ andererseits (z. B. ven! [beŋ] ‘komm! ’ vs. ben [bɛŋ] ‘gut (Adverb)’, oso [ ˈ osʊ] ‘Bär’ vs. oso [ ˈ ɔsʊ] ‘Knochen’, vgl. Martínez-Gil 2022: 887). Während im Spanischen der Öffnungsgrad mittlerer Vokale kontextbedingt ist und in geschlossener Silbe tendenziell die offenen Varianten realisiert werden (z. B. papel / pa ˈ pel/ [pa ˈ pɛl] ‘Papier’, costa / ˈ kosta/ [ ˈ kɔstɐ] ‘Küste’, vgl. 2.5.3.1), können diese im Galicischen auch in offener Silbe auftreten. Auf das in Galicien gesprochene Spanisch wirkt sich dies in Form einer Tendenz zur Verwendung der offenen Varianten aus: bueno [ ˈ bwɛ.nʊ], obra [ ˈ ɔ.βɾɐ] (Faginas Souto 2001, De la Fuente Iglesias & Pérez Castillejo 2020). 20 Zweitens weist das Galicische regelhafte Reduktion von Vokalen in unbetonter Position auf. 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 299 <?page no="300"?> 21 Auch andere spanische Kontaktvarietäten weisen vokalische Reduktionsprozesse auf, so etwa die Varietät von Olivenza (Extremadura), die im Kontakt mit dem Portugiesischen steht und die Anhebung des unbetonten / o/ zu [u] übernommen hat (Gabriel et al. 2020a), oder das in Bulgarien gesprochene Judenspanisch (5.2.3). 22 Möglicherweise ist dieses Phonem durch spanischen Einfluss ins Galicische gekommen. Belege über die Existenz von / θ/ im (Alt-)Galicisch-Portugiesischen liegen nicht vor (Meisenburg 1996b: 275ff.). Abb. 5.1-4: Vokalreduktion im Galicischen (vgl. Martínez-Gil 2022: 897ff.). Wie Abb. 5.1-4 zeigt, werden in unbetonten Silben die vorderen Vokale / i e ɛ/ als ungespanntes [ɪ] und die hinteren Vokale / u o ɔ/ als ungespanntes [ʊ] realisiert, während / a/ zu [ɐ] angehoben wird. Da alle Vokale in unbetonter Position mehr in der Mitte des Mundraums artikuliert werden als ihre betonten Gegenstücke, spricht man hier auch von Zentralisierung. Die Übertragung dieses Phänomens ins Spanische wurde bereits anhand der Transkriptionen der obigen Beispiele deutlich: In bueno haben wir das unbetonte auslautende / o/ als [ʊ] transkribiert, und das finale / a/ in costa haben wir als [ɐ] wiedergegeben. Als Beispiel für die Zentralisierung eines vorderen Vokals lässt sich bebé [bɪ ˈ βɛ] ‘Baby’ anführen. 21 Im Bereich des Konsonantismus ist zunächst der seseo (Zusammenfall von / θ/ und / s/ zu / s/ , vgl. 2.5.1.2) zu nennen. Anders als das Katalanische beinhaltet das Phoneminven‐ tar des heutigen Galicisch den interdentalen Frikativ / θ/ . 22 Dessen Schwund zugunsten von / s/ ist jedoch in galicischen Substandardvarietäten verbreitet (Martínez-Gil 2022: 903) und wird von galicisch dominanten Sprechern häufig ins Spanische übertragen (Schubert 2015: 98-101). Einzigartig in der Gruppe der iberoromanischen Sprachen ist die sog. gheada, die neben dem seseo ein typisches Merkmal des Substandards westgalicischer Varietäten ist. Man versteht hierunter die Realisierung des velaren stimmhaften Plosivs / ɡ/ vor tiefen und hinteren Vokalen (d. h. vor [a ɔ o u]) als stimmloser velarer oder pharyngaler Frikativ (Alén Garabato 2001, Thomas 2007, Martínez-Gil 2022: 903f.). Aus galego ‘galicisch’ wird dann [x]ale[x]o bzw. [ħ]ale[ħ]o, wobei die erste Realisierungsvariante dem spanischen [x] in mit <j> (bzw. mit <g> vor <e> oder <i>) geschriebenen Wörtern ähnelt (z. B. jamás [xa ˈ mas] ‘nie’). Von galicisch-dominanten Sprechern, vor allem von solchen, die aus dem ländlichen Raum stammen, wird die gheada häufig ins Spanische übertragen (Schubert 2015: 95-98), was zu Realisierungen von gato ‘Katze’ oder agua ‘Wasser’ als [ ˈ xatʊ]/ [ ˈ ħatʊ] bzw. 300 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="301"?> [ ˈ axwɐ]/ [ ˈ aħwɐ] führt. Da die Verwendung der gheada sowohl im Galicischen als auch im Spanischen soziolinguistisch negativ markiert ist und mit ländlicher Herkunft und geringem Bildungsstand assoziiert wird, kommt es in diesem Bereich auch zu Hyperkorrekturen des [x]-Lauts, z. B. wenn der Name José oder das Verb mojar ‘nass machen’ mit [ɡ] statt [x], also als [ɡ]osé und mo[ɡ]ar, realisiert werden. Hier treten auch entsprechende hyperkorrekte Fehlschreibungen auf (*<Gosé>, *<mogar>). Hinsichtlich der Prosodie des galicischen Spanisch ist auf rhythmischer Ebene kein Transfer aus der Kontaktsprache zu erwarten: Da die regelhafte Vokalreduktion des Galicischen zwar die spektralen Eigenschaften, aber eher nicht die Dauer der zentralisierten unbetonten Vokale betrifft, weist es, wie auch das Spanische, kaum Unterschiede in der Dauer betonter und unbetonter Silben auf und wird damit zu den prototypischen silbenzählenden Sprachen gerechnet (Fernández Rei 2002, Martínez-Gil 2022: 921). Intonatorisch unterscheidet sich das Galicische allerdings vom kastilischen Spa‐ nisch. Ein wichtiger Unterschied betrifft die Alignierung der pränuklearen Tonhöhenakzente in Deklarativsätzen: Während diese im kastilischen Spanisch normaler‐ weise einen nach rechts verschobenen Tonhöhengipfel aufweisen (L+>H*, vgl. 4.5.4.1), wird der Gipfel im Galicischen in den meisten Fällen im Rahmen der betonten Silbe erreicht (L+H*). Allerdings weist die Alignierung der steigenden Pränuklearakzente im Galicischen deutlich mehr Variation auf, als es etwa im Porteño-Spanischen der Fall ist, das die mutmaßlich aus dem Italienischen übernommene frühe Alignierung generalisiert hat (vgl. 4.5.4.2). So treten im Galicischen neben Pränuklearakzenten mit frühem Tonhöhengipfel (L+H*) auch solche mit spätem Gipfel auf, was sich im galicischen Spanisch in Form von variabler Alignierung niederschlägt: L+(>)H* (vgl. Pérez Castillejo 2014: 250ff.). Ein weiterer Unterschied zwischen dem kastilischen Spanisch und dem Galicischen betrifft die Kontur von neutralen Fragesätzen, die im Spanischen steigend ist (L* HH%; vgl. 4.5.4.1), während das Galicische, wie auch das Baskische und das Katalanische (vgl. 5.1.1, 5.1.2), im unmarkierten Fall eine global fallende Fragekontur aufweist (H+L* L%). Wie Hernández (2020: 50-58) und Pérez Castillejo & De la Fuente Iglesias (2024: 19f.) anhand von evozierten Produktionsdaten gezeigt haben, realisieren galicisch-dominante Sprecher im Galicischen und im Spani‐ schen vorzugsweise fallende Interrogativkonturen, wohingegen spanisch-dominante Personen in beiden Sprachen zur steigenden Kontur tendieren. Ob sich eher Transfer aus dem Galicischen ins Spanische oder - umgekehrt - aus dem Spanischen ins Galicische zeigt, ist auch vom Alter der Sprecher abhängig. So kommen bei jüngeren Bilingualen mehr “spanische” steigende Konturen in beiden Sprachen vor, während Ältere eine Tendenz zur “galicischen” fallenden Kontur haben. Der Befund deutet darauf hin, dass als typisch galicisch wahrgenommene tonale Merkmale über die Generationen hin im Rückgang begriffen sind und dass sich “spanische” Muster nicht nur im galicischen Spanisch, sondern auch im Galicischen durchsetzen. Umgekehrt finden sich aber auch monolingual mit dem galicischen Spanisch im urbanen Raum aufgewachsene Menschen, die selbst nur wenig Galicisch sprechen und dennoch in 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 301 <?page no="302"?> 23 Überreste der alten Aztekenhauptstadt finden sich jedoch heute an zahlreichen Stellen in Me‐ xiko-Stadt, unter anderem in der Nähe der Kathedrale am Zócalo (Hauptplatz), wo die Ruinen des bei der Eroberung völlig zerstörten templo mayor (nah. huēy teōcalli ‘großer Tempel’) zu besichtigen sind (vgl. https: / / templomayor.inah.gob.mx/ ). ihrem Spanischen die typisch “galicische” Fragekontur verwenden. Abb. 5.1-5 zeigt abschließend ein solches Beispiel aus der Studie von Fernández Rei (2019). Abb. 5.1-5: Neutrale Ja/ Nein-Frage ¿Tiene mermelada? ‘Haben Sie Marmelade? ’ mit fallender Kontur, produziert von einer monolingual aufgewachsenen Sprecherin des galicischen Spanisch (Universitäts‐ studentin) (nach Fernández Rei 2019: 453). Die von uns hinzugefügte ToBI-Annotation H+L* L% entspricht der von Pérez Castillejo & De la Fuente Iglesias (2024: 20, 25) vorgeschlagenen Analyse. Einen Überblick über die Intonationskonturen aller grundlegenden Äußerungstypen des in Galicien gesprochenen Spanisch (u. a. einfache und komplexe Deklarativ- und Interrogativsätze sowie Imperative und Vokative) auf der Basis eines mithilfe eines Discourse Completion Task (DCT; vgl. 4.5.4) erhobenen Korpus bieten Pérez Castillejo & De la Fuente Iglesias (2024). 5.1.4 Das mexikanische Spanisch im Kontakt mit dem Nahuatl und dem yukatekischen Maya 1519 landet der spanische Eroberer Hernán Cortés (1485-1547) auf der westlich von Kuba gelegenen Halbinsel Yucatán. Mithilfe diverser Lokalmächte, die mit den Azteken verfeindet waren, wird 1521 Tenochtitlán ([tenoːʧ ˈ ti.tɬan]), die Hauptstadt des Azteken‐ reichs, erobert und fast vollständig zerstört. 23 In einem brutalen Vernichtungsfeldzug folgt die Unterwerfung weiterer Gebiete bis hin zum heutigen Guatemala; das 1535 gegründete Virreinato de Nueva España ‘Vizekönigreich Neues Spanien’ erstreckt sich 302 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="303"?> 24 Kurz vor Staatsgründung (1810) wurden in Mexiko ca. 6,1 Mio. Einwohner erfasst, von denen knapp die Hälfte als ethnisch gemischt gelten (ca. 1,1 Mio. “euromestizos”, 418.568 “afromestizos”, 704.245 “indomestizos”; vgl. Klee & Lynch 2009: 117). 25 Bei dieser Affrikate geht der alveolare Plosiv [t] unmittelbar in den (an derselben Artikulationsstelle produzierten) lateralen Frikativ [ɬ] über. von der heutigen Südgrenze der USA bis nach Costa Rica. In sprachlicher Hinsicht zeichnete sich das Aztekenreich durch eine große Vielfalt aus: Neben dem klassischen Aztekisch, dem Vorläufer des heutigen Nahuatl, das in dem Vielvölkerstaat als Ver‐ kehrs-, Handels- und Verwaltungssprache diente, wurden ca. 80 weitere Sprachen und Varietäten gesprochen. Mit Gründung des Vizekönigreichs wird das Spanische durch Erlass der Reyes Católicos als offizielle Verwaltungssprache eingesetzt, jedoch werden die autochthonen Sprachen bis ins 17. Jahrhundert durch den Klerus, v. a. von Franziskaner- und Dominikanermönchen, weiterhin zu Missionierungszwecken verwendet (Heath 1972). Nach Hidalgo (2001) lassen sich drei sprachpolitische Epochen ausmachen: Die Frühzeit bis zum letzten Drittel des 16. Jahrhunderts zeichnet sich durch eine Diskrepanz zwischen offizieller Sprachpolitik (mit dem Spanischen als alleiniger Sprache) und der mehrsprachigen Realität aus. In der Folge wird per Dekret Philipps II. 1578 das Nahuatl zur offiziellen Missionssprache erhoben, bevor schließlich das 17. und 18. Jahrhundert durch eine Rückkehr zur Hispanisierungspolitik gekennzeichnet ist. Es bildet sich eine relativ stabile Diglossiesituation heraus, in der das Spanische als Distanzsprache und die autochthonen Sprachen als Nähesprachen fungieren. Auch mit der Unabhängigkeit Mexikos 1821 bleibt das Spanische einzige Nationalsprache - durch die sprachliche sollte auch die nationale Einheit gestärkt werden. Da große Bevölkerungsteile jedoch kein oder kaum Spanisch sprachen, waren sie damit von jeglicher Teilhabe ausgeschlossen, was im Widerspruch zum teils ostentativ zur Schau getragenen Stolz des jungen Staates auf die ethnische Vielfalt seiner Bevölkerung und die daraus resultierende kulturelle Verschmelzung stand. 24 Erste Schritte zur Anerkennung sprachlicher Vielfalt lassen sich erst ab den 1940er Jahren erkennen (vgl. Klee & Lynch 2009: 116-119; Zimmermann 2013: 410-418). Heute leben in Mexiko mehr als 120 Mio. spanischsprachige Menschen; ca. 6,7 Mio. von ihnen sprechen zudem eine autochthone Sprache. Insgesamt sind 62 Sprachen als Minderheitensprachen anerkannt, wobei in der Volkszählung von 2020 (INEGI 2020) die am häufigsten genannten das Nahuatl (mit ca. 1,7 Mio. Sprechern) und das yukatekische Maya (mit 774.755 Sprechern) sind (für einen Überblick zu früheren Jahren vgl. Ramírez-Trujillo 2013: 85ff.). Auf lautlicher Ebene, vor allem im Konsonantismus, lässt sich der Kontakt mit dem Nahuatl an einigen Merkmalen festmachen, die für das mexikanische Spanisch als typisch gelten. So sind über zahlreiche Lehnwörter der postalveolare Frikativ / ʃ/ sowie die Affrikaten / ts/ und / tɬ/ 25 aus dem Nahuatl ins mexikanische Spanisch übernommen worden: mixiote [mi ˈ ʃjote] ‘Agavenblatt’ (bzw. ein darin gegartes tradi‐ tionelles Gericht), tzotzil [tsotsil] (Volksgruppe aus Chiapas und deren Sprache), tlapalería [tɬapale ˈ ɾia] (< nah. tlapalli ‘Farbe’) ‘Eisenwarenhandlung, Drogerie’. Die 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 303 <?page no="304"?> drei genannten Phoneme sind in ihrem Vorkommen allerdings auf Lehnwörter und Ei‐ gennamen beschränkt und haben das weitere Konsonantensystem des mexikanischen Spanisch unbeeinflusst gelassen. Allerdings hat die Aufnahme der alveolar-lateralen Affrikate / tɬ/ in den Lautbestand dazu geführt, dass die Sequenz / tl/ wie in atlas ‘Atlas’ oder atletismo ‘Leichtathletik’ anders syllabiert wird, als es in spanischen Nicht-Kon‐ taktvarietäten der Fall ist (vgl. 4.2.5). So haben Hualde & Carrasco (2009: 184f.) Dauer‐ messungen der wortmedialen Abfolge [pl], [tl] und [kl] in von mexikanischen und kastilischen Sprechern produzierten Realisierungen von Wörtern wie repleta ‘er/ sie füllt (voll)’, atleta ‘Athlet/ in’ und tecla ‘Taste’ durchgeführt und festgestellt, dass bei mexikanischen Sprechern keine Dauerunterschiede zwischen den unterschiedlichen Plosiv-Lateral-Kombinationen auftreten, während bei den kastilischen Sprechern die Dauer von [tl] signifikant länger ist als die von [pl] und [kl]. Dies spricht dafür, dass die wortmediale Abfolge / tl/ im mexikanischen Spanisch einen komplexen Onset bilden kann ([a.tleta]), während sie im kastilischen Spanisch auf zwei Silben verteilt wird ([at.leta]). Wie Martín Butragueño (2014: 296-304) gezeigt hat, trifft dies jedoch nicht auf alle mexikanischen Sprecher zu. So finden sich in allen Regionen Mexikos Belege für beide Realisierungsvarianten; vgl. die in Abb. 5.1-6 dargestellte Variation in der Syllabierung von atleta. Abb. 5.1-6: Syllabierung der Sequenz / tl/ in atleta ‘Athlet/ in’ (nach Martín Butragueño 2014: 304). Auch im Bereich der r-Laute macht sich gegebenenfalls übereinzelsprachlicher Einfluss bemerkbar. Während das Spanische über die beiden Phoneme Tap / ɾ/ und Trill / r/ verfügt, kennt das Nahuatl keinerlei r-Laute. Das könnte ein Grund dafür sein, dass die positionsbedingten Neutralisierungsregeln des Standardspanischen (Wortanlaut: 304 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="305"?> [r], Coda: [ɾ]; vgl. 2.5.1.5) im mexikanischen Spanisch nicht immer respektiert werden. Zudem wird die ebenfalls bereits in 2.5.1.5 besprochene Assibilierung (sp. asibilación), d. h. die Realisierung von wortfinalem [ɾ] vor Pause als Sibilant (hier: als stimmloser alveo-palataler Frikativ wie z. B. in señor [se.ɲɔɕ] ‘Herr’), oft mit dem Fehlen von r-Lauten im Nahuatl in Verbindung gebracht. Diese Kausalität ist jedoch fragwürdig, da dieses Phänomen auch in anderen Gebieten der spanischsprachigen Welt auftritt, so etwa im Andenspanischen, wo meist die stimmhafte Variante, also [se.ɲɔʑ], realisiert wird (vgl. Klee & Lynch 2009: 120 sowie Martín Butragueño 2014: 541-549). Die Tat‐ sache, dass assibilierte Aussprachevarianten im urbanen Mexiko durchaus ein hohes Prestige genießen können (“among middleand upper-class female speakers of Mexico City … often regarded as a prestige variant”, Lipski 1994: 279), spricht eher gegen direkten Einfluss aus dem Nahuatl, da als eindeutig autochthon wahrgenommene Aussprachemerkmale in den spanischsprachigen Ländern Mittel- und Südamerikas in der Regel soziolinguistisch niedrig konnotiert sind. Werfen wir nun einen Blick auf den Vokalismus. Das Vokalsystem des Nahuatl umfasst nur vier Vokale (/ a e i o/ ) und ist damit noch weniger komplex als das des Spanischen: Der Raum der beiden hinteren Vokale / o/ und / u/ wird hier von einem einzigen hinteren [-tiefen] Phonem eingenommen. Zusätzlich weist das Nahuatl einen durchgehenden Längenkontrast auf, d. h., alle Vokale kommen in langer und kurzer Version vor und bilden entsprechende Minimalpaare, z. B. x[i]huitl ‘Gras, Kraut’ vs. x[iː]huitl ‘Komet’. - vorn hinten - vorn hinten hoch i u hoch i iː o oː mittel e o mittel e eː tief a tief a aː Abb. 5.1-7: Das Vokalsystem des Spanischen (links) und des Nahuatl (rechts; vgl. Hernández 1998: 3). Über einen regelmäßigen Prozess der Vokalreduktion verfügt das Nahuatl nicht - anders als etwa die in 5.1.2 und 5.1.3 besprochenen Kontaktsprachen Katalanisch und Galicisch. Dennoch finden sich vor allem bei männlichen Sprechern aus Zentralmexiko häufig Elisionen nachtoniger Vokale, wobei es sich zu ungefähr 90 % um Fälle handelt, bei denen der betreffende Vokal in Nachbarschaft zu / s/ auftritt wie etwa in tres‐ cien[ts] ‘dreihundert’ (Martín Butragueño 2014: 163ff.). Ein Grund hierfür mag darin liegen, dass sich aus der Nicht-Realisierung des nachtonigen Vokals eine segmentale Abfolge ergibt, die der (aus dem Nahuatl entlehnten) Affrikate / ts/ entspricht. Klee & Lynch (2009: 120) weisen allerdings darauf hin, dass auch in anderen Kontaktvarietäten des amerikanischen Spanisch vergleichbare Reduktionsphänomene auftreten (zum Andenspanischen vgl. 5.1.5). 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 305 <?page no="306"?> 26 Die resultierende Verminderung des Kontrasts zwischen Vokal und Konsonant lässt sich als Schwä‐ chung des Codakonsonanten interpretieren, wie sie für die genannten Varietäten typisch ist. Die Elision unbetonter Vokale führt zu einer Zunahme komplexer Konsonanten‐ kombinationen, was sich auf rhythmischer Ebene in einer (im Vergleich zu anderen Varietäten des Spanischen) höheren Variabilität konsonantischer Intervalle abbilden sollte. Gleiches ist für den potenziellen Transfer des vokalischen Längenkontrasts aus dem Nahuatl in das Spanische hinsichtlich der vokalischen Variabilität denkbar (vgl. 4.4.2). Entsprechende empirische Studien zum Sprachrhythmus bei nahuatl-spanisch Bilingualen liegen unseres Wissens jedoch bislang nicht vor. Auch sind eventuelle Auswirkungen der Mehrsprachigkeit auf die Intonation bislang nur wenig erforscht. Da sich die Akzentsysteme des Spanischen und des Nahuatl darin gleichen, dass die Pänultimabetonung jeweils den unmarkierten Fall darstellt (zum Spanischen vgl. 4.3.5.3), ist zumindest auf Wortebene kaum prosodischer Spracheneinfluss zu erwarten. Auch hat Velázquez Patiño (2016) hinsichtlich der Frageintonation keine Unterschiede zwischen nahuatl-spanisch Bilingualen auf der einen und lebensweltlich spanisch monolingual aufgewachsenen Spanischsprechern aus derselben Region (Provinz Ve‐ racruz) gefunden. Die für das mexikanische Spanisch typische Zirkumflexkontur in der Intonation von Deklarativ- und Fragesätzen (vgl. 4.5.4.3) lässt sich nach dem momentanen Kenntnisstand nicht auf Kontakt mit dem Nahuatl zurückführen. Deutlicherer Einfluss der autochthonen Sprache lässt sich im auf der Halbinsel Yu‐ catán gesprochenen Spanisch finden. Auf segmentaler Ebene ist hier zunächst die La‐ bialisierung finaler Nasale zu nennen. Wie wir bereits in 2.5.1.3 gesehen haben, ist das Spanische hinsichtlich des Vorkommens von Nasalen im Auslaut stark eingeschränkt. Wortfinal ist in der Normaussprache nur [n] möglich, d. h., es erfolgt Neutralisierung der Phoneme / m/ , / n/ und / ɲ/ zugunsten von [n] (vgl. álbum [ ˈ alβun] ‘Album’); [m] kommt silbenfinal nur in Assimilationskontexten vor, z. B. en Bilbao [em.bil ˈ βao]. Dass die Neutralisierung in einigen Varietäten (Andalusien, Kanarische Inseln, Karibik) auch zugunsten des velaren Nasals [ŋ] erfolgen kann (sog. Velarisierung) haben wir bereits besprochen; durch antizipierte Senkung des Velums wird hierbei meist auch der vorausgehende Vokal nasaliert wie in pan [p-ŋ]. 26 Das yukatekische Spanisch zeichnet sich hingegen durch häufige Labialisierung wortfinaler Nasale aus, die hauptsächlich vor Sprechpausen eintritt, z. B. pan [pam], ¡Vaya bien! [bjem] ‘Mach’s gut! ’ etc. Hier kann insofern übereinzelsprachlicher Einfluss geltend gemacht werden, als das yukatekische Maya - im Gegensatz zum Spanischen - zahlreiche auf / m/ auslautende Wörter aufweist wie etwa am ‘Spinne’ oder lukum ‘Wurm’ (vgl. Michnowicz 2008, Martín Butragueño 2014: 523-528, Uth 2022). Über sprachliche und kulturelle Besonderheiten des auf der Halbinsel Yucatán gespro‐ chenen Spanisch informiert der von Carlos Hornelas Pineda ins Leben gerufene Blog Real Academia de la lengua de Yucatám (http: / / yucatam.blogspot.com/ ). Der Name nimmt ironisch Bezug auf die offiziellen Sprachakademien und verweist mit der Verschriftung der Labialisierung auf die lokale Aussprache des Toponyms. 306 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="307"?> Hinsichtlich der Intonation zeigt sich der Einfluss des yukatekischen Maya vor allem in der prosodischen Fokusmarkierung. Während in den meisten Varietäten des Spanischen kontrastiver Fokus mithilfe besonderer Tonhöhenakzente markiert wird, die mit der metrisch starken Silbe des fokussierten Worts assoziieren (z. B. L+H* im Madrid-Spanischen und L+H*+L im Buenos-Aires-Spanischen; vgl. 4.5.4.1, 4.5.4.2), erscheint im yukatekischen Spanisch unmittelbar vor der Fokuskonstituente ein H-Ton (den man als Grenzton am Beginn der Fokusdomäne interpretieren könnte), während diese selbst nach einem abrupten Tonhöhenabfall prosodisch flach realisiert wird. In Abb. 5.1-8 vergleichen wir die Kontur einer Äußerung mit kontrastivem Fokus im yukatekischen Spanisch mit den entsprechenden Konturen der in Madrid und Buenos Aires gesprochenen Varietäten. Abb. 5.1-8: Tonhöhenverlauf der Äußerung No, al parecer es [ KF Aruma] la que está comprando el diario ‘Nein, anscheinend ist es Aruma, die die Zeitung kauft’ (unten, nach Uth 2019: 369) sowie schematische Darstellung des entsprechenden Tonhöhenverlaufs in den Varietäten von Madrid, Buenos Aires und Yucatán (oben). Die von anderen spanischen Varietäten deutlich abweichende prosodische Fokusmar‐ kierung des yukatekischen Spanisch - H-Ton vor der fokussierten Konstituente und deutlicher Tonhöhenabfall innerhalb dieser - lässt sich als Resultat des langwährenden Kontakts mit dem yukatekischen Maya auffassen, einer Tonsprache, in der die proso‐ dische Phrasierung durch jeweils am linken Phrasenrand platzierte Hochtöne markiert wird (Verhoeven & Skopeteas 2015, Uth 2018: 94f., 2019: 379ff.). In pragmatisch weniger stark markierten Kontexten hat sich die Intonation des yukatekischen Spanisch jedoch der in Mexiko-Stadt gesprochenen Varietät angenähert. Während neutrale Deklarativsätze im Spanischen (wie in der Kontaktsprache) durch einen “descenso notorio en la sílaba nuclear” (Martín Butragueño 2017: 161) gekennzeichnet sind (Nu- 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 307 <?page no="308"?> 27 Anstelle der hispanisierten Schreibungen der Eigennamen Atahualpa und Huáscar verwenden wir jeweils die peruanische Quechua-Schreibung. 28 Die alternativen Schreibungen tragen der Tatsache Rechnung, dass das Phonemsystem des Quechua kein / e/ beinhaltet (vgl. Abb. 5.1-9 und 3.1.2.1), aber den uvularen Verschlusslaut / q/ hat (siehe unten). Wir verwenden dennoch die verbreitete Schreibung <Quechua>. Eine Karte zur heutigen Verbreitung der Quechua-Varietäten findet sich in Buchholz (2024: 6). klearkonfiguration: (H+)L* L%), ist für die Hauptstadtvarietät die in 4.5.4.3 vorgestellte Zirkumflexkontur mit einem steigenden (und meist hochgestuften) Nuklearakzent (L+¡H*) typisch. Wie Uth & Martínez García (2022: 849) gezeigt haben, verwenden sowohl monolinguale Sprecher des yukatekischen Spanisch als auch maya-spanisch Bilinguale den steigenden Nuklearakzent in mehr als der Hälfte der Fälle. Dabei ist bei den bilingualen Frauen die Quote steigender Nuklearakzente (L+¡H* und L+H*) mit 68,3 % am höchsten, was dafür spricht, dass bei dieser Personengruppe das Bedürfnis zur Anpassung an die als Standard wahrgenommene zentralmexikanische Varietät am stärksten ist. 5.1.5 Spanisch und Quechua in den Anden 1532 landet der spanische Eroberer Francisco Pizarro González (ca. 1476-1541) mit seinen Truppen an der Küste des heutigen Peru. Das Reich der Inka, wie es die Kolonisa‐ toren vorfinden, ist durch den erbitterten Machtkonflikt des Inkaherrschers Atawallpa mit seinem Bruder Waskar 27 und die daraus resultierenden internen kriegerischen Auseinandersetzungen strategisch geschwächt (Riese 2016: 77-80). Hinzu kommen wiederkehrende Aufstände zahlreicher unterworfener Völker, die in der Ankunft der Spanier eine Chance auf Befreiung von der Inkaherrschaft sehen. Vor diesem Hintergrund gelingt es den Spaniern trotz deutlicher zahlenmäßiger Unterlegenheit, Atawallpas Heer im gleichen Jahr bei Cajamarca zu schlagen, das Reich zu unterwerfen und den Herrscher in Gefangenschaft zu nehmen - um ihn kurz darauf hinrichten zu lassen (Riese 2016: 10-14). Die Sprachsituation des präkolonialen Inkareichs wird in der Literatur als Diglossie zwischen runi simi (wörtl. ‘Sprache der Menschen, des Volkes’), dem Vorläufer des heutigen Quechua (auch: Kichwa, Qichwa 28 ), und den lokalen Sprachen der unterschiedlichen Regionen beschrieben (Gugenberger 2013: 704f.). Unmittelbar nach der Eroberung der Hauptstadt Cusco setzt die Hispanisierung des öffentlichen Lebens ein, jedoch wird im 1542 gegründeten Vizekönigreich Peru (sp. Virreinato del Perú) bis ins 17. Jahrhundert Quechua auch von der spanischen Administration als Verkehrssprache verwendet, zum einen zur Kommunikation mit der indigenen Bevölkerung und zum anderen zum Zwecke der Christianisierung. Hierzu werden, wenn auch begrenzt, in Cusco und Lima Sprachschulen für Spanisch und Quechua eingerichtet. Die Hispanisierungstendenzen verstärken sich im 17. und 18. Jahrhundert im Zuge des Ausbaus des allgemeinen Schulwesens; 1770 wird per Dekret des spanischen Königs Karls III. die flächendeckende Hispanisierung aller Kolonien verfügt (Gugenberger 2013: 707). Das 19. Jahrhundert ist schließlich durch 308 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="309"?> 29 Daten eines lebensweltlich monolingualen Quechua-Sprechers finden sich im Korpus von Bendezú Araujo et al. (2019). 30 Aymara zählt mit 2,2 Millionen Sprechern zusammen mit Quechua und Guaraní zu den am meisten gesprochenen autochthonen Sprachen in Südamerika. Ob zwischen Aymara und Quechua eine genealogische Verwandtschaft besteht, ist umstritten. Gewisse lautliche Ähnlichkeiten zwischen den südlichen Varietäten des Quechua und dem Aymara lassen sich durch Sprachkontakt erklären. Das Guaraní ist mit keiner der beiden Sprachen verwandt und gehört der Tupí-Familie an (vgl. 5.1.6). 31 Zur Begriffsbestimmung vgl. Greußlich (2021). den weitgehenden Ausschluss des Quechua vom öffentlichen Leben gekennzeichnet, auch wenn davon auszugehen ist, dass zum Zeitpunkt der Loslösung der Andenstaaten von Spanien (Kolumbien 1810, Peru 1821, Bolivien 1825, Ecuador 1830) große Bevölke‐ rungsteile monolingual in den autochthonen Sprachen sind (Rivarola 1990: 108f., Klee & Lynch 2009: 132). Heute wird Quechua von ca. 8 Millionen Menschen gesprochen, wovon die meisten (über 3 Millionen) in Peru leben und - mit unterschiedlicher Sprachdominanz - bilingual sind. In entlegenen Gebieten lassen sich auch heute noch lebensweltlich monolinguale quechuahablantes finden, die über bestenfalls geringe Spanischkenntnisse verfügen (vgl. Buchholz 2024: 8). 29 In Bolivien ist das Quechua seit 2009 gemeinsam mit dem Spanischen und weiteren autochthonen Sprachen (u. a. Ay‐ mara, Guaraní) 30 offizielle Amtssprache; in den mehrheitlich mehrsprachigen Regionen Perus und Ecuadors wird es, wie auch Aymara, neben Spanisch als kooffizielle Sprache geführt. Obwohl die mit dem andinen Spanisch in Kontakt stehenden autochthonen Sprachen einen gewissen Grad an Institutionalisierung erfahren haben und auch in die schulischen Curricula der jeweiligen Länder und Regionen eingebunden sind, gelten die Spuren, die der Bilinguismus im Spanischen auf unterschiedlichen sprachlichen Ebenen hinterlassen hat, als Makel. Mit anderen Worten: Ein eindeutiger “andiner Akzent” oder die Verwendung von Konstruktionen, die vom Standardspanischen abweichen (etwa vom Quechua beeinflusste Wortstellungsvarianten), führen zu sprachlicher Diskriminierung und stellen ein Hindernis für sozialen Aufstieg und Bildungserfolg dar (Pérez Silva et al. 2008, Zavala & Córdova 2010). Im Folgenden besprechen wir Besonderheiten des andinen Spanisch 31 , die auf den Kontakt mit dem Quechua zurückzuführen sind. Dabei gehen wir zuerst auf den Bereich der segmentalen Phonologie ein, bevor wir uns mit der Prosodie befassen. Zunächst unterscheiden sich Spanisch und Quechua darin, dass das Spanische ein dreistufiges Vokalsystem mit den fünf Phonemen / a e i o u/ aufweist, während das des Quechua zweistufig ist und nur drei Phoneme umfasst, nämlich die Vokale / a i u/ , die die Eckpunkte des Vokaldreiecks markieren (3.1.2.1). Wie Abb. 5.1-9 anhand der durchgezogenen schwarzen Linien (links und rechts) zeigt, werden die Vokale des Quechua zentraler im Mundraum realisiert als ihre (im rechten Teil der Darstellung mithilfe gestrichelter Linien vergleichend angezeigten) spanischen Entsprechungen. Im Sinne einer oberflächennahen Repräsentation werden die hohen Vokalphoneme des Quechua deshalb in der Literatur auch oft als / ɪ/ bzw. / ʊ/ repräsentiert (Guion 2003, Pérez Silva et al. 2008). 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 309 <?page no="310"?> 32 Die Bezeichnungen leiten sich von mote, dem Namen eines traditionellen Gerichts aus gekochtem Mais, ab. Abb. 5.1-9: Vokale des Quechua (/ a i u/ , produziert von einem Muttersprachler aus Cusco, links) und des Spanischen (/ a e i o u/ , produziert von einem monolingualen nicht-andinen Sprecher, rechts). Die durchgezogenen Linien markieren in den beiden Vokalräumen die Realisierungen der Vokale des Quechua, die gestrichelten Linien die des Spanischen (nach Pérez Silva et al. 2008: 15, 18). Die Überlappung der spanischen (nicht-tiefen) Vokale / e i/ und / o u/ mit den Vokalen / ɪ/ bzw. / ʊ/ des Quechua hinsichtlich ihrer F 1 - und F 2 -Werte hat zur Folge, dass Menschen, die mit Quechua als L1 aufgewachsen sind und für die Spanisch damit die L2 ist, oft Schwierigkeiten haben, die hohen und mittleren Vokale des Spanischen perzep‐ tiv voneinander zu unterscheiden. Wörter wie puso [ ˈ puso] ‘er/ sie stellte’ und pozo [ ˈ poso] ‘Brunnen’ einerseits und piso [ ˈ piso] ‘Stockwerk’ und peso [ ˈ peso] ‘Gewicht’ andererseits klingen für sie jeweils gleich. Hieraus resultieren wiederum Abweichun‐ gen in der Sprachproduktion wie bei ¿Como estás? ‘Wie geht es dir? ’ als [ ˌ kʊmwɪs ˈ tas] - was von Spanischsprechern als Realisierung von */ komu istas/ wahrgenommen wird. Auch kann es bei der Nennung einzelner Wörter potenziell zu Missverständnissen kommen, etwa wenn mesa ‘Tisch’ wie [ ˈ mɪsa] gesprochen und von den Zuhörenden als Realisierung von misa / misa/ ‘Messe’ interpretiert wird. Entsprechende Ausspra‐ cheabweichungen sind typisch für den als motoseo oder motosidad 32 bezeichneten und sozial stigmatisierten andinen Akzent (Cerrón Palomino 2003: 37ff.). Auch bei der Integration spanischer Lehnwörter ins Quechua kommt der Unterschied zwischen den Vokalsystemen zum Tragen: Spanisches / o/ wie in carro ‘Auto’ wird im Quechua zu / ʊ/ , was sich auch in der Schreibung widerspiegelt (vgl. Calvo Pérez 2 2022: unter karru). Ein weiteres Merkmal des Quechua-Vokalismus besteht darin, dass unbetonte Vokale oft entstimmt (und damit reduziert) oder gar ganz getilgt werden (Delforge 2011; Buchholz & Reich 2018; Gabriel & Reich 2022: 483). Je nach Vokal kann die Reduktionsrate bis zu 91 % betragen (Delforge 2011: 558). Wie Delforge (2008: 110) anhand von mehr als 16.000 Zielsegmenten in unbetonten Silben gezeigt hat, wird auch 310 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="311"?> diese Eigenschaft von Bilingualen ins Spanische transferiert (z. B. contestar [ kʊnt(ɪ ̥ )s ˈ taɾ] ‘antworten’), wobei die Reduktionsrate mit ca. 10 % jedoch deutlich geringer ist als im Quechua. In einer soziophonetischen Studie hat die Autorin zudem gezeigt, dass sich die Desonorisierung und Tilgung unbetonter Vokale nach sozialen Gruppen unterscheidet: Jüngere Sprecher reduzieren weniger als ältere, Frauen weniger als Männer, und die Unterschiede zwischen sozialen Klassen sind bei Jüngeren größer (Delforge 2012). Dieser Befund spiegelt sich in der Bewertung des Phänomens durch die Sprecher selbst wider, die es mit ländlichem Milieu sowie geringem Bildungsgrad und sozioökonomischem Status in Verbindung bringen; Menschen, deren Aussprache entsprechend gekennzeichnet ist, charakterisieren sie u. a. folgendermaßen: “Personas que han emigrado a la ciudad del campo y no hablan el español correctamente - mayormente de pocos recursos y poca cultura” (‘Leute, die vom Land in die Stadt gezogen sind und nicht richtig Spanisch sprechen - meistens arm und ungebildet’, Delforge 2012: 324). Im Bereich des Konsonantismus ist die Sonorisierung von intervokalischem / s/ ein auffälliges Merkmal (Davidson 2019, García 2020, Klee et al. 2023). In nördlichen Varietäten des Quechua (Ecuador, nördliches Peru) wird / s/ in intervokalischer Position regelhaft stimmhaft realisiert (Davidson 2019: 118). Bilinguale, vor allem jüngere männliche Personen, übertragen dieses Phänomen ins Spanische, z. B. sus amigos [su.za ˈ miɣos] oder la sopa [la ˈ zopa] (García 2020: 456). Neben Alter und Geschlecht sind auch die individuelle Sprachdominanz und das Umfeld ein relevanter Faktor. So hat Davidson (2019: 133) gezeigt, dass quechua-dominante Sprecher in einer ecuadorianischen Kleinstadt in mehr als der Hälfte der Fälle intervokalisches / s/ sonorisieren, während dies bei Personen, die aus andinen Gebieten nach Lima übergesiedelt sind, in nur 20 % der Fälle vorkommt - vermutlich, weil sie das insbesondere in der peruanischen Hauptstadt stigmatisierte Phänomen vermeiden. In südlichen Quechua-Varietäten (Cusco) tritt die / s/ -Vokalisierung nur wenig auf. Entsprechend kommt sie auch bei Bilingualen aus Peru im Spanischen deutlich seltener vor (Klee et al. 2023). Auch hier liegt die Sonorisierungsrate bei jüngeren Sprechern und bei Männern höher als bei älteren und bei Frauen, wobei insgesamt große individuelle Unterschiede von zwischen 0 und 30 % bestehen (Klee et al. 2023: 107ff.). Weiterhin unterscheiden sich das Spanische und das Quechua hinsichtlich ihres Repertoires an Verschlusslauten. Während das Spanische über je eine Serie stimmhafter und stimmloser Plosivphoneme mit den Ortsmerkmalen [labial], [alveolar] und [velar] verfügt (/ b d ɡ p t k/ , vgl. 2.5.1.1, 3.1.2.2), hat das Quechua uvulare Verschlusslaute (so etwa im Ortsnamen Cusco, der im Quechua entsprechend Qusqu geschrieben wird). Die sich hieraus ergebende Serie von vier Artikulationsstellen liegt bezüglich der laryngalen Merkmale (vgl. 3.1.1) in drei Versionen vor: 1. stimmlos und nicht-aspiriert (d. h. mit kurzer positiver VOT: / p t k q/ ), 2. stimmlos und aspiriert (d. h. mit langer 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 311 <?page no="312"?> 33 Ejektive sind Konsonanten (meist Verschlusslaute), die ohne Beteiligung der Lungenatmung durch eine Aufwärtsbewegung des Kehlkopfes bei geschlossenen Stimmlippen und anschließender Lösung des oralen Verschlusses gebildet werden. In der IPA-Umschrift werden sie durch das nachgestellte Hochkomma symbolisiert. 34 Insofern lässt sich die Media Lengua auch als spanisch relexifiziertes Quechua bezeichnen. Das folgende Beispiel aus Muysken (1997: 365) zeigt, wie spanische Vokabeln mit Suffixen des Quechua kombiniert werden. Auch die Wortstellung (SVO) entspricht der des Quechua. Zum besseren Ver‐ ständnis werden die parallele Struktur des Quechua, die Glossierung und die spanische Übersetzung angegeben. Media Lengua unu fabur-ta pidi-nga-bu bini-xu-ni Quechua shuk fabur-da maña-nga-bu shamu-xu-ni ein Gefallen-AKK bitten-NOMIN-BENEF kommen-PROG-1SG Spanisch Vengo para pedir un favor. Anhand der lexikalischen Wörter wird auch die lautliche Anpassung an das Quechua deutlich: favor > fabur, pedir > pidi, venir > bini. positiver VOT: / p h t h k h q h / ) und 3. ejektiv 33 (/ p’ t’ k’ q’/ ). Voll stimmhafte Plosive (d. h. Laute mit negativer VOT) kennt das klassische Quechua ursprünglich nicht. Allerdings wird mit dem spanischen Lehngut, das ca. 30 % des heutigen Wortschatzes ausmacht, die volle Stimmhaftigkeit bei mit / b d ɡ/ anlautenden Wörtern wie basu ‘Glas’ (< sp. vaso, vgl. Calvo Pérez 2 2022: s. v. basu) ins Quechua übernommen. Dabei ist, wie Stewart (2018: 189) gezeigt hat, die negative VOT im Quechua und im Spanischen der Bilingualen länger als im (monolingualen) Spanisch der städtischen Bevölkerung. Gleiches gilt auch für die Aussprachen solcher Wörter in der sog. Media Lengua, einer vom Linguisten Pieter Muysken in den 1970er Jahren bei der Feldforschung entdeckten Mischsprache, die - vereinfacht gesagt - die Grammatik des Quechua mit spanischem Vokabular verbindet (vgl. Muysken 1997). 34 Die Überanpassung an die volle Stimmhaftigkeit des Spanischen bei den entlehnten Segmenten / b d ɡ/ , die man auch als target overshoot bezeichnet, wird von Stewart & Meakins (2021: 67) bestätigt. Als ein letztes segmentales Merkmal sei die bereits im Zusammenhang mit dem zentralmexikanischen Spanisch besprochene Assibilierung des / r/ erwähnt, die auch in andinen Varietäten auftritt (Klee & Lynch 2009: 136f.). Wegen der oben beschriebenen Vokalreduktion entstehen zahlreiche Konsonanten‐ verbindungen, die in standardnahen Varietäten des Spanischen so nicht vorkommen. Dies wiederum hat einen Einfluss auf den Sprachrhythmus. So hat O’Rourke (2008) gezeigt, dass das von Sprechern aus bilingualen Regionen wie Cusco produzierte Spanisch eine höhere konsonantische Variabilität (VarcoC) aufweist als das monolin‐ gualer Spanischsprecher. Auch in den Bereichen Akzentsystem und Intonation lässt sich im andinen Spanisch der Einfluss des Quechua ausmachen. Für die in Cusco und Umgebung gesprochene Varietät des Quechua geht O’Rourke (2005: 40ff.) von einem wortbasierten Intonationssystem aus, wobei in fast allen Wörtern bzw. Wortformen Pänultimabetonung vorliegt (z. B. [ ˈ wa.si] ‘Haus’ [wa ˈ si.pi] ‘im Haus’); die Apokope der finalen Silbe, etwa durch Vokaltilgung, kann zur Endbetonung führen. Prosodisch 312 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="313"?> werden die Akzentpositionen durch F 0 -Bewegungen realisiert, deren Gipfel im Rahmen der betonten Silbe erreicht wird. Dies entspricht den Tonhöhenakzenten L+H* und L+H*+L (vgl. Abb. 5.1-10, oben). Für das in Huari gesprochene Quechua geht Buchholz (2024: 299ff.) davon aus, dass die Zuweisung von akzentuellen Prominenzen auf der Ebene der phonologischen Phrase erfolgt, deren Beginn und Ende durch Tonhöhenbe‐ wegungen markiert werden können. Auf der phonetischen Ebene ergeben sich hieraus (nicht nur, aber vorwiegend) Tonhöhenkonturen, die im Rahmen einer Silbe steigen (LH) bzw. steigen und fallen (LHL). In diesem Fall wird keiner der Teiltöne mit dem Asterisk markiert, da keine Assoziierung mit einer metrisch starken Silbe angenommen wird. Abb. 5.1-10: Intonation des Quechua. Oben: Iskay warmi-pi pinsa-chka-n zwei Frau-LOC den‐ ken-PROG-3SG ‘Sie denkt an zwei Frauen’ (Varietät von Cusco, nach O’Rourke 2005: 55). Unten: mögliche tonale Realisierungen von kanan ‘jetzt’, pitsana ‘Besen’ und taa-yaa-naa ‘sie lebten’ (Varietät von Huari, nach Buchholz 2024: 327f.). Die für das Quechua typischen Tonhöhenanstiege innerhalb einer Silbe haben sich in der Intonation des andinen Spanisch insofern niedergeschlagen, als - im Gegensatz zum kastilischen und zum (zentral)mexikanischen Spanisch, vgl. 4.5.4.1, 4.5.4.3) - die unmarkierte Realisierung von Pränuklearakzenten der steigende Tonhöhenakzent mit früher Alignierung (L+H*) ist (O’Rourke 2005, Buchholz 2024). Anders als im Porteño-Spanischen, das gleichfalls aufgrund von kontaktbedingtem Wandel im prä‐ nuklearen Bereich L+H* aufweist (vgl. 4.5.4.2), gilt dies auch für den Nuklearakzent, der 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 313 <?page no="314"?> im Normalfall ebenfalls als steigender Ton mit früher Alignierung realisiert wird. Ein Beispiel für eine Sequenz von steigenden Tonhöhenakzenten des Typs L+H* im andinen Spanisch geben wir in Abb. 5.1-11. Die Pränuklearakzente werden mehrheitlich steigend mit früher Alignierung (L+H*) und teils als Hochton ohne Anstieg in der betonten Silbe (hier notiert als (L+)H*) realisiert; der Nuklearakzent hat ebenfalls die Form L+H*. Abb. 5.1-11: Oszillogramm, Spektrogramm mit F 0 -Kontur sowie Annotation (von oben nach unten: Grenztöne, Tonhöhenakzente, Silben in IPA, Wörter in orthographischer Transkription) des Teilsatzes El zorillo pequeño está en frente de la casa grande ‘Das kleine Stinktier ist vor dem großen Haus’ produziert von einem bilingualen Sprecher aus Huari (nach Buchholz 2024: 238). Wie Buchholz (2024: 170) insgesamt zeigt, weist das andine Spanisch (zumindest in der von ihm untersuchten Varietät) mit einem einzigen Tonhöhenakzent (L+H*) und je drei Grenztönen auf ip- und IP-Ebene (L-/ L%, H-/ H%, LH-/ LH%) ein im Vergleich zu anderen spanischen Varietäten simples Tonsystem auf. Interessanterweise lässt sich dies auch für andere lateinamerikanische Varietäten zeigen, die sich in mehrsprachigen Kontexten herausgebildet haben. So haben Rao & Sessarego (2018) und Fenton et al. (2020) gezeigt, dass die in Ecuador und Peru von den Nachfahren schwarzer Sklaven gesprochenen afrohispanischen Varietäten ebenfalls einfache Tonsysteme mit früh alignierten steigenden Pränuklear- und Nuklearakzenten aufweisen. Hierfür ist allerdings kein Einfluss des Quechua geltend zu machen; vielmehr liegen (wie auch bei der Herausbildung von Kreolsprachen) eine Vielzahl von (meist afrikanischen) Sprachen zugrunde, die von den heutigen Sprechern jedoch nicht mehr gesprochen werden. Man geht davon aus, dass in früheren Sprachzuständen durch multiplen Transfer ein hoher Grad von Variabilität vorgelegen hat und dass sich im Zuge der Konsolidierung der jeweiligen Kontaktvarietäten bestimmte Merkmale - hier der steigende Tonhöhenakzent L+H* - generalisiert haben (vgl. hierzu auch die Diskussion über die argentinische Frageintonation in 5.1.7). 314 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="315"?> 35 Die Verwendung anderer Sprachen als Hauptkommunikationsmittel im privaten Bereich ist mit 2 % marginal. 36 Morpheme, die einen Aussagesatz in einen Fragesatz umwandeln, gibt es auch in vielen anderen Sprachen, so etwa im Lateinischen (Dormitne? schlaf-3 S G - Q ‘Schläft er/ sie? ’), im Türkischen (Gelecek misin? Komm- F U T Q -2 S G ‘Wirst du kommen? ’) oder, wie wir bereits in 4.5.1 gesehen haben, im Mandarin-Chinesischen ( 你是德国人吗 ? Nǐ shì déguó rén ma? du sein Deutschland Mensch Q ‘Bist du Deutsche/ r? ’). 37 Mit dieser Wortstellung, die der des Aussagesatzes entspricht, wird eine Frage zum Ausdruck gebracht, die den Fokus auf das Subjekt legt (also ungefähr: ‘Ist es Maria, die in Paraguay wohnt? ’). Um eine neutrale Frage zu formulieren, die den Wahrheitswert der Aussage erfragt, muss der Fragemarker piko an die Verbform treten, die dann in die satzinitiale Position verschoben wird: Oiko piko María Paraguáipe? Für Genaueres vgl. Estigarribia (2020: 237-240). 5.1.6 Spanisch und Guaraní in Paraguay Die sprachliche Situation der República del Paraguay ist insofern einzigartig, als hier im Unterschied zu Mexiko (5.1.4), zu den Andenstaaten (5.1.5) und zu weiteren latein‐ amerikanischen Ländern der größte Teil der Bevölkerung im Alltag nicht vorwiegend Spanisch spricht, sondern mehrheitlich mit dem Guaraní eine autochthone Sprache verwendet. So zeigen die Daten der paraguayischen Volkszählung von 2022, dass von den insgesamt befragten 6,7 Mio. Personen 34,4 % zu Hause sowohl Spanisch als auch Guaraní sprechen; 33,4 % der Befragten verwenden ausschließlich Guaraní und 29,6 % ausschließlich Spanisch (INE 2022). 35 Das bedeutet, dass etwas mehr als zwei Drittel der Bevölkerung im privaten Bereich Guaraní spricht - entweder ausschließlich oder abwechselnd mit dem Spanischen. Das Guaraní (Eigenbezeichnung: avañeʼẽ), das nicht nur in Paraguay, sondern auch in Nordostargentinien (Provinz Corrientes) sowie im südwestlichen Brasilien und in Teilen Boliviens von insgesamt ca. 4-5 Millionen Men‐ schen gesprochen wird, zählt zur Familie der Tupi-Sprachen und unterscheidet sich auf grammatischer Ebene deutlich vom Spanischen. So werden im Guaraní keine (voran‐ gestellten) Präpositionen verwendet wie in sp. en el Paraguay ‘in Paraguay’, sondern (nachgestellte und mit dem Bezugswort zusammengeschriebene) Postpositionen wie in gua. Paraguáipe (Paraguay=in) ‘in Paraguay’. Weiterhin werden Ja/ Nein-Fragen weder syntaktisch noch prosodisch markiert, wie es im Spanischen der Fall ist: Während in sp. ¿Vive María en el Paraguay? ‘Wohnt Maria in Paraguay? ’ der interrogative Satzmodus durch Subjekt-Verb-Inversion und eine von der Intonationskontur des entsprechenden Deklarativsatzes abweichende Sprachmelodie (vgl. 4.5.4) angezeigt wird, erfolgt im Guaraní die Markierung von Fragesätzen auf morphologischer Ebene, nämlich durch das Anfügen eines Fragemarkers ( Q ) 36 wie z. B. piko, der an die erste syntaktische Phrase des Satzes tritt. So lässt sich der Aussagesatz María oiko Paraguáipe (Maria wohnt Paraguay=in) ‘Maria wohnt in Paraguay’ in den entsprechenden Fragesatz María piko oiko Paraguáipe? (Maria Q wohnt Paraguay=in) ‘Wohnt Maria in Paraguay? ’ umwandeln. 37 Einen leicht zugänglichen Gesamtüberblick über den Sprachbau des Guaraní bietet die im Open Access verfügbare Grammatik von Estigarribia (2020). Als Beispiel für eine in Paraguay erschienene linguistisch fundierte Grammatik mit sprachpolitischem 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 315 <?page no="316"?> Anspruch (Förderung des Bilinguismus) sei Zarratea (2002) genannt; vgl. auch Abb. 5.1-12. Unter https: / / guaranicorpus.usc.edu/ index.html findet sich ein transkribiertes und morphologisch annotiertes Korpus mündlicher Erzählungen mit den entsprechen‐ den Aufnahmen. Als älteste grammatische Beschreibung des Guaraní gilt der 1639 vom Jesuitenmönch Antonio Ruiz de Montoya veröffentlichte Tesoro de la lengua guaraní (‘Thesaurus (wörtl. Schatz) der Sprache Guaraní’). Überhaupt spielten die Jesuiten, die im 17. und 18. Jahrhundert auf dem Gebiet des heutigen Paraguay zur Missionierung der Bevölkerung und zur gemeinsamen Bewirtschaftung kleinerer bis mittelgroßer Län‐ dereien sog. Reduktionen (sp. reducciones, vgl. Hüttel 1996) gegründet hatten, eine zentrale Rolle für die Erhaltung der autochthonen Sprache: In den Gemeinschaften der reducciones jesuíticas, die von der spanischen Krone unabhängig und direkt der Kirche unterstellt waren, wurde das Guaraní in einer von den Jesuiten kodifizierten und auf mehreren Varietäten der Sprache beruhenden Form als alleiniges Kommuni‐ kationsmittel verwendet (vgl. Zajícová 2009: 23-26; Symeonidis 2013: 809). Damit hatte sich das Guaraní als Verkehrssprache so weit etabliert, dass es nach dem Verbot des Jesuitenordens durch den spanischen König Carlos III. und der Vertreibung seiner Mitglieder aus den Kolonien (1767) die am meisten genutzte Sprache blieb. Auch nach der Unabhängigkeit Paraguays (1811) wurde es über alle Gesellschaftsschichten hinweg als Alltagssprache genutzt. Dieser Trend verstärkte sich, als während der Regierungszeit des Diktators Gaspar Rodríguez de Francia (1814-1840) das Land politisch isoliert wurde und der Kontakt zur spanischsprachigen Welt eingeschränkt war. Um die Vorherrschaft der spanischstämmigen Oberschicht zu brechen, wurden zudem ethnisch gemischte Familiengründungen gesetzlich bevorzugt - mit dem Ziel, eine völlig durchmischte Bevölkerung zu schaffen (“una población totalmente mestiza”, Alcàzar Garrido 2007: 130). Auch dies trug zur Festigung der autochthonen Sprache bei, die im Krieg des jungen Staates gegen die Triple Alianza Brasilien, Uruguay und Argentinien (1865-1870) zum Symbol der nationalen Einheit gegen den äußeren Feind wurde. Während des Chaco-Kriegs gegen Bolivien (1932-1935) war die Verwendung des Spanischen sogar offiziell verboten (vgl. Symeonidis 2013: 810). Nach Kriegsende und erneuter Öffnung des Staates für internationale Kontakte etablierte sich das Spa‐ nische jedoch im öffentlichen Bereich als dominante Sprache, wobei das Guaraní die im privaten Bereich vorherrschende Sprache blieb. Unter der Militärdiktatur (1954-1989) des Generals Alfredo Stroessner Matiauda, Sohn eines oberfränkischen Einwanderers und einer wohlhabenden Paraguayerin ethnisch gemischter Abstammung, wurden in der Verfassung von 1967 Guaraní und Spanisch als Nationalsprachen festgeschrieben, wobei dem Spanischen die Verwendung im öffentlichen Raum zukam: “Los idiomas nacionales de la República son el español y el guaraní. Será de uso oficial el español” (§ 5, zit. n. Zajícová 2009: 45). Nach der Demokratisierung des Landes wurde das Guaraní in der Verfassung von 1992 dem Spanischen offiziell gleichgestellt. Die heutige sprachliche Situation in Paraguay ist durch eine stabile Zweisprachig‐ keit gekennzeichnet, wobei der städtische Raum (u. a. die Hauptstadt Asunción) 316 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="317"?> 38 Der Vokal / ɨ/ kommt u. a. auch im Rumänischen vor, wo er <â> oder <î> geschrieben wird, z. B. român ‘rumänisch’. In der Darstellung von Walker (1999: 69) wird der sechste Vokal des Guaraní als hinterer ungerundeter Vokal / ɯ/ bzw. / ɯ̃ / repräsentiert, der - allerdings nur als Oralvokal - auch im Türkischen vorkommt und dort in der Schreibung als i ohne Punkt <ı> repräsentiert wird, z. B. ışık ‘Licht’. teils durch ausgeglichenen Bilinguismus, teils durch spanische Dominanz bis hin zu (wenn auch marginaler) spanischer Einsprachigkeit gekennzeichnet ist. In ländlichen Gebieten hingegen sind die meisten Sprecher im Guaraní dominant; hinzu kommen Personen, die als funktional monolinguale Guaraní-Sprecher (mit nur geringen aktiven Spanischkenntnissen) zu bezeichnen sind (Palacios Alcaine 2 2011). Im Bildungssystem sind beide Sprachen fest verankert, wobei die vorherrschende Unterrichtssprache in Schule und Universität das Spanische ist. Allerdings ist auch für lebensweltlich spanisch aufwachsende Kinder und Jugendliche der schulische Erwerb des Guaraní verpflichtend; auf diese Weise soll der Bilinguismus gefestigt werden (Ito 2012). Hinsichtlich des Guaraní ist zu unterscheiden zwischen der auch als guaraniete be‐ zeichneten, im Bildungssystem vermittelten Norm und dem Jopara (auch: yopará oder guarañol), d. h. einer umgangssprachlichen Form des Guaraní, die starke spanische Einflüsse aufweist und deshalb in der Literatur auch als der Media Lengua (vgl. 5.1.5) ähnliche Mischsprache aufgefasst wird (Herring Dudek & Clements 2021). Der Status des Jopara als Mischsprache ist jedoch umstritten; einige Forschende sehen hierin lediglich eine “durch ein häufiges Code-Switching zwischen dem Spanischen und dem Guaraní gekennzeichnete Sprachvarietät, ohne dass dabei eine der beiden Sprachen ihre grundlegenden morphosyntaktischen Strukturen verliert” (Symeonidis 2013: 813f.). Ähnlich äußert sich Kallfell (2011: 57), der das Jopara als “ein Sprechen mit zwei Sprachsystemen” charakterisiert. Zur historischen Entwicklung des Kontakts zwischen dem Spanischen und dem Guaraní vgl. auch Klee & Lynch (2009: 153-157) und Palacios Alcaine ( 2 2011). Vor dem Hintergrund des jahrhundertelangen intensiven Kontakts mit dem Guaraní verwundert es kaum, dass das in Paraguay gesprochene Spanisch auf lautlicher Ebene zahlreiche Merkmale aufweist, die sich als Ergebnis kontaktinduzierten Wandels in‐ terpretieren lassen: “El español del Paraguay es español con fonética guaraní” (Alonso 1941/ 1951: 325). Vor dem Hintergrund neuerer Studien ist, wie sich im Folgenden zeigen wird, diese radikale Auffassung allerdings etwas zu relativieren. Das Vokalsystem des Guaraní ist wie das des Spanischen dreistufig. Zusätzlich zu den Vokalphonemen / a e i o u/ beinhaltet es jedoch den zentralen hohen Oralvokal / ɨ/ . 38 Alle sechs Vokale treten im Guaraní in oraler und nasaler Variante auf, wobei letztere in der Schreibung durch die Tilde markiert wird (z. B. <->); vgl. Krivoshein de Canese & Corvalán (1987: 21) und Estigarribia (2020: 26). 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 317 <?page no="318"?> 39 Der Glottisschlag kommt auch in der Eigenbezeichnung avañeʼẽ [ʔ-ʋ-ɲẽ ˈ ʔẽ] vor. Im Wortinneren wird er durch das Zeichen <’> repräsentiert; am Wortanfang wird er in der Schreibung nicht wiedergegeben. Abb. 5.1-12: Das Vokalsystem des Guaraní nach Zarratea (2002: 40, links) und gemäß IPA (nach Esti‐ garribia 2020: 27, rechts). In Zarrateas Darstellung wird der zentrale Oralvokal [ɨ] abweichend von der IPA-Konvention durch das in der Guaraní-Schreibung hierfür verwendete Zeichen <y> wiedergegeben, während bei allen anderen Vokalen sich IPA-Konvention und Schreibung entsprechen. Oben zeigen die Pfeile jeweils den Kontrast zwischen zwei Phonemen hinsichtlich der Dimension [±vorne] an, unten hinsichtlich der Dimension [±offen]. Der zweisprachige Appell zur Förderung der guaraní-spanischen Zweisprachigkeit macht die sprachpolitischen Ambitionen des Werks deutlich. Reflexe des Guaraní-Vokalsystems finden sich im paraguayischen Spanisch unter anderem in der Realisierung des (zugrundeliegenden) hohen Vokals / u/ als [ɨ], vor allem in Diphthongen wie beispielsweise in puerta [ pɨ ̯ eɾta ] oder in der Partikel pues, die bei Elision des auslautenden / s/ als [pɨ] ausgesprochen wird. Krivoshein de Canese & Corvalán (1987: 25) erklären die Realisierung von / u/ als [ɨ] durch die Abwesenheit der Kombination / pue/ [pwe] im Guaraní. Auffällig ist weiterhin die starke Nasalisierung von Vokalen in Nachbarschaft zu Nasalkonsonanten wie z. B. in mundo [ ˈ mũndo] sowie die damit oft einhergehende Tilgung des nachfolgenden Nasalkonsonanten wie in [ ˈ l-paɾa] lámpara ‘Lampe’ oder [ ˈ votõ] botón ‘Knopf ’ (vgl. De Granda 1982: 150 und Krivoshein de Canese & Corvalán 1987: 234; zur [v]- oder [ʋ]-Aussprache des bilabialen Plosivs / b/ siehe unten). Im Bereich des Konsonantismus sind vor allem folgende Faktoren relevant: Zunächst verfügt das Guaraní über einen phonemischen Glottisschlag / ʔ/ (Walker 1999: 68; Estigarribia 2020: 30), der - ähnlich wie im Deutschen - am Beginn vokalisch anlautender Wörter und in intervokalischer Position auftritt, um das unmittelbare Aufeinandertreffen zweier Vokalsegmente zu vermeiden. 39 Als Beispiele für die ent‐ sprechende Verwendung von / ʔ/ im paraguayischen Spanisch nennen Krivoshein de 318 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="319"?> 40 Nach Walker (1999: 68) tritt der Reibelaut [v] im Guaraní als Allophon des an der gleichen Artikulationsstelle produzierten approximantischen Phonems / ʋ/ auf und wurde vermutlich aus der Kontaktsprache ins Spanische übernommen. Canese & Corvalán (1987: 23) u. a. me ca[ʔ]í ‘ich bin hingefallen’ und alco[ʔ]ol ‘Alkohol’. Ein weiteres Beispiel geben wir in Abb. 5.1-13. Abb. 5.1-13: Glottisschlag in der Äußerung Es de mi [ʔ]hijo ‘Das ist von meinem Sohn’, produziert von einer guaraní-dominanten Sprecherin (Aufnahme: 2014). Der Beginn des Anlautvokals von hijo ist zusätzlich durch Glottalisierung (creaky voice) markiert; in der IPA-Transkription wird dies durch die Tilde unter dem Vokalsymbol angezeigt ([ḭ]). Ein weiteres typisches Merkmal des paraguayischen Spanisch ist das Auftreten des stimmhaften labiodentalen Frikativs [v], der insbesondere in emphatischer Redeweise als Oberflächenvariante des zugrundeliegenden bilabialen Plosivs / b/ vorkommt (der in Nicht-Kontaktvarietäten des Spanischen als Frikativapproximant [β] realisiert wird, vgl. 2.5.1.1 und 3.2). Ein Beispiel hierfür ist die Aussprache des initialen / b/ im Adjektiv bárbaro ‘großartig’ als gelängter Frikativ [v] in ¡Qué [vː]árbaro! ‘Wie großartig! ’ (Gabriel et al. 2020b: 42). 40 In Bezug auf die Aussprache von <y> und <ll> wird in großen Teilen der Literatur die Auffassung vertreten, dass die phonemische Opposition / ʝ/ vs. / ʎ/ beibehalten werde (z. B. De Granda 1982: 171; Lipski 1994: 307f.) und das paraguayische Spanisch keinen yeísmo kenne. Vor dem Hintergrund neuerer empirischer Studien ist dies jedoch zu relativieren. Wie Gabriel et al. (2020b) auf der Grundlage eines Korpus von gelesenen, semi-spontansprachlichen und spontansprachlichen Daten in beiden Sprachen gezeigt haben, spielt die distinción (die im aktuellen Sprachgebrauch der meisten spanischen Varietäten vom yeísmo verdrängt wurde, vgl. 2.5.1.2, 2.5.1.4, 3.1.2.4) nur noch in der Le‐ seaussprache eine größere Rolle. Ansonsten sprechen die Faktoren Alter und Datentyp für eine zunehmende Verbreitung des yeísmo auch im paraguayischen Spanisch: Nur 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 319 <?page no="320"?> 41 Zur Integration der Partikel piko ins Spanische vgl. auch Palacios Alcaine ( 2 2011: 33ff.). von Sprechern über 50 Jahren wird <ll> mehrheitlich als Lateral [ʎ] ausgesprochen, während diese Realisierung bei Personen unter 20 gar nicht (mehr) vorkommt. Zudem tritt die Beibehaltung der unterschiedlichen Aussprache von <y> und <ll> hauptsäch‐ lich in gelesenen Daten auf, während dies in (semi-)spontansprachlichen Daten kaum der Fall ist. Dies spricht dafür, dass sich das paraguayische Spanisch in Bezug auf das Phänomen des yeísmo von anderen Varietäten nicht grundsätzlich unterscheidet. Das Vorkommen der distinción in der Leseaussprache lässt sich vermutlich als Effekt der im schulischen Unterricht vermittelten Norm interpretieren, an der sich insbesondere guaraní-dominante Menschen orientieren - vermutlich, um zu zeigen, dass sie die nicht vom Guaraní beeinflusste Normaussprache des Spanischen beherrschen. Für eine solche Interpretation spricht, dass die monolingual aufgewachsenen spanischen Sprecher des von Gabriel et al. (2020b) analysierten Korpus auch beim Vorlesen kein [ʎ] produzieren: Da sie im Alltag ohnehin nicht zwischen Guaraní und Spanisch wechseln (und auch kein Jopara sprechen), müssen sie im Spanischen auch keine Normorientierung unter Beweis stellen. Auf kontaktbedingten Wandel im paraguayischen Spanisch auf prosodischer Ebene haben bereits Krivoshein de Canese & Corvalán (1987) hingewiesen: Wenn die mor‐ phologische Markierung des interrogativen Satzmodus durch Fragepartikeln wie piko 41 aus dem Guaraní übernommen wird, weisen die entsprechenden spanischen Fragesätze keine spezifische Intonation auf: “[L]a entonación ascendente que se usa en el español para indicar interrogación, permanece descendente […] en ese caso” (S. 34). Pešková (2022) hat dieses Phänomen auf empirischer Basis untersucht und u. a. gezeigt, dass spanische Fragesätze, die mit der aus dem Guaraní entlehnten Partikel piko markiert sind, nicht die für zahlreiche spanische Varietäten typische stark steigende Schlusskontur haben (vgl. 4.5.4.1 zum kastilischen und 4.5.4.3 zum mexikanischen Spa‐ nisch), sondern stattdessen einen spät beginnenden Tonhöhenanstieg (analysiert als komplexer Grenzton LH%) aufweisen, der in dieser Form auch im Guaraní vorkommt. Als Beispiel zeigen wir in Abb. 5.1-14 die Kontur einer nicht-neutralen Ja/ Nein-Frage. 320 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="321"?> Abb. 5.1-14: Realisierung des Fragesatzes ¿Todavía piko no vino el electricista? ‘Ist der Elektriker immer noch nicht gekommen? ’ durch eine guaraní-dominante Sprecherin (Aufnahme: 2014). Der interrogative Modus wird durch die Fragepartikel piko ( Q ) und den (hier heruntergestuften) finalen Grenzton L! H% angezeigt (nach Pešková 2022: 17). Spuren des Kontakts mit dem Guaraní zeigen sich auch in der intonatorischen Gestaltung von Wh-Fragen (Pešková 2023a) und von Deklarativsätzen (Pešková 2024). Im Bereich des Rhythmus sind im paraguayischen Spanisch keine kontaktbedingten Besonderheiten zu erwarten: Wie Estigarribia (2020: 45) im Rahmen eines Vergleichs mit dem Englischen hervorhebt, weist das Guaraní im Gegensatz zu diesem keine (qua‐ litative und quantitative) Reduktion unbetonter Vokale auf. Insofern ist anzunehmen, dass das Guaraní einen eher silbenzählenden Rhythmus hat und darin dem Spanischen gleicht. 5.1.7 Spanisch im Kontakt mit Migrationssprachen: Das Beispiel Argentiniens Im Zusammenhang mit der Besprechung dialektaler Unterschiede in der spanischen Intonation haben wir festgehalten, dass die in Buenos Aires gesprochene Varietät (Por‐ teño-Spanisch) durch die Sprachmelodie der Migrationssprache Italienisch beeinflusst ist: Die ca. 3,5 Millionen Arbeitssuchenden aus unterschiedlichen Gegenden Italiens, die ab der Mitte des 19. Jahrhunderts nach Argentinien eingewandert waren und sich vor allem in der Hauptstadt niedergelassen hatten, haben beim Erwerb des Spanischen als Fremdsprache tonale Merkmale der von ihnen gesprochenen italoromanischen Varietäten auf die Zielsprache übertragen. Ihre Einwanderer- und Lernervarietät - die oft auch nach einer den Typus des sympathischen italienischen Einwanderers 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 321 <?page no="322"?> 42 Für Genaueres hierzu vgl. Meo Zilio (1993) und Engels (2012). 43 Allgemein zum italienischen Einfluss im argentinischen Spanisch vgl. Ennis (2015), Kailuweit (2021: 346-352) und Kropp (2021: 327ff.). verkörpernden Figur des Boulevardtheaters als cocoliche bezeichnet wird 42 - war ursprünglich als soziolinguistisch niedrig markiert. Heutzutage kann das auf mehreren sprachlichen Ebenen italienisch beeinflusste Porteño-Spanische jedoch als argentini‐ sche Standardvarietät gelten (vgl. Pešková et al. 2012b, Gabriel 2018, Kailuweit 2021). Neben zahlreichen italienischen Lehnwörtern wie etwa laburo ‘Arbeit’ (< it. lavoro, statt trabajo) oder manyar ‘essen’ (< it. mangiare, statt comer; vgl. Veith 2008) findet sich, wie die Sprach- und Bildungswissenschaftlerin Berta Elena Vidal de Battini schon 1964 hervorhob, italienischer Einfluss insbesondere auf prosodischer Ebene: “Ya es común que los extranjeros comenten como algo sabido que Buenos Aires habla con entonación italiana” (‘Es ist mittlerweile üblich, dass Ausländer sagen, man spreche in Buenos Aires mit italienischer Intonation’, Vidal de Battini 1964: 144). 43 Die Gründe für die weltweit wohl einzigartige soziolinguistische Aufwertung einer ursprünglich stigmatisierten Einwanderervarietät zum nationalen Standard sind vielfältig. So steht die Herausbildung einer nationalen Identität im seit 1816 unabhängigen Argentinien in engem Zusammenhang mit der Selbstkonstitution des jungen Staates als Einwander‐ nation, wobei insbesondere die Migration aus Europa als identitätsstiftender Faktor im Vordergrund stand (vgl. Devoto 2008 für einen Überblick). Dabei stellten aus Italien stammende Migranten die zahlenmäßig größte Einwanderergruppe dar, die zu Beginn des 20. Jahrhunderts in Buenos Aires knapp ein Drittel der Einwohnerschaft ausmachte (wobei der Anteil in einigen Stadtvierteln wie La Boca und San Telmo deutlich höher lag). Ein weiterer, nicht zu vernachlässigender Grund ist im maßgeblichen Beitrag der italienischen Immigration zum wirtschaftlichen Aufschwung Argentiniens zu sehen (Baily 1999: 202). Wir haben bereits darauf hingewiesen, dass die Alignierung der Pränuklearakzente (die den Tonhöhengipfel gegen Ende der metrisch starken Silben erreichen, L+H*) auf den migrationsbedingten Kontakt mit italoromanischen Varietäten zurückzuführen ist. Dies gilt auch für die weiteren in 4.5.4.2 erwähnten auffälligen Merkmale der Porteño-Intonation: So findet sich der tritonale Tonhöhenakzent (L+H*+L), der einen F 0 -Anstieg und -Abfall innerhalb derselben Silbe aufweist und bei Fokussierung sowie generell in emphatischer Sprache auftritt, auch in vielen italienischen Varietäten (vgl. Gili Fivela 2002 zum in Pisa gesprochenen Italienisch; generell zur Problematik tritonaler Tonhöhenakzente im Italienischen vgl. Sorianello 2006: 129). Auch die fallende Fragekontur des Porteño-Spanischen (Nuklearkonfiguration L+¡H* HL%; vgl. Abb. 4.5-18) lässt sich auf italienisches Substrat zurückführen. Jedoch weisen die Nuklearkonfigurationen der Ja/ Nein-Fragen über die italienischen Varietäten hinweg eine große Vielfalt auf, d. h., es finden sich sowohl Konturen, die dem steigenden Muster des in 4.5.4.1 besprochenen Madrid-Spanischen entsprechen (z. B. Mailand, Florenz: H+L* H%; Rom: H*+L H%), als auch solche, die - wie die des Porteño-Spanischen - global fallend sind (z. B. Turin: H+(L+H*) H-L%; Neapel, Palermo: L*+H L%; Bari: L+H* L%; vgl. 322 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="323"?> 44 Dass nicht alle Konturen fallend sind, liegt vor allem daran, dass die Nuklearkonfiguration L+¡H* HL% i. d. R. zu L+¡H* H% verkürzt wird, wenn das letzte Wort der Intonationsphrase endbetont (oxyton) ist: Während bei ¿Tiene mandarinas? ‘Haben Sie Mandarinen? ’ nach der betonten Silbe -riausreichend Zeit verbleibt, den fallenden Grenzton (HL) vollständig zu realisieren, ist das bei ¿Mandarinas, tenés? ‘Mandarinen, hast du welche? ’ in Ermangelung einer nachtonigen Silbe nicht so. Die Verkürzung des Grenztons von HL% zu H% nennt man auch Trunkierung (< lat. T R U N C A R E ‘abschneiden’, engl. truncation ‘Kürzung’). Sorianello 2006: 138). Da die italienischen Einwanderer aus unterschiedlichen Regionen des Landes kamen - erst hauptsächlich aus dem Norden (Lombardei, Piemont), seit der Wende zum 20. Jahrhundert v. a. aus dem Süden (Kalabrien, Kampanien, Sizilien) -, ist anzunehmen, dass in der frühen Phase des L2-Erwerbs von den Einwanderern sowohl steigende als auch fallende Fragekonturen im Spanischen produziert wurden. Im Zuge der Verfestigung der durch starke individuelle Variabilität gekennzeichneten Lernervarietät zu einem in der Migrantengemeinschaft verwendeten Soziolekt und spätestens in Zusammenhang mit dem Aufstieg zum nationalen Standard hat sich dann eine der Konturen, nämlich die fallende, generalisiert - womit gewährleistet ist, dass eine eindeutige tonale Markierung des interrogativen Satzmodus vorliegt. Um diese Annahme zu untermauern, haben Gabriel & Kireva (2014a) die Prosodie des Porteño-Spanischen mit der des L2-Spanischen italienischer Lerner verglichen, die im Erwachsenenalter aus unterschiedlichen nord- und süditalienischen Regionen nach Madrid übersiedelt sind und die in ihren jeweiligen italienischen Varietäten teils steigende, teils fallende Interrogativkonturen produzieren. Dabei wurde gezeigt, dass im L2-Spanischen hinsichtlich der steigenden bzw. fallenden Nuklearkonfigurationen der Fragesätze große inter- und intrapersonale Variabilität herrscht, während neutrale Ja/ Nein-Fragen im muttersprachlichen Madrid-Spanisch zu 86 % mit einer steigenden und im Porteño-Spanischen zu 83 % mit einer fallenden Kontur produziert werden (Gabriel & Kireva 2014a: 271ff.). 44 Dieser Befund stützt die Annahme, dass sich das heutige argentinische Spanisch - zumindest auf prosodischer Ebene - als eine zum Standard aufgewertete Lernervarietät begreifen lässt. Bereits McMahon (2004) hat dafür argumentiert, dass die Italianisierung des argentinischen Spanisch als ein Phänomen des Transfers prosodischer Eigenschaften aufzufassen ist. An dieser Stelle sei darauf hingewiesen, dass mit dem Galicischen eine weitere, für Argentinien relevante Migrationssprache vorliegt (Gugenberger 2004, 2018: 311-332), die mit den o. g. italoromanischen Varietäten - und ebenso mit dem Porteño-Spani‐ schen - einige Merkmale teilt, die einen Anteil an der Herausbildung der Intonation des heutigen argentinischen Spanisch gehabt haben könnten. Zu nennen ist hier die zumindest teilweise frühe Alignierung des steigenden Tonhöhenakzents (L+H*) sowie die fallende Gesamtkontur von Ja/ Nein-Fragen (H+L* L%; vgl. 5.1.3). Dass ein möglicher Einfluss der zweitgrößten europäischen Migrantengruppe in der Forschung bislang wenig Beachtung gefunden hat, mag dadurch bedingt sein, dass Einwanderer aus Galicien spanische Staatsbürger waren und damit - wenn auch in vielen Fällen zu 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 323 <?page no="324"?> 45 Ihr Galicisch wurde oft als defizitäres Spanisch wahrgenommen (Gugenberger 2018: 325). Die Bezeichnung gallego wird im argentinischen Spanisch umgangssprachlich auch verallgemeinernd für Menschen aus Spanien verwendet (Plager 2008, unter gallego). 46 Interessanterweise gehen hierbei die L2-Werte jeweils sogar über die Werte des Italienischen hinaus − eine solche ‘Verstärkung’ rhythmischer Eigenschaften beim Transfer ist bereits in ähnlichen Studien bei anderen Sprachenkombinationen festgestellt worden (vgl. White & Mattys 2007). Unrecht - als spanischsprachig wahrgenommen wurden (Pérez-Prado 2007: 41-46). 45 Zudem lässt sich die in Anbetracht der historischen Faktoren durchaus plausible Annahme einer Beeinflussung des Porteño-Spanischen durch L1-Transfer aus dem Galicischen in Ermangelung von monolingual aufgewachsenen Galicischsprechern, die im Erwachsenenalter das europäische Spanisch als L2 erwerben, heute nicht empirisch überprüfen. Kommen wir nun auf den Rhythmus zu sprechen. Die in 4.4.2 erwähnte Auswertung von Ramus et al. (1999) hat gezeigt, dass das europäische Spanisch in Bezug auf den vokalischen Gesamtanteil (%V) und die Variabilität konsonantischer Intervalle (ΔC) niedrigere Werte aufweist als das Italienische (vgl. Abb. 4.4-4). Vor dem Hinter‐ grund der bereits erwähnten Transferhypothese (McMahon 2004) ist die prosodische Beschaffenheit des heutigen Porteño-Spanischen nicht zuletzt dadurch zu erklären, dass sich Eigenschaften der Lernervarietät im Spanischen Argentiniens verfestigt haben. Bezogen auf den Sprachrhythmus ist zu erwarten, dass sich die italienisch beeinflusste argentinische Kontaktvarietät ähnlich verhält wie das Italienische. Sie sollte zudem dem L2-Spanischen italienischer Muttersprachler gleichen, die die eu‐ ropäische Standardvarietät des kastilischen Spanisch in Madrid erlernen und dabei den Sprachrhythmus ihrer L1 auf die Zielsprache übertragen, d. h., Kontakt- und Lernervarietäten sollten ähnliche rhythmische Charakteristika aufweisen. Benet et al. (2012), Gabriel & Kireva (2012, 2014a) und Kireva & Gabriel (2015) haben auf der Basis der Auswertung von gelesenen und semi-spontansprachlichen Daten gezeigt, dass dies in der Tat der Fall ist. Wie Abb. 5.1-15 zeigt, weist das Italienische sowohl einen höheren vokalischen Gesamtanteil (%V) als auch einen höheren VarcoV-Wert auf als das kastilische Spanisch, was im Großen und Ganzen den aus der Literatur bekannten Werten entspricht (vgl. Ramus et al. 1999). Die für die hier skizzierte Rhythmusstudie aufgenommenen italienischen Sprecher leben seit einigen Jahren in Madrid und haben dort das kastilische Spanisch als Fremdsprache erlernt. Ihre spanischen L2-Daten zeigen, dass der Sprachrhythmus ihrer L1 in die Zielsprache übernommen wurde. Ausschlaggebend ist hierbei vor allem der Transfer der Längung von metrisch starken Silben und von Silben vor prosodischen Grenzen aus dem Italienischen ins Spanische. 46 Gleiches gilt auch für das Porteño-Spanische: Die Werte für %V und VarcoV unterscheiden sich nur unwesentlich von denen, die für das L2-Spanische italienischer Muttersprachler ermittelt wurden − Ergebnisse, die die Transferhypothese stützen. 324 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="325"?> Abb. 5.1-15: Vokalischer Gesamtanteil (%V) und Dauervariabilität vokalischer Intervalle (VarcoV) in den Varietäten Spanisch (Kastilisch) L1, Italienisch, L2-Spanisch italienischer Muttersprachler und Porteño-Spanisch. Material: Lesetext El viento del norte y el sol bzw. La tramontana e il sole; Mittelwerte von je sechs Sprechern pro Varietät (nach Gabriel & Kireva 2014a: 268). Andere Migrationssprachen wie Walisisch, Deutsch und Afrikaans hingegen haben keinen Einfluss auf die Prosodie des heutigen argentinischen Spanisch genommen. Ein wichtiger Grund hierfür ist, dass die entsprechenden Einwanderergruppen deut‐ lich kleiner waren und die Immigranten sich weniger im (normgebenden) Zentrum Buenos Aires als in dünn besiedelten Gebieten wie z. B. Patagonien niederließen. So blieben entsprechende Kontaktphänomene stark lokal begrenzt. Zudem sind die prosodischen Eigenschaften des von bilingualen Sprechern aus diesen Gemeinschaften gesprochenen Spanisch bislang nur wenig erforscht. Eine Ausnahme bildet das von den Nachkommen südafrikanischer Einwanderer in Chubut gesprochene Spanisch, bei dem Henriksen et al. (2019) keine rhythmische Beeinflussung durch das in der entspre‐ chenden Gemeinschaft über die Generationen weitergegebene Afrikaans feststellen konnten. Umgekehrt ist die Herkunftssprache der Bilingualen durch das Spanische beeinflusst, d. h., sie weist im Vergleich zum Afrikaans südafrikanischer Sprecher eine geringere Variabilität vokalischer und konsonantischer Intervalle und damit einen eher silbenzählenden Rhythmus auf. Damit liegt ein einseitiger Einfluss der Umgebungsauf die Herkunftssprache vor, d. h., die Migrationssprache Afrikaans hat sich der Mehrheitssprache Spanisch angepasst - was im Gegensatz zu dem Weg steht, den die argentinische Prestigevarietät Porteño mit der Aufnahme prosodischer Merkmale aus dem Italienischen genommen hat. 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 325 <?page no="326"?> 47 Ein Beispiel für eine Vokalepenthese findet sich auch in dem weiter unten analysierten Beispiel, vgl. Abb. 5.1-16. Abschließend besprechen wir eine weitere argentinische Kontaktvarietät, nämlich das auch Argenchino (argentino + chino) genannte, von chinesischen Einwanderern im Raum Buenos Aires gesprochene Spanisch. Chinesische Einwanderung nach Argen‐ tinien in nennenswertem Umfang ist ein neueres Phänomen, das seinen Anfang in den 1980er Jahren genommen hat (Vetter 2012: 18, Gabriel 2018: 42f.). In den offiziel‐ len Statistiken ist es nur unzureichend dokumentiert, da Personen ohne offiziellen Aufenthaltsstatus in den Volkszählungen nicht berücksichtigt sind. So werden für 2022 für ganz Argentinien offiziell 18.629 Menschen aus der Volksrepublik und 3.018 aus Taiwan genannt (INDEC 2024: 12); Vetter (2012: 16) geht allerdings allein für Buenos Aires je nach Schätzung von zwischen 30.000 und 100.000 aus China und Taiwan stammenden Einwohnern aus. Das wirtschaftliche und kulturelle Zentrum der chinesischen Einwanderer in Buenos Aires ist das barrio chino ‘chinesisches Viertel’ im Stadtteil Belgrano; die Wohngebiete der Einwanderer und insbesondere ihre (meist kleinen) Supermärkte, die dort maßgeblich zur Lebensmittelversorgung beitragen, sind über den gesamten Großraum (Gran Buenos Aires) verteilt. Die Integration der chinesischen Migranten in die argentinische Mehrheitsgesellschaft ist insgesamt wenig fortgeschritten, was nicht zuletzt in den oft unzureichenden Spanischkenntnissen der Einwanderer begründet ist. Diese wurden in den meisten Fällen ohne oder mit nur geringer didaktischer Unterstützung erworben und stellen, zumindest für die Einwanderer der ersten Generation, ein Hindernis für den sozialen Aufstieg dar. Auf segmentaler Ebene ist das Argenchino durch typische Merkmale chinesischer Lerneraussprache gekennzeichnet. Zu nennen sind hier u. a. die Elision silbenschließender Konsonanten (z. B. dos [do] ‘zwei’, entonces [entonse] ‘dann’; Vetter 2012: 87) und die Vokalepenthese zur Verbesserung der Silbenstruktur (z. B. t[i]reinta ‘dreißig’; Vetter 2012: 96); 47 beides ist als Reflex der chinesischen Silbenstruktur zu interpretieren, die abgesehen von den Coda-Nasalen [n] und [ŋ] nur CV-Silben erlaubt. Ein weiteres typisches Merkmal ist die Verwechslung der spanischen r-Laute mit dem Lateral / l/ (sog. Lambdazismus wie in ma[l]ido ‘Gatte’ oder Rhotazismus wie in inf[ɾ]ación ‘In‐ flation’, Vetter 2012: 92f.). Zurückzuführen ist dieses saliente Merkmal, das auch der argentinische Autor Ariel Magnus in seinem Roman Un chino en bicicleta zur Charakterisierung seines Protagonisten nutzt (“mucho estlés, necesita dolmil” ‘viel Stress, Sie müssen schlafen’, Magnus 2007: 83), einerseits auf die artikulatorische Ähnlichkeit der Laute [l] und [ɾ] und andererseits auf die Tatsache, dass der chinesische r-Laut als stimmhafter retroflexer Approximant [ɻ] realisiert wird (wie z. B. im Anlaut von 人 rén ‘Mensch’) und sich damit artikulatorisch stark vom Tap bzw. Trill des Spanischen unterscheidet. Auch auf prosodischer Ebene unterscheidet sich das Argenchino deutlich vom Porteño-Spanischen. Wir gehen hier zunächst auf den Rhythmus und dann auf die Intonation ein. Zwar gelten sowohl das Spanische als auch das Chinesische als typisch 326 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="327"?> 48 Wie wir in 4.5.1 gesehen haben, tragen u. a. manche Funktionswörter wie die Interrogativpartikel 吗 ma keinen lexikalischen Ton; gleiches gilt für Reduplikationssilben wie die zweite Silbe in 妈妈 māma ‘Mutter’. Ansonsten gilt als Grundregel, dass jede Silbe, die eine lexikalische Bedeutung hat, tonal spezifiziert ist und dass der zugrundeliegende Ton auch dann realisiert wird, wenn eine weitere tonal spezifizierte Silbe folgt. silbenzählende Sprachen, jedoch weist das argentinische Spanisch, wie wir gesehen haben, aufgrund des migrationsbedingten Kontakts mit dem Italienischen eine höhere Variabilität vokalischer Intervalle auf als das kastilische Spanisch. Die chinesischen Einwanderer haben beim Erwerb des argentinischen Spanisch nun wiederum den durch niedrige vokalische Variabilität gekennzeichneten Rhythmus des Chinesischen auf die Zielsprache übertragen - mit dem Ergebnis, dass das Argenchino rhythmisch eher dem kastilischen als dem argentinischen Spanisch ähnelt (Gabriel 2018: 53). In Bezug auf ihre Intonationssysteme unterscheiden sich das Spanische und das Chinesische deutlich: Wie wir in 4.5.1 gezeigt haben, lässt sich das Spanische als sog. reine Intonationssprache charakterisieren, während das Chinesische eine Tonsprache ist, in der (fast) 48 jede Silbe zugrundeliegend tonal spezifiziert ist. Abb. 5.1-16 zeigt eine kurze spontansprachliche Sequenz eines im Alter von 38 Jahren aus Taiwan eingewanderten Argenchinosprechers, in der deutliche tonale Spuren seiner L1, der taiwanesischen Varietät des Mandarin-Chinesischen, zu sehen sind. Abb. 5.1-16: Tonhöhenkontur und Oszillogramm der Äußerung Empezamos (a) e(s)tudiar: uno, do(s), tre(s) ‘Wir begannen zu lernen: eins, zwei, drei’ (Spontansprache, soziolinguistisches Interview), produziert von einem 64-jährigen Argenchinosprecher (nach Gabriel 2018: 52; Aufnahme: Dirk Vetter, Buenos Aires, 2007). Tiers von oben nach unten: Tonhöhenakzente (ToBI), entsprechende lexikalische Töne des Chinesischen, phonetische Transkription. Hinsichtlich der Betonungsmuster unterscheidet sich das hier analysierte Beispiel sowohl vom Porteño-Spanischen als auch von anderen spanischen Varietäten insofern, als die Betonung des Infinitivs estudiar nicht auf der Ultima liegt: [e ˈ tu.di.a]. Mindestens ebenso auffällig ist der zusätzliche tonale Zielpunkt (L*), der in der Verbform empeza‐ mos hinzugefügt wurde: Wie in Abb. 5.1-16 zu sehen ist, steigt die F 0 -Kontur nicht 5.1 Spanisch im Kontakt mit autochthonen Sprachen und mit Migrationssprachen 327 <?page no="328"?> 49 In der Literatur zum chinesischen Lernerspanisch wird dieses Phänomen oft als Staccato-Effekt bezeichnet und wie folgt beschrieben: “Los sinohablantes cuando se expresan en español aplican en el seno de algunas sílabas unos importantes movimientos tonales, ajenos al habla normal de los hispanohablantes nativos” (‘Wenn sich chinesische Sprecher auf Spanisch ausdrücken, wenden sie innerhalb einiger Silben umfangreiche tonale Bewegungen an, die der normalen Sprache spanischer Muttersprachler fremd sind’, Cortés Moreno 2006: 46). “Tienden a imprimir un movimiento tonal a cada sílaba” (‘Sie neigen dazu, jeder Silbe eine Tonbewegung aufzudrücken’, Cortés Moreno 2006: 62). kontinuierlich bis zum Beginn der metrisch starken Silbe an, wie man es bei einer regulären phonetischen Interpolation zwischen dem Beginn der Intonationsphrase und dem hohen Zielpunkt des mit -zaassoziierten Tonhöhenakzents H*+L erwarten würde. Die konstant flache Kontur, die auf der vortonigen Silbe -perealisiert wird, und der abrupte Anstieg, der den Eindruck separat realisierter Silben erweckt, können im Rahmen des autosegmental-metrischen Modells modelliert werden, indem ein zusätzlicher tonaler Zielpunkt L* unmittelbar vor der akzentuierten Silbe angenommen wird. 49 Tonale Einschübe dieser Art lassen sich plausibel als ein fossilisiertes Merkmal interpretieren, das typisch für Lerner mit tonsprachlichem Hintergrund ist: Sie sind von ihrer L1 daran gewöhnt, dass (fast) jede Silbe im mentalen Lexikon tonal spezifiziert ist, was es ihnen schwer macht, mit einer Sprache wie dem Spanischen zurechtzukommen, die eine F 0 -Interpolation über mehrere unbetonte Silben hinweg erfordert. Interessant ist zudem die exhaustive Verwendung des tritonalen Tonhöhenakzents L+H*+L, den der Sprecher dreimal unmittelbar hintereinander produziert. Dies zeigt, dass er das typische Merkmal des argentinischen Spanisch zwar als Tonmuster korrekt erworben hat, nicht jedoch dessen Verwendung: Der Tonhöhenakzent L+H*+L, der im argenti‐ nischen Spanisch Kontrast (im Sinne kontrastiver Fokussierung; Feldhausen et al. 2011a) und Emphase ausdrückt und vorwiegend als Nuklearakzent vorkommt, tritt hier auch in einer nicht-emphatischen Passage und zweifach in pränuklearer Position auf. Abgesehen von der Einfügung zusätzlicher tonaler Zielpunkte, die nicht mit metrisch starken Silben assoziieren, zeigt sich L1-Transfer aus dem Chinesischen in zweierlei Hinsicht: Zum einen entsprechen die produzierten Tonhöhenakzente insofern dem Tonrepertoire des Chinesischen, als sich L+H* mit dem 2. (steigenden) Ton, H+L* mit dem 4. (fallenden) Ton und L+H*+L mit einer Kombination aus 2. und 4. Ton gleichset‐ zen lässt (vgl. Gabriel 2018: 54f.). Zum anderen kommt das argentinische Tonsystem, das anders als das des kastilischen Spanisch keine zugrundeliegenden steigenden Tonhöhenakzente mit später Alignierung (L+>H*) aufweist, dem tonsprachlichen Hintergrund des Sprechers entgegen: Ebenso wie im Chinesischen die lexikalischen Töne hinsichtlich ihrer Realisierung auf den zeitlichen Rahmen der entsprechenden Silbe festgelegt sind, kennt auch das argentinische Spanisch keine Tonhöhenakzente, deren Gipfel außerhalb der betreffenden Silbe realisiert werden. Abgesehen vom hier diskutierten Beispiel Argentiniens wurden lautliche Effekte des Kontakts spanischer Varietäten mit Migrationssprachen bislang nur wenig auf empirischer Basis untersucht - auch wenn sich entsprechende Beispiele in allen spa‐ nischsprachigen Ländern finden lassen. Eine Ausnahme bildet die Studie von Mohamed 328 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="329"?> 50 Vgl. hierzu z. B. die Interviews mit in Argentinien aufgewachsenen Sprecherinnen aus chinesischstämmigen Familien unter https: / / www.youtube.com/ watch? v=Y0S6SlWt1pA&t=604s. 51 Zu den grammatischen Merkmalen vgl. Montrul (2013: 113-124; 2018). et al. (2019) zum in Puerto Rico gesprochenen Spanisch arabischer Einwanderer. Hier wurde gezeigt, dass arabisch-dominante Bilinguale den aus dem Arabischen transferierten Glottisschlag im Spanischen nutzen, um bei aufeinander folgenden Vokalsegmenten den Hiatus zu vermeiden - ähnlich wie es auch im paraguayischen Spanisch durch den Kontakt mit der autochthonen Sprache Guaraní der Fall ist (vgl. Abb. 5.1-13 in 5.1.6). Insgesamt ist festzuhalten, dass der italienische (und gegebenenfalls auch galicische) Einfluss auf die Prosodie des argentinischen Spanisch insofern eine Ausnahme dar‐ stellt, als es sich hierbei um den seltenen Fall der Aufwertung einer Lernerzur Standardvarietät handelt. Wichtig ist in diesem Zusammenhang, dass im heutigen Argentinien zwar durchaus Italienisch als Herkunftssprache gesprochen wird, dass die meisten Sprecher der italienisch beeinflussten Standardvarietät aber selbst gar kein Italienisch sprechen. Anders ist der Fall beim Afrikaans, das zwar weiterhin in den entsprechenden Gemeinschaften gesprochen wird, aber keinerlei Reflexe im Spanischen der Bilingualen hinterlassen hat. Die Argenchinosprecher, deren Spanisch stark durch das Chinesische beeinflusst ist, sprechen alle auch weiterhin ihre Her‐ kunftssprache und haben keinen Sprachwechsel vorgenommen. Das Spanische der jüngeren Generation, die in Argentinien geboren und im argentinischen Schulsystem herangewachsen ist, hat sich hingegen deutlich dem der Mehrheitsgesellschaft an‐ passt, 50 was darauf hindeutet, dass es sich beim Argenchino im Wesentlichen um eine Lernervarietät handelt, die sich im Sinne eines Soziolekts innerhalb der betreffenden Gemeinschaft verfestigt hat, aber von jüngeren Sprechern unter dem normativen Einfluss des Bildungssystems zunehmend aufgegeben wird. Eine soziolinguistische Aufwertung und eine Generalisierung typisch chinesischer Aussprachemerkmale über die betreffende Gemeinschaft hinaus ist damit unwahrscheinlich. 5.2 Spanisch als Herkunftssprache und Diasporavarietät Nachdem wir uns in 5.1.7 mit spanischen Varietäten befasst haben, die sich auf Ausspracheebene durch den Kontakt mit Migrationssprachen verändert haben, befas‐ sen wir uns im Folgenden mit dem umgekehrten Fall, d. h. mit dem Spanischen als Migrationssprache und Diasporavarietät. Zuerst behandeln wir das in den USA als Herkunftssprache gesprochene Spanisch (5.2.1), dessen lautliche Beeinflussung durch den intensiven Kontakt mit dem Englischen mittlerweile in zahlreichen empirischen Studien gut dokumentiert ist. 51 Weniger gut untersucht sind die phonetisch-phonolo‐ gischen Eigenschaften des Spanischen als Herkunftssprache in Deutschland, dem wir einen weiteren Abschnitt widmen (5.2.2). 5.2 Spanisch als Herkunftssprache und Diasporavarietät 329 <?page no="330"?> 52 Hinsichtlich des Vokabulars, insbesondere aus Bereichen wie Bildung oder Verwaltung, in denen die Herkunftssprache nicht oder kaum verwendet wird, lassen sich bei Herkunftssprechern durchaus Lücken feststellen. Das Sprachsystem als solches ist hiervon jedoch nicht betroffen. Unter einer Herkunftssprache (eng. heritage oder community language, sp. lengua de herencia) versteht man eine Minderheitensprache, die durch Migration in eine andere sprachliche Umgebung gelangt ist. Sie wird von den Eingewanderten bzw. ihren Nachkommen in früher Kindheit erworben und im privaten Bereich verwendet. Eine Herkunftssprache ist weder die Sprache der Mehrheitsgesellschaft noch die des Bildungssystems. Der Begriff wurde von Valdés (2000) eingeführt; einen Überblick zur aktuellen Forschung geben Polinsky (2018) und Aalberse et al. (2019). Herkunftssprachen unterscheiden sich auf allen sprachlichen Ebenen von den stan‐ dardnahen Varietäten, wie sie monolingual aufgewachsene Menschen in den Her‐ kunftsländern sprechen. Lautliche Abweichungen, die oft als schlechte Aussprache oder als fremdsprachiger Akzent wahrgenommen werden, lassen sich im Prinzip auf unterschiedliche Weise erklären: • als Folge von Spracherosion (language attrition, vgl. Schmid 2011) bei Einwande‐ rern der ersten Generation, deren Herkunftssprache sich unter dem Einfluss der dominanten Sprache verändert hat • als unvollständiger Erwerb (incomplete acquisition) in Bezug auf Sprecher der zweiten und weiterer Einwanderergeneration(en), die im Zielland auf der Basis eines durch die dominante Sprache veränderten Input eine - verglichen mit der monolingualen Standardvarietät-- ‘unvollständige’ Kompetenz erworben haben Der zweite Erklärungsansatz ist in terminologischer Hinsicht als unangemessen kritisiert worden, da auch ein herkunftssprachliches System zu umfassender Kommu‐ nikation befähigt und somit nicht als ‘unvollständig’ bezeichnet werden sollte (vgl. Domínguez et al. 2019 und Bayram et al. 2019). Auf unseren konkreten Interessensbe‐ reich bezogen bedeutet das: Die Aussprache des Spanischen als Herkunftssprache (in den USA oder in Deutschland) ist in Teilen zwar anders als die Aussprache monolingualer Varietäten in Europa und Amerika, aber nicht unvollständig, da sich ja auch in einer herkunftssprachlichen Varietät alle Wörter und Sätze in konkrete Lautketten überführen lassen. 52 Gemäß der oben genannten Definition lässt sich auch das Judenspanische, das von den Nachfahren der ab 1492 von der Iberischen Halbinsel vertriebenen sephardi‐ schen Juden in den neuen Siedlungsgebieten gesprochen wird, als Herkunftssprache bezeichnen. In der Forschung ist es jedoch eher üblich, die weit verstreuten Varietäten des Judenspanischen zu einer Gruppe von Diasporavarietäten (< agr. διασπορά diasporá ‘Verstreuung’) zusammenzufassen. In 5.2.3 kommen wir hierauf zurück und diskutieren anhand ausgewählter Beispiele, wie sich der enge Kontakt mit den 330 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="331"?> jeweils dominanten Sprachen auf die Phonetik und Phonologie des Judenspanischen ausgewirkt hat. 5.2.1 Das Spanische als Herkunftssprache in den USA Die Präsenz des Spanischen auf dem Gebiet der heutigen USA lässt sich bis ins 16. Jahrhundert zurückverfolgen. So segelte der spanische Eroberer Juan Ponce de León (1460-1521) in den Jahren 1512 und 1513 entlang der Küste des jetzigen Bun‐ desstaats Florida und gab ihm seinen aktuellen Namen (vgl. Herling 2013: 453). Im Laufe der Kolonialisierung wurden u. a. Siedlungen in den heutigen Bundesstaaten Virginia (1561), New Mexico (1598) und Texas (1659) gegründet, bis im 18. Jahrhundert schließlich Kalifornien besiedelt wurde. In den kolonisierten Gebieten wurde, wie auch in Mittel- und Südamerika das Spanische als Verkehrs- und Verwaltungssprache eingeführt. Die politischen Veränderungen des 19. Jahrhunderts unterbrachen jedoch die Kontinuität des Spanischen in Nordamerika: 1801 ging das Gebiet des heutigen Louisiana in französischen Besitz über und wurde 1803 an die USA weiterverkauft; 1819 erwarben die USA Florida zum Preis von 5 Mio. US-Dollar. 1836 wird Texas von Spanien unabhängig, um kurz darauf (1845) in die USA eingegliedert zu werden. Der mexikanisch-amerikanische Krieg (1845-1848) endete mit einer Niederlage Mexikos und territorialer Neuverteilung, im Zuge derer Neu-Mexiko, Utah, Nevada, Arizona an die USA fielen. In der Folge wurde das Englische offiziell zur einzigen Sprache der öffentlichen Kommunikation, auch wenn große Teile der Bevölkerung zunächst über‐ wiegend spanischsprachig blieben. Bereits um die Wende vom 19. zum 20. Jahrhundert kam es zu ersten Einwanderungswellen aus spanischsprachigen Ländern: Allein 1910 immigrierte ungefähr eine halbe Million Menschen aus Mexiko, was vor allem durch die schlechte Wirtschaftslage Mexikos und den hohen Bedarf an Arbeitskräften in den USA begründet ist. Es folgten Einwanderungsbewegungen aus Puerto Rico (dem heute der Status “unincorporated United States insular area” zukommt; vgl. https: / / ww w.doi.gov/ oia/ islands/ politicatypes), deren Höhepunkt in den 1940er und 1950er Jahre erreicht wurde. Die kubanische Revolution (1959) schließlich löste förmlich einen (im Wesentlichen politisch bedingten) Exodus aus: Mehrere hunderttausend Personen - vornehmlich aus der wohlhabenden kubanischen Mittel- und Oberschicht - verließen ihr Land, um in den USA (vor allem in Florida) ein neues Leben zu beginnen. In der Volkszählung von 2020 wurden 61,2 Millionen Hispanics registriert, was knapp 20 % der Gesamtbevölkerung entspricht und je nach Bundesstaat starken Schwankun‐ gen unterliegt. Der größte Anteil entfällt mit 58 % auf aus Mexiko stammende Personen (vgl. Peña et al. 2023). Die USA haben keine explizite Sprachgesetzgebung, in der eine Amtssprache fest‐ gelegt wird; de facto ist das Englische jedoch die einzige offizielle Sprache (und zugleich die Sprache der Verfassung). Regionale Sprachgesetzgebungen gibt es in einzelnen Bundesstaaten, wobei in zahlreichen Bundesstaaten, darunter 1988 in Florida, English only-Gesetze erlassen wurden, die die Bevölkerung zur Verwendung des Englischen 5.2 Spanisch als Herkunftssprache und Diasporavarietät 331 <?page no="332"?> im öffentlichen Raum verpflichten sollten und die teils (wie 2002 in Alaska) für verfassungswidrig erklärt wurden. Einige Bundesstaaten wie Arizona, Kalifornien oder Texas bieten heutzutage ihre gesetzlichen Bekanntmachungen und amtlichen Dokumente zweisprachig auf Englisch und Spanisch an. 1979 wurde die Academia norteamericana de la lengua española ins Leben gerufen, deren Ziel die Pflege und Normierung des Spanischen in Nordamerika ist (vgl. www.anle.us). Im Bereich des Konsonantismus lassen sich Einflüsse des Englischen auf das in den USA gesprochene herkunftssprachliche Spanisch (oft auch als Spanglish bezeichnet) in allen Bereichen erkennen, in denen sich Englisch und Spanisch unterscheiden. Zu nennen ist hier zunächst die Realisierung der Plosive, die im Spanischen mit kurzer positiver VOT ([p t k]) bzw. voll stimmhaft, d. h. mit negativer Stimmeinsatzzeit produziert werden ([b d ɡ]; vgl. 2.5.1.1). Das Englische hingegen entspricht hinsichtlich der phonetischen Realisierung des binären Kontrasts der Verschlusslaute insofern dem Deutschen, als / p t k/ lange positive VOT-Werte aufweisen (was als Aspiration wahrgenommen wird: [p h t h k h ]), während deren stimmhafte Entsprechungen mit kurzen positiven VOT-Werten produziert und damit entstimmt werden ([b̥ d̥ g̊ ]). Empi‐ rische Studien haben gezeigt, dass sich bei in den USA lebenden spanischen Herkunfts‐ sprechern, insbesondere bei englisch-dominanten Probanden, massiver Einfluss der Umgebungssprache zeigt und dass sich deren VOT-Werte signifikant von denen mo‐ nolingual aufgewachsener Spanischsprecher unterscheiden (Kim, J. Y. 2011). Amengual (2012) hat zudem anhand von / t/ darauf hingewiesen, dass sich herkunftssprachliche Realisierungen vor allem dann von monolingualen unterscheiden und sich denen der Umgebungssprache annähern, wenn sog. kognate, also lautlich ähnliche Wörter im Englischen vorliegen (z. B. sp. teléfono, engl. telephone ‘Telefon’). Hinsichtlich der Perzeption haben Gonzales & Lotto (2013) jedoch gezeigt, dass Bilinguale, die von früher Kindheit sowohl mit dem Englischen als auch mit der Herkunftssprache Spa‐ nisch in engem Kontakt waren, mit stimmlosen bzw. stimmhaften Plosiven anlautende Kunstwörter in beiden Sprachen entsprechend den einzelsprachlichen VOT-Werten korrekt identifizieren konnten: Sie waren in der Lage, die Realisierung eines bilabialen Plosivs mit kurzer positiver VOT in einem englischen Kontext zielsprachlich als / b/ zu hören, während das gleiche akustische Signal in einem spanischen Kontext als Aussprache von / p/ interpretiert wurde. Dies spricht dafür, dass sich Produktion und Perzeption bei Bilingualen unterscheiden können: Während beim Wahrnehmungspro‐ zess einzelsprachliches phonetisches Wissen erfolgreich genutzt wird, kann es im Bereich der Produktion durchaus zu übereinzelsprachlicher Beeinflussung kommen. Bei den intervokalischen Plosiven / b d ɡ/ , die im Spanischen normgemäß spirantisiert, d. h. als Frikativapproximanten realisiert werden ([β ð ɣ], vgl. 2.5.1.1), zeigt sich der Einfluss des Englischen darin, dass insgesamt weniger Spirantisierung erfolgt und mehr Plosive produziert werden als in den monolingualen Vergleichsdaten. Dem Phonem / b/ kommt dabei die Besonderheit zu, dass es oft - wie im Englischen - als (nicht-approximantischer) labiodentaler Frikativ [v] ausgesprochen wird, wenn ihm in der Schreibung das Graphem <v> entspricht, so etwa in una vela ‘eine Kerze’ (Rao 332 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="333"?> 53 Auf die Übertragung der Vokalreduktion aus Kontaktsprachen haben wir bereits in den Abschnitten zum Spanischen im Kontakt mit dem Katalanischen (5.1.2), dem Galicischen (5.1.3) und dem Quechua (5.1.5) hingewiesen. Als weiteres Beispiel hierzu besprechen wir in 5.2.3 das in Bulgarien gesprochene Judenspanisch. 2014, 2015). In Abb. 5.2-2 (siehe unten) finden sich Beispiele für die ausbleibende Spirantisierung stimmhafter Plosive im intervokalischen Wortanlaut (z. B. la bola [la ˈ bo.la] statt [la ˈ βo.la] ‘der Ball’). Hinsichtlich des phonemischen Tap-Trill-Kontrasts (/ ɾ/ vs. / r/ , vgl. 2.5.1.5) hat Henriksen (2015) gezeigt, dass in der Region Chicago lebende mexikanische Herkunftssprecher den Trill häufig nur mit einem einzigen Verschluss (und damit als Tap) produzieren. Dadurch wird die zielsprachliche Realisierung des Kontrasts zwar teils beeinträchtigt; eine Übertragung der retroflexen r-Realisierung aus dem Englischen erfolgt jedoch nicht. Weiterhin wäre vorstellbar, dass die Velarisierung von / l/ in finaler Position (vgl. z. B. engl. call [-ɫ] ‘(an)rufen’ vs. sp. cal [-l] ‘Kalk’) im Sinne negativen Transfers in das herkunftssprachliche Spanisch übernommen wird. Wie Yavaş & Suner (2024) gezeigt haben, sind in den USA lebende spanisch-englische Bilinguale jedoch in der Lage, ihre Lautsysteme hinsichtlich dieses Merkmals zu trennen: Während sie in der Coda das sog. ‘dunkle’ [ɫ] produzieren, wenn sie Englisch sprechen, realisieren sie in ihrem Spanisch sowohl in Onsetals auch in Coda-Position das sog. ‘helle’ [l]. Zur möglichen Interferenz der Sonorisierung von intervokalischem / s/ (vgl. z. B. engl. desire [-z-] vs. sp. deseo [-s-] ‘Wunsch, Verlangen’) liegen unseres Wissens noch keine empirischen Studien vor. Hinsichtlich des Vokalismus ist insbesondere der Transfer der Reduktion unbetonter Vokale ins Spanische zu nennen, die im Englischen zentralisiert und hinsichtlich der Dauer verkürzt, wenn nicht sogar vollständig elidiert werden (z. B. engl. phonology [ ˈ f (ə) nɑːləʤi] ‘Phonologie’). Wie Ronquest (2013) mittels eines Bildbenennungstests gezeigt hat, werden die unbetonten Vokale des Herkunftsspanischen zentraler im Mundraum produziert als die betonten Vokale, während die spektralen Unterschiede zwischen betonten und unbetonten Vokalen in monolingualen Nicht-Kontaktvarietä‐ ten des Spanischen marginal sind (vgl. 2.5.3.1). 53 5.2 Spanisch als Herkunftssprache und Diasporavarietät 333 <?page no="334"?> 54 Weiterhin ist vor dem Hintergrund des in Abb. 5.2-1 gezeigten Befundes anzunehmen, dass sich der Transfer der englischen Vokalreduktion nicht nur auf / a/ , sondern auch auf weitere Vokale bezieht. Allerdings lässt sich dies anhand des gezeigten Beispiels nicht nachweisen, da der fragliche Vokal Abb. 5.2-1: F 1 - und F 2 -Werte betonter und unbetonter Vokale im Spanischen als Herkunftssprache im US-amerikanischen Kontext (nach Ronquest 2013: 164). Wie Lease (2022) gezeigt hat, tritt dieses Phänomen bei bilingual aufgewachsenen Kindern in stärkerem Umfang auf als bei (spät bilingualen) erwachsenen Einwanderern der ersten Generation. Colantoni & Pérez Leroux (2024) haben die durch den Kontakt mit dem Englischen bedingte Reduktion und Zentralisierung der mittleren und tiefen Vokale im Zusammenhang mit der Produktion der morphosyntaktischen Genusmar‐ kierung des Spanischen durch englisch-spanisch Bilinguale untersucht. Dabei wurde gezeigt, dass die durch die Zentralisierung bedingte Überlappung der Vokale / a/ und / o/ in unbetonter Position im Wortauslaut zwar sowohl bei Erwachsenen als auch bei bilin‐ gual aufwachsenden Kindern auftritt, dass dies jedoch keinen negativen Einfluss auf die Produktion der nominalphraseninternen Genuskongruenz im Sinne der Angleichung von Adjektiven hinsichtlich der Endung -o bzw. -a an das (maskuline bzw. feminine) Bezugsnomen hat. In Abb. 5.2-2 geben wir ein Beispiel, das von einem in den USA aufgewachsenen englisch-dominanten Bilingualen mit mexikanischem Hintergrund produziert wurde. Die Übertragung der Vokalreduktion aus dem Englischen zeigt sich hier exemplarisch anhand des tiefen Vokals / a/ . Wie bei l[ɐ] d[a]m[ɐ] ‘die Dame’ deutlich wird, weisen die / a/ -Realisierungen in unbetonter Position (also im Artikel la und in der Endsilbe von dama) verglichen mit dem betonten / a/ deutlich niedrigere F 1 -Werte auf, d. h., das unbetonte / a/ wird hier mit höherer Zungenlage im Mund produziert und ist damit zu [ɐ] angehoben (zu den spektralen Eigenschaften spanischer Vokale vgl. 2.5.3.1). Allerdings tritt die Vokalreduktion nicht kategorisch auf, denn die unbetonten / a/ in daba ‘er/ sie gab’ und la bola ‘den Ball’ zeigen keine verminderten F 1 -Werte. 54 Im dritten tier sind die Durchschnittswerte des ersten Formanten pro 334 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="335"?> hierfür sowohl in betonter als auch und in unbetonter Position vorliegen müsste. Konkret bedeutet das hier: Um beurteilen zu können, ob das unbetonte / e/ des Objektklitikons le ‘ihm/ ihr’ reduziert ist oder nicht, müsste man die F 1 - und F 2 -Werte dieser Vokalrealisierung mit den entsprechenden Werten eines vom selben Sprecher produzierten betonten / e/ vergleichen. 55 Auch im Judenspanischen tritt am Wortanfang keine Spirantisierung ein, vgl. 5.2.3. Segment angegeben (in Hz); der entsprechende Wert ist im Sonagramm durch waa‐ gerechte schwarze gepunktete Linien angezeigt. Ein weiteres für das US-Spanische typisches Merkmal ist die bereits angesprochene fehlende Spirantisierung, die hier jeweils den Anlaut lexikalischer Wörter betrifft (z. B. la [d]ama, im Sonagramm schwarz umrandet), während der zugrundeliegende Plosiv / b/ im Wortinneren als Frikativapproximant realisiert wird (da[β]a, im Sonagramm weiß umrandet). 55 Abb. 5.2-2: Tonhöhenkontur, Oszillogramm und Formantenstruktur der Äußerung La dama le daba la bola ‘Die Dame gab ihm/ ihr den Ball’, produziert von einem englisch-dominanten erwachsenen Her‐ kunftssprecher (Aufnahme: Rajiv Rao). Tiers von oben nach unten: Grenztöne, Tonhöhenakzente, über das jeweilige Intervall gemittelte F 1 -Werte, IPA-Transkription (Segmente), orthographische Transkription (Silben). Die in Abb. 5.2-2 (zweiter tier) transkribierten Pränuklearakzente sind im Vergleich zum mexikanischen Spanisch unauffällig: Es liegt jeweils eine späte Alignierung vor (L+>H*), was auch im mexikanischen Spanisch die unmarkierte Realisierung ist (vgl. 4.5.4.3). Grundsätzlich gleicht das Intonationssystem des Spanischen dem des Engli‐ schen, denn beide Sprachen haben ein wortbasiertes System, in dem die Sprachmelodie im Wesentlichen durch Tonhöhenakzente bestimmt ist, die mit metrisch starken Silben assoziieren. Das bedeutet jedoch nicht, dass das in den USA als Herkunftssprache gesprochene Spanisch auf tonaler Ebene keine kontaktbedingten Besonderheiten aufweist. Diese betreffen vor allem die Schlusskonturen von Äußerungen. So hat Alvord (2006, 2010) in einer umfangreichen Studie zur Intonation von Ja/ Nein-Fragen im Herkunftsspanischen der kubanischen Exilgemeinschaft in Miami gezeigt, dass An‐ gehörige der ersten Einwanderergeneration in ihrem Spanisch neutrale Ja/ Nein-Fragen 5.2 Spanisch als Herkunftssprache und Diasporavarietät 335 <?page no="336"?> teils mit der ‘kubanischen’ (global fallenden) und teils mit der ‘englischen’ (global stei‐ genden) Schlusskontur markieren, wobei insgesamt das fallende Tonmuster bevorzugt wird. In der zweiten Generation hat sich das Bild insofern geändert, als die meisten Sprecher ihre spanische Fragesatzintonation dem Englischen angepasst haben und fast ausschließlich steigende Schlusskonturen produzieren. In der dritten Generation treten allerdings wieder vermehrt typisch ‘kubanische’, also fallende Intonationsmus‐ ter auf (vgl. Alvord 2010: 249). Der Autor interpretiert diesen Befund als Reflex eines außersprachlichen Faktors, nämlich der Rückbesinnung auf die kubanische Identität in der Enkelgeneration. Rao (2016) hat die Intonation unterschiedlicher Satztypen bei in den USA lebenden mexikanischen Herkunftssprechern untersucht und insgesamt festgestellt, dass diese Nuklearkonfigurationen produzieren, die von denen des mono‐ lingualen mexikanischen Spanisch abweichen - allerdings ohne dass ein unmittelbarer Einfluss des Englischen auszumachen wäre. Schließlich hat Kim (2023) gezeigt, dass in den USA (Kalifornien) ansässige Herkunftssprecher des Spanischen in der Lage sind, ihre Sprachen auf tonaler Ebene voneinander zu trennen: Während ihr Englisch häufig durch den sog. uptalk gekennzeichnet ist (Anhebung der Tonhöhenkontur am Ende von Deklarativsätzen, um sich der Zustimmung des Kommunikationspartners zu versichern), tritt dieses pragmatisch markierte Merkmal in ihrem Spanisch kaum auf. Auf die Interaktion von Wortstellung und Intonation bei der Fokusmarkierung sind wir bereits in 4.5.5 und in Zusammenhang mit der Diskussion der Schnittstellenhypothese in 5.1 eingegangen: Manche Studien haben gezeigt, dass sich Herkunftssprecher von monolingual aufgewachsenen Spanischsprechern dahingehend unterschieden, dass sie fokussierte Subjekte vorzugsweise durch prosodische Hervorhebung in der kanonischen Subjektposition am Satzanfang markieren und die postverbale Subjekt‐ position meiden (Gondra 2020), was für die Anfälligkeit externer Schnittstellen (hier: der Schnittstelle zwischen den kerngrammatischen Modulen Syntax und Phonolo‐ gie einerseits und dem externen Modul der Informationsstruktur andererseits) bei Bilingualen spricht. Andere Studien wie Leal et al. (2018) hingegen konnten keine entsprechenden Differenzen ausmachen und die Schnittstellenhypothese demnach nicht bestätigen. Auf die prosodische Fokusmarkierung bei in Deutschland lebenden Herkunftssprechern des Spanischen kommen wir in 5.2.2 zurück. In Bezug auf den Sprachrhythmus ist im Herkunftsspanischen deutlicher Einfluss des Englischen zu erwarten, da das Spanische als prototypisch silbenzählende Sprache gilt, während das Englische einen akzentzählenden Rhythmus aufweist (vgl. 4.4.1). Diese Annahme wird durch die umfangreiche Studie von Robles Puente (2014: 23) bestätigt, der gezeigt hat, dass das Herkunftsspanische früh bilingualer Sprecher (die von früher Kindheit an beide Sprachen verwendet haben) hinsichtlich der Variabilität vokalischer Intervalle (vgl. 4.4.2) stark vom Englischen beeinflusst ist, während bei spät bilingualen Sprechern der gleichmäßigere Rhythmus des Spanischen erhalten geblie‐ ben ist und dementsprechend niedrigere PVI-Werte vorliegen als bei der erstgenannten Gruppe. 336 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="337"?> 56 Zwei Studien befassen sich mit Phänomenen, die wir in unserer Einführung nicht detailliert besprochen haben: Beristain (2023) analysiert die Überlappung artikulatorischer Gesten in den Vokal-Nasalkonsonant-Sequenzen und stellt fest, dass die im Englischen größere Überlappung der Gesten nicht ins Spanische übernommen wird. Dagegen ist die koartikulatorische Nasalisierung bei den Bilingualen im Englischen geringer als im monolingualen Englisch. Duarte-Borquez et al. (2024) befassen sich mit dem sprachspezifischen Einsatz von unterschiedlichen Stimmqualitäten (z. B. der Knarrstimme, sog. creaky voice) und stellen wenig diesbezüglichen übereinzelsprachlichen Einfluss fest. 57 Auch in Österreich und in der deutschsprachigen Schweiz leben Menschen mit möglichen herkunfts‐ sprachlichen Spanischkenntnissen. Während das Statistische Jahrbuch der Republik Österreich diese nicht gesondert ausweist, sondern nur die 23 häufigsten Herkunftsgruppen nennt, zu denen kein spanischsprachiges Land zählt (Statistik Austria 2023: 25), lässt sich auf der Basis des Schweizer Migrationsberichts für die deutschsprachigen Kantone ein Anteil von 1,2 % an der ca. 8,8 Mio. Menschen umfassenden Gesamtbevölkerung ausmachen (SEM 2023). Abschießend sei auf die Übersichtsartikel zur Phonetik und Phonologie des Spani‐ schen als Herkunftssprache im englischsprachigen Kontext von Rao & Ronquest (2015), Ronquest & Rao (2018) und Rao & Amengual (2021) verwiesen. 56 5.2.2 Das Spanische als Herkunftssprache in Deutschland Im März 1960 schloss die Bundesrepublik Deutschland mit dem Königreich Spanien ein Abkommen zum Anwerben sog. Gastarbeiter ab, das auf deutscher Seite dazu beitragen sollte, den Mangel an Arbeitskräften während des Wirtschaftswunders zu beheben. Für Spanien bestand der Vorteil des Anwerbeabkommens vor allem in der Bekämpfung der Arbeitslosigkeit und in der Devisenbeschaffung; zugleich sollte es dazu beitragen, dem franquistischen Staat den Weg aus der politischen Isolation zu ebnen. Bis zum Anwerbestopp 1973 ließen sich ca. 600.000 spanische Gastarbeiter in der Bundesrepublik nieder (vgl. Rass 2012 und Kreienbrink 2012 für einen Überblick). Eine weitere Einwanderungswelle wurde in jüngerer Zeit durch die Finanz- und Eurokrise ausgelöst; allein 2012 kamen knapp 38.000 Menschen aus Spanien dauerhaft nach Deutschland. Der Mikrozensus 2023 verzeichnet 233.000 in Deutschland lebende Personen mit dem Bezugsland Spanien. Hinzu kommen 353.000 Migranten aus spanischsprachigen Ländern Mittel- und Südamerikas (Destatis 2024), womit sich der Anteil der potenziell spanischsprachigen Bevölkerung auf ca. 0,7 % der Gesamteinwohnerschaft (84,6 Mio.) beläuft. 57 Da jedoch nur Personen gezählt werden, die entweder selbst oder deren Eltern eingewandert sind, nicht jedoch deren Nachkommen ab der dritten Generation, liegen die Zahlen für Menschen mit einem spanischsprachigen Bezugsland und möglichen herkunftssprachlichen Kenntnissen mutmaßlich höher. Dennoch ist das Spanische als Herkunftssprache in Deutschland bislang nur wenig auf empirischer Basis erforscht worden. Eine erste Studie war dem morphosyntaktischen Bereich gewidmet: Schmitz et al. (2016: 14) haben auf der Basis spontansprachlicher Daten gezeigt, dass weder nach Deutschland eingewanderte Sprecher der ersten Generation (L1 Spanisch, L2 Deutsch) noch solche der zweiten Ge‐ neration, die das Spanische als Herkunftssprache in Deutschland erworben haben, sich 5.2 Spanisch als Herkunftssprache und Diasporavarietät 337 <?page no="338"?> hinsichtlich der Verwendung von Subjektpronomina signifikant von den monolingual aufgewachsenen Kontrollpersonen aus Spanien unterscheiden. Somit wurde zumindest für den grammatischen Bereich der Nullsubjekteigenschaft kein Sprachverfall (bzw. keine Spracherosion, engl. language attrition) festgestellt. Anders ist dies im Bereich der Aussprache, wie die bislang vorliegenden Studien darlegen, deren Ergebnisse wir im Folgenden zusammenfassend vorstellen. Für den Konsonantismus hat Lleó (2018) gezeigt, dass deutsch-spanisch bilinguale Kinder, die das Spanische als Herkunftssprache in Deutschland (Hamburg) erwerben, im Vergleich zu in Spanien (Madrid) aufwachsenden bilingualen und monolingualen Kindern weniger zielsprachliche Spirantisierungen produzieren (z. B. la [b]olsa statt la [β]olsa ‘die Tasche’). Erklärbar ist dies mit Blick auf die Tatsache, dass das Deutsche (die dominante Sprache der Hamburger Kinder) keinen entsprechenden intervokalischen Abschwächungsprozess aufweist (vgl. 2.5.1.1). Ein Einfluss des Deutschen zeigt sich auch darin, dass diese Kinder den Artikulationsort von Nasalkonsonanten weniger häufig an den des nachfolgenden Konsonanten anpassen, also z. B. weniger häufig e[m] Bogotá sagen, als es bei den in Madrid aufwachsenden Kindern der Fall ist (vgl. 2.5.1.3, 3.1.2.3, 3.2, 3.3, 3.4). Auch hier kann ein Einfluss der dominanten Um‐ gebungssprache geltend gemacht werden, da entsprechende Assimilationen gemäß der Aussprachenorm des Deutschen sowohl über Wortgrenzen als auch wortintern unüblich sind, vgl. i[n]/ *[m] Bonn und a[n]/ *[m]passen (Krech et al. 2009: unter anpassen). In einer breit angelegten Studie hat Ruiz Moreno (2019) die spanische und deutsche Aussprache von in Deutschland lebenden Bilingualen untersucht und mit der von monolingual aufgewachsenen Sprechern des kastilischen Spanisch bzw. des norddeutschen Standarddeutsch verglichen. Dabei wurden drei Probandengruppen berücksichtigt: (1) in Deutschland geborene früh Bilinguale, (2) in einem spanisch‐ sprachigen Land geborene früh Bilinguale, die im Kindesalter mit ihren Familien nach Deutschland gekommen sind, und (3) spät Bilinguale, die das Deutsche im Erwachsenenalter in Deutschland erworben haben. Hinsichtlich der Realisierung stimmhafter und stimmloser Verschlusslaute hat er anhand von VOT-Messungen (vgl. 2.5.1.1) festgestellt, dass der Anteil an (nicht-normgerechten) Desonorisierungen von / b d ɡ/ bei den in Deutschland aufgewachsenen früh bilingualen Herkunftssprechern (Gruppe 1) im Spanischen höher liegt als bei den in spanischsprachiger Umgebung aufgewachsenen und nach Deutschland eingewanderten Bilingualen (Gruppen 2 und 3). Umgekehrt ist der Anteil (nicht-normgerechter) voll stimmhafter Realisierungen von / b d ɡ/ im Deutschen bei im Erwachsenenalter eingewanderten spät bilingualen Sprechern (Gruppe 3) am höchsten (vgl. Ruiz Moreno 2019: 127-139). Dagegen wird die Realisierung von / p t k/ im Spanischen unabhängig von der Gruppenzugehörigkeit kaum negativ vom Deutschen beeinflusst, was im Gegensatz zu entsprechenden Befunden für das Herkunftsspanische im englischsprachigen Kontext steht (vgl. 5.2.1). Auch hinsichtlich der r-Laute konnte Ruiz Moreno (2019: 157-163) bei in Deutschland lebenden spanischen Herkunftssprechern keinen negativen Transfer der uvularen r-Realisierung des Deutschen ([ʁ]) ins Spanische feststellen. 338 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="339"?> Bezüglich des Vokalismus lässt sich für das im deutschsprachigen Kontext gespro‐ chene herkunftssprachliche Spanisch ein ähnlicher Effekt erwarten wie beim Spani‐ schen als Herkunftssprache in den USA, denn in beiden Kontaktsprachen weisen unbetonte im Vergleich zu betonten Vokalen reduzierte spektrale Charakteristika und kürzere Dauern auf. Wie Ruiz Moreno (2019: 111ff.) mithilfe von normalisierten F 1 - und F 2 -Werten gezeigt hat, unterscheiden sich betonte und unbetonte Vokale im Herkunftsspanischen deutlich, was für eine Beeinflussung des Spanischen durch die Umgebungssprache Deutsch spricht. Hinsichtlich der Prosodie lässt sich für das in Deutschland gesprochene herkunfts‐ sprachliche Spanisch ein deutlicher Einfluss der Kontaktsprache auf rhythmischer Ebene erwarten, ebenso wie es auch für das in den USA gesprochene Spanisch gezeigt wurde (vgl. 5.2.1): Da das Deutsche wie auch das Englische einen akzentzählenden Rhythmus aufweist und sich damit vom silbenzählenden Spanisch unterscheidet (vgl. 4.4.1, 4.4.2), sollte sich eine Anpassung des Spanischen an die Umgebungssprache in Form einer höheren Variabilität vokalischer Intervalle und eines geringeren vokali‐ schen Gesamtanteils niederschlagen. Eine empirische Studie dazu steht jedoch noch aus. Auf intonatorischer Ebene sind entsprechende Vorhersagen schwieriger: Das Deutsche und das Spanische gleichen sich darin, dass beide Sprachen über ein wort‐ basiertes Intonationssystem verfügen und dass die konkret produzierten F 0 -Konturen durch die Position metrisch starker Silben und die dort realisierten Tonhöhenakzente einerseits und die an prosodischen Grenzen platzierten Grenztöne andererseits be‐ stimmt werden (vgl. 4.5.1). Die diatopische Variation an Tonhöhenakzenten und Grenz‐ tönen ist hingegen in beiden Sprachen stark ausgeprägt, sodass bei jeder konkreten Studie mit einbezogen werden müsste, welche spanische Varietät der Herkunftssprache zugrundeliegt und wie die dialektale Prosodie des umgebungssprachlichen Deutsch beschaffen ist. Gerade dies ist jedoch nicht einfach zu gewährleisten, da sich bei Herkunftssprechern in der Diaspora häufig Gemeinschaften bilden, in denen Personen unterschiedlicher dialektaler Herkunft miteinander kommunizieren und sich hinsicht‐ lich diatopischer Aussprachemerkmale gegebenenfalls einander anpassen. Hinsichtlich der Schnittstelle zwischen Informationsstruktur, Prosodie und Syntax haben Feldhausen & Vanrell (2024) gezeigt, dass in Deutschland geborene und aufge‐ wachsene Herkunftssprecher des europäischen Spanisch fokussierte Konstituenten vorzugsweise durch prosodische Prominenz in situ markieren, und zwar unabhängig davon, ob es sich um (neutralen) Informationsfokus oder um (korrektiven) Kontrastfo‐ kus handelt ([ F/ KF MaRÍa] come la manzana ‘MaRIa isst den Apfel’). Für die monolingual aufgewachsenen Sprecher des europäischen Spanisch, die für die Studie aufgenom‐ men wurden, stellt diese (rein prosodische) Strategie der Fokusmarkierung keine relevante Option dar; stattdessen markieren sie neutral fokussierte Konstituenten bevorzugt durch die Verschiebung des Fokus ans Satzende (La come [ F MaRÍa] ‘Ma‐ RIa isst ihn (den Apfel)’), während der Kontrastfokus im Wesentlichen durch den Spaltsatz (No. Es [ KF MaRÍa] la que come la manzana ‘Nein. Es ist Maria, die den Apfel isst’) oder durch Fokusvoranstellung ausgedrückt wird (No. [ KF La manZAna] 5.2 Spanisch als Herkunftssprache und Diasporavarietät 339 <?page no="340"?> 58 Über die nach 1492 auf iberischem Boden verbliebenen, zum Christentum konvertierten Araber (sog. moriscos) informiert Bossong ( 3 2016: 59-65); vgl. auch die Zeittafel zur politischen Geschichte der Reconquista in Bossong ( 3 2016: 123f.). 59 Eine umfassende Darstellung jüdischen Lebens in Spanien vor 1492 sowie der Vertreibungsge‐ schichte findet sich bei Bossong (2008: 32-98). 60 Die Bezeichnung leitet sich von dem im biblischen Buch Obadja (1,19) erwähnten Gebiet Sepharad ab. Im Mittelalter wurde der Name auf die Iberische Halbinsel und auf die von dort stammenden Juden übertragen (vgl. Bossong 2008: 13). Die sephardischen Juden (auch: Sephardim) stellen neben den ursprünglich aus dem deutschsprachigen Raum (und insbesondere aus den rheinischen Gemeinden Speyer, Worms und Mainz) stammenden Aschkenasen den zweiten großen Zweig des Weltjudentums dar. Auch der Terminus Aschkenas war ursprünglich eine biblische Gebietsbezeichnung, die im Mit‐ telalter auf das deutschsprachige Gebiet und die dort lebenden Juden übertragen wurde. Die Sprache der aschkenasischen Juden ist das Jiddische, das früher teils auch als Judendeutsch bezeichnet wurde. come María, y no la pera ‘Nein. Den Apfel isst Maria, und nicht die Birne’). Dieser Befund stützt die Annahme, dass an externen Schnittstellen angesiedelte Phänomene für kontaktinduzierten Sprachwandel anfällig sind: Hier ist offensichtlich Einfluss aus dem Deutschen zu verzeichnen, einer Sprache, die zwar informationsstrukturell bedingte Wortstellungsvariation aufweist, jedoch kein unmittelbares Gegenstück zur spanischen Fokussierungsstruktur V(O)[ F S] (*Isst den Apfel / ihn [ F MaRIa]) kennt. Stattdessen ist im Deutschen die prosodische Fokussierung des Subjekts am Satzanfang unabhängig vom Fokustyp möglich ([ F/ KF MaRIa] isst den Apfel, vgl. Gabriel & Grünke 2018a: 365). 5.2.3 Das Judenspanische in Bulgarien und in der Türkei Nach Abschluss der christlichen Rückeroberung Spaniens, der sog. Reconquista (1492), und der Vertreibung der Araber 58 von der iberischen Halbinsel wurden im Zuge einer gewaltsamen Christianisierung auch alle jüdischen Menschen ausgewiesen, die nicht bereit waren, zum christlichen Glauben überzutreten. Die vertriebene jüdische Bevölkerung siedelte u. a. in nordeuropäischen Großstädten wie Amsterdam, London und Hamburg, aber auch in Nordafrika (heutiges Marokko), in Italien und - aufgrund der damals dort herrschenden umfassenden Religionsfreiheit - im Osmanischen Reich (bzw. in dessen Nachfolgestaaten, u. a. Griechenland, Serbien, Türkei, Bulgarien). 59 Das von ihnen gesprochene Spanisch kam in den neuen Siedlungsgebieten mit zahl‐ reichen typologisch unterschiedlichen Sprachen in Kontakt (Gabinskij 1992/ 2011; Arnold 2006; Minervini 2006; Quintana 2006: 295-318; 2014; Bürki 2013; Gabriel et al. 2014). Im Deutschen wird das von den jüdischen Gemeinschaften in der Diaspora gesprochene Spanisch meist als Judenspanisch bezeichnet. Je nach Varietät und Kontext firmiert die Sprache aber auch unter den Bezeichnungen ladino, (d)judezmo, djudyo, sefardí oder spanyolit (vgl. Gabinskij 1992/ 2011: 21-26; Schwarzwald 2018). Weitere Migrationsbewegungen der Nachfahren vertriebener sephardischer Juden 60 sind ab dem 19. Jahrhundert zu verzeichnen; sie führten vor allem in die USA. Für die europäischen Siedlungsgebiete war das einschneidendste Ereignis des 20. Jahrhunderts der Holocaust. Das Menschheitsverbrechen, dem insgesamt mehr als sechs Millionen 340 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="341"?> 61 So die Antwort auf eine Anfrage an das Bulgarische Nationale Statistikinstitut vom April 2024. Die Ergebnisse des Zensus von 2021 waren zum Zeitpunkt der Drucklegung noch nicht publiziert. jüdische Menschen zum Opfer fielen, dezimierte auch die Anzahl der sephardischen Juden in Europa maßgeblich. So wurde die jüdische Gemeinde der Stadt Saloniki (heute: Thessaloniki), die von 1430 bis 1912 zum Osmanischen Reich gehört hatte (danach zu Griechenland) und “von 1500 bis zu Beginn des 20. Jahrhunderts … eine mehrheitlich jüdische und spanischsprachige Stadt” (Bossong 2008: 94) gewesen war, unter deutscher Besatzung völlig ausgelöscht: Zwischen März und August 1943 wurden von dort insgesamt fast 50.000 Juden nach Auschwitz deportiert und dort ermordet. Das gleiche Schicksal traf die jüdischen Gemeinschaften auf dem Gebiet des heutigen Nordmazedonien, so etwa die in Manastir (heute: Bitola) und Skopje ansässigen Gemeinden. Eine Ausnahme bildet Bulgarien. Die 1934 dort lebenden ca. 50.000 Juden mit bulgarischer Staatsangehörigkeit blieben während des Zweiten Weltkriegs trotz der politischen Allianz ihres Landes mit Deutschland von den Deportationen in Vernich‐ tungslager verschont - nicht zuletzt aufgrund der Unterstützung durch die Regierung und die nicht-jüdische Bevölkerung (Hoppe 2009). Nach Gründung der Bulgarischen Volksrepublik (1946) verringerte sich die Größe der sephardischen Gemeinschaften jedoch durch die Auswanderung von ca. 90 % der jüdischen Bevölkerung (vor allem in den 1948 gegründeten Staat Israel) auf ca. 2.500 Personen. In der bulgarischen Volkszählung von 2021 benannten nur noch 194 Menschen еврейски evrejski ‘Jüdisch’ als ihre Erstsprache, wobei nicht zwischen unterschiedlichen ‘jüdischen’ Sprachen wie dem modernen Hebräisch, dem Jiddischen und dem Judenspanischen unterschieden wurde. 61 Das in Bulgarien gesprochene Judenspanisch ist damit eine bedrohte Spra‐ che, die keine monolingualen Sprecher mehr aufweist. Alle Sprecher - die ältesten wurden in den 1920er, die jüngsten in den 1960er Jahren geboren - sind mindestens zweisprachig und als im Bulgarischen dominant einzustufen. Durch die Aktivitäten des 1998 in Sofia gegründeten Klub ladino ist die Sprache wieder stärker in den Fokus der Öffentlichkeit gerückt. Die entsprechenden Aktivitäten kamen während der Corona-Pandemie jedoch zum Erliegen und wurden aufgrund der altersbedingt stetig schwindenden Mitgliederzahl nicht wieder aufgenommen. In der Literatur wird die Anzahl der Judenspanischsprecher in Bulgarien mit 250-300 Personen beziffert (Studemund-Halévy & Fischer 2013). Erkenntnisse aus Datenerhebungen des Forschungsprojekts “Judenspanisch in Bulgarien: eine Kontaktsprache zwischen Archaismus und Innovation” (2022-2025; vgl. https: / / gepris.dfg.de/ gepris/ projekt/ 4915 53503) machen deutlich, dass ihre Zahl rapide abnimmt und dass aktuell von bestenfalls 20-30 hochbetagten Sprechern auszugehen ist, die in unterschiedlichen Städten leben. In der Türkei befindet sich mit ca. 17.000 Menschen die größte sephardische Gemeinschaft, die in ihrem seit der frühen Neuzeit angestammten Gebiet verblieben ist. Allerdings spricht mittlerweile nur noch ein kleiner Bruchteil der Mitglieder Judenspanisch, da - wie auch in Bulgarien - die Sprache schon seit dem zweiten 5.2 Spanisch als Herkunftssprache und Diasporavarietät 341 <?page no="342"?> Drittel des 20. Jahrhunderts kaum noch an die Folgegenerationen weitergegeben wird. Ein weiterer Grund für den Schwund der Sprechergemeinschaft ist - ebenfalls wie in Bulgarien - die massive Auswanderung von Sepharden nach Israel, was in Istanbul zur Auflösung der räumlich konzentrierten jüdischen Gemeinde geführt hat. Da die wenigen verbliebenen potenziellen Sprecher über die gesamte Metropole versprengt sind, wurde der Sprachwechsel zum Türkischen begünstigt. Nach wie vor ist Istanbul jedoch das Zentrum jüdischen Lebens in der Türkei; hinzu kommen kleinere Gemeinschaften in Städten wie Ankara, Bursa, Çanakkale und Izmir (für einen Überblick vgl. Gabriel et al. 2024a: 257ff.). Ein filmisches Porträt des Sofioter Klub ladino von Boris Misirkov und Georgi Bogdanov (Bulgarien/ USA, 2015) findet sich unter https: / / www.youtube.com/ watch? v=n4DqvLR9dGc. Einen Überblick zur gegenwärtigen Situation des Judenspanischen in Istanbul mit zahlreichen Videos und anderen Dokumenten hat die Österreichische Akademie der Wissenschaften (ÖAW) zusammengestellt (vgl. https: / / www.oeaw.ac.at/ vlach/ collections/ judeo-spanish/ judeo-spanish-in-istanbul). Ebenfalls hat die ÖAW die im Wiener Phonogrammarchiv befindlichen historischen Aufnahmen des Balkan-Ju‐ denspanischen auf einer CD mit Begleitheft zugänglich gemacht (vgl. Liebl 2009). Über den heutigen Zustand der jüdischen Gemeinde in Thessaloniki informiert ein Beitrag von John Kazaklis, der selbst Sprecher des Judenspanischen ist (http: / / istoria.life/ jew s-of-thessaloniki/ 2016/ 12/ 5/ we-are-still-here-the-jews-of-thessaloniki). Ein Interview mit dem 1938 in Thessaloniki geborenen Shemtov Nathan, das Marie-Christine Varol Bornes 2004 mit ihm auf Judenspanisch geführt hat, lässt sich auf YouTube anhören (https: / / www.youtube.com/ watch? v=rFxWXfRLlQw). Im Folgenden geben wir einen Überblick über varietätenübergreifende lautliche Merkmale des Judenspanischen, bevor wir genauer auf die jeweiligen Einflüsse der Kontaktsprachen Bulgarisch und Türkisch eingehen. Nach Bradley (2022) umfasst das Phonemsystem des Judenspanischen varietätenübergreifend die in Abb. 5.2-3 vermerkten Konsonanten sowie die dem Standardspanischen entsprechenden fünf Vokale / a e i o u/ (vgl. 3.1.2.1). - - bilabial labioden‐ tal dental alveolar postalveo‐ lar velar Plosive -sth / p/ - / t/ - - / k/ +sth / b/ - / d/ - - / ɡ/ Affrikaten -sth - - - - / t͡ʃ/ - +sth - - - - / d͡ʒ/ - Frikative -sth - / f/ / s/ - / ʃ/ / x/ +sth - / v/ / z/ - / ʒ/ - Nasale +sth / m/ - - / n/ - - 342 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="343"?> Laterale +sth / l/ Vibranten Tap +sth - - - / ɾ/ - - Trill +sth - - - / r/ - - Abb. 5.2-3: Konsonantenphoneme des Judenspanischen (nach Bradley 2022: 812). Vgl. auch Varol Bornes (2008a: 21), die den durch Kontakt mit dem kastilischen Spanisch ins Judenspanische gekom‐ menen velaren Frikativ / x/ nicht verzeichnet. Grundsätzlich ist die judenspanische Phonologie durch zwei gegenläufige Tendenzen gekennzeichnet. Einerseits lassen sich Merkmale ausmachen, die früheren Sprachzu‐ ständen des Spanischen entsprechen und damit als Archaismen gelten können. Zu nennen ist neben dem Erhalt der Opposition / b/ : / v/ (Quintana 2009: 28; Bradley 2022: 812) vor allem das komplexe Sibilantensystem, das die dentalen und postalveolaren Frikative und Affrikaten sowohl in stimmloser als auch in stimmhafter Form also / s z ʃ ʒ/ sowie / ts dz tʃ dʒ/ aufweist (Quintana 2006: 69-84; Friedman & Joseph 2014: 8; Bradley 2022: 812) und damit dem System des spätmittelalterlichen Spanisch entspricht (Penny 2 2002: 98f.). Dagegen kennen die übrigen Varietäten des modernen Spanisch seit dem Umbruch des spanischen Konsonantensystems im 16. Jahrhundert (sog. revolución consonántica ‘konsonantische Revolution’) nur stimmlose Sibilanten, nämlich / s/ (in Kastilien auch / θ/ ) sowie varietätenübergreifend / x/ und / tʃ/ (vgl. Penny 2 2002: 101ff.). Kontrovers diskutiert wird die Abschwächung der intervokalischen stimmhaften Plosive zu Frikativapproximanten (Spirantisierung), die im Judenspani‐ schen nur wortintern vorkommt (Hualde 2013), in anderen Varietäten des modernen Spanisch hingegen über Wortgrenzen hinweg erfolgt (vgl. 2.5.1.1). Der möglichen Interpretation der im Judenspanischen beschränkt auftretenden Spirantisierung als Archaismus steht die von Penny (1992: 256) vertretene Auffassung gegenüber, dass der betreffende Schwächungsprozess im iberischen Sprachraum bereits gegen Ende des 15. Jahrhunderts generalisiert war und die judenspanische Plosivrealisierung daher als sprachliche Innovation zu betrachten sei. Als weitere innovative Merkmale, die sich nach der Vertreibung in den jüdischen Netzwerken als Aussprachevarianten herausgebildet haben, nennen Penny (1992) und Quintana (2006) für Teile des Balkans die Anhebung des unbetonten / e/ zu [i] wie etwa in noch[i] ‘Nacht’ (Quintana 2006: 40f.), für Manastir/ Bitola (Nordmazedonien) die Anhebung des finalen / a/ zu [e] (mesa [ ˈ meze]) ‘Tisch’ sowie varietätenübergreifend die Labialisierung des initialen / n/ des Pronomens der 1. Person Plural nosotros > muzos ‘wir’ und die rd-Metathese (Lautum‐ stellung) wie in gordo > godro ‘dick’ (Bradley 2007a). Wie andere spanische Varietäten weist das Judenspanische regressive Stimmhaftigkeitsassimilation auf wie z. B. in mismo [ ˈ mizmo] ‘selbst’ (vgl. 2.5.1.2 und Bradley 2007b). Die marokkanische Varietät des Judenspanischen, das sog. haketía, zeigt zudem Totalassimilation über Wortgrenzen hinweg, d. h., es werden alle Merkmale der betreffenden Laute einander angeglichen, sodass die vormals unterschiedlichen Segmente identisch sind. Dabei können sog. 5.2 Spanisch als Herkunftssprache und Diasporavarietät 343 <?page no="344"?> 62 Während die mittleren Vokale des Türkischen, ebenso wie die des Spanischen, als / e/ bzw. / o/ repräsentiert werden, setzt man für das Bulgarische aufgrund der im unmarkierten Fall offeneren Realisierungen die Kategorien / ɛ/ bzw. / ɔ/ an. Diese Eigenschaften übernehmen wir für die Darstel‐ lung der judenspanischen Vokalsysteme. 63 Im Deutschen hingegen ist der Schwa-Laut [ə] auf unbetonte Silben beschränkt (Lehre [ ˈ leʁə], Pappe [ ˈ papə], Bedarf [bə ˈ daːf]). Weist diese Silbe einen Nasalkonsonanten oder Lateral auf, wird in normaler Aussprache kein [ə] realisiert (Pappen [ ˈ pap m̩ ], Pappel [ ˈ pap l ̩ ]); enthält sie ein vokalisiertes r [ɐ] (sog. r-Schwa, vgl. 2.5.1.5 und 5.3.1), ist auch in besonders deutlicher Aussprache kein [ə] zu hören (Lehrer [ ˈ leʁɐ]). 64 Im Einklang mit gängigen Analysen des bulgarischen Vokalsystems verwenden wir anstelle des ansonsten für Schwa üblichen Zeichens [ə] das Zeichen [ɤ], das einen etwas weiter hinten im Mundraum produzierten ungerundeten Oralvokal repräsentiert (Ternes & Vladimirova-Buhtz 1999: 56). Scheingeminaten (engl. fake geminates) entstehen wie in siudad ninguna / d#n/ [-n.n-] > [nː] (Bradley & Adams 2018). Darüber hinaus treten Geminaten im haketía nicht nur in arabischen und hebräischen Lehnwörtern, sondern auch in Wörtern spanischen Ursprungs auf. So hat etwa rikézz[ː]a ‘Reichtum’ einen Langkonsonanten, während das spanische Äquivalent riqueza mit einem einfachen Sibilanten [s] bzw. [θ] realisiert wird. Bentolila (1985) interpretiert dies als Einfluss der semitischen Kontaktsprachen Arabisch und Hebräisch auf das in Marokko gesprochene Judenspanisch. Prosodische Merkmale des Judenspanischen waren bisher nur in Bezug auf die in Bulgarien und der Türkei gesprochenen Varietäten Gegenstand der Forschung. Im letzten Teil dieses Unterkapitels kommen wir hierauf zurück. Das Vokalsystem des in Bulgarien und der Türkei gesprochenen Spanisch umfasst, ebenso wie das anderer spanischer und judenspanischer Varietäten, zwei hohe und zwei mittlere sowie einen tiefen Vokal (vgl. 3.1.2.1 bzw. Bradley 2022: 813). In Über‐ einstimmung mit gängigen Analysen des bulgarischen bzw. türkischen Vokalsystems (Ternes & Vladimirova-Buhtz 1999; Göksel & Kerslake 2005: 10) repräsentieren wir die Vokale des in Bulgarien gesprochenen Judenspanisch als / a ɛ i ɔ u/ und die des in der Türkei gesprochenen als / a e i o u/ . 62 Auf einen wichtigen Aspekt kontaktinduzierter Innovation weist Kănchev (1974; 1975) hin, der die bislang einzige Gesamtdarstellung der segmentalen Phonologie des in Sofia gesprochenen Judenspanisch vorgelegt hat. Dieses hat über Entlehnungen den zentralen Oralvokal Schwa aus dem Bulgarischen übernommen, der dort Phonemstatus hat und auch in betonten Silben auftritt. 63 Demnach weist das bulgarische Judenspanisch in begrenztem Maße Minimalpaare wie p[a]n ‘Brot’ vs. p[ɤ]n 64 ‘Baumstumpf, Holzklotz’ auf. Allerdings spielt das betonte Schwa abgesehen von bulgarischen Lehnwörtern im Judenspanischen keine Rolle, weshalb es bestenfalls als peripheres Phonem zu werten ist. Als ein weiteres aus der Kontaktsprache übernommenes Merkmal führen Kănchev (1974: 14f.) und Quintana (2006: 60) die Vokalreduktion an, die in ostbulgarischen Varietäten unbetontes / a ɛ ɔ/ betrifft (Anhebung zu [i ɤ u]), in Westbulgarien (und damit auch in der Hauptstadt) jedoch auf / a/ → [ɤ] und / ɔ/ → [u] beschränkt ist. Die Anhebung resultiert in der Verschmelzung des tiefen Vokals mit dem mittleren zentralen Vokal (/ a/ zu [ɤ]) und des mittleren mit dem hohen hinteren (/ ɔ/ zu [u]; Andreeva et al. 2013). Die Neutralisierung 344 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="345"?> von unbetontem / i/ und / ɛ/ ist in der in Sofia gesprochenen bulgarischen Varietät jedoch stigmatisiert und wird auch von aus Ostbulgarien stammenden Einwohnern der Hauptstadt vermieden. Für das in Sofia gesprochene Judenspanisch haben Gabriel & Kireva (2014b) und Fischer et al. (2014: 98) anhand gelesener Daten gezeigt, dass 36 % der unbetonten / ɔ/ zu [u] und 75,5 % der unbetonten / a/ zu Schwa angehoben werden, was wiederum dem hauptstädtischen Standard des Bulgarischen entspricht. Vgl. das folgende Beispiel aus der judenspanischen Version der Fabel von Nordwind und Sonne (vgl. Anhang), in dem die Anhebung von unbetontem / a/ und / ɔ/ allerdings nicht durchgehend auftritt: i en este punto ([ ˈ puntu]) vyene de pasar ([p ɤˈ saɾ]) un pasajero ([pas ɤˈ ʒɛɾu]) kon un palto godro ([ ˈ paltu ˈ ɡɔðru]) ‘und in diesem Moment kam ein Wanderer mit einem dicken Mantel vorbei’. Die in Sofia stigmatisierte, für Ostbulgarien typische / ɛ/ -zu-[i]-Anhebung tritt jedoch nicht auf. Hierauf aufbauend haben Gabriel & Grünke (2018b) gezeigt, dass bei in Ostbulgarien aufgewachsenen und nach Sofia übersiedelten Akademikerinnen die dialektale / ɛ/ -zu-[i]-Anhebung weder in Lesenoch in Spontandaten des Bulgarischen vorkommt und im Judenspanischen auf letztere begrenzt ist. Autokorrekturen wie in der Überschrift des Nordwindtexts El ayre del norte, die erst mit / ɛ/ -zu-[i]-Anhebung (ayr[i], nort[i]) und dann ohne realisiert wird (ayr[ɛ], nort[ɛ]), zeigen, dass diese beim Vorlesen judenspanischer Texte dezidiert vermieden wird. In den judenspanischen Spontandaten zeigen sich zwar auch Hyperkorrekturen wie in la istoria de m[ɛ] (statt m[i]) suegro ‘die Geschichte meines Schwiegervaters’, doch betragen die Anhebungsraten insgesamt bis zu 50 %. Dies spricht dafür, dass sich in der sephardischen Gemeinschaft Sofias die Vorstellung einer an der hauptstädtischen Varietät des Bulgarischen orientierten judenspanischen Aussprachenorm etabliert hat. Grünke et al. (2023b) haben die bereits dargelegten Befunde zum Vokalismus des in Bulgarien gesprochenen Judenspanisch auf breiterer Datenbasis validiert. Abb. 5.2-4 zeigt eine schematische Darstellung der dort prakti‐ zierten Anhebung unbetonter Vokale. Abb. 5.2-4: Schematische Darstellung der Reduktion (Anhebung) unbetonter Vokale im in Bulgarien gesprochenen Judenspanisch. Die nur in Ostbulgarien übliche / ɛ/ -zu-/ i/ -Anhebung wird durch die gestrichelte Linie repräsentiert. 5.2 Spanisch als Herkunftssprache und Diasporavarietät 345 <?page no="346"?> 65 Auslautendes / o/ tritt im Türkischen nur in Lehnwörtern auf wie etwa mayo ‘Badehose/ -anzug’, das aus dem Französischen übernommen wurde (< fr. maillot). Auch die in Istanbul gesprochene Varietät des Judenspanischen (vgl. Varol Bornes 2008b) weist Alternanzen unbetonter Vokale auf. Hierbei handelt es sich jedoch nicht um Reduktionsprozesse (die als solche auch in der Kontaktsprache Türkisch unbekannt sind), sondern eher um Reflexe der türkischen Vokalharmonie. Unter Vokalharmonie versteht man die Angleichung der in Suffixen enthaltenen Vokale an den letzten Vokal der Basis, an die diese angehängt werden. So lautet beispielsweise das Pluralsuffix gemäß der sog. kleinen Vokalharmonie -ler, wenn es an eine Silbe mit einem vorderen Vokal wie [i] angefügt wird (şehirler ‘Städte’), aber -lar, wenn es an eine Silbe mit einem tiefen oder hinteren Vokal wie den hinteren hohen ungerundeten Vokal [ɯ] tritt (kızlar ‘Mädchen P L ’). Entsprechend der sog. großen Vokalharmonie lautet das Akkusativsuffix -i, -ü, -u bzw. -ı, wenn es auf eine Silbe folgt, die die Vokale [e]/ [i], [ø]/ [y], [o]/ [u] bzw. [a]/ [ɯ] enthält, z. B. ateşi ‘Feuer A K K ’, gölü ‘See A K K ’, yolu ‘Weg A K K ’ bzw. balı ‘Honig A K K ’ (Göksel & Kerslake 2005: 21-25). Wie Gabriel et al. (2024a) gezeigt haben, wird diese Eigenschaft teils auf das Judenspanische übertragen, wobei insbesondere der Vokal / o/ in nachtoniger Position betroffen ist: Nach / a/ erscheint er oft als [ɯ] wie in anyos [ ˈ anjɯs] ‘Jahre’, vamos [ ˈ vamɯs] ‘wir gehen’ oder estamos [es ˈ tamɯs] ‘wir befinden uns’, was dem türkischen Muster bal - balı [-ɯ] entspricht. Ist der vorangehende Tonvokal jedoch ein / o/ oder ein / u/ , wird das nachtonige / o/ hingegen oft als [u] produziert wie z. B. in solo [ ˈ solu] oder muncho [ ˈ muntʃu]. Auch wenn die Oberflächenrealisierung der Anhebung des unbetonten / o/ zu [u] im bulga‐ rischen Judenspanisch gleichkommt, ist es plausibler, hier einen Einfluss des türkischen Musters yol - yolu anzunehmen. Zudem passt sich das Judenspanische dem Türkischen mit dieser Vokalalternanz auch dahingehend an, dass der im nativen Vokabular des Türkischen nicht vorkommende Auslautvokal / o/ vermieden wird. 65 Eine umfassende Übertragung der türkischen Vokalharmonie scheint jedoch durch die hohe funktionale Belastung der unbetonten wortfinalen Vokale [o] und [a] im Spanischen gehemmt zu sein: So müsste das auf den Stamm von viejo ‘alt’ folgende Suffix gemäß dieser phonologischen Regel entweder den Vokal [e] (kleine Vokalharmonie) oder den Vokal [i] enthalten (große Vokalharmonie). Als Resultat würden sowohl die maskuline als auch die feminine Form entweder [ ˈ vjeʒe] oder [ ˈ vjeʒi] lauten, und die Opposition des Genusmerkmals in viejo ‘alt M ’ bzw. vieja ‘alt F ’ könnte nicht ausgedrückt werden. Dies scheint dazu beizutragen, dass die türkische Vokalharmonie - anders als die bulgarische Vokalreduktion - nicht umfassend ins Judenspanische übertragen wird (vgl. Gabriel et al. 2024a: 275f.). Der Konsonantismus der in Bulgarien und der Türkei gesprochenen Varietäten des Judenspanischen entspricht weitgehend dem bereits beschriebenen konservativen System anderer Varietäten (vgl. Abb. 5.2-3). Eine Besonderheit ist der velare Frikativ, der im bulgarischen Judenspanisch als marginales Phonem / x/ nur in hebräischen Lehnwörtern auftritt (Kănchev 1974: 8f.) und im Istanbuler Judenspanisch - vermutlich 346 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="347"?> durch Kontakt mit kastilischen Medien - als allophonische Variante von / ʒ/ in das System integriert wurde (Romero 2013). Hieraus ergeben sich Aussprachevarianten wie in Parí dos ijas [ ˈ iʒas], dos ijas [ ˈ ixas] parí ‘Ich habe zwei Töchter auf die Welt gebracht, zwei Töchter habe ich auf die Welt gebracht’ (Romero 2013: 279). Für den suprasegmentalen Bereich haben Gabriel & Kireva (2014b: 731) gezeigt, dass sich die aus dem Bulgarischen ins Judenspanische übernommene Vokalreduktion, die mit einer Verkürzung der angehobenen Vokale einhergeht, auch auf den Rhythmus auswirkt: So weist das in Bulgarien gesprochene Judenspanisch im Vergleich zum kastilischen Spanisch einen niedrigeren vokalischen Gesamtanteil (%V) und eine höhere vokalische Variabilität auf (PVI, vgl. 4.4.2) und gleicht darin dem Bulgarischen. Da das Türkische ebenso wie das Spanische zu den silbenzählenden Sprachen gehört, ist auf rhythmischer Ebene keine nennenswerte Beeinflussung des in der Türkei gesprochenen Judenspanisch durch die Kontaktsprache zu erwarten. Entsprechende Untersuchungen stehen jedoch noch aus. Auch in Bezug auf die Intonation teilt das in Bulgarien gesprochene Judenspanisch zentrale Eigenschaften mit der Kontaktsprache. So haben Andreeva et al. (2017) gelesene Daten von älteren bilingualen Sprecherinnen (Alter: 79-88) untersucht und im Rahmen der autosegmental-metrischen Intonationsphonologie (vgl. 4.5.3) gezeigt, dass in beiden Sprachen dasselbe Repertoire von Akzent- und Grenztönen verwendet wird. Dies wiederum entspricht dem Tonsystem gleichaltriger monolingualer Sprecher des Bulgarischen in Sofia, das Andreeva (2007) auf breiter empirischer Grundlage untersucht hat. Andreeva et al. (2019, 2021) konnten den Befund tonaler Konvergenz zudem anhand von Semispontandaten derselben Personen untermauern. Pränukleare Tonhöhenakzente werden sowohl in den beiden Sprachen der Bilingualen (Bulgarisch und Judenspanisch) als auch im Bulgarischen der gleichaltrigen Monolingualen am häufigsten hoch (H*) und steigend mit früher Alignierung (L+H*) realisiert. Davon abweichend treten im (monolingualen) Bulgarisch jüngerer Sprecherinnen (Alter: 19-23) neben H* vorwiegend steigende Pränuklearakzente mit später Alignierung auf (L+>H*; Dimitrova et al. 2018: 711). Dieser altersbedingte Unterschied, der auf einen aktuellen Wandel der Alignierungseigenschaften bulgarischer Tonhöhenakzente hindeutet, hat jedoch keinen Einfluss auf das in Bulgarien gesprochene Judenspanisch, da dieses nur von älteren Menschen verwendet wird. Auch bei den Nuklearkonfigu‐ rationen zeigt sich im Judenspanischen bulgarischer Einfluss. So treten in neutralen Ja/ Nein-Fragen global fallende Schlusskonturen auf, die in deutlichem Gegensatz zu den steil steigenden Interrogativkonturen des kastilischen Spanisch (L* HH%, 4.5.4.1) stehen. Übernommen wurde die fallende Schlusskontur aus dem Bulgarischen, das den Modus des Fragesatzes mithilfe der Interrogativpartikel ли li ( Q ) ausdrückt. In Abb. 5.2-5 stellen wir einen bulgarischen neutralen Fragesatz dem judenspanischen Pendant gegenüber. Auch wenn sich die gezeigten Konturen nicht völlig entsprechen - die bulgarische Kontur enthält eine intermediäre Phrasengrenze (H-), die judenspanische nicht -, wird offensichtlich, dass sich die fallende judenspanische Schlusskontur (L*-L-L%) deutlich von der steigenden des Kastilischen Spanisch unterscheidet. 5.2 Spanisch als Herkunftssprache und Diasporavarietät 347 <?page no="348"?> Abb. 5.2-5: Neutraler Fragesatz bg. Имате ли мандарини? Imate li mandarini? (haben- P R S .2 S G Q Mandarine- P L ) und jsp. Tenesh mandarinas? ‘Haben Sie Mandarinen? ’ mit global fallender F 0 -Kontur L-L% (Sofia 2023; Erhebungsmethode: DCT). Bulgarischer Einfluss zeigt sich auch bei der Realisierung von Rufkonturen (Vokativen) in unterschiedlichen pragmatischen Kontexten. So haben Grünke et al. (2023b) gezeigt, dass monolinguale und bilinguale Sprecher des Bulgarischen in neutralen und positiven Kontexten in dieser Sprache überwiegend die Konturen L+H* ! H-H% und L+H* H-L% verwenden (Situation: Das Kind Kalina wird gerufen, um zum Essen zu kommen bzw. um ein Geburtstagsgeschenk abzuholen), während L+H* L-L% eindeutig für negativ konnotierte Situationen reserviert ist (Kalina wird gerufen, weil sie eine Blumenvase zerbrochen hat). Im bulgarischen Judenspanisch greifen die Bilingualen hingegen auch in neutralen und positiven Kontexten häufiger auf die (im Bulgari‐ schen negativ konnotierte) Rufkontur L+H* L-L% zurück und zeigen generell mehr Variation. Dieser Befund stützt die in Abb. 5-1 dargestellte Schnittstellen-Hypothese, der zufolge an der externen Schnittstelle zur Pragmatik angesiedelte Phänomene in Sprachkontaktsituationen für übereinzelsprachlichen Einfluss und Spracherosion anfällig sind. Gleiches gilt auch für die Platzierung prosodischer Prominenzen bei der Realisierung von Strukturen, die im Spanischen und im Bulgarischen grammatisch parallel aufgebaut sind und für deren korrekte Interpretation ein Rekurs auf periphere Module und damit eine Aktivierung externer Schnittstellen wie der zur Pragmatik und zur Informationsstruktur erforderlich ist. Relevant sind hier Komparativstrukturen wie más fuerte ‘stärker’, bei denen im Spanischen die Betonung auf der metrisch starken Silbe des Adjektivs liegt. Im Bulgarischen hingegen erfolgt entweder eine 348 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="349"?> Betonungsverschiebung auf die vorangestellte Komparativpartikel, also ПО-силен PO-silen, oder es werden zwei benachbarte Prominenzen realisiert (was im Spanischen generell ausgeschlossen ist), nämlich ПО-СИлен PO-SIlen. Ähnliche Unterschiede bei der Platzierung prosodischer Prominenzen gibt es zwischen Spanisch und Bulgarisch bei Konstruktionen mit sp. muy bzw. bg. много mnogo ‘sehr’, d. h. sp. (una casa) muy LINda ‘ein sehr schönes Haus’ vs. bg. МНОго красива MNOgo krasiva oder МНОго краСИва MNOgo kraSIva ‘sehr schön F ’. Bei beiden Konstruktionstypen können externe Schnittstellen aktiviert werden, etwa wenn aufgrund des Kontexts das modifizierte Adjektiv fokussiert wird. Entsprechend der Schnittstellen-Hypothese ist eine Anpas‐ sung des Judenspanischen bei der prosodischen Realisierung dieser Konstruktionen an das Bulgarische zu erwarten, und in der Tat finden sich zahlreiche Belege für Betonungsmuster, die von denen des Spanischen abweichen. Ein Beispiel geben wir in Abb. 5.2-6. Abb. 5.2-6: Realisierung der Sequenz ama lo mas fuerte (el ayre soplava) ‘aber je stärker (der Wind blies)’ mit zwei benachbarten Prominenzen durch eine judenspanisch-bulgarisch bilinguale Sprecherin (Sofia 2012; Erhebungsmethode: Lesetext). Die Konjunktion jsp. ama ‘aber’ (sp. pero) wurde aus dem Türkischen entlehnt (< türk. ama ‘aber’). Anders liegen die Dinge, wenn es um kerngrammatische Phänomene wie die Kom‐ bination von Verben mit klitischen Objektpronomina und Negationspartikeln geht. Auch hier entsprechen sich die morphosyntaktischen Strukturen des Bulgarischen und des Spanischen (Abfolge Negation-Klitikon-Verb), jedoch weisen beide Sprachen unterschiedliche Betonungsmuster auf: Während im Bulgarischen eine Betonungsver‐ schiebung auf das Klitikon erfolgt wie in bg. Не МЕ интересува Ne ME interesuva ( N E G mich interessieren-3 S G ) ‘(Das) interessiert mich nicht’, liegt im Spanischen die Betonung auf der Negationspartikel, und das Klitikon bleibt unbetont: NO me interesa. Interessant ist, dass sich das Judenspanische hier nicht der Kontaktsprache angepasst hat, d. h., es erfolgt keine Betonungsverschiebung auf das Klitikon (*No ME interesa). Auch dieser Befund stützt die Schnittstellen-Hypothese: Da die Verbindung des Verbs mit klitischen Pronomina und Negationspartikeln festen Stellungsregeln unterliegt und keinerlei informationsstrukturell oder pragmatisch motivierte Variation erlaubt, han‐ 5.2 Spanisch als Herkunftssprache und Diasporavarietät 349 <?page no="350"?> 66 Tonhöhenakzente im Sinne von mit metrisch starken Silben assoziierte F 0 -Bewegungen kommen im Türkischen zudem nur in sog. unregelmäßigen Wurzeln wie im antepänultimabetonten Ortsnamen ANkara oder im pänultimabetonten Lehnwort BANka ‘Bank’ (< it. banca) vor. Ansonsten weist die Sprache ein phrasenbasiertes Intonationssystem auf, das dem des Französischen ähnelt. In Bezug auf die für das Türkische typische Koexistenz von (im unmarkierten Falle) phrasenbasierter und (auf Ausnahmen beschränkter) wortbasierter Intonation wird in der Forschung oft von co-phonologies gesprochen (vgl. Kabak & Vogel 2001: 317f. sowie Grünke & Gabriel 2022: 6 für einen Überblick). delt es sich hierbei um ein kerngrammatisches Phänomen, das sich im Sprachkontakt als robust erweisen sollte. Die Intonation des in der Türkei gesprochenen Judenspanisch ist bislang weniger intensiv untersucht worden. In einer ersten Studie haben Hualde & Şaul (2011) auf Basis der Daten eines Sprechers aus Istanbul keinen Einfluss der türkischen Prosodie auf das Judenspanische, jedoch umgekehrt eine Beeinflussung der türkischen Intonation durch die Diasporasprache festgestellt. Hualde & Quintana (2024: 238) weisen aber darauf hin, dass sich türkischer Einfluss in den Betonungsmustern einzelner Lexeme bemerkbar macht, so etwa in jsp. pasharó ‘Vogel’, wo die Endbetonung im Gegensatz zu sp. pájaro dem unmarkierten Muster des Türkischen entspricht (vgl. Göksel & Kerslake 2005: 26). Nach Hualde & Quintana (2024: 252) weist das in Istanbul gesprochene Judenspanisch in der Intonation, anders als die meisten spanischen Varietäten, vor allem steigende Pränuklearakzente mit früher Alignierung auf (L+H*). Darin gleicht es dem in Bulgarien gesprochenen Judenspanisch, das, wie bereits ausgeführt, die frühen Tonhöhengipfel vermutlich aus der Kontaktsprache übernommen hat. Die L+H*-Akzente des in Istanbul gesprochenen Judenspanisch lassen sich jedoch kaum durch Sprachkontakt erklären, da die Tonhöhenakzente des Türkischen eher fallend (H*+L) als steigend sind und damit nicht als unmittelbares Vorbild dienen können (vgl. Féry 2017: 253-256). 66 Abschließend verweisen wir auf die Überblicksartikel von Bradley (2022) und Quintana (2023) zur judenspanischen Phonetik und Phonologie. 5.3 Spanisch als Fremdsprache im deutschsprachigen Kontext Als letzte Sprachkontaktsituation befassen wir uns mit dem Fremdsprachenler‐ nen, also mit der gesteuerten und institutionalisierten Form des L2- oder Zweitspracherwerbs, wie er in der Schule, in der Universität oder auch im Rahmen von Sprachkursen in der Erwachsenenbildung erfolgt. Beim ungesteuerten L2-Erwerb hingegen erwerben Menschen nach Abschluss des L1-Erwerbs eine weitere Sprache in erster Linie durch Immersion, d. h. durch Konfrontation mit sprachlichen Daten im Zielland. Ein Beispiel hierfür sind die sog. Gastarbeiter (vgl. 5.2.2), die - von der Bundesrepublik Deutschland in den 1950er bis 1970er Jahren angeworben - vorwiegend in schlecht bezahlten Berufen tätig waren (für die sie keine oder nur wenig Deutschkenntnisse benötigten) und die - meist ohne oder mit nur geringer Unterstützung durch formellen Sprachunterricht - nach und nach Grundkenntnisse 350 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="351"?> 67 Auch bei Kindern von umgesiedelten Arbeitsmigranten findet in der neuen Umgebung, insbesondere mit den Peers in Kindergarten und Schule, ungesteuerter L2-Erwerb statt. Je nach Alter ist dieser frühe L2-Erwerb nur schwer vom L1-Erwerb zu unterscheiden (Meisel 2009). 68 Im Schuljahr 2021/ 22 haben 5,9 % aller Kinder und Jugendlichen in Deutschland Spanisch als Schulfremdsprache gelernt, was knapp 500.000 Lernenden entspricht. Zum Vergleich: Englisch lernten im gleichen Zeitraum 82,4 % (6,95 Millionen), Französisch 15,3 % (1,29 Millionen) und Latein 6,4 % (539.000) der Kinder und Jugendlichen (Statistisches Bundesamt; vgl. https: / / www.destatis.de/ DE/ Presse/ Pressemitteilungen/ Zahl-der-Woche/ 2023/ PD23_03_p002.html). der neuen Umgebungssprache erwarben. 67 Unabhängig davon, ob der Erwerb einer weiteren Sprache nach Abschluss des kindlichen L1-Erwerbs in ungesteuerter oder in gesteuerter Form (um die es jetzt gehen soll) erfolgt: Auch hier interagieren im sprachlichen Wissen des Individuums mindestens zwei Sprachen miteinander, nämlich die in früher Kindheit erworbene Erstsprache und die zu erlernende Fremdsprache. Oft sind es aber auch mehr als zwei Sprachen, die miteinander in Kontakt kommen: Zum einen ist die Fremdsprache in vielen Fällen nicht die erste, mit der die Lernenden konfrontiert werden. Dies gilt insbesondere für das Spanische im deutschsprachigen Raum, das fast immer als zweite Fremdsprache nach dem Englischen und oft auch als dritte Fremdsprache nach Englisch und Französisch oder Latein gelernt wird. Zum anderen kann der Fremdsprachenerwerb auch vor dem Hintergrund frühkindlicher Mehrsprachigkeit erfolgen, d. h., wenn Menschen, die neben dem Deutschen eine Herkunftssprache (vgl. 5.2) erworben haben und im privaten Umfeld verwenden, Spanisch als Fremdsprache lernen. In beiden Fällen spricht man von Dritt- oder Tertiärsprachenerwerb (abgekürzt: L3-Erwerb). Im Folgenden beschränken wir uns auf den Erwerb des Spanischen als Fremdsprache durch monolingual mit Deutsch als L1 aufgewachsene Lernende sowie auf solche, die neben dem Deutschen eine Herkunftssprache wie z. B. das Türkische sprechen. Obwohl Spanisch in Deutschland eine verbreitete Fremdsprache ist, 68 lässt sich die verfügbare Literatur zum Erwerb der spanischen Aussprache durch deutschsprachige Lernende bislang gut überschauen; wir beziehen deshalb im Einzelfall Studien aus dem anglophonen Bereich mit ein. Theorien des lautlichen L2-Erwerbs Bis weit ins 20. Jahrhundert hinein wurde Fremdsprachenerwerb in der sprach‐ wissenschaftlichen und insbesondere phonetisch-phonologischen Forschung nur wenig thematisiert. Stattdessen war die Beschäftigung mit fremdsprachlicher Lautung im Wesentlichen didaktisch und lehrmethodisch motiviert: Kontrastive Analysen der Erst- und der Zielsprache dienten zur Vorhersage von Fehlern - und zu deren Vermeidung (vgl. Lado 1957). Erst seit den frühen 1970er Jahren wird die Sprachproduktion von Fremdsprachenlernenden nicht mehr ausschließlich als fehlerhaftes und damit verbesserungsbedürftiges Sprechen wahrgenommen, sondern als Aussprache, die auf einem eigenständigen System beruht, das sich sowohl von dem der Erstals auch von dem der Zielsprache unterscheidet. Für solche individuellen lernersprachlichen Systeme, die sich mit 5.3 Spanisch als Fremdsprache im deutschsprachigen Kontext 351 <?page no="352"?> zunehmender Progression sukzessive dem Lautsystem der Zielsprache annähern, hat Selinker (1972) den Begriff der Interimssprache (im englischen Original: interlanguage; sp. interlengua) geprägt. Wie aber sieht ein solches Lautsystem aus und inwiefern ist es von der L1 der Lernenden geprägt? Welche Rolle spielen dabei allgemeine Konzepte wie das der Markiertheit (vgl. 3.1.1) und die Wahrnehmung der Fremdsprache durch die Lernenden? Die nachfolgend skizzierten theoretischen Ansätze versuchen, Antworten auf diese Fragen zu geben, um damit Vorhersagen für Fremdsprachenerwerb zu treffen und die Interpretation lernersprachlicher Daten zu erleichtern. • Eckman (1977) verfolgt einen Ansatz, der auf dem Konzept der Markiertheit aufbaut. Seine Markedness Differential Hypothesis (MDH) besagt, dass markierte Laute und Lautkombinationen, also solche, die in den Sprachen der Welt selten vorkommen, durch Fremdsprachenlerner weniger leicht zu erwerben sind als solche, die in den meisten Sprachen auftreten und damit als unmarkiert gelten (vgl. 3.1.1). So lässt sich u. a. erklären, dass französisch- oder spanischsprachige Deutschlernende die Auslautverhärtung (vgl. 3.2, 5.1.2) meist mühelos erlernen, während es umgekehrt deutschsprachigen Lernern in der Regel schwerfällt, diese in einer Fremdsprache, die stimmhafte Obstruenten im Silbenauslaut erlaubt, zu vermeiden. Eine markiertheitsba‐ sierte Erklärung liegt darin, dass stimmhafte Obstruenten wie / b d ɡ v z ʒ/ in Codaposition in den Sprachen der Welt selten vorkommen und damit markierter sind als die entsprechenden stimmlosen Laute / p t k f s ʃ/ . Dies spricht dafür, dass es schwerer ist, die Auslautverhärtung in der Fremdsprache zu vermeiden, wenn man sie in der L1 einmal erworben hat, als umgekehrt mit der Auslautverhärtung eine neue Regel zu erwerben, die zu einem weniger markierten System führt. Gemäß der MDH gelten die folgenden Voraussagen: Leicht erlernbar sind Phänomene, die in Erst- und Zielsprache gleich sind, und solche, die in der Zielsprache zwar anders, aber weniger markiert sind als in der Erstsprache. Schwer zu erlernen hingegen sind Phänomene, die in der Zielsprache anders und markierter sind als in der Erstsprache. Im konkreten Fall der Auslautverhärtung führt ein negativer Transfer aus dem Deutschen allerdings nur selten zu Fehlaussprachen: Spanische Silben lassen nur in begrenztem Maße Obstruenten in der Coda zu, und die wenigen dort vorkommenden Segmente sind meist ohnehin stimmlos (vgl. 4.2.4.2) wie etwa [-s] in tres ‘drei’. Folglich können sie auch nicht fehlerhaft entstimmt werden. Ausnahmen stellen Lehnwörter wie club dar, deren auslautender Konsonant im Spanischen zwar getilgt, nicht aber entstimmt werden kann (vgl. 2.5.1.1). Die Aussprache *[klup] (anstelle von 352 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="353"?> 69 Im bulgarischen Judenspanisch (vgl. 5.2.3) tritt die Aussprache [klup] jedoch auf, was auf die Auslautverhärtung der dominanten Sprache Bulgarisch zurückzuführen ist. [klub], [kluβ] oder [klu]) würde also als fremdsprachiger Akzent wahrge‐ nommen und sollte entsprechend vermieden werden. 69 • Im Rahmen des von Flege (1987) vorgeschlagenen und von Flege & Bohn (2021) überarbeiteten Speech Learning Model (SLM) wird der Aussprache‐ erwerb vor allem aus der Wahrnehmungsperspektive (Perzeption, vgl. 2.4) betrachtet: Im Einklang mit Trubetzkoy (1939/ 7 1989) wird angenommen, dass Lernende die Laute der Fremdsprache gefiltert durch das phonologi‐ sche System ihrer Erstsprache wahrnehmen. Deswegen hören sie lautliche Unterschiede, die in ihrem L1-System nicht vorkommen, nur schlecht und können sie folglich oft auch nicht korrekt produzieren. Es handelt sich dabei meist um similar sounds, also um artikulatorisch oder perzeptiv ähnliche Laute, die von den Lernenden nicht korrekt kategorisiert werden. Daneben gibt es sog. old sounds - also ‘alte’ Laute, die man aus dem L1-System kennt und die eins-zu-eins in die Zielsprache übernommen werden können. Schließlich gibt es noch die als new sounds bezeichneten ‘neuen’ Laute, die sich von denen des L1-Systems so deutlich unterscheiden, dass Lerner sie meist als anders wahrnehmen. Anhand der r-Laute des Deutschen und der romanischen Sprachen kann man sich den Unterschied zwischen den drei von Flege vorgeschlagenen Lautklassen klarmachen: Deutschsprachige Spanischlernende, die in ihrer L1 den uvularen Frikativ [ʁ] verwenden, merken in der Regel sofort, dass die spanischen r-Laute anders realisiert werden, nämlich nicht im Rachen wie bei dt. rot [ʁoːt], sondern mit der Zungenspitze wie im Anlaut von sp. rojo [ ˈ roxo] ‘rot’ oder intervokalisch in caro [ ˈ kaɾo] ‘teuer’. Damit handelt es sich aus deutscher Sicht bei sp. [r] (Trill) und [ɾ] (Tap) um new sounds; wenn ein Lerner diese nicht von Anfang an korrekt mit der Zungenspitze produzieren kann, liegt das daran, dass er die entsprechenden artikulatorischen Bewegungen nicht gewohnt ist (vgl. 5.3.1 für entsprechende Ausspracheübungen). Für italienische Spa‐ nischlernende ist der spanische Trill [r] hingegen ein old sound, den sie als konsonantisches Phonem aus ihrer L1 kennen. Der italienische Trill kommt sowohl in einer Langversion als auch in einer Kurzversion (d. h. mit weniger Verschlussphasen) vor, wobei die Kurzversion durchaus dem spanischen Tap entsprechen kann, aber nicht muss (vgl. Heinz & Schmid 2021: 179). Daher haben italienische Lerner Schwierigkeiten, im Spanischen den Trill vom Tap zu unterscheiden, und sie schlagen letzteren eher als similar sound der Kate‐ gorie / r/ zu als hierfür eine eigene phonemische Kategorie zu eröffnen. Das bedeutet, sie kategorisieren die intervokalisch kontrastierenden Phoneme / r/ und / ɾ/ (vgl. sp. carro [ ˈ karo] ‘Wagen’ vs. caro [ ˈ kaɾo] ‘teuer’) als Varianten ein und desselben Lauts. Folglich haben sie auch Schwierigkeiten, die beiden 5.3 Spanisch als Fremdsprache im deutschsprachigen Kontext 353 <?page no="354"?> 70 Ein weiteres Beispiel für die Kategorie der similar sounds sind für Lernende mit der L1 Deutsch (und vielen anderen Sprachen) die Frikativapproximanten [β ð ɣ], die den Lauten [b] (bzw. [v]), [d], [ɡ] ähnlich sind und die deshalb von ihnen automatisch durch diese ersetzt werden. Das wird auch durch die Schreibung unterstützt, in der die spanische Spirantisierung nicht wiedergegeben wird (2.5.1.1). r-Laute in zielsprachlicher Distribution zu produzieren - auch wenn sie grundsätzlich in der Lage sind, die spanischen r-Laute mit der Zungenspitze zu realisieren. 70 Was bei italienischen Spanischlernern für den Trill [r] zutrifft, gilt für deutsche Lerner hinsichtlich des französischen r: Da in den Standardvarietäten sowohl des Deutschen als auch des Französischen der r-Laut im Onset als uvularer Frikativ ausgesprochen wird (z. B. dt. rot [ʁoːt] bzw. fr. rouge [ʁuːʒ] ‘rot’), handelt es sich gemäß SLM um einen old sound, der problemlos aus dem Deutschen ins Französische übernommen werden kann. Allerdings müssen deutschsprachige Lernende des Französischen und des Spanischen darauf achten, die für das Deutsche typische phonologische Regel der r-Vokalisierung in der Coda (2.5.1.5) nicht in die Fremdsprache zu übertragen. • Auch das von Best (1995: 193-199) vorgeschlagene Perception-Assimila‐ tion Model (PAM; vgl. auch Best & Tyler 2007) geht von unterschiedlichen Kategorisierungsvorgängen bei der Wahrnehmung fremdsprachlicher Laute aus. Zugrundeliegend ist dabei die Beobachtung, dass wir unbekannte Objekte, wenn wir sie zum ersten Mal sehen, automatisch mit Objekten vergleichen, die wir bereits kennen und die wir in Bezug auf Merkmale wie Form, Farbe und Größe als ähnlich empfinden. Gleiches passiert auch bei der Perzeption von fremdsprachlichen Lauten: Auch sie setzen wir unwillkürlich mit lautlichen Kategorien unseres L1-Systems in Verbindung. Dabei spielen sog. artikulatorische Gesten, also die beim Sprechen ausgeführten Bewegun‐ gen der Sprechwerkzeuge, eine besondere Rolle. Wenn die artikulatorischen Gesten fremdsprachlicher Laute denen der L1-Laute, die wir perzeptiv mit ihnen in Verbindung bringen, vollständig oder weitgehend entsprechen (vgl. die im SLM angenommenen old sounds bzw. similar sounds), werden die fremdsprachlichen Laute entsprechenden L1-Kategorien zugeordnet. Im Kontext des PAM ist hier von Assimilation die Rede - was nicht zu verwechseln ist mit der Assimilation im Sinne einer artikulatorischen Anpas‐ sung von Segmenten an die lautliche Umgebung, wie wir sie in 3.1.1 und 3.2 besprochen haben. Allerdings kann es auch sein, dass ein fremdsprachlicher Laut zwar als Bestandteil der Redekette wahrgenommen wird, aber nicht gemäß den aus der L1 gewohnten artikulatorischen Gesten kategorisiert werden kann; solche Fälle entsprechen mehr oder minder den new sounds des SLM. Entsprechende Laute werden dann zwar ins Lautrepertoire aufge‐ nommen, bleiben aber unkategorisiert, was zur Folge haben kann, dass sie schwer zu produzieren sind (z. B. die spanischen r-Laute in der Aussprache deutschsprachiger Lerner, siehe oben). Schließlich besteht die Möglichkeit, 354 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="355"?> dass ein Laut gar nicht als sprachlich interpretiert wird. Dies ist etwa bei den Klick- oder Schnalzlauten des im südlichen Afrika gesprochenen Xhosa (Aussprache: [ ˈ kǁʰoːsa]) in der Wahrnehmung von Menschen, deren L1 keine derartigen Laute enthält, der Fall: So wird etwa der im IPA-System durch zwei senkrechte Striche ([ǁ]) symbolisierte laterale Klick von deutschen, spanischen oder englischen L1-Sprechern eher als ein Fremdkörper in der Lautkette empfunden, denn als Sprachlaut gehört. Solche Laute gelten dann als “not assimilated into native phonological space at all” (Best 1995: 195). • Speziell auf das Erlernen fremdsprachlicher Intonation bezieht sich die von Mennen (2015) ausgearbeitete L2 Intonation Learning Theory (LiLT). Um die unterschiedlichen Ebenen des tonalen Transfers von der L1 in die Fremdsprache genauer zu erfassen, werden vier Dimensionen unterschieden, entlang derer in der fremdsprachlichen Intonation Abweichungen von mut‐ tersprachlichen Normen auftreten können: Die systemische Dimension bezieht sich auf den Erwerb des Inventars von zugrundeliegenden Elementen wie Tonhöhenakzenten und Grenztönen. Die Realisierungsdimension bezieht sich auf die phonetische Umsetzung der phonologischen Struktur‐ elemente (z. B. Skalierung und Alignierung von Tonhöhengipfeln), während sich die semantische Dimension damit befasst, wie solche Elemente zur Vermittlung von Bedeutung eingesetzt werden (z. B. zum Ausdruck pragma‐ tischer Lesarten oder der Informationsstruktur). Die Frequenzdimension schließlich betrifft die relative Häufigkeit des Vorkommens einzelner Struk‐ turelemente im Sprachsignal. In Übereinstimmung mit den Modellen zum Erwerb von L2-Segmenten wie SLM und PAM (siehe oben) wird angenom‐ men, dass die tonalen Kategorien sowohl der L1 als auch der gelernten Fremdsprache in einem gemeinsamen Bereich des sprachlichen Wissens abgelegt sind, was zu sprachenübergreifendem Einfluss entlang den oben genannten Dimensionen führen kann. Durch die Aufspaltung in unterschied‐ liche Dimensionen lassen sich Bereiche der L2-Intonation bestimmen, die verglichen mit anderen für erstsprachliche Einflüsse mehr oder weniger anfällig sind bzw. die sich mit zunehmender fremdsprachlicher Erfahrung schneller entwickeln als andere (für eine ausführlichere Darstellung des Modells vgl. Pešková 2023b: 75-80). 5.3.1 Segmentale Aspekte Wie bereits in 2.5.3 gezeigt, ist das spanische Vokalsystem einfach strukturiert und besteht aus nur fünf Vokalen, / i u e o a/ , die drei Öffnungsgrade (geschlossen, mittel und offen) abdecken. Alle diese Vokale gibt es auch im deutschen Vokalsystem, das das spanische an Komplexität übertrifft, da es u. a. auch vordere gerundete Vokalphoneme wie / y/ oder / œ/ sowie die hohen ungespannten Vokale / ɪ ʏ ʊ/ (z. B. bitte, Hütte, 5.3 Spanisch als Fremdsprache im deutschsprachigen Kontext 355 <?page no="356"?> 71 Zur Beeinflussung der unbetonten Vokale im herkunftssprachlichen Spanisch in Deutschland durch die Kontaktsprache Deutsch vgl. 5.2.2. Butter) umfasst. Der Erwerb der fünf spanischen Vokalphoneme bereitet deutschen Lernern keine größeren Schwierigkeiten, da sie alle als old sounds im Sinne von Fleges (1987) SLM zu verstehen sind und damit eins-zu-eins aus der L1 in die Zielsprache übernommen werden können. Das Deutsche zeichnet sich weiterhin dadurch aus, dass in unbetonten Silben fast ausschließlich die Reduktionsvokale [ə] (wie in bitte) und [ɐ] (wie in bitter) vorkommen, die im Vergleich zu Vollvokalen wie das [a] in Papa reduzierte spektrale Eigenschaften aufweisen, d. h., sie werden mit zentraler Zungenlage im Mund produziert. In Silben, die einen stimmhaften Konsonanten wie z. B. einen Nasal oder einen Lateral enthalten, wird der Schwa-Laut [ə] in normaler Aussprache zudem bis Null reduziert, d. h., er bleibt unrealisiert wie z. B. in geben [ ˈ ɡeː.bm̩] oder Löffel [ ˈ lœf l ̩ ]. Übertragen deutschsprachige Lerner dieses Merkmal auf das Spanische, so sind nicht-zielsprachliche Realisierungen bestimmter Wörter wahrscheinlich wie z. B. venden *[bendən] oder *[bendn̩] statt [benden] ‘sie verkaufen’. Im Spanischen hingegen unterscheiden sich betonte und unbetonte Vokale hinsichtlich ihrer Dauer und spektralen Ausprägung nicht wesentlich, d. h., auch in unbetonter Po‐ sition müssen Vollvokale realisiert werden. 71 Auf prosodischer Ebene entspricht dieser auffällige Unterschied zwischen dem deutschen und dem spanischen Vokalsystem dem bekannten Gegensatz zwischen akzent- und silbenzählenden Sprachen (vgl. 4.4.1). Wir kommen in 5.3.2 hierauf zurück. Was den Konsonantismus betrifft, stellen die meisten Segmente des Spanischen für deutschsprachige Lernende keine besonderen Schwierigkeiten dar: Unter den Nasalen gehören [m], [n] und [ŋ] (vgl. 2.5.1.3) zum muttersprachlichen Inventar des Deutschen. Der palatale Nasal [ɲ] hingegen fehlt im deutschen System; in französischen Lehnwörtern wie Kognak wird er meist durch die Sequenz [nj]/ [nʝ] ersetzt (Krech et al. 2009: 658). Wenn deutsche Spanischlerner anstelle des Zielseg‐ ments [ɲ] die Sequenz [nj]/ [nʝ] produzieren (z. B. *Espa[nj]/ [nʝ]a statt Espa[ɲ]a), trägt dies zwar zur Wahrnehmung eines fremdsprachigen Akzents bei, führt aber in der Regel nicht zu Missverständnissen. Eine Schwierigkeit kann allerdings darin bestehen, dass die Nasalassimilation im Deutschen sowohl wortintern als auch über die Wortgrenze hinweg auf informelle Register beschränkt ist (z. B. Einfluss [ ˈʔaɪ ̯ ɱflʊs ], kein Geld [ kaɪ ̯ ŋˈɡɛlt ]). Dagegen gehört sie im Spanischen zur Norm und muss dort in allen Kontexten, also sowohl wortintern (z. B. [iɱ]flexible ‘unbiegsam’) als auch bei intervenierenden Wortgrenzen realisiert werden, z. B. [uɱ] faro ‘ein Leuchtturm’ oder [koŋ] gusto ‘mit Vergnügen’ (vgl. Lleó & Ulloa 2019: 272f.). Die Produktion der spanischen Frikative / f θ s x/ stellt für deutschsprachige Lernende im Prinzip keine große Herausforderung dar: Der einzige Laut, der nicht mit dem Deutschen geteilt wird, nämlich der stimmlose interdentale Frikativ / θ/ , kann aus der (in der Regel zuvor erlernten) Fremdsprache Englisch übernommen werden. Zudem tritt er ohnehin nur in der kastilischen Varietät des Spanischen auf und kann von Lernern, die sich an ameri‐ 356 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="357"?> 72 Die im Spanischen optionale Assimilation von / s/ in der Coda vor Nasalkonsonant zu [z] (z. B. mismo [ ˈ mizmo] oder [ ˈ mismo] ‘(der)selbe’, asno [ ˈ azno] oder [ ˈ asno] ‘Esel’, vgl. 2.5.1.2) ist für deutschsprachige Lernende ungewohnt, da das Deutsche aufgrund der Auslautverhärtung in der Coda-Position gerade kein stimmhaftes [z] erlaubt. kanischen Varietäten orientieren, vernachlässigt werden. Allerdings unterscheidet sich das Spanische vom Deutschen darin, dass es auch im Anlaut nur stimmloses / s/ zulässt (z. B. sol [sol] ‘Sonne’), während im Standarddeutschen das stimmhafte / z/ in dieser Position verallgemeinert ist (z. B. Sonne [ ˈ zɔṇə]). Deutschsprachige Lerner müssen also darauf achten, den stimmhaften alveolaren Frikativ [z] in wortinitialer Position (z. B. sol *[z-]) und im wortinternen Onset nach einem stimmhaften Segment (z. B. consonante *[-nz-] ‘Konsonant’) konsequent zu vermeiden. 72 Eine große Herausforderung ist für die meisten deutschen Spanischlernenden die zielsprachliche Produktion der Plosive. Wie wir in 2.5.1.1 gesehen haben, weisen sowohl das Deutsche als auch das Spanische einen binären phonologischen Kontrast zwischen den stimmhaften Verschlusslauten / b d ɡ/ und ihren stimmlosen Entspre‐ chungen / p t k/ auf. Im Spanischen wird dieser auf phonetischer Ebene durch das Vorhandensein bzw. die Abwesenheit von Stimmhaftigkeit ausgedrückt, d. h. durch eine negative voice onset time (VOT) im absoluten Anlaut von Wörtern wie vaso [ ˈ baso] ‘Glas’, día [ ˈ dia] ‘Tag’, gama [ ˈ ɡama] ‘Tonleiter’ und eine kurze positive VOT bei paso [ ˈ paso] ‘Schritt’, tía [ ˈ tia] ‘Tante’, cama [ ˈ kama] ‘Bett’. Im Deutschen sind die Anlautkonsonanten in Wörtern wie backen, Dorf und Gabel entstimmt: [ ˈ b̥akŋ̩], [d̥ɔɐ̯f], [ ˈɡ̊ abl ̩ ]. Damit sind sie phonetisch gesehen ebenso stimmlos wie / p t k/ im Spanischen, d. h., sie werden mit kurzer positiver VOT produziert. Die anlautenden Verschlusslaute in packen, Torf und Kabel unterscheiden sich von diesen durch die deutlich längere VOT, die als Aspiration (oder Behauchung) wahrgenommen wird: [ ˈ p h akŋ̩], [t h ɔɐ̯f], [ ˈ k h aːbl̩]. Wenn wir diese Aussprachegewohnheit des Deutschen auf das Spanische übertragen, müssen wir damit rechnen, dass unsere [b̥ d̥ ɡ̊ ]-Laute als stimmlose Plosive wahrge‐ nommen werden. Bei typisch deutscher Aussprache von Wörtern wie vaso, día oder gama als [ ˈ b̥aso], [ ˈ d̥ia] bzw. [ ˈɡ̊ ama] (anders notiert: [ ˈ paso], [ ˈ tia], [ ˈ kama]) kann es demnach zu Missverständnissen kommen, da spanischsprachige Menschen dies ver‐ mutlich als intendierte Realisierungen von paso, tía bzw. cama interpretieren würden. In Abb. 5.3-1 stellen wir die L1-spanische Aussprache der anlautenden Silben von vaso [ba] und paso [pa] der Aussprache der gleichen Sequenzen durch einen deutschen Muttersprachler ([b̥a]so, [p h a]so) sowie seinen Realisierungen der Anlautsequenzen aus dt. backen [b̥a] und packen [p h a] gegenüber. In den Oszillogrammen und Sonagrammen ist deutlich zu sehen, dass die Ausspracheeigenschaften der anlautenden Plosive aus dem Deutschen ins Spanische übertragen werden: Während die L1-spanische Realisierung des anlautenden / b/ in vaso eine negative VOT von -88 ms aufweist, überträgt der deutsche L2-Sprecher hier die kurze positive VOT aus seiner L1 (13 ms) in die Fremdsprache (10 ms). Auch seine Aussprache des anlautenden / p/ von sp. paso zeigt negativen Transfer aus dem Deutschen: Während der spanische Muttersprachler hier eine kurze positive VOT von 9 ms realisiert, überträgt der deutsche Spanischlerner 5.3 Spanisch als Fremdsprache im deutschsprachigen Kontext 357 <?page no="358"?> die lange positive VOT seiner Aussprache von packen (65 ms) auf das Spanische und spricht das Wort paso mit Aspiration (VOT von 65 ms). Das Resultat des negativen Transfers lässt sich wie folgt zusammenfassen: Seine Realisierung von vaso ‘Glas’ klingt für spanischsprachige Hörer wie paso ‘Schritt’, und seine Aussprache von paso zeigt durch die Aspiration des anlautenden / p/ ([p h ]) deutliche Anzeichen eines typischen deutschen Akzents. Abb. 5.3-1: Realisierung der ersten beiden Segmente von sp. paso ‘Schritt’ und vaso ‘Glas’ durch einen spanischen Muttersprachler (links) und durch einen deutschsprachigen Lerner (Mitte) sowie die Entsprechungen in dt. packen und backen durch denselben Sprecher. Die Verschlusslösung ist jeweils durch eine gestrichelte senkrechte graue Linie markiert. Annotation der tiers von oben nach unten: S (Beginn der Stimmhaftigkeit), VA (Anfang des Vokals) und VE (Ende des Vokals); VOT-Messung in Millisekunden; enge IPA-Transkription. Deutlichen negativen Transfer aus dem Deutschen ins Spanische haben auch Gabriel et al. (2024c) in einer Interventionsstudie mit monolingual aufgewachsenen deutsch‐ sprachigen und bilingual deutsch-türkisch aufgewachsenen Lernenden (Alter: 14-18) nachgewiesen: Die Probanden beider Lernergruppen produzieren die stimmlosen Plosive des Spanischen mit deutlich höheren VOT-Werten; dass die Bilingualen nicht von den (im Vergleich zum Deutschen) kürzeren VOT-Werten von türk. / p t k/ (Öğüt et al. 2006) profitieren, liegt vermutlich daran, dass der Spanischunterricht in das deutschsprachige Umfeld des deutschen Bildungssystems eingebettet ist, in dem die Herkunftssprachen der Lernenden keine große Rolle spielen. Allerdings zeigt sich, dass sowohl Monoals auch Bilinguale von der Bewusstmachung der Unterschiede und 358 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="359"?> Ähnlichkeiten bei der Verschlusslautproduktion in der Zielsprache Spanisch sowie in ihrer bzw. ihren Erstsprache(n) Deutsch bzw. Deutsch und Türkisch profitieren: Alle Teilnehmenden produzierten nach der in Form eines digitalen Lernmoduls gestalteten Intervention zielsprachlichere (niedrigere) VOT-Werte für sp. / p t k/ , d. h., es gelingt ihnen danach besser, die für einen deutschen Akzent typische Aspiration zu vermeiden (vgl. Gabriel et al. 2024c: 223ff.). Ein Vergleich mit englischsprachigen Spanischlernern zeigt, dass auch deren Spanisch massiv durch negativen Transfer aus der L1 Englisch gekennzeichnet ist; das Englische weist ebenso wie das Deutsche einen Kontrast zwischen nicht-aspirierten und aspirierten Plosiven auf (d. h. kurze positive VOT-Werte bei / b d ɡ/ und lange bei / p t k/ ). Dies gilt sowohl für Lerner, die das Spanische im englischsprachigen Kontext als Fremdsprache erlernen (Zampini 2014) als auch für englischsprachige Einwanderer in Spanien (Face & Menke 2020). Hinsichtlich des Erwerbs spanischer Plosive durch mehrsprachige Lernende im englischsprachigen Kontext haben Bondarenko et al. (2022) gezeigt, dass sowohl polnische als auch ukrai‐ nische Herkunftssprecher in der Fremdsprache Spanisch zielsprachlichere VOT-Werte produzieren als monolingual mit Englisch als L1 aufgewachsene Lernende. VOT-bedingte Schwierigkeiten beim Erwerb der fremdsprachlichen Aussprache stellen sich natürlich nicht nur für deutschsprachige Spanischlerner, sondern auch umgekehrt für hispanohablantes, die Deutsch als Fremdsprache sprechen und sowohl Behauchung als auch Entstimmung erlernen müssen. Diese Unter‐ schiede waren auch schon im 18. Jahrhundert bekannt: So hat Antonio de Villa in seiner 1792 erschienenen Gramática de la lengua alemana auf den “acento varonil de los Alemanes” (also auf den als ‘männlich’ wahrgenommenen Akzent der Deutschen) hingewiesen, der beim Deutschlernen nachzuahmen sei und der u. a. darin bestehe, dass das deutsche Wort Bach in spanischen Ohren wie Pach klinge, also mit entstimmtem Anlautkonsonanten [b̥] (bzw. [p]), ausgesprochen werde (vgl. De Villa 1792: 23). Eine weitere Schwierigkeit bei der Aussprache von Verschlusslauten besteht für deutschsprachige Lerner in der zielsprachlichen Spirantisierung der stimmhaften Plosive. Wie in 2.5.1.1 gezeigt, werden / b d ɡ/ in allen Positionen außer im absoluten Anlaut (d. h. nach einer Sprechpause wie in ¡[b]uenas noches! ‘Gute Nacht! ’) und nach Nasal sowie im Fall von / d/ auch nach / l/ (en [b]otellas ‘in Flaschen’, el [d]edo ‘der Finger’) als Frikativapproximanten [β ð ɣ] realisiert (z. B. se van [se ˈ βan] ‘sie gehen fort’, padre [ ˈ paðɾe] ‘Vater’, algo [ ˈ alɣo] ‘etwas’). In einer Produktionsstudie mit deutschsprachigen universitären Spanischlernern auf BA- und MA-Niveau hat Grünke (2019: 49f.) gezeigt, dass erstere die Spirantisierung nur zu 28 % zielsprachlich produzie‐ ren, während die MA-Studierenden immerhin eine durchschnittliche Korrektheitsrate von 78 % erreichen. 5.3 Spanisch als Fremdsprache im deutschsprachigen Kontext 359 <?page no="360"?> 73 Auch wenn, wie in 2.5.1.5 dargestellt, in einigen Varietäten des Spanischen Liquide in der Coda neutralisiert werden und es dort ebenfalls zu Vokalisierungen und Elisionen kommt, so entsprechen die Ergebnisse dieser Prozesse doch nie der r-Vokalisierung des Deutschen. Typisch deutsche Aussprachen wie z. B. [p h oɐ̯fa ˈ voːɐ̯] für por favor klingen für spanische Ohren, wenn sie überhaupt verstanden werden, “höchst befremdlich” (Kubarth 2009: 118) und sollten deshalb vermieden werden. Wie kann man die Aussprache anlautender spanischer Plosive üben? Hält man sich ein Stück dünnes Papier, eine Feder oder die Flamme einer brennenden Kerze dicht vor den Mund, während man Wörter wie dt. Panne, Tal oder Kappe ausspricht, werden Papier, Feder oder Flamme durch die Aspiration in stärkere Bewegung versetzt, als es bei den nicht-aspirierten spanischen Plosiven wie in pan, tapas oder capa der Fall ist. Um die in enger Transkription durch ein kleines hochgestelltes [ h ] nach dem Plosivzeichen symbolisierte Aspiration bei den stimmlosen Plosiven des Spanischen zu vermeiden, sollte man üben, Wörter wie pan, tapas oder capa auszusprechen, ohne dass Papier, Feder oder Flamme allzu sehr in Bewegung geraten. Nach anlautendem [ʃ], also in Wörtern wie [ʃtaːl] Stahl (gegenüber [t h aːl] Tal) oder [ ˈ ʃpanə] Spanne (gegenüber [ ˈ p h anə] Panne), werden die stimmlosen Plosive des Deutschen nicht aspiriert. Solche Wörter sind also ein guter Ausgangspunkt, um die Artikulation der nicht-aspi‐ rierten stimmlosen Plosive des Spanischen zu üben. Um die Artikulation voll stimmhafter Plosive (im Sinne von negativen VOT-Werten, d. h. mit vor der Verschlusslösung eintretender Stimmhaftigkeit) zu trainieren, ist es hilfreich, den betreffenden Wörtern einen homorganen Nasal voranzusetzen, also für vaso, día und gama zunächst von Formen wie [ ˈ mbaso], [ ˈ ndia] oder [ ˈ ŋɡama] auszugehen. Nach einigen Übungsdurchgängen kann man dann die vorangestellten Nasale flüchtiger artikulieren ([ ˈ m baso] etc.) und schließlich ganz weglassen ([ ˈ baso] etc.). Wenn man sich dabei selbst mit Praat aufnimmt, kann man anhand der im Sonagramm sichtbaren Stimmhaftigkeitsmerkmale kontrollieren, ob sich der Einsatz gelohnt hat. Eine weitere große Herausforderung für deutsche Spanischlerner ist die zielsprachliche Produktion der r-Laute (vgl. 2.5.1.5 und Ruiz Moreno 2023: 28-33). Zum einen gilt es hier, den negativen Transfer der r-Vokalisierungsregel aus der L1 zu vermeiden, der zufolge silbenschließendes r nicht als Konsonant, sondern als Vokal realisiert wird wie in Klavier [kla ˈ viːɐ̯] (vgl. dagegen dasselbe Segment in Onset-Position in der Pluralform Klaviere [kla ˈ viː.ʁə]). Eine fehlerhafte Übertragung dieser phonologischen Regel auf das Spanische führt zu nicht-zielsprachlichen Realisierungen wie *[sa ˈ liɐ̯ ] für sp. salir [sa ˈ liɾ] ‘(heraus)gehen’, was von spanischsprachigen Hörern als intendierte Aussprache der Imperfektform salía ‘er/ sie ging heraus’ missverstanden werden kann. 73 Zum anderen müssen Lernende mit der L1 Deutsch sowohl den Artikulationsort als auch die Artikulationsart zweier new sounds, nämlich des alveolaren Tap / ɾ/ und des homorganen Trill / r/ erlernen. Die beiden r-Laute, die nur in intervokalischer 360 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="361"?> Position miteinander kontrastieren (z. B. caro [ ˈ kaɾo] ‘teuer’ vs. carro [ ˈ karo] ‘Wagen’; vgl. 2.5.1.5) und deren artikulatorischer Unterschied lediglich darin besteht, dass / ɾ/ nur eine Verschlussphase aufweist, / r/ jedoch mehrere, sind zudem nur schwer zu unterscheiden; besonders dann, wenn - wie es beim Deutschen der Fall ist - die L1 der Lerner keinen entsprechenden Unterschied im Phonemsystem aufweist. Neu zu erlernen sind auch die komplexen Neutralisierungsregeln des Spanischen, nach denen der Trill [r] durchgehend im Wortanlaut und nach / n l s/ verwendet wird, während der Tap [ɾ] immer in Onsetclustern auftritt und in der Coda-Position vorherrscht (Blecua 2001; Hualde 2022: 791f.). In einer breit angelegten Studie zum Erwerb der spanischen r-Laute durch deutsch monolingual und deutsch-türkisch bilingual aufgewachsene Lernende haben Gabriel et al. (2023a) und Grünke et al. (2024) ein Prä-Post-Design verwendet und dabei mit allen Teilnehmenden je drei Aufnahmen eines Lesetexts gemacht, und zwar vor, während und nach einer Intervention. Das Ziel der Intervention, die als digitales Lernmodul mit praktischen Ausspracheübungen gestaltet war (vgl. Gabriel et al. 2024b), bestand darin, beide Lernergruppen für die Ähnlichkeiten und Unterschiede zwischen ihrem sprachlichen Hintergrund (2L1 Deutsch/ Türkisch; L1 Deutsch) und der Zielsprache (Spanisch) zu sensibilisieren. Die Ergebnisse zeigen, dass die zweisprachigen Teilnehmer den einsprachigen sowohl hinsichtlich der Korrektheitsraten bei der Produktion von alveolaren r-Lauten als auch in Bezug auf die Vermeidung der r-Vokalisierung von Anfang an überlegen waren (vgl. Abb. 5.3-2). Dies mag wenig überraschend erscheinen, da das Türkische im Gegensatz zum Deutschen einen alveolaren r-Laut aufweist (z. B. kara [ka ˈ ɾa] ‘schwarz’) und keine r-Vokalisierung kennt (kar [kaɾ]/ *[kaɐ̯ ] ‘Schnee’). Allerdings haben Studien zu anderen Phänomenen gezeigt, dass deutsch-türkische Zweisprachigkeit nicht per se einen Vorteil beim Erwerb von Aussprachemerkmalen darstellt, die mit denen des Türkischen übereinstimmen: So konnten Grünke & Gabriel (2022) darlegen, dass deutsch-türkisch Bilinguale beim Erwerb der phrasenbasierten In‐ tonation des Französischen keinen nennenswerten Vorteil gegenüber monolingual auf‐ gewachsenen deutschen Lernern haben, obwohl die Prosodie ihrer Herkunftssprache auch unter dem Einfluss des Deutschen ihre (teils) phrasenbasierten Intonationsmuster bewahrt hat und damit eine potenzielle Basis für positiven Transfer in die Fremdspra‐ che darstellt. Auch in der von Gabriel et al. (2023b) durchgeführten Interventionsstudie, in deren Rahmen deutsch-türkische Französischlernende auf Ähnlichkeiten zwischen der türkischen und der französischen Prosodie aufmerksam gemacht wurden, ergab sich über die Messzeitpunkte hinweg keine nennenswerte Verbesserung. Positiver Transfer aus der Herkunftsin die Zielsprache scheint also bei salienten, d. h. besonders auffälligen Merkmalen der segmentalen Phonologie wie den r-Lauten besser zu funk‐ tionieren als im Bereich der Prosodie. Diese Annahme wird hinsichtlich der Studie zur r-Realisierung dadurch gestützt, dass alle Bilingualen schon in der ersten Aufnahme, also bereits vor der Sensibilisierung für die Ähnlichkeiten zwischen dem Türkischen und dem Spanischen, ein hohes Leistungsniveau erreicht hatten (Abb. 5.3-2 links); die einzige zweisprachige Lernerin, die bei der ersten Aufnahme deutlichen Transfer des 5.3 Spanisch als Fremdsprache im deutschsprachigen Kontext 361 <?page no="362"?> dt. [ʁ] ins Spanische gezeigt hatte, verbesserte sich durch die Intervention erheblich. Dies ist zwar auch bei zwei monolingualen Probanden der Fall (Abb. 5.3-2 rechts), jedoch verbleibt die Hälfte der einsprachig mit der L1 Deutsch aufgewachsenen Lerner über die drei Messzeitpunkte hinweg auf niedrigem Leistungsniveau (Korrektheitsrate unter 50 %). Die Autoren interpretieren ihre Befunde als Hinweis darauf, dass die Sensibilisierung für sprachspezifische Unterschiede das lautsprachliche Lernen fördert. Bilinguale sind dabei offensichtlich nicht grundsätzlich im Vorteil, sondern nur dann, wenn ihre Herkunftssprache das betreffende Merkmal ebenfalls aufweist und wenn es hinreichend salient ist. Abb. 5.3-2: Anteil (in %) der korrekten Realisierungen von / r/ und / ɾ/ im Spanischen als Fremdsprache durch 12 bilingual aufgewachsene Lernende (2L1, Deutsch/ Türkisch, links) und 12 monolingual aufge‐ wachsene Lernende (L1 Deutsch, rechts) über drei Messzeitpunkte hinweg (nach Gabriel et al. 2023a: 22 und Grünke et al. 2024). Unterschieden werden drei Leistungsniveaus: über alle Messzeitpunkte hinweg hoch, d. h. über 50 % Korrektheitsrate (rot); durch deutlichen Anstieg gekennzeichnet (grün); über alle Messzeitpunkte hinweg niedrig, d. h. unter 50 % Korrektheitsrate (blau). Wie kann man die spanische r-Aussprache üben? Hilfreich für den Erwerb des Tap [ɾ] ist die Orientierung am stimmhaften alveolaren Plosiv [d], für den man allerdings die Zungenspitze nur ganz kurz gegen die Alveolen schlagen lässt. Hier kann man sich am US-amerikanischen Englisch orientieren, das anstelle des Plosivs des britischen Englisch wie in better [ ˈ b̥etə] einen Tap aufweist: [ ˈ b̥eɾɚ]. Um einen Tap nach einem Konsonanten zu produzieren, versucht man, rasch mehrmals hintereinander Wörter wie Brötchen, Tränen oder Birke als Bdötchen, Tdänen bzw. Bidke auszusprechen. Wenn dabei ein 362 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="363"?> 74 Gemeint ist hier die umgangssprachliche Form von (du) impfst es (z. B. das Kind) mit phonischer Enklise des Objektpronomens (es > ’s). 75 Dies bezieht sich auf monolinguale Varietäten, die nicht unter dem maßgeblichen Einfluss anderer Sprachen stehen. Dass dies in spanischen Kontaktvarietäten anders ist, haben wir in Zusammenhang mit der Diskussion des in Katalonien (5.1.2), in Galicien (5.1.3), in Mexiko (5.1.4) und im Andenraum (5.1.5) gesprochenen Spanisch sowie des Spanischen als Herkunftssprache in den USA (5.2.1) und in Deutschland (5.2.2) und des in Bulgarien gesprochenen Judenspanisch (5.2.3) gesehen. kurzes vokalisches Element zwischen die Konsonanten gerät (etwa B ö dötchen), ist das völlig normal: Wie wir in 2.5.1.5. anhand der Realisierung von se trata als [set a ˈ ɾata] (Abb. 2.5-11d) gesehen haben, geschieht dies auch im Spanischen. Es sollte darauf geachtet werden, den Tap in der Coda immer als solchen zu artikulieren. Zum Erlernen des Trills [r] gibt es neben verschiedenen Demonstrationsvideos auch umfangreichen Erfahrungsaustausch in Internetforen mit zahlreichen mehr oder weniger hilfreichen Ratschlägen (z. B. http: / / dict.leo.org/ forum/ viewGener aldiscussion.php? idThread=195169&lp=esde&lang=de). Eine vielversprechende Übung stellt Kubarth (2009: 116f.) vor: Nachdem man zunächst lautmalerisch das Zuklappen eines Buchs nachahmt - der palatale Frikativ [ç] wird nach einigen Sekunden durch einen nicht gelösten Plosiv abgebremst [çːt̚] -, erhöht man den Atemdruck, um den möglichst elastisch an den Alveolen anliegenden Zungen‐ kranz (die sog. Korona) ins Flattern zu bringen, etwa [çːtr̥ ̥ː]. Dieser stimmlose Vibrant sollte zunächst zwischen geflüsterten Vokalen trainiert werden (z. B. [ḁr̥ ̥ːḁ], [u̥r̥ ̥ːu̥] etc.), bevor die Sequenzen mit Stimmbandschwingungen unterlegt werden. Tipps für deutschsprachige Lerner gibt auch Gil Fernández (2007: 515ff.). 5.3.2 Prosodie Auf suprasegmentaler Ebene lassen sich insbesondere hinsichtlich dauerbasierter Merkmale, also im Bereich des Rhythmus, Einflüsse aus dem Deutschen in die Fremdsprache Spanisch erwarten. Wie wir in 4.4.1 gesehen haben, zählt das Deutsche zu den sog. akzentzählenden Sprachen, denn es kennt komplexe Konsonantenverbin‐ dungen (z. B. VCCCCCC wie in (du) impfst’s [ɪmp͡fsts] 74 ) und hat in unbetonter Stellung oft Reduktionsvokale (z. B. Hase [ ˈ hazə]), die unter bestimmten Bedingungen meist ganz weggelassen werden - etwa dann, wenn die betreffende Silbe einen Nasal beinhaltet wie in der Pluralform Hasen [ ˈ hazn̩] oder einen Lateral wie in Kübel [ ˈ k h yb l ̩ ]. Das Spanische hingegen weist eine starke Tendenz zu einfachen Silbenstruk‐ turen wie CV oder CVC auf (vgl. 4.2.4 und Heinz 2023: 97ff.) und kennt auch in unbetonter Position keine reduzierten Vokale. 75 Diese Eigenschaften schlagen sich in rhythmischer Hinsicht darin nieder, dass das Deutsche im Vergleich zum Spanischen einen geringeren vokalischen Gesamtanteil im Sprachsignal (%V) und eine höhere Variabilität konsonantischer und vokalischer Intervalle (z. B. VarcoC bzw. VarcoV, vgl. 4.4.2) aufweist. In der Literatur ist anhand von verschiedenen Sprachenkombinationen darauf hingewiesen worden, dass Sprecher akzentbzw. silbenzählender Sprachen die 5.3 Spanisch als Fremdsprache im deutschsprachigen Kontext 363 <?page no="364"?> rhythmischen Eigenschaften ihrer L1 jeweils auf die der anderen Gruppe angehörende Zielsprache übertragen, so etwa von White & Mattys (2007), die das L2-Spanische englischer Muttersprachler und das L2-Englische spanischer L1-Sprecher untersucht haben, oder von Gabriel et al. (2015) für den rhythmischen Transfer zwischen den Erstsprachen Deutsch und Mandarin-Chinesisch und den Fremdsprachen Englisch und Französisch. Eine Übertragung dauerbasierter Merkmale wurde auch für den Erwerb der Fremdsprache Deutsch durch Lernende mit der L1 argentinisches Spanisch konstatiert (Pulzován de Egger 2002). Für den Spanischerwerb im mehrsprachigen Kontext haben Gabriel & Rusca-Ruths (2015) gezeigt, dass deutsch-türkische Lerner den silbenzählenden Rhythmus der Fremdsprache zielsprachlicher produzieren als die monolingual mit der L1 Deutsch aufgewachsenen Lerner aus der gleichen Schulklasse, die von einem muttersprachlichen Lehrer unterrichtet wurde. Die deutsch-türkisch bilinguale Lernerin, die die deutlichste Dominanz im Deutschen aufwies (DT2, vgl. Abb. 5.3-3), verhielt sich jedoch eher wie ihre einsprachigen Mitschüler. Abb. 5.3-3: Vokalischer Gesamtanteil (%V) und Variabilität konsonantischer Intervalle (VarcoV) im Deutschen (L1 Deutsch ◁; Durchschnittswert der monolingualen Lerner) und im Spanischen (L1 Spanisch ☐; Produktion des muttersprachlichen Spanischlehrers) sowie in der Fremdsprache Spanisch produziert von fünf monolingual mit der L1 Deutsch aufgewachsenen Lernenden (△ S D 1-5) und fünf deutsch-türkisch Bilingualen (▽ S DT 1-5). 364 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="365"?> Mithilfe von Praat und Correlatore (vgl. 4.4.2) lassen sich Studien zum fremdsprachlichen Rhythmus selbst durchführen. Im universitären Kon‐ text findet man leicht Spanischlernende mit unterschiedlichem sprachlichen Hintergrund; das von ihnen produzierte fremdsprachliche Spanisch kann dann mit Kontrolldaten von spanischen Muttersprachlern sowie mit entsprechendem Material aus der L1 der Lerner verglichen werden. Grundsätzlich ist es ratsam, sich bei der Segmentierung in C- und V-Intervalle an den in 4.4.2 eingeführten Kriterien zu orientieren. Die Intonation des Spanischen unterscheidet sich nicht grundlegend von der des Deutschen, da beide Sprachen einen kontrastiven Wortakzent aufweisen. Die Sprach‐ melodie wird jeweils maßgeblich durch Grenztöne und durch die Positionen der im Lexikon spezifizierten metrisch starken Silben sowie die dort realisierten Ton‐ höhenakzente bestimmt, aus denen sich die konkret realisierte F 0 -Kontur durch phonetische Interpolation ergibt (vgl. 4.5.3). Zwar können im L2-Spanischen Fehler hinsichtlich der Betonungsmuster entstehen, vor allem bei Internationalismen (auch: kognaten Wörtern), die in beiden Sprachen unterschiedlich betont werden, wie etwa dt. Kilometer (oder Kilometer, vgl. Krech et al. 2009 unter Kilometer) und sp. kilómetro, doch treten beim Erwerb der spanischen Intonation durch deutsche Muttersprachler keine Probleme auf, die auf eine grundsätzliche Unterschiedlichkeit der Intonationssysteme zurückzuführen wären, wie es etwa bei deutschsprachigen Lernern der phrasenbasierten Intonation des Französischen zu erwarten ist. Gleichfalls für deutschsprachige Spanisch- und Französischlerner schwierig ist jedoch in beiden romanischen Fremdsprachen die dem Deutschen weitgehend fremde Resyllabierung innerhalb der phonologischen Phrase (4.2.5). Ein grundlegendes Problem bei der Erforschung der von deutschsprachigen Ler‐ nenden in der Fremdsprache Spanisch produzierten Intonation besteht darin, dass sowohl die L1 als auch die Zielsprache auf intonatorischer Ebene durch große dialektale Variation gekennzeichnet sind (zum Spanischen vgl. 4.5.4, die entsprechenden Abschnitte in 5.1 und 5.2 sowie Prieto & Roseano 2010 und Hualde & Prieto 2015; zum Deutschen vgl. Peters 2006). Da zudem auch der Input, den die Lerner durch ihre Lehrkraft sowie durch Kontakte in unterschiedliche spanischsprachige Länder haben, hochgradig variabel ist, lassen sich beispielsweise kaum “typische deutsche” Merkmale in der Realisierung von Tonhöhenakzenten (beispielsweise hinsichtlich der Alignierung von Tonhöhengipfeln) identifizieren. Um entsprechende Aussagen zu treffen, ist es notwendig, dialektal homogene Lernergruppen zu untersuchen, wie es z. B. Pešková (2023b) getan hat, deren Daten von Spanischlernern aus Norddeutschland stammen (vgl. Pešková 2023b: 95). Unter anderem hat sie im Rahmen ihrer breit angelegten Studie gezeigt, dass ihre (nord)deutschen Spanischlernenden in neutralen Aussagesätzen vornehmlich L*+H als Pränuklearakzent produzieren, während im L1-Spanischen hier je nach Varietät L+>H* (z. B. Madrid, Mexiko) bzw. L+H* (Buenos 5.3 Spanisch als Fremdsprache im deutschsprachigen Kontext 365 <?page no="366"?> Aires) gebraucht werden. Neutrale Ja/ Nein-Fragen werden jedoch - wenn man den finalen Tonhöhenanstieg des kastilischen Spanisch als Zielkategorie ansetzt - von den deutschen Lernern im Wesentlichen zielsprachlich produziert (89 % H%; vgl. Pešková 2023b: 125, 182). Gleiches gilt auch für die tonale Gestaltung der Rufkontur (Vokativ) ¡Natalia! , die von allen deutschsprachigen Lernern mit dem zielsprachlichen Tonhöhenakzent L+H* und immerhin in 75 % der Fälle zudem mit dem zielsprachlichen Grenzton ! H% realisiert wird (vgl. Pešková 2023b: 245f.). Bei den ebenfalls von der Autorin untersuchten tschechischen Lernenden treten hier, bedingt durch die stark abweichende Kontur ihrer L1 (L*+H L%), deutlich stärkere Abweichungen auf. Mit Blick auf LiLT (Mennen 2015) stellt die Autorin bei ihren deutschsprachigen Spanischlernern in allen vier Dimensionen L1-Transfer fest (vgl. Pešková 2023b: 275-284): Hinsichtlich der systemischen (d. h. phonologischen) Ebene fällt auf, dass die norddeutschen Spanischlerner anstelle des steigenden Tonhöhenakzents L+>H* den aus ihrer Varietät des Deutschen transferierten Tonhöhenakzent L*+H verwenden. Dementsprechend ist dieser insgesamt zahlenmäßig überrepräsentiert (Frequenzdimension), und er unterscheidet sich auch auf phonetischer Ebene - genauer gesagt hinsichtlich der Alignierung des nachtonigen Gipfels - vom auch im System des Spanischen enthalte‐ nen L+H* (Realisierungsdimension). Bezüglich der semantischen Dimension haben die Lernenden Schwierigkeiten, zwischen unterschiedlichen pragmatischen Lesarten zielsprachlicher Konturen zu differenzieren und diese kontextgerecht zu verwenden (z. B. bei neutralen vs. nicht-neutralen Ja/ Nein-Fragen). Hinsichtlich der Schnittstelle von Prosodie und Syntax haben Gabriel & Grünke (2018a) anhand einer Produktionsstudie zur Fokusrealisierung gezeigt, dass Spanischlernende die in der Zielsprache präferierte postverbale Stellung fokussierter Subjekte (vgl. 4.5.5.3) vermeiden (Typ: La comió [ F MaRÍa] ‘MARIA hat ihn (= den Apfel) gegessen’) und stattdessen den Satz- oder Nuklearakzent an den Satzanfang verschieben (Typ: [ F MaRÍa] la comió). Interessanterweise gilt dies auch weitgehend für Lerner, die neben dem Deutschen mit dem Italienischen oder dem Europäischen Por‐ tugiesisch eine Herkunftssprache sprechen, die hinsichtlich der postverbalen Stellung fokussierter Subjekte der Zielsprache Spanisch gleicht. Abschließend gehen wir mit der sog. Konstruktionsgrammatik auf die Anwen‐ dung einer theoretischen Ausrichtung auf die L2-Erwerbsforschung ein, die in der phonologischen Theoriebildung - anders als in der Syntaxforschung - bislang eher geringen Widerhall gefunden hat (vgl. 1.4). Um der Tatsache gerecht zu werden, dass es tonale Einheiten gibt, die mit einer bestimmten Pragmatik verbunden sind und mehr als die im AM-Modell angesetzte Minimaleinheit der Nuklearkonfiguration (bestehend aus nuklearem Tonhöhenakzent und finalem Grenzton) umfassen, haben Torreira & Grice (2018) vorgeschlagen, von sog. melodischen Konstruktionen auszugehen. Diese können sich, wie Abb. 5.3-4 zeigt, über kürzere oder längere Sequenzen von Wörtern erstrecken und je nach Äußerungslänge in Form unterschiedlicher Kombinationen von Tonhöhenakzenten und Grenztönen realisiert werden. Die wiederum sind unabhängig 366 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="367"?> von der konkreten Oberflächengestaltung auf ein und dieselbe “Grundmelodie”, also dieselbe melodische Konstruktion zurückzuführen. Abb. 5.3-4: ToBI-Annotation (oben) zweier Realisierungen der melodischen Konstruktion {LHL} (unten) in der aus zwei Intonationsphrasen bestehenden Äußerung Claro, el hermano de Manolo ‘Klar, der Bruder von Manolo’. In der Mitte wird die metrische Struktur (*) angegeben (nach Torreira & Grice 2018: 23). Pešková (2021) hat diesen Ansatz auf die Lernerintonation angewandt und anhand der tonalen Gestaltung von L2-spanischen Wh-Fragen durch deutsche und tschechi‐ sche Lernende gezeigt, dass beide Gruppen “mindestens zum Teil muttersprachliche Strukturen als eine Art ‘Schablone’ in die L2 übertragen” (Pešková 2021: 267). Die hinsichtlich der Alignierung einzelner Kategorien unterschiedlichen tonalen Oberflä‐ chenrealisierungen lassen sich z. B. für die Frage ¿Qué quieres? ‘Was willst du? ’ durch die melodische Konstruktion {LHL} zusammenfassen, die auch dem Muster der deutschen Wh-Frage Was willst du? entspricht (vgl. Pešková 2021: 258). Für die Erhebung von Sprachdaten im Spanischen als L1 und als Fremdsprache haben Pustka et al. (2018) ein Protokoll zusammengestellt. Dieses umfasst eine Wortliste, einen Lesetext, eine Diskursvervollständigungsaufgabe (Discourse Completion Task (DCT), vgl. 4.5.4) sowie einen Interviewleitfaden und eine Vorlage für die Erhebung der Hintergrunddaten. Unterschiedliche Versionen des DCT für Muttersprachler bzw. für Anfänger und fortgeschrittene Lernende sind unter https: / / www.romanistik.uni-mainz.de/ pustkaetal2018_appendixgabriel_m eisenburg/ zugänglich. 5.3 Spanisch als Fremdsprache im deutschsprachigen Kontext 367 <?page no="368"?> Übungsaufgaben 1. Nehmen Sie den Lesetext El viento norte y el sol (vgl. Anhang) mit spanischen Herkunftssprechern auf, die in Deutschland aufgewachsen sind. Formulieren Sie zunächst ihre Erwartungen hinsichtlich der Merkmale (a) Sprachrhythmus, (b) VOT stimmloser und stimmhafter Verschlusslaute, (c) Spirantisierung und (d) unbetonte Vokale und überprüfen Sie diese anhand von Analysen mit Praat. 2. Suchen Sie auf der Plattform https: / / de.forvo.com muttersprachliche Aufnahmen der folgenden spanischen und deutschen Wörter und messen Sie die VOT (voice onset time): baño, ducha, gas, parque, tema, coro; Bad, Dusche, Gas, Park, Thema, Chor. Welche Unterschiede finden Sie zwischen den anlautenden Plosiven in den deutschen und spanischen Wörtern? Welche Erwartungen haben Sie hinsichtlich der Aussprache der spanischen Wörter durch deutsche Muttersprachler und in Bezug auf die Aussprache der deutschen Wörter durch spanische Muttersprachler? 3. Nehmen Sie spanische Muttersprachler und deutschsprachige Lerner mit Äuße‐ rungen wie ¿Conoces un sitio para comer tapas? auf. Sehen Sie sich in Praat Oszillo- und Spektrogramm an und messen Sie in den mit stimmlosen Plosiven beginnenden Wörtern jeweils die VOT (voice onset time). Wiederholen Sie die Aufgabe mit den Lernern nach einer Übungsphase und wiederholen Sie die VOT-Messungen. 4. Nehmen Sie spanische Muttersprachler und deutschsprachige Lerner mit Äuße‐ rungen wie bueno, dígame, por favor, donde está el garaje auf. Sehen Sie sich in Praat Oszillo- und Spektrogramm an, untersuchen Sie die stimmhaften Plosive auf Anzeichen von Stimmhaftigkeit und messen Sie die VOT (voice onset time). Wie lassen sich voll stimmhafte Plosive trainieren? 5. Nehmen Sie den Lesetext El viento del norte y el sol bzw. Einst stritten sich Nordwind und Sonne (s. Anhang) von spanischen und deutschen Muttersprachlern sowie von Spanischlernenden (L1 Deutsch) und von Deutschlernenden (L1 Spanisch) auf. Analysieren Sie den Sprachrhythmus der beiden muttersprachlichen Varietäten und der beiden Lernervarietäten entsprechend den in 4.4.2 genannten Kriterien. Welche Erwartungen haben Sie in Bezug auf die rhythmische Beschaffenheit der vier Datensätze? Wo zeigt sich gegebenenfalls prosodischer Transfer? 6. Informieren Sie sich über das Intonationssystem des Deutschen (z. B. anhand von Grice & Baumann 2002) und analysieren Sie die für Aufgabe 3) erhobenen Lernerdaten (L2 Deutsch, produziert von spanischen Muttersprachlern; L2 Spa‐ nisch, produziert von deutschen Muttersprachlern) in Bezug auf die Realisierung der Tonhöhenakzente. Welche Erwartungen haben Sie bezüglich des tonalen Transfers? 368 5 Spanische Phonetik und Phonologie im Sprachkontakt <?page no="369"?> Anhang Das internationale phonetische Alphabet (IPA) <?page no="370"?> p b t d æ ÿ c ï k g q G / m µ nr = − N Ð õ R i | Ç F B f v T D s z S Z § ½ J x V X å © ? h H ñ L à ¨ Õ j ÷ l ð ´ K y u e o a é Ö … « Ï ì { Y U ‚ ¿ ê ¯ O À P A È ó ä è ú Ó Œ ë ¸ º íç w - E > I Ä Â ù < ø² p' t' k' s' ' a» b» eÑ e~ ¦ Í e@ › e! e_ e& eÞ ‹ e% Ì e$ e# ž™�‰ •Ÿ‘Š ts kp ® foUn« " tIS«n ¨i . Ïkt ù . * eÉ eò e* ¥ ¡ 9 n9 d9 » t 1 d1 s 3 t 3 b0 a0 tî dî £ t £ d £ t 4 d4 7 O7 tW dW ) e) O¦ tÆ d Æ dö uª t× d× d 2 e2 t³ d³ } d} eá : e + e6 ` n` e¤ e8 e5 - a± e° "® Éò Å Á B¤ ¤ 1 t Á dÁ 4 W 0 3 î ö Æ × ¨ 6 6 ª á + ³ 5 8 ° ± ⱱ Plosive Nasal Trill Tap or Flap Fricative Lateral fricative Approximant Lateral approximant Bilabial Labiodental Dental Alveolar Postalveolar Retroflex Palatal Velar Uvular Pharyngeal Glottal Bilabial Dental/ alveolar Palatal Velar Uvular Bilabial Dental (Post)alveolar Palatoalveolar Alveolar lateral Examples: Bilabial Dental/ alveolar Velar Alveolar fricative Clicks Voiced implosives Ejectives Breathy voiced Creaky voiced Linguolabial Labialized Palatalized Velarized Pharyngealized Velarized or pharyngealized Raised Lowered Advanced Tongue Root Retracted Tongue Root Voiceless Voiced Aspirated More rounded Less rounded Advanced Retracted Centralized Mid-centralized Syllabic Non-syllabic Rhoticity Dental Apical Laminal Nasalized Nasal release Lateral release No audible release ( = voiced alveolar fricative) ( = voiced bilabial approximant) Typefaces: Doulos SIL (metatext); Doulos SIL, IPA Kiel, IPA LS Uni (symbols) or or THE INTERNATIONAL PHONETIC ALPHABET (revised to 2020) 2020 IPA CONSONANTS (PULMONIC) Symbols to the right in a cell are voiced, to the left are voiceless. Shaded areas denote articulations judged impossible. CONSONANTS (NON-PULMONIC) OTHER SYMBOLS DIACRITICS Some diacritics may be placed above a symbol with a descender, e.g. ŋ̊ VOWELS Where symbols appear in pairs, the one to the right represents a rounded vowel. SUPRASEGMENTALS TONES AND WORD ACCENTS LEVEL CONTOUR Voiceless labial-velar fricative Voiced labial-velar approximant Voiced labial-palatal approximant Voiceless epiglottal fricative Voiced epiglottal fricative Epiglottal plosive Alveolo-palatal fricatives Voiced alveolar lateral flap Simultaneous ʃ and x Affricates and double articulations can be represented by two symbols joined by a tie bar if necessary. Primary stress Secondary stress Long Half-long Extra-short Minor (foot) group Major (intonation) group Syllable break Linking (absence of a break) Extra high High Mid Low Extra low Downstep Upstep Rising Falling High rising Low rising Risingfalling Global rise Global fall Close Close-mid Open-mid Open Front Central Back IPA Chart, http: / / www.internationalphoneticassociation.org/ content/ ipa-chart, available under a Crea‐ tive Commons Attribution-Sharealike 3.0 Unported License. Copyright © 2015 International Phonetic Association. 370 Anhang <?page no="371"?> Der Nordwind und die Sonne Kastilisches Spanisch El viento norte y el sol porfiaban sobre cuál de ellos era el más fuerte, cuando acertó a pasar un viajero envuelto en ancha capa. Convinieron en que quien antes lograra obligar al viajero a quitarse la capa sería considerado más poderoso. El viento norte sopló con gran furia, pero cuanto más soplaba, más se arrebujaba en su capa el viajero; por fin el viento norte abandonó la empresa. Entonces brilló el sol con ardor, e inmediatamente se despojó de su capa el viajero; por lo que el viento norte hubo de reconocer la superioridad del sol. (Quilis & Fernández 15 1996: 190) Lateinamerikanisches Spanisch El viento del norte y el sol estaban disputándose sobre cuál de ellos era el más fuerte, cuando pasó un viajero envuelto en una gruesa capa. Se pusieron de acuerdo en que el primero que lograra que el viajero se quitara la capa sería considerado más fuerte que el otro. Entonces, el viento del norte sopló tan fuerte como pudo, pero cuanto más soplaba más estrechamente se ceñía el viajero la capa al cuerpo hasta que, al fin, el viento del norte se rindió. Luego, el sol brilló calurosamente y de inmediato el viajero se despojó de su capa. Así, el viento del norte se vio obligado a reconocer que el sol era el más valiente de los dos. (Fernández de Castro 2021: 62) Judenspanisch El ayre del norte i el sol sestavan peleando para saver ken era el mas fuerte i en este punto vyene de pasar un pasajero kon un palto godro. Se metieron dakordo ke el ke puede azer kitar su palto al pasajero antes del otro iva ser konsiderado komo el mas fuerte. El ayre del norte empeso a azer una furtuna, ama lo mas fuerte el ayre soplava lo mas apretado el pasajero se embolvia en su palto. Al kavo el ayre del norte se ezvacheo. El sol salio i empeso a azer kalor i pishin el pasajero se kito su palto. I el ayre del norte tuvo ke rekonoser ke el sol era el mas fuerte de los dos. (Hualde & Şaul 2011: 108) Deutsch Einst stritten sich Nordwind und Sonne, wer von ihnen beiden wohl der Stärkere wäre, als ein Wanderer, der in einen warmen Mantel gehüllt war, des Weges daherkam. Sie wurden einig, dass derjenige für den Stärkeren gelten sollte, der den Wanderer zwingen würde, seinen Mantel abzunehmen. Der Nordwind blies mit aller Macht, aber je mehr er blies, desto fester hüllte sich der Wanderer in seinen Mantel ein. Endlich gab der Nordwind den Kampf auf. Nun erwärmte die Sonne die Luft mit ihren freundlichen Strahlen, und schon nach wenigen Augenblicken zog der Wanderer seinen Mantel aus. Da musste der Nordwind zugeben, dass die Sonne von ihnen beiden der Stärkere war. (IPA 1999: 89) Anhang 371 <?page no="372"?> Literaturverzeichnis Aalberse, Suzanne; Backus, Ad & Muysken, Pieter (2019). Heritage languages. A language contact approach. Amsterdam: Benjamins. Abercrombie, David (1967). Elements of general phonetics. Edinburgh: Edinburgh University Press. Aguilar, Lourdes; de-la-Mota, Carme & Prieto, Pilar (2009). Sp_ToBI. Training materials, http: / / p rosodia.upf.edu/ sp_tobi/ en. Alarcos Llorach, Emilio ( 4 1986). Fonología española. Madrid: Gredos ( 1 1950). Alcàzar Garrido, Joan del (2007). Historia contemporánea de América. San Vicente de Raspeig: Servei de Publicacions de la Universitat d’Alacant. Alén Garabato, M. Carmen (2001). La gheada. Un phénomène de variation phonétique, géolin‐ guistique et socioculturelle du galicien. Travaux neuchâtelois de linguistique 34/ 35, 219-232. Alonso, Amado (1941/ 1951). Substratum y superstratum. Revista de filología hispánica 3 (1941), 209-218. Wieder abgedruckt in Estudios lingüísticos. Temas españoles. Madrid: Gredos (1951), 315-330. Alonso-Cortés, Ángel (2010). El sistema fonemático del español normativo reexaminado. Zeitschrift für romanische Philologie 55, 602-608. Alvord, Scott M. (2006). Spanish intonation in contact. The case of Miami Cuban bilinguals. Dissertation, Minneapolis/ Saint Paul: University of Minnesota, https: / / scholarsarchive.byu.e du/ facpub/ 1354/ . Alvord, Scott M. (2010). Variation in Miami Cuban Spanish interrogative intonation. Hispania 93, 235-255. Amengual, Mark (2012). Interlingual influence in bilingual speech. Cognate status effect in a continuum of bilingualism. Bilingualism. Language and Cognition 15, 517-530. Andreeva, Bistra (2007). Zur Phonetik und Phonologie der Intonation der Sofioter Varietät des Bulgarischen. Dissertation, Saarbrücken: Universität des Saarlandes, https: / / publikationen.sulb.uni-saarland.de/ bitstream/ 20.500.11880/ 23554/ 1/ BA_DISS_final.pdf. Andreeva, Bistra; Barry, William J. & Koreman, Jacques (2013). The Bulgarian stressed and unstressed vowel system. A corpus study. In Bimbot, Frédéric; Fougeron, Cécile & Pellegrino, François (Eds). Proceedings of Interspeech 2014, Lyon, 345-348, https: / / www.isca-archive.org / interspeech_2013/ andreeva13_interspeech.html. Andreeva, Bistra; Dimitrova, Snezhina; Gabriel, Christoph; Gazdik, Anna & Grünke, Jonas (2017). Intonation and convergence. Evidence from Bulgarian Judeo-Spanish. In Tarpoma‐ nova, Ekaterina & Aleksova, Krasimira (Eds). Domination and adaptation. Proceedings of the International Conference of the Faculty of Slavic Studies. Volume 2: Linguistics. Sofia: Universität St. Kliment Ohridski, 169-177. Andreeva, Bistra; Dimitrova, Snezhina; Gabriel, Christoph & Grünke, Jonas (2019). The intona‐ tion of Bulgarian Judeo-Spanish spontaneous speech. In Calhoun, Sasha; Escudero, Paola; Tabain, Marija & Warren, Paul (Eds). Proceedings of the 19 th International Congress of Phonetic Sciences. Canberra, Australia: Australasian Speech Science and Technology Association Inc., <?page no="373"?> 3827-3841, https: / / www.internationalphoneticassociation.org/ icphs-proceedings/ ICPhS201 9/ papers/ ICPhS_3876.pdf. Andreeva, Bistra; Dimitrova, Snezhina; Gabriel, Christoph & Grünke, Jonas (2021). Intonational convergence in Bulgarian Judeo-Spanish spontaneous speech. In Teixeira Kalkhoff, Alexander; Selig, Maria & Mooshammer, Christine (Eds). Prosody and conceptional variation. Frankfurt: Lang, 171-190. Archangeli, Diana (1988). Aspects of underspecification theory. Phonology 5, 183-207. Armstrong, Lilias E. & Ward, Ida C. (1926). Handbook of English intonation. Leipzig: Teubner. Arnold, Rafael D. (2006). Spracharkaden. Die Sprache der sephardischen Juden in Italien im 16. und 17. Jahrhundert. Heidelberg: Winter. Auer, Peter (2001). Silben- und akzentzählende Sprachen. In Haspelmath, Martin; König, Ekkehard; Oesterreicher, Wulf & Raible, Wolfgang (Eds). Language typology and language universals. An international handbook. Berlin: De Gruyter, 1391-1399. Auer, Peter & Uhmann, Susanne (1988). Silben- und akzentzählende Sprachen. Literaturüberblick und Diskussion. Zeitschrift für Sprachwissenschaft 7, 214-259. Baehr, Rudolf (1962). Spanische Verslehre auf historischer Grundlage. Tübingen: Niemeyer. Baily, Samuel L. (1999). Immigrants in the lands of promise. Italians in Buenos Aires and New York City, 1870-1914. New York: Cornell University Press. Baković, Eric (1994). Strong onsets and Spanish fortition. In Giordano, Chris & Ardron, Daniel (Eds). MIT working papers in linguistics 23, 21-39. Bauer, Angelika & Auer, Peter (2008). Aphasie im Alltag. Stuttgart: Thieme. Bayram, Laura; Kupisch, Tanja; Pascal y Cabo, Diego & Rothman, Jason (2019). Terminology matters on theoretical grounds too! Coherent grammars cannot be incomplete. Studies in Second Language Acquisition 41, 257-264. Becker, Thomas (2012). Einführung in die Phonetik und Phonologie des Deutschen. Darmstadt: Wissenschaftliche Buchgesellschaft. Beckman, Mary E. & Pierrehumbert, Janet B. (1986). Intonational structure in Japanese and English. Phonology Yearbook 3, 255-309. Beckman, Mary E.; Díaz-Campos, Manuel; Tevis McGory, Julia & Morgan, Terrell A. (2002). Intonation across Spanish, in the Tones and Break Indices Framework. Probus 14, 9-36. Beckman, Mary E.; Hirschberg, Julia & Shattuck-Hufnagel, Stefanie (2005). The original ToBI system and the evolution of the ToBI framework. In Jun, Sun-Ah (Ed). Prosodic typology. The phonology of intonation and phrasing. Oxford: Oxford University Press, 9-54. Bécquer, Gustavo Adolfo (2013). Rimas/ Reime. Spanisch/ Deutsch. Übersetzt und herausgegeben von Christiane und Rudolf Busl. Nachwort von Ralf Junkerjürgen. Stuttgart: Reclam. Bendezú Araujo, Raúl; Buchholz, Timo & Reich, Uli (2019). Corpora amerikanischer Sprachen. Interaktive Sprachspiele aus dem mehrsprachigen Lateinamerika (Quechua 1), https: / / refubiu m.fu-berlin.de/ handle/ fub188/ 25747. Benet, Ariadna; Gabriel, Christoph; Kireva, Elena & Pešková, Andrea (2012). Prosodic transfer from Italian to Spanish. Rhythmic properties of L2 speech and Argentinean Porteño. In Ma, Qiuwu; Ding, Hongwei & Hirst, Daniel (Eds). Proceedings of Speech Prosody 2012, Shanghai, China, 438-441, http: / / sprosig.org/ sp2012/ uploadfiles/ file/ sp2012_submission_176.pdf. Literaturverzeichnis 373 <?page no="374"?> Bentolila, Yaakov (1985). Le composant hébraïque dans le judéo-espagnol marocain. In Benabu, Isaac & Sermoneta, Joseph (Eds). Judeo-Romance languages. Jerusalem: Misgav Yerushalayim, 27-40. Beristain, Ander (2023). An airflow analysis of Spanish and English anticipatory vowel nasalization among heritage bilinguals. Languages 8(3), 205, https: / / doi.org/ 10.3390/ languages803 0205. Bernstein, Lynne E. (2005). Phonetic processing by the speech perceiving brain. In Pisoni, David B. & Remez, Robert E. (Eds). The handbook of speech perception. Malden, MA: Blackwell, 79-98. Bertinetto, Pier Marco (1989). Reflections on the dichotomy “stress” vs. “syllable-timing”. Revue de phonétique appliquée 91/ 93, 99-130. Bertinetto, Pier Marco & Bertini, Chiara (2008). On modeling the rhythm of natural languages. In Barbosa, Plínio A.; Madureira, Sandra & Reis, Cesar (Eds). Proceedings of Speech Prosody 2008. Campinas: Editora RG/ CNPq, 427-430, https: / / www.isca-archive.org/ speechprosody_2 008/ bertinetto08_speechprosody.html. Best, Catherine T. (1995). A direct realist view of cross-language speech perception. In Strange, Winifred (Ed). Speech perception and linguistic experience. Issues in cross-language research. Baltimore: York Press, 171-204. Best, Catherine T. & Tyler, Michael D. (2007). Nonnative and second-language speech perception. Commonalities and complementarities. In Munro, Murray J. & Bohn, Ocke-Schwen (Eds). Language experience in second language speech learning. In honor of James Emil Flege. Amsterdam: Benjamins, 13-34. Birdsong, David; Gertken, Libby M. & Amengual, Mark (2012). Bilingual Language Profile: An easy-to-use instrument to assess bilingualism. Austin: COERLL, University of Texas at Austin, https: / / sites.la.utexas.edu/ bilingual/ . Blas-Arroyo, José Luis (2007). Spanish and Catalan in the Balearic Islands. International Journal of the Sociology of Language 184, 79-93. Blaser, Jutta ( 2 2011). Phonetik und Phonologie des Spanischen. Eine synchronische Einführung. 2., aktualisierte und erweiterte Auflage. Berlin: De Gruyter ( 1 2007). Blecua, Beatriz (2001). Las vibrantes del español. Manifestaciones acústicas y procesos fonéticos. Dissertation, Barcelona: Universitat Autònoma de Barcelona, http: / / hdl.handle.net/ 10803/ 48 59. Blevins, Juliette (1995). The syllable in phonological theory. In Goldsmith, John A. (Ed). The handbook of phonological theory. Oxford: Blackwell, 206-244. Boersma, Paul & Hayes, Bruce (2001). Empirical tests of the gradual learning algorithm. Linguistic Inquiry 32, 45-86. Boersma, Paul & Weenink, David (2023). Praat. Doing phonetics by computer (Computerpro‐ gramm). Version 6.3.13, http: / / www.praat.org/ . Bolinger, Dwight (1951). Intonation. Levels vs. configurations. Word 7, 199-210. Bondarenko, Margaryta; Butera, Brianna & Rao, Rajiv (2022). Voice Onset Time (VOT) of L3 Spanish / ptk/ by multilingual heritage speakers of Ukrainian and Polish. EuroAmerican Journal of Applied Linguistics and Languages 9, 28-51, https: / / doi.org/ 10.21283/ 2376905X.15. 1.225. 374 Literaturverzeichnis <?page no="375"?> Boomershine, Amanda (2006). Perceiving and processing dialectal variation in Spanish. An Exemplar Theory approach. In Face, Timothy & Klee, Carol (Eds). Selected proceedings of the 8 th Hispanic Linguistics Symposium. Somerville, MA: Cascadilla, 58-72, https: / / www.lingref.com/ cpp/ hls/ 8/ paper1255.pdf. Bossong, Georg (2008). Die Sepharden. Geschichte und Kultur der spanischen Juden. München: Beck. Bossong, Georg ( 3 2016). Das maurische Spanien. Geschichte und Kultur. 3., durchgesehene Auflage. München: Beck. Bowen, Donald J. & Stockwell, Robert P. (1955). The phonemic interpretation of semivowels in Spanish. Language 31, 236-240. Bradley, Travis (2006). Spanish complex onsets and the phonetics-phonology interface. In Mar‐ tínez-Gil, Fernando & Colina, Sonia (Eds). Optimality-theoretic studies in Spanish phonology. Amsterdam: Benjamins, 15-38. Bradley, Travis G. (2007a). Constraints on the metathesis of sonorant consonants in Judeo- Spanish. Probus 19, 171-207. Bradley, Travis G. (2007b). Prosodically conditioned sibilant voicing in Balkan Judeo-Spanish. In Bainbridge, Erin & Agbayani, Brian (Eds). Proceedings of the 34 th Western Conference on Linguistics. Fresno, CA: California State University, Department of Linguistics, 48-60. Bradley, Travis G. (2022). Judeo-Spanish. In Gabriel, Christoph; Gess, Randall & Meisenburg, Trudel (Eds). Manual of Romance phonetics and phonology. Berlin: De Gruyter, 808-838. Bradley, Travis G. & Adams, Jacob J. (2018). Sonority distance and similarity avoidance effects in Moroccan Judeo-Spanish. Linguistics 56, 1463-1511. Broś, Karolina & Krause, Peter A. (2024). Stop lenition in Canary Islands Spanish. A motion capture study. Laboratory Phonology 151, 1-50, https: / / doi.org/ 10.16995/ labphon.9934. Broś, Karolina; Żygis, Marzena; Sikorski, Adam & Wołłejko, Jan (2021). Phonological contrasts and gradient effects in ongoing lenition in the Spanish of Gran Canaria. Phonology 38, 1-40, https: / / doi.org/ 10.1017/ S0952675721000038. Bruce, Gösta (1977). Swedish word accents in sentence perspective. Lund: Gleerup. Brumme, Jenny (1985). Der Prozess der “sprachlichen Normalisierung” des Katalanischen, darge‐ stellt an neologischen Tendenzen in der Wortbildung der heutigen politisch-sozialen Lexik. Dissertation, Leipzig: Universität Leipzig. Buchholz, Timo (2024). Intonation between phrasing and accent. Spanish and Quechua in Huari. Berlin: De Gruyter, https: / / doi.org/ 10.1515/ 9783111304595. Buchholz, Timo & Reich, Uli (2018). The realizational coefficient. Devising a method for empirically determining prominent positions in Conchucos Quechua. In Feldhausen, Ingo; Fliessbach, Jan & Vanrell, Maria del Mar (Eds). Methods in prosody. A Romance language perspective. Berlin: Language Science Press, 123-164. Bühler, Karl (1934). Sprachtheorie. Jena: Fischer. Nachdruck Stuttgart: Fischer, 1982. Bürki, Yvette (2013). The status of Judeo-Spanish in the Ottoman Empire. In del Valle, José (Ed). A political history of Spanish. The making of a language. Cambridge: Cambridge University Press, 691-722. Bybee, Joan (2001). Phonology and language use. Cambridge: Cambridge University Press. Literaturverzeichnis 375 <?page no="376"?> Bybee, Joan (2006). From usage to grammar. The mind’s response to repetition. Language 82, 711-733. Calvo Pérez, Julio ( 2 2022). Nuevo diccionario español-quechua. Quechua-español. 2 Bd. Lima: Universidad de San Martín de Porres ( 1 2009). Campos-Astorkiza, Rebeka (2012). The phonemes of Spanish. In Hualde, José Ignacio; Olarrea, Antxon & O’Rourke, Erin (Eds). The handbook of Hispanic linguistics. Oxford: Blackwell, 89-109. Carreiras, Manuel & Perea, Manuel (2004). Naming pseudowords in Spanish. Effects of syllable frequency. Brain and Language 90, 393-400. Cerrón Palomino, Rodolfo (2003). Castellano andino. Aspectos sociolingüísticos, pedagógicos y gramaticales. Lima: Pontificia Universidad Católica del Perú. Chamorro, Gloria & Sorace, Antonella (2019). The Interface Hypothesis as a framework for studying L1 attrition. In Köpke, Barbara & Schmid, Monika S. (Eds). The Oxford handbook of language attrition. Oxford: Oxford University Press, 25-35. Chomsky, Noam (1957). Syntactic structures. ’s-Gravenhage: Mouton. Chomsky, Noam (1971). Deep structure, surface structure and semantic interpretation. In Steinberg, Danny D. & Jakubovits, Leon A. (Eds). Semantics. An interdisciplinary reader in philosophy, linguistics and psychology. Cambridge: Cambridge University Press, 183-216. Chomsky, Noam & Halle, Morris (1968). The sound pattern of English. New York: Harper & Row. Clark, John; Yallop, Colin & Fletcher, Janet ( 3 2007). An introduction to phonetics and phonology. Malden, MA: Blackwell ( 1 1990). Clements, George (1985). The geometry of phonological features. Phonology Yearbook 2, 225-252. Cloonan Cortez de Andersen, Denise (2010). Contornos del habla. Fonología y fonética del español. New Haven & London: Yale University Press. Cohn, Abigail C.; Fougeron, Cécile & Huffman, Marie K. (Eds) (2012). The Oxford handbook of laboratory phonology. Oxford: Oxford University Press. Colantoni, Laura & Cuervo, María Cristina (2013). Clíticos acentuados. In Colantoni, Laura & Rodríguez Louro, Celeste (Eds). Perspectivas teóricas y experimentales sobre el español de la Argentina. Frankfurt: Vervuert, 143-157. Colantoni, Laura & Pérez Leroux, Ana T. (2024). Acoustic properties of word-final vowels and the acquisition of gender in Spanish-English heritage speakers. In Babatsouli, Elena (Ed). Multilingual acquisition and learning. An ecosystemic view to diversity. Amsterdam: Benjamins, 380-402. Colina, Sonia (2009). Spanish phonology. A syllabic perspective. Washington: Georgetown Uni‐ versity Press. Cortés, Susana; Lleó, Conxita & Benet, Ariadna (2009). Gradient merging of vowels in Barcelona Catalan under the influence of Spanish. In Braunmüller, Kurt & House, Juliane (Eds). Convergence and divergence in language contact situations. Amsterdam: Benjamins, 185-204. Cortés Moreno, Maximiano (2006). Análisis acústico de la transferencia de rasgos del sistema tonal chino al habla español como lengua extranjera. Estudios de Fonética Experimental 15, 43-65. 376 Literaturverzeichnis <?page no="377"?> Coseriu, Eugenio (1980). “Historische Sprache” und “Dialekt”. In Göschel, Joachim (Ed). Dialekt und Dialektologie. Wiesbaden: Steiner, 106-122. Coseriu, Eugenio ( 2 1992). Einführung in die Allgemeine Sprachwissenschaft. Tübingen: Francke ( 1 1988). Côté, Marie-Hélène (2022). French. In Gabriel, Christoph; Gess, Randall & Meisenburg, Trudel (Eds). Manual of Romance phonetics and phonology. Berlin: De Gruyter, 669-708. Crawford, Clifford J. (2009). Adaptation and transmission in Japanese loanword phonology. Dissertation, Ithaca, NY: Cornell University, https: / / hdl.handle.net/ 1813/ 13947. Cressey, William W. (1978). Spanish phonology and morphology. A generative view. Washington: Georgetown University Press. D’Imperio, Mariapaola; Elordieta, Gorka; Frota, Sónia; Prieto, Pilar & Vigário, Marina (2005). Intonational phrasing in Romance. The role of syntactic and prosodic structure. In Frota, Sónia; Vigário, Marina & Freitas, Maria Jo-o (Eds). Prosodies. Berlin: De Gruyter, 59-98. D’Introno, Francesco; del Teso, Enrique & Weston, Rosemary (1995). Fonética y fonología actual del español. Madrid: Cátedra. Daneš, František et al. (1974). Zur Terminologie der FSP. In Daneš, František (Ed). Papers on functional sentence perspective. Prag: Academia, 217-222. Dauer, Rebecca (1983). Stress-timing and syllable-timing reanalyzed. Journal of Phonetics 11, 51-62. Davidson, Justin (2015). Intervocalic fricative voicing in the Spanish of Barcelona. Considerations for contact-induced sociophonetic innovation. In Potowski, Kim & Bugel, Tania (Eds). Sociolinguistic change across the Spanish-speaking world. Case studies in honor of Anna Maria Escobar. New York: Lang, 119-146. Davidson, Justin (2019). Intervocalic / s/ voicing in Andean Spanish. Problematizing the assess‐ ment of contact-induced change. In Alvord, Scott & Thompson, Gregory L. (Eds). Contact, community, and connections. Current approaches to Spanish in multilingual populations. Wilmington: Vernon Press, 111-146. Davidson, Justin (2020). Spanish phonology in contact with Catalan. On implementations of gradience and discreteness in the study of sociolinguistic variation of laterals. In Rao, Rajiv (Ed). Spanish phonetics and phonology in contact. Studies from Africa, the Americas, and Spain. Amsterdam: Benjamins: 383-420. Davis, Stuart & Pollock, Matthew (2024). A feature alignment approach to plural realization in Eastern Andalusian Spanish. Languages 9(5), 166, https: / / doi.org/ 10.3390/ languages9050166. De Granda, Germán (1982). Observaciones sobre la fonética del español en el Paraguay. Anuario de Letras. Lingüística y filología 20, 145-194. De la Fuente Iglesias, Mónica & Pérez Castillejo, Susana (2020). Spanish mid vowels as sociolinguistic variables in Galicia. Spanish in Context 17, 464-487. De Lacy, Paul (2006). Markedness. Reduction and preservation in phonology. Cambridge: Cam‐ bridge University Press. De Villa, Antonio (1792). Gramática de la lengua alemana dividida en tres partes. Compuesta, y arreglada á los preceptos de los dos mejores Maestros Alemanes Matias Kramer, y Juan Christoval Gottsched. Madrid: Imprenta Real, http: / / bdh-rd.bne.es/ viewer.vm? id=0000060933. Literaturverzeichnis 377 <?page no="378"?> De-la-Mota, Carme; Martín Butragueño, Pedro & Prieto, Pilar (2010). Mexican Spanish intona‐ tion. In Prieto, Pilar & Roseano, Paolo (Eds). Transcription of intonation of the Spanish language. München: Lincom, 319-350. Del Giudice, Alex; Shosted, Ryan; Davidson, Kathryn; Salihie, Mohammad & Arvaniti, Amalia (2007). Comparing methods for locating pitch “elbows”. In Trouvain, Jürgen & Barry, William J. (Eds). Proceedings of the 16 th International Congress of Phonetic Sciences 2007, Saarbrücken, 1117-1120, http: / / www.icphs2007.de/ conference/ Papers/ 1283/ 1283.pdf. Delais-Roussarie, Élisabeth (2022). Prosodic structure revisited. The need to disentangle rhythm from intonation. Romanistisches Jahrbuch 73, 33-69. Delais-Roussarie, Élisabeth; Post, Brechtje; Avanzi, Mathieu; Buthke, Carolin; di Cristo, Alberto; Feldhausen, Ingo; Jun, Sun-Ah; Martin, Philippe; Meisenburg, Trudel; Rialland, Annie; Sichel-Bazin, Rafèu & Yoo, Hiyon (2015). Intonational phonology of French. Developing a ToBI system for French. In Frota, Sónia & Prieto, Pilar (Eds). Intonation in Romance. Oxford: Oxford University Press, 63-100. Delattre, Pierre (1965). Comparing the phonetic features of English, French, German and Spanish. An interim report. Heidelberg: Julius Groos. Delattre, Pierre (1966). A comparison of syllable length conditioning among languages. Interna‐ tional Review of Applied Linguistics in Language Teaching 4, 183-198. Delforge, Ann Marie (2008). Unstressed vowel reduction in Andean Spanish. In Colantoni, Laura & Steele, Jeffrey (Eds). Selected proceedings of the 3 rd conference on laboratory approaches to Spanish phonology. Somerville, MA: Cascadilla, 107-124. Delforge, Ann Marie (2011). Vowel devoicing in Cusco Collao Quechua. In Lee, Wai-Sum & Zee, Eric (Eds). Proceedings of the 17 th International Congress of Phonetic Sciences, Hong Kong, China, 556-559, https: / / www.internationalphoneticassociation.org/ icphs-proceedings/ ICPh S2011/ OnlineProceedings/ RegularSession/ Delforge/ Delforge.pdf. Delforge, Ann Marie (2012). ‘Nobody wants to sound like a provinciano.’ The recession of unstressed vowel devoicing in the Spanish of Cusco, Perú. Journal of Sociolinguistics 16, 311-335. Dellwo, Volker (2006). Rhythm and speech rate. A variation coefficient for deltaC. In Karnowski, Pawel & Szigeti, Imre (Eds). Language and language processing. Proceedings of the 38 th Linguistic Colloquium, Piliscsaba. Frankfurt: Lang, 231-241. Dellwo, Volker & Wagner, Petra (2003). Relations between language rhythm and speech rate. In Solé, Maria José; Recasens, Daniel & Romero, Joaquim (Eds). Proceedings of the 15 th International Congress of Phonetic Sciences, Barcelona: Futurgraphic, 471-474, https: / / www.i nternationalphoneticassociation.org/ icphs-proceedings/ ICPhS2003/ papers/ p15_0471.pdf. Destatis (2024) = Statistisches Bundesamt. Statistischer Bericht (Mikrozensus). Bevölkerung nach Migrationshintergrund (Erstergebnisse 2023). Wiesbaden: Statistisches Bundesamt, https : / / www.destatis.de/ DE/ Themen/ Gesellschaft-Umwelt/ Bevoelkerung/ Migration-Integration/ Publikationen/ Downloads-Migration/ statistischer-bericht-migrationshintergrund-erst-2010 220237005.xlsx? __blob=publicationFile. Devoto, Fernando J. (2008). Historia de los italianos en la Argentina. Buenos Aires: Biblos. 378 Literaturverzeichnis <?page no="379"?> Dimitrova, Snezhina (1998). Bulgarian speech rhythm. Stress-timed or syllable-timed? Journal of the International Phonetic Association 27, 27-33. Dimitrova, Snezhina; Andreeva, Bistra; Gabriel, Christoph & Grünke, Jonas (2018). Speaker age effects on prosodic patterns in Bulgarian. In Klessa, Katarzyna; Bachan, Jolanta; Wagner, Agnieszka; Karpiński, Maciej & Śledziński, Daniel (Eds). Proceedings of the 9th International Conference on Speech Prosody. Poznań: Uniwersytet im. Adama Mickiewicza w Poznaniu, 709-713, https: / / www.isca-archive.org/ speechprosody_2018/ dimitrova18_speechprosody.pdf. Dogil, Grzegorz; Gvozdanovič, Jadranka & Kodzasov, Sandro (1999). Slavic languages. In Van der Hulst, Harry (Ed). Word prosodic systems in the languages of Europe. Berlin: De Gruyter, 813-876. Domínguez, Laura (2013). Understanding interfaces. Second language acquisition and first language attrition of Spanish subject realization and word order variation. Amsterdam: Benjamins. Domínguez, Laura; Hicks, Glyn & Slabakova, Roumyana (2019). Terminology choice in ge‐ nerative acquisition research. The case of “incomplete acquisition” in heritage languages grammars. Studies in Second Language Acquisition 41, 241-255. Donegan, Patricia & Stampe, David (1979). The study of Natural Phonology. In Dinnsen, Daniel A. (Ed). Current approaches to phonological theory. Bloomington: Indiana University Press, 126-173. Duanmu, San ( 2 2007). The phonology of Standard Chinese. 2 nd ed. Oxford: Oxford University Press ( 1 2000). Duarte-Borquez, Claudia; van Doren, Maxine & Garellek, Marc (2024). Utterance-final voice quality in American English and Mexican Spanish bilinguals. Languages 9(3), 70, https: / / doi. org/ 10.3390/ languages9030070. Dufter, Andreas (2003). Typen sprachrhythmischer Konturbildung. Tübingen: Niemeyer. Dufter, Andreas & Gabriel, Christoph (2016). Information structure, prosody, and word order. In Fischer, Susann & Gabriel, Christoph (Eds). Manual of grammatical interfaces in Romance. Berlin: De Gruyter, 419-455. Durand, Jacques (2017). Corpus phonology. Oxford research encyclopedia of linguistics, https: / / doi.org/ 10.1093/ acrefore/ 9780199384655.013.145. Durand, Jacques; Gut, Ulrike & Kristoffersen, Gjert (Eds) (2014). The Oxford handbook of corpus phonology. Oxford: Oxford University Press. Eckman, Fred R. (1977). Markedness and the contrastive analysis hypothesis. Language Learning 27, 315-330. Elordieta, Gorka & Hualde, José Ignacio (2014). Intonation in Basque. In Jun, Sun-Ah (Ed). Prosodic typology II. The phonology of intonation and phrasing. Oxford: Oxford University Press, 405-463. Elordieta, Gorka & Romera, Magdalena (2020). The influence of social factors on the prosody of Spanish in contact with Basque. International Journal of Bilingualism 25, 286-317. Engels, Kathrin (2012). Cocoliche als Mediensprache. Die Darstellung einer Lernervarietät im Theater des Río de la Plata-Raumes. Freiburg: Rombach. Ennis, Juan Antonio (2015). Italian-Spanish contact in early 20 th century Argentina. Journal of Language Contact 8, 1-34. Literaturverzeichnis 379 <?page no="380"?> Estebas-Vilaplana, Eva & Prieto, Pilar (2009). La notación prosódica en español. Una revisión del Sp_ToBI. Estudios de Fonética Experimental 18, 263-283. Estebas-Vilaplana, Eva & Prieto, Pilar (2010). Castilian Spanish intonation. In Prieto, Pilar & Roseano, Paolo (Eds). Transcription of intonation of the Spanish language. München: Lincom, 17-48. Estigarribia, Bruno (2020). A grammar of Paraguayan Guarani. London: UCL Press, https: / / discovery.ucl.ac.uk/ id/ eprint/ 10107709/ 1/ A-Grammar-of-Paraguayan-Guarani.pdf. Eusko Jaurlaritza (Ed) (2021). VII encuesta sociolingüística 2021. Vitoria-Gasteiz: Eusko Jaurlaritza (Gobierno Vasco), https: / / www.euskadi.eus/ contenidos/ informacion/ eas_ikerketak/ es_def/ a djuntos/ VII-ENCUESTA-SOCIOLINGUISTICA_resumen-.pdf. Eychenne, Julien (2022). Corpus phonology. In Gabriel, Christoph; Gess, Randall & Meisenburg, Trudel (Eds). Manual of Romance phonetics and phonology. Berlin: De Gruyter, 319-341. Face, Timothy L. (2002). Intonational marking of contrastive focus in Madrid Spanish. Frankfurt: Lang. Face, Timothy L. (2003). Intonation in Spanish declaratives. Differences between lab speech and spontaneous speech. Catalan Journal of Linguistics 2, 115-131. Face, Timothy L. (Ed) (2004). Laboratory approaches to Spanish phonology. Berlin: De Gruyter. Face, Timothy L. (2008). Guide to the phonetic symbols of Spanish. Somerville, MA: Cascadilla. Face, Timothy L. & Prieto, Pilar (2007). Rising accents in Castilian Spanish. A revision of Sp_ToBI. Journal of Portuguese Linguistics 6, 117-146. Face, Timothy L. & Menke, Mandy R. (2020). L2 acquisition of Spanish VOT by English-speaking immigrants in Spain. Studies in Hispanic and Lusophone Linguistics 13, 361-389. Faginas Souto, Sandra (2001). A interferencia fonética no español da Coruña. A vocal [o] tónica. Actas do I simposio internacional sobre o bilingüismo. Vigo: Universidade de Vigo, 686-698. Fant, Gunnar (1960). Acoustic theory of speech production. The Hague: Mouton. Feldhausen, Ingo & Vanrell, Maria del Mar (2024). Focus realization in Heritage Spanish. The case of German-dominant speakers of Peninsular Spanish. In Rao, Rajiv (Ed). The phonetics and phonology of heritage languages. Cambridge: Cambridge University Press, 166-189. Feldhausen, Ingo; Pešková, Andrea; Kireva, Elena & Gabriel, Christoph (2011a). Categorical perception of Porteño nuclear accents. In Lee, Wai-Sum & Zee, Eric (Eds). Proceedings of the 17 th International Congress of Phonetic Sciences, Hong Kong, China, 116-119, https: / / www.i nternationalphoneticassociation.org/ icphs-proceedings/ ICPhS2011/ OnlineProceedings/ Spec ialSession/ Session4/ Feldhausen/ Feldhausen.pdf. Feldhausen, Ingo; Benet, Ariadna & Pešková, Andrea (2011b). Prosodische Grenzen in der Spontansprache. Eine Untersuchung zum Zentralkatalanischen und Porteño-Spanischen. Hamburg: SFB 538 “Mehrsprachigkeit”, https: / / www.academia.edu/ 5495355. Félix-Brasdefer, J. César (2010). Data collection methods in speech act performance. DCTs, role plays, and verbal reports. In Martínez-Flor, Alicia & Usó-Juan, Esther (Eds). Speech act performance. Theoretical, empirical and methodological issues. Amsterdam: Benjamins, 41-56. Fellbaum, Klaus ( 2 2013). Sprachverarbeitung und Sprachübertragung. Berlin: Springer ( 1 1984). 380 Literaturverzeichnis <?page no="381"?> Fenton, Elyssa; Bustin, Amy & Muntendam, Antje G. (2020). The intonation of broad focus declaratives in Afro-Peruvian Spanish. Findings from two elicitation tasks. Studies in Hispanic and Lusophone Linguistics 13, 1-49. Fernández de Castro, Félix (2021). Textos fonéticos de El Salvador, Nicaragua, Costa Rica y Panamá (1960-2006). Estudios filológicos 68, 47-68, http: / / dx.doi.org/ 10.4067/ S0071-17132021 000200047. Fernández Rei, Elisa (2002). Aproximación ó estudio da isocronía en galego. In Lorenzo, Ramón (Ed). Homenaxe ó Prof. Fernando R. Tato Plaza. Santiago de Compostela: Universidade de Santiago de Compostela, 115-128. Fernández Rei, Elisa (2019). Galician and Spanish in Galicia. Prosodies in contact. Spanish in contact 16, 438-461. Féry, Caroline (2012). Die Annotation der deutschen Intonation. Wie kann GToBI die Syntax und die Semantik integrieren? Linguistische Berichte 229, 39-97. Féry, Caroline (2017). Intonation and prosodic structure. Cambridge: Cambridge University Press. Fiukowski, Heinz ( 8 2010). Sprecherzieherisches Elementarbuch. Berlin: De Gruyter ( 1 1967). Fischer, Susann; Gabriel, Christoph & Kireva, Elena (2014). Towards a typological classification of Judeo-Spanish. Analyzing syntax and prosody of Sofia judezmo. In Braunmüller, Kurt; Höder, Steffen & Kühl, Karoline (Eds). Stability and divergence in language contact. Factors and mechanisms. Amsterdam: Benjamins, 77-108. Flege, James E. (1987). The production of “new” and “similar” phones in a foreign language. Evidence for the effect of equivalence classification. Journal of Phonetics 15, 47-65. Flege, James E. & Bohn, Ocke-Schwen (2021). The Revised Speech Learning Model (SLMr). In Wayland, Ratree (Ed). Second language speech learning. Theoretical and empirical progress. Cambridge: Cambridge University Press, 3-83. Fowler, Carol A. & Saltzman, Elliot (1993). Coordination and coarticulation in speech production. Language and Speech 36, 171-195. Fowler, Carol A. & Galantucci, Bruno (2005). The relation of speech perception and speech production. In Pisoni, David B. & Remez, Robert E. (Eds). The handbook of speech perception. Malden, MA: Blackwell, 633-648. Friedman, Victor A. & Joseph, Brian D. (2014). Lessons from Judezmo about the Balkan Sprachbund and contact linguistics. International Journal of the Sociology of Language 226, 3-23. Frota, Sónia (2012). Prosodic structure, constituents, and their implementation. In Cohn, Abigail C.; Fougeron, Cécile & Huffman, Marie (Eds). The Oxford handbook of laboratory phonology. Oxford: Oxford University Press, 255-265. Frota, Sónia; D’Imperio, Mariapaola; Elordieta, Gorka; Prieto, Pilar & Vigário, Marina (2007). The phonetics and phonology of intonational phrasing in Romance. In Prieto, Pilar; Mascaró, Joan & Solé, Maria-Josep (Eds). Segmental and prosodic issues in Romance phonology. Amsterdam: Benjamins, 131-153. Gabinskij, Mark A. (Габинский, Марк A.) (1992/ 2011). Сефардский (еврейско-испанский) язык. (Sefardskij (evrejsko-ispanskij) jazyk). Chişinău: Ştiinţa, 1992 (Dt. Übersetzung von Heinrich Literaturverzeichnis 381 <?page no="382"?> Kohring: Die sephardische Sprache. Bearbeitet von Winfried Busse und Heinrich Kohring. Tübingen: Narr, 2011). Gabriel, Christoph (2007). Fokus im Spannungsfeld von Phonologie und Syntax. Eine Studie zum Spanischen. Frankfurt: Vervuert. Gabriel, Christoph (2010). On focus, prosody, and word order in Argentinean Spanish. A minimalist OT account. Revista Virtual de Estudos da Linguagem 8.4, 183-222, http: / / www.re vel.inf.br/ files/ artigos/ revel_special_4_on_focus_prosody_and_word_order.pdf. Gabriel, Christoph (2014). Emphase, Sprachkontakt und prosodischer Wandel. Überlegungen zum tritonalen Tonhöhenakzent des Porteño-Spanischen. In Pustka, Elissa & Goldschmidt, Stefanie (Eds). Emotionen, Expressivität, Emphase. Berlin: Erich Schmidt, 197-214. Gabriel, Christoph (2018). Sprachmischung und Prosodie. Spanisch, Italienisch und Chinesisch in Buenos Aires. In Burkard, Thorsten & Hundt, Markus (Eds). Sprachmischung - Mischspra‐ chen. Vom Nutzen und Nachteil gegenseitiger Sprachbeeinflussung. Frankfurt: Lang, 39-62. Gabriel, Christoph (2021). La prosodia de las variedades americanas. In Eckkrammer, Eva Martha (Ed). Manual del español en América. Berlin: De Gruyter, 465-487. Gabriel, Christoph (2022). Phonetik und Phonologie des Spanischen. In Klabunde, Ralf; Mihatsch, Wiltrud & Dipper, Stefanie (Eds). Linguistik im Sprachvergleich. Germanistik - Romanistik - Anglistik. Berlin: Springer, 27-48. Gabriel, Christoph & Kireva, Elena (2012). Intonation und Rhythmus im spanisch-italienischen Kontakt. Der Fall des Porteño-Spanischen. In Schafroth, Elmar & Selig, Maria (Eds). Testo e ritmi. Zum Rhythmus in der italienischen Sprache. Frankfurt: Lang, 131-149. Gabriel, Christoph & Kireva, Elena (2014a). Prosodic transfer in learner and contact varieties. Speech rhythm and intonation of Buenos Aires Spanish and L2 Castilian Spanish produced by Italian native speakers. Studies in Second Language Acquisition 36, 257-281. Gabriel, Christoph & Kireva, Elena (2014b). Speech rhythm and vowel raising in Bulgarian Judeo-Spanish. In Campbell, Nick; Gibbon, Dafydd & Hirst, Daniel (Eds). Proceedings of Speech Prosody 2014. Dublin: Trinity College, 728-732, https: / / www.isca-archive.org/ speechprosod y_2014/ gabriel14_speechprosody.pdf. Gabriel, Christoph & Rusca-Ruths, Exequiel (2015). Der Sprachrhythmus bei deutsch-türkischen L3-Spanischlernern. Positiver Transfer aus der Herkunftssprache? In Witzigmann, Stéphanie & Rymarczyk, Jutta (Eds). Mehrsprachigkeit als Chance. Herausforderungen und Potentiale individueller und gesellschaftlicher Mehrsprachigkeit. Frankfurt: Lang, 185-204. Gabriel, Christoph & Grünke, Jonas (2018a). Focus, prosody, and subject positions in L3 Spanish. Analyzing data from German learners with Italian and European Portuguese as heritage languages. In García García, Marco & Uth, Melanie (Eds). Focus realization in Romance and beyond. Amsterdam: Benjamins, 357-386. Gabriel, Christoph & Grünke, Jonas (2018b). Is there a standard pronunciation of Bulgarian Judeo-Spanish? Evidence from / e/ -to-[i] raising in read and spontaneous speech. In Muhr, Rudolf & Meisnitzer, Benjamin (Eds). Pluricentric languages and non-dominant varieties worldwide. New pluricentric languages - old problems. Frankfurt: Lang, 367-381. Gabriel, Christoph & Meisenburg, Trudel ( 4 2021). Romanische Sprachwissenschaft. 4., aktuali‐ sierte und überarbeitete Auflage (utb 2897). Paderborn: Brill/ Fink ( 1 2007). 382 Literaturverzeichnis <?page no="383"?> Gabriel, Christoph & Heidinger, Steffen (2022). The focus prominence rule in Spanish from a perception perspective. Borealis. An International Journal of Hispanic Linguistics 11, 141-172, https: / / doi.org/ 10.7557/ 1.11.1.6483. Gabriel, Christoph & Reich, Uli (2022). The phonology of Romance contact varieties. In Gabriel, Christoph; Gess, Randall & Meisenburg, Trudel (Eds). Manual of Romance phonetics and phonology. Berlin: De Gruyter, 462-502. Gabriel, Christoph; Feldhausen, Ingo; Pešková, Andrea; Colantoni, Laura; Lee, Su-Ar; Arana, Valeria & Labastía, Leopoldo (2010). Argentinian Spanish intonation. In Prieto, Pilar & Roseano, Paolo (Eds). Transcription of intonation of the Spanish language. München: Lincom, 285-317. Gabriel, Christoph; Feldhausen, Ingo & Pešková, Andrea (2011). Prosodic phrasing in Porteño Spanish. In Gabriel, Christoph & Lleó, Conxita (Eds). Intonational phrasing in Romance and Germanic. Cross-linguistic and bilingual studies. Amsterdam: Benjamins, 153-182. Gabriel, Christoph; Fischer, Susann & Kireva, Elena (2014). Judenspanisch in Bulgarien. Eine Diasporasprache zwischen Archaismus und Innovation. In Bischoff, Doerte; Gabriel, Chris‐ toph & Kilchmann, Esther (Eds). Sprache(n) im Exil. München: Text + Kritik, 150-167. Gabriel, Christoph; Stahnke, Johanna & Thulke, Jeanette (2015). Assessing foreign language speech rhythm in multilingual learners. An interdisciplinary approach. In Peukert, Hagen (Ed). Transfer effects in multilingual language development. Amsterdam: Benjamins, 191-219. Gabriel, Christoph; Müller, Natascha & Fischer, Susann ( 3 2018). Grundlagen der generativen Syntax. Französisch, Italienisch, Spanisch. 3., aktualisierte und überarbeitete Auflage. Berlin: De Gruyter ( 1 2008). Gabriel, Christoph; Grünke, Jonas & Kireva, Elena (2020a). Portuguese remnants in the Spanish of Olivenza (Extremadura). Exploring vowel raising, global speech rhythm, and intonation. In Rao, Rajiv (Ed). Spanish phonetics and phonology in contact. Studies from Africa, the Americas, and Spain. Amsterdam: Benjamins, 421-450. Gabriel, Christoph; Pešková, Andrea & Ewald, Tim (2020b). How much like Guarani does Paraguayan Spanish sound? The pronunciation of <y> and <ll>. In Gabriel, Christoph; Pešková, Andrea & Selig, Maria (Eds). Contact, variation and change in Romance and beyond. Studies in honor of Trudel Meisenburg. Berlin: Erich Schmidt, 39-56. Gabriel, Christoph; Grünke, Jonas & Schlaak, Claudia (2023a). Rhotics in Spanish as a foreign language. An intervention study with German-Turkish bilinguals. Strani jezici. Foreign Languages. A Journal of Applied Linguistics 52, 9-35, https: / / doi.org/ 10.22210/ strjez/ 52-1/ 1. Gabriel, Christoph; Grünke, Jonas & Schlaak, Claudia (2023b). Using digital tools to foster the acquisition of L3 French prosody in an autonomous learning process. An intervention study with German-Turkish learners. In Eibensteiner, Lukas; Kropp, Amina; Müller-Lancé, Johan‐ nes & Schlaak, Claudia (Eds). Neue Wege des Französischunterrichts. Linguistic Landscaping und Mehrsprachigkeitsdidaktik im digitalen Zeitalter. Tübingen: Narr, 75-100. Gabriel, Christoph; Grünke, Jonas & Quintana, Aldina (2024a). Vocalic alternations in İstanbul Judeo-Spanish. A pilot study on semi-spontaneous speech data. In Minervini, Laura & Savelsberg, Frank (Eds). New perspectives on Judeo-Spanish and the linguistic history of the Sephardic Jews. Leiden: Brill, 256-281. Literaturverzeichnis 383 <?page no="384"?> Gabriel, Christoph; Grünke, Jonas & Schlaak, Claudia (2024b). Ausspracheförderung für deutsch-türkisch bilinguale und deutsch monolinguale Spanischlernende. Hispanorama 183, 30-34. Gabriel, Christoph; Grünke, Jonas; López Pereyra, Licia & Schlaak, Claudia (2024c). Acquiring Spanish voiceless stops in a multilingual setting. An intervention study with German-Turkish bilinguals. In Grünke, Jonas; Pešková, Andrea & Gabriel, Christoph (Eds). Spanish as a second and third language. Approaching the linguistics-didactics interface. Berlin: Frank & Timme, 207-235. Ganong, William F. (1980). Phonetic categorization in auditory word perception. Journal of Experimental Psychology. Human Perception and Performance 6, 110-125. García, Christina (2020). Seeds of change. Social factors conditioning intervocalic / s/ voicing in Loja, Ecuador. Spanish in contact 17, 438-463. Gaskell, M. Gareth (2007). Statistical and connectionist models of speech perception and word recognition. In Gaskell, M. Gareth (Ed). The Oxford handbook of psycholinguistics. Oxford: Oxford University Press, 55-69. Gertken, Libby M.; Amengual, Mark & Birdsong, David (2014). Assessing language dominance with the Bilingual Language Profile. In Leclercq, Pascale; Edmonds, Amanda & Hilton, Heather (Eds). Measuring L2 proficiency. Perspectives from SLA. Bristol: Multilingual Matters, 208-225. Gil Fernández, Juana (2007). Fonética para profesores de español. De la teoría a la práctica. Madrid: Arco Libros. Gili Fivela, Barbara (2002). Tonal alignment in two Pisa Italian peak accents. In Hirst, Daniel & Rossi, Mario (Eds). Proceedings Speech Prosody 2002, Aix-en-Provence, 339-342, https: / / spros ig.org/ sp2002/ pdf/ gili.pdf. Gili Fivela, Barbara; Avesani, Cinzia; Barone, Marco; Bocci, Giuliano; Crocco, Claudia; D’Impe‐ rio, Mariapaola; Giordano, Rosa; Marotta, Giovanna; Savino, Michelina & Sorianello, Patrizia (2015). Intonational phonology of the regional varieties of Italian. In Frota, Sónia & Prieto, Pilar (Eds). Intonation in Romance. Oxford: Oxford University Press, 140-197. Gogolin, Ingrid (1988). Erziehungsziel Zweisprachigkeit. Konturen eines sprachpädagogischen Konzepts für die multikulturelle Schule. Hamburg: Bergmann + Helbig. Göksel, Aslı & Kerslake, Celia (2005). Turkish. A comprehensive grammar. London: Routledge. Goldman, Jean-Philippe (2011). EasyAlign. An automatic phonetic alignment tool under Praat. In Cosi, Piero; de Mori, Renato; di Fabbrizio, Giuseppe & Pieraccini, Roberto (Eds). Proceedings of Interspeech 2011. Firenze: ISCA Archive, 3233-3236, https: / / www.isca-archive.org/ intersp eech_2011/ goldman11_interspeech.html. Goldman, Jean-Philippe & Schwab, Sandra (2014). EasyAlign Spanish. A (semi-)automatic segmentation tool under Praat. In Congosto Martín, Yolanda; Monero Curiel, María Luisa & Salvador Plans, Antonio (Eds). Fonética experimental, educación superior e investigación (Bd.1). Madrid: Arco libros, 629-640. Goldsmith, John A. (1979). Autosegmental phonology. New York: Garland. Goldstein, E. Bruce ( 7 2008). Wahrnehmungspsychologie. Der Grundkurs. Berlin: Springer ( 1 1981). 384 Literaturverzeichnis <?page no="385"?> Gondra, Ager (2020). Testing the Interface Hypothesis. Heritage speakers’ perception and production of Spanish subject position with unergative and unaccusative verbs. International Journal of Bilingual Education and Bilingualism 25, 1730-1764. Gonzales, Kalim & Lotto, Andrew J. (2013). A Bafri, un Pafri. Bilinguals’ pseudoword identifica‐ tions support language-specific phonetic systems. Psychological Science 24, 2135-2142. Grabe, Esther & Low, Ee Ling (2002). Durational variability in speech and the rhythm class hypothesis. In Gussenhoven, Carlos & Warner, Natasha (Eds). Papers in Laboratory Phonology 7. Berlin: De Gruyter, 515-546. Greußlich, Sebastian (2021). Variedades andinas en comparación. In Eckkrammer, Eva Martha (Ed). Manual del español en América. Berlin: De Gruyter, 649-667. Grice, Martine (1995). Leading tones and downstep in English. Phonology 12, 183-233. Grice, Martine & Baumann, Stefan (2002). Deutsche Intonation und GToBI. Linguistische Berichte 191, 267-298. Grice, Martine; D’Imperio, Mariapaola; Savino, Michelina & Avesani, Cinzia (2006). Strategies for intonation labelling across varieties of Italian. In Jun, Sun-Ah (Ed). Prosodic typology. Oxford: Oxford University Press, 362-389. Grünke, Jonas (2019). Lautsprachliches Wissen und Spirantisierung im universitären Spanisch‐ erwerb. Eine Studie zu verschiedenen Lernniveaus. Zeitschrift für Romanische Sprachen und ihre Didaktik 13, 37-58. Grünke, Jonas (2022). Intonation in language contact. The case of Spanish in Catalonia. Disserta‐ tion, Mainz: Johannes-Gutenberg-Universität Mainz, https: / / openscience.ub.uni-mainz.de/ h andle/ 20.500.12030/ 7474. Grünke, Jonas & Gabriel, Christoph (2022). Acquiring French intonation against the backdrop of heritage bilingualism. The case of German-Turkish learners. Languages 7(1), 68, https: / / d oi.org/ 10.3390/ languages7010068. Grünke, Jonas; Andreeva, Bistra; Gabriel, Christoph & Săbev, Mitko (2023a). Vocative intonation in language contact. The case of Bulgarian Judeo-Spanish. Languages 8(4), 284, https: / / doi.o rg/ 10.3390/ languages8040284. Grünke, Jonas; Săbev, Mitko; Gabriel, Christoph & Andreeva, Bistra (2023b). Vowel reduction in spontaneous Bulgarian Judeo-Spanish. In Skarnitzl, Radek & Volín, Jan (Eds). Proceedings of the 20 th International Congress of Phonetic Sciences. Praha: Guarant International, 2844-2848, https: / / guarant.cz/ icphs2023/ 220.pdf. Grünke, Jonas; Gabriel, Christoph & Schlaak, Claudia (2024). r in Spanish as a foreign language. A comparison of monolingual German and bilingual German-Turkish learners. In Pustka, Elissa; Remberger, Eva-Maria & Sánchez-Miret, Fernando (Eds). R in Romance. System, variation and change. Leiden: Brill. Guasti, Maria Teresa; Nespor, Marina; Christophe, Anne & Van Ooyen, Brit (2001). Pre-lexical setting of the head complement parameter through prosody. In Weissenborn, Jürgen & Höhle, Barbara (Eds). Approaches to bootstrapping. Phonological, lexical, syntactic and neurophysiological aspects of early language acquisition. Band1. Amsterdam: Benjamins, 231−248. Gugenberger, Eva (2004). Sprache - Identität - Hybridität. Das Beispiel der Galicier/ innen in Galicien und Argentinien. Grenzgänge 22, 110-143. Literaturverzeichnis 385 <?page no="386"?> Gugenberger, Eva (2013). Peru. In Herling, Sandra & Patzelt, Carolin (Eds). Weltsprache Spanisch. Handbuch für das Studium der Hispanistik. Stuttgart: ibidem, 703-732. Gugenberger, Eva (2018). Theorie und Empirie der Migrationslinguistik. Mit einer Studie zu den Galiciern und Galicierinnen in Argentinien. Wien: LIT. Guion, Susan G. (2003). The vowel systems of Quichua-Spanish bilinguals. Age of acquisition effects on the mutual influence of the first and second languages. Phonetica 60, 98-128. Gussenhoven, Carlos (2004). The phonology of tone and intonation. Cambridge: Cambridge University Press. Haase, Martin (2003). Baskisch. Eine “exotische” Sprache in romanischer Umgebung. In Gugen‐ berger, Eva & Blumberg, Mechthild (Eds). Vielsprachiges Europa. Frankfurt: Lang, 71-81. Hall, T. Alan ( 2 2011). Phonologie. Eine Einführung. Berlin: De Gruyter ( 1 2000). Halle, Morris & Clements, George N. (1983). Problem book in phonology. A workbook for introductory courses in linguistics and modern phonology. Cambridge, MA: MIT Press. Hammond, Michael (1995). Metrical Phonology. Annual Review of Anthropology 24, 313-342. Hardcastle, William J. & Hewlett, Nigel (Eds) (1999). Coarticulation. Theory, data and techniques. Cambridge: Cambridge University Press. Harris, James W. (1969). Spanish phonology. Cambridge, MA: MIT Press. Harris, James W. (1983). Syllable structure and stress in Spanish. A nonlinear analysis. Cambridge, MA: MIT Press. Harris, James W. (1984). Theories of phonological representation and nasal consonants in Spanish. In Baldi, Philip (Ed). Papers from the 12 th Linguistic Symposium on Romance Languages. Amsterdam: Benjamins, 153-168. Harris, James W. (1995). Projection and edge marking in the computation of stress in Spanish. In Goldsmith, John A. (Ed). The handbook of phonological theory. Oxford: Blackwell, 867-887. Harris, James W. & Kaisse, Ellen M. (1999). Palatal vowels, glides, and obstruents in Argentinian Spanish. Phonology 16, 117-190. Hawkins, Sarah (2010). Phonological features, auditory objects and illusions. Journal of Phonetics 38, 60-89. Hayes, Bruce (1995). Metrical stress theory. Principles and case studies. Chicago: University of Chicago Press. Heath, Shirley B. (1972). La política del lenguaje en México. De la colonia a la nación. México: Instituto Nacional Indigenista. Hennecke, Inga & Wiesinger, Evelyn (Eds) (2023). Constructions in Spanish. Amsterdam: Benjamins. Henriksen, Nicholas (2015). Acoustic analysis of the rhotic contrast in Chicagoland Spanish. An intergenerational study. Linguistic Approaches to Bilingualism 5, 285-321. Henriksen, Nicholas; García-Amaya, Lorenzo; Coetzee, Andries & Wissing, Daan (2019). Language contact in Patagonia. Durational control in the acquisition of Spanish and Afrikaans phonology. In Martínez-Gil, Fernando & Colina, Sonia (Eds). Handbook of Spanish phonology. New York: Routledge, 416-438. Herling, Sandra (2013). USA. In Herling, Sandra & Patzelt, Carolin (Eds). Weltsprache Spanisch. Handbuch für das Studium der Hispanistik. Stuttgart: ibidem, 353-385. 386 Literaturverzeichnis <?page no="387"?> Hernández, Erika (2020). The effects of bilingualism on intonation in Galician and Spanish. MA-Arbeit, Tallahassee: Florida State University, https: / / diginole.lib.fsu.edu/ islandora/ objec t/ fsu: 781665/ datastream/ PDF/ view. Hernández, Esther (1998). La acomodación fonética de los nahuatlismos al español. Nueva revista de filología hispánica 46, 1-21. Heine, Bernd & Kuteva, Tania (2013). Contact and grammaticalization. In Hickey, Raymond (Ed). The handbook of language contact. Malden: Wiley-Blackwell, 86-105. Heinz, Matthias (2023). Silbentyp und Wortschatz im diachronen Sprachkontakt. Zentrum und Peripherie in phonotaktischen Systemen und im Lexikon romanischer Sprachen. Berlin: De Gruyter. Heinz, Matthias & Schmid, Stephan (2021). Phonetik und Phonologie des Italienischen. Berlin: De Gruyter. Herring Dudek, Elizabeth & Clements, J. Clancy (2021). Jopara as a case of a variable mixed language. In Mazzoli, Maria & Sippola, Eeva (Eds). New perspectives on mixed languages. From core to fringe. Berlin: De Gruyter, 277-297. Hickey, Raymond (2013). Language contact. Reconsideration and reassessment. In Hickey, Raymond (Ed). The handbook of language contact. Malden: Wiley-Blackwell, 1-28. Hidalgo, Margarita (2001). Sociolinguistic stratification in New Spain. International Journal of Sociology of Language 149, 55-78. Hidalgo Navarro, Antonio & Quilis Merín, Mercedes ( 2 2004). Fonética y fonología española. Valencia: Tirant lo Blanch ( 1 2002). Hidalgo Navarro, Antonio & Quilis Merín, Mercedes (2012). La voz del lenguaje. Fonética y fonología del español. Valencia: Tirant Humanidades. Hockett, Charles F. (1958). A course in modern linguistics. New York: Macmillan. Höder, Steffen (2014). Convergence vs. divergence from a diasystematic perspective. In Braun‐ müller, Kurt; Höder, Steffen & Kühl, Karoline (Eds). Stability and divergence in language contact. Factors and mechanisms. Amsterdam: Benjamins, 39-60. Hoffmann, Thomas & Trousdale, Graeme (Eds) (2013). The Oxford handbook of construction grammar. Oxford: Oxford University Press. Hoot, Bradley (2016). Narrow presentational focus in Mexican Spanish. Experimental evidence. Probus 28, 335-365. Hoppe, Jens (2009). Bulgarien. In: Wolfgang Benz (Ed). Handbuch des Antisemitismus. Juden‐ feindschaft in Geschichte und Gegenwart. Berlin: De Gruyter, 64-70. Hualde, José Ignacio (1986). Tone and stress in Basque. A preliminary survey. Anuario del Seminario Julio de Urquijo 20, 867-896. Hualde, José Ignacio (2002). Intonation in Spanish and the other Ibero-Romance languages. Overview and status quaestionis. In Wiltshire, Caroline R. & Camps, Joaquim (Eds). Romance phonology and variation. Amsterdam: Benjamins, 101-115. Hualde, José Ignacio (2003a). El modelo métrico y autosegmental. In Prieto, Pilar (Ed). Teorías de la entonación. Barcelona: Ariel, 155-184. Literaturverzeichnis 387 <?page no="388"?> Hualde, José Ignacio (2003b). Remarks on the diachronic reconstruction of intonational patterns in Romance with special attention to Occitan as a bridge language. Catalan Journal of Linguistics 2, 181-205. Hualde, José Ignacio (2004). Romance intonation from a comparative and diachronic perspective. Possibilities and limitations. In Auger, Julie; Clements, J. C. & Vance, Barbara (Eds). Contem‐ porary approaches to Romance linguistics. Amsterdam: Benjamins, 217-237. Hualde, José Ignacio (2005). The sounds of Spanish. Cambridge: Cambridge University Press. Hualde, José Ignacio (2006). Stress removal and addition in Spanish. Journal of Portuguese Linguistics 5, 59-89. Hualde, José Ignacio (2010). Secondary stress and stress clash in Spanish. In Ortega-Llebaria, Marta (Ed). Selected proceedings of the 4 th conference on laboratory approaches to Spanish phonology. Somerville, MA: Cascadilla, 11-19. Hualde, José Ignacio (2013). Intervocalic lenition and word-boundary effects. Evidence from Judeo-Spanish. Diachronica 30, 232-266. Hualde, José Ignacio (2022). Spanish. In Gabriel, Christoph; Gess, Randall & Meisenburg, Trudel (Eds). Manual of Romance phonetics and phonology. Berlin: De Gruyter, 779-807. Hualde, José Ignacio & Carrasco, Patricio (2009). / tl/ en español mexicano. ¿Un segmento o dos? Estudios de Fonética experimental 18, 175-191, https: / / revistes.ub.edu/ index.php/ experiment alphonetics/ article/ view/ 44422. Hualde, José Ignacio & Şaul, Mahir (2011). Istanbul Judeo-Spanish. Journal of the International Phonetic Association 41, 89-110. Hualde, José Ignacio & Prieto, Pilar (2015). Intonational variation in Spanish. European and American varieties. In Frota, Sónia & Prieto, Pilar (Eds). Intonation in Romance. Oxford: Oxford University Press, 351-391. Hualde, José Ignacio & Quintana, Aldina (2024). Intonational patterns in the last generation of native Judeo-Spanish speakers born in Turkey. In Minervini, Laura & Savelsberg, Frank (Eds). New perspectives on Judeo-Spanish and the linguistic history of the Sephardic Jews. Leiden: Brill, 227-255. Hurch, Bernhard & Rhodes, Richard A. (Eds) (1996). Natural phonology. Berlin: De Gruyter. Hüttel, Richard (1996). Idealstädte im Dschungel. Zur Genese der Jesuiten-Reduktionen in Paraguay. Kritische Berichte 24, 4-10, https: / / doi.org/ 10.11588/ kb.1996.1.28418. Idsardi, William & Poeppel, David (2012). Neurophysiological techniques in laboratory phono‐ logy. In Cohn, Abigail C.; Fougeron, Cécile & Huffman, Marie (Eds). The Oxford handbook of laboratory phonology. Oxford: Oxford University Press, 593-605. IGE (2018) = Instituto galego e estatística. Enquisa estrutural a fogares 2018. Santiago de Compostela: IGE, https: / / www.ige.gal/ estatico/ html/ gl/ OperacionsEstruturais/ PDF/ Resumo _resultados_EEF_Galego_2018.pdf. INDEC (2024) = Instituto Nacional de Estadística y Censos de la República Argentina. Censo Nacional de Población, Hogares y Viviendas 2022. Resultados definitivos. Migraciones internaci‐ onales y internas, https: / / www.indec.gob.ar/ ftp/ cuadros/ poblacion/ censo2022_migraciones.p df. 388 Literaturverzeichnis <?page no="389"?> INE (2022) = Instituto Nacional de Estadística del Paraguay. Encuesta permanente de hogares continua 2022. Asunción: INA, http: / / www.ine.gov.py: 81/ anda/ index.php/ catalog/ 160. INEGI (2020) = Instituto Nacional de Estadística y Geografía. Censo de población y vivienda 2020. México: INEGI, https: / / www.inegi.org.mx/ programas/ ccpv/ 2020/ #Tabulados. IPA (1999). Handbook of the International Phonetic Association. A guide to the use of the international phonetic alphabet. Cambridge: Cambridge University Press. Ito, Hiroshi (2012). With Spanish, Guaraní lives. A sociolinguistic analysis of bilingual education in Paraguay. Multilingual Education 2: 6, http: / / www.multilingual-education.com/ content/ 2/ 1/ 6. Jakobson, Roman & Halle, Morris (1956). Fundamentals of language. The Hague: Mouton. Jakobson, Roman & Waugh, Linda (1979). The sound shape of language. Brighton: Harvester Press (Dt. Übersetzung: Die Lautgestalt der Sprache. Berlin: De Gruyter, 1986). Jakobson, Roman; Fant, C. Gunnar M. & Halle, Morris (1952). Preliminaries to speech analysis. The distinctive features and their correlates. Cambridge, MA: MIT Press. Jessen, Michael (2012). Phonetische und linguistische Prinzipien des forensischen Stimmenver‐ gleichs. München: Lincom. Jones, Daniel (1918). An outline of English phonetics. Leipzig: Teubner. Kabak, Barış & Vogel, Irene (2001). The phonological word and stress assignment in Turkish. Phonology 18, 315-360. Kabatek, Johannes (2013). Galicien. In Herling, Sandra & Patzelt, Carolin (Eds). Weltsprache Spanisch. Handbuch für das Studium der Hispanistik. Stuttgart: ibidem, 176-179. Kabatek, Johannes & Pusch, Claus D. ( 2 2011). Spanische Sprachwissenschaft. Eine Einführung. 2., überarbeitete Auflage. Tübingen: Narr ( 1 2009). Kager, René (1995). The metrical theory of word stress. In Goldsmith, John A. (Ed). The handbook of phonological theory. Oxford: Blackwell, 367-402. Kager, René (2007). Feet and metrical stress. In De Lacy, Paul (Ed). The Cambridge handbook of phonology. Cambridge: Cambridge University Press, 195-227. Kailuweit, Rolf (2021). Procesos migratorios entre Europa y América. In Eckkrammer, Eva Martha (Ed). Manual del español en América. Berlin: De Gruyter, 339-358. Kaisse, Ellen M. (2019). Glides and high vowels in Spanish. In Colina, Sonia & Martínez-Gil, Fernando (Eds). The Routledge handbook of Spanish phonology. London: Routledge, 145-161. Kallfell, Guido (2011). Grammatik des Jopara. Gesprochenes Guaraní und Spanisch in Paraguay. Frankfurt: Lang. Kănchev, Ivan V. (1974). El sistema fonológico del dialecto judeo-español de Bulgaria. Español actual 28, 1-17. Kănchev, Ivan V. (1975). Fonética y fonología del judeoespañol de Bulgaria. Dissertation, Sofia: Universität Sv. Kliment Ohridski. Kasper, Gabriele & Dahl, Merete (1991). Research methods in interlanguage pragmatics. Studies in Second Language Acquisition 13, 215-247. Kim, Ji Young (2011). L1-L2 phonetic interference in the production of Spanish heritage speakers in the US. The Korean Journal of Hispanic Studies 4, 1-28, https: / / ihs.korea.ac.kr/ wp-content / uploads/ 2017/ 04/ 20170428_003912.pdf. Literaturverzeichnis 389 <?page no="390"?> Kim, Ji Young (2023). Spanish-English cross-linguistic influence on heritage bilinguals’ produc‐ tion of uptalk. Languages 8(1), 22, https: / / doi.org/ 10.3390/ languages8010022. Kim, Miran (2011). The phonetics of stress manifestation. Segmental variation, syllable constituency and rhythm. Dissertation, Stony Brook: Stony Brook University. Kingston, John (2005). Ears to categories. New arguments for autonomy. In Frota, Sónia; Vigário, Marina & Freitas, Maria Jo-o (Eds). Prosodies. With special reference to Iberian languages. Berlin: De Gruyter, 177-222. Kleber, Felicitas (2023). Phonetik und Phonologie. Ein Lehr- und Arbeitsbuch. Tübingen: Narr. Klee, Carol A. & Lynch, Andrew (2009). El español en contacto con otras lenguas. Washington, DC: Georgetown University Press. Klee, Carol A.; Rogers, Brandon M.A.; de la Fuente Iglesias, Mónica & Ramsburg, James (2023). Intervocalic / s/ voicing in the Andean Spanish of southern Peru. In Waltermire, Mark & Bove, Kathryn (Eds). Mutual influence in situations of Spanish language contact in the Americas. London: Routledge, 91-116. Kleiner, Stefan (2011). Atlas zur Aussprache des deutschen Gebrauchsstandards (AADG). In Zusammenarbeit mit Ralf Knöbl, http: / / prowiki.ids-mannheim.de/ bin/ view/ AADG/ . Kireva, Elena & Gabriel, Christoph (2015). Rhythmic properties of a contact variety. Comparing read and semi-spontaneous speech in Argentinean Porteño Spanish. In Delais-Roussarie, Élisabeth; Avanzi, Mathieu & Herment, Sophie (Eds). Prosody and languages in contact. L2 acquisition, attrition, languages in multilingual situations. Berlin: Springer, 149-168. Koch, Peter & Oesterreicher, Wulf (1985). Sprache der Nähe - Sprache der Distanz. Mündlichkeit und Schriftlichkeit im Spannungsfeld von Sprachtheorie und Sprachgeschichte. Romanisti‐ sches Jahrbuch 36, 15-43. Koch, Peter & Oesterreicher, Wulf ( 2 2011). Gesprochene Sprache in der Romania. Französisch, Italienisch, Spanisch. Berlin: De Gruyter ( 1 1990). Kohler, Klaus J. ( 2 1995). Einführung in die Phonetik des Deutschen. Berlin: Erich Schmidt ( 1 1977). Kohler, Klaus J. & Niebuhr, Oliver (2007). The phonetics of emphasis. In Trouvain, Jürgen & Barry, William J. (Eds). Proceedings of the 16 th International Congress of Phonetic Science, Saarbrücken, 2145-2148, http: / / www.icphs2007.de/ conference/ Papers/ 1055/ 1055.pdf. Kornfilt, Jaklin (1997). Turkish. London: Routledge. Krämer, Martin (2009). The phonology of Italian. Oxford: Oxford University Press. Krech, Eva-Maria; Eberhard Stock; Ursula Hirschfeld & Lutz-Christian Anders (2009). Deutsches Aussprachewörterbuch. Berlin: De Gruyter. Krefeld, Thomas (1999). Wortgestalt und Vokalsystem in der Italoromania. Plädoyer für eine gestaltphonologische Rekonstruktion des romanischen Vokalismus. Kiel: Westensee. Krefeld, Thomas (2001). Phonologische Prozesse. In Haspelmath, Martin; König, Ekkehard; Oeste