eBooks

Die intersektionale Wirkung von Geschlecht und Gender bei Französisch- und Spanischlernenden in Jahrgangsstufe 9

2023
978-3-8233-9622-2
Gunter Narr Verlag 
Patricia Uhl
10.24053/9783823396222

In der quantitativen Studie werden 92 Französisch- und 94 Spanischlernende der 9. Jahrgangsstufe des Gymnasiums hinsichtlich der multiplen Einflussfaktoren auf ihre fremdsprachliche Leistung im Hören, Lesen und Schreiben unter besonderer Berücksichtigung der Variablen Geschlecht und Gender miteinander verglichen. Dabei wird ersichtlich, dass die fremdsprachlichen Leistungen der Jungen und Mädchen je nach Zielsprache und Teilkompetenz teilweise stark variieren. Während in Französisch signifikante Geschlechterunterschiede zugunsten der Mädchen gefunden werden, sind in Spanisch schwache, nicht signifikante Effekte zugunsten der Jungen messbar. Einen erhöhten Erkenntnisgewinn erbringt jedoch die Erforschung der Erklärungsansätze für diese Ergebnisse, wobei die Rolle der kognitiven, affektiven und sozialen Leistungsprädiktoren berücksichtigt wird.

Multilingualism and Language Teaching MLT Multilingualism and Language Teaching ISBN 978-3-8233-8622-3 10 In der quantitativen Studie werden 92 Französisch- und 94 Spanischlernende der 9. Jahrgangsstufe des Gymnasiums hinsichtlich der multiplen Einflussfaktoren auf ihre fremdsprachliche Leistung im Hören, Lesen und Schreiben unter besonderer Berücksichtigung der Variablen Geschlecht und Gender miteinander verglichen. Dabei wird ersichtlich, dass die fremdsprachlichen Leistungen der Jungen und Mädchen je nach Zielsprache und Teilkompetenz teilweise stark variieren. Während in Französisch signifikante Geschlechterunterschiede zugunsten der Mädchen gefunden werden, sind in Spanisch schwache, nicht signifikante Effekte zugunsten der Jungen messbar. Einen erhöhten Erkenntnisgewinn erbringt jedoch die Erforschung der Erklärungsansätze für diese Ergebnisse, wobei die Rolle der kognitiven, affektiven und sozialen Leistungsprädiktoren berücksichtigt wird. Patricia Uhl Geschlecht und Gender bei Französisch- und Spanischlernenden 10 Patricia Uhl Die intersektionale Wirkung von Geschlecht und Gender bei Französisch- und Spanischlernenden in Jahrgangsstufe 9 Eine empirische Studie zu multiplen Einflussfaktoren auf die fremdsprachliche Leistung 10 Die intersektionale Wirkung von Geschlecht und Gender bei Französisch- und Spanischlernenden in Jahrgangsstufe 9 Multilingualism and Language Teaching Herausgegeben von Thorsten Piske (Erlangen), Silke Jansen (Erlangen) und Martha Young-Scholten (Newcastle) Band 10 Patricia Uhl Die intersektionale Wirkung von Geschlecht und Gender bei Französisch- und Spanischlernenden in Jahrgangsstufe 9 Eine empirische Studie zu multiplen Einflussfaktoren auf die fremdsprachliche Leistung DOI: https: / / doi.org/ 10.24053/ 9783823396222 © 2023 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Überset‐ zungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Internet: www.narr.de eMail: info@narr.de CPI books GmbH, Leck ISSN 2199-1340 ISBN 978-3-8233-8622-3 (Print) ISBN 978-3-8233-9622-2 (ePDF) ISBN 978-3-8233-0493-7 (ePub) Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Natio‐ nalbibliografie; detaillierte bibliografische Daten sind im Internet über http: / / dnb.dnb.de abrufbar. www.fsc.org MIX Papier aus verantwortungsvollen Quellen FSC ® C083411 ® Danksagung An dieser Stelle gebührt es, all den Menschen zu danken, die mir während der Zeit des vorliegenden Dissertationsprojekts mit Rat und Tat zur Seite gestanden haben. Ohne sie wäre es nicht möglich gewesen, die Höhen und Tiefen, die so eine aufwendige wissenschaftliche Arbeit mit sich bringt, zu meistern. Allen voran möchte ich meinem Betreuer Herrn Prof. Dr. Thorsten Piske danken, der von Anfang an großes Vertrauen in meine wissenschaftlichen Fä‐ higkeiten hatte und mich bei der Umsetzung meines Vorhabens stets unterstützt hat. Er hat sich sehr viel Zeit für meine Anliegen genommen und durch seine Expertise und konstruktiven Rückmeldungen substanziell zum Erfolg meiner Dissertation beigetragen. Durch seine Förderung konnte ich mich auch über das Promotionsprojekt hinaus wissenschaftlich weiterentwickeln und wertvolle Erfahrungen in der akademischen Welt sammeln. Meiner zweiten Betreuerin Prof. Dr. Silke Jansen möchte ich ebenfalls herzlich für die kompetenten und zeitnahen Rückmeldungen sowie für das entgegengebrachte Vertrauen danken. Auch Prof. Dr. Christiane Fäcke spreche ich meinen tiefen Dank dafür aus, dass sie meinem Projekt etwas von ihrer Zeit geschenkt hat und dazu bereit war, das Drittgutachten so rasch zu erstellen. Des Weiteren möchte ich meiner Drittprüferin Frau Prof. Dr. Annette Keil‐ hauer, die mir durch ihre Arbeit als Gründerin und Vorsitzende des IZGDD (Interdisziplinären Zentrums für Gender Differenz Diversität) zahlreiche Denk‐ anstöße gab, für das Interesse an meiner Forschungsarbeit danken. Neben den Prüfenden haben mich in meinem engeren und weiteren Forschungs‐ umfeld einige sehr geschätzte Kolleginnen und Kollegen während des Disserta‐ tionsprojekts unterstützt, die ich an dieser Stelle hervorheben möchte: Meiner Kollegin PD Dr. Anja Steinlen danke ich von Herzen für ihre stets sehr motivierende Art und ihre vielen Ratschläge. Auch meiner ehemaligen Kollegin Katrin Schwanke, M. A. möchte ich für ihre zahlreichen hilfreichen Tipps und ihre vielseitige Unterstützung besonders danken. Meinem Kollegen PD Dr. habil. Roger Schöntag gebührt Dank für die kompetenten Ratschläge aus sprachwissenschaftlicher Perspektive. Außerdem schätzte ich die gemeinsame Zeit und den Austausch mit meinen ehemaligen Kolleginnen Dr. Jessica Barzen und Dr. Hanna Lene Geiger während unserer Promotionsverfahren sehr. Des Weiteren gilt meinen Kolleginnen und Kollegen aus dem Sprachenzentrum der FAU, Javier Navarro González und Silvia Sáenz Caballé, die die spanischen Hörverstehenstexte im Tonstudie einsprachen, sowie Akad. ORat Christian Hagen, der die Aufnahmen und später die Schnitte der Hörtexte vornahm, ein besonderer Dank. StRin Annette Lorenz, Petra Bradatsch M.A, Geneviève Beaulieu und Dr. Ivana Lohrey möchte ich zudem von ganzem Herzen für ihre Zeit und die vielen kleinen Tipps ganz herzlich danken. Sehr profitiert habe ich außerdem während meiner Forschungsarbeit von Unter‐ stützungsprogrammen für Promovierende der FAU: Dem ARIADNE-Programm und meiner Mentorin Prof. Dr. Bettina Brandl-Risi, die mir ganz zu Beginn des Promotionsprojekts half, Kontakte zu knüpfen und Prioritäten richtig zu setzen, gebührt entsprechender Dank. Hinzukam die intensive Beratung des ZiLL (Zentralinstitut für Lehr-Lernforschung) durch Dr. Marcus Penthin bezüglich der quantitativen Erhebungsmethoden, die mir sehr weitergeholfen hat und wofür ich mich an dieser Stelle ganz herzlich bedanken möchte. Durch die Vorstellung der Fortschritte meiner Doktorarbeit auf vielen Konfe‐ renzen und Workshops habe ich von zahlreichen Forschenden zusätzliche Rück‐ meldungen erhalten, die mich entscheidend vorangebracht haben. Hervorheben möchte ich besonders die 4. DGFF-Sommerschule vom 13.-19.08.2017 in Riez‐ lern, bei der Prof. Dr. Julia Settinieri und Prof. Dr. Dominik Rumlich durch ihr kompetentes Feedback wesentlich zum Erfolg meiner Arbeit beigetragen haben. Ohne finanzielle Hilfe wäre dieses Projekt ebenfalls nicht leicht zu stemmen gewesen. Daher möchte ich dem Büro für Gender und Diversity der FAU für den finanziellen Forschungsanschub danken, durch den ich die Kosten der Datenerhebung teilweise abdecken konnte. Natürlich gilt jedoch mein höchster Dank all den Schulleitungen, Lehr‐ kräften, Eltern, Schülerinnen und Schüler, die bereit waren, mit vollem Engagement an der Erhebung teilzunehmen. Ohne sie wäre die vorliegende Studie nicht möglich gewesen. Von ganzem Herzen bedanke ich mich schließlich bei meinem Mann Sergio, der mich stets in meinem Vorhaben bestärkt und immer an mich geglaubt hat, auch wenn dies gewiss nicht immer leicht war. Mein herzlicher Dank gilt zu guter letzt auch meinen Eltern Karin und Ulrich, meinen Großeltern Erna (†) und Paul, meinen Brüdern Marcel und Matthias sowie meinen Schwiegereltern Carmen und Miguel, die mir immer viel Vertrauen geschenkt haben und mich durch viele kleine und große Gesten die ganze Zeit über unterstützt haben. 13 1 21 2 27 3 33 4 37 4.1 37 4.2 38 4.3 55 5 57 5.1 57 5.1.1 57 5.1.2 65 5.1.3 71 5.2 124 5.2.1 126 5.2.2 127 5.2.3 128 5.2.4 129 Inhalt Verzeichnis über die verwendeten Abkürzungen und statistischen Einheiten . . Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Kategorien Geschlecht und Gender aus interdisziplinärer Sicht . . . . Intersektionale Geschlechterforschung im Kontext des Fremdsprachenunterrichts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stand der Forschung: Geschlecht und fremdsprachliche Leistungen . . . Fremdsprachliche Leistung als komplexer Forschungsgegenstand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Geschlecht und fremdsprachliche Leistung . . . . . . . . . . . . . . . Zwischenfazit zum Stand der Forschung bezüglich fremdsprachlicher Leistung und Geschlecht . . . . . . . . . . . . . . Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Endogene Faktoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Alter und Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . Kognitive, neurologische Faktoren, Geschlecht und sprachliche Leistung . . . . . . . . . . . . . . . . . . . . . . . . . . . . Affektive Faktoren und Geschlecht . . . . . . . . . . . . . . . Exogene Faktoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eltern als geschlechtsspezifische Sozialisationsinstanzen . . . . . . . . . . . . . . . . . . . . . . . . . Peers als geschlechtsspezifische Sozialisationsinstanzen . . . . . . . . . . . . . . . . . . . . . . . . . Fremdsprachenlehrkräfte als geschlechtsspezifische Sozialisationsinstanzen . . . . . . . . . . . . . . . . . . . . . . . . . Sozioökonomischer Status, Lernumgebung und Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.5 130 5.2.6 133 5.2.7 134 6 137 7 139 8 143 8.1 143 8.2 151 9 157 9.1 157 9.1.1 157 9.1.2 159 9.2 162 9.2.1 173 9.2.2 186 9.2.3 198 9.3 209 9.3.1 209 9.3.2 211 9.3.3 214 9.3.4 217 9.3.5 244 9.3.6 253 10 257 11 259 11.1 259 Interaktionswirkungen von Migrationshintergrund, Mehrsprachigkeit, sozialem Umfeld und Geschlecht . Gesamtgesellschaftliche und interkulturelle Einflussfaktoren auf die fremdsprachliche Leistung von Jungen und Mädchen . . . . . . . . . . . . . . . . . . . . . . . Zwischenfazit: Exogene Faktoren und Geschlecht . . . Netzwerkmodell der interaktiven Faktoren des genderbezogenen Fremdsprachenlernerfolgs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Forschungsdesign: Vorhaben und Erhebungsinstrumente . . . . . . . . Grundgesamtheit und Sampling-Strategien der quantitativen Untersuchung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bestimmung der beiden angestrebten Grundgesamtheiten . . Sampling-Strategien der quantitativen Untersuchung . . . . . . Untersuchungsinstrumente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kognitive Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D2-R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . SPM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sprachtests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Hörverstehenstest . . . . . . . . . . . . . . . . . . . . . . . . . Der Leseverstehenstest . . . . . . . . . . . . . . . . . . . . . . . . . Der Schreibtest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Schülerfragebogen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pilotierung des Schülerfragebogens . . . . . . . . . . . . . . . Erfassung der Hintergrundvariablen . . . . . . . . . . . . . . Erfassung der affektiv-motivationalen Variablen . . . . Die Skalen der affektiv-motivationalen Konstrukte . Skalen zum Ought-to-L3/ L4 Self . . . . . . . . . . . . . . . . . . Limitationen des Schülerfragebogens . . . . . . . . . . . . . Durchführung der Studie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Auswertung der Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Umgang mit fehlenden Werten . . . . . . . . . . . . . . . . . . . . . . . . . 8 Inhalt 11.2 260 11.2.1 261 11.2.2 268 11.2.3 274 11.3 276 11.3.1 276 11.3.2 285 11.3.3 288 11.4 289 11.4.1 290 11.4.2 300 11.4.3 310 11.5 398 11.5.1 403 11.5.2 405 11.6 406 11.6.1 407 11.6.2 416 11.6.3 417 11.6.4 425 11.7 426 11.7.1 426 Statistische Merkmale der Stichproben . . . . . . . . . . . . . . . . . . Spezifische Merkmale der Französischstichprobe . . . Spezifische Merkmale der Spanischstichprobe . . . . . . Zwischenfazit: Merkmale der Französisch- und Spanischstichprobe im Vergleich . . . . . . . . . . . . . . . . . Ergebnisse der kognitiven Tests . . . . . . . . . . . . . . . . . . . . . . . . Ergebnisse des d2-R-Tests . . . . . . . . . . . . . . . . . . . . . . . Ergebnisse des SPM-Tests . . . . . . . . . . . . . . . . . . . . . . . Zwischenfazit: Ergebnissen der kognitiven Tests . . . . Ergebnisse der Sprachtests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Auswertung und Ergebnisse der Hörverstehenstests Auswertung und Ergebnisse der Leseverstehenstests Auswertung und Ergebnisse des Schreibtests . . . . . . . Gesamtleistungen in den Sprachtests in Französisch und Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zwischenfazit: Antwort auf Forschungsfrage 1 für Französisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zwischenfazit: Antwort auf Forschungsfrage 1 für Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analyse möglicher Interaktionseffekte des Geschlechts mit den Intersektionalitätsaxiomen sozioökonomischer Status und sprachlicher Hintergrund . . . . . . . . . . . . . . . . . . . . . . . . . . Analyse möglicher Interaktionen zwischen Geschlecht, sprachlichem Hintergrund und sozioökonomischem Status bezüglich der Französischleistungen . . . . . . . . . . . . . . . . . . . . . . . . . . Zwischenfazit: Antwort auf Forschungsfrage 2 für Französisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analyse einer möglichen Interaktion zwischen Geschlecht, sprachlichem Hintergrund und sozioökonomischem Status bezüglich der Spanischleistungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zwischenfazit: Antwort auf Forschungsfrage 2 für Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ergebnisse bezüglich der endogenen und wahrgenommenen exogenen Faktoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ergebnisse bezüglich der endogenen affektiven Faktoren in Französisch . . . . . . . . . . . . . . . . . . . . . . . . . Inhalt 9 11.7.2 432 11.7.3 432 11.7.4 435 11.7.5 435 11.7.6 440 11.7.7 441 11.7.8 443 11.8 443 11.8.1 445 11.8.2 447 11.9 449 11.9.1 453 11.9.2 464 11.9.3 466 11.9.4 473 11.10 474 11.10.1 475 11.10.2 504 Zwischenfazit: Antwort auf Forschungsfrage 3 für Französisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ergebnisse bezüglich der wahrgenommenen exogenen Faktoren in Französisch . . . . . . . . . . . . . . . . Zwischenfazit: Antwort auf Forschungsfrage 4 für Französisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ergebnisse bezüglich der endogenen affektiven Faktoren in Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . Zwischenfazit: Antwort auf Forschungsfrage 3 für Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ergebnisse bezüglich der wahrgenommenen exogenen Faktoren in Spanisch . . . . . . . . . . . . . . . . . . Zwischenfazit: Antwort auf Forschungsfrage 4 für Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Korrelationsanalysen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Korrelationsanalysen innerhalb der Französischstichprobe . . . . . . . . . . . . . . . . . . . . . . . . . . Korrelationsanalysen innerhalb der Spanischstichprobe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Regressionsanalysen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Regressionsanalysen zu den Leistungen in Französisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zwischenfazit: Antwort auf Forschungsfrage 5 für Französisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Regressionsanalysen zu den Leistungen in Spanisch . Zwischenfazit: Antwort auf Forschungsfrage 5 für Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analysen geschlechtsspezifischer Prädiktoren der Leistungen in Französisch . . . . . . . . . . . . . . . . . . . . . . . Zwischenfazit: Antwort auf Forschungsfrage 6 für Französisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Inhalt 11.10.3 511 11.10.4 523 11.11 528 11.11.1 529 11.11.2 532 12 537 12.1 537 12.1.1 537 12.1.2 543 12.1.3 548 12.1.4 558 12.1.5 562 12.2 568 12.2.1 568 12.2.2 574 12.2.3 577 12.2.4 583 12.2.5 587 12.3 595 13 603 Analyse geschlechtsspezifischer Prädiktoren der Leistungen in Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . Zwischenfazit: Antwort auf Forschungsfrage 6 für Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diskriminanzanalysen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diskriminanzanalyse und Antwort auf Forschungsfrage 7 für Französisch . . . . . . . . . . . . . . . . Diskriminanzanalyse und Antwort auf Forschungsfrage 7 für Spanisch . . . . . . . . . . . . . . . . . . Interpretation der Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interpretation der zentralen Ergebnisse in Französisch . . . . . Interpretation der zentralen Ergebnisse bezüglich des Hörverstehenstests in Französisch . . . . . . . . . . . . . . . . Interpretation der zentralen Ergebnisse bezüglich des Leseverstehenstests in Französisch . . . . . . . . . . . . . . . Interpretation der zentralen Ergebnisse bezüglich des Schreibtests in Französisch . . . . . . . . . . . . . . . . . . . . . . Interpretation der zentralen Ergebnisse bezüglich der Gesamtleistungen in den Französischtests . . . . . . . . . Interpretation der Ergebnisse der Diskriminanzanalyse in Französisch . . . . . . . . . . . . . . Interpretation der zentralen Ergebnisse in Spanisch . . . . . . . Interpretation der zentralen Ergebnisse bezüglich des Hörverstehenstests in Spanisch . . . . . . . . . . . . . . . . . . Interpretation der zentralen Ergebnisse bezüglich des Leseverstehenstests in Spanisch . . . . . . . . . . . . . . . . . . Interpretation der zentralen Ergebnisse bezüglich des Schreibtests in Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . Interpretation der zentralen Ergebnisse bezüglich der Gesamtleistungen in den Spanischtests . . . . . . . . . . . . Interpretation der Ergebnisse der Diskriminanzanalyse in Spanisch . . . . . . . . . . . . . . . . . Vergleich der Ergebnisse aus den Fächern Französisch und Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einschränkungen und Grenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Inhalt 11 14 609 15 615 621 683 687 Didaktische Implikationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fazit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Abbildungsverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabellenverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Inhalt Inhaltsverzeichnis Anhang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 697 Verzeichnis über die verwendeten Abkürzungen und statistischen Einheiten α Cronbachs α (Reliabilitätskoeffizient) ADHS Aufmerksamkeitsdefizit-/ Hyperaktivitätsstörung AEM5-7 Attribuierungsfragebogen für Erfolg und Misserfolg in der Schule für 5.-7. Klassen AF Auslassungsfehler (d2-R) a j * Standardisierter kanonischer Diskriminanzfunktionskoeffizient AMTB Attitude Motivation Test Battery ANCOVA Analysis of Covariance; dt. Kovarianzanalyse ANOVA Analysis of Variance; dt. Varianzanalyse Ang L3-/ L4 Angst Auf. Aufmerksamkeitsverteilung AufLk Wahrgenommene Aufmerksamkeitsverteilung der Lehrkraft zu‐ gunsten der Mädchen Aufmerk. Aufmerksamkeitsverteilung Auslandsauf. Auslandsaufenthalt B Geschätzte Regressionsparameter β Standardisierte geschätzte Regressionsparameter BRD Bundesrepublik Deutschland BZO Zahl der bearbeiteten Zielobjekte (d2-R) CEFR Common European Framework of Reference for Languages CHF Schweizer Franken CIEP Centre International d’études pédagogiques CLIL Content and Language Integrated Learning CPM Coloured Progressive Matrices d Cohens d (Maß der Effektstärke) DELE Diploma de Español como Lengua Extranjera DALF Diplôme approfondi de langue française DELF Diplôme d’études de langue française DESI Deutsch-Englisch Studie International DFI Deutsch-Französisches Institut d.h. das heißt DGPs Deutsche Gesellschaft für Psychologie d2-R Test d2-Revision € Euro η p2 Partielles Eta-Quadrat (Effektstärkenmaß auf Stichproben‐ ebene) E. Erwartungen EAL Exploratorische Faktorenanalyse EALTA European Association of Language Testing and Assessment EDK Schweizerische Konferenz der kantonalen Erziehungsdirektion EFL SC English as a foreign language self-concept EFS Englisch als Fremdsprache Einst. Einstellungen ELaK Einstellungen zum Zielland und zur Zielkultur ELk Wahrgenommene Erwartungen der Lehrkraft Elt. Eltern Erw. Erwartungen ErwE Wahrgenommene Erwartungen der Eltern ErwP Wahrgenommene Erwartungen der Peers ESpra Einstellungen zur Fremdsprache ESpre Einstellungen zu den Sprecherinnen und Sprechern der Ziel‐ sprache EU Europäische Union F F-Wert (Kennwert der Varianzanalyse) FFS Französisch als Fremdsprache FL Faktorladung 14 Verzeichnis über die verwendeten Abkürzungen und statistischen Einheiten FLK Französischlehrkraft Fran. Französisch Freiz. Freizeitaktivitäten Freizeitaktivit. Freizeitaktivitäten frz. französisch f 2 Cohens f 2 (Maß der Effektstärke) F% Sorgfalt der Arbeitsweise (d2-R) γ Schiefe GCSE General Certificate of Secondary Education ges Gesamtstichprobe Genderst. Genderstereotyp GeR Gemeinsamer europäischer Referenzrahmen für Sprachen Ges.leist. Gesamtleistung Gr.f. Grundfertigkeiten Häufig. Häufigkeit HarmoS Interkantonale Vereinbarung über die Harmonisierung der ob‐ ligatorischen Schule HISEI Highest International Socio-Economic Index of Occupational Status Hö Hören hoh. hoher HV Hörverstehen ICC Intraclass Correlation Coefficient IdSel Ideal L3/ L4 Self IEF Instrumente für die Evaluation von Fremdsprachenkompe‐ tenzen IGLU Internationale Grundschul-Lese-Untersuchung IGS Integrierte Gesamtschule IHR Integrierte Haupt- und Realschule Ind. Index In Interesse am Fach Verzeichnis über die verwendeten Abkürzungen und statistischen Einheiten 15 InstOr Instrumentelle Orientierung IntOr Integrative Orientierung IPM Informatik - Physik - Mathematik IQB Institut zur Qualitätsentwicklung im Bildungswesen ISCO International Standard Classification of Occupations ISEI International Socio-Economic Index of Occupational Status I-S-T 2000 R Intelligenz-Struktur-Test 2000 R KESS Kompetenzen und Einstellungen von Schülerinnen und Schü‐ lern KFT Kognitiver Fähigkeitstest KI Konfidenzintervall KL Konzentrationsleistung (d2-R) KMK Kultusministerkonferenz der Länder KMO Kaiser-Mayer-Olkin-Koeffizient kog. kognitive Λ Wilks Lambda LAU Hamburger Lern-Ausgangs-Untersuchung Le Lesen LV Leseverstehen L1 Erstsprache L2 Zweitsprache L2 WTC Willingness to Communicate in a Second Language L3 Tertiärsprache L4 Viertsprache m männlich M Mittelwert (mean value) M. Mädchen Mäd. Mädchen Mdn Median 16 Verzeichnis über die verwendeten Abkürzungen und statistischen Einheiten MES Mehrsprachigkeit fördern. Vielfalt und Reichtum Europas in der Schule nutzen min Minuten mittl. mittlerer ml monolingual/ einsprachig M Rang Mittlerer Rang MSA Measure of Sample Adequacy MV Fehlender Wert (missing value) N Größe der Grundgesamtheit n Größe der Stichprobe NFER National Foundation of Educational Research niedr. niedrig NW Normwert NWT Naturwissenschaft und Technik OECD Organisation for Economic Co-operation and Development Orient. Orientierung σ 2B Level-2-Varianz zwischen den Clustern σ 2W Level-2-Varianz innerhalb der Cluster p Signifikanzwert PCIC Plan Curricular del Instituto Cervantes PISA Programme for International Student Assessment ρIC Statistischer Kennwert der Interklassenkorrelation pl plurilingual/ mehrsprachig P7 Letztes Jahr der Primary School in Schottland r Korrelationskoeffizient nach Pearson RAE Real Academia Española r c Kanonischer Korrelationskoeffizient r s Korrelationskoeffizient Spearmans Rho RW Rohwert (d2-R) Verzeichnis über die verwendeten Abkürzungen und statistischen Einheiten 17 R 2 Geschätztes Inkrement SAT Scholastic Aptitude Test Sc Schreiben SD Standardabweichung (standard deviation) SDR Studentisierte ausgeschlossene Residuen SE (B) Standardfehler des geschätzten Regressionsparameters sec Sekunden Selbstk. Selbstkonzept SEM Standardfehler des Mittelwerts (standard error of mean) SFB Schülerfragebogen SFS Spanisch als Fremdsprache Sk Selbstkonzept in der Fremdsprache SLA Second Language Acquisition SLK Spanischlehrkraft SöS Sozioökonomischer Status Span. Spanisch SPM Standard Progressive Matrices Sprachhandlungsk. Sprachhandlungskompetenz SSCS Interdependent Self-Construal Scale StWe Genderstereotyp weibliche Wahrnehmung der Zielsprache SW Standardwert (d2-R) S1 Erstes Jahr der Sekundarstufe in Schottland t t-Wert (Größe der Differenz relativ zur Streuung) TAL Test of Academic Lexicon TIMSS Trends in International Mathematics and Science Study U U-Wert als Ergebnis des Mann-Whitney-U-Tests U. Unterstützung u. a. unter anderem ULk Wahrgenommene Unterstützung durch die Lehrkraft 18 Verzeichnis über die verwendeten Abkürzungen und statistischen Einheiten UN HDI United Nations Human Development Programme v Variable VF Verwechslungsfehler (d2-R) w weiblich ꞷ Kurtosis Wahrg. Wahrnehmung bzw. Wahrgenommene weibl. weiblich Z Z-Wert als Ergebnis des Mann-Whitney-U-Tests z.B. zum Beispiel Zielk. Zielkultur zug. zugunsten Verzeichnis über die verwendeten Abkürzungen und statistischen Einheiten 19 1 Einleitung Seit mehreren Jahrzehnten stellt sich innerhalb verschiedener Forschungsdiszi‐ plinen immer wieder die Frage, inwieweit Bildungsungleichheiten und -chancen an Schulen in Deutschland auch mit dem Geschlecht der Lernenden zusammen‐ hängen (vgl. Faulstich-Wieland/ Horstkemper 2012: 25). Während in der BRD in den 1960/ 70er Jahren bezüglich der Qualität der Bildungsabschlüsse die „ka‐ tholische Arbeitertochter vom Lande“ (Dahrendorf 1965) als Prototypin für eine potenzielle Bildungsverliererin galt, stellen Mädchen innerhalb des Schulsys‐ tems aktuell keine benachteiligte Gruppe mehr dar (vgl. Wieland/ Horstkemper 2012: 27). Seit den 1990er Jahren wird in der Forschung sogar immer wieder die Tendenz aufgezeigt, dass die Mädchen die Jungen zunehmend überholen (vgl. Horstkemper 1995: 189; Aktionsrat Bildung 2009: 95). Insbesondere seit den 2000er Jahren wird zunehmend vom „Migrantensohn bildungsarmer Eltern aus der Großstadt“ (Geißler 2013: 95) als prototypischem Bildungsverlierer gesprochen. Man findet sogar seit den 2000er Jahren bezüglich der Merkmals‐ gruppe der Jungen den Begriff „Risikogruppe“ (vgl. Buchmann et al. 2008; Aktionsrat Bildung 2009; Martino et al. 2009; OECD 2009; Diefenbach 2010; Quenzel/ Hurrelmann 2010; Hannover/ Kessels 2011): Mädchen werden häufiger als Jungen vorzeitig eingeschult und Jungen werden häufiger von der Einschu‐ lung zurückgestellt (vgl. Autorengruppe Bildungsberichterstattung 2018: 7); bei den Übergangsempfehlungen treten Unterschiede zugunsten der Mädchen auf, die sich später auch an den Besuchsquoten der verschiedenen Schularten und dem Geschlechteranteil der Bildungsabschlüsse festmachen lassen: Im Jahr 2016 lag beispielsweise der Anteil der Frauen mit Hochschulreife unter den 20bis 25- Jährigen mit 55.6% deutlich über demjenigen der Männer (47.6%) (vgl. Autorengruppe Bildungsberichterstattung 2018: 55, 276). Diese sehr allgemeinen Tendenzen sind jedoch wenig aussagekräftig, da sie nicht pauschal auf alle Kontexte zutreffen und differenziert nach Alter der Lernenden, Ausprägung verschiedener kognitiver und affektiver Faktoren, Lernbiographie, Schulart, Schulfach und soziokulturellem Kontext infrage gestellt werden müssen. In der vorliegenden Studie stehen die Schulfächer Französisch als zweite Fremdsprache und Spanisch als dritte Fremdsprache im Vordergrund und der Fokus liegt auf der Erforschung von Gemeinsamkeiten und Unterschieden von Jungen und Mädchen in der 9. Jahrgangsstufe bezüglich der Leistung in den beiden Fächern sowie der Erforschung möglicher Erklärungs‐ ansätze und Wechselwirkungen. In internationalen Leistungsstudien wie TIMSS und PISA wird oftmals in sprachlichen Fächern tendenziell ein Leistungsvorteil der Mädchen und in mathematisch-naturwissenschaftlichen Fächern hingegen tendenziell eine Überlegenheit der Jungen nachgewiesen (vgl. Faulstich-Wieland/ Horstkemper 2012: 27; Stürzer 2003), was teilweise in der Öffentlichkeit zu stereotypen Vorstellungen von dichotom zuzuweisenden Begabungsbereichen führt. Vielmehr weisen jedoch die uneinheitlichen Ergebnisse der Spracherwerbs- und Fremdsprachenlernforschung bezüglich der Variable Geschlecht darauf hin, dass pauschale Aussagen wie etwa, dass Mädchen und Frauen beim Erlernen von Fremdsprachen stets und in allen Teilkompetenzen Vorteile haben würden, nicht haltbar sind (vgl. Piske 2017: 45): Es gibt Studien, bei denen Mädchen besser abschnitten als Jungen, aber auch liegen Studien vor, bei denen Jungen besser abschnitten als Mädchen oder bei denen keinerlei Geschlechterunterschiede zu beobachten waren. Oft kommt es zudem vor, dass die Unterschiede innerhalb der Gruppe der Mädchen und innerhalb der Gruppe der Jungen deutlich größer ausfallen als dies zwischen den beiden Gruppen der Fall ist. Diese uneinheitlichen Ergebnisse variieren nach bestimmten Einflussfaktoren, wie zum Beispiel das Alter der Lernenden, die zu erlernende Zielsprache, die unter‐ suchten fremdsprachlichen Teilkompetenzen, die Sprachlernbibliographie, der Lehr-Lern-Kontext, das soziokulturellen Umfeld und nicht zuletzt bezüglich der in verschiedenen Studien eingesetzten Testformate. Einige der Studien, die bisher durchgeführt wurden, nehmen allerdings lediglich ein bis zwei Faktoren in den Blick, beispielsweise Geschlecht und fremdsprachliche Leistung (vgl. Winkelmann/ Groeneveld 2010), Geschlecht und affektive Faktoren (vgl. Fuchs 2013, 2014), Geschlecht und Einstellungen (vgl. Venus 2017a, 2017b), Geschlecht, kognitive und neuronale Faktoren (vgl. z. B. Wallentin 2008), Geschlecht, Iden‐ titätsbildungsprozesse und Sprachenlernen (vgl. Norten 2001) oder Geschlecht und Fächerwahl (vgl. Grein 2015). Um einen umfassenderen Blick auf diesen komplexen Themenbereich zu erlangen wird daher in der vorliegenden Studie im Sinne der Berücksichtigung der Faktorenkomplexion (vgl. López Rúa 2006) ein intersektionaler Ansatz verfolgt. Außerdem ist zu beobachten, dass sich die Erforschung von schulischen sprachlichen Leistungen von Jungen und Mädchen in Deutschland oftmals auf die Fächer Deutsch und Englisch beschränkt (vgl. z. B. Bos/ Gröhlich 2010; DESI-Konsortium 2006). Eher selten wird Französisch (vgl. Böhme et al. 2016a; Winkelmann/ Groeneveld 2010) und noch seltener Spanisch als Forschungsge‐ genstand gewählt, wenn es darum geht, die Wirkung von Geschlecht und Gender bezüglich der fremdsprachlichen Leistung zu erforschen (vgl. Übersichtsdarstel‐ lungen in Grein 2012; Uhl 2019: 207). 22 1 Einleitung 1 Böhme et al. (2016) untersuchten die geschlechtsbezogenen Disparitäten in der Leistung im Französischen im Rahmen des IQB-Bildungstrends 2015 im Gegensatz zu den Ländervergleichsstudien von 2009 nicht (vgl. hierzu Kapitel 4.2). Bei den Fächern Französisch als zweite Fremdsprache und Spanisch als dritte Fremdsprache handelt es sich um zwei ähnliche und doch teilweise stark unterschiedliche Forschungsgegenstände: Spezifisch bezüglich des Faches Französisch ist das Stereotyp, es handle sich um ein „Mädchenfach“ in der deutschen Gesellschaft weit verbreitet (vgl. Budde 2011: 104). Die Begründungen für diese Bezeichnung reichen vom angeblich femininen Klang des Französi‐ schen (vgl. Leupold 2007: 15; Williams et al. 2002) über den Hinweis auf die Überzahl an weiblichen Schülerinnen und weiblichen Lehrkräften in den Französischklassen (vgl. Grein 2012: 173, 175), den Vorwurf des zu stark an Mädchen ausgerichteten Französischunterrichts (vgl. Grein 2012: 171) bis hin zum Verweis auf höhere Leistungen der weiblichen Schülerinnen in Schulleis‐ tungsstudien, wie beispielsweise in der IQB-Ländervergleichsstudie von 2009 (vgl. Winkelmann/ Groeneveld 2010). 1 Dementsprechend werden Postulate nach einer spezifischen „Jungenförderung“ bzw. einem Boy Turn innerhalb der Fran‐ zösischdidaktik immer lauter (vgl. Bonin 2009; Braun/ Schwemer 2013; Nieweler 2017b: 16-17). Für das Fach Spanisch wurden hingegen bisher kaum geschlechtsspezifische Stereotypen gefunden (vgl. Kissau et al. 2010: 714) und durch seine Stellung als oftmals dritte schulische und meist zweite romanische Fremdsprache eignet es sich gut um einen Vergleich zum Fach Französisch zu ziehen: Sowohl beim Französischen als auch beim Spanischen handelt es sich um romanische Sprachen, wodurch die Leistungen in den beiden Fächern sehr gut verglichen werden können. Außerdem scheint es einen Moment zu geben, bei dem, obwohl Französisch bereits früher einsetzt als Spanisch, sich die Leistungen in beiden Fächern stark annähern, da am Ende der mittleren Reife in jedem der beiden Fächer das Niveau B1 des GeR erreicht werden muss, was bedeutet, dass die Progression in der dritten Fremdsprache steiler verläuft als in der zweiten. Den‐ noch muss dieser Vergleich mit Vorsicht vollzogen werden, da beispielsweise das Fächerwahlverhalten für die zweite Fremdsprache Französisch und für die dritte Fremdsprache genuin unterschiedlich sind: In Baden-Württemberg kann beispielsweise als Alternative zur zweiten Fremdsprache Französisch lediglich Latein gewählt werden, während in der 8. Jahrgangsstufe entschieden werden kann, ob mit Spanisch eine dritte Fremdsprache gelernt, oder aber ein weiteres naturwissenschaftliches Fach belegt wird, was ein hohes Maß an Selektion bei der dritten Fremdsprache zur Folge hat. 1 Einleitung 23 Nach der Definition von Geschlecht und Gender (vgl. Kapitel 2) und einer Erläuterung des intersektionalen Forschungsansatzes dieser Arbeit (vgl. Ka‐ pitel 3) wird zunächst ein Überblick über den Stand der Forschung bezüglich Geschlecht und fremdsprachlicher Leistung (vgl. Kapitel 4) gegeben, um an‐ schließend eine genaue Identifikation der Variablen vorzunehmen, die mit den fremdsprachlichen Leistungen und dem Geschlecht in interdependenter Beziehung stehen und daher als Erklärungsansätze für Gemeinsamkeiten und Unterschiede von Jungen und Mädchen in der fremdsprachlichen Leistung herangezogen werden können (vgl. Kapitel 5). Am Ende dieses Prozesses steht die Konzeption eines theoretischen Lernendenmodells, welches alle relevanten Faktoren beinhaltet (vgl. Kapitel 6). Auf Grundlage dessen wird eine empirische quantitative Studie mit einer Stichprobe von Schülerinnen und Schüler des Französischen als zweite Fremdsprache und einer zweiten mit Schülerinnen und Schülern des Spanischen als dritte Fremdsprache in Jahrgangsstufen 9 in Baden-Württemberg durchgeführt, welche sowohl die fremdsprachlichen Leistungen im Hörverstehen, Leseverstehen und Schreiben misst als auch kognitive Grundfertigkeiten über standardisierte Tests (vgl. d2-R und SPM) erhebt und schließlich mittels eines Schülerfragebogens die Mehrheit der mit der Variable Geschlecht interagierenden Variablen ermittelt (vgl. Kapitel 7 bis 10). Schließlich werden die dadurch erzielten Ergebnisse hinsichtlich folgender Forschungsfragen ausgewertet (vgl. Kapitel 11): 1. In welchen fremdsprachlichen Leistungen treten bezüglich des Lesevers‐ tehens, des Hörverstehens und des Schreibens jeweils im Französischen und im Spanischen Geschlechterunterschiede und -gemeinsamkeiten bei Schülerinnen und Schülern der 9.-Jahrgangsstufe auf ? 2. Treten bei den sprachlichen Leistungen Interaktionseffekte des Ge‐ schlechts mit dem sozioökonomischen Status oder mit dem sprachlichen Hintergrund auf ? 3. Innerhalb welcher affektiver Faktoren (integrative Orientierung, Ideal L3 bzw. L4 Self, instrumentelle Orientierung, Häufigkeit der Freizeitakti‐ vitäten auf Französisch bzw. Spanisch, L3/ L4 WTC, Interesse am Fach Französisch bzw. Spanisch, Interessensgebiete innerhalb der Unterrichts‐ gegenstände, Einstellungen zu den Sprechern, zu den Bewohnerinnen und Bewohnern Frankreichs bzw. Spaniens, zum Land und zur Kultur, genderstereotyp weibliche Wahrnehmung der französischen bzw. spani‐ schen Sprache, FFS bzw. SFS Selbstkonzept und L3bzw. L4-Angst) treten Geschlechterunterschiede und -gemeinsamkeiten auf ? 4. Welche Geschlechterunterschiede und -gemeinsamkeiten in den wahrge‐ nommenen Einflüssen auf Makroebene (wahrgenommene Unterstützung 24 1 Einleitung durch die Lehrkraft, wahrgenommene Erwartungen der Lehrkraft, wahr‐ genommene Aufmerksamkeitsverteilung der Lehrkraft zugunsten der Mädchen, wahrgenommene Erwartungen der Eltern, wahrgenommene Erwartungen der Peers) können festgestellt werden? 5. Welche Faktoren (Geschlecht, sozioökonomischer Hintergrund, sprachli‐ cher Hintergrund, kognitive Grundfertigkeiten, affektive Faktoren, Fak‐ toren auf der Makroebene) weisen jeweils für Französisch und Spanisch die größte Prädiktorstärke für die fremdsprachliche Leistung auf ? 6. Inwiefern lassen sich mögliche Unterschiede in der fremdsprachlichen Leistung auf unterschiedliche bzw. unterschiedlich stark ausgeprägte Prä‐ diktoren zurückführen? 7. Welche relative Vorhersagekraft besitzt jede einzelne Variable in der Untersuchung von Geschlechterunterschieden? Am Ende der Beantwortung dieser Forschungsfragen stehen eine Interpretation der erzielten Ergebnisse und ein abschließender Vergleich zwischen den beiden fremdsprachlichen Fächern (vgl. Kapitel 12). Es bleibt also festzuhalten, dass eine Vielzahl von endogenen und exogenen Faktoren Einfluss auf die fremdsprachlichen Leistungen von Jungen und Mäd‐ chen nimmt. Diese Faktoren gilt es möglichst in ihrer gesamten Vielfalt zu erfassen, um anschließend deren relative Prädiktorstärke sowie eventuelle intersektionale Wechselwirkungen bezüglich der fremdsprachlichen Leistung der beiden Merkmalsgruppen präzise aufzuzeigen. 1 Einleitung 25 2 Die Kategorien Geschlecht und Gender aus interdisziplinärer Sicht Seit den 1980er Jahren unterscheidet die sozialwissenschaftliche Geschlechter‐ forschung zwischen Sex und Gender, während Sex das biologische Geschlecht einer Person bezeichnet und Gender als soziale, historische, kulturelle und psy‐ chologische Konstruktion von Geschlecht definiert wird (vgl. Steins 2010a: 13). Auch die Fremdsprachenforschung nimmt, insbesondere seit dem 21.-Jahrhun‐ dert, diese Unterscheidung vor (vgl. Decke-Cornill/ Volkmann 2007b; Schmenk 2016: 254): Pavlenko (2008: 167) definiert Gender beispielsweise als “discursively, culturally, and socially constructed and inseparable from other facets of social identity”. König et al. (2015: 135) weisen ebenfalls deutlich darauf hin, dass Gender als soziales und diskursives Konstrukt auf der kulturellen Opposition von Weiblichkeit und Männlichkeit basiert, und fügen hinzu, dass sich dieses Konstrukt allerdings nicht auf diese Dichotomie begrenzt, sondern Zwischen‐ stufen zulässt. Im Anschluss wird ein kurzer Überblick über die zahlreichen Forschungs‐ felder, in denen die Kategorien Geschlecht und Gender untersucht werden, konturiert, um daraufhin eine klare Eingrenzung bezüglich der Geschlechter‐ forschung im Rahmen der Erforschung des Fremdsprachenunterrichts inklusive einer Bestimmung der für die vorliegende interdisziplinäre Arbeit relevanten Forschungsdisziplinen vorzunehmen. Das theoretische Spannungsfeld zwischen angeborenen Anlagen, welche unter den Begriff Geschlecht subsummiert werden, und von der Umwelt erworbenen Denk- und Handlungsmustern, die unter dem Begriff Gender zusammengefasst werden, wird als nature-nurture-Konflikt bezeichnet. Im Bereich der psychologischen Geschlechterforschung wird dieses theoretische Spannungsfeld besonders ausgeprägt untersucht (vgl. Steins 2010a: 15). Stainton Rogers und Stainton Rogers (2001: 9-82) etablieren ausgehend von diesem Spannungsfeld eine Kategorisierung von drei verschiedenen Paradigmen zur Erforschung der Variablen Geschlecht und Gender: das biologische Geschlecht, das soziale und kulturelle Geschlecht sowie das interaktionistische Paradigma des Geschlechts. Betrachtet man die Erforschung des biologischen Paradigmas sex bzw. Geschlecht, so stehen Geschlechtsunterschiede bezüglich der Anatomie, der Gehirnmorphologie, der Hormone, Chromosomen und der Genetik im Vorder‐ grund. Auch evolutionäre Prozesse, die den Menschen als Spezies betreffen, sind innerhalb dieses Paradigmas von großem Forschungsinteresse (vgl. Stainton Rogers/ Stainton Rogers 2001: 12). Die wissenschaftlichen Disziplinen, die diese Aspekte beforschen, sind vor allem die Biologie, die Sexualforschung, die Neurowissenschaften und die Psychologie, die beispielsweise den Einfluss von weiblichen und männlichen Hormonen auf das jeweilige Verhalten untersucht. Innerhalb der Fremdsprachenlernforschung haben sich Subdisziplinen wie die sogenannte „Neurodidaktik“ (vgl. Böttger 2016) etabliert, welche unter anderem der Frage nachgeht, inwiefern geschlechtsspezifische neuronale Eigenschaften innerhalb des Fremdsprachenunterrichts Berücksichtigung finden sollten. Für das Erlernen von Fremdsprachen und die fremdsprachliche Leistung des Indivi‐ duums während der Adoleszenz relevant seien insbesondere die Gehirnstruktur von weiblichen und männlichen Lernenden, aber auch Geschlechtshormone, welche gewisse Effekte auf das menschliche Erleben und Verhalten hätten (vgl. Böttger/ Sambanis 2017: 11). Laut Stein (2008: 12) sind die Unterschiede zwischen Männern und Frauen, wenn diese nur nach ihrem biologischen Geschlecht differenziert werden, im Gesamten betrachtet erstaunlich gering: sie sind deutlich kleiner als die Gemeinsamkeiten und auch als die Unterschiede innerhalb der Gruppen der Frauen und innerhalb derjenigen der Männer (Steins 2008b: 12). Es zeigt sich also, dass es diesbezüglich unterschiedliche Positionen und unterschiedliche Forschungsergebnisse gibt, weshalb der Stand der For‐ schung bezüglich des Zusammenhangs zwischen biologischem Geschlecht und Fremdsprachenlernerfolg in Kapitel 5.1.2 ausführlicher dargelegt wird. Betrachtet man das soziale und kulturelle Paradigma, also die konstruierte Entität Gender, so steht die genderspezifische Internalisierung von externen Aspekten, wie beispielsweise Normen, Werten und Regeln, nach denen das Indi‐ viduum denkt, handelt und fühlt, im Mittelpunkt (vgl. Stainton Rogers/ Stainton Rogers 2001: 37-38). Diese Internalisierung wird während der Sozialisation durch Familie, Lehrkräfte, Peers und andere relevante Bezugspersonen aus‐ gelöst. Mögliche Untersuchungsgegenstände innerhalb dieser Kategorie sind neben der geschlechtsspezifischen Sozialisation auch geschlechtsspezifische Verhaltensweisen, oft gepaart mit kulturspezifischen Verhaltensweisen, Eigen‐ schaften, Interessen und sozialen Geschlechtsmerkmalen wie beispielsweise Kleidung, Geschlechterrollen und -stereotype als gestaltende und prägende Faktoren von Interaktion und Kommunikation; dies alles kann als Inszenierung von Gender zusammengefasst werden (vgl. Budde 2005: 25). Primär kulturelle Einflussgrößen werden vor allem aus anthropologischer, aber auch aus literatur- und kulturwissenschaftlicher Sicht im Rahmen der Gender Studies untersucht, während soziale und wirtschaftliche Einflussgrößen eher aus psychologischer und sozialwissenschaftlicher Sicht erforscht werden 28 2 Die Kategorien Geschlecht und Gender aus interdisziplinärer Sicht (vgl. Steins 2010a: 14). Die sogenannte Diversityforschung, die neben Gender Studies auch Migrations-, Ungleichheits-, Minderheiten- und Gleichstellungs‐ forschung in sich vereint, ist sowohl in der Betriebswirtschaftslehre als auch in der Soziologie, der Politik- und Rechtswissenschaft sowie in der Erziehungs‐ wissenschaft anzutreffen und untersucht ebenfalls kulturelle, soziale und wirt‐ schaftliche Einflussgrößen (vgl. Krell et al. 2007b: 7). Gesetzlich verankert ist die Nichtdiskriminierung aufgrund verschiedener Dimensionen von Diversität beispielsweise in Artikel 21 der Grundrechtecharta der EU: Diskriminierungen, insbesondere wegen des Geschlechts, der Rasse, der Hautfarbe, der ethnischen oder sozialen Herkunft, der genetischen Merkmale, der Sprache, der Religion oder der Weltanschauung, der politischen oder sonstigen Anschauung, der Zugehörigkeit zu einer nationalen Minderheit, des Vermögens, der Geburt, einer Behinderung des Alters oder der sexuellen Ausrichtung, sind verboten. (Amtsblatt der Europäischen Gemeinschaften 2000: 13) Die psychologischen Prozesse, die durch die Kategorie Geschlecht initiiert werden, sind immer dann Untersuchungsgegenstand, wenn Geschlechtsiden‐ tität (männlich/ weiblich/ transgender/ transsexuell), Geschlechtsrollenidentität, geschlechtsspezifische Erziehung und Sozialisation und damit zusammenhän‐ gend die Internalisierung von Normen und Werten, Beschreibungen und Erklärungen von Emotionen, Beschreibungen der für den Menschen charakte‐ ristischen Beweggründe von Handlungen und schließlich Bedingungen und Wirkungen von Handlungen erforscht werden. In der Psychologie wird bei‐ spielsweise nach Steins (2010a: 16) davon ausgegangen, dass Kinder und Jugend‐ liche sich besonders stark mit Modellen des gleichen Geschlechts identifizieren, somit geschlechtsgleiche Bezugspersonen als Modell betrachten und danach streben, geschlechtsangemessenes Verhalten zu zeigen. Dabei ist es von großer Relevanz, neben den Theorien zum Modelllernen (vgl. Bandura 1986) die Perspektive der Denkschule des sozialen Konstruktivismus zu berücksichtigen, die Geschlechtsidentität als konstruierte Entität auffasst und die Prozesse der sozialen Kategorienbildung präzise erforscht (Steins 2010a: 14). Auch bezüglich des Fremdsprachenlernens, das im weitesten Sinne eine Verhaltensweise dar‐ stellt, wird oftmals die Untersuchung der Kategorie Gender bevorzugt, wie bereits Labov (1991: 206) beschreibt: “[T]here is little reason to think that sex is an appropriate category to explain linguistic behavior.“ Innerhalb der Französisch- und der Spanischdidaktik wird insbesondere verstärkt untersucht, wie der Unterricht unter Gender-Aspekten motivierender gestaltet werden und dadurch das sprachliche Verhalten der Lernerinnen und Lerner positiv 2 Die Kategorien Geschlecht und Gender aus interdisziplinärer Sicht 29 beeinflusst werden kann, was als gendersensibler Unterricht bezeichnet wird (vgl. Braun/ Schwemer 2013: 8). Zum sozialen und kulturellen Paradigma gehört auch der Begriff Doing Gender, welcher von West und Zimmerman (1987) erstmals eingeführt wurde. Der Terminus betont im Rahmen eines sozialisationstheoretischen Ansatzes den bedeutenden Anteil von Inszenierung und Interaktion bei der Produktion von Geschlecht, Männlichkeit und Weiblichkeit. Er impliziert außerdem eine Kritik an der scharfen Trennung zwischen Sex und Gender und berücksichtigt soziale, kulturelle sowie historische Faktoren, die die Definition des biologi‐ schen Geschlechts durchaus beeinflussen. Doing Gender beschreibt daher auch die Verinnerlichung des jeweiligen Verständnisses von Geschlecht vor dem zeit‐ genössischen Hintergrund im Bewusstsein jedes Menschen sowie den Prozess der sozialen Konstruktion von Geschlecht (vgl. Budde 2005: 24; Steins 2010a: 13). Auch die Bildungsforschung und die Fremdsprachendidaktik untersuchen diese Konstruktionsprozesse: Budde (2005: 24-25) geht zum Beispiel davon aus, dass im Fremdsprachenunterricht Doing Gender sowohl innerhalb der geschlechtshomogenen Gruppen als auch zwischen den Geschlechtern bzw. Geschlechtergruppen und in Interaktionen mit den Lehrkräften geschieht. Er beschreibt Schule als Raum, in dem Inszenierungen, individuelle und interakti‐ onale Prozesse „auf Grundlage kollektiver und dichotomer Deutungsmuster“ verlaufen (Budde 2005: 25). Eng verbunden mit der Konstruktion von Gender ist also die Konstruktion von Männlichkeit und Weiblichkeit, welche oft unbewusst Entscheidungen des täglichen Lebens prägend beeinflusst (vgl. Lohaus/ Vier‐ haus 2015b: 207): Ein Beispiel für Doing Gender aus dem schulischen Kontext wäre nach Budde (2005: 20) die bewusste oder unbewusste Konstruktion von Männlichkeit durch die Wahl des Faches Physik und die bewusste oder unbe‐ wusste Konstruktion von Weiblichkeit durch die Wahl des Faches Französisch. Darüber hinaus stellt die stereotype Zuweisung von weiblichen oder männli‐ chen Eigenschaften zu einer Sprache einen Prozess des Doing Gender dar, wobei bezüglich des Französischen im deutschen und angelsächsischen Raum oft eine weibliche Konnotation festgestellt wurde (vgl. Bonin 2009; Carr/ Pauwels 2006; Cohen 2010; Grein 2012: 176; Leupold 2007: 15; Williams et al. 2002; vgl. Kapitel 5.1.3.1.12). Neben dem biologischen und dem sozialen und kulturellen Paradigma gibt es in der Psychologie das interaktionistische Paradigma des Geschlechts. Dieses bewegt sich zwischen Geschlecht und Gender und beruht nach Stainton Rogers und Stainton Rogers (2001: 60) auf der, je nach Perspektive als Zusammenspiel oder Konflikt zu betrachtenden, Wechselwirkung von nature und nurture. Es behandelt die Frage, ob beziehungsweise zu welchem Anteil Geschlechterun‐ 30 2 Die Kategorien Geschlecht und Gender aus interdisziplinärer Sicht terschiede und -gemeinsamkeiten ihren Ursprung in biologischen oder aber sozialen und kulturellen Aspekten haben, sprich inwiefern diese entweder an‐ geboren oder anerzogen sind. Davon ausgehend entstanden in der Psychologie und Sozialwissenschaft mehrere interaktionistische Theorien, die versuchen, sowohl biologische als auch soziale Einflüsse sowie ihre Wechselwirkungen in ein zusammenhängendes theoretisches Beschreibungs- und Erklärungsmodell zu übertragen. Interaktionistische Theorien gehen davon aus, dass bestimmte Fähigkeiten genetisch bedingt sind und deren Ausprägung und Entwicklung dann von der Umwelt beeinflusst werden. Steins (2010a: 17) nennt, basierend auf Stainton Rogers und Stainton Rogers (2003: 66-73) als erste bekannte Beispiele für interaktionistische Theorien Freuds Psychoanalyse (Freud 1925) und Piagets kognitive Entwicklungstheorie (Piaget/ Inhelder 1972). Das interaktionistische Paradigma wirft also die Frage nach der Trennschärfe von Geschlecht und Gender auf, welche einstweilen aus den Reihen der Gender Studies, der Psychologie und der Fremdsprachenforschung als nicht haltbar kritisiert wird (vgl. Fausto-Sterling 2000; Pavlenko 2008; Steins 2010a: 13). Viel‐ mehr beeinflussen soziale, kulturelle und historische Faktoren die Definition des biologischen Geschlechts und umgekehrt. Vor diesem Hintergrund muss fest‐ gehalten werden, dass es die Forschung bisher noch nicht ermöglicht, die jeweils genauen Anteile des biologischen und des sozialen und kulturellen Paradigmas zu bestimmen, auch und gerade weil diese Kategorien nicht trennscharf sind. Aus dem interaktionistischen Ansatz kann also zunächst lediglich abgeleitet werden, dass eine gewisse Art von Interaktion zwischen Geschlecht und Gender durchaus existiert, deren genaue Ausprägung aber oft unergründet bleibt (vgl. Steins 2010a: 18). Bereits nach dieser kurzen Diskussion zu den Definitionen von Geschlecht und Gender steht fest, dass im Kontext der Untersuchung schulischer fremd‐ sprachlicher Leistungen eine Abkehr vom Denken von Geschlecht als rein anthropologischer Konstante in polaren Begrifflichkeiten wie z. B. Mann und Frau, hin zu einer Sichtweise, die Männlichkeit und Weiblichkeit als das Resultat aus zahlreichen sozialen Praktiken betrachtet, notwendig ist (vgl. Wieland/ Horstkemper 2012: 26). Dies wird in der vorliegenden Studie dadurch angestrebt, dass neben den reinen Vergleichen zwischen den fremdsprachlichen Leistungen und Ausprägungen affektiver Faktoren von Jungen und Mädchen auch Variablen wie das Doing Gender durch wahrgenommene Erwartungshal‐ tungen von Eltern, Lehrkräften und Peers oder auch die wahrgenommene ge‐ nderspezifische Aufmerksamkeitsverteilung der Lehrkräfte und schließlich die genderstereotyp weibliche Wahrnehmung des Französischen bzw. Spanischen Teil der Untersuchungsgegenstände sind (vgl. Kapitel 9.3.4.8, 9.3.5.1 bis 9.3.5.5). 2 Die Kategorien Geschlecht und Gender aus interdisziplinärer Sicht 31 3 Intersektionale Geschlechterforschung im Kontext des Fremdsprachenunterrichts Der interaktionistische Forschungsansatz der Psychologie hat, wie in Kapitel 2 erläutert, zum Ziel, Aufklärung über den Anteil von biologischen Faktoren einerseits und sozialen sowie kulturellen Faktoren andererseits bezüglich ver‐ schiedener Fähigkeiten, Einstellungen oder Werte von Männern und Frauen, zu leisten (vgl. Steins 2010a: 18). Im Falle der Erforschung der Kategorien Geschlecht und Gender vor dem Hintergrund der fremdsprachlichen Leistung von Jungen und Mädchen der 9. Jahrgangsstufe in Französisch und Spanisch würde dies beispielsweise bedeuten, den genauen Anteil von nature und nurture bei Jungen und Mädchen bezüglich eines möglichen Geschlechterunterschieds bestimmen zu wollen. Jedoch weist Steins (2010a: 18) auf ein zentrales Problem hin: „Interaktionistische Paradigmen machen den Blick auf einen Forschungs‐ gegenstand insgesamt komplexer. Häufig sind die Daten jedoch so kompliziert, dass sie das Bedürfnis nach Klarheit nicht befriedigen können.“ Abgesehen davon kritisieren Gottburgsen und Gross (2012: 87), dass dem Einfluss des sozialen Kontexts bei der Erforschung von Bildungsungleichheiten insgesamt in der Regel zu wenig Aufmerksamkeit beigemessen wird. Driessen und Van Langen (2013: 71) führen in diesem Kontext an, dass biologische und neurolo‐ gische Faktoren nicht erklären, weshalb sprachliche Leistungen von Jungen und Mädchen im Laufe der Geschichte und in unterschiedlichen Ländern ständig und teilweise stark variieren und dass die interaktionistische Erforschung des jeweiligen Anteils von nature und nurture hierauf keine Antworten liefert. Aus den oben genannten Gründen wird in der vorliegenden Studie kein interaktionistischer, sondern ein intersektionaler Forschungsansatz gewählt, welcher ursprünglich aus der soziologischen Bildungsforschung stammt und mittlerweile Einzug in die Fremdsprachenlernforschung gehalten hat (vgl. Grein 2012; Steinlen 2019). Diese Forschungsperspektive erlaubt es, die Komplexität der Abhängigkeitsverhältnisse der Faktoren, die zu möglichen Bildungsvor‐ teilen und -ungleichheiten führen, zu erfassen (vgl. Bührmann 2009). Geschlecht und Gender werden im intersektionalen Forschungsansatz als in‐ terdependente und intersektionale Kategorien betrachtet, die in wechselseitiger Abhängigkeit von weiteren, inneren und äußeren Faktoren stehen und nicht isoliert erforscht werden können (vgl. Riemer 2002, 2006). Intersektionalität bezeichnet in der Soziologie das Ineinanderwirken verschiedener Ungleichheits‐ strukturen oder -kategorien: We regard the concept of ‘intersectionality’ as signifying the complex, irreducible, varied, and variable effects which ensue when multiple axis of differentiation - eco‐ nomic, political, cultural, psychic, subjective and experiential - intersect in historically specific contexts. The concept emphasizes that different dimensions of social life cannot be separated out into discrete and pure stands. (Brah/ Phoenix 2004: 76) Laut dem Intersektionalitätsansatz gibt es verschiedene Ungleichheitsachsen. Darunter fallen bezüglich der Erforschung von Bildungsungleichheiten bei Jugendlichen innerhalb der Institution Schule insbesondere Gender, Migrati‐ onsstatus und soziale Herkunft. Zum einen werden in der Intersektionalitäts‐ forschung multiple Gruppenzugehörigkeiten zu diesen drei Kategorien unter‐ sucht, was als Multidimensionalität bezeichnet wird, und zum anderen die Wechselwirkungen der Gruppenzugehörigkeiten, welche als Intersektionalität determiniert werden (Gottburgsen/ Gross 2012: 87). Schließlich wird explizit beschrieben, dass die drei genannten Kategorien je nach sozialem Kontext anders wirken können, was durch den Terminus Kontextualität ausgedrückt wird. Mit anderen Worten bedeutet dies, dass in unterschiedlichen sozialen Kontexten außerhalb der Schule, zum Beispiel auf dem Arbeitsmarkt oder inner‐ halb von Familienstrukturen dieselben Merkmale (also Gender, soziale Herkunft und Migrationsstatus) relevant sind, jedoch in völlig in anderer Weise wirken können. Es bedeutet aber auch, dass eventuell in unterschiedlichen Kontexten weitere Intersektionalitätsachsen, die über Gender, Migrationsstatus und soziale Herkunft hinausgehen, betrachtet werden müssen (vgl. Gottburgsen/ Gross 2012: 89). Folglich zeigt dieses Verständnis von Kontextualität der Intersektio‐ nalitätsforschung erneut deutlich, weshalb es wenig zielführend ist, Studien lediglich auf biologische und neurowissenschaftliche Voraussetzungen von Jungen und Mädchen im Zusammenhang mit ihrer fremdsprachlichen Leis‐ tung zu untersuchen, da der soziale Kontext einen sehr starken Einfluss zu nehmen scheint. Auch Schmenk (2002: 26) bestätigt dies in ihrer Metaanalyse, welche Anfang der 2000er-Jahre den Startpunkt für eine vertiefte, kritische und mehrperspektivische Auseinandersetzung mit den Variablen Geschlecht und Gender innerhalb der Fremdsprachenlehr-/ lernforschung darstellt: „Die ‚Sozialisationsthese‘ stellt einen machtvollen theoretischen Überbau dar, der Äußerungen zum Geschlecht als vorübergehend, nicht endgültig fixiert lesbar macht.“ Dadurch wird die isolierte Betrachtung des Faktors Geschlecht inner‐ halb der Fremdsprachenforschung als nicht zielführend erklärt und vielmehr eine Forschungsweise gefordert, die mehrere Perspektiven und Lernervariablen berücksichtigt. Schließlich muss bezüglich der Kontextualität im Sinne der Intersektiona‐ litätsforschung festgehalten werden, dass diese im Setting der vorliegenden 34 3 Intersektionale Geschlechterforschung im Kontext des Fremdsprachenunterrichts Studie nicht ausschließlich an der Institution „Schule“ festgemacht werden kann, sondern spezifische Gruppenzugehörigkeiten je nach Bundesland und Schulart unterschiedliche Auswirkungen auf Bildungsprozesse haben können (vgl. Gottburgsen/ Gross 2012: 89). Daher wird in Kapitel 8 die zu untersuchende Grundgesamtheit präzise beschrieben und im Verlauf der Auswertung und Interpretation der Ergebnisse erneut darauf Bezug genommen. Ein weiteres Argument für die Verwendung der Intersektionalität als Grundkonzept für die Forschungsmethodik ist, dass diese per se einen interdisziplinären Charakter besitzt, da sie zum einen offen genug ist, um verschiedene Sichtweisen aus unterschiedlichen Forschungsdisziplinen bei Bedarf zu integrieren und ande‐ rerseits einen ausreichend konkreten Rahmen spannt, damit die Integration dieser Perspektiven durch die Anwendung des Forschungsparadigmas der Intersektionalität erfolgen kann (vgl. Bührmann 2009: 37; Uhl 2019: 209). Eine Herausforderung stellt aber dennoch die Tatsache dar, dass das Forschungspara‐ digma der Intersektionalität, insbesondere in der erziehungswissenschaftlichen und soziologischen Bildungsforschung und in fachdidaktischen Studien, vor‐ wiegend in der qualitativen Forschung eingesetzt wird (vgl. z. B. Grein 2015). Gottburgsen und Gross (2012: 87-95) zeigen allerdings anhand des Datensatzes der PISA-Studie von 2006 (vgl. Prenzel et al. 2008) Möglichkeiten auf, wie dies auch in quantitativer Forschung mittels Mehrebenenanalysen gelingt. Im Sinne des Intersektionalitätsparadigmas gilt es daher zunächst, die Kon‐ textfaktoren und entsprechend die relevanten Forschungsdisziplinen zu ermit‐ teln, die für die fremdsprachliche Leistung im Französischen und Spanischen von Jungen und Mädchen im Alter von ca. 15 Jahren besonders relevant sind. Außerdem zeigen die oben genannten Definitionen von Geschlecht und Gender (vgl. Kapitel 2), dass in der aktuellen Geschlechterforschung im Rahmen der Fremdsprachenforschung der reine Vergleich von fremdsprachlichen Leis‐ tungen von männlichen und weiblichen Probanden nur ein erster Schritt, aber noch keine umfassende Analyse darstellt. Zugunsten von sogenannten diversity frameworks müssen also Forschungsfragen wie „Wie unterscheiden sich Mäd‐ chen und Jungen in Y? “ durch Fragen wie „Wer bzw. welche Geschlechtergruppe wird von Z mehr beeinflusst? “ erweitert werden, um so dem intersektionalen Ansatz Rechnung zu tragen. Dies wird entsprechend in der aktuellen Studie berücksichtigt, in der neben der Erforschung vielfältiger Geschlechterunter‐ schiede auch die vielschichtige Erfassung von Prädiktoren bzw. Einflussfaktoren im Zentrum steht (vgl. Kapitel 11.6, 11.8 bis 11.11). 3 Intersektionale Geschlechterforschung im Kontext des Fremdsprachenunterrichts 35 4 Stand der Forschung: Geschlecht und fremdsprachliche Leistungen 4.1 Fremdsprachliche Leistung als komplexer Forschungsgegenstand Um Forschungsergebnisse zum Themenkomplex Geschlecht, Gender und fremd‐ sprachliche Leistung einordnen zu können, stellt sich neben der Frage nach der Definition von Geschlecht und Gender, die bereits in Kapitel 2 beantwortet wurde, auch immer die Frage nach der Definition von fremdsprachlicher Leistung. Fremdsprachliche Leistung wird in der Forschungsliteratur meist als Ergebnis der Bearbeitung bestimmter Aufgaben im Rahmen von Leistungs‐ ermittlungen und Leistungsbewertungen definiert (vgl. z. B. Schröder 2017: 210). Sie wird innerhalb der von Chomsky (1969, 2001) initiierten Kompetenz- Performanz-Debatte, die bis heute kontrovers diskutiert wird, im Bereich der Performanz, also der konkreten Ausführung und Anwendung des fremdsprach‐ lichen Wissens verortet (vgl. Chudaske 2012: 38; Jude 2008: 13). Die konkrete Ausführung fremdsprachlichen Wissens bedeutet gleichzeitig eine Bedingtheit durch situative und personale Einflüsse (vgl. Klieme/ Hartig 2007: 16), die es bei der Interpretation der Ergebnisse fremdsprachlicher Leistungsermittlungen zu berücksichtigen gilt. Caplan et al. (1997: 72-74) behaupten sogar, dass aufgrund der Unklarheit, was man genau unter ‚verbaler Fähigkeit‘ verstehe und wie diese zu messen sei, eine weibliche oder männliche Überlegenheit gar nicht messbar sein könnten. Schmenk (2002: 35), die wie bereits erwähnt in ihrer Metaanalyse eine kritische Aufarbeitung aller relevanter Studien zum Thema Geschlecht und fremdsprachliche Leistung des 20. Jahrhunderts betrieb, fand heraus, dass vor Burstall (1970, 1975; Burstall et al. 1974) niemand versucht hatte fremdsprachli‐ chen Lernerfolg systematisch, etwa nach den vier Fertigkeiten Lesen, Schreiben, Hören und Sprechen zu klassifizieren und entsprechende unterschiedliche Messungen von Mädchen und Jungen vorzunehmen, sodass Forschende oft von generell besseren fremdsprachlichen Leistungen sprachen ohne zu differen‐ zieren, was im jeweils spezifischen Fall wie gemessen wurde (vgl. Schmenk 2002: 35). Schmenk (2002: 35) fand außerdem heraus, dass die Praxis des undifferen‐ zierten Umgangs mit der fremdsprachlichen Leistung der Geschlechtergruppen in den 90er Jahren stark abnahm und eine immer präzisere Dokumentation der Erhebungsinstrumente, der Testgegenstände und der Auswertungsprozesse stattfand. Daher wird auch in der vorliegenden Studie viel Wert darauf gelegt, Untersuchungsgegenstände, Testmaterialien und Auswertungsverfahren prä‐ zise zu definieren und transparent zu dokumentieren (vgl. Kapitel 9.2 bis 11). In der folgenden Analyse des Stands der Forschung wird zudem die in den einzelnen Studien verwendete Definition von fremdsprachlicher Leistung stets kritisch hinterfragt. Im Zentrum stehen insbesondere Studien, die den For‐ schungsgegenstand der fremdsprachlichen Leistung möglichst klar definieren und sich durch einen hohen Grad an Objektivität, Validität und Reliabilität (vgl. Kapitel 9.2) bei der Leistungsmessung auszeichnen. Studien, bei denen beispielsweise die Schulnoten in den Fremdsprachen zur Ermittlung von mög‐ lichen Leistungsunterschieden zwischen Mädchen und Jungen dienten, werden entsprechend weniger berücksichtigt und lediglich kurz erwähnt, da Schulnoten nicht im selben Maße objektiv, valide und reliabel sind wie standardisierte empirische Leistungstests (vgl. Kapitel 4.1). Hertel (1994) zeigte das geringe Maß an Aussagekraft von Schulnoten in ihrem Forschungsergebnis konkret auf: Sie führte eine Studie zu fremdsprach‐ licher Leistung und Geschlecht mit 950 Schülerinnen und Schülern durch, bei der einerseits die Schulnote erfragt und andererseits das Ergebnis des Bun‐ deswettbewerbs Fremdsprachen berücksichtigt wurde. Während die Mädchen zwar zahlenmäßig überlegen waren und bessere Noten in den Fremdsprachen angaben, erzielten die Jungen jedoch bessere Leistungen im Bundeswettbewerb Fremdsprachen. Dass Noten die Leistung nur bedingt widerspiegeln, belegten später auch Anders et al. (2010: 323-324) empirisch und kamen zu dem Ergebnis, dass Lehrkräfte bei der Übergangsempfehlung und auch bei der Notengebung Aspekte wie bestimmte Persönlichkeitseigenschaften und Verhaltensweisen berücksichtigten: Insbesondere bei Kriterien wie Sozialverhalten, Motivation und Lerntugenden wurden Mädchen positiver eingeschätzt als Jungen, was sich auf die Notengebung auswirkte. 4.2 Geschlecht und fremdsprachliche Leistung Innerhalb der Forschung zeigten sich bisher hinsichtlich des Lernerfolgs beim Erlernen von Fremdsprachen und dessen Zusammenhang zur Variable Ge‐ schlecht uneinheitliche Ergebnisse, die je nach Epoche, Land, Zielsprache und Forschungsansatz unterschiedlich ausfielen. Dabei können Studien gefunden werden, die eine weibliche Überlegenheit attestieren (vgl. Burstall et al. 1974; Köller et al. 2010; Nisbet/ Welsh 1972; Nyikos 1990; Randwaha/ Korpan 1973; 38 4 Stand der Forschung: Geschlecht und fremdsprachliche Leistungen Schröder/ Macht 1983), Studien, die zum Ergebnis einer männlichen Überle‐ genheit kommen (vgl. Bügel/ Buunk 1996; Carrell/ Wise 1998; Cross 1983; Scar‐ cella/ Zimmerman 1998) und Studien, die keinerlei Geschlechtsunterschiede nachweisen konnten (vgl. Bacon 1992; Berga/ Newell 1967; Farhady 1982; Hyde/ McKinley 1997; Walker/ Perry 1978). In neuerer Zeit sind auch einige Studien publiziert worden, bei denen die Er‐ gebnisse von Jungen und Mädchen je nach Fertigkeit unterschiedlich ausfallen, indem teilweise die Jungen, teilweise die Mädchen Vorteile zeigen und teilweise vergleichbare Ergebnisse erzielt werden (vgl. DESI-Konsortium 2006, 2008). Da sich die Erforschung der Variable Geschlecht bezüglich des Fremdsprachenler‐ nerfolgs im Laufe des 20. und im beginnenden 21. Jahrhunderts stark gewandelt hat und die Metastudie von Schmenk (2002) im deutschsprachigen Raum eine wichtige Zäsur in diesem Forschungsbereich darstellte, werden im Folgenden zunächst Studien aus dem 20. Jahrhundert aufgearbeitet, bevor Studien des 21.-Jahrhunderts genauer in den Blick genommen werden. In den 50er Jahren kam ein verstärktes Interesse an biologischen, psycholo‐ gischen und soziologischen Ausprägungen von Geschlechterunterschieden auf (vgl. für eine Übersicht Fuchs 2013: 45), jedoch wurde eher weniger Wert auf die Erforschung der Variable Geschlecht im Hinblick auf den Fremdsprachen‐ lernerfolg gelegt, auch weil eine weibliche Überlegenheit als per se gegeben betrachtet wurde (vgl. Überblick bei Boyle 1987: 273). In den 80er und 90er Jahren erfolgte dann erstmals eine intensive Auseinandersetzung mit einem möglichen Zusammenhang zwischen Geschlecht und Fremdsprachenlernen (vgl. Schmenk 2002: 33). Dabei untermauerten zahlreiche Studien die Annahme der Überlegenheit des weiblichen Geschlechts beim Fremdsprachenlernen (vgl. z.B Burstall et al. 1974; Nisbet/ Welsh 1972; Nyikos 1990; Randhawa/ Korpan 1973; Schröder/ Macht 1983). Bezüglich des Französischen als Fremdsprache war die Vorstellung der weiblichen Überlegenheit fast noch deutlicher aus‐ geprägt als bei anderen modernen Fremdsprachen wie beispielsweise dem Englischen: „Die Beobachtung, dass Mädchen Jungen im Französischunterricht weit hinter sich lassen, durchzieht das gesamte 20. Jahrhundert“ (Bonin 2009: 19). Oftmals wurden lediglich Vermutungen zu der Ursache der weiblichen Überlegenheit aufgestellt: Dabei wurden Mädchen und Frauen Eigenschaften zugeschrieben, die dem Fremdsprachenlernen besonders zuträglich zu sein schienen: Anpassungsbereitschaft, Bereitschaft zu kontinuierlichem Lernen, empathische Fähigkeiten, Intuition, Selbstdisziplin (vgl. Kahlke 1996: 19-21), eine Offenheit für neue sprachliche Formen und ein schnelleres Korrigieren fehlerhafter Phänomene der Interlanguage (vgl. Ellis 1994: 202), ein wenig spe‐ zifisches Notenkalkül, eine eher unspezifische Berufsplanung und ein erhöhtes 4.2 Geschlecht und fremdsprachliche Leistung 39 Interesse an literarischen Texten bei gleichzeitig „spezifische[r] Begabung“ für Fremdsprachen (vgl. Christ 1996: 23-24) waren nur einige der Attribute, die in diesem Zusammenhang genannt wurden. Ellis (1994: 202) kam zu folgendem pauschalisierendem Schluss: “Female learners generally do better than male“. Jungen und Männer wären hingegen eher an theoretischen und systemati‐ schen Betrachtungen interessiert und weniger an praktischer Umsetzung der nicht immer systematisch funktionierenden Fremdsprachen; außerdem seien sie weniger willig als weibliche Lernerinnen, die Aussprache einer Fremdsprache zu erlernen (vgl. Kahlke 1996: 21), wählten eine Fremdsprache aufgrund des praktischen Nutzens für das spätere Berufsleben und interessierten sich eher für Politik und Geschichte (vgl. Christ 1996: 23). Schmenk (2002: 26) kritisierte daran, dass lediglich stereotype Attribute zugewiesen wurden, wobei ein Wi‐ derspruch vorläge, da die vermeintlich als männliche Dominanz und weibliche Unterordnung lesbaren Eigenschaften im Falle des Fremdsprachenlernens eine Überlegenheit der Mädchen und Frauen zur Folge hätten. Der aktuelle Stand der Forschung zu den möglichen Gründen für Geschlechterunterschiede in der fremdsprachlichen Leistung wird daher in der vorliegenden Arbeit in Kapitel 5 vertieft analysiert. In den 90er Jahren etablierte sich auch aufgrund der Annahme der weiblichen Dominanz beim Fremdsprachenlernen in vielen Ländern Europas der Begriff des „Jungenproblems“ oder des Gendergap (vgl. für eine Übersicht Driessen/ Van Langen 2013: 70). Dies zog auch die politische und mediale Aufmerksamkeit auf das Thema (vgl. Smith 2003). Driessen und Van Langen (2013: 70) bemerken in dieser Diskussion zum Gendergap das Problem, dass oft eine empirische Dis‐ kussionsgrundlage fehlte, da zum einen die fraglose Akzeptanz der weiblichen Überlegenheit die Studien bis in die 1990er Jahre stark prägte. Zum anderen fußte die Debatte um den Gendergap auf einer recht kleinen Anzahl an nur teilweise empirisch basierten Studien (vgl. Schmenk 2016: 254). Aufgrund der damaligen Debatte besteht bis in die Aktualität das Risiko, Geschlechterunterschiede überzubewerten oder ungerechtfertigte Verallgemei‐ nerungen zu wagen. Außerdem stellt sich die Frage, inwiefern so etwas wie ein Gendergap im Zusammenhang mit Fremdsprachenlernen tatsächlich existierte bzw. im 21. Jahrhundert immer noch existiert. Gillborn und Mirza (2000) gehen beispielsweise davon aus, dass der Gendergap stetig größer wird, während Gorard et al. (1999) diese Meinung nicht teilen und vielmehr die grundsätzliche Frage aufwerfen, ob Mädchen in den 70er und 80er Jahren tatsächlich bessere fremdsprachliche Kompetenzen aufwiesen als Jungen. Insgesamt lässt sich bei den Studien zu fremdsprachlicher Leistung und Geschlecht Mitte und Ende des 20. Jahrhunderts eine Tendenz dahingehend erkennen, dass eine weibliche 40 4 Stand der Forschung: Geschlecht und fremdsprachliche Leistungen Überlegenheit als „normal“ und erwartungserfüllend aufgefasst wurde, wäh‐ rend eine männliche (fremd)sprachliche Überlegenheit stets hinterfragt wurde (vgl. Schmenk 2002: 11, 23). Die Debatte um die vermeintliche weibliche Überlegenheit und den Gen‐ dergap lenkte jedoch ein Stück weit davon ab, dass bereits im Laufe des 20. Jahr‐ hunderts uneinheitliche Ergebnisse erzielt wurden, wobei zahlreiche Studien gar keine Geschlechterunterschiede oder aber eine männliche Überlegenheit in der fremdsprachlichen Leistung attestierten. Nachfolgend werden daher einige zentrale Forschungsergebnisse in zusammenfassender Form dargelegt, welche alle Arten von Forschungsergebnissen berücksichtigen (vgl. für einen ausführlichen Überblick auch Schmenk 2002). Studien, die die weibliche Überlegenheit untermauerten, waren beispiels‐ weise diejenige von Nisbet und Welsh (1972) mit 1 947 schottischen Proban‐ dinnen und Probanden im letzten Jahr der Primary School (P7) und im ersten Jahr der Sekundarstufe (S1), d. h. im Alter von 12 und 13 Jahren, die signifikante Vorteile von weiblichen Französischlernerinnen bei mündlichen Sprachtests fanden (vgl. Nisbet/ Welsh 1972: 171, 173). Randhawa und Korpan (1973) kamen zu dem Ergebnis, das bei einem Sample von 100 Französischlernenden im englischsprachigen Teil Kanadas die weiblichen Probandinnen der 7. und 8. Klasse in der fremdsprachlichen Leistung besser abschnitten und begründeten dies ebenfalls mit einer erhöhten Motivation, welche sich in den Regressions‐ analysen als stärkster Prädiktor für die Französischleistung erwies (vgl. auch Schmenk 2002: 34). Nyikos (1990) fand unter 118 Studierenden in den USA schließlich signifikant höhere Abschlussnoten in Deutsch bei weiblichen Lern‐ erinnen, wobei Noten wie gesagt nur bedingt die fremdsprachliche Leistung widerspiegeln (vgl. Kapitel 4.1). Schmenk (2002: 33) fasst zusammen, dass sich all diese Studien durch fehlende konsistente Begründungen für die Überlegenheit der weiblichen Lernenden kennzeichnen und mögliche Hintergründe ihrer Entstehung nicht einmal an‐ satzweise aufgearbeitet wurden, sondern dass Geschlecht vielmehr als Kon‐ stante aufgefasst wurde, eine Tatsache, die sich erst mit der einschlägigen Studie von Burstall et al. (1974) änderte: Dabei handelte es sich um eine sehr umfangreiche Längsschnittstudie, die die weibliche Überlegenheit im Französi‐ schen ebenfalls untermauerte: Die Forschenden erhoben zwischen 1964 und 1974 im Rahmen eines Pilotprojekts der National Foundation for Educational Research (NFER) Daten zum Französischunterricht an britischen Schulen auf der Primar- und Sekundarstufe von über 18 000 Lernenden im Alter von 8 bis 16 Jahren hinsichtlich ihrer Leistungen, Einstellungen und Motivation im Fach Französisch. Wenngleich das primäre Ziel vielmehr darin lag, die 4.2 Geschlecht und fremdsprachliche Leistung 41 Wirkung des frühen Fremdsprachenunterrichts zu ergründen und weniger darin, den Faktor Geschlecht zu erforschen, wurden diesbezügliche Ergebnisse im Nachhinein berichtet: Dabei bestätigte sich durchgängig eine weibliche Überlegenheit bei den Französischkenntnissen: “Sex differences in achievement favouring the girls were evident on the first occasion of testing and persisted throughout the period of the experiment, showing no sign of diminution when the pupils entered the adolescent period.“ (Burstall 1975: 11). Burstall et al. (1974) führten Korrelationsanalysen der Variable Geschlecht mit verschiedenen Hintergrundvariablen durch (Schultyp, sozioökonomischer Hintergrund, Lage und Größe der Schule) und versuchten dadurch mögliche Zusammenhänge zu berechnen. Dabei kamen sie zu dem Ergebnis, dass eine starke Abhängigkeit des Geschlechts von der sozioökonomischen Herkunft gegeben war, da Geschlech‐ terunterschiede zugunsten der Mädchen vor allem innerhalb der Probandinnen und Probanden mit niedrigem sozioökonomischem Status auftraten (vgl. Bur‐ stall 1975: 11). Auch kulturelle Bedingungen, d. h. beispielsweise der Grad der kollektiven stereotypen Wahrnehmung des Lesens als spezifisch weibliche Fertigkeit, haben laut Burstall et al. (1974: 30) entsprechende Auswirkungen auf die fremdsprachliche Leistung. Sie sahen daher das gute Abschneiden von weiblichen Lernerinnen als Symptom eines gesellschaftlich determinierten Rollenverständnisses von Mädchen, bei denen gute Leistungen in fremdsprach‐ lichen Fächern durch die Gesellschaft eher vorgesehen bzw. gewünscht waren als bei Jungen. Die Ursachenforschung bezüglich der Interaktion von Geschlecht und affektiven sowie sozialen Faktoren, die von Burstall et al. (1974) besonders in den Blick genommen wurde, wird daher in Kapitel 5.1.3.1.6 noch einmal genauer bezüglich der möglichen Erklärungsansätze von Geschlechterunterschieden analysiert. Mit den späteren Ergebnissen der vorliegenden Studie werden daher ebenfalls Korrelations- und Regressionsanalysen durchgeführt um komplexere Zusammenhänge darzustellen (vgl. Kapitel 11.8 bis 11.10). Außerdem wird in der vorliegenden Studie eine mögliche Interaktion zwischen Geschlecht und sozioökonomischem Status mithilfe von zweifaktoriellen Varianzanalysen geprüft (vgl. Kapitel 11.6). Um zunächst aber noch einmal auf die Rezeption der Studie von Burstall et al. (1974) zurückzukommen, sei ergänzt, dass Ekstrand (1980) daran kritisierte, dass sich statistische Signifikanz bei so hohen Probandenzahlen trotz geringer Unterschiede rechnerisch schnell ergäbe, dies also noch kein Beleg für weibliche Überlegenheit sei, und die Studie von Burstall et al. (1974) ferner eine mangelnde Kontrolle durch fehlende Kovarianzanalyse aufwiese; darüber hinaus warf er Burstall et al. (1974) vor, die Variable Geschlecht nicht in Form von Intelli‐ genztests oder Tests zu allgemeinen sprachlichen Fähigkeiten kontrolliert zu 42 4 Stand der Forschung: Geschlecht und fremdsprachliche Leistungen haben. Aufgrund dieser berechtigten Kritik werden in der vorliegenden Arbeit zum einen der Aspekt der kognitiven Fertigkeiten in Kapitel 5.1.2 theoretisch aufgearbeitet und zum anderen Tests zu den kognitiven Grundfertigkeiten ergänzend zu den Sprachstandserhebungen durchgeführt (vgl. Kapitel 9 und 11.3). Obwohl die stereotype Annahme der weiblichen Überlegenheit beim Fremd‐ sprachenlernen stark verbreitet war, gab es also auch Stimmen aus der Forschung der 1960er und 1970er Jahre, die generalisierende Aussagen wie diejenige einer allgemeinen weiblichen Überlegenheit für verfrüht und ohne ausreichende Evidenz kritisierten (vgl. Carrol 1963: 1091; Ekstrand 1980). Au‐ ßerdem wurde kritisiert, dass das Geschlecht vor allem als Konstante betrachtet wurde, deren Bezug zur fremdsprachlichen Leistung, aber auch zu affektiven Variablen wie Motivation oder Interessen, nicht ausreichend erforscht wurde (vgl. Ekstrand 1980; für Überblicksdarstellungen vgl. Fuchs 2013: 45; Schmenk 2002: 33), weshalb die affektiven Faktoren in der vorliegenden Arbeit in Kapitel 5.1.3 verstärkt in den Fokus gerückt werden. Was das Stereotyp der weiblichen Überlegenheit neben der Vielzahl an Studien, die diese augenscheinlich belegten, befeuerte, war außerdem das sogenannte file drawer Problem, was beschreibt, dass Befunde ohne statistisch signifikante Unterschiede oftmals unveröffentlicht blieben (vgl. z. B. Richardson 1997: 9; Schmenk 2002: 32). Dennoch liegen einige Studien aus dem 20. Jahrhun‐ dert vor, bei denen keinerlei Geschlechterunterschiede in der fremdsprachlichen Leistung dokumentiert wurden, allerdings vorwiegend erwachsene Lernende als Zielgruppe haben: Beispielsweise fanden Brega und Newell (1967: 409) bei US-amerikanischen Schülerinnen und Schülern der High School keinerlei geschlechtsspezifische Unterschiede in der fremdsprachlichen Leistung in Fran‐ zösisch. Walker und Perry (1978) fanden in Kanada bei rund 400 französisch‐ sprachigen erwachsenen Lernenden im Alter zwischen 18 und 22 ebenfalls keinerlei geschlechtsspezifische Unterschiede in der fremdsprachlichen Leis‐ tung in Englisch. Farhady (1982) stellte bei Tests für Englisch als Zweitsprache an einer US-amerikanischen Universität keinerlei Geschlechterunterschiede fest. Bacon (1992) fand schließlich bei 50 US-amerikanischen Studierenden des zweiten Semesters keine geschlechtsspezifischen Leistungsunterschiede bei Hörverstehenstests im Spanischen. Cross (1983), Boyle (1987), Bügel und Buunk (1996) Scarella und Zimmerman (1998) sowie Carrell und Wise (1998) wiesen wiederum eine männliche Überle‐ genheit vorwiegend in den Bereichen des Hörverstehens, des Leseverstehen und des Wortschatzes nach: 4.2 Geschlecht und fremdsprachliche Leistung 43 Cross (1983) untersuchte zahlreiche sprachliche Fertigkeiten von 59 vier‐ zehnjährigen Französischlernerinnen und -lernern in Großbritannien und kam zu dem Ergebnis, dass in der Versuchsgruppe, die eine männliche Lehrkraft hatte, die Jungen im Leseverstehen (survival reading und extensive reading), im Hörverstehen, im C-Test und in der Flüssigkeit beim mündlichen Sprachtest signifikant bessere Ergebnisse erzielten als die Mädchen. Durch die Vergleichs‐ gruppe, in der eine weibliche Lehrkraft unterrichtete, wurden allerdings alle signifikanten Unterschiede wieder ausgeglichen, wodurch am Ende keinerlei Geschlechterunterschiede vorlagen. Daher ging Cross (1983: 162) davon aus, dass die Lehrkraft, deren Geschlecht, Alter und Unterrichtsstil mehr Einfluss auf die fremdsprachlichen Leistungen der jeweiligen Geschlechtergruppe hat als das Geschlecht der Lernenden an sich (vgl. hierzu auch Kapitel 5.2.3). Boyle (1987: 274) untersuchte neben einer ganzen Reihe anderer fremdsprach‐ licher Fertigkeiten das Hörverstehen einzelner Lexeme (listenting vocabulary) von 490 Studierenden aus Hong Kong im Englischen. Dabei ging es zum einen darum, gehörte Wörter Bildern zuzuordnen und zum anderen, gehörte Wörter den chinesischen Äquivalenten zuzuweisen. In beiden Subtests konnten deutliche Vorteile zugunsten der männlichen Lernenden gefunden werden. Bügel und Buunk (1996) fanden in den Niederlanden in der Sekundarstufe bei 2 980 Lernenden des Englischen im Leseverstehen bessere Leistungen bei den Jungen als bei den Mädchen. Aus ihrer Rahmenuntersuchung bezüg‐ lich geschlechtsspezifischer Interessen und geschlechtsspezifischen Vorwissens schlussfolgerten sie deshalb, dass Jungen insgesamt über eine größere Erfah‐ rung mit komplexeren informativen Texten verfügen würden. Bügel und Buunk (1996: 26) begründeten die bessere Leistung im Leseverstehen durch die größere Erfahrung von Jungen mit komplexeren sprachlichen Strukturen und mit spezialisiertem Vokabular, welche sie beim gelegentlichen Lesen von Fachzeitschriften, in denen eine größere sprachliche Komplexität auftreten würde, erworben hätten. Im Gegensatz dazu würden Mädchen bei ihrer zwar umfangreicheren Lektüre verschiedener, aber eher im literarischen Bereich zu verortenden, Textsorten lediglich mit einfachen Strukturen und Vokabular konfrontiert (vgl. auch Kapitel 5.1.3.1.9). Schmenk (2002: 100) kritisierte die Studie dahingehend, dass sie die Argumentationslinie von Bügel und Buunk (1996) als nicht ausreichend bewertete, da die Textsorte und das Thema nicht ausschlaggebend für den Komplexitätsgrad der sprachlichen Strukturen der Texte seien. Die Begründung männlicher Superiorität sei somit an stereotype Alltagsvorstellungen geknüpft und die Ergebnisse dieser Studie wären daher wenig aussagekräftig (vgl. Schmenk 2002: 101). Außerdem stellt sich die Frage, ob eine weniger bzw. nicht auf Stereotypen beruhende Studie Anfang des 44 4 Stand der Forschung: Geschlecht und fremdsprachliche Leistungen 2 Insgesamt nahmen 192 Probandinnen und Probanden teil. Die weiblichen Proban‐ dinnen waren bei ihrer Ankunft in den USA im Durchschnitt 11.28 Jahre alt und seit durchschnittlich 7.33 Jahren in den USA und die männlichen Probanden waren bei ihrer Ankunft durchschnittlich 11.31 Jahre alt und lebten seit 7.91 Jahren in den USA (vgl. Scarcella/ Zimmerman 1998: 35). 21. Jahrhunderts vor dem Hintergrund des zu beobachtenden veränderten Le‐ severhaltens im Zeitalter digitaler Medien nicht zu völlig anderen Ergebnissen kommen würde. Scarcella/ Zimmerman (1998) wiesen außerdem eine signifikante Überlegen‐ heit der männlichen Studienanfänger unterschiedlicher Fächer der Univer‐ sität California im Englischen als Zweitsprache 2 bezüglich der Verwendung von wissenschaftlichen, disziplinübergreifenden Termini wie beispielsweise to assert, research oder conclusion mittels des Tests of Academic Lexicon (TAL) nach. Die wissenschaftlichen, disziplinübergreifenden Termini wurden für den Studienerfolg ausschlaggebend definiert und beeinflussten sowohl das Hör- und Leseverstehen als auch die mündliche und schriftliche Produktion wissen‐ schaftlicher Texte (vgl. Scarcella/ Zimmerman 1998: 29). ANCOVA-Analysen zeigten zudem, dass das Alter zum Zeitpunkt der Einreise in die USA, die Länge des Aufenthalts in den USA und verbale Intelligenz, gemessen durch den Scholastic Aptitude Test (SAT), keinen Einfluss auf die Abhängigkeit zwischen Geschlecht und dem Ergebnis im TAL-Test hatten. Als Erklärungsansätze für den Geschlechterunterschied wurden vielmehr soziale Hierarchien, Einflüsse des Unterrichts und Interaktionsverhaltens sowie des Leseverhaltens vermutet (vgl. Scarcella/ Zimmerman 1998), wodurch erneut gewisse Geschlechterstereotype bemüht wurden. Schließlich wurde auch in der Studie von Carrell und Wise (1998) mit 104 Studierenden des Englischen als Zweitsprache eine leicht höhere Leistung männlicher Lernender beim Textverständnistest gemessen. Schmenk (2002: 105) kritisierte in ihrer Meta-Studie, dass in den Studien zur männlichen Überlegenheit beim Fremdsprachenlernen, welche in der zweiten Hälfte des 20. Jahrhunderts durchgeführt wurden, als Begründungen Vorteile von Jungen und Männern hinsichtlich des besseren analytischen Denkens, des höheren Durchsetzungsvermögens und der höheren sozialen Machtpositionen genannt wurden. Dadurch würden erneut Stereotype reproduziert, welche aufgrund der methodisch fragwürdigen Umsetzung der Studien wenig haltbar schienen. Zudem warf Schmenk (2002: 105) den Studien wie derjenigen von Bügel und Buunk (1996) eine „Maskulinisierung“ der Einschätzung des Fremd‐ sprachenlernens vor, in dem Sinne, dass in den 1990er Jahren die Tendenz zu beobachten war, stereotyp maskuline Eigenschaften wie eben das analytische 4.2 Geschlecht und fremdsprachliche Leistung 45 Denken als besonders vorteilhaft für das Erlernen von Fremdsprachen anzu‐ sehen. Es stellt sich also die Frage, inwiefern die Publikation der Metastudie von Schmenk (2002), welche vor allem die genderstereotypen, nicht evidenz‐ basierten Erklärungsmuster für Geschlechterunterschiede kritisierte als auch einigen Studien methodisch unsauberes Arbeiten vorwarf, zu einer Steigerung der Qualität bei der Untersuchung von Geschlechterunterschieden führte. Vor allem seit Ende der 1990er Jahre lässt sich die Tendenz erkennen, dass differenziertere Studien zum komplexen Zusammenhang zwischen Geschlecht und Fremdsprachenlernerfolg erschienen, was zur Verbesserung der Qualität der Studien beitrug. Nur noch selten fanden sich pauschale Behauptungen, dass Mädchen „besser“ oder „begabter“ seien als Jungen (vgl. für Überblicksdarstel‐ lungen Sunderland 2000; Schmenk 2002, 2016). Daher lauten weitere wichtige Fragen hinsichtlich der Aufarbeitung des Stands der Forschung, ob sich seit den 2000er Jahren Geschlechterunterschiede in den modernen Fremdsprachen Englisch, Französisch und Spanisch nur in bestimmten Bildungszweigen von bestimmten Ländern finden lassen und ob in Bezug auf die fremdsprachliche Leistung lediglich einzelne Teilkompetenzen einzelner Zielsprachen betroffen sind oder ob es sich um ein universelles Phänomen handelt. Wenn Geschlechter‐ unterschiede tatsächlich nur in einzelnen Bildungszweigen bestimmter Länder, Zielsprachen und darin wiederum lediglich in einzelnen fremdsprachlichen Teilkompetenzen vorzufinden wären, würde dies laut Driessen und Van Langen (2013) vor allem ein Indiz für die negativen Effekte für die jeweilige Geschlech‐ tergruppe des spezifischen Bildungssystems sprechen. Eine zusätzliche Frage, die sich anschließend im Sinne der Intersektionalität stellen wird, lautet, welche Wechselwirkungen bisher von Gender mit anderen Faktoren hinsichtlich des Lernerfolgs untersucht wurden. Insgesamt liegt auch im 21. Jahrhundert eine hohe Anzahl an Studien vor, die die Faktorenkomplexion rund um Geschlecht und Fremdsprachenlernen erforscht. Diese sind bezüglich der kulturellen, sozialen und institutionellen Kontexte, hinsichtlich der untersuchten individuellen Lernervariablen und fremdsprachlichen Leistungen sowie bezüglich der Forschungsdesigns und -methoden sehr heterogen, weshalb sie erneut uneinheitliche Ergebnisse her‐ vorbringen (vgl. z. B. DESI-Konsortium 2006, 2008; Hartig/ Jude 2008; HarmoS Konsortium Fremdsprachen 2009; Jiménez Catalán/ Terrazas Gallego 2005-2008). Im Folgenden werden in erster Linie Studien mit hohen Stichprobenzahlen aus dem deutschsprachigen Raum, welche Schülerinnen und Schüler in der Adoleszenz als Zielgruppe haben, im Detail dargestellt: Eine Studie, die Geschlechterunterschiede bezüglich sprachlicher Leistungen im Deutschen und Englischen von Schülerinnen und Schülern der 9. Jahr‐ 46 4 Stand der Forschung: Geschlecht und fremdsprachliche Leistungen 3 Die Stichprobengröße lag bei n = 10 639 beim ersten Erhebungszeitpunkt am Anfang des 9. Schuljahres und bei n = 10 632 beim zweiten Erhebungszeitpunkt am Ende des 9. Schuljahres. Die Schülerinnen und Schüler stammten aus 219 Schulen aus allen Bundesländern Deutschlands, wobei unterschiedliche Bildungsgänge berücksichtigt wurden (vgl. DESI-Konsortium 2006: 6). 4 In der Fremdsprache Englisch wurden die Teilkompetenzen Leseverstehen, Hörver‐ stehen, Soziopragmatik, Grammatik, Textrekonstruktion, Schreiben und Sprechen ge‐ messen, wobei letzteres wiederum unterteilt wurde in Satzbau, Wortschatz, Flüssigkeit und Aussprache (vgl. Hartig/ Jude 2008: 204; Nold/ Rossa 2008: 178). 5 Im Deutschen wurden Lesekompetenz, Textproduktion und Sprachbewusstheit ge‐ messen (vgl. DESI-Konsortium 2006: 4). 6 Bezüglich des Sprechens und den hierbei gemessenen Teilkompetenzen fehlen bei Nold und Rossa (2008: 178) die genauen Angaben der Effektstärken und Signifikanzwerte, weshalb hier nicht auf diese verwiesen werden kann. gangsstufe in Deutschland sehr differenziert hinsichtlich verschiedener Teil‐ kompetenzen untersuchte, stellt die DESI-Studie (Deutsch-Englisch-Schüler‐ leistungen-International) aus den Jahren 2002 und 2003 dar (vgl. Beck/ Klieme 2007; DESI-Konsortium 2006, 2008). 3 Dabei wurden jeweils unterschiedliche Teilkompetenzen im Englischen 4 und im Deutschen 5 gemessen, wodurch ein differenziertes Leistungsbild entstand: Die Geschlechterunterschiede fielen im Englischen deutlich kleiner aus als im Deutschen (vgl. Hartig/ Jude 2008: 203), dennoch konnten die Mädchen im Gesamtergebnis im Englischen einen klaren Vorsprung erzielen (vgl. Hartig/ Jude 2008: 203). Die deutlichsten Ge‐ schlechterunterschiede zugunsten der Mädchen fanden sich in der schriftlichen Textproduktion und in der Textrekonstruktion, die mittels eines C-Tests erhoben worden war (vgl. Hartig/ Jude 2008: 204). Die Jungen konnten wiederum im Kompetenzbereich Sprechen einen Leistungsvorsprung erzielen, wobei sie den größten Vorsprung auf die Mädchen in den Teilbereichen Flüssigkeit und Aussprache hatten, wohingegen lediglich ein geringer Unterschied beim Satzbau vorzufinden war (vgl. Nold/ Rossa 2008: 178). Ausschließlich im Leis‐ tungsbereich Wortschatz erzielten die Mädchen beim Sprechen im Englischen höhere Ergebnisse als die Jungen. 6 Somit wird die Gesamttendenz erkennbar, dass die Jungen in der mündlichen Sprachproduktion Vorteile zeigten und die Mädchen wiederum in der schriftlichen Textproduktion, aber auch beim Hör- und Leseverstehen höhere Ergebnisse erzielten. Eine nach Bildungsgängen getrennte Analyse zeigt zudem, dass die Geschlechterunterschiede zugunsten der Mädchen im Gesamtergebnis im Englischen sowohl an Haupt- und Real‐ schulen, Integrierten Gesamtschulen (IGS) und an Gymnasien zu finden waren, wobei sie an Gymnasien am geringsten ausfielen (vgl. Hartig/ Jude 2008: 205). Bei Betrachtung der Deutsch- und Englischleistungen in ihrer Gesamtheit und in ihrer Progression vom ersten zum zweiten Erhebungszeitraum fielen 4.2 Geschlecht und fremdsprachliche Leistung 47 7 Insgesamt lag die Stichprobengröße bei n = 3-224 (vgl. Lehmann et al. 2004: 133). 8 Die Probandinnen und Probanden der LAU 11-Studie (Aspekte der Lernausgangslage und der Lernentwicklung Klassenstufe 11, Lehmann et al. 2004) stammten aus Gym‐ nasien, Gesamtschulen, Aufbaugymnasien in der Vorstufe, Aufbaugymnasien in der Einführungsstufe und schließlich aus Wirtschaftsgymnasien und technischen Gymna‐ sien (vgl. Lehmann et al. 2004: 25). die Leistungszuwächse bei den Mädchen deutlich größer aus als bei den Jungen. Bei ausschließlicher Betrachtung der Ergebnisse im Englischen waren die Leistungszuwächse von Jungen und Mädchen in der Textrekonstruktion und im Hörverstehen jeweils signifikant, d. h. beide Geschlechtergruppen erzielten in diesen beiden Teilkompetenzen am Ende der 9. Jahrgangsstufe ein signifikant besseres Ergebnis als am Anfang der 9. Jahrgangsstufe, wenn‐ gleich die Lernzuwächse bei den Mädchen jeweils etwas höher ausfielen als bei den Jungen. Da Hartig und Jude (2008: 206) mittels Mehrebenenanalysen berechneten, dass die genannten „[…] Unterschiede zwischen Mädchen und Jungen auch unter Kontrolle des Bildungsganges signifikant variieren“, kamen sie zu der Schlussfolgerung, dass es lohnenswert sein könnte, auf Klassen- und Unterrichtsebene nach erklärenden Variablen zu suchen, welche entweder für das Zustandekommen von Geschlechterunterschieden förderlich waren oder eher zu deren Vermeidung beitrugen. Die Forschungsmethodik der DESI-Studie ist von besonderer Relevanz für das weitere Vorgehen in der vorliegenden Studie, da hier ebenfalls verschiedene fremdsprachliche Teilkompetenzen detailliert erfasst und auf Geschlechterun‐ terschiede untersucht werden. Außerdem wird in der vorliegenden Studie nach vielfältigen Erklärungsansätzen für Geschlechterunterschiede und Ge‐ meinsamkeiten geforscht, womit der Forderung von Hartig und Jude (2008: 206) Rechnung getragen wird, auf Klassen- und Unterrichtsebene nach erklä‐ renden Variablen zu suchen (vgl. Kapitel 5, 11.7 bis 12). Die Ergebnisse der DESI-Studie können zu einigen anderen, später durchgeführten Langzeitstudien in Beziehung gesetzt werden. Lehmann et al. (2004) begleiteten beispielsweise in der Hamburger Lern-Ausgangs-Untersuchung (LAU) Jungen und Mädchen 7 aus verschiedenen Schularten 8 von der 7. bis zur 11. Jahrgangsstufe und führten dabei kontinuierlich C-Tests im Englischen durch. Sie fanden heraus, dass sowohl bei den Jungen als auch bei den Mädchen ein starker Lernfortschritt im Verlauf der Jahrgangsstufen 7 und 8 stattfand und die Lernentwicklung in den Jahrgangsstufen 9 bis 11 bei beiden Geschlechtergruppen stark verlangsamt wurde (vgl. Lehmann et al. 2004: 133). Allerdings erzielten die Mädchen am Gymnasium immer wieder leicht bessere Leistungen im Englischen als die Jungen, sodass insgesamt eine parallele Entwicklung der Leistung im C-Test von 48 4 Stand der Forschung: Geschlecht und fremdsprachliche Leistungen 9 Ab der 7. Jahrgangsstufe wurden Mittels eines C-Tests Wortschatz-, Orthographie-, Syntax-, Grammatik- und Semantikkenntnisse gemessen (vgl. Nikolova 2011: 122). Am Ende von Jahrgangsstufe 4 wurde das Hörverstehen in Englisch erhoben (vgl. May 2006a: 203). 10 An KESS 4 nahmen n = 10 987 Englischschülerinnen und -schüler teil. Bei KESS 7 waren es n = 13 865 Englischlernende (vgl. May 2009: 75). Im Kontext von KESS 8 wurden von n = 8 412 Lernenden C-Tests im Englischen ausgewertet (vgl. Nikolova/ Ivanov 2010: 52) und bei KESS 10/ 11 nahmen n = 3 809 Schülerinnen und Schüler an den Englischtests teil (vgl. Nikolova 2011). 11 In den Studien KESS 4, KESS 7, KESS 8 und KESS 10/ 11 wurden keine Signifikanzen, sondern lediglich Effektstärken berichtet (vgl. May 2009; Nikolova/ Ivanov 2010; Niko‐ lova 2011). Am Ende der Jahrgangsstufe 6 lag der Effekt zugunsten der Mädchen bei d-=-.28 (vgl. May 2009: 62). 12 Bei KESS 8 lag der Effekt zugunsten der Mädchen bei d = .24 (vgl. Nikolova/ Ivanov 2010: 54). der 7. bis zur 11. Jahrgangsstufe des Gymnasiums beobachtet werden konnte. In den Gesamtschulen kam es hingegen zu einem größeren Lernfortschritt der Mädchen in den Klassenstufen 7 und 8, wobei sich die Jungen in den Klassenstufen 9 und 10 wieder an die Leistungen der Mädchen annäherten. Aufbauend auf LAU (vgl. Lehmann et al. 2004) wurden im Rahmen der Langzeitstudie KESS (Kompetenzen und Einstellungen von Schülerinnen und Schülern) in Hamburg am Ende von Jahrgangsstufe 4 (KESS 4; vgl. Bos/ Pietsch 2006), am Ende von Jahrgangsstufe 6 und zu Beginn von Jahrgangsstufe 7 (KESS 7, vgl. Bos et al. 2009a), am Ende von Jahrgangsstufe 8 (KESS 8; vgl. Bos/ Gröhlich 2010) und am Ende von Jahrgangsstufe 10 (KESS 10/ 11; vgl. Vieluf et al. 2011) neben den Deutsch- und den Mathematikkompetenzen auch die Englischkompetenzen 9 erhoben. 10 Während am Ende der 4. Jahrgangsstufe kein Geschlechterunterschied in der durchschnittlichen Englischleistung gemessen wurde, trat in KESS 7 am Ende der Jahrgangstufe 6 zum ersten Mal ein schwacher Effekt zugunsten der Mädchen auf (vgl. May 2009: 62). 11 May (2009: 62) machte in diesem Zusammenhang darauf aufmerksam, dass die Englischleistungen am Ende der Grundschulzeit noch in hohem Maße von außerschulischen Faktoren bestimmt seien und die Englischleistungen von Sechstklässlerinnen und Sechstklässlern vielmehr „Resultat des systematischen Unterrichts in der Schule“ seien, was darauf schließen lassen könnte, dass Mädchen stärker vom Englischunterricht profitierten als Jungen. Im Rahmen von KESS 8 wurden die Ergebnisse aus KESS 7 bestätigt und der Geschlechterunterschied zugunsten der Mädchen wies erneut eine schwache Effektstärke auf (vgl. Nikolova/ Ivanov 2010: 54). 12 Am Ende von Jahrgangs‐ stufe 10 zeigten die Mädchen schließlich erneut höhere Englischleistungen bei schwacher Effektstärke (vgl. Nikolova 2011: 130) 13 , wobei dies an allen 4.2 Geschlecht und fremdsprachliche Leistung 49 13 Am Ende von Jahrgangsstufe 10 betrug die Effektstärke d = .21 zugunsten der Mädchen (Nikolova 2011: 130). 14 Integrierte Haupt- und Realschule (IHR; vgl. Nikolova et al. 2011: 16) 15 Der Leistungsunterschied im Englischen zugunsten von Schülerinnen und Schülern mit Deutsch als Familiensprache im Vergleich zu Schülerinnen und Schülern mit nicht‐ deutscher Familiensprache lag bei d = .48; bei den monolingual deutsch aufgewachsenen hatten die Mädchen einen Vorsprung in Form der Effektstärke von d = .21 und bei den mehrsprachig aufgewachsenden in Form von d = .15 (vgl. Nikolova 2011: 131, 151). drei Schularten gemessen wurde und der kleinste Geschlechterunterschied am Gymnasium feststellbar war. Außerdem wiesen die Jungen in der 10. Jahr‐ gangsstufe eine höhere Leistungsstreuung auf als die Mädchen (vgl. Nikolova 2011: 130). Der Lernzuwachs vom Ende der 8. Jahrgangsstufe bis zum Ende der 10. Jahrgangsstufe war, bei Betrachtung aller Schularten im Gesamten, bei beiden Geschlechtergruppen gleich groß. Bei Analyse des Lernfortschritts von Jungen und Mädchen an den einzelnen Schularten wird ersichtlich, dass sich der Leistungsabstand zwischen den beiden Geschlechtergruppen am Gymnasium etwas verringerte, während an der Gesamtschule und an IHR- 14 und Realschule der Leistungsunterschied etwas größer wurde (vgl. Nikolova 2011: 138). Außerdem wurde im Rahmen der Studien KESS 8 und KESS 10 untersucht, welche Englischleistungen jeweils von Jungen und Mädchen mit Deutsch als Familiensprache und mit einer nichtdeutschen Familiensprache erzielt wurden. Dabei wurde festgestellt, dass Schülerinnen und Schüler mit Deutsch als Familiensprache deutlich bessere Ergebnisse erzielten als Schülerinnen und Schüler mit nichtdeutscher Familiensprache, wobei sowohl bei den monolin‐ gual deutsch aufgewachsenen als auch bei den mehrsprachig aufgewachsenen Schülerinnen und Schülern jeweils die Mädchen höhere Englischleistungen erzielten (vgl. Nikolova 2011: 131). 15 Bei schulformspezifischer Betrachtung zeigte sich, dass der Geschlechterunterschied bei beiden Schülergruppen an IHR- und Realschulen eher gering war, allerdings am Gymnasium deutlicher ausgeprägt war (vgl. Nikolova 2011: 131, 151). Bei Analyse der Leistungsent‐ wicklung von der 8. Jahrgangsstufe bis zur 10. Jahrgangsstufe wurde ersichtlich, dass sich der Leistungsunterschied zwischen Schülerinnen und Schülern mit Deutsch als Familiensprache und Schülerinnen und Schülern mit nichtdeutscher Familiensprache geringfügig vergrößerte, da erstere Merkmalsgruppe einen etwas stärkeren Lernzuwachs erreichte als letztere (vgl. Nikolova 2011: 139). Schulformspezifische Analysen zeigten, dass die Schülerinnen und Schüler am Gymnasium mit nichtdeutscher Familiensprache einen unterdurchschnittlichen Lernzuwachs verzeichneten, sodass hier eine sehr starke Öffnung der Leistungs‐ schere zu beobachten war (vgl. Nikolova 2011: 139, 153). 50 4 Stand der Forschung: Geschlecht und fremdsprachliche Leistungen 16 In der 6. Jahrgangsstufe nahmen 492 Mädchen und 471 Jungen teil. In der 9. Jahr‐ gangsstufe lag die Zahl der Mädchen bei 537 und die Zahl der Jungen bei 514. Mittelwertsunterschiede zwischen Schülerinnen und Schülern: 6. Klasse: 21 Punkte (t = 2.323*) und zwischen Schülerinnen und Schülern der 9. Klasse: 23 Punkte, t = 1.675 (vgl. Konsortium HarmoS Fremdsprachen 2009: 39). Insgesamt bestätigten sich in den KESS-Studien also Leistungsvorteile bei den Mädchen, wobei der kleinste Geschlechterunterschied meist am Gymna‐ sium feststellbar war und die Jungen in der 10. Jahrgangsstufe eine höhere Leistungsstreuung aufwiesen (vgl. Nikolova 2011: 130). Sowohl bei einsprachig deutsch aufgewachsenen als auch bei mehrsprachig aufgewachsenen Lernenden wurden schwache Effekte zugunsten der Mädchen gemessen, wobei insgesamt die einsprachig aufgewachsenen Lernenden besser abschnitten als die mehr‐ sprachig aufgewachsenen (vgl. Nikolova 2011: 130). Folglich erzielten erneut die mehrsprachig aufgewachsenen Jungen die schwächsten Leistungen. Andere sehr umfassende Studien wiesen ähnliche Ergebnisse auf: Die Schweizer Studie HarmoS zur Überprüfung der in den Schweizer Basisstan‐ dards festgeschriebenen Niveaustufen überprüfte die Lesekompetenz in den Fremdsprachen Französisch und Englisch in der Deutschschweiz und in den Fremdsprachen Deutsch und Englisch in der Westschweiz (vgl. Konsortium HarmoS Fremdsprachen 2009). Die Lesekompetenz in Deutsch und Französisch wurden in einer Querschnittstudie sowohl in der 6. als auch in der 9. Jahrgangs‐ stufe gemessen, Englisch aufgrund des späteren Lernbeginns lediglich in der 9. Jahrgangsstufe. Die Skala für das fremdsprachliche Leseverstehen umfasste knapp 200 Items und es wurden zwei präzise definierte Teilkompetenzen des Lesens (sorgfältig-genaues Lesen, erkundendes Lesen; vgl. Kapitel 9.2.2) gemessen (vgl. Konsortium HarmoS Fremdsprachen 2009: 35; Lenz/ Studer 2008a). Für das vorliegende Forschungsvorhaben bezüglich eines angestrebten Vergleichs der Geschlechtergruppen zwischen den Leistungen in den Fremdsprachen Franzö‐ sisch und Spanisch außerdem relevant ist, dass bei HarmoS eine einheitliche Skala für das Leseverstehen in den Fremdsprachen Deutsch, Französisch und Englisch konstruiert wurde, was auch Ziel der vorliegenden Arbeit ist. Die Ergebnisse der HarmoS-Studie gestalteten sich bezüglich der drei verschiedenen Fremdsprachen jeweils ähnlich: In Französisch wurde in der Deutschschweiz in der 6. Jahrgangsstufe ein signifikanter Unterschied zugunsten der Mädchen gemessen; in der 9. Jahrgangsstufe erzielten die Mädchen ebenfalls tendenziell bessere Leseleistungen in Französisch als die Jungen, wobei hier kein signifi‐ kanter Unterschied vorlag (vgl. Konsortium HarmoS Fremdsprachen 2009: 39). 16 Außerdem wurde in der HarmoS-Studie ermittelt, dass in der französischspra‐ chigen Westschweiz die Lesekompetenz in Deutsch als Fremdsprache in der 4.2 Geschlecht und fremdsprachliche Leistung 51 17 In der 6. Jahrgangsstufe nahmen 496 Mädchen und 480 Jungen an der Studie in der Westschweiz teil. In der 9. Jahrgangsstufe lag die Teilnehmerzahl in der Westschweiz für Deutsch als Fremdsprache bei 540 Mädchen und 525 Jungen. Die Mittelwertunter‐ schiede zwischen Schülerinnen und Schülern der 6. Jahrgangsstufe betrugen 16 Punkte, (t = 1.963*) und zwischen Schülerinnen und Schülern der 9. Jahrgangsstufe 15 Punkte (t-=-1.422). 18 Mittelwertunterschied in Englisch in der Deutschschweiz: 33, t-= 2.430*; Mittelwertun‐ terschied in Englisch in der Westschweiz: 21, t-=-1.743. 19 Während in Deutsch und Englisch als erste Fremdsprache alle 16 Bundesländer einbezogen wurden, wurden in der Ländervergleichstudie von 2008 lediglich Berlin, Hessen, Baden-Württemberg, Saarland, Rheinland-Pfalz und Nordrhein-Westfalen in die Untersuchung aufgenommen, da vor allem in diesen Ländern eine relativ hohe Anzahl an Schülerinnen und Schülern des Französischen als erste Fremdsprache existierte (vgl. Köller et al. 2010: 4). 6. Jahrgangsstufe ebenfalls signifikante Geschlechterunterschiede zugunsten der Mädchen zeigte und sich diese Unterschiede in der 9. Jahrgangsstufe fortsetzten, aber abschwächten, sodass sie nicht mehr signifikant waren (vgl. Konsortium HarmoS Fremdsprachen 2009: 40). 17 Während der Geschlechter‐ unterschied in der Englischleistung in der 9. Jahrgangsstufe schließlich in der Deutschschweiz signifikant zugunsten der Mädchen ausfiel, war der Unter‐ schied in der Westschweiz nicht signifikant, wobei tendenziell die weiblichen Englischlernerinnen höhere Ergebnisse erzielten. 18 Somit ist hier bezogen auf das Leseverstehen in den Fremdsprachen Französisch, Englisch und Deutsch bezüglich eines Querschnitts in der 6. und 9. Jahrgangsstufe eine deutliche Tendenz zur Verringerung des Geschlechterunterschieds zu beobachten, die in gewisser Weise den Ergebnissen von DESI und LAU entspricht, auch wenn bedacht werden muss, dass es sich bei HarmoS um eine Querschnittstudie handelt. Querschnittliche empirische Studien, die Geschlechterunterschiede bei sprachlichen Leistungen bei Schülerinnen und Schülern der 9. Jahrgangsstufe in Deutschland sehr differenziert bezüglich sprachlicher Teilkompetenzen un‐ tersuchten und dabei insbesondere das Deutsche als Erstsprache sowie das Englische und Französische als jeweils erste Fremdsprachen in den verschie‐ denen Bundesländern 19 in den Blick nahmen, sind die Ländervergleichsstudie von 2009 (vgl. Köller et al. 2010; Winkelmann/ Groeneveld 2010) und der IQB-Bildungstrend aus dem Jahr 2015 (vgl. Stanat et al. 2016a, 2016b). Beide Studien überprüften das Erreichen der Bildungsstandards für den mittleren Schulabschluss für die erste Fremdsprache (Englisch/ Französisch) des Sekretariats der Ständigen Konferenz der Kultusminister der Bundesrepublik Deutschland (KMK 2004), wobei sie bezüglich der beiden ersten Fremdsprachen lediglich Leistungen in den sprachlichen Fertigkeiten Hörverstehen und Leseverstehen 52 4 Stand der Forschung: Geschlecht und fremdsprachliche Leistungen maßen. Der Ländervergleich von 2009 ergab für alle sprachlichen Bereiche (jeweils Leseverstehen und Hörverstehen in Deutsch, Englisch und Französisch sowie Orthographie in Deutsch) signifikante Leistungsvorteile der Mädchen gegenüber den Jungen (vgl. Winkelmann/ Groeneveld 2010). Dabei zeigte sich in beiden rezeptiven Fertigkeiten der größte Vorsprung der Mädchen im Fran‐ zösischen (vgl. Winkelmann/ Groeneveld 2010: 181-183). Auffällig ist, dass die geschlechtsbezogenen Leistungsunterschiede zwischen den einzelnen Bundes‐ ländern stark schwankten: Im Leseverstehen in Englisch wurde im Saarland, in Bremen, Brandenburg und Hamburg ein Cohens d kleiner als .1 gemessen und im Gegensatz dazu wurden in Bayern, Sachsen, Baden-Württemberg und Sachsen-Anhalt Effektstärken von .2 und höher zugunsten der Mädchen nachgewiesen (vgl. Winkelmann/ Groeneveld 2010: 182). Dasselbe Phänomen lässt sich auch beim Leseverstehen im Französischen beobachten, bei dem in Nordrhein-Westfalen ein Effekt kleiner als .1 und in Berlin ein Effekt über .3 zugunsten der Mädchen gemessen wurde (vgl. Winkelmann/ Groeneveld 2010: 182). Im Hörverstehen in Englisch reichte die Spanne ebenfalls von Effektstärken unter .1 im Saarland, in Bremen und Brandenburg bis hin zu einem Effekt zugunsten der Mädchen von über .3 in Sachsen-Anhalt. Im Hörverstehen im Französischen war die Spannweite ähnlich groß mit Effekten unter .1 in Nordrhein-Westfalen und Rheinland-Pfalz und einem Effekt über .3 in Berlin (vgl. Winkelmann/ Groeneveld 2010: 183). Da innerhalb des Ländervergleichs keinerlei Vermutungen für den Grund der unterschiedlichen Ergebnisse in den einzelnen Bundesländern diskutiert wurden, stellt sich die Frage, welche Prozesse im Bildungssystem der einzelnen Bundesländer diese Schwankungen jeweils bewirken. Diese Frage wird im Rahmen der vorliegenden Studie bezogen auf die Stichprobe aus dem Regierungsbezirk Tübingen im weiteren Verlauf zu klären versucht. Der IQB-Bildungstrend von 2015 (Stanat et al. 2016a, 2016b) kam zu ver‐ gleichbaren Ergebnissen, wobei hier lediglich in Deutsch und Englisch Ge‐ schlechterunterschiede untersucht wurden. Bezüglich des Englischen konnte im Vergleich zu den Ergebnissen aus dem Schuljahr 2008/ 2009 die Tendenz festgestellt werden, dass sich die Geschlechterunterschiede im Hörverstehen etwas verringert und im Leseverstehen etwas vergrößert hatten (vgl. Böhme et al. 2016: 388; Stanat et al. 2016b: 21; Winkelmann/ Groeneveld 2010: 181-183). Die Schwankungen der Stärke der Geschlechterunterschiede bezogen auf die unter‐ schiedlichen Bundesländer waren dabei ähnlich groß wie beim Ländervergleich von 2009 (vgl. Böhme et al. 2016: 393). 4.2 Geschlecht und fremdsprachliche Leistung 53 20 Optimalstandards werden vom IQB (2013: 7) definiert als „Kompetenzen, die bei weitem die Erwartungen der Bildungsstandards übertreffen (in den meisten Fächern weitgehend basierend auf sozialer Norm).“ Optimalstandards stellen im Kompetenzstu‐ fenmodell des IQB (2013: 7) die höchste Kompetenzstufe V dar. Die geschlechtsbezogenen Unterschiede in den fremdsprachlichen Leis‐ tungen waren außerdem, anders als bei KESS, am Gymnasium und an den nicht‐ gymnasialen Schularten ähnlich groß. Doch ähnlich wie bei KESS zeigen die Ergebnisse der Jungen in allen gemessenen Kompetenzbereichen des Deutschen und Englischen eine größere Streuung als diejenige der Mädchen (vgl. Böhme et al. 2016: 389). Im Englischen waren schließlich 56% der Lernenden, die den Optimalstandard 20 der Bildungsstandards erreichten, weiblich; im Hörverstehen waren es 53% (vgl. Böhme et al. 2016: 389). Das stärkste Ungleichgewicht war im Fach Deutsch im Bereich der Orthographie zu verorten, da 71% der Lernenden, die die Optimalstandards erreichten, weiblich waren: Hier wurde ein mittlerer Effekt zugunsten der Mädchen gemessen (vgl. Böhme et al. 2016: 389-399). Bei gemeinsamer Analyse des Ländervergleichs 2009 und des IQB-Bildungs‐ trends 2015 zeigt sich also, dass stets höhere Leistungen der Mädchen in allen gemessenen Kompetenzbereichen des Deutschen und des Englischen nachgewiesen wurden. Im Französischen wurden Geschlechterunterschiede lediglich im Ländervergleich 2009 untersucht, welche ebenfalls zugunsten der Mädchen ausfielen (vgl. Böhme et al. 2016; Köller et al. 2010; Stanat et al. 2016a, 2016b). Manno (2017) untersuchte ebenfalls die Lesekompetenz in Französisch als erste und als zweite Fremdsprache in der deutschsprachigen Schweiz, allerdings bereits in der 6. Jahrgangsstufe und fand in beiden Varianten einen signifikanten Effekt des Geschlechts auf die Leseleistung, wobei Mädchen durchschnittlich besser abschnitten als Jungen. Rumlich (2016) untersuchte in einer Langzeitstudie die Faktoren Leistung in der Fremdsprache Englisch, Selbstkonzept in der Fremdsprache Englisch, Interesse am Englischunterricht, Häufigkeit der Verwendung des Englischen (spare-time English) in der Freizeit, verbale Intelligenz (verbal cognitive abilities), Alter, Geschlecht, sprachlicher Hintergrund in unterschiedlichen bilingualen und nicht-bilingualen Ansätzen von insgesamt 1 398 Schülerinnen und Schülern in den Jahrgangsstufen 6 und 8 (vgl. Rumlich 2016: 255-259). Dabei zeigte das Selbstkonzept in der Fremdsprache Englisch den größten Einfluss, die verbale Intelligenz (gemessen durch den KFT-Test) den zweitgrößten und das Geschlecht den drittgrößten Einfluss auf die fremdsprachlichen Leistungen im Englischen, welche über einen C-Test ermittelt wurden. Auch hier erzielten die Mädchen signifikant höhere Ergebnisse. In dieser Studie zeigte das Geschlecht 54 4 Stand der Forschung: Geschlecht und fremdsprachliche Leistungen sogar einen höheren Einfluss auf die Leistungen im Englischen als der sprach‐ liche Hintergrund, das Alter, die Häufigkeit der Freizeitaktivitäten in englischer Sprache oder das Interesse am Englischunterricht (vgl. Rumlich 2016: 385). Neben den Haupteffekten auf die Leistung wurden über ein Strukturgleichungs‐ modell multiple indirekte Effekte ermittelt. Dadurch konnte herausgefunden werden, dass sowohl in Jahrgangsstufe 6 als auch in Jahrgangsstufe 8 das Interesse am Fach Englisch teilweise den Einfluss des Geschlechts auf die Englischleistung mitbestimmte (vgl. Rumlich 2016: 438-439). Es wird also ersichtlich, dass sich sowohl die Forschungsmethodik als auch die Forschungsgegenstände in aktuellen Studien immer weiter ausdifferen‐ zieren. Je differenzierter die Forschungsdesigns sind, umso deutlicher wird, dass das Geschlecht als interdependente Variable wirkt. Dementsprechend reichen monokausalen Erklärungen nicht mehr aus, um Geschlechterunterschiede zu begründen. 4.3 Zwischenfazit zum Stand der Forschung bezüglich fremdsprachlicher Leistung und Geschlecht Insgesamt zeigt die Analyse des Stands der Forschung bezüglich des Zusam‐ menhangs zwischen fremdsprachlicher Leistung und Geschlecht, dass trotz der oftmals proklamierten weiblichen Überlegenheit (vgl. z. B. Burstall et al. 1974; Boyle 1987; Schröder 1996) Mitte bis Ende des 20. Jahrhunderts in empirischen Studien uneinheitliche Ergebnisse erzielt wurden, die keinerlei pauschalisierende Äußerungen zulassen. Je nach Kontext, Forschungsmethode und Zielgruppe erzielten teilweise die Mädchen bessere Ergebnisse (vgl. Burstall et al. 1974; Nisbet/ Welsh 1972; Nyikos 1990; Randhawa/ Korpan 1973) oder aber die Jungen (vgl. Boyle 1987; Bügel/ Buunk 1996; Carrell/ Wise 1998; Cross 1983; Scarcella/ Zimmerman 1998). Außerdem wurden die Begründungen für Vorteile von weiblichen bzw. männlichen Lernenden in bestimmten Fertigkeitsbereichen häufig in vorherrschenden Genderstereotypen gesucht (vgl. Christ 1996; Ellis 1994; Kahlke 1996; Schmenk 2002). Teilweise waren auch, vorwiegend bei erwachsenen Lernenden, überhaupt keine Geschlechterunterschiede in den Studien messbar (vgl. Bacon 1992; Brega/ Newall 1967; Farhady 1982; Walker/ Perry 1978). Zusätzlich dazu wird vom sogenannten file drawer Problem ausge‐ gangen, aufgrund dessen nicht signifikante Befunde unveröffentlicht blieben (vgl. Schmenk 2002). Abgesehen davon gab es durchaus auch Forschende, die der Annahme der weiblichen Überlegenheit beim Fremdsprachenlernen eher kritisch gegenüberstanden (vgl. Carrol 1963; Ekstrand 1980). 4.3 Zwischenfazit zum Stand der Forschung bezüglich fremdsprachlicher Leistung und Geschlecht 55 Im 21. Jahrhundert ist zu beobachten, dass in den großen Bildungsmonito‐ rings, die während der Adoleszenz der Schülerinnen und Schüler durchgeführt wurden, vorwiegend das Hör- und das Leseverstehen gemessen sowie C-Tests eingesetzt wurden, um die Kompetenzen im Englischen und teilweise auch im Französischen zu messen. Dabei wurden durchgehend Vorteile zugunsten der Mädchen festgestellt, auch wenn diese nicht immer signifikant waren (vgl. Konsortium HarmoS Fremdsprachen 2009). Insgesamt können folgende Ten‐ denzen gefunden werden: Geschlechterunterschiede im Französischen scheinen ausgeprägter zu sein als im Englischen (vgl. Winkelmann/ Groeneveld 2010) und Vorteile der Mädchen scheinen im Leseverstehen ausgeprägter zu sein als im Hörverstehen (vgl. Winkelmann/ Groeneveld 2010). Außerdem scheinen Geschlechterunterschiede zugunsten der Mädchen insbesondere ab der 6. Jahr‐ gangsstufe aufzutreten (vgl. Bos et al. 2009a; Manno 2017), dann zunächst größer und ab der 9. Jahrgangsstufe wieder kleiner zu werden (vgl. Konsortium HarmoS Fremdsprachen 2009: 39; Nikolova 2011: 138) bzw. ganz zu verschwinden (vgl. Kapitel 5.1.1). Die Lernentwicklung scheint sich im Englischen in den Jahrgangsstufen 9 bis 11 bei beiden Geschlechtergruppen zu verlangsamen (vgl. Lehmann et al. 2004: 133) und geschlechtsspezifische Unterschiede scheinen an Gymnasien teilweise kleiner auszufallen als an anderen Schularten (vgl. Nikolova 2011: 130). Schließlich ist zu beobachten, dass Jungen eine höhere Streuung in ihren Leistungen zeigen als Mädchen (vgl. Böhme et al. 2016: 389; Nikolova 2011: 130), dass Jungen mit mehrsprachigem Hintergrund in der Adoleszenz im Englischen teilweise eher schwächere Leistungen erzielen (vgl. Nikolova 2011: 130) und dass die Geschlechterunterschiede von Bundesland zu Bundesland stark unterschiedlich ausfallen (Winkelmann/ Groeneveld 2010: 182). Lediglich die DESI-Studie (vgl. DESI-Konsortium 2006, 2008; Hartig/ Jude 2008; Nold/ Rossa 2008) untersuchte neben dem Hör- und dem Leseverstehen sowie der Textrekonstruktion in Form von C-Tests auch das Schreiben und das Sprechen im Englischen, wobei die Jungen im Sprechen signifikante Vorteile zeigten. Somit bedarf es einer weiteren Erforschung der produktiven Fertig‐ keiten und eine Untersuchung der Entwicklung der Jungen ausgehend von produktiven mündlichen Fertigkeiten (vgl. Budde 2009). Inwiefern die sprachlichen Leistungen im Laufe des Alters bezüglich der Geschlechterunterschiede Änderungen unterliegen und weshalb gerade in der Adoleszenz derlei geschlechtsspezifische Unterschiede gemessen werden, wird in den folgenden Kapiteln näher auf Grundlage des aktuellen Stands der Forschung analysiert. 56 4 Stand der Forschung: Geschlecht und fremdsprachliche Leistungen 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Bei den Erklärungsansätzen für Geschlechterunterschiede und -gemeinsam‐ keiten können mehrere Bereiche und Lernervariablen ausgemacht werden, die in Interdependenz zum Geschlecht wirken und sich gegenseitig bedingen (vgl. López Rúa 2006): Zu den lernerendogenen, internen Faktoren zählen das biologische Alter, kognitive und neuronale Faktoren sowie affektive Faktoren. Zu den lernerexogenen, externen Faktoren zählen soziokulturelle Kontexte, sozioökonomische Hintergründe und der Einfluss verschiedener Sozialisations‐ instanzen wie Eltern, Peers und Lehrkräfte, welche ihrerseits die Lernbiographie des Individuums beeinflussen (vgl. zu endogenen und exogenen Faktoren auch das „Einzelgänger“-Modell von Riemer 1997: 77-78). Im Folgenden zunächst endogene und anschließend exogene Faktoren bezüg‐ lich des aktuellen Stands der Forschung hinsichtlich der Wechselwirkung mit dem Geschlecht in Bezug auf das Fremdsprachenlernen analysiert. 5.1 Endogene Faktoren 5.1.1 Alter und Geschlecht Bezüglich der Frage nach der Erklärung von Geschlechterunterschieden durch unterschiedliche Entwicklungsphasen im Laufe des Lebens gibt es zahlreiche Forschungsarbeiten, die erneut uneinheitliche Ergebnisse liefern. Die Unei‐ nigkeit betrifft zum einen die Frage, ob überhaupt Unterschiede auftreten. Falls Unterschiede angenommen werden, stellt sich zum anderen die Fragen, welche Entwicklungsphasen (d. h. beispielsweise das Kleinkindalter oder aber die Adoleszenz) besonders durch Geschlechterunterschiede geprägt sind und welche nicht. Außerdem wird erforscht, in welchen konkreten sprachlichen Fähigkeiten vergleichbare und unterschiedliche Leistungen bei den Geschlech‐ tergruppen vorliegen und inwiefern gewisse Tendenzen abzulesen sind, nach denen Geschlechterunterschiede in den jeweiligen Entwicklungsphasen auf‐ treten, abnehmen bzw. gänzlich verschwinden (vgl. z. B. Hyde/ Linn 1988: 53; Hartig/ Jude 2008: 202; Klann-Delius 2005; Steinlen et al. 2019: 73-74). Einige Forschende gehen davon aus, dass der sprachliche Kompetenzvor‐ sprung von Mädchen und Frauen gegenüber Jungen und Männern prinzipiell das ganze Leben lang andauert; diese Position stammt aus den 50er und 60er Jahren, findet aber teilweise bis heute Anhängerinnen und Anhänger (vgl. Anas‐ tasi 1958; Golombok/ Fivush 1994; Halpern 1986; Hartig/ Jude 2008: 202; Tyler 1965). Unter anderem aufgrund dieser Annahmen wurden sowohl öffentliche als auch wissenschaftliche Diskussionen über Jungen als „Bildungsverlierer“ im Schul- und Bildungssystem entfacht (vgl. Budde: 2008). Eine zweite, den Forschungsdiskurs vorwiegend bestimmende Position, geht davon aus, dass sich Geschlechterunterschiede bei sprachlichen Fähigkeiten im Laufe des Lebens unterschiedlich stark manifestieren und phasenweise inexistent sind. Es herrscht jedoch teilweise Unklarheit darüber, welche genauen Altersspannen und sprachlichen Fertigkeiten davon betroffen sind: Oftmals wird behauptet, dass Mädchen zu Beginn des Lebens eine schnellere sprachliche Entwicklung durchlaufen würden als Jungen (vgl. z. B. Berk 1997; Bornstein et al. 1996; Bornstein et al. 1998; Eriksson et al. 2012; Fenson et al. 1994; Maccoby 1966a: 26; Maccoby/ Jacklin 1974). Dies äußere sich in der Form, dass Mädchen im Kleinkindalter meist früher anfingen zu sprechen, höhere Artikulationsleis‐ tungen zeigten, die Grammatik der Erstsprache schneller erwürben, früher längere Sätze bildeten und vom Säuglingsalter bis zur frühen Kindheit eine schnellere Wortschatzentwicklung sowie ein größeres Wortschatzspektrum zeigten (vgl. Budde 2011: 103; Hartig/ Jude 2008: 202; Henrichs et al. 2011; Huttenlocher et al. 1991; Klann-Delius 2005: 108; Luchtmaya et al. 2002; Nelson 1973; Schachter et al. 1978). Dennoch lassen sich zu diesen Behauptungen einige gegenläufige For‐ schungsergebnisse finden: Klann-Delius (2005: 107-108) bezeichnet die Stu‐ dienergebnisse, die die „These eines früheren Sprachbeginns bei Mädchen“ untersuchten, als kontrovers, da die jeweiligen Definitionen der sprachlichen Form, die als erstes Wort klassifiziert wird, stark divergieren. Sie fügt hinzu, dass Mädchen mit 23 bis 30 Monaten einen signifikant höheren Anteil an kon‐ ventionellen Wortformen innerhalb der Gesamtzahl ihrer vokalen Äußerungen aufweisen, und dass dieser Unterschied aber im Alter von 36 Monaten wieder verschwindet (vgl. Klann-Delius 2005: 108). Bezüglich der Lautentwicklung werden in älteren Studien höhere Artiku‐ lationsleistungen von Mädchen dokumentiert (vgl. Eisenberg et al. 1968; Garai/ Scheinfeld 1968; Templin 1957). Hingegen können im Lautdiskrimina‐ tionsvermögen (vgl. Ptok et al. 2006; Templin 1957) und im phonologischen Arbeitsgedächtnis (vgl. Patzelt 2011) im Kindergarten- und Vorschulalter keine Geschlechterunterschiede festgestellt werden. Was die Wortschatzentwicklung anbelangt, so scheint sich ein schnellerer Wortschatzzuwachs der Mädchen in den ersten zwei Lebensjahren oftmals zu 58 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung bestätigen (vgl. Klann-Delius 2005: 109). Im Alter von 8 bis 16 Monaten wurde eine höhere Leistung von Mädchen beim Verstehen von Lexemen gemessen und im Alter von 8 bis 30 Monaten wurde zudem ein Vorteil der Mädchen bei der Wortschatzproduktion festgestellt (vgl. Fenson et al. 1994). Andersson et al. (2011) führten ebenfalls eine Studie mit 295 schwedischen Kleinkindern im Alter von 8 bis 24 Monaten durch und untersuchten die Frage, ob es im pro‐ duktiven Wortschatz ihrer Erstsprache Schwedisch Geschlechterunterschiede gab. Während der Unterschied zwischen den 18 Monate alten Jungen und Mädchen in dieser Studie im Gegensatz zu Fenson et al. (1994) nicht signifikant war, zeigte sich für das Alter von 21 und 24 Monaten erneut ein signifikanter Geschlechterunterschied zugunsten der Mädchen (vgl. Andersson et al. 2011: 111). Huttenlocher et al. (1991), Feldman et al. (2000) und Luchtmaya et al. (2002) kamen in ihren Studien zu vergleichbaren Ergebnissen. Bornstein et al. (2004) fanden in den USA in ihrer Studie mit 329 Probandinnen und Probanden im Alter von 2 bis 5 Jahren große Geschlechterunterschiede zugunsten der Mädchen in einigen spezifischen und allgemeinen sprachlichen Fertigkeiten - inklusive produktivem Wortschatz, Wortschatzverstehen und Satzkomple‐ xität - jedoch keine Unterschiede im ersten und im sechsten Lebensjahr. Außerdem wurde bei Untersuchungen, die speziell den Erwerb logisch-seman‐ tischer Relationen in Form von kognitiven Strukturen des mentalen Lexikons (vgl. James/ Miller 1973; Shepard 1970) und in Form von Verstehensleistungen von logischen Konnektoren und von Negationen (vgl. Supples/ Feldman 1971) keinerlei Geschlechterunterschiede festgestellt. Schließlich konnten auch in Bremen hinsichtlich der Wortschatzkompetenz und des Satzverständnisses bei 4 692 Kindergartenkindern keine geschlechtsspezifischen Unterschiede erfasst werden (vgl. Kretschmann/ Schulte 2004). Darüber hinaus konnte Ende des 20. Jahrhunderts bei Kindern im Alter zwischen 17 Monaten und 7 Jahren festgestellt werden, dass Jungen ein größeres Wortschatzspektrum in Bereichen aufweisen, die traditionell männlichen Rollen zugeordnet werden konnten und Mädchen wiederum eher differenzierten Wortschatz in traditionell weiblich zugeordneten Rollen zeigten, wie z. B. Fahrzeugbezeichnungen im Falle von Jungen und Haushaltsgegenständen im Falle von Mädchen (vgl. Gipper 1985; Jessner 1992: 121). Inwiefern dies noch immer auf Kinder zutrifft, die im 21. Jahrhundert aufwachen, müsste erneut überprüft werden. Während sich also im Bereich des Wortschatzes oftmals deutliche, wenn auch nicht immer konsistente Unterschiede zugunsten der Mädchen finden lassen, werden beim Erwerb der Morphosyntax uneinheitlichere Ergebnisse erfasst, aus denen keine Beständigkeit hervorgeht und bei denen oftmals die 5.1 Endogene Faktoren 59 Effektstärken um einiges kleiner ausfallen als beim Wortschatz (vgl. Bornstein et al. 2004; Fenson et al. 1994; Lange et al. 2016: 1418), weshalb viele Forschende von einem kleinen oder sogar nicht existenten Geschlechterunterschied in diesem Bereich ausgehen (vgl. Bornstein et al. 2004; Hayiou-Thomas et al. 2012; Wallentin 2009). Daher gibt es im Bereich der Syntaxentwicklung auch einige Studien, die dem Stereotyp der weiblichen Überlegenheit widersprechen: Sie berichten beispielsweise davon, dass Jungen höhere Durchschnittwerte bei der Länge der Sätze erzielen als Mädchen (vgl. Smith/ Daglish 1977). Obwohl es der Fall zu sein scheint, dass Mädchen schneller von Einwortzu Zweiwortäu‐ ßerungen übergehen als Jungen (vgl. Ramer 1976), bleibt wiederum fraglich, ob Mädchen auch bei der weiteren Syntaxentwicklung schneller sind, da beispielsweise Koenigsknecht und Friedman (1976) eine schnellere Entwicklung bei den Mädchen fanden, Templin (1957) hingegen keine Unterschiede in der Entwicklungsgeschwindigkeit feststellen konnte. Bezüglich der Komplexität der syntaktischen Äußerungen konnten wiederum in verschiedenen Alters‐ stufen keinerlei geschlechtsspezifische Unterschiede gefunden werden (vgl. Braun/ Klassen 1971; Moore 1967; Templin 1957). Es stellt sich also die Frage, inwiefern sehr frühe Entwicklungen in der Geschlechterforschung bezüglich des Fremdsprachenlernens die Auffassung des Geschlechterverhältnisses bis heute prägen. Die Studie von Lange et al. (2016) mit drei Samples und insgesamt 10 067 Probandinnen und Probanden belegte schließlich ebenfalls signifikante Vor‐ teile von Mädchen in den Bereichen Wortschatz, Grammatik, Spontansprache, Sprachverstehen und Arbeitsgedächtnis im Alter von 3 bis 4 Jahren; im Alter von 5 bis 6 Jahren waren diese Unterschiede aber verschwunden (vgl. Lange et al. 2016: 1428, 1430). Außerdem wurde bei Jungen eine viel größere Varianz der Leistungen gemessen als bei Mädchen (vgl. Lange et al. 2016: 1430). Klann-Delius (2008: 109) kommt bezüglich der frühkindlichen Entwicklung und der Variable Geschlecht zu folgender zusammenfassender Schlussfolge‐ rung: „Die Laut- und Wortschatzentwicklung vollzieht sich bei Mädchen früher und rascher als bei Jungen. Für die Syntaxentwicklung konnten keine eindeu‐ tigen Geschlechterdifferenzen ermittelt werden.“ Es bleibt hinzuzufügen, dass viele der im Kleinkindalter gemessenen Geschlechterunterschiede oftmals bis zum Eintritt in die Grundschule, d. h. im Alter von 6 Jahren nicht mehr existent sind (vgl. Beltz et al. 2013; Bornstein et al. 2004; Lange et al. 2016; Wallentin 2009). Betrachtet man zusätzlich zu den erstsprachlichen Fähigkeiten auch zweit- und fremdsprachliche Leistungen von Kindern unter sechs Jahren, so konnten beispielsweise im Englischen weder im rezeptiven L2-Wortschatzwissen noch 60 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 21 In den IGLU-Studien (vgl. Bos et al. 2003; Bos et al. 2012; McElvany et al. 2017) wurden, ähnlich wie dies bei den Ländervergleichsstudien auf Bundesebene der Fall war (vgl. Böhme et al. 2016; Winkelmann/ Groeneveld 2010), erhebliche Unterschiede zwischen den einzelnen teilnehmenden Ländern bezüglich der statistischen Relevanz und Größe der Geschlechterdisparitäten festgestellt: Während bei IGLU 2011 (vgl. Bos et al. 2012: 127) in Italien keine signifikanten Geschlechterunterschiede in der erstsprachlichen Leseleistung von Jungen und Mädchen gefunden wurden, war der Leistungsvorsprung von Mädchen bei der Leseleistung in England überdurchschnittlich deutlich ausgeprägt. In Deutschland war der Unterschied zugunsten der Mädchen ebenfalls signifikant, jedoch geringer als in vielen anderen teilnehmenden Ländern. in den rezeptiven L2-Grammatikkenntnissen (vgl. Häckel/ Piske 2016; Rohde 2010; Rohde/ Tiefenthal 2002; Steinlen 2016; Steinlen et al. 2010) geschlechtsspe‐ zifische Unterschiede gefunden werden (vgl. Steinlen et al. 2019 für eine Über‐ blicksdarstellung). Auch im Französischen konnten in der Vorschule keinerlei Unterschiede zwischen Mädchen und Jungen bezüglich des rezeptiven L2-Wort‐ schatzwissens ermittelt werden (vgl. Natorp 1975). Diese Befunde zeigen, dass sich die teilweise im Erstspracherwerb erfassten Geschlechterunterschiede oftmals nicht in den zweit- und fremdsprachlichen Kompetenzen widerspiegeln. Bezüglich der schulischen Leistungen während der Grundschulzeit finden einige Studien erneut Leistungsvorsprünge der Mädchen im Fach Deutsch bzw. in anderen muttersprachlichen Fächern anderer Länder; insbesondere in den Bereichen Lesekompetenz und Rechtschreibung werden Vorteile bei den Mädchen ausgemacht (vgl. Bos et al. 2003; Bos et al. 2012; McElvany et al. 2017; May 2006b: 121; Mielke et al. 2006: 100; Schneider et al. 1997; Stanat/ Kunter 2001). 21 Ferner werden im fremdsprachlichen Fach Englisch teilweise Geschlechterunterschiede zugunsten der Mädchen gemessen, wie beispielsweise in der BIG-Studie (vgl. BIG-Kreis 2015). Allerdings wurden bei dieser Studie die Schulnoten als Referenz herangezogen (vgl. BIG-Kreis 2015: 13), was, wie in Kapitel 4.1 erläutert wird, nur bedingt aussagekräftig ist. Neben den Studien, die in erst- und fremdsprachlichen Fächern Geschlech‐ terunterschiede erfassen, gibt es aber im Grundschulbereich insbesondere hinsichtlich der fremdsprachlichen Kompetenzen zahlreiche Forschungsergeb‐ nisse, die keinerlei Unterschiede ermitteln: KESS 4 (vgl. Bos/ Pietsch 2006) testete beispielsweise das Hörverstehen von Hamburger Viertklässlerinnen und Viertklässlern im Englischen und fand keine geschlechtsspezifischen Unterschiede (May 2006a: 210; vgl. auch Kapitel 4.2). Jiménez Catalán und Terrazas Gallego (2005-2008: 183) untersuchten das rezeptive Vokabular in der Fremdsprache Englisch von 270 spanischsprachigen Viertklässlerinnen und Viertklässlern, die im Durchschnitt 10.3 Jahre alt waren und konnten ebenfalls keine signifikanten Geschlechterunterschiede finden. Steinlen (2018) 5.1 Endogene Faktoren 61 22 Das erste Lernjahr begann entweder in der 1., 2., 3. oder 4. Jahrgangsstufe (vgl. Uhl et al. 2020). fand darüber hinaus keine Geschlechterunterschiede in den Englischleistungen im rezeptiven L2-Wortschatzwissen und in den rezeptiven L2-Grammatikkom‐ petenzen von 370 Viertklässlerinnen und Viertklässlern, und zwar weder im traditionellen Englischunterricht noch in Bilingualen Programmen. Uhl et al. (2020: 75) konnten überdies keinerlei Geschlechterunterschiede im Hörsehver‐ stehen, im freien monologisch-deskriptiven Sprechen und in der Flüssigkeit beim leisen Lesen von 263 Grundschülerinnen und Grundschülern am Ende des ersten Lernjahrs Französisch als AG oder Zusatzangebot im Ganztag finden. 22 Im Laufe der Sekundarstufe I ist bezüglich der fremdsprachlichen Fächer tendenziell zu beobachten, dass sich die Vorsprünge der Mädchen oftmals insbesondere im Hörverstehen, Leseverstehen und in der Textrekonstruktion verstärken (vgl. Bos et al. 2009a; Konsortium HarmoS Fremdsprachen 2009: 39; Manno 2017; Winkelmann/ Groeneveld 2010), im Sprechen teilweise die Jungen Vorteile zeigen (vgl. DESI-Konsortium 2008; Hartig/ Jude 2008) und die geschlechtsspezifischen Unterschiede sich ab der 9. Jahrgangsstufe teilweise verringern oder verschwinden, was in Kapitel 4.2 ausführlich dargelegt wurde. Budde (2008: 21) argumentiert beispielsweise als Reaktion auf die DESI-Studie (vgl. DESI-Konsortium 2008) und bezüglich eines möglichen geschlechtsspezi‐ fisch unterschiedlichen Lernzuwachses, welcher auch in der LAU-Studie (vgl. Lehrmann et al. 2004) erfasst wurde, dass die Bildungsmisserfolge der Jungen in Englisch mit zunehmendem Alter allmählich verschwänden und begründet dies mit einem zeitverschobenen Kompetenzerwerb der Jungen. Demzufolge würden Jungen erst zu einem späteren Zeitpunkt in ihrer schulischen Entwicklung die Bedeutung der Fremdsprache Englisch erkennen und erst dann motivierter sein, diese zu erlernen (vgl. auch Christ 1996: 23). Dieselbe Hypothese stellen auch Meißner et al. (2008: 158) auf und behaupten darüber hinaus, dass an der DESI-Studie eventuell ablesbar sei, dass die Jungen über das Sprechen in den anderen Kompetenzbereichen aufholen würden. Meißner et al. (2008: 158) gehen zudem davon aus, dass dieser Effekt in den zweiten Fremdsprachen wie Französisch oder Spanisch genauso, allerdings deutlich später auftritt. Somit ist die Annahme inzwischen relativ weit verbreitet, dass die Entwicklung der fremdsprachlichen Leistungen insgesamt bei Mädchen und Jungen zeitversetzt verläuft. Die männlichen Lernenden scheinen folglich im Laufe der späten Adoleszenz und des (frühen) Erwachsenenalters aufzuholen und die weiblichen Lernenden sogar teilweise zu überholen. Budde (2008: 21) unterstreicht außerdem, dass 62 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 23 Die nach jeweiliger Stichprobengröße gewichtete mittlere Effektstärke zur Berechnung von Geschlechterunterschieden lag bei d-=-.11 (d-=-.02 im Bereich Wortschatz, d-=--.16 bei Analogiebildungen, d-=-.03 im Leseverstehen, d = .09 im Verfassen von Essays, d = .22 bei der Bildung von Anagrammen und als höchste gemessene Effektstärke d-= .33 bei der Sprachproduktion; vgl. Hyde/ Linn 1988: 56-61). Studien zum bilingualen Physikunterricht in den Jahrgangsstufen 7 bis 10 (vgl. Willems 2007) zeigen, dass diese Unterrichtsform aufgrund des Fokus auf die naturwissenschaftlichen Inhalte nicht als Sprachunterricht aufgefasst würde und dadurch das Interesse der Jungen besser aufrechterhalten werden könne als im traditionellen Fremdsprachenunterricht, was Budde (2008: 21) erneut mit den teilweise stärker ausgeprägten Kompetenzen der Jungen in fachsprachlichem Englisch begründen. Schließlich verweist auch die Study of Reading Literacy von Wagemaker (1996) darauf, dass in der Adoleszenz Entwicklungsvorsprünge der Mädchen durch die Jungen aufgeholt werden können. MacIntyre et al. (2002: 543) fassen bezüglich der unterschiedlich raschen Entwicklung beim fremdsprachlichen Kompetenzerwerb und Kommunikati‐ onsverhalten von Jungen und Mädchen treffend zusammen: “Sex likely interacts with age to influence L2 communication variables because of differences in boys’ and girls’ developmental path during adolescence.” Eine dritte Position, die zur Erläuterung der Wechselwirkung der Variablen Alter und Geschlecht beiträgt, sieht schließlich das ganze Leben lang keinerlei nennenswerten Geschlechterunterschiede bezüglich der sprachlichen Fähig‐ keiten: Diese Position begründet sich auf zahlreichen Studien, die Eingang in die Metaanalyse von Hyde und Linn (1988) fanden: Die beiden Forschenden analysierten 165 Studien, die vorwiegend aus den 50er bis 70er Jahren stammten, und untersuchten dabei die sprachlichen Fähigkeiten von Kindern im Alter von 2 Jahren bis hin zum Erwachsenenalter. Untersuchungsgegenstand waren insbesondere die Effektstärken bei der Untersuchung von Geschlechterunter‐ schieden in sprachlichen Fähigkeiten, die als Cohens d in insgesamt 120 der 165 Studien vorlagen. Bei gemeinsamer Analyse der Bereiche Wortschatz, Analo‐ giebildungen, Leseverstehen, Verfassen von Essays, Bildung von Anagrammen und Sprachproduktion hinsichtlich Geschlechterunterschieden kamen Hyde und Linn (1988) auf einen vernachlässigbaren Effekt. 23 Eine Verstärkung des Geschlechtsunterschieds ab dem Alter von 10 oder 11 Jahren, wie sie zuvor von Maccoby und Jacklin (1974) proklamiert worden war, konnte in der Studie von Hyde und Linn (1998) nicht bestätigt werden. Daher kamen sie zu folgendem Schluss: “The difference is so small that we argue that gender differences in verbal ability no longer exist” (Hyde und Linn 1988: 53). 5.1 Endogene Faktoren 63 24 Einzig und allein bezüglich Muskelmasse und gewissen physischen Leistungen, in denen Jungen und Männer höhere Werte erzielen, körperlicher Aggression (physical agression), die bei Jungen und Männern stärker ausgeprägt ist und psychologischer und verbaler Aggression (relational agression, verbal agression), die bei Mädchen und Frauen oft stärker ausgeprägt ist, sowie im Bereich Sexualität fanden sich teilweise starke Effekte (vgl. Hyde 2005: 586). Die Annahme der inexistenten Geschlechterunterschiede in sprachlichen und anderen Fähigkeiten wird auch im 21. Jahrhundert weiter aufrechterhalten: Hyde (2005) proklamiert die Gender Similarities Hypothesis, welche daran fest‐ hält, dass sich Mädchen und Jungen bzw. Männer und Frauen in den meisten, wenn auch nicht in allen, psychologischen Variablen sehr ähnlich sind. 24 Sie untermauert diese Hypothese durch die Ergebnisse aus ihrer Metastudie von 2005, die ihrerseits 46 Metaanalysen untersuchte (vgl. Hyde 2005: 581): Hierbei fand sie auch bei traditionell von Geschlechterunterschieden gekennzeichneten psychologischen Variablen wie mathematischen Leistungen oder sprachlichen Fertigkeiten vernachlässigbare Effekte. Allerdings konnten ausgehend von dieser letzten Metastudie keine Angaben zur genauen sprachlichen Entwicklung in den einzelnen Lebensphasen bezüglich Geschlechterunterschieden abgeleitet werden (vgl. Hyde 2005: 586). Dennoch wird ersichtlich, dass sich alle phasen‐ weise existierenden Unterschiede im Laufe des Lebens auszugleichen scheinen. In der vorliegenden Studie wird ausgehend vom Stand der Forschung zum Themenkomplex „Alter und Geschlecht“ das Hauptaugenmerk bewusst auf die 9. Jahrgangsstufe und somit auf die Adoleszenz gelegt. Die Konzentration auf die Adoleszenz beeinflusst das Studiendesign insofern, dass neben den allgemeinen Lernerfaktoren wie Motivation und kognitiven Faktoren auch Variablen wie die wahrgenomenen Erwartungen der Peers im Zentrum der Untersuchung stehen (vgl. van Houtte 2004, Kissau 2006a). Insbesondere bei er Erfassung affektiver Faktoren wird außerdem immer wieder geprüft, inwiefern sich diese auf der Grundlage der bisherigen Sprachlernerfahrungen bereits auf verschiedene Kulturkreise innerhalb des frankophonen Raums beziehen können und inwiefern die Jugendlichen bereits Pläne für ihre persönliche und berufliche Zukunft schmieden (vgl. Kapitel 9.3.4). Auch bei der Auswahl der Testaufgaben wird auf altersgemäße Inhalte und Sprache geachtet (vgl. Kapitel 9.2). Insgesamt stellt sich die Frage, inwiefern bereits der von Wagemaker (1996), Budde (2008) und Meißner et al. (2008) genannte Effekt zu erkennen ist, dass die Jungen die Mädchen im Laufe der Adoleszenz oder im frühen Erwachsenenalter überholen. Jedoch wird insbesondere bei der Interpretation der Ergebnisse nicht außer Acht gelassen, dass es sich bei der vorliegenden Studie lediglich um eine Momentaufnahme, welche aufgrund der mannigfaltigen Entwicklungen im 64 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Lebensabschnitt der Adoleszenz bei erneuter Durchführung voraussichtlich zu anderen Ergebnissen führen würde (vgl. Kapitel 12). Im Anschluss wird nun, aufbauend auf den bereits dargelegten Erkenntnissen zu fremdsprachlicher Leistung, Geschlecht und altersbedingter Entwicklung eine Analyse des Stands der Forschung zu den kognitiven und neurologischen Faktoren vorgenommen, die mit dem Geschlecht in Wechselwirkung stehen. 5.1.2 Kognitive, neurologische Faktoren, Geschlecht und sprachliche Leistung Wie bereits in Kapitel 2 im Rahmen der Definition von Geschlecht und Gender erläutert wurde, beeinflussen sowohl biologische als auch soziokultu‐ relle Aspekte den Spracherwerb und das Fremdsprachenlernen von Jungen und Mädchen. Im Folgenden wird die biologische Ebene des Geschlechts (nature) aus theoretischer Sicht analysiert und der Frage nachgegangen, welche Erkenntnisse nach aktuellem Stand der Forschung bezüglich des Zusammen‐ hangs zwischen neurologischen und kognitiven Faktoren, Geschlecht und (fremd)sprachlicher Leistung existieren. Diesbezüglich können, ähnlich wie beim Themenkomplex „Alter und Geschlecht“, unterschiedliche Positionen innerhalb des Forschungsdiskurses ausgemacht werden: Die erste Position geht davon aus, dass Jungen und Mädchen bzw. Männer und Frauen aufgrund kleiner geschlechtsspezifischer Unterschiede der neuro‐ nalen Organisation „Sprachen teils offensichtlich völlig unterschiedlich lernen und gebrauchen“ (Böttger 2016: 79-80; vgl. auch Baron-Cohen 2004) und dass klare Vorteile des weiblichen Gehirns bezüglich der Ausbildung sprachlicher Fertigkeiten zu beobachten seien, weshalb Mädchen und Frauen Fremdsprachen leichter und schneller erlernen würden als Jungen und Männer (vgl. z. B. Böttger 2016: 83; Shaywitz et al. 1995). Eine zweite Position sieht keinerlei Unterschiede zwischen dem weiblichen und dem männlichen Gehirn (vgl. z. B. Wallentin 2008) und folglich auch keinerlei Auswirkungen auf das Fremdsprachenlernen und eine dritte Position hält daran fest, dass bis heute jegliche Evidenz fehlt, um sich diesbezüglich festzulegen (vgl. z. B. OECD 2007). Alle drei Positionen werden im Folgenden näher erläutert und kritisch diskutiert. Bezüglich der ersten Position, die von kognitiven und neuronalen Geschlech‐ terunterschieden ausgeht, die das Fremdsprachenlernen erheblich beeinflussen, wodurch Vorteile bei weiblichen Lernenden zustandekommen sollen, werden immer wieder einzelne geschlechtsspezifisch ausgeprägte Bereiche und Funk‐ tionen des Gehirns aufgelistet, die als wissenschaftlich gesichert gelten. Im Zentrum steht jedoch die Frage, inwiefern ein Kausalzusammenhang dieser 5.1 Endogene Faktoren 65 mit einzelnen Vorteilen bei bestimmten sprachlichen Fertigkeiten von Jungen und Mädchen bzw. Männern und Frauen tatsächlich angenommen werden kann. Im Folgenden werden die zentralen Befunde dargelegt, die über die bereits in Kapitel 5.1.1 erläuterten Forschungsergebnisse zur Entwicklung des Spracherwerbs und des Fremdsprachenlernens in verschiedenen Altersspannen hinausgehen. Ein Argument, das von denjenigen Forschenden angeführt wird, die diese erste Position vertreten, betrifft die Häufigkeit der Sprachstörungen: Bei Jungen werden häufiger ADHS, Stottern und Lese-Rechtschreib-Schwäche diagnosti‐ ziert als bei Mädchen, wobei die statistischen Ergebnisse in diesem Bereich sehr robust und konstant sind (vgl. Bornstein et al. 2004; Gerlach 2010: 18; Sambanis 2013: 56; Szagun 2016). Lange et al. (2016: 1418) weisen als Gegenargument aller‐ dings darauf hin, dass die isolierte Betrachtung dieses Phänomens ausklammert, dass gleichzeitig die Mehrzahl derjenigen Berufe, die mit hoher sprachlicher Kompetenz in Verbindung stehen, wie beispielsweise Autorin bzw. Autor (vgl. Lange/ Euler 2014), Berufe im Bereich des Journalismus, der Politik, der höheren Bildung und Berufe, die das Sprechen in der Öffentlichkeit als Haupttätigkeits‐ gebiet haben (vgl. Burling 1986, 2005; Halpern 2000) von Männern ausgeübt werden. Obwohl dies auch stark durch soziale Faktoren bedingt sein könnte, beobachten Lange et al. (2016: 1418) auch das statistische Phänomen der sogenannten phänotypischen Varianz männlicher Sprecherinnen und Sprecher, die zum einen darin begründet liegt, dass oftmals eine höhere Leistungsvarianz bei männlichen Lernenden festzustellen ist (vgl. z. B. Hedges et al. 1995 und Strand et al. 2006 für die Wortschatzleistung und Strand et al. 2006 Wortschatz- und Syntaxleistung) und zum anderen, dass Jungen und Männer an beiden Enden der Leistungsspanne oftmals überrepräsentiert seien. Ein zweites Phänomen, das sehr häufig genannt wird, um die weibliche Überlegenheit beim Fremdsprachenlernen aus neuronaler Perspektive zu unter‐ streichen, ist die Lateralisierung. Sie bezeichnet den Prozess der Lokalisierung von Gehirnfunktionen entweder in der rechten oder in der linken Hemisphäre (vgl. OECD 2007: 47): Shaywitz et al. (1995) erkennen beispielsweise gehirn‐ morphologische Geschlechterunterschiede bezüglich der Lateralisierung: Diese vollzieht sich hinsichtlich der sprachlichen Funktionen derart, dass die linke Hemisphäre bei der Verarbeitung sprachlicher Reize an Dominanz gewinnt, wobei gleichzeitig die Aktivität der rechten Hirnhälfte gehemmt wird. Bei Mäd‐ chen vermeiden allerdings spezielle Geschlechtshormone diesen Hemmprozess. Die Studie von Weiss et al. (2003) mit 97 College-Studentinnen und Studenten kam beispielsweise zu dem Ergebnis, dass die weiblichen Teilnehmerinnen signifikant besser im Abrufen von Wörtern waren, die mit einem bestimmten 66 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Buchstaben beginnen als die männlichen Probanden und führt dies auf die La‐ teralisierung zurück: Über neuronale Konnektivitätsanalysen wurde ermittelt, dass Mädchen stärker und zu einem höheren Grad als Jungen funktionell sym‐ metrisch organisiert beide Gehirnhälften einsetzten, um effizienter sprachliche Aufgaben zu lösen (vgl. Weiss et al. 2003). Laut den Theorien zur Lateralisierung nützten Jungen hingegen vor allem die linke Hemisphäre, in der mit dem Broca- und dem Wernicke-Zentrum die wichtigsten Sprachzentren verortet sind, um sprachliche Aufgaben zu lösen (vgl. Böttger 2016: 86; Shaywitz/ Shaywitz 2008: 13). Daher würden Mädchen und Frauen durch das Phänomen der Lateralisie‐ rung 20 bis 30% mehr Hirnanteile für die Sprache nutzen als Jungen und Männer, wodurch die weibliche Überlegenheit zu begründen sei (vgl. Böttger 2016: 87, 95; Böttger/ Sambanis 2017: 21). Ein dritter zerebraler Prozess, der im Zusammenhang mit Geschlechterun‐ terschieden beim Fremdsprachenlernen immer wieder genannt wird, ist die sogenannte Myelinisierung, die das Überziehen der Nervenfasern im Gehirn mit Markschichten, auch Myelin genannt, beschreibt (vgl. Konrad et al. 2013). Dieser Prozess vollzieht sich von Geburt an und endet im Laufe der Adoleszenz. Es wird berichtet, dass die Myelinisierung der Sprachzentren des Gehirns bei Jungen später erfolgt als bei Mädchen (vgl. Macintyre 2009; Seeman 2013: 1245). Mit diesem Prozess werden Vorteile von Mädchen in der Lese- und Schreibkompetenz sowie bei den feinmotorischen Fähigkeiten, die für die Anfer‐ tigung von Handschriften notwendig sind, in Zusammenhang gebracht; dabei ist von einem Vorsprung der Mädchen von bis zu drei Jahren die Rede sowie von einem Ausgleich der unterschiedlichen Entwicklungsgeschwindigkeit circa um das 18. Lebensjahr (vgl. Böttger 2016: 93-94; Böttger/ Sambanis 2017: 20). Aslin und Schlaggar (2006) sowie Chiang et al. (2009) warnen jedoch vor einer Überbewertung des Prozesses der Myeliniserung, da diese nur einen kleinen Teil der Sprachentwicklung darstelle. Auf Grundlage beobachteter neurologischer Prozesse wie beispielsweise der Myelinisierung entstand außerdem in den 1990er Jahren die sogenannte „Neurodidaktik“, welche didaktische Schlussfolgerungen aus neurologischen Befunden ableitet und dadurch versucht, eine gehirngerechte Didaktik, die sich unter anderem auf geschlechtsspezifische neuronale Prozesse beruft, als eigene Disziplin zu etablieren (vgl. Arnold 2002; Böttger 2016; Böttger/ Gien 2014; Böttger/ Sambanis 2018; Folta-Schoofs/ Ostermann 2019). Dieser Ansatz ist jedoch oftmals scharfer Kritik ausgesetzt, wobei ein Kritikpunkt darin liegt, dass die Neurodidaktik keinerlei Erkenntnisse hervorbringe, die Pädagogen zwingen würde, anders als bisher zu unterrichten (vgl. Westerhoff 2008: 38). Ein zweiter Kritikpunkt lautet, dass aus neurowissenschaftlichen Erkenntnissen nicht un‐ 5.1 Endogene Faktoren 67 mittelbar didaktische Empfehlungen ableitbar seien, wobei dieses Vorgehen als „naturalistischer Fehlschluss“ bezeichnet wird (vgl. Scheunpflug 2001: 36; Westerhoff 2008: 39). Vielmehr müssten didaktische Handlungsanweisungen interdisziplinär auf zahlreichen Befunden aus der Neurobiologie, aber auch unter anderem aus Erkenntnissen der Fremdsprachendidaktik, der Erziehungs‐ wissenschaft, der Zweitspracherwerbsforschung und der Lernpsychologie ge‐ stützt werden, um derart „naturalistische Fehlschlüsse“ zu vermeiden (vgl. Folta-Schoofs/ Ostermann 2019: 59). Die zweite zu beobachtende Position innerhalb der Erforschung der Relevanz von neurologischen Prozessen geht vielmehr davon aus, dass es keinerlei für das Sprachenlernen relevante Unterschiede im Gehirn von Männern und Frauen gibt: Die Metaanalysen von Sommer et al. (2004), die 26 Neuroimaging-Studien untersuchten, kamen beispielsweise zu dem Ergebnis, dass bei der Gehirnfunk‐ tion keine signifikanten Effekte bezüglich Geschlechterunterschieden, die die sprachliche Lateralisierung von Kindern und Erwachsenen betreffen, ausge‐ macht werden konnten. Manche Autorinnen und Autoren gehen sogar so weit, die Unterschiede des männlichen und des weiblichen Gehirns als neuromyth (Hyde 2005) zu deklarieren. Die dritte Position geht zwar von teilweise geschlechtsspezifischen Gehirn‐ prozessen aus, sieht aber bisher keinerlei Evidenz für den Rückschluss auf kon‐ krete Fremdsprachenlernprozesse: Bereits Bates et al. (1992) wiesen darauf hin, dass es zwar einige auffällige Parallelen in der neuronalen und der sprachlichen Entwicklung gibt, dass aber nicht geklärt sei, inwiefern bestimmte neuronale Entwicklungen auch sprachliche Entwicklungen auslösen würden. Auch die OECD (2007: 16) erklärte Rückschlüsse zu einem direkten Zusammenhang zwischen der Gehirnstruktur von Jungen und Mädchen und der sprachlichen Leistung als jenseits von Evidenz abgeleitet oder schlicht falsch. Dies bedeutet aber nicht, dass Studien, die der Frage nach der Wirkung der Interaktion von Ge‐ schlecht und neurologischen Faktoren auf die (fremd)sprachlichen Fertigkeiten und Leistungen nachgehen, nicht unter Umständen zielführend sein könnten, sondern lediglich, dass diesbezüglich noch nicht ausreichend Evidenz vorliegt (vgl. Driessen/ van Langen 2013: 71). Insgesamt zeichnet sich ab, dass gewisse physiologische Unterschiede zwi‐ schen Mädchen und Jungen hinsichtlich genetischer und hormoneller Voraus‐ setzungen sowie der Gehirnmorphologie bestehen und diese eine Entwicklung von teils unterschiedlichen Kompetenzen, Interessen und Vorlieben begüns‐ tigen könnten (vgl. Böhme et al. 2016: 377). Es bleibt jedoch nach wie vor unge‐ klärt, inwieweit diese biologischen Ausprägungen tatsächlich zur Entwicklung von Geschlechterunterschieden im fremdsprachlichen schulischen Bereich bei‐ 68 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung tragen. Daher ist nach wie vor nicht eindeutig belegt, dass bestimmte Prozesse auf neuronaler Ebene auch tatsächlich für bessere schulische fremdsprachliche Leistungen bei bestimmten Gruppen von Lernenden verantwortlich sind und dass gerade diese Prozesse zu Geschlechterunterschieden führen. Somit muss nach aktuellem Stand der Forschung ein direkter Zusammenhang zwischen neu‐ rologsichen Prozessen und fremdsprachlichen Leistungen, wie er beispielsweise von Böttger (2016) postuliert wird, stark infragegestellt werden. Diese kritische Infragestellung eines möglichen Zusammenhangs drängt sich regelrecht auf, da in aktuellen Schulleistungsstudien wie z. B. dem Ländervergleich 2009 (vgl. Winkelmann/ Groeneveld 2010) oder dem IQB-Bildungstrend 2015 (vgl. Böhme et al. 2016a) relativ starke Veränderungen in den Mustern der Bildungsbetei‐ ligung und im Erwerb von Bildungsabschlüssen sowie unterschiedlich stark ausgeprägte Geschlechterunterschiede je nach Teilkompetenz und Bundesland gefunden wurden (vgl. Böhme et al. 2016; Budde 2011; Kapitel 4.2). Außerdem lässt sich durch die ausschließliche Betrachtung der neuronalen Aspekte nicht erklären, weshalb der Geschlechterunterschied in der Ländervergleichsstudie in der 9. Klasse (vgl. Köller et al. 2010) in der Englischkompetenz kleiner war als in der Französischkompetenz. Insgesamt zeigt sich, dass sich die in Studien zur fremdsprachlichen schulischen Leistung erzielten Befunde nicht durch neurologische Befunde vorhersagbar gewesen wären. Darüber hinaus werden Einflüsse von affektiven Faktoren wie Motivation, Einstellungen und Stereotype sowie soziokulturellen Faktoren wie Bildungshintergrund und kommunikative Nützlichkeitsfaktoren auf die fremdsprachliche Leistung von Jungen und Mäd‐ chen in neurodidaktischen Diskursen oftmals völlig ausgeklammert, weshalb es oft zu monokausalen Erklärungsansätzen kommt (vgl. Westerhoff 2008). Böhme et al. (2016: 377) schließen daher aus der derzeitigen Befundlage, dass Geschlech‐ terunterschiede im Bildungsbereich in erster Linie aus Sozialisationseinflüssen und weniger aus kognitiven und neurologischen Ursachen resultieren. Das biologische, kognitive und neurologische Paradigma der Geschlechterforschung stellt aus diesen Gründen keinen primären Untersuchungsgegenstand der vor‐ liegenden Studie dar. Ein weiterer Grund für diese Entscheidung ist, dass neurologische Prozesse im Rahmen der Schulforschung nur sehr schwer zu erheben sind, da hierfür spezielle medizinische Untersuchungen zur Gehirn‐ morphologie inklusive entsprechender Geräte und Zustimmungen seitens der Testpersonen und ihrer Erziehungsberechtigten nötig wären. Darüber hinaus werden geschlechtsspezifische neuronale Faktoren derzeit weltweit erforscht und entsprechende Erkenntnisse wie beispielsweise die frühere Entwicklung von Myelinschichten in den Sprachzentren des weiblichen Gehirns (vgl. Chiang et al. 2009) könnten - unter der Voraussetzung des Vorliegens einer deutlichen 5.1 Endogene Faktoren 69 Evidenz - durchaus herangezogen werden, um die Ergebnisse der vorliegenden Studie zu interpretieren und zu diskutieren. Eine Forschungspraxis, die sich teilweise durchgesetzt hat und eine interes‐ sante Alternative zu neurologischen Messungen darstellt, ist, neben den fremd‐ sprachlichen Kompetenzen auch die kognitiven Grundfertigkeiten zu erheben, um so eine verbesserte Vergleichbarkeit der Geschlechtergruppen zu erreichen. Über solche Baseline-Testungen wird ermittelt, inwiefern allgemeine Intelligenz und weitere kognitive Grundfertigkeiten wie beispielsweise Konzentration bei verschiedenen Merkmalsgruppen ähnlich oder unterschiedlich ausgeprägt sind. Sind diese ähnlich ausgeprägt, verbessert sich die Vergleichbarkeit der Merk‐ malsgruppen und somit die Aussagekraft der jeweiligen Studie (vgl. Ekstrand 1980: 241; Möller/ Zaunbauer 2008; Steinlen 2018; Zaunbauer et al. 2009). Der Ansatz der kognitiven Baseline-Testung wird in der vorliegenden Studie verfolgt, indem der SPM-Test (Raven 2009) zur allgemeinen Intelligenz und der d2-R Test (Brickenkamp et al. 2010) zur Erhebung von Konzentrationsleistung, Sorgfalt der Arbeitsweise und Arbeitstempo eingesetzt werden (vgl. Kapitel 9 und 11.3). Fuchs (2013: 46) weist darüber hinaus darauf hin, dass oftmals in den Studien zum Einfluss des Geschlechts auf die fremdsprachliche Leistung zu wenig Bezug auf die erstsprachlichen Kompetenzen und die verbale Intelligenz genommen wird. Beispielsweise untersuchten Sparks et al. (2008: 169-170) in einer auf zehn Jahre angelegten Längsschnittstudie den Zusammenhang zwischen frühen Erst- und späteren Fremdsprachenkompetenz und fanden heraus, dass sich insbesondere erstsprachliche Erfolge in der Lesekompetenz, in der Orthogra‐ phie und im korrekten Vorlesen geschriebener Wörter positiv auf dieselben Kompetenzbereiche in der Fremdsprache auswirkten und dies unabhängig vom Geschlecht erfolgte. Dies ist ein Ansatz, der in längsschnittlichen Studien, die in der frühen Kindheit beginnen, zukünftig verstärkt in den Blick genommen werden sollte. Schließlich muss bedacht werden, dass sich diejenigen Erkenntnisse, die sich auf das soziale Geschlecht beziehen oftmals nur schwer vom biologische Geschlecht trennen lassen (vgl. Böttger 2016: 80; Kapitel 2), weshalb es oftmals ratsam ist, auf genaue Zuordnungen von einzelnen Leistungen zu einem der beiden Paradigmen zu verzichten. Nachdem nun das biologische Paradigma umfassend behandelt wurde, werden im Folgenden verstärkt affektive und soziale Faktoren, die mit dem Geschlecht in Interdependenz treten, in den Blick genommen. 70 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 25 Bezüglich der Bezeichnung der affektiven Faktoren gibt es unterschiedliche termino‐ logische Kategorisierungen: Schweinger et al. (2015) differenzieren beispielsweise zwischen motivationalen und affektiven Faktoren, wobei sie unter den motivationalen Faktoren das Fähigkeitsselbstkonzept, Selbstwert und Zielorientierung und unter den affektiven Faktoren Interesse und schulisches Wohlbefinden subsummieren (vgl. Schweiniger et al. 2015: 276). Seidel et al. (2016) trennen diese beiden Kategorien nicht und fassen alles unter affektiv-motivationalen Faktoren zusammen. In der vorliegenden Arbeit werden unter dem Oberbegriff der affektiven Faktoren sowohl motivationale als auch weitere affektive Faktoren subsummiert. 5.1.3 Affektive Faktoren und Geschlecht Aufgrund ihrer Intersektionalität, Überschneidungen und Überlappungen werden die für den Themenkomplex „Fremdsprachenlernen und Geschlecht“ relevanten affektiven Faktoren im Folgenden zunächst in ihrer Gesamtheit betrachtet, bevor die verschiedenen theoretischen Ansätze der L2-Motivations‐ forschung, welche sich gleichzeitig auch verstärkt in der Genderforschung wiederfinden, vorgestellt werden. Hierbei wird zunächst die L2-Motivation als Schlüsselvariable innerhalb der affektiven Faktoren beim Fremdsprachenlernen betrachtet (vgl. Legutke 2017: 254). Anschließend wird auf andere affektive Faktoren wie Interesse und Einstellungen eingegangen, die mit der L2-Motiva‐ tion in Beziehung stehen. 25 Aus der Komplexität des Motivationskonstrukts heraus entstanden unein‐ heitliche Definitionen (vgl. Oxford/ Shearin 1994: 13), wobei die Art von Motivation, die auf das Lernen einer Zweit- oder Fremdsprache abzielt, als L2-Motivation bezeichnet wird (vgl. Riemer 2016c: 30) und im Zentrum der nachfolgenden Ausführungen steht. Obwohl es sich bei der geplanten Studie um die Erforschung der L3-Motivation im Französischen und der L4-Motivation im Spanischen handelt, wobei es sich bei einzelnen Individuen mit mehrsprach‐ lichem Hintergrund durchaus auch um L5- oder L6-Motivation handeln kann, wird zunächst der Übersichtlichkeit halber der Terminus L2-Motivation gene‐ risch für die Fremdsprachenlernmotivation gebraucht und in späteren Kapiteln bezüglich der konkreten Sprachenfolge und Sprachlernbiographien präzisiert. Gardner (2005: 3) geht, als einer der bedeutendsten Forschenden auf dem Gebiet der L2-Motivation, von der Definition Kellers (1983: 389) aus und beschreibt das Motivationskonstrukt folgendermaßen: “Motivation refers to the choice people make as to what experience or goals they will approach or avoid and the degree of the effort they exert in this respect.” Dörnyei (1998: 118), der neben Gardner über mehrere Jahrzehnte umfassende Studien zur L2-Motivation durchführte, präzisiert den Zielaspekt von Motivation und definiert sie als “a process whereby a certain amount of instigation force arises, initiates action, 5.1 Endogene Faktoren 71 26 Interesse als Teil des Motivationskonstrukts wurde bereits von Keller (1983: 392) beschrieben und später präziser zur L2-Motivation in Bezug gesetzt (vgl. z.-B. Legutke 2017: 255). 27 Obwohl der Terminus Motivation oft synonym zu Motiv verwendet wird, soll hier noch einmal klargestellt werden, dass die Nennung von Motiven die Frage beantwortet, warum jemand etwas lernen möchte, weshalb Motive lediglich einen Teil einer länger‐ fristigen Motivation darstellen (vgl. Kirchner 2004: 2). and persists as long as no other force comes into play to weaken it and thereby terminate action, or until the planned outcome has been reached.” Motivation beinhaltet also zum einen den Wunsch, ein Ziel zu erreichen sowie gleichzeitig eine zielgerichtete Anstrengung in Form des Aufbringens von Energie, um auf das entsprechende Ziel hinzuarbeiten (vgl. Oxford/ Shearin 1994). Gardner (1985: 6) fügt hinzu, dass auch vorteilhafte Einstellungen zu den Lernaktivitäten vorhanden sein müssen und Ager (2001: 9) sieht neben Zielen auch Bedürfnisse und Einstellungen als Teil des Motivationskonstrukts an. Legutke (2017: 254) macht schließlich auch Zusammenhänge zwischen der L2-Motivation und Interessen sowie Sprachlernerfahrungen aus. 26 Mit letzterem meint er, basierend auf Riemer (2006: 44), die Auswahl der Themen und Aufgaben durch den Lernenden selbst, die sozialen Beziehungen im Klassenzimmer, das positive Erleben der eigenen Kompetenz sowie der Persönlichkeit der Lehrkraft, das Erfolgserleben im Unterricht sowie die persönlich motivierte Beschäftigung mit dem L2-Input, der außerhalb des Unterrichts zugänglich ist. Dies schließt auch den (durch die oder den motivierten Lernenden initiierten) Kontakt mit Sprecherinnen und Sprechern der Zielsprache ein (vgl. Legutke 2017: 255). Bezogen auf das Fremdsprachenlernen stellt L2-Motivation 27 folglich einen zentralen Faktor dar, der Einfluss darauf hat, ob ein Individuum überhaupt damit beginnt, eine Sprache zu erlernen, ob es die Lernanstrengung über einen längeren Zeitraum aufrechterhält, wie gut seine fremdsprachlichen Leistungen sind, wie oft es mit Muttersprachlerinnen und Muttersprachlern interagiert, wie effizient es Lernstrategien verwendet und ob es nach abgeschlossener Schullaufbahn die Fremdsprache weiterhin benutzt und weiterlernt oder nicht (vgl. Crookes/ Schmidt 1991: 473; Dörnyei 1994a, 2005; Kissau 2006a: 74; Kissau 2006b: 402; Oxford/ Shearin 1994). Im Umkehrschluss können selbst sehr in‐ telligente Lernende trotz qualitativ hochwertigen Fremdsprachenunterrichts scheitern, wenn sie zu wenig L2-Motivation verspüren. Aus anderer Perspektive betrachtet kann eine hohe L2-Motivation kognitive Defizite und schlechte Lernbedingungen zumindest bis zu einem gewissen Grad ausgleichen (vgl. Dörnyei 2005: 65). 72 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Da in der vorliegenden Studie insbesondere der Zusammenhang zwischen Geschlecht, Doing Gender, Motivation und fremdsprachlicher Leistung im Vor‐ dergrund steht, wird zunächst kurz erläutert, inwiefern der Einfluss von L2-Mo‐ tivation auf die fremdsprachliche Leistung eher als direkt oder aber indirekt beschrieben werden kann: Dörnyei (2001, 2005) weist darauf hin, dass L2-Mo‐ tivation nur indirekt mit dem Outcome bzw. der Leistung zusammenhängt, da sie per definitionem ein Antezedens von Verhalten und nicht von Leistung sei. So kommt er zu der Schlussfolgerung, dass Motivation Verhalten bestimmt und infolgedessen auch erklären könne, dass aber die Frage, ob dieses durch Motivation bestimmte Verhalten erfolgreich ist oder nicht, auf dieser Grundlage noch nicht beantwortet werden könne. Um das Verhältnis zwischen Motivation und Outcome zu erforschen, müssten daher ebenfalls die Fähigkeiten des Lernenden, die Lerngelegenheiten und die Qualität des Unterrichts untersucht werden. Als etwas zugespitzten Beleg dafür führt er die Tatsache an, dass kein Zusammenhang zwischen Motivation und Leistung besteht, wenn eine Aufgabe von den Schülerinnen und Schülern mit viel Enthusiasmus durchgeführt wird, diese Aufgabe jedoch völlig inadäquat ist und aus diesem Grund gar nicht zum Erfolg führen kann. Der vermittelnde Faktor Verhalten muss also immer beachtet werden, wenn das Verhältnis zwischen L2-Motivation und Outcome der Lernenden untersucht wird (vgl. Dörnyei 2005: 20). Bezüglich der Wechselwirkung zwischen Motivation und Lernerfolg wird außerdem noch immer darüber diskutiert, in welche Richtung diese stärker aus‐ geprägt ist: Die Kausalhypothese geht davon aus, dass L2-Motivation zum Erfolg führt, während die Resultativhypothese davon ausgeht, dass erst Lernerfolg Motivation auslöst. Jedoch ist stark davon auszugehen, dass beide Faktoren sich gegenseitig bedingen und die Stärke des jeweiligen Faktors auf den anderen von weiteren individuellen Variablen abhängt (vgl. Hermann 1978, 1980; Kirchner 2004: 4). Diese Relationen werden später im Laufe der Korrelations- und Re‐ gressionsanalysen auf statistische Relevanz innerhalb der vorliegenden Studie geprüft (vgl. Kapitel 11.8 bis 11.10). Zusammenfassend betrachtet werden in L2-Motivationsmodellen ausgehend von L2-Motivation als Schlüsselkomponente oft einige weitere affektive und teilweise auch weitere endogene und exogene Faktoren, die mit diesen in Beziehung stehen, in ihrem Gesamtkomplex erforscht. Aus diesem Grund weist Williams (1994: 84) auf die Komplexität des Motivationskonstrukts hin: “There is no room for simplistic approaches to such complex issues as motivation.” Pinnow (2010: 56) präzisiert dies hinsichtlich des Genderbezugs, indem sie resümiert, dass Motivation „sowohl biologischer, persönlicher, sozialer und gleichzeitig kultureller Natur“ ist und dass sich überdies „Motivation und 5.1 Endogene Faktoren 73 28 Diese Eigenschaften des Motivationskonstrukts sprechen dafür, dass neben quantita‐ tiven Verfahren auch qualitative Verfahren für dessen Erforschung gewinnbringend eingesetzt werden können (vgl. Kirchner 2004: 12). persönliche Ziele […] während der Sozialisation ontogenetisch langfristig ent‐ wickeln“, d. h. je nach Entwicklungsphase (und somit auch Genderidentität) und je nach Alter des Individuums unterschiedliche Ausprägungen annehmen. Es wird also deutlich, dass die Anzahl der Komponenten des Motivationskonst‐ rukts rasch unübersichtlich werden kann. Dörnyei (2001: 185-186) beschreibt die Komplexität von L2-Motivation durch drei wesentliche Merkmale: Zum einen ist Motivation ein abstraktes Konstrukt, das nicht direkt beobachtbar ist und mehrere mentale Prozesse inkludiert; mithin sind Forschende von den Äußerungen und Selbstdarstellungen einzelner Individuen abhängig und die über Motivation gewonnenen Erkenntnisse beruhen auf subjektiven Daten. Zum anderen stellt L2-Motivation ein multidimensionales Konstrukt dar, bei dem eine große Anzahl an inneren und äußeren Faktoren eine Rolle spielen, wodurch es zu vielfältigen Korrelationen kommen kann. Schließlich ist die L2-Motivation nicht konstant, sondern instabil und ergo im Laufe der Zeit veränderbar. Daher kann in der einmaligen Untersuchung der vorliegenden Studie nur ein Ausschnitt aus der L2-Motivation erfasst werden und es bleibt ungeklärt, wie konstant der gemessene Wert über eine längere Zeit bleibt (vgl. Kirchner 2004: 12). 28 Im Anschluss wird daher erläutert, welche Teilkonstrukte von L2-Motivation für die vorliegende Forschungsarbeit in Hinblick auf die Erklärung möglicher Unterschiede in der fremdsprachlichen Leistung in Französisch und Spanisch von Mädchen und Jungen in der 9. Jahrgangsstufe sowie bezüglich deren Doing Gender relevant sind. Außerdem stehen die Fragen im Mittelpunkt, wie diese Teilkonstrukte in der L2-Motivationsforschung zu verorten sind und wie sie zu anderen Lernerfaktoren in Beziehung zu setzen sind. - 5.1.3.1 Theorien und Modelle zur Erforschung der L2-Motivation Die verstärkte Erforschung der L2-Motivation lässt sich insbesondere seit den 1960er Jahren beobachten. Dörnyei (2005: 66-67) sowie Dörnyei und Ryan (2015: 72-105) unterscheiden in ihren Überblicksdarstellungen innerhalb der L2-Moti‐ vationsforschung drei Phasen: Die erste stellt die sozialpsychologische Phase von 1959 bis 1990 dar, die vor allem durch Forschungsarbeiten von Gardner (1968, 1985) und dessen Mitarbeiterinnen und Mitarbeitern in Kanada geprägt wurde (vgl. z.-B. Gardner/ Lambert 1972). Als Zweites ist die kognitionswissen‐ schaftliche Phase in den 1990er Jahren zu nennen, die durch die Konzeption von kognitiven Theorien in der Lernpsychologie beeinflusst wurde. Schließlich 74 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung spricht man seit den 2000er Jahren von der prozessorientierten Phase, die durch das Interesse an motivationaler Veränderung geleitet wird und vorrangig durch Dörnyei (2001, 2005) sowie Dörnyei und Ushioda (2009) eingeleitet wurde. Alle drei theoretischen Ansätze werden bis heute weiterentwickelt und weisen teilweise Überschneidungen auf. 5.1.3.1.1 Die sozialpsychologische L2-Motivationsforschung und deren Weiterentwicklung Ausgangspunkt für die sozialpsychologische Erforschung von L2-Motivation durch Gardner (1985) war die Koexistenz anglophoner und frankophoner Sprachgemeinschaften in Kanada und die Notwendigkeit, die Sprache der jeweils anderen Gemeinschaft zu erlernen, um dadurch die gelungene interkul‐ turelle Kommunikation zwischen den beiden ethnolinguistischen Gruppen auf‐ rechtzuerhalten und langfristig zu fördern. Diesen Ansatz verteidigte Gardner (1985: 6) ausgehend von folgender Hypothese: “Students’ attitudes toward the specific language group are bound to influence how successful they will be in incorporating aspects of that language.” Diese im heutigen Forschungskontext so offensichtlich erscheinende Annahme hatte damals zur Folge, dass von jenem Zeitpunkt an in der L2-Motivationsforschung zusätzlich zu den individuellen Faktoren auch sozialpsychologische Aspekte einschließlich der Beziehungen zwischen verschiedenen Sprachgemeinschaften näher untersucht wurden (vgl. Dörnyei 2005: 67). Nach dem sozialpsychologischen Ansatz handelt es sich demzufolge bei einer Fremdsprache keinesfalls um ein soziokulturell neutrales Feld, wie dies bei Inhalten der naturwissenschaftlichen Fächer meist prokla‐ miert wird, sondern um einen von Einstellungen gegenüber der jeweiligen Sprache, von kulturellen Stereotypen und schließlich auch um einen von geo- und sprachpolitisch geprägten Werten determinierten Lerninhalt. Aus diesem Grund weisen Lernende gegenüber unterschiedlichen Fremdsprachen auch unterschiedliche Einstellungen und kulturelle Stereotype auf, was in der vorliegenden Studie, in der Französisch und Spanisch als Fremdsprachen verglichen werden, besondere Berücksichtigung findet. Aus Gardners (1979, 1985, 2002, 2010) Forschungsarbeiten gingen sein lernsoziologisches Modell des Zweitspracherwerbs (Socio-Educational Model of Second Language Acquisition, SLA) sowie die Attitude Motivation Test Battery (AMTB), ein Fragebogen mit 130 Items zu verschiedenen Komponenten von L2-Motivation hervor, welcher sich zunächst auf den zweisprachigen eng‐ lisch-französisch geprägten Kontext Kanadas bezog, aber später auch in Asien, Südamerika und Europa eingesetzt wurde (vgl. Gardner et al. 1979; Meißner 2008: 23). Da die AMTB aber mit ihren 130 Items, die den Lernenden teilweise 5.1 Endogene Faktoren 75 redundant erscheinen mögen, sehr umfangreich ist und in einzelnen Bereichen als veraltet angesehen wird (vgl. Dörnyei/ Ryan 2015; Gardner/ MacIntyre 1993a), werden, auch in Anlehnung an Kissau (2006a) in der vorliegenden Studie ledig‐ lich einzelne Teilbereiche adaptiert und in den Schülerfragebogen integriert (vgl. Kapitel 9.3.4.1 und 9.3.4.2). Beim Socio-Educational Model of SLA handelt es sich um eine schematische Darstellung der Zusammenhänge der verschiedenen affektiven Faktoren, die zu L2-Motivation beitragen (vgl. Gardner 1979; Gardner/ MacIntyre 1993): Das Modell geht davon aus, dass sich L2-Motivation zum einen durch Einstellungen gegenüber der Lernsituation speist, welche sich ihrerseits aus der Beurteilung der Lehrkraft und des Unterrichts seitens des Lernenden zusammensetzt. Dieser Bereich wird in der vorliegenden Studie nicht erhoben, sondern zum einen durch das neuere Konzept der Willingness to communicate (WTC) ersetzt, da dieses das tatsächliche lernförderliche Verhalten der Schülerinnen und Schüler während des Unterrichts noch genauer widerspiegelt (vgl. MacIntyre et al. 2002; Kapitel 5.1.3.1.11 und 9.3.4.4). Die In-class L2 Willingness to communicate (WTC) bezeichnet die fremdsprachliche Gesprächsbereitschaft während des Fremdsprachenunterrichts (vgl. Mystkowska-Wiertelak/ Pawlak 2016: 21). Zum anderen wird die wahrgenommene Aufmerksamkeitsverteilung der Lehrkraft zugunsten der Mädchen erhoben, um Prozesse des Doing Gender innerhalb des Unterrichts genauer zu erfassen, die eventuell mit der fremdsprachlichen Leistung in Verbindung stehen könnten. Außerdem bedingt laut Gardner und MacIntyre (1993b: 8) Integrativität L2-Motivation, wobei sich diese aus integrativer Orientierung, Interesse an Fremdsprachen sowie aus den Einstellungen gegenüber der L2-Gemeinschaft zusammensetzt. Alle drei Teilkonstrukte werden in der vorliegenden Studie erhoben, wobei bei Interessen an Fremdsprachen und Einstellungen gegenüber der L2-Gemeinschaft aktuellere Konstrukte als diejenigen von Gardner und MacIntyre (1993) verwendet werden (vgl. Kapitel 9.3.4.1, 9.3.4.5 und 9.3.4.7). Als integrativ orientiert werden Fremdsprachenlernende klassifiziert, die das Ziel haben, mit Muttersprachlerinnen und Muttersprachlern in Kontakt zu treten, die Zielsprachenkultur besser zu verstehen, sich ganz in die Zielsprachenkultur zu integrieren und sich emotional mit ihr zu identifizieren (vgl. Gardner/ Lambert 1959; Gardner 1985: 11). Schülerinnen und Schüler sind demnach dann integrativ motiviert, wenn sie die Sprache vorrangig deshalb lernen, weil sie das Bedürfnis empfinden, eine maximale kommunikative Leistungsfähigkeit zu erlangen. Dies führt zu einer verstärkten Verbreitung der prestigeträchtigsten und der bereits am weitesten verbreiteten Sprachen (vgl. Meißner et al. 2008: 23). Integrativität ist eines der am meisten untersuchten Konzepte im Bereich der L2-Motivation 76 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 29 Diese Problematik erkennt auch Gardner (2001: 1) selbst, als er Folgendes feststellt: The “term is used frequently in the literature, though close inspection will reveal that it has slightly different meanings to many different individuals.” und eine hohe Anzahl an Studien zeigt eine statistisch relevante Korrelation zur Intensität der Lernarbeit (vgl. z. B. Clément et al. 1994; Dörnyei/ Kormos 2000), was ebenfalls dafür spricht, die Intensität der Lernarbeit in der vorliegenden Studie nicht zusätzlich zur integrativen Orientierung zu erheben. Wegen seiner hohen Relevanz für die L2-Motivation wurde das Konstrukt der Integrativität auch über das Socio-Educational Model hinaus zu einem Hauptbaustein mehrerer theoretischer L2-Motivationsmodelle (vgl. Dörnyei 2001; Kissau 2006a, 2006b). In seiner letzten Aktualisierung des Socio-Educational Model setzte Gardner (2010) die Bedeutung der integrativen Orientierung jedoch wieder etwas her‐ unter: Er betrachtet integrative Orientierung und Einstellungen gegenüber der Lernsituation nun als korrelierende Variablen, die Motivation beeinflussen und Motivation wird ihrerseits zusammen mit Language aptitude als Einflussfaktor auf die Leistung beschrieben (vgl. Kissau 2006a: 77), wobei hinzugefügt werden muss, dass Language aptitude nur schwer zu erfassen ist und unklar bleibt, in‐ wiefern diese angeboren ist oder sich im Laufe des Lebens weiterentwickelt (vgl. Schlak 2008). Gardner (2010) stellt schließlich fest, dass integrative Orientierung eine Komplexion aus Einstellungen darstellt, welche sowohl eine begünstigende Einstellung gegenüber der Gruppe der Zielsprachensprecherinnen und -spre‐ cher einschließt als auch Offenheit gegenüber anderen kulturellen Gruppen im Allgemeinen. Dörnyei kritisiert (2003: 5) das Konstrukt der Integrativität und unterstellt ihm einen rätselhaften Charakter, da es keine offensichtlichen Parallelen zu der allgemeinen Motivationspsychologie aufweise und dessen genaue Natur sehr schwer zu definieren sei, auch weil es auf kontextuellen Faktoren basiere (vgl. Csizér/ Dörnyei 2005: 21). 29 Aufgrund dieser Kritik erweiterten Dörnyei und Csizér (2002) die Definition von Integrativität, indem sie behaupteten, dass integrative Orientierung nicht zwingend mit einem tatsächlichen Wunsch des Lernenden verbunden sein müsse, sich zu einem aktuellen Zeitpunkt, wie von Gardner (1968, 1985, 2001) beschrieben, in die Zielsprachengemeinschaft zu integrieren, sondern dass es sich vielmehr um einen grundsätzlichen Iden‐ tifizierungsprozess mit Attributen, die mit dieser Zielsprachengemeinschaft assoziiert werden, handle (vgl. Csizér/ Dörnyei 2005: 29; Kissau 2006a: 76). Aus diesem Grund und zur besseren Erforschung der Integrativität machen sich Csizér und Dörnyei (2005: 29) die Forschungsarbeiten zu Possible Selves zunutze (vgl. z. B. Oyserman et al. 2004), welche als Teil der sozio-dynamischen L2-Motivationsforschung in Kapitel 5.1.3.1.3 näher erläutert wird. 5.1 Endogene Faktoren 77 Neben der integrativen Orientierung sehen Gardner und MacIntyre (1993b: 8) wie gesagt auch das Interesse an der jeweiligen Fremdsprache als Teil der In‐ tegrativität an. Nachfolgend wird dieses Konstrukt daher nach aktuellem Stand der Forschung näher definiert und zu ähnlichen Konstrukten abgegrenzt: Unter Interesse versteht man die besondere Beziehung zwischen einer Person und einem Gegenstand, d. h. einem Objekt, einem Thema oder einer Tätigkeit (vgl. Prenzel et al. 1986). Besonders ist die Beziehung deshalb, weil das Individuum positive emotionale Zustände während der Interessenshandlungen erfährt und dadurch dem Interessensgegenstand eine hohe subjektive Wertschätzung und persönliche Bedeutsamkeit beimisst (vgl. Krapp 2010). Interesse ist somit eine Voraussetzung für intrinsische Motivation, da es zu dem Wunsch führt, ein Thema genauer zu ergründen und sich vertieft damit auseinanderzusetzen. Es kommt oft zu einer persönlichen Identifikation mit dem Interessensgegen‐ stand und wenn dies geschieht, hat das Interesse oft auch Auswirkungen auf das Selbstkonzept (vgl. Hasselhorn/ Gold 2017: 101 ff.; vgl. Kapitel 5.1.3.1.3). Außerdem finden sich Zusammenhänge zwischen Interesse und Aufmerksam‐ keit (vgl. Renninger et al. 1985) sowie zwischen Interesse und Anstrengung (vgl. Krapp/ Lewalter 2001). Wenngleich Interesse, Motivation, Selbstkonzept und Einstellungen sich gegenseitig bedingen, gilt es für die Konzeption des Schülerfragebogens, Unterschiede zwischen den einzelnen Konstrukten heraus‐ zuarbeiten. Eine Abgrenzung von Interesse zu Einstellungen lässt sich insofern vornehmen, als dass die subjektive Wertkomponente des Interesses nicht zwangsläufig mit der Bewertungsdimension der Einstellungen gleichgesetzt werden kann: Individuen können sich auch trotz einer negativen Einstellung zu einem Themenkomplex stark für diesen interessieren (vgl. Krapp/ Ryan 2002: 70). Interesse unterscheidet sich außerdem von Motivation insofern, als dass keinerlei Zielsetzungen mit den Interessen verbunden sind (vgl. Rumlich 2016: 289). Außerdem ist Interesse immer stark auf konkrete Inhalte bezogen, was bei Motivation nicht immer der Fall ist (vgl. Krapp 2002a: 420). In der Psychologie werden viele Arten von Interesse unterschieden. Zunächst ist die Unterscheidung von individuellem und situationalem Interesse von Bedeutung: Während individuelles Interesse eine relativ stabile Tendenz be‐ schreibt, sich selbst mit dem Interessensgegenstand auseinanderzusetzen (vgl. Krapp 2002b: 388), bezeichnet situationales Interesse ein durch die Interessant‐ heit eines Gegenstands in einem konkreten Moment ausgelöstes Interesse, durch welches sich beispielsweise Schülerinnen und Schüler diesem zuwenden, wodurch ein Lernprozess initiiert wird (vgl. Krapp 2002b: 388). Situationales Interesse ist von Lehrkräften zu einem gewissen Grad positiv beeinflussbar 78 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 30 Daniels (2008: 26) definiert allgemeine Interessen als relativ überdauernde Handlungs- und Verhaltenstendenzen, die auf verschiedene Gegenstands-, Tätigkeits- oder Erleb‐ nisbereiche gerichtet sind. Spezifische Interessen umfassen hingegen konkrete Inhalte oder Gegenstände innerhalb des jeweiligen allgemeinen Interessensbereichs. (vgl. z. B. Riemer 2001) und kann zu individuellem Interesse führen (vgl. Hidi/ Renninger 2006). Im Folgenden wird aber im Spezifischen auf das Interesse im Zusammenhang mit den Fächern Französisch und Spanisch eingegangen. In diesem Kontext kann ein allgemeines Interesse, Französisch bzw. Spanisch zu lernen, von einem spezifischen Interesse am Fach Französisch bzw. Spanisch unterschieden werden, wobei beide in enger Wechselwirkung stehen können, aber nicht zwangsläufig müssen (vgl. Daniels 2008: 26; Fuchs 2013: 188-189). 30 So ist es beispielsweise möglich, dass eine Schülerin oder ein Schüler sich im Kontext der Schule für das Fach Spanisch interessiert, in ihrer oder seiner Freizeit aber anderen allgemeinen Interessen nachgeht (vgl. Daniels 2008: 27). Interessen bezüglich des Lernens von Fremdsprachen zeigen in zahlreichen Studien einen gewissen statistischen Einfluss auf die fremdsprachlichen Leis‐ tungen; dieser kann allerdings unterschiedlich stark ausfallen, auch abhängig davon, wie viele Einflussfaktoren insgesamt untersucht werden (vgl. Helmke et al. 2008; Rumlich 2016: 234; Zaunbauer et al. 2009). Rumlich (2016: 408) weist außerdem darauf hin, dass junge Schülerinnen und Schüler sich für diejenigen Fachbereiche interessieren, in denen sie gute Leistungen erzielen, was wiederum motivationsfördernd ist. Interesse hat auch oft einen hohen Einfluss auf die Fächerwahl bzw. auf die Wahl des sprachlichen Angebots. So konnte Christ (1996: 47 ff.) für die Jahre 1979 bis 1994 (n = 445) in Nordrhein-Westfalen feststellen, dass 80% der Abiturientinnen und Abiturienten im bilingualen Französischprogramm sich für dieses rein aus Interesse an der französischen Sprache entschieden hatten. Dementsprechend ist davon auszugehen, dass auch bei denjenigen Schülerinnen und Schülern, die Spanisch als dritte Fremdsprache freiwillig wählen, ein erhöhtes Interesse an der spanischen Sprache und somit auch am Spanischunterricht auftritt als dies vielleicht im Regelunterricht in der zweiten Fremdsprache Französisch, zu dem es oft ausschließlich die Alternative des Lateinunterrichts gibt, der Fall ist. Als dritten Bestandteil von Integrativität sehen Gardner und MacIntyre (1993b: 8) Einstellungen zur L2-Gemeinschaft an, weshalb diese ebenfalls in ihrer aktuellen Definition nachfolgend erläutert werden: Fast alle Studien zu L2-Motivation untersuchen gleichzeitig auch die Ein‐ stellungen zu den jeweiligen Sprachen (vgl. Csizér/ Dörnyei 2005: 21). Riemer (2002: 53), Edmondson und House (2011: 202-204), Roche (2013) und Reimann 5.1 Endogene Faktoren 79 (2015) attestieren dem Faktor Einstellung den Status als individuelle Lernerva‐ riable, welche eine Voraussetzung für den Fremdsprachenlernerfolg darstellt. Schmenk (2016: 254) deklariert Motivation und Einstellungen als einen Themen‐ komplex innerhalb der individuellen Lernervariablen, in dem auf unterschied‐ lichen Ebenen Geschlechterunterschiede nachgewiesen wurden. Daher sollen die Einstellungen Teil der Fragebogenstudie sein. In der Psychologie versteht man unter einer Attitüde „eine zusammenfas‐ sende Beurteilung eines Objekts oder einer Idee“ (Bohner/ Janke 2002: 5, über‐ setzt durch Meißner et al. 2008: 15). Crystal (2008: 266) beschreibt aus soziolingu‐ istischer Sicht sprachliche Einstellungen als Empfindungen, die Menschen ihrer eigenen Sprache und fremden Sprachen entgegenbringen, welche positiv oder negativ sein können. Es muss allerdings hinzugefügt werden, dass der Begriff der Einstellung nicht nur auf Empfindungen, also eine affektive Komponente be‐ schränkt ist, sondern auch eine kognitive (Wissen, Gedanken, Überzeugungen, Ideen, Werte) und eine konative Komponente besitzt (vgl. Meißner et al. 2008: 15). Mit der kognitiven Komponente eng verbunden ist das kulturelle Interesse, welches die Wertschätzung von kulturellen Produkten widerspiegelt, die durch die Medien übertragen werden, also z. B. Filme, Videos, Fernsehprogramme, Musik, Zeitschriften und Bücher. In manchen Lernumgebungen ist der direkte Kontakt zu Zielsprachensprecherinnen und -sprechern sehr gering und dennoch ist es möglich, dass die Zielsprachengemeinschaft durch indirekten Kontakt mit ihr den Lernenden bekannt ist, und zwar durch den Kontakt mit einer Reihe von Produkten und Artefakten aus der Zielsprachengemeinschaft (vgl. Csizér/ Dörnyei 2005: 21). Die Ergebnisse von Csizér und Dörnyei (2005) zeigten, dass diese mediengestützte Komponente eine besondere Rolle dabei spielt, den Fremdsprachenlernenden die Zielsprachenkultur näherzubringen und somit davon auch die Bildung ihrer Einstellungen gegenüber der Zielsprachengemein‐ schaft abhängt. Allerdings sind verbal fassbare Einstellungen zunächst einmal nur Oberflächenmanifestationen von tieferen Überzeugungen und insbeson‐ dere von latenten und impliziten Wertehaltungen, welche über Befragungen dementsprechend nur schwer untersucht werden können (vgl. Meißner et al. 2008: 15). Kissau (2006b: 405) betont, dass eine Kausalbeziehung zwischen L2-Moti‐ vation und Einstellungen zur Sprache insofern besteht, als dass die unter be‐ stimmten Gesellschaftsmitgliedern vorherrschenden negativen Konnotationen der Zielsprachengemeinschaft die Wahrscheinlichkeit senken, dass diese deren Sprache erlernen möchten. Die konative Komponente der Einstellungen könnte laut Meißner et al. (2008) wiederum als Bindeglied zwischen Einstellungen und Motivation einerseits und beobachtbarem Verhalten andererseits fungieren, 80 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung wobei die Forschergruppe darauf hinweist, dass es immer noch an Stichhal‐ tigkeit mangelt, um die Beziehung zwischen Einstellungen und Handlungen nachzuweisen (vgl. Meißner et al. 2008: 15). Jedoch sind laut Fasold (1984) und Meißner et al. (2008) insbesondere fünf attitudinale Implikationen aus den bisherigen Forschungsergebnissen ableitbar: Einstellungen zu einer Sprache korrelieren mit Einstellungen gegenüber den Sprecherinnen und Sprechern der Sprache und verändern die Sichtweise auf die betroffene sprachliche Va‐ rietät. Sie können beeinflussen, wie Lehrende ihre Schülerinnen und Schüler betrachten, können sich auf das Erlernen von Zweit- oder Fremdsprachen auswirken und einen Effekt auf die reziproke Verständlichkeit von zwei sprachlichen Varietäten haben. Besonders die Annahme, dass sich auf Spra‐ chen und Kulturen bezogene Einstellungen auf das Erlernen von Zweit- und Fremdsprachen auswirken können, ist für die vorliegende Forschungsarbeit als ausschlaggebend zu betrachten, da sich potenzielle Geschlechterunterschiede in der Leistung eventuell durch Unterschiede in den Einstellungen erklären lassen. Einstellungen zur jeweiligen Zielsprache sind für den Lernprozess zentral, da es sich bei Sprachen nach dem sozialpsychologischen Ansatz der L2-Moti‐ vationsforschung wie gesagt nicht um soziokulturell neutrale Felder handelt, sondern um Lerninhalte, die von kulturellen Einstellungen, Stereotypen und auch geo- und sprachpolitischen Werten geprägt sind (vgl. Dörnyei 2005: 67). Eine wichtige Voraussetzung für die Entwicklung integrativer Orientierung und auch der Wahrnehmung des aus dem sozio-dymamischen Ansatz stammenden Konstrukts des Ideal L3/ L4 Self (vgl. Kapitel 5.1.3.1.3) als attraktive Entwick‐ lungsziele sind daher positive Einstellungen gegenüber der Zielkultur (vgl. Csizér/ Dörnyei 2005: 28, 30). Der Status oder das Prestige der Sprachen sowie ihre Präsenz in einer Gesellschaft sind ausschlaggebende Elemente für die Her‐ ausbildung von entweder wohlgesinnten, neutralen oder nicht-wohlgesinnten Einstellungen gegenüber verschiedenen Sprachen (vgl. Meißner et al. 2008: 18). Dabei kommt es auch darauf an, wie die jeweiligen Sprachen auf sprachpoli‐ tischer Ebene betitelt werden, ob es sich also um eine „Migrationssprache“, „Minderheitensprache“, „Amtssprache“, „Regionalsprache“, „Muttersprache der Mehrheitsbevölkerung“ oder um eine „Fremdsprache“ handelt, wobei letzteres für Französisch und Spanisch in dieser Arbeit der Fall ist. Meißner et al. (2008: 19) belegen, dass die Fremdsprachen, die auf der Welt sehr häufig gelernt werden, also Englisch, Französisch, Deutsch und Spanisch ein hohes Prestige genießen, während selten gelernte Fremdsprachen in der Regel neutrale Einstellungen hervorrufen. Daher müsste davon ausgegangen werden, dass Französisch und Spanisch als Weltsprachen ein ähnlich hohes Prestige genießen. 5.1 Endogene Faktoren 81 Venus (2017a, 2017b) beschäftigt sich verstärkt mit den einzelnen Einstel‐ lungsobjekten bezüglich des Fremdsprachenunterrichts im Fach Französisch in Deutschland. Sie konzipiert eine Einteilung nach fachspezifischen und lern‐ spezifischen Einstellungsobjekten, wobei fachspezifische Einstellungsobjekte als zielsprachenspezifisch charakterisiert werden. Im Fall der Zielsprachen Französisch und Spanisch würde dies also die Einstellungen zur französischen bzw. spanischen Sprache, zu den Sprecherinnen und Sprechern der französi‐ schen bzw. spanischen Sprache und zu Frankreich, dem französischsprachigen Raum und deren Kulturen bzw. zu Spanien, dem spanischsprachigen Raum und deren Kulturen einschließen (vgl. Venus 2017b: 125). Lernspezifische Ein‐ stellungsobjekte beziehen sich wiederum auf das Erlernen von Fremdsprachen im Allgemeinen, auf das Erlernen der französischen bzw. spanischen Sprache im Besonderen und auf den Französischbzw. Spanischunterricht (vgl. Venus 2017b: 125). Da die lernspezifischen Einstellungsobjekte sich sehr stark mit dem Konzept der Motivation überschneiden und es insbesondere bei den fachspezifischen Einstellungsobjekten bei Venus (2017a, 2017b) zu signifikanten Geschlechterunterschieden kam, werden ausschließlich die fachspezifischen Einstellungsobjekte Berücksichtigung in der vorliegenden Studie finden (vgl. Kapitel 9.3.4.6 und 9.3.4.7). Weitere Teilkonstrukte des Socio-Educational Model sind schließlich der Wunsch, die Fremdsprache zu erlernen, die motivationale Intensität im Sinne von Lernanstrengung und die Einstellungen gegenüber dem Erlernen der Fremdsprache (vgl. Gardner/ MacIntyre 1993: 8). Da diese Teilkonstrukte aber sehr stark der Integrativität, der WTC und den Einstellungen zur L2-Gemein‐ schaft ähneln und mit diesen Konstrukten oft hohe signifikante Korrelationen aufweisen, werden diese in der vorliegenden Studie nicht noch einmal getrennt erhoben. Außerdem sieht Gardner (2010: 84) die L2-Motivation als ein Teilkonstrukt der individuellen Unterschiede und stellt diese auf eine Ebene mit Sprachlernbe‐ gabung, Intelligenz und situationaler L2-Angst. Gardner (2010: 90) definiert das Konstrukt der Language Anxiety, das hier als L2-Angst bezeichnet wird, als “a situational form of anxiety associated with learning and using a second lang‐ uage.” Dieses Konstrukt wurde von Horwitz et al. (1986) intensiv mittels eines Fragebogens untersucht. In der vorliegenden Studie werden entsprechend dem L2-Motivationsmodell von Gardner allgemeine kognitive Grundfertigkeiten (SPM, Raven 2009; d2-R, Brickenkamp et al. 2010) anstelle von Sprachlernbe‐ gabung (vgl. zur Kontroversität des Konstrukts Schlak 2008) und Intelligenz erhoben sowie L2-Angst (vgl. Kapitel 9 und 9.3.4.10). 82 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Gardners (1979) Ansatz wird auch deshalb als sozialpsychologischer Ansatz bezeichnet, weil er den Lernkontext im Zusammenhang mit L2-Motivation beschreibt. Für den Lernkontext benutzt er den Begriff des sozialen Milieus, welches insbesondere durch kulturelle Überzeugungen (cultural beliefs) geprägt ist. Er geht davon aus, dass, wenn die kulturelle Umgebung - also sowohl die Gesamtgesellschaft als auch die Familie des oder der Lernenden - das Erlernen der jeweiligen Fremdsprache unterstützt, die Wahrscheinlichkeit höher ist, dass besagtes Individuum auch eine erhöhte sprachliche Kompetenz aufweist (vgl. Gardner 2010: 84). Aus diesem Grund wird der Lernkontext in Form von exo‐ genen Faktoren, die in Kapitel 5.2 genauer erläutert werden, in der vorliegenden Arbeit umfassend berücksichtigt. Einzug in den Schülerfragebogen findet der Lernkontext in Form der konkret messbaren Konstrukte der wahrgenommenen Unterstützungs- und Erwartungshaltungen von Eltern, Peers und Lehrkräften, um im Anschluss zu überprüfen, inwiefern diese tatsächlich den Französischbzw. Spanischleistungen zuträglich sind (vgl. Kapitel 6). Gardner (1979, 2010: 45, 84) unterscheidet außerdem einen formalen Lern‐ kontext im Klassenzimmer, bei dem eine Lehrkraft das Lernen anleitet und einen informellen Lernkontext, z. B. Arbeitsgemeinschaften, Sprachclubs, Lesen fremdsprachlicher Bücher in der Freizeit oder soziale Interaktionen. Der infor‐ melle Lernkontext wird in der vorliegenden Studie dadurch berücksichtigt, dass auch die Häufigkeit der Freizeitaktivitäten in französischer bzw. spanischer Sprache im Schülerfragebogen abgefragt werden und deren Einfluss auf die fremdsprachlichen Leistungen geprüft wird (vgl. Kapitel 9.3.4.3). Laut Gardners Modell führt formales Sprachtraining zu sprachlichen Outcomes in Form von sprachlichem Wissen und Fähigkeiten; informelles Sprachtraining führt wie‐ derum eher zu nicht-sprachlichen Outcomes, wie Selbstvertrauen oder aber L2-Angst, positiven oder negativen Einstellungen bezüglich der Sprache und ihrer Gemeinschaft (vgl. auch Dörnyei/ Ryan 2015: 75; Meißner 2008: 24 für Übersichtsdarstellungen). Ob diese Hypothese auch für die vorliegende Studie zutrifft oder ob es nicht doch einen Zusammenhang zwischen der Häufigkeit der durchgeführten Freizeitaktivitäten in der Fremdsprache und der fremdsprach‐ lichen schulischen Leistung gibt, wird später überprüft (vgl. Kapitel 11.9 und 11.10). Gardner (1985, 2005) lieferte also entscheidende Impulse für die Erforschung der L2-Motivation, die bis heute von Bedeutung sind. So unterscheidet er zum einen die Termini Einstellung, Orientierung und Motivation genauer, wobei Einstellungen von ihm als Antezedenzien für Motivation betrachtet werden. L2-Motivation wird von ihm definiert als „the extent to which the individual works or strives to learn the language because of a desire to do so“ (Gardner 1985: 5.1 Endogene Faktoren 83 31 Dörnyei (1994b) kritisiert diese Terminologie, da die Begriffe integrative Orientierung, Integrativität und integrative Motivation auf unterschiedlichen Abstraktionsebenen gebraucht werden, was zu Missverständnissen führen kann. 19; Kissau 2006a: 76), während sich Orientierung auf ein individuelles Ziel be‐ zieht (vgl. Gardner 1985: 9-12). Folglich betrachten Lambert und Gardner (1959, 1972) Einstellungen als motivationale Konstrukte und versuchen, motivationale Intensität, welche später als vergleichsweise unscharfer Begriff kritisiert wurde (vgl. Meißner et al. 2008: 23) und daher in der vorliegenden Studie nicht separat erhoben wird, und motivationale Orientierung voneinander zu unterscheiden. Außerdem prägte die Forschung Gardners die Dichotomie zwischen einer‐ seits integrativer Orientierung, Integrativität und integrativer Motivation 31 als interpersonale und affektive Dimensionen und Instrumentalität, instru‐ menteller Orientierung und Motivation als praktische bzw. utilitaristische Dimensionen andererseits. Beide Dimensionen bilden auch im 21. Jahrhundert teilweise noch feste Bestandteile von L2-Motivationsmodellen, da sie spezifisch auf das Fremdsprachenlernen ausgerichtet sind (vgl. Kissau 2006a; MacIntyre et al. 2002: 541; Martinović/ Sorić 2018; Riemer 2006: 44; Shaaban/ Ghaith 2000; Tremblay/ Gardner 1995; Warden/ Lin 2008). Als instrumentell orientiert werden Lernende kategorisiert, die eine Fremdsprache aus einem wahrgenommenen pragmatischen Nützlichkeitsaspekt heraus erlernen, beispielsweise, weil sie sich auf Reisen besser verständigen möchten, Zugang zu universitärer Bildung erlangen möchten, weil ihnen das Erlernen der jeweiligen Fremdsprache bessere Möglichkeiten auf dem Arbeitsmarkt verschaffen könnte oder sie dadurch zu einer gebildeteren Person werden (vgl. Gardner/ Lambert 1959; Gardner 1985: 11; Kissau 2006a: 75; Meißner et al. 2008: 23). Jedoch kritisiert Dörnyei (1994a; vgl. auch Csizér/ Dörnyei 2005: 21) diesen Begriff erneut als nicht eindeutig, indem er argumentiert, dass der utilitaristi‐ sche Nutzen von beispielsweise besseren Berufsaussichten für die Schülerinnen und Schüler oft nicht direkt relevant ist, weil diese in ferner Zukunft liegen; des Weiteren beklagt er, dass die instrumentelle Variable zusammen mit Items, die die allgemeine Bedeutung der Beherrschung der Fremdsprache für die persönliche Bildung fokussieren, ein Cluster bildet. Csizér und Dörnyei (2005) argumentieren, dass, abhängig vom Grad der Internalisierung der extrinsischen Motive, Instrumentalität entweder mit dem Ideal Self oder mit dem Ought Self in Verbindung gebracht werden kann (vgl. Kapitel 5.1.3.1.3). Im ersten Fall wäre Instrumentalität eng mit der idealen L2-Identität der Integrativität verknüpft und würde somit signifikant zum betriebenen Lernaufwand beitragen. Jedoch würden nicht internalisierte instrumentelle Motive, die mit dem Ought Self verbunden sind, wie zum Beispiel Motive, die aus einem reinen Pflichtbewusst‐ 84 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung sein entstehen oder aus einer Angst vor Bestrafung heraus, die Tendenz haben, kurzfristig aufzutreten ohne die anhaltende Leistungsbereitschaft zu generieren, die für die Beherrschung der Zielsprache notwendig wäre (vgl. Csizér/ Dörnyei 2005: 29). Zudem mischte sich in den Studien von Dörnyei und Kormos (2000) und Dörnyei (2002) die utilitaristische Dimension mit einer Reihe von anderen Anreizen, wie zum Beispiel die Möglichkeit zu verreisen, Freundschaften mit ausländischen Gleichaltrigen zu schließen oder den Text von fremdsprachlichen Liedern besser zu verstehen. Instrumentalität wurde von ihnen als ein erwei‐ tertes Konglomerat aus incentive values beschrieben. Um eine Trennschärfe zu Integrativität beizubehalten, wird das Konstrukt als ein Teil der vorliegenden Studie folgendermaßen definiert: Unter dem Begriff Instrumentalität versteht man pragmatische Anreize für das Erlernen einer Fremdsprache, worunter neben individuellen beruflichen Plänen auch die Wichtigkeit fällt, welche die L2 für das Individuum in der Welt hat, sowie der Beitrag, den die L2 für das Individuum leistet, um von der Gesellschaft als eine gebildete Person wahrgenommen zu werden (vgl. Csizér/ Dörnyei 2005: 21). Clément et al. (1980) kamen zudem in ihrer Studie zu dem Ergebnis, dass die Wahrscheinlichkeit, dass integrativ orientierte Individuen mit Sprecherinnen und Sprechern der Zielsprache in direkten Kontakt treten, höher ist als bei instrumentell orientierten, was gleichzeitig das Selbstbewusstsein der integrativ Orientierten bezüglich der Beherrschung der Zielsprache verbessern würde. Andere Studien, wie beispielsweise diejenigen von Au (1988) oder Crookes und Schmidt (1991) haben indes gezeigt, dass dem Unterschied zwischen integrativer und instrumenteller Orientierung zu viel Bedeutung beigemessen wurde, da die Korrelationen zwischen Orientierungstyp und Leistung in der Fremdsprache dann verschwanden, wenn andere Einflussfaktoren, wie beispielsweise das Alter statistisch kontrolliert wurden. Zudem soll abschließend noch einmal her‐ vorgehoben werden, dass es sich bei Integrativität und Instrumentalität weniger um eine Dichotomie als um ein Kontinuum handelt. Aufgrund der bisherigen Forschungslage werden die Konstrukte der Integrativität und Instrumentalität in der vorliegenden Studie durch das Ideal L2 Self und das Ought-to L2-Self erweitert, was in Zusammenhang mit der Erläuterung des sozio-dynamischen Ansatzes in Kapitel 5.1.3.1.3 vertieft dargelegt wird. 5.1.3.1.2 Die kognitionspsychologische L2-Motivationsforschung Die kognitionspsychologische L2-Motivationsforschung begann mit dem Ar‐ tikel von Crookes und Schmidt (1991) und zeichnet sich durch eine verstärkte Berücksichtigung der Erkenntnisse aus der Bildungsforschung und pädagogi‐ schen Psychologie sowie durch eine klare Ausrichtung auf den konkreten Lern‐ 5.1 Endogene Faktoren 85 32 Für die Erfassung des Grads der L2-Selbstbestimmung wurde innerhalb des kogniti‐ onspsychologischen Ansatzes, ähnlich wie für das Socio-Educational Model of SLA von Gardner (1979, 1985, 2002, 2010), ein Erhebungsinstrument konstruiert, die Language Learning Orientation Scale (vgl. Noels et al. 2000). kontext aus, welcher oft als Mikroperspektive oder Mikroebene bezeichnet wird (vgl. Kissau 2006a). Dieser steht der Makroperspektive oder der Makroebene ge‐ genüber, welche motivationale Dispositionen ganzer sozialer Gemeinschaften in den Blick nimmt, die ihrerseits wiederum im Zentrum des soziopsychologischen Ansatzes stehen (vgl. Dörnyei/ Ryan 2015: 80). Innerhalb der Mikroperspektive rücken vor allem die Lernsituation, die Lehrpläne und die Lerngruppen ins Zentrum der L2-Motivationsforschung (vgl. Dörnyei 1994a; Williams/ Burden 1997). Die zentrale Theorie der kognitionspsychologischen L2-Motivationsfor‐ schung ist die Selbstbestimmungstheorie von Deci und Ryan (1985, 2009; Ryan/ Deci 2002). 32 Diese Theorie beschreibt, wie Individuen versuchen, drei Arten von psychologischen Bedürfnissen zu befriedigen: Autonomieerleben (autonomy) als das Erleben der Kontrolle über die eigenen Handlungen, soziale Eingebun‐ denheit (relatedness) im Sinne des Gefühls, zu einer Gruppe von Personen dazuzugehören und Kompetenzerleben (competence) im Sinne des Erlebens der eigenen Fähigkeiten. Diese drei Faktoren führen zu Motivation, d.-h. zum Fest‐ legen und Verfolgen von konkreten Zielen durch ein Individuum und schließlich zu intentionalen Handlungen. Hierbei unterscheiden Deci und Ryan (1993: 226) zwischen intrinsischer und extrinsischer Motivation: Intrinsische Motivation ist dann gegeben, wenn das Verhalten interessenbestimmt ist, Freude bereitet und keinerlei externe Impulse, Versprechungen oder Bedrohungen benötigt. Intrinsische Motivation impliziert folglich Interesse, Neugier, Exploration und Spontanität und bedingt ein hohes Maß an Selbstbestimmung (vgl. Deci/ Ryan 1993: 225-226). Extrinsische Motivation wiederum beinhaltet die instrumentell ausgerichtete Intention, eine Konsequenz zu erzielen, die als losgelöst von der eigentlichen Handlung bewertet werden kann; im Gegensatz zu intrinsisch motiviertem Verhalten erfolgt extrinsisch motiviertes Verhalten selten spontan, sondern oftmals einer Aufforderung in Form des Versprechens einer positiven Konsequenz, die eine Belohnung darstellt oder aber des Androhens einer negativen Konsequenz. Intrinsische und extrinsische Motivation werden in der vorliegenden Studie nicht erhoben, da diese den Konstrukten von integrativer und instrumenteller Orientierung sehr ähnlich sind. Schließlich ist an dieser Stelle die Attributionstheorie als Teil der L2-Moti‐ vationsforschung zu nennen (vgl. Weiner 1992, 2010). Demnach ist die Kau‐ salattribution dafür verantwortlich, welche motivationalen Dispositionen das 86 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 33 Erwartungs-Wert-Modelle der Motivation sehen den Urspruch einer konkreten Motiva‐ tion in zwei Komponenten: zum einen in der Erwartung, d. h. in der wahrgenommenen Wahrscheinlichkeit, die jeweilige Aufgabe bzw. Handlung erfolgreich durchführen zu können und zum anderen im Wert bzw. in der subjektiven Bedeutsamkeit, die der Handlung und deren Folgen zugemessen wird (vgl. Schiefele 2009: 153). 34 Dies kann differenziert werden, insofern das allgemeine Selbstkonzept eine stabilere Disposition darstellt als das fachspezifische Selbstkonzept, welches zunächst einmal Individuum ausbildet: Werden Erfolge im L2-Outcome mit internalen Ursachen begründet, wie zum Beispiel mit den eigenen Fähigkeiten, der eigenen Anstren‐ gung und/ oder dem eigenen Perfektionismus und negative L2-Outcomes mit externalen, wie zum Beispiel fehlender Anstrengung oder einer verkürzen Lernzeit erklärt, entsteht ein positives Motivationsprofil und ein positives Selbstkonzept. Erfolgt die Zuschreibung genau umgekehrt, erfolgt die Ausbil‐ dung eines negativen Selbstkonzepts (vgl. Ushioda 2002). In der vorliegenden Studie wird daher das auf das Fach Französisch bzw. Spanisch bezogene Selbstkonzept der Lernerinnen und Lerner gemessen. Die Er‐ forschung des akademischen Selbstkonzepts war in Deutschland lange Zeit auf die naturwissenschaftlichen Fächer ausgerichtet (vgl. Möller/ Zaunbauer-Wo‐ melsdorf 2008: 595) oder aber auf die L1 bezogen (vgl. Mercer 2011: 23) und wird erst in jüngster Zeit in der Fremdsprachenlernforschung, insbesondere in Bezug auf das Fach Englisch und den Bilingualen Sachfachunterricht Englisch/ Deutsch untersucht (vgl. Niepel et al. 2014; Rumlich 2016: 123). Wagner et al. (2008: 231) definieren das akademische Selbstkonzept als „das deklarative Wissen über die eigenen Kompetenzen und die eigene Leistungsfä‐ higkeit.“ Lohaus und Vierhaus (2019) erweitern die Definition noch etwas: Das Selbstkonzept besteht als kognitive Komponente des Selbst aus der Selbstwahr‐ nehmung und dem Wissen um das, was die eigene Person ausmacht. Neben persön‐ lichen Eigenschaften und Fähigkeiten, die man besitzt, gehören zu diesem Wissen auch Neigungen, Interessen und typische Verhaltensweisen. (Lohaus/ Vierhaus 2019: 204) Lohaus und Vierhaus (2019: 204) grenzen den Begriff des Selbstkonzepts vom Selbstwert ab, welcher die subjektive Bewertung der eigenen Fähigkeiten und Eigenschaften und somit die affektive Komponente des Selbst darstellt, während Selbstkonzept die kognitive Komponente darstellt. In Anlehnung an das Erwartungs-Wert-Modell (vgl. Eccles 2005; Heckhausen 1989; Heck‐ hausen/ Heckhausen 2018: 521) 33 wird das Selbstkonzept als stabile Disposition betrachtet, die das Ergebnis der Gesamtsumme der gemachten Erfahrungen darstellt (vgl. Wagner et al. 2008: 231). 34 Es enthält eine Erwartungskomponente, 5.1 Endogene Faktoren 87 variieren kann und sich mit zunehmendem Alter verfestigt (vgl. Lohaus/ Vierhaus 2019: 208; Marsh/ Ayotte 2003; Rumlich 2016: 135). da das Individuum aufgrund vorausgegangener Lernerfahrungen Erwartungen bezüglich des eigenen Lernerfolgs an sich selbst stellt; diese Erwartungen hängen vom persönlichen Umfeld, also vom kulturellen Milieu, vom Lern- und Lehrverhalten zentraler Sozialisationsinstanzen wie Lehrkräften und Eltern sowie von eigenen Lernerfahrungen, der eigenen Leistung und den erzielten Rückmeldungen im schulischen Kontext ab (vgl. Rumlich 2016: 132). Ausge‐ hend von der Forschungsarbeit von Shavelson et al. (1976: 413) und dem daraus hervorgegangenen hierarchischen, mehrdimensionalen und differen‐ zierten Selbstkonzeptmodell kann zwischen einem fachbezogenen Selbstkon‐ zept und einem allgemeinen akademischen bzw. schulischen Selbstkonzept unterschieden werden (vgl. Corbière et al. 2006: 4; Lohaus/ Vierhaus 2019: 207). Das fachbezogene Selbstkonzept umfasst alle kognitiven Repräsentationen eigener Fähigkeiten und Begabungen in einem konkreten Fach, wobei zunächst eine Unterteilung in ein sprachliches und ein mathematisches Selbstkonzept vorzunehmen ist (vgl. Lohaus/ Vierhaus 2019: 208). Innerhalb des sprachlichen Selbstkonzepts kann zwischen dem Selbstkonzept in der L1 (z. B. Deutsch), in der L2 (z. B. Englisch), in der L3 (z. B. Französisch) oder in der L4 (z. B. Spanisch) unterschieden werden (vgl. Möller/ Trautwein 2015: 183): Holder (2005: 184) konnte bereits nachweisen, dass die Fähigkeits‐ selbstkonzepte in Englisch und Französisch nur mäßig interkorrelieren, was darauf hindeutet, dass es sich um weitestgehend getrennte fachbezogene Selbst‐ konzepte handelt. Somit ist das Formulieren von Hypothesen auf Grundlage von Studien bezüglich des Selbstkonzepts im Englischen als erste Fremdsprache hinsichtlich möglicher Ergebnisse in (zukünftigen) Untersuchungen des Selbst‐ konzepts im Französischen oder Spanischen als zweite und dritte Fremdsprache kaum möglich. In der vorliegenden Studie werden zwei fachspezifische Selbstkonzepte in den Blick genommen: das Selbstkonzept in Französisch als Fremdsprache (FFS Selbstkonzept) und das Selbstkonzept in Spanisch als Fremdsprache (SFS Selbst‐ konzept), wobei es sich hier um zwei spezifische sprachliche Selbstkonzepte handelt, welche sich klar vom L1-Selbstkonzept unterscheiden, wenngleich deutliche Korrelationen mit ihnen auftreten können (vgl. Dickhäuser 2003; Rumlich 2016: 134): Dadurch, dass der Lernprozess einer Fremdsprache kumu‐ lativ ist, fällt es den Lernenden immer leichter, das auszudrücken, was sie möchten; gleichzeitig wird aber auch das Anforderungsniveau der sprachlichen Aufgaben im Unterricht immer höher, weshalb die Herausbildung des Selbst‐ 88 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 35 Dörnyei (1998) legt sieben Hauptdimensionen von Motivation nahe: 1) die integrative Dimension, 2) die instrumentelle Dimension, 3) die auf den Makro-Kontext bezogene Dimension, 4) die auf das Selbstkonzept bezogene Dimension, unter die laut Dörnyei auch Selbstvertrauen, Selbstwirksamkeit, Angst, Zurückhaltung, Erwartung und Er‐ folgsbedürfnisse fallen, 5) die auf das Ziel bezogene Dimension, 6) die auf den erziehe‐ rischen Kontext bezogene Dimension und 7) die auf andere Sozialisationsinstanzen (Eltern, Familie, Mitlernende, Freunde) bezogene Dimension (vgl. Meißner et al. 2008: 22). konzepts in der Fremdsprache trotz steigender tatsächlicher Kompetenzen gebremst werden kann oder aber das Selbstkonzept sogar im Laufe des Lern‐ prozesses immer niedriger ausfallen kann (vgl. Rumlich 2016: 136; Walker 2013: 93). Das akademische Selbstkonzept zeigt vielschichtige Abhängigkeiten zu an‐ deren Lernerfaktoren: Es wird als der am stärksten signifikante affektiv-moti‐ vationaler Prädiktor für schulische Leistungen über alle Fächer hinweg und somit auch für die fremdsprachlichen Fächer begriffen (vgl. Helmke et al. 2008: 247-251; Helmke/ Weinert 1997a: 112). Sparfeldt et al. (2003) kommen beispielsweise auf einen Zusammenhang von r = .21 zwischen allgemeinem Selbstkonzept und objektiven Schulleistungen sowie auf einen Zusammenhang von r = .42 zwischen schulischem Selbstkonzept und objektiven Schulleistungen. Zwischen fachspezifischen Selbstkonzepten und Leistungen finden sie Korrela‐ tionswerte bis zu r = .70 (vgl. auch Lohaus/ Vierhaus 2019: 208). Hingegen liegen zwar Korrelationen zwischen mathematischen und sprachlichen Leistungen vor, nicht jedoch zwischen dem mathematischen und dem sprachlichen Selbst‐ konzept (vgl. Lohaus/ Vierhaus 2019: 209; Marsh/ Yeung 1998; Möller/ Trautwein 2015: 190; Rumlich 2016: 140). Außerdem zeigt das Selbstkonzept meist signifikante Korrelationen mit dem Faktor Motivation (vgl. Corbière et al. 2006: 9) sowie mit dem Faktor Interesse am Fach (vgl. Helmke et al. 2008: 255; Nold 2003: 178-179). Das akademische Selbstkonzept stellt deshalb ein Bindeglied zwischen dem von Dörnyei (1998, 2005) 35 entwickelten L2 Motivational Self System als Teil des sozio-dynamischen Ansatzes und den Motivationstheorien der pädagogischen Psychologie dar und wird oft als Voraussetzung für Motivation oder aber als Teilkonstrukt dieser betrachtet (vgl. Rumlich 2016: 127, 131). Zur Frage nach der Abgrenzbarkeit des Fähigkeitsselbstkonzepts von ähn‐ lichen affektiven Faktoren gibt es in der Wissenschaft teils unterschiedliche Auffassungen: Während beispielsweise die DESI-Studie (vgl. Helmke et al. 2008: 244) ein Messinstrument nutzte, welches das akademische Selbstkonzept über die drei Teilkonstrukte fachbezogenes Fähigkeitskonzept, Selbstwirksamkeit und fachspezifisches Lerninteresse maß, gehen Möller und Trautwein (2015: 5.1 Endogene Faktoren 89 193) sowie Rumlich (2016: 130) davon aus, dass Selbstwirksamkeit und Selbst‐ konzept zwei unterschiedliche Konstrukte darstellen, die jedoch konzeptuell verbunden sind: Im Unterschied zum akademischen Selbstkonzept definiere sich Selbstwirksamkeit durch die Beurteilung der eigenen Fähigkeiten, spezifische Verhaltensweisen in spezifischen Situationen auszuführen. Somit bezieht sich das Selbstkonzept nach dieser Auffassung auf die Beurteilung der eigenen Fähigkeiten, beispielsweise in einem bestimmten Schulfach, und Selbstwirksam‐ keit auf die Beurteilung der eigenen Fähigkeiten bei der Ausführung einer konkreten Aufgabe (vgl. Rumlich 2016: 130). Daher kann beispielsweise auch bei einem hohen Selbstkonzept im Französischen eine geringe Selbstwirksamkeit bei der Ausführung der Aufgabe, ein Theaterstück aufzuführen, vorhanden sein. Aus diesen Gründen wird in dieser Arbeit eine klare Abgrenzung zwischen Selbstkonzept und Selbstwirksamkeit vorgenommen und ausschließlich das fachspezifische Selbstkonzept als Forschungsgegenstand näher betrachtet (vgl. Kapitel 9.3.4.9). 5.1.3.1.3 Die sozio-dynamische L2-Motivationsforschung Eine weitere Tendenz in der aktuellen L2-Motivationsforschung stellt, wie bereits erwähnt, die verstärkte Berücksichtigung des zeitlichen Aspekts dar. Damit ist der dynamische Charakter von Motivation gemeint, demzufolge sich die Lernmotivation innerhalb kurzer Zeit, z. B. innerhalb eines Jahres, aber auch zwischen einer Aktivität und einer anderen stark verändern kann, wobei zwischen kurzfristiger und langfristiger Motivation unterschieden wird (vgl. Dörnyei 2001, 2005). Ziel der vorliegenden Studie ist es, aufgrund der Tatsache, dass nur ein Erhebungszeitpunkt gegeben ist, eher die langfristige Motivation zu untersuchen, da die kurzfristige von einzelnen Aktivitäten abhängt und sich entsprechend schnell verändern kann. Somit ist die eher eindimensionale Sichtweise Gardners (2002, 2010), nach der Schülerinnen und Schüler entweder integrativ oder instrumentell orientiert, entweder motiviert oder unmotiviert sind, nicht mehr in dieser Weise haltbar. Dem zeitlichen Aspekt wird von Dörnyei (2001, 2005) große Wichtigkeit zugesprochen, weshalb er ein prozessorientiertes Modell der L2-Motivation favorisiert und Motivation nach dem Zeitaspekt in initiierende, ausführende und aufrechterhaltene Motivation gliedert. Dieses Modell schließt Faktoren auf der Mikro- und Makroebene gleichermaßen ein und beinhaltet Erfolgserwartung, Einstellungen gegenüber der zielsprachlichen Gemeinschaft, Zielsetzungen, Einflüsse von Eltern, Lehrkräften und Peers sowie die Beurteilung der Lerner‐ fahrung durch die Schülerinnen und Schüler. 90 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Dörnyei (2003) geht sogar so weit, innerhalb der Mikroebene aufgabenspe‐ zifische Motivation separat zu untersuchen, da diese durchaus stark variieren kann. Jedoch gibt es auch Studien, die zeigen, dass die L2-Motivation über einen längeren Zeitraum relativ stabil bleiben kann und somit Dörnyei (2003) erneut wiedersprechen: Gardner et al. (2004) zeigten beispielsweise auf, dass bei 197 Universitätsstudierenden, die ein Jahr lang einen Französischkurs auf mittlerem Niveau besuchten, die Wahrscheinlichkeit individueller Veränderung in den Variablen integrative und instrumentelle Orientierung, L2-Angst, Motivation und Einstellungen gegenüber dem Fremdsprachenlernen eher gering war. Die größte Wahrscheinlichkeit zur Veränderung wurde bei Variablen, die mit der Lernumgebung zusammenhingen, und insbesondere bei den Einstellungen gegenüber der Lernsituation, gefunden. Der Faktor, der am wenigsten wahr‐ scheinlich Veränderung erfuhr, war dabei die integrative Orientierung. Da in der vorliegenden Studie die Entwicklung der L2-Motivation zunächst nicht erfasst wird, sondern vielmehr ein querschnittlicher Ansatz vorliegt, soll an dieser Stelle auf Prozessmodelle wie jenes von Dörnyei und Ottó (1998) nicht näher eingegangen werden. Ein durchaus erwähnenswerter Ansatz aus der sozio-dynamischen L2-Motivationstheorie, auch in Hinblick auf die Genderforschung, ist jedoch derjenige von Ushioda (2009: 220), welcher das fremdsprachenlernende Individuum als Person in einem relationalen Kontext betrachtet und seine Identität, Persönlichkeit sowie den persönlichen Hinter‐ grund genauer in den Blick der Forschung nimmt. Aus diesem Anspruch heraus und aus der Possible Selves-Forschung, die von Markus und Nurius (1986) initiiert wurde, entstand die Theorie zum L2 Motivational Self System (vgl. Dörnyei 2005). Possible Selves repräsentieren laut Markus und Nurius (1986: 954) “individuals’ ideas of what they might become, what they would like to become, and what they are afraid of becoming” und schaffen somit eine konzeptuelle Verbindung zwischen Kognition und Motiva‐ tion. Sie sind also bereichsspezifische, situativ bedingte Repräsentationen des Selbst in einem zukünftigen Zustand und beschreiben gleichzeitig die Vorstel‐ lung von noch auszuschöpfendem Potenzial; folglich handelt es sich um ein komplexes Zusammenspiel aus aktuellen und imaginären Selbstidentitäten (vgl. Henry/ Cliffordson 2013a: 274). Motivation wird in diesem Zusammenhang als Wunsch definiert, die wahrgenommenen Diskrepanzen zwischen dem aktuellen Selbst der Lernerin oder des Lerners und dem möglichen Selbst zu reduzieren (vgl. Csizér/ Dörnyei 2005: 29). Higgins (1996) führte wichtige Unterscheidungen zwischen Possible Selves ein: Er grenzte das Ideal Self, das die Eigenschaften darstellt, die ein Individuum gerne haben würde, vom Ought Self ab, welches die Eigenschaften darstellt, von denen Individuen glauben, dass sie diese besitzen 5.1 Endogene Faktoren 91 36 Csizér und Dörnyei (2005: 30) definieren unter Einbezug des Konzepts des Ideal L2 Self L2-Motivation neu als “the desire to achieve one’s ideal language self by reducing the discrepancy between one’s actual and ideal selves.” sollten. Auch wenn beide Konzepte ähnlich sind, da sie beide das zukünftige Erreichen eines gewünschten Endzustands beschreiben, weist Higgins (1996) darauf hin, dass sich die Neigungen, die mit diesen beiden Konzepten verbunden werden, motivational unterscheiden: dem Ideal Self ist in Form von Hoffnungen, Bestrebungen, dem Wunsch des Weiterkommens, der Entfaltung und des Errei‐ chens stets ein sich selbst fördernder Fokus inhärent, wohingegen den Ought Selves ein präventiver Fokus innewohnt und sie somit die Funktion haben, das Hervorbringen und Verhindern von negativem Outcome zu regulieren. Dahinter stehen ein gewisses Sicherheitsbedürfnis, Verantwortungs- und Pflichtbewusst‐ sein. Von Ideal Self und Ought Self wurden bezüglich der Fremdsprachenlernfor‐ schung die Konzepte Ideal L2 Self und Ought-to L2 Self abgeleitet: Das Ideal L2 Self bezeichnet “a desirable self-image of the kind of L2 user that one would like to be in the future” (Dörnyei/ Ryan 2015: 87). Dörnyei und Csizér (2002) definieren das Konstrukt des Ideal L2 Self folgendermaßen: “If one’s ideal self is associated with the mastery of a L2, that is, if the person that we would like to become is proficient in the L2, we can be described as having an integrative disposition” (Csizér/ Dörnyei 2005: 29). Es beschreibt also das gewünschte Selbstbild, eine Fremdsprache in der Zukunft bis zu einem gewissen Grad zu beherrschen, was mit integrativen Orientierungen verbunden ist. Der Vorteil dieser definitorischen Erweiterung des Konzepts der Integrativität liegt darin begründet, dass durch das Ideal L2 Self auch motivationale Begebenheiten in verschiedenen Lernkontexten beschrieben werden können und Integrativität auch dann gemessen werden kann, wenn diese Lernkontexte wenig oder gar keinen Kontakt zu L2-Sprecherinnen und Sprechern bieten (vgl. Csizér/ Dörnyei 2005: 30). 36 In der Studie von Csizér und Dörnyei (2005) wurde diese Annahme bestätigt, da die beiden Forschenden zu dem Ergebnis kamen, dass die integrativ motivierten L2-Lernenden ein Ideal L2 Self konstruierten, auch wenn sie nicht in Kontakt mit Muttersprachlerinnen und Muttersprachlern der Zielsprache waren. Nun stellt sich die Frage, wie sich Integrativität im weiteren Sinne, d. h. unter Berücksichtigung des Konzepts des Ideal L2 Self in ein umfassenderes Motivationsmodell einordnen lässt. Positive Einstellungen gegenüber der L2 sowie der Zielsprachenkultur werden in der statistischen Erhebung zur inneren Struktur der L2-Motivation von Csizér und Dörnyei (2005: 28) als Antezedenzien für eine integrative Orientierung errechnet, was sich auch aus dem Zusammenhang erklären lässt, dass ein Individuum nur dann 92 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 37 Bereits in Gardners Motivationsmodell wurden neben integrativer Motivation und instrumenteller Motivation die attitudes toward the learning situation als dritte große Komponente von Motivation beschrieben. Auch Kissau (2006a: 75-76), der in Kanada ausführliche Studien zu Motivation und Geschlecht beim Französischlernen durchge‐ führt hat, kommt zu dem selben Schluss wie Csizér und Dörnyei (2005). willens ist, in die zielsprachliche Kultur einzutauchen, wenn es positive Einstel‐ lungen gegenüber deren Mitgliedern empfindet. 37 Je positiver die Einstellungen gegenüber den L2-Sprecherinnen und Sprechern sind, umso attraktiver ist das idealisierte L2-Selbst oder, anders gesagt ist es sehr wenig wahrscheinlich, dass das ideale Selbst mit Kompetenzen in einer Fremdsprache assoziiert wird, welche von einer Gemeinschaft gesprochen wird, die der oder die Lernende verachtet. Somit betreffen Instrumentalität und die Einstellungen gegenüber den L2-Sprecherinnen und Sprechern zwei komplementäre Aspekte des idealen L2-Selbst: Sein allgemein angenehmes Wesen und seine leistungsbezogene Effi‐ zienz beziehungsweise fremdsprachliche Kompetenz (vgl. Csizér/ Dörnyei 2005: 30). Im Falle der geplanten Fragebogenstudie werden für das Französische als zweite Fremdsprache und das Spanische als dritte Fremdsprache entsprechend das Ideal L3 Self und das Ideal L4 Self erhoben werden (vgl. Kapitel 9.3.4.1). Das Ought-to L2 Self spiegelt komplementär zum Ideal L2 Self die Attribute wider, die jemand denkt, haben zu müssen, um gewissen Erwartungen ge‐ recht zu werden und um mögliche negative Konsequenzen zu vermeiden. Das Ought-to L2 Self wird in der vorliegenden Studie berücksichtigt, indem wahr‐ genommene Erwartungen von Eltern, Lehrkräften und Peers im Schülerfrage‐ bogen erhoben werden (vgl. Kapitel 9.3.5.2 bis 9.3.5.5). Festzuhalten bleibt, dass L2-Motivation ein komplexes, aus zahlreichen Faktoren zusammengesetztes Konstrukt ist. Die bisherige Forschung hat sich intensiv mit der Identifizierung ihrer weiteren Schlüsselkomponenten und deren Wirkungszusammenhang auseinandergesetzt. Außerdem wurde versucht, den exakten Einfluss, den die einzelnen Komponenten von L2-Motivation auf das Lernverhalten und die Lernleistung ausüben, zu erfassen (vgl. z.-B. Csizér/ Dörnyei 2005: 19). 5.1.3.1.4 Zwischenfazit: Zentrale Konstrukte der L2-Motivationsforschung Nachdem die zentralen Konstrukte der L2-Motivationsforschung in diesen theoretischen Kapiteln definiert und jeweils in den unterschiedlichen theore‐ tischen Ansätzen verortet wurden, kann nun zusammengefasst werden, dass folgende Untersuchungsgegenstände in der vorliegenden Studie im Bereich der endogenen affektiven Faktoren erhoben werden: Integrative Orientierung, instrumentelle Orientierung, Ideal L3/ L4 Self, L3/ L4 WTC, Interesse am Fach Französisch bzw. Spanisch, Einstellungen zur Zielkultur, FFS/ SFS Selbstkonzept, 5.1 Endogene Faktoren 93 L3-/ L4-Angst und die Häufigkeit der Freizeitaktivitäten auf Französisch bzw. Spanisch. Als exogen bedingte affektive Faktoren, welche in Kapitel 5.2 ausführ‐ licher behandelt werden, stehen außerdem die wahrgenommene Unterstützung und die wahrgenommenen Erwartungen der Lehrkraft, die wahrgenommenen Erwartungen der Eltern, der Lehrkräfte und der Peers im Zentrum der Fragebo‐ genstudie. Welche Forschungstendenzen bezüglich des Zusammenhangs zwischen Ge‐ schlecht, Gender, fremdsprachlicher Leistung und den genannten affektiv-mo‐ tivationalen Konstrukten vorliegen, wird im Anschluss ausführlich dargestellt. Dabei wird insbesondere überprüft, ob nach aktuellem Stand der Forschung Konstrukte hinzugefügt werden müssen, die die Konstruktion von Gender innerhalb des Französischbzw. Spanischunterrichts bedingen und eng mit der L2-Motivation zusammenhängen. 5.1.3.1.5 Die Erforschung von L2-Motivation im Kontext der Faktoren Geschlecht und Gender Zunächst einmal muss hervorgehoben werden, dass es eine sehr große Anzahl an Forschungsarbeiten zur L2-Motivation und der Frage nach Geschlechterun‐ terschieden im Motivationsprofil einerseits sowie der Konstruktion von Gender innerhalb der Motivationsprofile andererseits gibt. Einige Wissenschaftlerinnen und Wissenschaftler merken allerdings an, dass die Erforschung noch wenig systematisch erfolgt (vgl. Csizér/ Dörnyei 2005; Dörnyei/ Csizér 2002; Henry und Cliffordson 2013a: 276). Dies resultiert unter anderem daraus, dass es zahlreiche unterschiedliche Theorien zur L2-Motivation gibt (vgl. Kapitel 5.1.3.1.1 bis 5.1.3.1.3), was bedingt, dass in jeder Studie unterschiedliche motivationale Konstrukte erhoben und auf unterschiedliche Weise zu Geschlecht und Gender in Beziehung gesetzt werden. Im Folgenden wird auf die zentralen Tendenzen der bisherigen Befunde der Geschlechter- und Genderforschung im Zusammenhang mit L2-Motivation eingegangen, was der Schaffung eines Überblicks über die Geschichte und Aktualität der L2-Motivation im Kontext von Geschlecht und Gender dient. Dabei werden insbesondere Studien näher betrachtet, die entweder kontroverse Rezeptionen erfahren haben oder aber die aktuellen Forschungspostulate bereits erfolgreich umsetzen. 5.1.3.1.6 Affektive Faktoren und Gender - Vorteile bei weiblichen Lernenden? Eine erste Forschungstendenz ist, dass seit den 70er Jahren Mädchen und Frauen meist eine ausgeprägtere L2-Motivation, positivere Einstellungen zur 94 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Zielkultur und ein höheres Interesse an Fremdsprachen als Jungen und Männern zugeschrieben wird (vgl. z. B. Bacon/ Finneman 1992; Ehrman/ Oxford 1988; Muchnick/ Wolfe 1982; Powell/ Batters 1985; Pritchard 1987; Randhawa/ Korpan 1973; vgl. für Übersichten Fuchs 2013; Henry 2011; Kissau et al. 2010; Schmenk 2002, 2016). Wright (1999) fand beispielsweise unter irischen Jugendlichen eine positivere Einstellung der Mädchen gegenüber dem Lernen und Sprechen von Französisch. Bei einer Regressionsanalyse stellte sich sogar heraus, dass das Geschlecht der stärkste Prädiktor für die Einstellungen gegenüber dem Sprechen des Französischen darstellte und stärker war als die Schulart, wahr‐ genommene innerschulische und wahrgenommene außerschulische Einflüsse auf Einstellungen. Laut Schmenk (2002: 33) wurde aber vor allem in den 70er und 80er Jahren oftmals nicht näher begründet, wie diese Unterschiede entstanden sein könnten, sondern Geschlechterunterschiede in der L2-Motiva‐ tion zugunsten der Mädchen wurden oftmals als gegeben präsupponiert. Auch wenn die Tendenz der stärker ausgeprägten L2-Motivation der Mädchen und Frauen auch in Studien des 21. Jahrhunderts immer wieder ersichtlich ist (vgl. Csizér/ Dörnyei 2005; Dörnyei/ Csizér 2002; Dörnyei et al. 2006; Kissau 2006a), wird in aktuelleren Studien versucht, immer mehr zu differenzieren, z. B. bezüglich der einzelnen affektiven Faktoren, in denen Geschlechterunterschiede auftreten, bezüglich der Erst- und der Zielsprache, der Ausgangs- und der Zielkultur, der Lernerfahrung, des Lernkontexts und weiteren Kontextfaktoren wie beispielsweise dem sprachlichen oder auch dem sozioökonomischen Hin‐ tergrund (vgl. z. B. Meißner et al. 2008). Aufgrund dessen kann schon lange nicht mehr pauschal von stärker ausgeprägten affektiven Faktoren der weiblichen Fremdsprachenlernenden ausgegangen werden. Einige exemplarische Studien, die so klar differenzieren, dass in spezifischen Kontexten positivere Einstellungen und höhere L2-Motivationen bei Mädchen zutage treten, in anderen spezifischen Kontexten jedoch keine Geschlechterun‐ terschiede vorliegen, sollen im Anschluss dargelegt werden: Zum Beispiel fand Holder (2005: 232) signifikante Unterschiede zugunsten der Mädchen bezüglich der Einstellungen zum Französischen und zum Fach Französisch, während keine Geschlechterunterschiede bei den Einstellungen zum Englischen gefunden werden konnten, was bereits zeigt, wie stark die Ziel‐ sprache ausschlaggebend für die Untersuchung von Geschlechterunterschieden sein kann. Außerdem hatten in dieser Studie 21 der 29 untersuchten Klassen einen männlichen Französischlehrer und lediglich 8 Klassen eine weibliche Französischlehrkraft (vgl. Holder 2005: 142). Daraus kann abgeleitet werden, dass das Geschlecht der Lehrkraft bezüglich der Herausbildung affektiver 5.1 Endogene Faktoren 95 Faktoren einen gewissen Einfluss nehmen kann, aber nicht zwangsläufig muss (vgl. Kapitel 5.2.3). Im Forschungsprojekt „Mehrsprachigkeit fördern. Vielfalt und Reichtum Eu‐ ropas in der Schule nutzen (MES)“ (Meißner et al. 2008) wurden in fünf europäi‐ schen Ländern Befragungen zu Attitüden, die von Meißner et al. (2008: 30) syn‐ onym zum Terminus Einstellungen verwendet wurden, von Schülerinnen und Schülern aus der 5. und aus der 9. Jahrgangsstufe durchgeführt. Die Forschungs‐ frage lautete, welche Auswirkung Einstellungen gegenüber einer Sprache auf die Sprachenwahl eines Schülers bzw. einer Schülerin in einem bestimmten Kontext hat (vgl. Meißner et al. 2008: 40). Ziel war es „zu einer besseren Kenntnis der Haltungen und Einstellungen schulpflichtiger Jugendlicher gegenüber einer Vielzahl von Sprachen mit unterschiedlichem Status beizutragen“ als auch deren Motivation zu erforschen, „kommunikative Kompetenz in mehreren Sprachen zu entwickeln, um schließlich Möglichkeiten und Wege zur Realisierung auszu‐ leuchten“ (Meißner et al. 2008: 9-10). In Deutschland wurde die Studie in Hessen in den Landkreisen Gießen und Limburg-Weilburg sowie in Berlin durchgeführt. Erkenntnisse wurden insbesondere für die Schulfremdsprachen Englisch und Französisch gewonnen. Für Spanisch waren die Probandinnen- und Probanden‐ zahlen so gering, dass diese Schulfremdsprache lediglich einen marginalen Platz in der Ergebnisdarstellung und -interpretation einnahm. Im Folgenden werden insbesondere die Ergebnisse zum Französischen und die, aufgrund der geringen Teilnehmerzahl mit Vorbehalt zu interpretierenden, Ergebnisse zum Spanischen resümiert: Insgesamt lag die Stichprobengröße in Deutschland bei 657 Schüle‐ rinnen und Schülern der 5.-Jahrgangsstufe und 598 Schülerinnen und Schülern der 9. Jahrgangsstufe (vgl. Meißner et al. 2008: 119). In Hessen waren es 127 Französischlernende sowie sechs Spanischlernende aus der 9. Jahrgangsstufe (vgl. Meißner et al. 2008: 65); in Berlin nahmen sieben Französischlernende der 5. Jahrgangsstufe und 119 Französischlernende sowie 34 Spanischlernende der 9. Jahrgangsstufe an der Studie teil (vgl. Meißner et al. 2008: 83). Mittels einer schriftlichen Befragung in Form eines Fragebogens wurden Daten 1) zur Sprachlernbiographie, 2) zum Unterrichtserlebnis (z. B. Unterrichtserlebnis in der Wahrnehmung der Lernenden, Leistungsbereitschaft in den gelernten Sprachen, Selbsteinschätzung in den gelernten Sprachen), 3) zu Haltungen und Einstellungen gegenüber dem Fremdsprachenunterricht (u. a. Nützlichkeit der erlernten Sprachen, Zufriedenheit mit der Wahl der Schulfremdsprache; vgl. Meißner et al. 2008, 69 ff., 73 ff.), 4) zu Erwartungen an den Fremdsprachenunter‐ richt und zu Fremdsprachen, die Schülerinnen und Schüler in Zukunft erlernen wollten sowie 5) zu allgemeinen Vorstellungen zu Sprachen ermittelt (vgl. Meißner et al. 2008: 65 ff., 82 ff.). Die Ergebnisse zeugen laut Meißner et al. (2008: 96 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 105) von einer „dilemmatischen Situation des Französischunterrichts“: Die Werte der Französischlernenden für Leistungsbereitschaft, Selbsteinschätzung, Haltungen und Einstellungen zum Fremdsprachenunterricht, Einstellungen gegenüber der französischen Sprache, Anwendungsmöglichkeiten und Außen‐ druck, angestrebter Kompetenzen, Integrativitätsziel, Instrumentalitätsziel, Bild des Landes blieben sowohl in Hessen als auch in Berlin alle mehr oder weniger deutlich hinter denen des Englischen zurück (vgl. Meißner et al. 2008: 68-73; 86-90). Dem gegenüber stehen ebenfalls die beachtlich höheren Werte, die die insgesamt 40 Probandinnen und Probanden des Spanischen in der MES-Studie erzielten. In allen untersuchten europäischen Zonen zeigen die Mädchen ein stärkeres Interesse an Fremdsprachen als die Jungen. In Deutschland betreffen die signifikanten Unterschiede vor allem die zweite Fremdsprache Französisch (vgl. Meißner et al. 2008: 103). Aus den Studienergebnissen schlussfolgert die Forschergruppe, dass die Sprachenfolge Französisch nach Englisch bezüglich der affektiven Faktoren wenig förderlich sei und schlägt eine Vorverlegung der zweiten Fremdsprache, eine leichte Erhöhung der Jahreswochenstundenzahl und einen vermehrten Einsatz von mehrsprachigkeitsdidaktischen Verfahren vor (vgl. Meißner et al. 2008: 93, 106). Meißner et al. (2008: 103) führen außerdem die Vermutung an, dass eine stärkere kommunikative Orientierung des Französischunterrichts die niedrigen Werte bei den Einstellungen ändern könnte. Inwiefern die Hypothesen von Meißner et al. (2008: 104) bezüglich der Ursachen für die niedrigeren Werte bei den Einstellungen zum Französischen zutreffen oder andere Einflüsse für die vergleichsweise niedrigen Werte im Bereich der affektiven Faktoren bezüglich des Fachs Französisch verantwortlich sind, muss in weiteren Studien genauer untersucht werden und stellt daher auch einen Teil des Forschungsansatzes der vorliegenden Studie dar. Auch wenn aktuelle Studien derzeit immer noch signifikante Geschlechter‐ unterschiede zugunsten der Mädchen zeigen, wird versucht, diese in Abhängig‐ keit von anderen Faktoren wie beispielsweise dem sprachlichen Hintergrund oder der Schulart zu erklären: Venus (2017a, 2017b) untersuchte in Bayern ebenfalls Einstellungen hinsichtlich des Französischunterrichts und differen‐ zierte hierbei zwischen fachspezifischen Einstellungsobjekten (französische Sprache; Sprecherinnen und Sprecher der französischen Sprache; Frankreich, die Frankophonie und deren Kulturen) und lernspezifischen Einstellungsob‐ jekten (Erlernen von Fremdsprachen; Erlernen der französischen Sprache; Französischunterricht, vgl. Venus 2017a: 121, 2017b: 125). Sie befragte mittels eines Online-Fragebogens insgesamt 739 Schülerinnen und Schüler (295 Jungen und 444 Mädchen) aus den Jahrgangsstufen 7 bis 10 der Realschule und des Gymnasiums mit Französisch als erster, zweiter oder dritter Fremdsprache 5.1 Endogene Faktoren 97 (vgl. Venus 2017a: 208). Bei allen erforschten Einstellungsobjekten ergaben sich bei den weiblichen Lernerinnen höhere Mittelwerte als bei den männli‐ chen Lernenden, wobei alle Unterschiede hoch signifikant waren und der größte Geschlechterunterschied bei den Einstellungen zu den Sprecherinnen und Sprechern der französischen Sprache vorzufinden war (vgl. Venus 2017a: 264-266). Die Untersuchung auf mögliche Interaktionseffekte mittels zweifak‐ torieller Varianzanalyse zeigte, dass signifikante Interaktionen zwischen den Faktoren ‚Geschlecht‘ und ‚mehrsprachig aufgewachsen‘ bezüglich der Einstel‐ lung zum Land und zur Kultur bestanden, welche allerdings lediglich geringe Effektgrößen vorwiesen. Der Geschlechtsunterschied in der Einstellung zum Land und zur Kultur war also sowohl auf das Geschlecht als auch auf den Faktor ‚mehrsprachig aufgewachsen‘ zurückzuführen, in dem Sinne, dass mehr‐ sprachig aufgewachsene männliche Schüler einen niedrigeren Mittelwert und somit negativere Einstellungen zum Land und zur Kultur Frankreichs und der Frankophonie aufwiesen als monolingual aufgewachsene männliche Schüler (vgl. Venus 2017a: 264-266). Zweifaktorielle Varianzanalysen, die für die Lernenden des Französischen als zweite Fremdsprache durchgeführt wurden (n = 474), zeigten einen Inter‐ aktionseffekt mit geringer Effektgröße zwischen den Faktoren ‚Geschlecht‘ und ‚Schulart‘ bei den lernspezifischen Einstellungen im Bereich Fremdspra‐ chenlernen: Die männlichen Realschüler wiesen höhere Mittelwerte und somit positivere Einstellungen zum Fremdsprachenlernen auf als die männlichen Gymnasiasten (vgl. Venus 2017a: 267-268). Der Unterschied war so stark, dass die männlichen Realschüler beinahe so hohe Werte erzielten wie die weiblichen Gymnasiasten. Ein ähnlicher Interaktionseffekt wurde zwischen dem Faktor ‚Geschlecht‘ und dem Faktor ‚Schulart‘ bei den Einstellungen zum Französischunterricht gefunden: Die männlichen Realschüler erreichten ebenfalls tendenziell höhere Mittelwerte und verfügten somit über tendenziell positivere Einstellungen zum Französischunterricht als die männlichen Gym‐ nasiasten. Bei der Teilstichprobe der Lernenden des Französischen als zweite Fremdsprache in der Realschule (n-=-146) trat hinsichtlich der Einstellung zum Französischunterricht außerdem der einzige Fall auf, bei dem die Mittelwerte der männlichen Schüler höher waren als diejenigen der weiblichen, wenngleich der Unterschied nicht signifikant war (vgl. Venus 2017a: 268). Neben den Einstellungen untersuchte Venus (2017a: 296) auch die Fachent‐ scheidungsfrage und befragte die Jungen und Mädchen nach der Wiederwahl des Französischen. Während 47.9% der Jungen Französisch wiederwählen würden, lag der Anteil der Mädchen, die Französisch wiederwählen würden, bei 65.2%, wobei der Unterschied nach dem Chi-Quadrat-Test signifikant war. 98 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Dementsprechend würden 44.9% der Jungen das Fach Französisch abwählen, wenn sie es könnten und lediglich 20.1% der Mädchen. Es wurde also deutlich, dass die Tendenz, Geschlechterunterschiede zu‐ gunsten der Mädchen in den motivationalen Faktoren vorzufinden, vor allem im traditionellen Fremdsprachenunterricht Französisch zu finden ist, wobei auch hier nach verschiedenen weiteren Faktoren wie beispielsweise sprachlichem Hintergrund und Schulart differenziert werden muss. Betrachtet man weitere Studien, so gibt es auch einige, die die vermeintliche Tendenz der stärker aus‐ geprägten affektiven Faktoren bei den weiblichen Fremdsprachenlernerinnen nicht bestätigen, da bei ihnen keinerlei Geschlechterunterschiede gefunden werden konnten. Henry (2011: 95 ff.) sieht drei Ursachen für das Ausbleiben von Geschlechter‐ unterschieden bei affektiven Faktoren bezüglich des Fremdsprachenlernens: Als ersten Grund nennt er Präselektionseffekte. Beispielsweise fanden Ma‐ cIntyre et al. (2002) (n = 268) in ihrer Langzeitstudie von Grade 7 bis 9 der Junior High School (Alter: 12-14 Jahre) in einem freiwilligen Immersionsprogramm für Französisch im englischsprachigen Teil Kanadas keinerlei Geschlechterun‐ terschiede in der Integrativität. Henry (2011: 95) sieht indes das Ungleichgewicht in der Geschlechterverteilung der Stichprobe (n (w)-= 188; n-(m)-=-96) als Indiz dafür, dass ein Präselektionsbias vorliegen könnte, in der Form, dass vor allem Jungen mit positiven Einstellungen zum Französischen dieses Immersionspro‐ gramm belegten und die Stichprobe daher nicht repräsentativ für die gesamte Altersgruppe sei. Als zweiten Grund für das Vorfinden vergleichbarer Ausprägungen der affek‐ tiven Faktoren von Jungen und Mädchen gegenüber dem Fremdsprachenlernen nennt Henry (2011: 95) einen insgesamt sehr starken Bezug der Lernenden zur Zielkultur: Ravid (1987) (n = 217), die ihre Studie für die Zielsprache Hebräisch durchführte, konnte bei den US-amerikanischen Teilnehmerinnen und Teilnehmern, die alle einen jüdischen Hintergrund hatten und deshalb neben der regulären Schule eine zusätzliche hebräische Schule besuchten, kei‐ nerlei Geschlechterunterschiede in der integrativen L2-Motivation, Hebräisch zu erlernen, finden. Auch Cortés (2002), die eine Studie (n-=-209) bezüglich der Zielsprache Spanisch in den USA durchführte, bei der 35% der Probandinnen und Probanden einen persönlichen Bezug zur Gruppe der Hispanics hatten, fand keinerlei Geschlechterunterschiede bei der integrativen Motivation. Als dritten Grund für das Ausbleiben von Geschlechterunterschieden bei affektiven Faktoren beim Fremdsprachenlernen sieht Henry (2011: 97) schließ‐ lich starke Einflüsse von soziokulturellen Praktiken, Hierarchien, Ideologien, Gesellschaftsformen (vgl. individualistische vs. kollektivistische Gesellschafts‐ 5.1 Endogene Faktoren 99 formen), geo- und sprachpolitischen Tendenzen, die beide Geschlechtergruppen in gleichem Maße betreffen: Beispielsweise fanden Shaaban und Ghaith (2000) keinerlei Geschlechterunterschiede in der integrativen Motivation für das Erlernen des Englischen bei Studierenden an der Universität von Beirut (n = 180), wobei diese bei beiden Geschlechtergruppen sehr niedrig ausgeprägt war. Dies könnte mit dem Befund erklärt werden, dass zu dieser Zeit das Englische im Mittleren Osten von Frauen und Männern gleichermaßen als Bedrohung für die arabische Sprache und Kultur angesehen wurde (vgl. Suleiman 1993; Zughoul/ Taminian 1984). Diese Beispiele illustrieren, wie wichtig es ist, gezielt mehrere Untersu‐ chungsgegenstände in die Studien einzubeziehen und insbesondere makro‐ strukturelle Elemente in den Studien zur L2-Motivation und Gender zu berücksichtigen. Letztere können, je nach deren Natur und Ausprägung, Ge‐ schlechterunterschiede schaffen oder aber neutralisieren, weshalb nicht mehr von einer allgemeinen Tendenz der höheren L2-Motivation der weiblichen Lernenden gesprochen werden kann. 5.1.3.1.7 Geschlechtsspezifische Tendenzen der Fächerwahl Eine zweite Tendenz, die an die vermeintlich höhere L2-Motivation der weibli‐ chen Lernenden anknüpft, bezieht sich auf die Fächerwahl (vgl. Grein 2012: 174): Zahlreiche Studien bestätigen, dass weibliche Lernende deutlich mehr und häufiger fremdsprachliche Kurse und Studiengänge belegen als männliche (vgl. für Übersichtsdarstellungen Carr/ Pauwels 2006; Faulstisch-Wieland 2004; Fuchs 2013; Schmenk 2007; Venus 2017a: 296). Sie nennen als Erklärungsansatz den Motivationsmangel von Jungen, welcher zur Fremdsprachenabwahl führe (vgl. Bittner 2003; McCall 2011; Pritchard 1987; Schröder-Sura et al. 2009; Williams et al. 2002). Bezüglich der Ursachenforschung für die Abwahl des Französischen werden schlechte Leistungen, das Schwierigkeitsempfinden und der geringe Nützlichkeitswert der Sprache genannt (vgl. Bittner 2003: 343; Küster 2007: 220). Auch hierbei sollte geklärt werden, inwiefern dies tatsächlich einer niedrigeren L2-Motivation der Jungen geschuldet ist oder inwiefern makrostrukturelle Aspekte dieses Ungleichgewicht bedingen, zum Beispiel indem von Jungen erwartet wird, eine karriereorientierte Fächerwahl im Bereich der Natur- und Wirtschaftswissenschaften vorzunehmen, was der von Bittner (2003: 343) und Küster (2007: 220) gefundene als gering wahrgenommene Nützlichkeitswert des Französischen erahnen lässt. Piller und Pavlenko (2007) berichten von der Erfahrung aus den 1970er Jahren, dass den Jungen zur Wahl von Latein und den Mädchen zur Wahl von Französisch als zweiter Fremdsprache geraten worden sei - mit der Konsequenz, 100 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung dass die Jungen zwar keine Fremdsprachen außer Englisch sprachen, dafür aber mit dem Latinum eine Bedingung für den Zugang zu vielen Studienfächern besessen hätten. Auf diesem Wege wurde schon vor einigen Jahrzehnten die „Weiblichkeit“ des Französischen untermauert. Auch andere Studien kamen zu dem Ergebnis, dass die gesellschaftliche Wahrnehmung von angemessenem männlichem Verhalten die Fächerwahl von Jungen im schulischen Bereich einschränken könnte (vgl. Frank et al. 2003; Martino 1995). Martino (1995) argumentiert sogar, dass männliche Schüler traditionell weiblich dominierte Fächer wie Französisch meiden würden, um den Verdacht auf Homosexualität nicht aufkommen zu lassen. Da das Thema der Fächerwahl aber kein zentrales Thema der vorliegenden Arbeit darstellt, soll dies an dieser Stelle nicht näher vertieft werden, sondern lediglich als im Zusammenhang mit Motivation stehend und auch als die Grundgesamtheiten und Stichproben bedingender Aspekt im Blick behalten werden. 5.1.3.1.8 Abkehr von dichotomen Zuschreibungen Eine dritte Tendenz, die Schmenk (2002: 50 ff.; 2007: 125) im Zusammenhang mit der Erforschung von affektiven Faktoren, Gender und Geschlecht im Zusammenhang mit dem Erlernen von Fremdsprachen hervorhebt, ist, dass Studien vor der Jahrtausendwende oft dichotome Zuschreibungen vornahmen und zu dem Ergebnis kamen, dass Frauen integrativ und Männer instrumentell orientiert seien (vgl. Bacon/ Finneman 1990; Burstall et al. 1974; Ludwig 1983), was wiederum den Geschlechterrollenstereotypen vom Mann als an Beruf und Karriere interessiertem Menschen und der Frau als kommunikativem und sozialem Wesen entspricht und daher besonders resistent sei (vgl. Schmenk 2002: 50-53). Außerdem habe dies dazu geführt, dass die soziale Seite von Frauen und ihre ausgeprägte Identifikationsfähigkeit mit der Zielkultur seitdem regelmäßig hervorgehoben werde (vgl. z. B. Oxford/ Nyikos 1989: 8; Oxford et al. 1988: 326). Diese Entweder-Oder-Zuweisung bringt eine große Problematik der Simplifizierung und Homogenisierung von verschiedenen Merkmalsgruppen hinsichtlich ihrer Geschlechtszugehörigkeit mit sich und muss allein schon aufgrund damaliger ungenauer Erhebungsmethoden wie etwa der inkorrekten Verwendung von integrativen Items für instrumentelle Motivation und umge‐ kehrt (vgl. Bacon/ Finneman 1990: 463; 1992: 480) oder der Zuschreibung von Kategorien, ohne dass diese aus der Datenbasis ableitbar wären (vgl. Burstall et al. 1974: 62) infrage gestellt und erheblich differenzierter betrachtet werden (vgl. Schmenk 2002: 53). Aus diesem Grund weist Schmenk (2016: 255) darauf hin, dass bislang keine Evidenz für diese dichotome Zuweisung gefunden 5.1 Endogene Faktoren 101 werden konnte. Da die vielfältigen Bemühungen, weiblichen Lernerinnen eher integrative und männlichen Lernenden eher instrumentelle Orientierungen gegenüber dem Fremdsprachenlernen zuzuschreiben, bisher nicht zum Erfolg führten, könne die verstärkt sprachlich ausgerichtete Fächerwahl der Mädchen laut Schmenk (2016: 255) auch nicht einfach nur durch ein „weibliches“ Moti‐ vationsprofil begründet werden. Aus diesem Grund fordert sie die Forschungs‐ gemeinschaft zum wiederholten Mal dazu auf, soziokulturelle Kontexte in die Erforschung von Geschlecht, affektiver Faktoren und deren Auswirkung auf das Fremdsprachenlernen stärker miteinzubeziehen (vgl. Schmenk 2016: 255). Es gibt bereits einige Studien, die versuchen, dies umzusetzen und gleichzeitig den Anspruch haben, ein möglichst differenziertes Motivationsprofil von weib‐ lichen und männlichen Lernenden zu erheben, wodurch die Komplexität der Studiendesigns stetig zunimmt (vgl. Fuchs 2013, 2014; Sunderland 2000) und es auch immer häufiger zum Einsatz von Mixed-Method-Designs kommt (vgl. Kissau 2006a, 2006b; Williams et al. 2002). Williams et al. (2002: 503) untersuchten mithilfe einer quantitativen Fragebo‐ genstudie potenzielle Geschlechterunterschiede bei Einstellungen, Motivation, Identität und externale Faktoren bezüglich des Erlernens des Deutschen und des Französischen bei 228 Lernenden der 7. bis 9. Jahrgangsstufe in England. Im Rahmen eines Mixed-Method-Designs wurden anschließend 24 Probandinnen und Probanden in qualitativen Interviews einzeln befragt. Insgesamt konnten si‐ gnifikant höhere Werte bei Mädchen nachgewiesen werden, insbesondere beim Gefallen an der Fremdsprache, beim Wunsch, die Fremdsprache zu erlernen, bei der integrativen Orientierung, der intrinsischen Motivation, bei der Lern‐ anstrengung und beim Einsatz metakognitiver Strategien. Bei der wahrgenom‐ menen Notwendigkeit, die Fremdsprache zu erlernen, dem wahrgenommenen Lernerfolg, der wahrgenommenen eigenen Fähigkeit, der Kontrollüberzeugung, dem Strategiebewusstsein, der wahrgenommenen Unterstützung durch Lehr‐ kräfte, Eltern und Peers traten wiederum keine signifikanten Geschlechterun‐ terschiede auf, wobei die Mädchen auch bei diesen Konstrukten, mit Ausnahme der Kontrollüberzeugung, tendenziell höhere Mittelwerte erzielten. In den qualitativen Interviews bestätigten Jungen und Mädchen gleichermaßen, dass die Mädchen mehr Lernanstrengung für das Erlernen der beiden Fremdsprachen aufbrächten und dass es für Jungen nicht „cool“ sei, Lernanstrengungen in fremdsprachlichen Fächern zu zeigen (vgl. Williams et al. 2002: 516), was erneut verdeutlicht, dass Jungen oftmals dem Geschlechterstereotyp so angestrengt folgen, dass sie in den sprachlichen Fächern eventuell unter ihren Möglichkeiten bleiben. 102 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Außerdem zeigte sich ein meist signifikanter Motivationsrückgang von der 7. zur 9. Jahrgangsstufe bei beiden Geschlechtergruppen (vgl. Williams et al 2002: 518). Schließlich fielen die Werte für das Erlernen der deutschen Sprache bei einer Mehrzahl der untersuchten Konstrukte signifikant höher aus als für das Französische (vgl. Williams et al. 2002: 520) und besonders die männlichen Befragten zeigten eine signifikant höhere Motivation für das Erlernen der deutschen Sprache. Als Gründe hierfür wurden in den Interviews genannt, dass das Französische “a feminine language” und “the language of love and stuff” sei, während Deutsch mit “the war, Hitler and all that” assoziiert und von den Jungen als „männliche“ Sprache wahrgenommen wurde (vgl. Williams et al. 2002: 520). Hier wird also deutlich, wie stark das Doing Gender sowohl mit einzelnen Sprachen als auch mit dem Alter der Lernenden zusammenzuhängen scheint. Des Weiteren wurde ein meist signifikanter Zusammenhang zwischen den einzelnen motivationalen Konstrukten und der fremdsprachlichen Leistung gezeigt, welche Williams et al. (2002: 517, 519) über die Lehrkräfte erfragten und drei Sprachniveaus (A-C nach dem britischen Notensystem) einteilten. Auch wenn diese Erhebungsmethode fragwürdig ist, da die Einschätzung durch die Lehrkräfte durchaus stark subjektiv sein kann, wird deutlich, wie wichtig die motivationalen Faktoren für den Fremdsprachenlernerfolg sind und dass Geschlechterunterschiede in den motivationalen Faktoren sich mit hoher Wahrscheinlichkeit auch in den fremdsprachlichen Leistungen niederschlagen. Zusammenfassend bleibt festzuhalten, dass eine Vielzahl an affektiven Kon‐ strukten erhoben und keinerlei dichotome Zuschreibungen getätigt werden sollten. Außerdem klären Williams et al. (2002) nicht, wie der Druck auf Jungen, geschlechterstereotypes Verhalten zu zeigen, überwunden werden kann. Dies könnte, wie Henry (2011) andeutet, über vermehrte Kontakte mit den Zielkul‐ turen und ein hohes Maß an Identifikation mit diesen Kulturen gelingen. 5.1.3.1.9 Die Erforschung geschlechtsspezifischer Interessen Einige Studien zeigen außerdem deutliche Unterschiede in den Interessen von Jungen und Mädchen. Todt (2000) unterscheidet sogar zwischen geschlechts‐ gruppentypischen Interessen und nicht geschlechtsspezifischen Interessen. Als Ursache für geschlechtsgruppentypische Interessen werden überwiegend die Entwicklung der Geschlechtsidentität und der Wunsch nach geschlechtsrollen‐ konformem Verhalten angesehen, welcher in der Pubertät besonders stark ausgeprägt ist (vgl. Fuchs 2013: 189; Todt 2000). Dennoch lässt sich eine geschlechtsspezifische Differenzierung der Interessen teilweise schon in der Kindheit erkennen (vgl. Daniels 2008: 69). 5.1 Endogene Faktoren 103 Bügel und Buunk gingen bereits im Jahr 1996 in ihrer Studie zum Lesever‐ stehen im Englischen in der niederländischen Sekundarstufe mit einer Stich‐ probengröße von 2 980 Englischlernenden der Frage nach, inwiefern die von ihnen gemessenen Unterschiede zugunsten der Jungen bei englischsprachigen Leseverständnistests mit deren möglichen geschlechtsspezifischen Interessen sowie dem Vorwissen von Jungen und Mädchen zusammenhingen und ob unterschiedliche Ergebnisse von Mädchen und Jungen bei diesen Tests mit geschlechtsspezifisch unterschiedlichem Vorwissen und Interesse korrelierten (vgl. Bügel/ Buunk 1996: 18). Hier wurde also nicht das Interesse an der Fremd‐ sprache, sondern vielmehr der Effekt der allgemeinen persönlichen Interessen‐ sgebiete auf die fremdsprachliche Leistung untersucht. Dabei gingen Bügel und Buunk (1996: 17) davon aus, dass Jungen primär an Computerspielen, technischen Aspekten, Sport, Autos, Wirtschaft und Politik interessiert seien, während Mädchen sich eher für Mode, Popstars, menschliche Beziehungen, Liebesgeschichten und Kunst interessierten und dementsprechend soziale, auf das Zuhause bezogene sowie literarische und künstlerische Aktivitäten bevor‐ zugen würden. Vor diesem Hintergrund formulieren sie die Hypothese, dass es beim Leseverstehenstest potentiell ein Geschlecht benachteiligende Texte und Testaufgaben vor dem Hintergrund der darin behandelten Thematik geben könnte. Um herauszufinden, ob dem wirklich so war, setzten sie für dieses Ziel Multiple-choice-Fragen zu Texten ein, welche zuvor von den Forschenden als ‚neutral‘, ‚weiblich‘ oder ‚männlich‘ klassifiziert worden waren. Außerdem entwickelten Bügel und Buunk (1996) Fragebögen zu Interessen und Vorwissen sowie zu Lese- und Fernsehgewohnheiten der Jugendlichen. Als ‚weiblich‘ wurden dabei Texte deklariert, die das Zuhause, den Haushalt, die Kunst, zwischenmenschliche Beziehungen, stereotype weibliche Verhaltensweisen, nicht-stereotype männliche Verhaltensweisen, weibliche Berufe, die eigene Pflege und die Pflege anderer, Kochen, Empathie für Außenseiterinnen und Außenseiter, Mitleid, Kunst, Literatur, Tanz und Philosophie beinhalteten. Als ‚männliche Texte‘ wurden Texte eingestuft, die die Themen Wirtschaft, Politik, Autos, Autoritäten, öffentliche Angelegenheiten, Kriminalität, Gewalt, Aggression, Krieg, Militär, Nationalismus, Gefahr, risikoreiches Verhalten, Sport, Technologie, Maschinen, Physik, stereotypes männliches Verhalten und nicht-stereotypes weibliches Verhalten zum Thema hatten. Als neutrale Texte wurden lediglich diejenigen deklariert, die das Aufnehmen von ausländischen Schülerinnen und Schülern bei einer Gastfamilie behandelten. Während Mäd‐ chen und Jungen etwa gleich gute Ergebnisse bei den Leseverstehenstests zu den neutralen Texten erzielten, schnitten die Jungen bei den Aufgaben zu ‚männlichen Texten‘ insgesamt besser ab als die Mädchen. Die Mädchen 104 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung erzielten wiederum bei den Aufgaben zu ‚weiblichen Texten‘ meist bessere Ergebnisse als die Jungen. Allerdings gab es auch ‚weiblich‘ klassifizierte Texte, bei denen die Jungen bessere Ergebnisse erzielten als die Mädchen, was Bügel und Buunk (1996: 26) als Beweis dafür ansahen, dass Jungen insgesamt über eine größere Erfahrung mit komplexeren informativen L2-Texten in Englisch verfügten als Mädchen. Schmenk (2002: 100) kritisiert jedoch an dieser Studie, dass Texte nicht als ‚weiblich‘ oder ‚männlich‘ klassifiziert werden könnten und die Testergebnisse vielmehr von der Komplexität der sprachlichen Strukturen der einzelnen Texte als vom Thema abhängen würden. Vom vermeintlichen Zusammenhang zwischen Themenwahl und fremd‐ sprachlicher Leistung abgesehen, reproduzieren sich ähnliche Studienergeb‐ nisse zu geschlechterspezifischen Interessensgebieten auch in jüngerer Zeit: Bei den spezifischen fachlichen Interessen im schulischen Bereich zeigen sich bei Sparfeldt et al. (2004), Dresel et al. (2005: 3) und Jansen et al. (2013) in der Adoleszenz deutliche Geschlechterunterschiede: Während Jungen oft ein höheres Interesse an Naturwissenschaften, Sport und Politik zeigen, kann bei Mädchen oft ein höheres Interesse an Biologie, Humanwissenschaften und Sprachen festgestellt werden. Helbig (2015) sieht sogar unter anderem in der durch Lehrkräfte stattfindenden Bevorzugung von als weiblich konnotierten Interessen und Verhaltensweisen einen Erklärungsansatz für die aktuell ge‐ messenen oft geringeren Schulerfolge der Jungen, was sichtbar macht, dass die Annahme der Existenz von „weiblich konnotierten Interessen“ auch im 21.-Jahrhundert fortbesteht. Abgesehen davon, welche Interessensbereiche als geschlechtstypisch weib‐ lich oder männlich konnotiert werden, wird bis heute davon ausgegangen, dass die Konstrukte der Interessensbereiche zum Doing Gender beitragen: Bei Mädchen ebenso wie bei Jungen kann eine Selbstinterpretation vor der Folie, was für das eigene Geschlecht als typisch gilt, und die Hervorbringung einer diesen Normen entsprechenden geschlechtlichen Identität zur Entfaltung von geschlechts‐ adäquaten fachbezogenen Motivationen und Interessen und zur Distanzierung von den nicht geschlechtsadäquaten beitragen. Insofern sind Gründe für Leistungsdiffe‐ renzen von Mädchen und Jungen auch im schulischen Doing Gender zu suchen. (Thorn 2017: 87) Bezüglich der Interessen gegenüber Fremdsprachen und dessen Zusammenhang zur fremdsprachlichen Leistung liegen außerdem insbesondere für das Engli‐ sche einige aktuelle Forschungsergebnisse vor: Zaunbauer et al. (2009) finden keinen signifikanten Einfluss des Geschlechts auf die Interessen am Englischen von Schülerinnen und Schülern der 5. Jahr‐ 5.1 Endogene Faktoren 105 38 Rumlich (2016) vergleicht CLIL-Programme mit traditionellem Englischunterricht. Die Prädiktorstärke des Unterrichtsansatzes ist aber bezüglich des Interesses am Fach Englisch von äußerst geringer Relevanz (vgl. Rumlich 2016: 407). gangsstufe. Auch Daniels (2008: 249) findet in der 7. Jahrgangstufe keinen signifikanten Einfluss des Geschlechts auf die Entwicklung der Interessen am Englischen. Jedoch konnte die DESI-Studie signifikant höhere Werte im Bereich des Interesses am Englischen zugunsten der Mädchen in der 9. Jahrgangsstufe sowie eine schwache Korrelation zwischen Interesse und sprachlicher Leistung finden (vgl. Helmke et al. 2008: 255). Meißner et al. (2008: 150) bestätigen dieses Ergebnis hinsichtlich des allgemeinen Interesses am Fremdsprachenlernen in ihrer MES-Studie, in der 3 027 Lernende der 5. Jahrgangsstufe und 3 246 Lernende der 9. Jahrgangsstufe untersucht wurden, da sie beim Index „Attitüde Fremdsprachenlernen“, welcher aus Interesse an Sprachen und aus der Anzahl an für die Schülerinnen und Schüler interessanten Sprachen bestand, in allen untersuchten Regionen in Deutschland, Belgien, Griechenland, Luxemburg und Polen signifikante Ergebnisse zugunsten der Mädchen maßen. Jedoch kommt Fuchs (2014: 192) wiederum zu dem Ergebnis, dass keine signifikanten Unter‐ schiede und vernachlässigbare Effekte beim Interesse am Englischunterricht in der 9. Jahrgangsstufe vorliegen. Allerdings setzt sich die Skala, die das Interesse maß, lediglich aus drei Items zusammen, was das Minimum für eine Skala darstellt und eine gewisse Instabilität mit sich bringt (vgl. Milfont/ Fischer 2010: 113; Osborne et al. 2008). Rumlich (2016: 407, 431) kommt in seiner Studie zu dem Ergebnis, dass sowohl in der 6. als auch in der 8. Jahrgangsstufe die wichtigsten Prädiktorva‐ riablen für das Interesse am Englischunterricht das Selbstkonzept bezüglich der eigenen Leistungen im Englischen (EFL SC) und das Geschlecht der Lernenden darstellen, wobei der Einfluss des Geschlechts in der Zeitspanne von der 6. bis zum Ende der 8. Jahrgangsstufe leicht zurückgeht. 38 Dabei verfügen die Mädchen der 6. Jahrgangsstufe über ein höheres Interesse am Englischunterricht als die Jungen (Rumlich 2016: 339). Während die Mädchen in der 6. Jahrgangsstufe sowohl ein signifikant höheres Interesse am Englischunterricht als auch signi‐ fikant häufigere Freizeitaktivitäten auf Englisch vorweisen (vgl. Rumlich 2016: 358), zeigt sich in der 8. Jahrgangsstufe, dass zwar die Mädchen immer noch ein signifikant höheres Interesse zeigen, die Jungen jedoch signifikant mehr Zeit in ihrer Freizeit mit Aktivitäten auf Englisch verbringen (vgl. Rumlich 2016: 376), was demzufolge weniger auf ihr Interesse an der Sprache Englisch als auf ihr Interesse an den entsprechenden Freizeitaktivitäten, wie zum Beispiel Computerspielen in englischer Sprache zurückzuführen sei. 106 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 39 Spanisch als dritte Fremdsprache ist in allen Bundesländern Deutschlands ab der 8. Jahrgangsstufe wählbar. Allerdings bieten lediglich zwölf der sechzehn Bundesländer Spanisch auch als zweite Fremdsprache an. Unter anderem ist in Baden-Württemberg und Bayern Spanisch nicht als zweite Fremdsprache wählbar. Schließlich ist zu bedenken, dass die Leistungsmotivation und schulbezogene Einstellungen in der Pubertät tendenziell sinken (vgl. Daniels 2008: 58), was ins‐ besondere für die zweite Fremdsprache Französisch, die in der 6. Jahrgangsstufe einsetzt und für die dritte Fremdsprache Spanisch, die ab der 8. Klassenstufe 39 erlernt wird, eine Herausforderung darstellen kann. Dabei hat Spanisch den Vor‐ teil, freiwillig anstelle eines weiteren naturwissenschaftlichen Faches gewählt werden zu können. Während die Eltern als Sozialisationsinstanz in den Hinter‐ grund treten, gewinnen Gleichaltrige im Jugendalter immer mehr Einfluss auf die Identitätsentwicklung und die Herausbildung von Interessen, was den Abfall der Leistungsmotivation eventuell erklären könnte (vgl. Kapitel 5.2.1). Dennoch kann sich eine anregende Lernumgebung auch in der Adoleszenz positiv auf die Interessensentwicklung der Jugendlichen auswirken (vgl. Fuchs 2013). Es kann also festgehalten werden, dass bis heute geschlechtsspezifische Interessensgebiete zu finden sind. Außerdem zeigt die hier nachgezeichnete Ent‐ wicklung für das Fach Englisch, zu dem umfassendere Studien vorliegen als zu den Fächern Französisch oder Spanisch, dass es teilweise in der 9. Jahrgangsstufe zu einem Punkt zu kommen scheint, an dem die fremdsprachlichen Interessen der Jungen stärker abnehmen als diejenigen der Mädchen. Dieses Phänomen könnte aber eventuell teilweise durch interessensgeleitete Aktivitäten in der Fremdsprache, wie beispielsweise dem Spielen von Computerspielen, ausgegli‐ chen werden. Rumlich (2016: 376) kommentiert in diesem Zusammenhang seine Studienergebnisse wie folgt: Furthermore, boys exhibit higher leisure English scores than girls, i.e., they pursue English activities even longer and/ or more frequently than girls, even though the latter display significantly higher interest scores […]. This suggests that the leisure English activities of boys are not so much driven by their interest in English (classes), but by their interest in the activity itself. They might choose to do it in English contexts, since this might have a genuine benefit for the activity itself. One could imagine this to be the case with computer games such as massive open online role playing games like World of Warcraft®, for instance. (Rumlich 2016: 367) Es scheint also eine Tendenz dahingehend zu geben, dass Jungen in der Adoleszenz die Fremdsprache gerne nutzen, um interessensgeleiteten, nicht unterrichtlichen Aktivitäten nachzugehen, wobei diese durchaus zu einem entsprechenden Kompetenzzuwachs führen können. Bei Mädchen scheint hin‐ 5.1 Endogene Faktoren 107 gegen etwas häufiger ein direkt auf die Fremdsprache ausgerichtetes Interesse vorzuliegen. 5.1.3.1.10 Geschlecht, Gender und die Identitätsinstanz des Selbst Auch innerhalb des Possible-Self-Paradigmas (vgl. z. B. Henry 2009; Henry/ Apelgren 2008; Ryan 2009) wurde die Geschlechter- und Genderforschung bezüglich des Fremdsprachenlernens in den letzten Jahren vorangetrieben, wodurch es erste Forschungstendenzen auf diesem Gebiet gibt: Henry und Cliffordson (2013a) erklären sich Geschlechterunterschiede im Kontext gender‐ spezifischer Identitätsbildung wie folgt: “This suggests deep-rooted differences in the ways in which females and males identify with target language (TL) speakers and how they envisage future situations involving interpersonal communication” (Henry/ Cliffordson 2013a: 271). Im Kontext des Genderbe‐ griffs, der als allgegenwärtiges kognitives und soziales Konstrukt innerhalb des Possible-Self-Paradigmas definiert wird, welches im Verlauf des Lebens die Entwicklung des Selbstkonzepts durchdringt, und in Anbetracht des möglichen Zusammenhangs von genderspezifischer L2-Motivation und geschlechtsspezi‐ fischer Identifizierung mit der Zielsprache, ist der methodische Passus von Henry und Cliffordson (2013a: 272) zu erklären, Dörnyeis (2005) Paradigma des Possible Self als Referenz zu begreifen, um die Rolle von Gender erneut zu untersuchen. Demgemäß ist es als wahrscheinlich anzusehen, dass Genderun‐ terschiede im Selbstkonzept auch eine Auswirkung auf die Entwicklung des Ideal Language-Speaking/ Using Self haben. Knox (2006) kommt in seiner Studie zu dem Ergebnis, dass Frauen und Männer Selbstkonzepte jeweils auf eine andere Art und Weise konstruieren, da Frauen den Fokus mehr auf Beziehungen und Interaktion mit anderen legen würden als Männer und dies im Umkehrschluss dazu beitrage, dass zu‐ kunftsorientierte Selbstkonzepte nach ähnlichen Mustern konstruiert würden. Empirische Ergebnisse liegen hierzu in ähnlicher Form von Segal et al. (2001) vor, die herausfanden, dass Frauen, wenn sie ihr Selbst in die Zukunft proji‐ zieren, sich tendenziell stärker um interpersonale Bereiche sorgen und eher dazu tendieren, sich über die Beziehung zu anderen Gedanken zu machen als Männer. Allerdings ist bei diesen Studien nicht nachzuvollziehen, wie hoch der Einfluss der Gesellschaft auf die Art der Zukunftsprojizierung und auf die Konstruktion des idealen Selbst ist und inwieweit folglich Studien in anderen soziokulturellen Kontexten eventuell auch zu anderen Ergebnissen führen würden. Henry und Cliffordson (2013a: 272) applizieren die Forschungsergeb‐ nisse zu den Possible Selves und Gender (vgl. Kemmelmeier/ Oyserman 2001; Knox 2006; Segal et al. 2001) und nutzen sie als Fundamentum für die Annahme, 108 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 40 Dieses Konstrukt wurde von Singelis (1994) entwickelt und für dessen Messung wurde eine Interdependent Self-Construal scale (SSCS) eingesetzt. Während ein unabhängiges Selbstkonzept (Independent Self-Construal) von einer inhärenten Abgrenzung von anderen Individuen ausgeht und den Grad der Individualisierung und Unabhängigkeit des Einzelnen beschreibt, beschreibt das interdependente Selbstkonzept das Individuum als Teil einer sozialen Makrostruktur, weshalb hierbei soziale Beziehungen zu anderen Individuen ein wesentlicher Teil des Konzepts des Selbst sind (vgl. Henry/ Cliffordson 2013a: 3; Markus/ Kitayama 1991). dass das höhere Interesse von Frauen an Interaktion, das in ihrem Selbstkonzept verankert ist, mit hoher Wahrscheinlichkeit einen Einfluss auf die Entwicklung ihres Ideal Language-Speaking/ Using Self hat. Genauer gesagt stellen Henry und Cliffordson (2013a: 272) die Hypothese auf, dass das von Mädchen und Frauen konstruierte Ideal Language-Speaking/ Using Self motivational stärker aufgeladen sei, da Mädchen und Frauen sich ein zukünftiges Selbst zum Ziel setzen, das die Zielsprache flüssig und in einer elaborierten Form spricht. Diese Hypothese überprüfen sie anhand eines Samples, das aus 271 Schülerinnen und Schülern der Sekundarstufe besteht, die im Durchschnitt 15.5 Jahre alt sind und aus Schweden stammen, ein Land, das im Jahr 2011 auf dem ersten Rang des Gender Inequality Index des United Nations Human Development Programme (UN HDI 2011) lag und in dem somit das höchste Maß an Gleichberechtigung unter den Geschlechtern vorzufinden war. Anhand eines Fragebogens wurden zum einen das interdependente Selbstkonzept (Interdependent Self-Construal) 40 untersucht und zum anderen das Ideal Language-Speaking/ Using Self, welches sich einerseits auf das Ideal L2 Self im Englischen und andererseits auf das Ideal L3 Self im Französischen, Deutschen oder Spanischen bezog. Während beim interdependenten Selbstkonzept und beim Ideal L3 Self signifikante Gender‐ unterschiede zugunsten der Mädchen auftraten, wurden keine signifikanten Genderunterschiede beim Ideal L2 Self in Bezug auf das Englische gefunden. Dies wird dadurch begründet, dass die Verwendung der englischen Sprache in Schweden allgemeine kulturelle Praxis und so weit verbreitet sei, dass es den Status als Fremdsprache verlieren würde (vgl. Henry/ Cliffordson 2013a: 286). Im Gegensatz dazu werden in Schweden Sprachen wie Französisch, Deutsch oder Spanisch selten außerhalb der Institution Schule verwendet, weshalb sie als Fremdsprachen wahrgenommen werden. In diesen fremdsprachlichen Kontexten treten nicht nur bei Henry und Cliffordson (2013a), sondern auch in einigen anderen Studien Geschlechterunterschiede hinsichtlich des Ideal Language-Speaking/ Using Self auf (vgl. Kim 2009; Ryan 2009) sowie hinsicht‐ lich weiterer affektiver Faktoren wie der L3-Motivation (Henry 2012), dem L2-Selbstkonzept (Henry 2009) oder den Einstellungen (Henry/ Apelgren 2008). Daher wurde die Testung der Hypothese, dass bei Mädchen das Ideal Lan‐ 5.1 Endogene Faktoren 109 guage-Speaking/ Using Self motivational stärker ausgeprägt sei als bei Jungen, da sie sich ein zukünftiges Selbst zum Ziel setzen, das die Zielsprache flüssig spricht, ausschließlich auf das interdependente Selbstkonzept und das Ideal L3 Self bezogen. Tatsächlich kamen Henry und Cliffordon (2013a: 16) zu dem Ergebnis, dass beim Einfluss von Gender auf das Ideal L3 Self das interdependente Selbst‐ konzept als Moderatorvariable fungiert, d. h. dass die zwischenmenschlichen und relationalen Eigenschaften (vgl. Knox 2006) der weiblichen Probandinnen sich verstärkend auf das Ideal L3 Self auswirkten und folglich die weiblichen Probandinnen mit höherer Wahrscheinlichkeit ihr zukünftiges Selbst als ein mit Menschen aus anderen Ländern in Beziehung stehendes Wesen sehen, was Auswirkungen auf die L3-Motivation hat (vgl. auch Kemmelmeir/ Oyserman 2001; Knox 2006). Somit wird deutlich, dass sich die Vorstellung von Mädchen und Frauen als „kommunikative Wesen“ auch in der jüngeren Forschung zum Ideal Language-Speaking/ Using Self fortsetzt. Da das Selbstkonzept als Kenntnis über die Fähigkeiten des Selbst defi‐ niert wird und das Selbst Identitätsbildungsprozessen, die unter anderem geschlechtsspezifischer Natur sind, unterworfen ist, gibt es neben den Studien zum Ideal Language-Speaking/ Using Self auch zahleiche Forschungsarbeiten, die das fachspezifische Selbstkonzept im Hinblick auf Geschlecht und Gender untersuchen. Hansford und Hattie (1982) fanden in ihren Metaanalysen zunächst keinerlei Zusammenhang zwischen Geschlecht und Selbstvertrauen. In der Studie von Eccles et al. (1993) traten jedoch erste deutliche Geschlechterunterschiede in unterschiedlichen fachbezogenen Selbstkonzepten auf. Den gängigen Ge‐ schlechterstereotypen folgend, gibt es einige Forschungsergebnisse, die bei Jungen ein höheres fachliches Selbstkonzept in mathematischen Bereichen erfassen (vgl. Ryckman/ Peckham 1987; Horstkemper 1987; Helmke 1992; Tie‐ demann/ Faber 1995). Im Bereich der Fremdsprachen liegen eher uneinheitliche Ergebnisse vor: Es gibt Studien, die bei Mädchen ein höheres Selbstkonzept in sprachlichen Bereichen fanden (Möller/ Trautwein 2015: 191). Als Ursache für das höhere Selbstkonzept der Mädchen im Englischen als Fremdsprache wurden oft die besseren Noten der Mädchen angeführt, welche, wie bereits in Kapitel 4 diskutiert, nicht immer objektiv sind; bei statistischer Kontrolle des Einflusses der Schulnote wurde allerdings kein Geschlechterunterschied im Selbstkonzept im Englischen gefunden (vgl. Schilling et al. 2006; Rumlich et al. 2016: 135). Ryckman und Peckham (1987) maßen in Seattle in den Klassenstufen 4 bis 12 keinerlei Geschlechterunterschiede beim Fähigkeitsselbstkonzept in den sprachlichen Fächern. Clark und Trafford (1995) konnten gegenläufig 110 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung dazu für den Fremdsprachenunterricht in England ein höheres Selbstvertrauen der Jungen feststellen, sich mündlich im Fremdsprachenunterricht zu äußern, obwohl die Mädchen höhere fremdsprachliche Leistungen verzeichneten. Auf‐ grund des eher dominanten Verhaltens der Jungen diskutierten sie die Frage, ob monoedukative Maßnahmen nicht förderlicher für die fremdsprachliche Leistungsentwicklung der Mädchen wären. In der DESI-Studie (vgl. Helmke et al. 2008) wurden die Selbstkonzepte im Deutschen und im Englischen in der 9. Jahrgangsstufe gemessen und ebenfalls mit dem Geschlecht und den Ergebnissen in den Leistungstests in Bezug gesetzt. Hier soll ausschließlich auf das Selbstkonzept im Englischen als Fremdsprache eingegangen werden: Während die Mädchen zwar durchweg höhere Englischleistungen aufwiesen und bezüglich des Fachinteresses etwa eine viertel Standardabweichung über den Jungen lagen, welche signifikant war (p < .001), lagen im akademischen Selbstkonzept keine signifikanten Geschlech‐ terunterschiede vor. Dies bedeutet, dass sich die Jungen eher überschätzten und sich die Mädchen eher unterschätzten (vgl. Helmke et al. 2008: 249, 255). Selbst wenn also keine signifikanten Geschlechterunterschiede vorlagen, wird, bei Inbezugsetzung zur fremdsprachlichen Leistung, ein Zusammenhang zwischen Geschlecht und akademischem Selbstkonzept ersichtlich. Holder (2005) führte in der deutschen Schweiz eine Langzeitstudie von der 5. bis zur 9. Jahrgangsstufe durch, wobei sowohl das Fähigkeitsselbstkonzept als auch die Leistungsmotivation in Englisch und Französisch von 536 Lernenden an verschiedenen Schularten in Deutschland erfasst wurden. Er untersuchte diese Konstrukte zusätzlich in Abhängigkeit von der fremdsprachlichen Leis‐ tung. Während in der allgemeinen Leistungsmotivation im Fach Englisch keinerlei Geschlechterunterschiede auftraten, lagen in Französisch bezogen auf den Schultyp, an dem das Leistungsniveau festgemacht wurde, signifikante Geschlechterunterschiede zugunsten der Mädchen vor (vgl. Holder 2005: 237). Dadurch, dass es sich um eine Längsschnittstudie handelte, konnte nachge‐ wiesen werden, dass der Geschlechterunterschied in der Leistungsmotivation in der 6. und 7. Klasse im Französischen sehr gering ausfiel, während in der 8. und 9. Jahrgangsstufe ein deutliches Auseinanderklaffen der Leistungsbereitschaft in Französisch der beiden Geschlechtergruppen beobachtet wurde. Dies konnte weiter ausdifferenziert werden, da mehrere Schularten in die Untersuchung mit einbezogen wurden: Während der Unterschied zugunsten der Mädchen vor allem in Realschulen (n-= 159) und Progymnasien (n-= 160) festgestellt wurde, erwies er sich in den Primar- (n = 51) und Sekundarschulklassen (n = 166) als eher gering (vgl. Holder 2005: 139, 240). 5.1 Endogene Faktoren 111 Rumlich (2016: 333) fand schließlich weder bei Schülerinnen und Schülern des Regelunterrichts Englisch noch des Bilingualen Sachfachunterrichts Eng‐ lisch/ Deutsch und weder in der 6. noch in der 8. Jahrgangsstufe signifikante Effekte des Geschlechts auf das akademische Selbstkonzept im Englischen als Fremdsprache (EFS Selbstkonzept). Da die hier vorgestellten Ergebnisse jedoch vor allem auf das Englische als Fremdsprache bezogen sind, können davon ausgehend keinerlei Hypothesen dahingehend aufgestellt werden, inwiefern ähnliche Ergebnisse für das Selbst‐ konzept in Französisch als Fremdsprache (FFS Selbstkonzept) oder für das Selbstkonzept in Spanisch als Fremdsprache (SFS Selbstkonzept) auftreten, da die Ausprägungen je nach Zielsprache stark voneinander abweichen können (vgl. Holder 2005: 184). Die Geschlechterunterschiede im Selbstkonzept lassen sich also insgesamt nur teilweise durch Unterschiede in objektiven Leistungsmaßen belegen (vgl. Lohaus/ Vierhaus 2019: 210). Dennoch hat das fachspezifische Selbstkonzept auch Auswirkungen auf die Fächerwahl, welche laut Husfeldt und Ow (2011: 23, 35) oft typisch maskulin bzw. typisch feminin verläuft, in dem Sinne, dass Jungen häufiger mathematische und naturwissenschaftliche Fächer und Mädchen häufiger sprachliche Fächer wählen (vgl. Kapitel 5.1.3.1.7). Zusammenfassend kann festgehalten werden, dass sich in der Erforschung des Ideal Language-Speaking/ Using Self die Annahme von Frauen als kommuni‐ kativere und mehr auf soziale Beziehungen fixierte Wesen zu reproduzieren scheint. Bezüglich der fachlichen Selbstkonzepte scheint es in den Naturwis‐ senschaften eine klare Tendenz dahingehend zu geben, dass Jungen über ein ausgeprägteres Selbstkonzept verfügen, während die Ergebnisse bezüglich des fremdsprachlichen Selbstkonzepts, welches sich in den vorliegenden Studien vorwiegend auf das Englische bezieht, uneinheitlich sind: Zum einen lässt sich ableiten, dass Mädchen sich eher unterschätzen und Jungen sich eher überschätzen und dass Jungen bezüglich des Sprechens vor der gesamten Klasse teilweise ein höheres Selbstbewusstsein zeigen. Schließlich wird ersichtlich, dass das fremdsprachliche Selbstkonzept sehr stark von Schulnoten und weniger von Erfolgserlebnissen in der fremdsprachlichen Realität abhängig ist, was kri‐ tisch zu betrachten ist, da Schulnoten nicht nur von der sprachlichen Fähigkeit, sondern auch vom schulnormkonformen Verhalten abhängen. 112 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 41 Willingness to communicate wird von MacIntyre et al. (1998: 547) definiert als “readiness to enter into discourse at a particular time with a specific person or persons using a L2.” 42 Im Immersionsprogramm wurden die Fächer Science, Mathematics und Social Studies auf Französisch unterrichtet (vgl. MacIntyre et al. 2002: 544). 5.1.3.1.11 Geschlechtsspezifische Tendenzen in der L2 WTC und der L2-Angst Bezüglich verschiedener Formen von L2-Angst und Willingness to communicate (WTC) 41 und deren statistischer Abhängigkeit vom Faktor Geschlecht liegen ebenfalls bereits mehrere Studien vor: MacIntyre et al. (2002) untersuchten beispielsweise mögliche Effekte von Geschlecht, Alter und Sprache (L1 vs. L2) auf die Willingness to communicate (WTC), die Kommunikationsangst in der L1 (Communication Apprehension) und die Sprachangst in der L2 (Language Anxiety) sowie auf die wahrgenommenen Kommunikationsfähigkeiten im Fran‐ zösischen von 268 zwölfbis vierzehnjährigen Schülerinnen und Schülern der Grades 7, 8 und 9 an Junior High Schools im französischen Immersionsprogramm der englischsprachigen Regionen Kanadas (vgl. MacIntyre et al. 2002: 543-544). 42 Dabei wurden signifikante Haupteffekte von Geschlecht und Jahrgangsstufe auf die L2 WTC gefunden, wobei in Grade 9 bei den Mädchen die L2 WTC signifikant stärker ausgeprägt war als bei den Jungen. Die Langzeitentwicklung zeigt, dass in Grade 7 noch kein signifikanter Unterschied zwischen den Jungen und den Mädchen vorlag und in den Folgejahren die Mädchen eine deutlich steilere Entwicklung der L2 WTC verzeichnen konnten als die Jungen (vgl. MacIntyre et al. 2002: 548). Komplementär dazu wurde in Grade 9 bei den Jungen eine signifikant höhere Sprach- und Kommunikationsangst sowohl in der L1 Englisch als auch in der L2 Französisch gefunden als bei den Mädchen (vgl. MacIntyre et al. 2002: 551). Somit zeigt sich bei der L2 WTC erneut, dass sich der Geschlechterunterschied erst im Laufe der Sekundarstufe I herausbildet. Kissau (2006a) untersuchte im Zusammenhang mit dem Geschlecht ebenfalls die French Class Anxiety, also die Angst vor dem Französischunterricht. Die Skala dafür leitete er aus der Attitude/ Motivation Test Battery (AMTB) von Gardner et al. (1979) ab. Dabei zeigte sich allerdings, dass die Angst vor dem Französischunterricht eine der Variablen darstellte, die am wenigsten Vorhersagekraft für das Geschlecht besaß. Martinović und Sorić (2018) untersuchten 555 Studierende im ersten Jahr an der Universität von Zadar in Kroatien bezüglich des Zusammenhangs von L2-Angst bezogen auf die Verwendung der L2 innerhalb und außerhalb des Klassenzimmers, L2-Motivation, L2-Interesse und Geschlecht. Dabei stu‐ dierte keiner der Teilnehmenden Englisch im Hauptfach, sondern Englisch 5.1 Endogene Faktoren 113 war ein obligatorisches Zusatzfach zum eigentlichen Hauptstudium. Die Stu‐ dierenden hatten bereits während durchschnittlich 10.3 Jahren Englisch gelernt. In diesem Lernkontext zeigten sich signifikante Geschlechterunterschiede in der L2-Angst, wobei die weiblichen Studierenden eine signifikant höhere L2-Angst zeigten als die männlichen (vgl. Martinović/ Sorić 2018: 46). Dieses Ergebnis ist deshalb bezeichnend, da bei den weiblichen Studierenden gleichzeitig eine signifikant höhere Anstrengung beim Englischlernen, eine signifikant höhere instrumentelle Motivation bezüglich der Prävention unangenehmer Konsequenzen (Instrumentality - prevention), ein signifikant höheres L2-Inter‐ esse und signifikant höhere Abschlussnoten gemessen wurden als bei den männlichen. Hingegen wurden keinerlei signifikante Unterschiede beim Ideal L2 Self, beim Ought-to L2 Self und bei der instrumentellen Motivation bezüglich der Förderlichkeit für die akademische und berufliche Karriere (Instrumentality - promotion) festgestellt (vgl. Martinović/ Sorić 2018: 45-46). Dies versuchten Martinović und Sorić (2018: 47) folgendermaßen zu erklären: “[…] one possible explanation for higher motivation to learn English among females may be the balance between their ideal L2 self and their fear of negative consequences.” Die stärkere Angst der weiblichen Studierenden vor negativen Konsequenzen in Form von beispielsweise schlechten Noten oder dem Nicht-Erreichen des Ab‐ schlusses, welche durch die Skala zur Integrativität bezüglich der Vermeidung von unangenehmen Konsequenzen gemessen worden war, schien im Konflikt zum Ideal L2 Self der weiblichen Studierenden zu stehen, welches sich genauso ausgeprägt zeigte wie das der männlichen Studierenden: Begründet durch das „befürchtete Selbst“ (Feared Self) der weiblichen Studierenden gepaart mit einem hohen Ideal L2 Self zeigten sie laut Martinović und Sorić (2018: 47) eine erhöhte L2-Motivation und folglich trotz oder aber aufgrund höherer L2-Angst und ausgeprägter Angst vor negativen Konsequenzen bessere Noten in Englisch als die männlichen Studierenden. Nach dieser Interpretation der Studienergebnisse hatte also bei den Frauen insbesondere eine hohe L2-Angst gepaart mit einer hohen Angst vor negativen Konsequenzen einen positiven Effekt auf Motivation und Leistung, wodurch es sich hierbei offensichtlich um eine Faciliative Anxiety handelte, also eine Art von Angst, die das Fremdsprachenlernen vorantreibt (vgl. Horwitz 2001; Kapitel 9.3.4.10). Die bisherigen Studien zu L2-Angst und Geschlecht zeigen also, dass L2-Angst und Geschlecht immer wieder Zusammenhänge aufweisen, jedoch je nach Lerneralter und Zielsprache sehr stark schwanken können, wobei weibliche Lernende oft mit einer höheren L2-Angst zu kämpfen zu haben scheinen als männliche. Allerdings kann eine erhöhte L2-Angst teilweise sogar förderlich für den Sprachlernerfolg sein (vgl. Martinović/ Sorić 2018: 46). 114 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 5.1.3.1.12 Genderstereotype und Doing Gender im Zusammenhang mit dem Image einzelner Sprachen Eine weitere Forschungstendenz, die versucht, neben dem Geschlecht die Konstruktion von Gender stärker in die Untersuchung von L2-Motivation zu integrieren, beschäftigt sich zum einen mit der Untersuchung eines möglichen Zusammenhangs zwischen geschlechterstereotypen Wahrnehmungen von und Einstellungen gegenüber einzelnen Fremdsprachen und entsprechenden posi‐ tiven oder negativen Haltungen von Frauen und Männern gegenüber dem Erlernen jener konkreten Fremdsprachen (vgl. Schmenk 2002: 54). Zum an‐ deren werden, wie bereits in Kapitel 5.1.3.1.10 erläutert, geschlechtsspezifische Identifikationsprozesse und geschlechtsspezifische Entwicklungen des ‚Selbst‘ genauer betrachtet. Insbesondere für das Französische, aber auch für das Deutsche als Fremd‐ sprache finden sich zur genderstereotypen Wahrnehmung seit den 80er Jahren und bis ins 21. Jahrhundert zahlreiche Studien (vgl. z. B. Carr/ Pauwels 2006; Cohen 2010; Kissau 2006a, 2006b; Ludwig 1983; Piller/ Pavlenko 2007; Pritchard 1987; Rosenthal 1999; Williams et al. 2002; Weis 2009). Das Genderstereotyp vom Französischen als „weibliche Sprache“ ist seit einigen Jahrzehnten erstaunlich hartnäckig: Beispielsweise begründen Carroll und Husén (1975) eine höhere Leistung englischsprachiger Mädchen im Franzö‐ sischen gegenüber den Jungen durch einen “stereotype of 'feminity' associated with the study of French” (Carroll/ Husén 1975: 214). Ludwig (1983: 225) findet bei Studierenden für die französische Sprache Zuweisungen wie “attractive“ und “romantic“ und begründet dies mit dessen schönem Klang sowie der hohen Anzahl an weiblichen Lernenden in den Französischkursen. Deutsch wird von den Studierenden hingegen als “useful“, “strong“, “intellectual“ und “precise“ bezeichnet. Allerdings waren im Vorhinein 15 Adjektive von Ludwig (1983) ausgewählt und vorher von ihm zu den Kategorien Weiblichkeit und Männlich‐ keit zugewiesen worden. Diese Adjektive mussten anschließend den einzelnen Sprachen zugewiesen werden, weshalb eine starke Präselektion der Kategori‐ sierungen vorlag. Pritchard (1987) sieht das Fremdsprachenlernen als weibliche Domäne und geht davon aus, dass Fremdsprachenunterricht eine “perpetuation of a vicious circle resulting in boys' underachievement in languages” darstellen könnte (Pritchard 1987: 65). Nationale Stereotype wie guter Wein, gutes Kochen, Haute Couture oder luxuriöse Parfums werden von ihm als Beleg für die weib‐ liche Konnotation der französischen Sprache angeführt (vgl. Pritchard 1987: 65), wodurch laut Schmenk (2002: 57) nationale Stereotype in Geschlechterste‐ reotype übergehen. Pritchards (1987) Ergebnis ist, dass Mädchen sowohl der deutschen als auch der französischen Sprache gegenüber positiver eingestellt 5.1 Endogene Faktoren 115 seien als Jungen und die deutsche Sprache eher ein männliches Image, die französische hingegen eher ein weibliches Image besäßen. In der Forschung der 90er und 2000er Jahre werden ähnliche Ergebnisse er‐ zielt (vgl. Carr/ Pauwels 2006: 129; Cohen 2010; Leupold 2007: 15; Rosenthal 1999; Williams et al. 2002; Weis 2009). Die Tendenz der Forschungsergebnisse bleibt bestehen, die französische Sprache als weiblich wahrzunehmen, und dies wird sogar teilweise als Ursache für die geringere Motivation männlicher Schüler, Französisch zu lernen, angesehen. Als Erklärung für diese Kausalbeziehung wird immer wieder angeführt, dass Jungen in der Pubertät besonders sensibel für Geschlechterstereotypen sind und versuchen, sich möglichst geschlechter‐ rollenkonform zu verhalten (vgl. Kissau 2006b: 405). Schmenk (2002: 58) lehnt diese Art der Erforschung genderbezogener Images von Sprachen jedoch ab, da es bislang noch nicht gelungen sei „geschlechtsspe‐ zifisch unterschiedliche Leistungen durch entsprechende Motivation aufgrund von Geschlechts-Images“ von Sprachen zu erklären. Dies mag zum einen daran liegen, dass meist ähnliche genderstereotype Wahrnehmungen von Sprachen bei Jungen und Mädchen gleichermaßen vorliegen (vgl. Kissau 2006a), schließt aber nicht aus, dass jene innerhalb der jeweiligen Geschlechtergruppe auf unterschiedliche Weise wirken. Außerdem können Genderstereotype, die über so lange Zeit insbesondere für das Französische, aber auch für das Deutsche (vgl. Williams et al. 2002) aufrechterhalten zu werden scheinen, in der zukünftigen Erforschung der fremdsprachlichen Leistungen auch nicht völlig ignoriert werden. Vielmehr muss weiter infrage gestellt werden, wie diese Konstrukte zu erheben sind, ohne von Seite des Forschenden zu viele Präsuppositionen vorzugeben. Kissau (2010: 174) fügt außerdem hinzu, dass die spanische Sprache in ihrer Rolle als zu erlernende Fremdsprache bisher keinerlei vergleichbare Genderste‐ reotypisierung erfahren habe. Dies ist bisher im europäischen Raum aber kaum näher untersucht worden. Schließlich sei noch darauf hingewiesen, dass es auch Studien zum Fran‐ kreichbild von deutschen Jugendlichen gibt, wie etwa diejenige von Schumann und Poggel (2008), welche auf keinerlei Genderstereotype treffen, eventuell auch, weil diese nicht im Blick der Untersuchung standen. Im Gegensatz zu Meißner et al. (2008), die Daten aus ihrer Studie zu den Einstellungen der Schüle‐ rinnen und Schüler zu Frankreich als eher ernüchternd interpretieren, kommen Schumann und Poggel (2008) in ihrer Studie zum Frankreichbild 1 064 deutscher Jugendlicher zu dem Ergebnis, dass diese ein teilweise von nationalen Stereo‐ typen geprägtes (vgl. häufige Nennungen von Trikolore, Napoleon, Marseillaise, Eiffelturm, Zinedine Zidane, Asterix und Obelix, Jeanne d’Arc, Louis XIV, 116 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Gallischer Hahn, Croissant und Baguette; vgl. Schumann/ Poggel 2008: 118-119), aber durchaus positives, realistisches und kenntnisreiches Bild von Frankreich besäßen (vgl. Schumann/ Poggel 2008: 125). Allerdings wurden hierbei keine statistischen Vergleiche zwischen Geschlechtergruppen vorgenommen und es handelte sich außerdem um eine Stichprobe, die bereits reiches Erfahrungs‐ wissen im Kontakt mit Französinnen und Franzosen erwerben konnte (vgl. Schumann/ Poggel 2008: 121). Folglich ist der Bereich der genderstereotypen Images von Sprachen, die eventuell im Laufe der Pubertät einen Einfluss auf die Herausbildung der genderspezifischen Identität nehmen könnten, ein in der Wissenschaft sehr kontrovers diskutierter Themenbereich, den es dennoch nicht zu ignorieren, sondern möglichst differenziert zu erforschen gilt. 5.1.3.1.13 Forschungsmethodologische Tendenzen der L2-Motivationsforschung im Kontext von Geschlecht und Gender Eine letzte Tendenz forschungsmethodologischer Natur lag anfangs darin, dass die Studien zu L2-Motivation und Geschlecht in den 70er, 80er und 90er Jahren fast ausschließlich mit dem anfänglich noch auf wenige internale bzw. endogene Faktoren reduzierten sozialpsychologischen Modell von Gardner und Lambert (1972) arbeiteten. Schmenk (2002: 48) kritisiert daran erneut den ausschließlichen Fokus auf die Dichotomie zwischen integrativer und instrumenteller Orientierung, welcher komplexere L2-Motivationsmodelle wie beispielsweise jene von Crookes und Schmidt (1991), Dörnyei (2001), Oxford und Shearin (1994) oder Ushioda (1996) außer Acht ließe. Als Theorie, die den Forschungsgegenständen Gender und Geschlecht innerhalb der L2-Motivation zuträglicher wäre, schlägt sie insbesondere diejenige von Oxford und Shearin (1994) vor: Die beiden Forschenden sehen eine Möglichkeit der Erklärung von geschlechtsspezifischen Ausprägungen von L2-Motivation in der Need-achieve‐ ment Theory und argumentieren, dass bestimmte Lernerbedürfnisse, die oft in soziologischen Strukturen begründet zu sein scheinen, dafür verantwortlich sein könnten, dass einige Individuen aktiv Lernerfolg verhindern und andere wiederum dringend Lernerfolge erzielen wollten (vgl. Oxford/ Shearin 1994: 18). Demnach kann es vorkommen, dass Mädchen das Bedürfnis verspüren, Fremd‐ sprachenlernprozesse vorzuweisen, weil dies gesellschaftlich erwünscht ist, während Jungen, bewusst oder unbewusst, weniger Motivation zeigen könnten, weil Fremdsprachenlernerfolge vermeintlich kein Teil ihrer sozial und stereotyp konturierten Geschlechterrolle darstellen. Wenngleich dies eine vereinfachte Sichtweise impliziert, welche laut Schmenk (2002: 55) erneut Frauen als „soziale, 5.1 Endogene Faktoren 117 43 Dieser gesellschaftliche Aspekt des Doing Gender in Bezug auf L2-Motivation wird in Kapitel 5.1.3.1.12 bezüglich soziologischer Tendenzen erläutert. 44 Steinlen (2019) verglich ebenfalls die Leistungen von Jungen und Mädchen in regu‐ lärem Englischunterricht und in Bilingualem Unterricht (Deutsch/ Englisch) in der Grundschule, erfasste aber dabei keine affektiven Faktoren, welche im Zentrum des vorliegenden Kapitels stehen, sondern vielmehr den Einfluss des sprachlichen und des sozioökonomischen Hintergrunds sowie der kognitiven Grundfähigkeiten. kooperative und kommunikative Wesen“ darstellt, womit Oxford und Shearin (1994) wiederum Genderstereotype bedienen, sollten in der aktuellen Gender‐ forschung und folglich auch in der vorliegenden Forschungsarbeit, sowohl die gesellschaftliche Makroals auch die lernsituationale Mikroebene miteinbe‐ zogen werden. 43 Seit den 2000er Jahren lassen sich hinsichtlich der L2-Motivati‐ onsforschung und Gender eine ganze Reihe unterschiedlicher forschungsmetho‐ dologischer Ansätze finden, wodurch eine beinahe unübersichtlich werdende Ausdifferenzierung stattfand. In der quantitativen Forschung gibt es Studien, die explizit kognitionspsychologische Ansätze anwenden (vgl. Fuchs 2013), aber auch Untersuchungen, die den Faktor Geschlecht im Zusammenhang mit der sprachlichen Leistung in verschiedenen Bildungsgängen wie zum Beispiel regulärem Fremdsprachenunterricht und Bilingualem Unterricht vergleichen und gezielt wenige isolierte affektive Konstrukte untersuchen (vgl. Rumlich 2016). 44 Außerdem ist es immer wieder Teil des Forschungsziels, ein umfas‐ sendes, differenziertes L2-Motivationsprofil von den Geschlechtergruppen zu erstellen und hierfür Konstrukte aus unterschiedlichen L2-Motivationstheorien zu untersuchen (vgl. Kissau 2006a, 2006b; López Rúa 2006). Schließlich lässt sich die Intention beobachten, immer stärker ausdifferenzierte Teilkonstrukte affektiver Faktoren hinsichtlich Geschlechtsunterschieden zu beleuchten (vgl. Fuchs 2013; Venus 2017a). Um weitere aktuelle forschungsmethodologische Tendenzen auszumachen, soll ein detaillierter Blick in zwei exemplarische Studien gegeben werden: Eine Studie, die bereits viele der oben genannten Forschungspostulate be‐ rücksichtigt, ist diejenige von Kissau (2006a, 2006b): Er führte in Ontario, also im englischsprachigen Teil Kanadas, bei 490 durchschnittlich vierzehnjährigen Französischlernenden in Grade 9 eine Mixed-Method-Studie durch, die in der quantitativen Hauptuntersuchung mithilfe von Fragebögen unterschiedliche Teilkonstrukte der L2-Motivation untersuchte. Diese stammten zum Teil aus dem sozialpsychologischen Ansatz und der AMTB von Gardner et al. (1979), wie etwa die motivationale Intensität, der Wunsch, Französisch zu lernen, integrative Orientierung, instrumentelle Orientierung, L2-Angst und elterliche Unterstützung. Zusätzlich untersuchte er die Konstrukte extrinsische und 118 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung intrinsische Motivation (vgl. Harter 1981), Kausalattribution und Zielsalienz (vgl. Tremblay/ Gardner 1995), Unterstützung durch Peers und Lehrkräfte (vgl. Netten et al. 1999), Selbstwirksamkeit, Ambiguitätstoleranz (vgl. Ely 1995) und die Wahrnehmungen der französischen Sprache (Student Perceptions of the French Language). Mit dem letzten Konstrukt, dessen Skala Kissau (2006a) selbst entworfen hatte, versuchte er, genderstereotype Einstellungen bezüglich des Französischen zu erheben, indem er Items einsetzte wie “I think girls are better at learning French than boys“, “French is a gentle and pleasant sounding language.“, “I think French is more suitable for girls than for boys.” oder “The French language is for sissies.” Um statistische Unterschiede zwischen männlichen und weiblichen Französischlernenden bezüglich der einzelnen motivationalen Konstrukte zu erforschen, führte er eine Diskriminanzanalyse durch. Diese kam zu dem Ergebnis, dass der Wunsch, Französisch zu lernen (Desire to learn French), den stärksten Prädiktor für das Geschlecht darstellte, dicht gefolgt von integrativer Orientierung und der motivationalen Intensität, wobei alle drei als Prädiktoren für die weiblichen Lernerinnen dienten. Somit zeichnete sich das Motivationsportrait der Mädchen insbesondere durch diese drei Konstrukte aus. Hingegen wiesen Leistungsmotivation (Mastery), L2-Angst und Ambiguitätstoleranz die geringste Prädiktorstärke für das Geschlecht auf. Bezüglich der Skala zu den Wahrnehmungen des Französischen kam er zu folgendem Ergebnis “French is perceived by boys as a female domain” (Kissau 2006a: 83). Dies begründe sich laut Kissau (2006b) auch darin, dass 80% der Schülerinnen und Schüler angaben, eine weibliche Lehrkraft in Französisch zu haben. Außerdem waren von den 122 Lernenden, die Französisch nach Grade 9 weiterbelegen wollten, 71.3% weiblich. Hingegen waren fast 70% der Lernenden, die angaben, Französisch sicherlich nicht weiter zu belegen, männlich (vgl. Kissau 2006b: 407), was der oben genannten Tendenz der überwiegend weiblich geprägten fremdsprachlichen Fächerwahl entspricht (vgl. Grein 2012). Geschichtete Zufallsstichproben wurden eingesetzt, um vier männliche und vier weibliche Lernende sowie drei weibliche und drei männliche Lehrkräfte nach der quantitativen Untersuchung für qualitative Interviews auszuwählen. Die weibliche Prägung des Französischen bestätigte sich laut Kissau (2006a) auch in elf der vierzehn Interviews. Dabei ergaben sich vor allem Genderun‐ terschiede auf der Mikroebene. So zeigte die Auswertung der qualitativen Interviews, dass vor allem die hohe Anzahl weiblicher Lehrkräfte und die hohe Anzahl weiblicher Schülerinnen in den höheren Französischklassen die Wahrnehmung des Französischen als weibliches Fach begünstigten (vgl. Kissau 2006a: 83). Zudem gaben die Lehrkräfte an, dass die geschlechterstereotype Vorstellung, ein „Mann“ würde keine Sprachen lernen, sondern sich vertieft 5.1 Endogene Faktoren 119 mit Mathematik oder Ingenieurwissenschaften auseinandersetzen, innerhalb der Probandengruppe weit verbreitet war (vgl. Kissau 2006a: 83-84). Die Gründe dieser genderstereotypen Ansichten waren laut Kissau (2006a: 84) deutlich aus‐ zumachen: Die genderstereotypen Wahrnehmungen der weiblichen Prägung des Französischen wurden sowohl bei den Probandinnen und Probanden selbst festgestellt als auch von ihnen in den Interviews als gesellschaftliche Ursachen für die Genderdifferenzen genannt. Das Ergebnis der Studie bestand also darin, dass die Faktoren der Mikro-, sprich Klassenzimmerebene zwar Einfluss auf die Motivation hatten, der grö‐ ßere Einfluss aber von der Gesellschaft, also von der Makroebene ausging, und dass beide Ebenen sich gegenseitig bedingten. In Konsequenz dazu könnten laut Einschätzung Kissaus (2006a: 88) eventuell Modifizierungen, die auf der Mikroebene stattfinden, dazu beitragen, die gesellschaftliche Wahrnehmung des Französischen zu verändern. Im Umkehrschluss beeinflusst laut Kissau (2006a: 88) die gesellschaftliche Wahrnehmung des Französischen nicht nur die Wahrnehmung dieser Sprache durch die Schülerinnen und Schüler, sondern auch eine Reihe von anderen affektiven Faktoren auf der Mikroebene, die für den Fremdsprachenlernerfolg zentral sind, wie etwa der Wunsch, die Sprache zu erlernen oder die motivationale Intensität. Aus dieser Studie lässt sich also ab‐ leiten, dass es einen Zusammenhang zwischen verschiedenen Teilkonstrukten der L2-Motivation und den genderstereotypen Einstellungen gegenüber dem Erlernen einer konkreten Zielsprache geben könnte und dass dies sowohl quantitativ als auch qualitativ erhoben werden sollte. Bei Kissau (2006a) fehlte jedoch der Einsatz von Leistungstests und auch kognitiven Tests sodass unklar bleibt, wie sich die erfassten Motivationsprofile genau auf die fremdsprachliche Leistung auswirken und ob auch kognitive Faktoren einen entscheidenden Einfluss zeigen. Fuchs (2013, 2014) verfolgt einen anderen Forschungsansatz und geht in ihrer explanativen Querschnittstudie unter anderem der Frage nach, welche Präferenzen 365 Jungen und Mädchen der 8. und 9. Jahrgangsstufe in Thüringen in Bezug auf Aufgaben und Übungen hinsichtlich der Lernbereiche Lesen, Hör-/ Sehverstehen, Sprechen und Schreiben im Englischunterricht haben (Fuchs 2014: 187, 189). Sie beachtet insofern die Theorie der sozio-dynamischen L2-Motivation, indem sie die einzelnen affektiven Faktoren auf einzelne Situa‐ tionsmerkmale des Englischunterrichts bezieht. Außerdem setzt sie dabei ein vorwiegend kognitionspsychologisches L2-Motivationsmodell ein: Für jeden der vier Lernbereiche werden Interesse, intrinsische Bedeutsamkeit, extrinsi‐ sche Bedeutsamkeit, Gefallen (positive Bewertung) des Englischunterrichts und Motivation in Skalen von zwei bis drei Items erfasst (vgl. Fuchs 2014: 190). 120 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Signifikante Unterschiede zugunsten der Mädchen ergeben sich lediglich bei der intrinsischen Bedeutsamkeit des Englischunterrichts insgesamt, der intrin‐ sischen Bedeutsamkeit des Schreibens, der extrinsischen Bedeutsamkeit des Schreibens und der allgemeinen Motivation im Lernbereich Schreiben; bei allen anderen Lernbereichen und Teilkonstrukten ergeben sich keinerlei statistisch signifikante Geschlechterunterschiede (vgl. Fuchs 2014: 193). Insgesamt macht Fuchs (2014: 193) die Tendenz aus, dass Mädchen eher die Lernbereiche Lesen und Schreiben bevorzugen während Jungen bei den Lernbereichen Sprechen und Hören tendenziell leicht höheres Interesse zeigen, auch wenn kein signifi‐ kanter Geschlechterunterschied in diesen Bereichen messbar ist. Ein Vergleich zwischen der 8. und der 9. Jahrgangsstufe, der mittels zweifaktorieller Varian‐ zanalysen durchgeführt wurde, zeigt, dass die Jungen der 8. Jahrgangsstufe signifikant motivierter und interessierter für den Englischunterricht waren als die Mädchen und dass sich dies in der 9. Jahrgangsstufe umkehrte, in der die Mädchen motivierter und interessierter waren als die gleichaltrigen Jungen, aber auch als die Mädchen der 8. Jahrgangsstufe. Dieses Phänomen kann auch bei der intrinsischen und bei der extrinsischen Bedeutsamkeit beobachtet werden: Es können jeweils für Motivation und extrinsische Bedeutsamkeit signifikante Interaktionseffekte zwischen Jahrgangsstufe und Geschlecht ge‐ messen werden, wobei extrinsische Bedeutsamkeit lediglich durch ein Item gemessen wurde, da sich die Skala sonst nicht reliabel gezeigt hätte (vgl. Fuchs 2014: 194). Bezüglich der Bereiche Schreiben, Sprechen und Hören sind die Jungen in der 8. Jahrgangsstufe motivierter, was sich ebenfalls in der 9. Jahrgangsstufe umkehrt, wobei hier der Interaktionseffekt zwischen Geschlecht und Jahrgangs‐ stufe ebenfalls signifikant ist, jedoch in allen drei Fällen kleine Effektstärken vorliegen. Dadurch zeigt sich den drei Lernbereichen Schreiben, Sprechen und Hören dieselbe Entwicklungsrichtung: Die Mädchen entwickeln sich von einer zu‐ nächst niedrigeren Motivation als die Jungen zu einer höheren und umgekehrt, was eventuell den unterschiedlichen Entwicklungsverläufen der Adoleszenz ge‐ schuldet sein könnte, die sich in ähnlicher Form auch in der fremdsprachlichen Leistung gezeigt haben (vgl. Kapitel 5.1.1): „In der neunten Klasse scheinen Mäd‐ chen und Jungen den Erwartungen des sozialen Umfeldes gerecht zu werden, indem sich Mädchen eben stärker für den Englischunterricht interessieren als Jungen, bei denen das Gegenteil der Fall ist“ (Fuchs 2014: 196). Nach den Befunden von Fuchs (2013: 328) kann daher nicht mehr von einer weiblichen Überlegenheit hinsichtlich motivationaler Merkmale gegenüber dem Englischunterricht ausgegangen werden, und da die Motivation auch eng 5.1 Endogene Faktoren 121 mit der fremdsprachlichen Leistung verknüpft ist, besteht die Möglichkeit, dass die fremdsprachlichen Potenziale der Jungen eventuell noch nicht völlig ausgeschöpft wurden, was nur durch die Durchführung von Leistungstests komplementär zur Erhebung affektiver Faktoren erforscht werden kann (vgl. Fuchs 2013: 328), weshalb dies in der vorliegenden Studie berücksichtigt wird. Fuchs (2013: 330) weist aber darauf hin, dass im Fach Englisch die Unterschiede zugunsten der Mädchen bei den affektiven Faktoren oftmals weniger stark ausfallen als bei vergleichbaren Studien im Fach Französisch oder im mutter‐ sprachlichen Fach Deutsch (vgl. DESI-Konsortium 2006; Holder 2005). Fuchs (2013: 327) sieht für zukünftige Studien außerdem den Bedarf, größere, stabilere Skalen bei der Erhebung der affektiven Faktoren einzusetzen, da die Skala der extrinsischen Bedeutsamkeit nicht reliabel war. Dies wird in der vorliegenden Studie ebenfalls berücksichtigt. Außerdem kann sie über die Einflüsse der Er‐ wartungshaltungen der Lehrpersonen, Eltern und Peers lediglich Vermutungen anstellen, da diese Konstrukte nicht erhoben wurden (vgl. Fuchs 2014: 196), weshalb auch diese Konstrukte Teil der vorliegenden Studie sind. Zudem handelt es sich bei der Studie von Fuchs (2013, 2014) wie gesagt um eine Querschnittstudie, in der gleichzeitig Schülerinnen und Schüler der 8. und der 9. Jahrgangsstufe bezüglich ihrer Motivation befragt wurden und es bleibt unklar, welchen Anteil bei der Umkehrung der Geschlechterunterschiede andere Aspekte wie z.-B. die Klassencluster oder die jeweilige Lehrkraft haben. 5.1.3.1.14 Zwischenfazit: L2-Motivation, Geschlecht und Gender Die Analyse des Stands der Forschung zu L2-Motivation, Geschlecht und Gender hat deutlich gemacht, dass zwar starke Tendenzen vorliegen, weiblichen Fremdsprachenlernenden eine ausgeprägtere L2-Motivation zuzuschreiben (vgl. z. B. Bacon/ Finneman 1992; Ehrman/ Oxford 1988; Muchnick/ Wolfe 1982; Powell/ Batters 1985; Pritchard 1987; Randhawa/ Korpan 1973, für Überblicke vgl. Henry 2011; Schmenk 2002, 2016), aber bei genauerer Prüfung der Lite‐ ratur ebenfalls einige Studien existieren, bei denen keinerlei Geschlechterun‐ terschiede in der L2-Motivation gefunden wurden (vgl. Cortés 2002; MacIntyre et al. 2002; Ravid 1987; Shaaban/ Ghaith 2000). Bisher liegen außerdem nur vereinzelte Studien vor, in denen Jungen und Männer bei einzelnen affektiven Konstrukten bezüglich des Fremdsprachenlernens signifikant höhere Werte zeigen, wie dies beispielsweise bei Fuchs (2013, 2014) für die 8. Jahrgangsstufe in Thüringen bezüglich des Englischunterrichts der Fall war. Dabei scheint insbesondere das Lerneralter in Interaktion mit dem Geschlecht ausschlaggebend zu sein: Insgesamt kann immer wieder beobachtet werden, dass bei zahlreichen affektiven Faktoren bezüglich des Fremdsprachenlernens 122 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung wie z. B. L2 WTC (vgl. MacIntyre et al. 2002) und L2-Motivation (vgl. Fuchs 2013; Holder 2005; Williams et al 2002) der Unterschied zwischen den Geschlechter‐ gruppen gegen Ende der Sekundarstufe I am größten ist, was sich entsprechend auf die weitere Fächerwahl auszuwirken scheint (vgl. Carr/ Pauwels 2006; Faulstich-Wieland 2004; Fuchs 2013; Schmenk 2007; Venus 2017a: 296). Die Ergebnisse zur L2-Motivation lassen sich außerdem oftmals als Produkt soziokultureller und teilweise auch sprach- und geopolitisch geprägter Mikro- und Makrostrukturen deuten, welche unter anderem mit den jeweiligen Erst- und Zielsprachen sowie Herkunfts- und Zielkulturen zusammenhängen, aber verschiedenen Präselektionseffekten geschuldet sein können oder auf kollek‐ tiven engen kulturellen Bezügen zur Zielkultur beruhen (vgl. Henry 2011). Gleichzeitig sind die L2-Motivationsprofile meist Ergebnis individueller Sprachlernerfahrungen, welche je nach individueller Ausgangssituation sowohl zu Geschlechterunterschieden führen können als auch dafür verantwortlich sein können, dass keinerlei Geschlechterunterschiede bei der Ausprägung affektiver Faktoren in Bezug auf das Fremdsprachenlernen gefunden werden. Schließlich bedarf es, was die Untersuchung der einzelnen affektiven Kon‐ strukte betrifft, eines hohen Maßes an Differenzierung und dichotome Zuschrei‐ bungen wie Integrativität als „weibliche“ und Instrumentalität als „männliche“ Motivation sind nicht mehr angemessen. Letzten Endes fällt auf, dass die quantitative Erhebung affektiver Konstrukte sich so komplex gestaltet, dass die Lernenden ein gewisses Alter und somit einen gewissen kognitiven Ent‐ wicklungsstand erreicht haben müssen, um die einzelnen Items der stark aus‐ differenzierten Fragebögen verstehen und sich selbst entsprechend einschätzen zu können (vgl. Fuchs 2014: 189). Aus diesen Gründen sollte bei der Interpre‐ tation der Studienergebnisse oftmals viel spezifischerer auf die mikro- und makrostrukturellen Gegebenheiten sowie auf die jeweiligen Altersgruppen und deren geschlechtsspezifische kognitive, affektive und identitätsbildende Ent‐ wicklungsstände, welche zeitlich versetzt stattfinden und von unterschiedlichen geschlechterstereotypen Wahrnehmungen geprägt sein könnten, eingegangen werden, anstatt die Ergebnisse schlicht auf die gesamte Geschlechtergruppe zu beziehen. Aus forschungsmethodologischer Perspektive ist erkennbar, dass in letzter Zeit seltener komplette etablierte L2-Motivationsmodelle (vgl. z. B. Gardner 1985, 2010; Deci/ Ryan 1985, 2002) erhoben werden, sondern vielmehr je nach Forschungszweck gezielt zum Teil sehr stark ausdifferenzierte Konstrukte untersucht werden (vgl. z. B. Fuchs 2013, 2014; Henry/ Cliffordson 2013a; Kissau 2006a; Venus 2017a, 2017b; Williams et al. 2002). Für die Erforschung von Ge‐ schlechterunterschieden bezüglich der affektiven Faktoren und für das Ziel der 5.1 Endogene Faktoren 123 Erklärung von Geschlechterunterschieden in der fremdsprachlichen Leistung erweisen sich folglich abermals die Erhebung der integrativen Orientierung, der instrumentellen Orientierung, des Ideal L3/ L4 Self, der Einstellungen gegenüber der Zielkultur, des Interesses am Fach Französisch bzw. Spanisch, der L3/ L4 WTC, der L3-/ L4-Angst und des FFS/ SFS Selbstkonzepts als besonders ertrag‐ reich; außerdem werden im Sinne der Erforschung der Konstruktion von Gender auch geschlechterstereotype Wahrnehmungen der Fremdsprachen Französisch und Spanisch sowie mögliche geschlechtsspezifische Interessensgebiete als Untersuchungsgegenstände der vorliegenden Studie aufgenommen (vgl. z. B. Fuchs 2013, 2014; Henry/ Cliffordson 2013a; Kissau 2006a; MacIntyre et al. 2002; Martinović/ Sorić 2018; Rumlich 2016; Venus 2017a, 2017b; Williams et al. 2002). 5.2 Exogene Faktoren Faktoren, die unabhängig von der oder dem Fremdsprachenlernenden existieren und in ihrer Gesamtheit die Umgebung des lernenden Individuums bilden, werden als externe oder exogene Faktoren der fremdsprachlichen Lernprozesse bezeichnet (vgl. Riemer 1997: 6). Darunter fallen beispielsweise die Sozialisati‐ onsinstanzen der Eltern, Peers und Lehrkräfte. Die Konstruktion von Gender wird durch Erziehung, Umfeld und Gesellschaft bestimmt. Diese exogenen Fak‐ toren können sich wiederum auf den Fremdsprachenlernerfolg, Lernergebnisse und Erwartungen auswirken (vgl. Alexiou 2016: 87). Eine ganze Reihe von Forschenden aus verschiedenen Disziplinen, unter anderem aus der Soziologie, Psychologie und der Fremdsprachenlernforschung, plädieren dafür, neben kognitiven und affektiven Faktoren auch verstärkt soziale Faktoren in die Untersuchung von Geschlechterunterschieden in sprach‐ lichen Leistungen zu berücksichtigen (vgl. z. B. Barbu et al. 2015; Böhme et al. 2016; Bornstein et al. 2004; Lovas 2011). Neben sozialen Aspekten spielen laut Wallentin (2008) auch kulturelle Erklärungen eine große Rolle. Im Folgenden werden insbesondere jene exogenen Faktoren näher betrachtet, die in der bisherigen Forschung eine Wechselwirkung mit dem Geschlecht im Kontext des Fremdsprachenlernens gezeigt haben. Dabei wird im Sinne Kissaus (2006a: 75) sowohl auf Faktoren des Mikrolevels, welche das Klassenzimmer und die immanente Lernumgebung betreffen, als auch auf Faktoren des Makrolevels im Sinne von gesamtgesellschaftlichen Phänomenen Bezug genommen. Die Sozialisationsinstanzen der Eltern, Peers und Lehrkräfte sowie gesamtge‐ sellschaftliche Einflüsse können die Fremdsprachenlernprozesse in Abhängig‐ keit vom Geschlecht der Lernenden prägen. Dabei sind insbesondere die soziale 124 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 45 Als Attributionsstile bezeichnet man „habituelle Voreinstellungen im Hinblick auf die Zuschreibung von Ursachen für bereits eingetretene Ereignisse“ (Weber/ Rammsayer 2012: 101). und kulturelle Herkunft, die Interaktionen mit Eltern, Peers und Lehrkräften, zum Beispiel in Form von Lob und Bestrafung von Bedeutung, aber auch Erwartungshaltungen und Unterstützungsmaßnahmen zentrale Faktoren; das Lernumfeld (z. B. Gruppengröße und Lehrmittel) sowie die Familie, das Schul‐ system und gesellschaftliche Erwartungen und Einstellungen sind prägend (vgl. Williams/ Burden 1997). Dörnyei (1994a: 280) differenziert innerhalb des Lernumfelds (Learning Situation Level) noch genauer und unterscheidet die Kategorien Lehrperson (fachlicher Antrieb, Autoritätstyp, direkte Sozialisation der Motivation in Form von Darstellungsprozessen, Aufgabenpräsentationen und Feedbacks), klassenspezifische Faktoren (Interesse, Relevanz, Erwartungen, Zufriedenheit) und Lerngruppe (Zielorientierung, Normen und Belohnungs‐ systeme, Gruppenzusammenhalt und Klassenzielstrukturen). Alle genannten Aspekte haben laut Dörnyei (1994a: 280) Einfluss auf die Motivation der Schülerinnen und Schüler. Bezüglich der klassenspezifischen Faktoren kann beispielsweise die Frage gestellt werden, ob der Unterricht die - teilweise geschlechtsspezifischen - Interessen aller Lernenden gleichermaßen berück‐ sichtigt und ob die Unterrichtsgegenstände für die Lernenden als relevant empfunden werden (vgl. Kirchner 2004: 7). Sozialisationstheoretische Erklärungsansätze stützen sich auf die Theorie, dass geschlechtstypische Einstellungen, Interessen und Eigenschaften durch die Interaktion von Heranwachsenden mit ihrem sozialen Umfeld erworben werden (vgl. Trautner 2006). Oft lässt sich das Muster erkennen, dass Sozialisationspro‐ zesse in Form von Erwartungshaltungen durch Eltern, Lehrkräfte und Peers biologisch angelegte Geschlechterunterschiede verstärken, geschlechterstereo‐ typenkonforme Verhaltensweisen unterstützt und geschlechtsuntypische Ver‐ haltensweisen sanktioniert werden, sodass bereits bei Eintritt in das Bildungs‐ system Geschlechterunterschiede bei affektiven Faktoren bestehen, die primär durch soziale Prozesse determiniert sind (vgl. Aktionsrat Bildung 2009: 14; Böhme et al. 2016: 378; Stanat/ Bergann 2010: 520). Als zentrale Bestandteile der geschlechtsspezifischen Sozialisation werden in psychologischen Lerntheorien die Bedeutung von Rollenvorbildern hervorgehoben (vgl. Böhme et al. 2016). Dadurch scheinen affektive Faktoren wie Leistungsmotivation (vgl. Atkinson 1975: 391-431) oder Attributionsstile 45 (vgl. Heider 1977: 176-177) einen direkten Bezug zur Sozialisation zu haben und ihrerseits wiederum die Herausbildung von Interessen und dem fachbezogenen Selbstkonzept zu bedingen (vgl. Böhme et al. 2016: 378). 5.2 Exogene Faktoren 125 Einen weiteren zentralen Aspekt stellen tradierte soziale Geschlechterrollen und -stereotypen dar. So werden Frauen nach Holmes (1992: 172) zahlreiche Aufgaben verbaler Interaktion in privaten Kontexten zugewiesen, wie beispiels‐ weise die Kindererziehung. Eine Hypothese von Alexiou (2016: 88) schließt darauf, dass aufgrund dieses vorherrschenden Stereotyps die Interaktions‐ muster und die Kommunikationsfähigkeit von Mädchen und Frauen - wenn auch unbewusst - vom sozialen Umfeld und von den Lehrkräften stärker gefördert werden als diejenigen der Jungen und Männer. Nach diesem kurzen globalen Überblick über die Wirkungsgefüge der Sozia‐ lisationsprozesse in Zusammenhang mit Geschlecht und Gender werden in den folgenden Kapiteln die einzelnen Sozialisationsinstanzen, d. h. Eltern, Peers und Lehrkräfte sowie die Lernumgebung und gesamtgesellschaftliche Einflüsse näher in den Blick genommen. 5.2.1 Eltern als geschlechtsspezifische Sozialisationsinstanzen Die Hypothese von Alexiou (2016: 88), dass aufgrund der vorherrschenden Genderstereotype die Interaktionsmuster und die Kommunikationsfähigkeit von Mädchen durch das soziale Umfeld stärker gefördert werden als diejenigen der Jungen, wird hinsichtlich der Sozialisationsinstanz der Eltern von Studien zum Thema Gender Typing im Erstspracherwerb bestätigt: Leaper et al. (1998) führten Metaanalysen zum sprachlichen Verhalten von Müttern gegenüber Söhnen und Töchtern durch, wobei sie herausfanden, dass Mütter eine stärkere Supportive Speech mit ihren Töchtern sprachen als mit ihren Söhnen. Clearfield und Nelson (2006) kamen in ihrer Studie mit 6-14 Monate alten Kindern und deren Müttern bezüglich der sprachlichen Handlungen während des Spielens zu dem Schluss, dass es keine Geschlechterunterschiede im Verhalten der Kinder gab, jedoch deutlich zu beobachten war, dass die Mütter mit Töchtern stärker interagierten und sich intensiver mit ihnen befassten als mit den Söhnen; die Söhne wiederum erhielten häufiger Anweisungen und Kommentare von den Müttern, als dass bilaterale Konversation stattfand. Stennes et al. (2005) und Wehberg et al. (2008) fanden wiederum heraus, dass Eltern beim Sprechen mit Söhnen und Töchtern jeweils unterschiedliche thematische Wortfelder verwendeten. Bezüglich des Fremdsprachenlernens im Kindes- und Jugendalter werden die Eltern zum einen oft als Vorbild gesehen, was sich positiv oder negativ auf die Haltung zum Fremdsprachenlernen der Söhne und Töchter auswirken kann; zum anderen kann die Fächerwahl der Schülerinnen und Schüler manchmal durch die Sprachkenntnisse der Eltern begründet sein, da sie nur dann bei den 126 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Hausaufgaben helfen können, wenn sie selbst über Kenntnisse der Zielsprache verfügen (vgl. Gardner 1985; Williams/ Burden 1997). Der Einfluss von Ermu‐ tigung und Unterstützung durch Eltern auf die Motivation der Schülerinnen und Schüler, eine Fremdsprache zu erlernen, ist bereits teilweise erforscht worden: Diejenigen Schülerinnen und Schüler der achten Jahrgangsstufe, die von Eltern und Lehrkräften dazu ermutigt werden, eine bestimmte Sprache zu erlernen, versuchen dies laut McGannon und Medeiros (1995) eher als diejenigen, die keine Ermutigung erfahren: Sie konnten in ihrer Studie zeigen, dass Schülerinnen und Schüler, die eine starke Ermutigung durch ihre Franzö‐ sischlehrkraft und durch die Eltern erfuhren, mit einer signifikant höheren Wahrscheinlichkeit Französisch weiterbelegten und dementsprechend nicht abwählten als diejenigen, die nur wenig oder gar nicht ermutigt wurden. Während die Eltern vor allem in jungen Jahren einen großen Einfluss auf ihre Kinder ausüben und oft als Vorbild angesehen werden, sind es in der Pubertät oft die Freundinnen und Freunde der Jugendlichen, die die Einstellungen und Verhaltensweisen prägen (vgl. Kirchner 2004: 6). 5.2.2 Peers als geschlechtsspezifische Sozialisationsinstanzen Die Sozialisationsinstanz der Peers hat ebenfalls einen großen Einfluss auf das Lernverhalten, insbesondere von Jugendlichen in der Pubertät: Der Einfluss der Peers zeigt sich, wenn es darum geht, dass Jungen versuchen, ein ideales männliches Image aufzubauen, welches oft nicht mit der Schulkultur harmo‐ niert, während Mädchen ein ideales weibliches Image entwickeln, das sehr gut in die Schulkultur passt, was van Houtte (2004) in einem Sample von 3760 Schülerinnen und Schülern in Belgien nachweisen konnte. Für das Französische als Fremdsprache zeigte Kissau (2006a) in Kanada wiederum, dass die Jungen Angst hatten, dass sie von ihren Peers als “effeminate” angesehen würden und daher Französisch nach dem Absolvieren der Pflichtzeit nicht weiter belegten. Daher nehmen einige Wissenschaftlerinnen und Wissenschaftler (vgl. Barton 2002; Chambers 2005; Kissau 2008) an, dass es aufgrund des fehlenden Drucks der Peers in monoedukativen Kontexten nicht so stark zur Demonstration von Männlichkeit durch Jungen kommen könnte und sie sich freier fühlen könnten, sprachliche Fächer zu belegen. Schließlich manifestiert sich in der Studie von Kissau (2006a: 84) bei Schülerinnen und Schülern in Grade 9 in Canada, dass das Konstrukt der wahrgenommenen Unterstützung durch Peers und Lehrkräfte, Französisch zu erlernen, eine relativ hohe Prädiktorstärke (.473) für das weibliche Geschlecht darstellt. Aufgrund der voraussichtlich jeweils unterschiedlichen Wirkung der Unterstützung durch die Peers und durch 5.2 Exogene Faktoren 127 die Lehrkraft sollten diese Faktoren allerdings getrennt voneinander erhoben werden (vgl. Kapitel 9.3.5.1 und 9.3.5.4). Bisher noch wenig erfasst ist aber, inwiefern die Erwartungen und die Unterstützung durch die Peers nicht nur Einfluss auf die affektiven Faktoren, sondern auch auf die fremdsprachliche Leistung nehmen und ob hierbei genderspezifisch unterschiedliche Interakti‐ onseffekte auftreten. 5.2.3 Fremdsprachenlehrkräfte als geschlechtsspezifische Sozialisationsinstanzen Die Erforschung der Lehrperson und deren Einflusses auf den Lernerfolg der Schülerinnen und Schüler kann als eigenständiger Forschungsbereich innerhalb der Sprachlehr-/ lernforschung angesiedelt werden. Die Lehrperson übt auf unterschiedliche Weise Einfluss auf die L2-Motivation der Lernenden aus: Zum Beispiel spielen Unterrichtsstil, fachliche Kompetenzen, die Lehrerpersönlich‐ keit und die Art und Weise positives oder negatives Feedback zu kommunizieren eine wichtige Rolle (vgl. Dörnyei 1994a; Kirchner 2004: 8; Williams/ Burden 1997). Helmke et al. (2008: 393) zeigen außerdem, dass unter anderem eine posi‐ tive Fehlerkultur, ein positives Unterrichtsklima, thematische Motivierung, Schülerorientierung, Unterstützung durch die Lehrkraft, Verständlichkeit der Erläuterungen, die Beimessung der Wichtigkeit von Kommunikation und Kor‐ rektheit, instrumentelle Motivierung, eine gute Klassenführung (Management und Störungsfreiheit) und Strukturiertheit signifikant mit dem Lerninteresse an der Fremdsprache korrelieren. Die Frage stellt sich also, welche der ge‐ nannten Einflussfaktoren der Lehrkraft auf den Fremdsprachenlernerfolg der Schülerinnen und Schüler sich in der aktuellen Forschung besonders häufig im Zusammenhang mit Geschlechterunterschieden in der fremdsprachlichen Leistung wiederfinden. Einige Untersuchungen zeigten in der Vergangenheit, dass Lehrkräfte unab‐ hängig von ihrem eigenen Geschlecht im Fremdsprachenunterricht tendenziell Mädchen mehr unterstützen als Jungen sowie höhere Erwartungen an Mädchen richteten als an Jungen (vgl. MacIntyre et al. 2002: 542; Worrall/ Tsarna 1987). Einige andere Studien kamen hingegen zu dem Ergebnis, dass das Geschlecht der Lehrkraft für die Schülerinnen und Schüler eher von geringer Bedeutung ist und dass sich die „Same-sex-Hypothese“, nach der Jungen einen höheren Kompetenzerwerb durch männliche Lehrkräfte und Mädchen durch weibliche Lehrkräfte erfahren, nicht bestätigt (vgl. Bacher et al. 2008; Helbig 2010a, 2010b; Holmlund/ Sund 2008; Jones/ Jones 2001). Jedoch gibt es auch Studien, 128 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung die die Wichtigkeit der Präsenz einer männlichen Lehrkraft im Fremdsprachen‐ unterricht unterstreichen (vgl. z. B. Clark/ Trafford 1995). Insgesamt könnte die Annahme einer negativen Wirkung weiblicher Lehrkräfte auf die Bildungs‐ chancen und -erfolge von Jungen dazu führen, dass der Blick der Forschung auf die eigentlichen Bildungs- und Sozialisationsprozesse, die teilweise zu einer höheren Potenzialentfaltung der Mädchen führen, verdeckt wird (vgl. Helbig 2010b: 286). 5.2.4 Sozioökonomischer Status, Lernumgebung und Geschlecht Carr und Pauwels (2006), die in Australien eine quantitative Studie mit mehr als 200 Jungen, aber auch ausgewählten Mädchen, Lehrkräften und Assistenz‐ lehrenden (vgl. Carr/ Pauwels 2006: 57) durchführten, gehen davon aus, dass die Motivation, eine Fremdsprache zu erlernen auch vom sozioökonomischen Status abhängt. Selbst wenn mittlerweile das Erlernen von Fremdsprachen kein Privileg einiger weniger mehr ist, kommt es auch heute noch zu Un‐ gleichheiten, die auf den sozioökonomischen Status zurückzuführen sind: Beispielsweise haben Schülerinnen und Schüler, die über einen niedrigeren sozioökonomischen Status verfügen, weniger Möglichkeiten, ins Ausland zu reisen, um dort die Fremdsprache aktiv zu verwenden (vgl. Kissau 2008: 157). Dadurch kann das Fremdsprachenlernen für Lernende aus sozioökonomisch schwachen Familien an Bedeutung verlieren. Auch bilinguale Angebote sind oft ein selbstverständliches Angebot teurer Privatschulen (vgl. Ullrich 2014). Carr und Pauwels (2006) zeigen, dass insbesondere Jungen aus der Arbeiterklasse die schwächsten fremdsprachlichen Leistungen erzielten und insgesamt deutlicher selten in Sprachkursen anzutreffen waren als Mädchen. Jungen aus Familien mit höherem sozioökonomischen Status gingen davon aus, dass sie in nächster Zukunft ins Ausland reisen konnten, weshalb das Erlernen von Fremdsprachen für sie relevanter war. Außerdem beobachteten Carr und Pauwels (2006), dass einige der australischen Jungen der Auffassung waren, dass das Erlernen von Fremdsprachen zu Berufen führe, die schlecht bezahlt würden, wie zum Beispiel das Lehramt, und dass sie deshalb keinen karrierebezogenen Nutzen im Erlernen von Fremdsprachen sahen. Insbesondere bezüglich der Lesekompetenz zeigen einige Untersuchungen einen deutlichen Interaktionseffekt zwischen Geschlecht und sozialer Herkunft, wobei die Leseleistung der Jungen aus sozial schwachen Schichten signifikant schwächer ausfällt als die Leseleistung der Mädchen aus derselben Schicht; bei Jungen und Mädchen aus Familien mit höherem sozioökonomischen Status bestehen hingegen kaum Geschlechterunterschiede in der Lesekompetenz (vgl. 5.2 Exogene Faktoren 129 z. B. Entwisle et al. 2007; Mensah/ Kiernan 2010). Gottburgsen und Gross (2012) finden in ihrer Metaanalyse der Daten von PISA 2006 sogar einen so starken Interaktionseffekt bei 15-jährigen Lernenden, dass Jungen mit hohem sozioökonomischen Status niedriger abschneiden als Mädchen mit niedrigem sozioökonomischen Status. Sie fassen zusammen, dass im Allgemeinen und über alle schulischen Fächer hinweg betrachtet bei der Erforschung des Zusammenhangs von Gender und sozialer Herkunft deutliche Vorteile von Mädchen und Frauen bestehen, da diese unabhängig von ihrer sozialen Herkunft höhere Bildungsabschlüsse erzielen (vgl. Gottburgsen/ Gross 2012: 88; vgl. z. B. auch Becker/ Müller 2011; Breen et al. 2010; Buchmann et al. 2008). Jedoch muss auch hier noch stärker diffe‐ renziert werden: Das soziale Umfeld bzw. die soziale Zusammensetzung der Schülerschaft scheint entscheidender für den Lernerfolg einzelner Individuen zu sein als deren soziale Herkunft (vgl. Baumert et al. 2006; Crosnoe 2009 Rumberger/ Palardy 2005). Legewie und DiPrete (2012) fanden beispielsweise für Viertklässlerinnen und Viertklässler von Berliner Grundschulen heraus, dass ein Umfeld mit höherem sozioökonomischen Status sich stärker positiv auf die Lesekompetenz von Jungen auswirkt als auf diejenige von Mädchen. Was das soziale Lernumfeld im Klassenzimmer betrifft, so führt die Studie von Van Houtte (2004) die zahlenmäßig stärkere Präsenz von Mädchen im Unterricht als Grund für den weniger hohen Bildungserfolg der Jungen an. Ein Blick auf das Ungleichgewicht innerhalb der Schülerzahlen in den Französischklassen in Deutschland zeigt, dass die Zahlen der männlichen Schüler vergleichsweise niedrig sind (vgl. Grein 2012). Eine Abnahme der Zahl der männlichen Schü‐ lerschaft in Französisch hätte auf lange Sicht gesehen zur Folge, dass immer noch weniger Männer den Beruf des Französischlehrers ergreifen würden, eine Situation, die bereits jetzt beobachtbar ist. Dieser Sachverhalt hängt wiederum eng mit der Frage nach dem Einfluss des Geschlechts der Lehrkraft zusammen (vgl. Kapitel 5.2.3). 5.2.5 Interaktionswirkungen von Migrationshintergrund, Mehrsprachigkeit, sozialem Umfeld und Geschlecht Ein weiteres als Intersektionalitätsaxiom geltendes Merkmal in Verbindung mit dem Geschlecht ist das des Migrationshintergrunds bzw. der Mehrsprachigkeit. In neueren Studien zu Spracherwerb und Fremdsprachenlernen (vgl. z. B. Hopp et al. 2018; Steinlen/ Piske 2016; Wilden/ Porsch 2015) wird mittlerweile die Ka‐ tegorie „sprachlicher Hintergrund“ verwendet und die Kategorie „Migrations‐ 130 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung 46 Laut der Definition des Mikrozensus gehören zu den Personen mit Migrationshinter‐ grund „1. Alle in Deutschland lebenden Ausländerinnen und Ausländer, 2. Deutsche mit Migrationshintergrund: Spätaussiedlerinnen und Spätaussiedler sowie Eingebürgerte, Kinder von Spätaussiedlerinnen und Spätaussiedlern sowie Eingebürgerten, Kinder ausländischer Eltern, die bei der Geburt zusätzlich die deutsche Staatsbürgerschaft erhalten haben (nach der sogenannten „Ius-soli“-Regelung), Kinder mit einseitigem Migrationshintergrund, bei denen nur ein Elternteil Migrantin oder Migrant ist, Einge‐ bürgerte nicht zugewanderte Ausländerinnen und Ausländer. Bei der Bestimmung des Migrationshintergrunds wird nur die Zuwanderung ab 1950 berücksichtigt“ (Landes‐ institut für Schulentwicklung/ Statistisches Landesamt Baden-Württemberg 2018: 317). hintergrund“, auch aufgrund der existierenden unterschiedlichen Definitionen, welche im Anschluss genauer erläutert werden, eher als überholt betrachtet. Ein weiteres Argument für die Bevorzugung des Merkmals des sprachlichen Hintergrunds liegt darin begründet, dass es bei Studien zu Spracherwerb und Fremdsprachenlernen vor allem um die Frage geht, ob eine Person einsprachig, also im deutschsprachigen Kontext ausschließlich mit Deutsch als Erstsprache oder mehrsprachig, d. h. zusätzlich mit einer oder mehreren anderen Familien‐ sprachen aufwächst (vgl. Steinlen 2018: 6). Der Begriff Migrationshintergrund wird vom Statistischen Landesamt Baden-Württemberg für den Mikrozensus 46 anders definiert als für die amtliche Schulstatistik. In letzterer findet folgende Definition Anwendung: „Einen Migra‐ tionshintergrund haben alle Schüler, die keine deutsche Staatsangehörigkeit be‐ sitzen oder die im Ausland geboren wurden oder in deren Familie überwiegend nicht deutsch gesprochen wird“ (Statistisches Landesamt Baden-Württemberg 2017, vgl. auch Landesinstitut für Schulentwicklung/ Statistisches Landesamt Baden-Württemberg 2018: 317). Der Begriff des Migrationshintergrunds fasst folglich sehr unterschiedliche soziale Kontextualitäten zusammen, die von Migration als Konsequenz aus Flucht und Vertreibung hin zu Migration aus beruflichen oder diplomatischen Gründen reichen und von niedrigem bis zum hohen sozioökonomischen Status sehr unterschiedliche Migrationsmotive einschließen (vgl. Gottburgsen/ Gross 2012: 89). Schließlich differenziert dieser Begriff weder bezüglich des Herkunftsnoch bezüglich des Ziellands. Bezüglich des Ziellands können beispielsweise je nach Einwanderungs- und Integrationspolitik (z. B. selektiv vs. nicht-selektiv; Inklusionsvs. Exklusionskonzepte) auch unterschiedliche Ländereffekte be‐ züglich der Lese- und Mathematikkompetenzen von Schülerinnen mit und ohne Migrationshintergrund gefunden werden (vgl. de Heus/ Dronkers 2010; Levels et al. 2008). Man spricht in der Soziologie von sogenannten Ländereffekten als Kontextfaktoren (vgl. Gottburgsen/ Gross 2012: 89). 5.2 Exogene Faktoren 131 Im Allgemeinen erreichen Mädchen mit Migrationshintergrund tendenziell höhere Bildungsabschlüsse und Kompetenzwerte als Jungen mit Migrations‐ hintergrund (vgl. z. B. Feliciano/ Rumbaut 2005; Støren/ Helland 2010). Beispiels‐ weise konnte für die PISA-Studie 2003 von Segeritz et al. (2010) bei Mädchen mit türkischem oder polnischem Migrationshintergrund sowie für Töchter von Eltern, die aus der ehemaligen Sowjetunion stammen, tendenziell eine höhere Lesekompetenz im Deutschen nachgewiesen werden als bei Jungen. Betrachtet man die fremdsprachlichen Kompetenzen in Zusammenhang mit Geschlecht und Mehrsprachigkeit, lassen sich für die Grundschule und den vor‐ schulischen Bereich jedoch einige Studien für das Englische als Fremdsprache finden, die weder in den Regelprogrammen noch im Immersionsunterricht signifikante Interaktionseffekte zwischen Geschlecht und sprachlichem Hinter‐ grund zeigen (vgl. Häckel/ Piske 2016; Steinlen 2018; Steinlen/ Piske 2016). In den großen Bildungsmonitorings der weiterführenden Schulen werden allerdings Geschlecht und Migrationshintergrund weitestgehend getrennt voneinander untersucht. Im Ländervergleich 2008 (vgl. Böhme et al. 2010) können, ähnlich wie in der DESI-Studie (vgl. DESI-Konsortium 2008), in der Leseleistung des Englischen in der 9. Jahrgangsstufe folgende Leistungsunterschiede festgestellt werden: Jugendliche ohne Migrationshintergrund erzielen die höchsten Ergeb‐ nisse, gefolgt von Jugendlichen mit einem im Ausland geborenen Elternteil, Jugendlichen der zweiten Generation und Jugendlichen der ersten Genera‐ tion. Im Hörverstehen hingegen liegen die Ergebnisse von Jugendlichen ohne Migrationshintergrund und Jugendlichen mit einem im Ausland geborenen Elternteil ähnlich hoch, während die anderen beiden Gruppen ebenfalls deut‐ lich niedrigere Ergebnisse erzielen (vgl. Böhme et al. 2010: 208). Statistische Berechnungen zu Interaktionseffekten zwischen Geschlecht und Migrations‐ hintergrund wurden bezüglich der Französischergebnisse allerdings leider nicht getätigt. Quantitative Studien zu den Wechselwirkungen aller drei Intersektionali‐ tätsachsen, also soziales Umfeld, Migrationshintergrund und Geschlecht, die multivariate Verfahren einsetzen, liegen noch relativ wenige vor und beziehen sich meist auf allgemeine Bildungsabschlüsse: Connolly (2006: 15-16) kam beim Einsatz eines solchen Verfahrens bei der Untersuchung der Jahrgänge 1997 bis 2001 in England und Wales zu dem Ergebnis, dass Jungen, unabhängig von ihrem sozioökonomischen Status und ihres Migrationsstatus schlechtere Leistungen im General Certificate of Secondary Education (GCSE) erzielten als Mädchen, dass allerdings die Faktoren Geschlecht und Migrationshintergrund lediglich 10% der Varianz erklärten. 132 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Wie in Kapitel 5.2.4 dargestellt, beeinflusst das soziale Umfeld die schulischen Leistungen sehr stark, wobei Jungen stärker von einem höheren sozioökonomi‐ schen Umfeld bezüglich der Ausprägung ihrer Lesekompetenz profitieren als Mädchen (vgl. Legewie/ DiPrete 2010). In Deutschland geschieht es allerdings sehr oft, dass Jugendliche mit Migrationshintergrund Schulen mit hohem Migra‐ tionsanteil und mit geringem Anteil an Akademikereltern besuchen (vgl. Kristen 2006), wodurch das soziale Umfeld individuelle Benachteiligung verstärkt, unter der insbesondere Jungen leiden (vgl. Gottburgsen/ Gross 2012: 89). 5.2.6 Gesamtgesellschaftliche und interkulturelle Einflussfaktoren auf die fremdsprachliche Leistung von Jungen und Mädchen López Rúa (2006) geht außerdem davon aus, dass die Verbindung zwischen gesellschaftlich tradierten Vorstellungen und Erziehung durch Eltern und Lehr‐ kräfte die unterschiedlichen Interessen, Einstellungen und Erwartungen von Jungen und Mädchen bzw. von Männern und Frauen erklären kann. Bei der Suche nach den Gründen für dieses Ungleichgewicht stößt man wiederum auf Forschungsarbeiten zur Fächerwahl und deren Begründung. Im Falle des Französischen zeigen Williams et al. (2002) wie gesagt, dass ein Grund für die Entscheidung gegen fremdsprachliche Fächer die in der Gesellschaft verbreitete Auffassung ist, dass diese stark weiblich konnotiert sind, weswegen Jungen diese als zu feminin ansehen und naturwissenschaftliche Fächer bevorzugen, während Mädchen Fächer wählen, die als weiblich oder feminin gelten. Dies bedeutet aber nicht, dass es keine Möglichkeiten gäbe, die entstandenen Dis‐ paritäten in der Bildungsbeteiligung und im Kompetenzerwerb durch gezielte Förderung zu reduzieren beziehungsweise vollständig auszugleichen (vgl. Ak‐ tionsrat Bildung 2009: 158; Böhme et al. 2016: 378), sondern lediglich, dass ein Ausgleich der entstandenen Disparitäten bisher noch nicht gelungen ist. Innerhalb des gesellschaftlichen Einflusses ist aber auch das Schulsystem zu nennen, das zu großen Teilen determiniert, welche Fremdsprachen in wel‐ cher Reihenfolge und ab welchem Alter erlernt werden können. Außerdem lassen sich unterschiedliche Sozialisationswirkungen von Schule ausmachen, die mit einer geschlechtsspezifisch unterschiedlichen Interessensentwicklung und Fächerpräferenzen (vgl. Roisch 2003) sowie einer Tradierung von ge‐ schlechtsspezifischen Bereichen des Wissens durch Curricula, Schulbücher und Lehr-Lern-Materialien einhergehen können (vgl. Hunze 2003). Ebenfalls stark mit sozialen Vorstellungen verknüpft ist das - auf allgemeine soziale Anerkennung bezogene - Prestigedenken oder Geltungsmotiv (vgl. Kirchner 2004: 8), welches sich durch den Wunsch des oder der Lernenden 5.2 Exogene Faktoren 133 einer Fremdsprache äußert, gesellschaftliche Anerkennung für seine bzw. ihre fremdsprachlichen Kompetenzen zu erfahren (vgl. Meißner et al. 2008). Dies hängt stark von der Ausgangs- und der Zielkultur ab sowie von deren wahrge‐ nommener Rolle in der Welt. Die Motivation, eine Fremdsprache zu erlernen, hängt also auch stark mit soziokulturellen Faktoren zusammen. Vor diesem Hintergrund lässt sich beispielsweise auch erklären, weshalb in bestimmten Lernumgebungen, in denen die soziokulturellen Voraussetzungen den Erwerb bzw. das Erlernen einer L2 erfordern (z. B. wenn die L1 Verkehrs- und die L2 Nationalsprache ist), ein hoher Prozentsatz der Bevölkerung eine Zweit‐ sprache erlernt, ganz unabhängig von den individuellen Begabungen oder der Zugehörigkeit zur Geschlechtergruppe (vgl. Dörnyei 2005: 66). Wenn es sich um eine nicht oder kaum im Inland gesprochene L2 handelt, ist der Faktor Kontakt zur Zielkultur für das Fremdsprachenlernen ausschlaggebend, worauf Kirchner (2004: 7) hinweist und sich dabei auf die Akkulturationshypothese von Schumann (1986) und auf die Studie von Riemer (1997: 40) beruft. Wenn kein Kontakt zur Zielkultur vorhanden ist, fehlt die Möglichkeit, die Fremdsprache außerhalb des Unterrichts zu verwenden und eigene direkte Erfahrungen mit der Zielkultur zu machen. Gerade diese Erfahrungen sind aber wichtig für die Herausbildung von Einstellungen und Meinungen gegenüber der Zielkultur, welche sich auch im Konstrukt der Instrumentalität niederschlagen. Die Frage ist also zentral, ob die Kenntnisse der Sprache und der Zielkultur der Schüle‐ rinnen und Schüler lediglich von Berichten der Lehrpersonen abhängen, oder ob die Lernenden in Form von E-Mail-Kontakt oder Schüleraustausch bereits näher mit der Zielkultur in Kontakt gekommen sind (vgl. Kirchner 2004: 7). Auf einer weiteren Metaebene stellt sich schließlich die Frage, inwieweit gesellschaftlich vorherrschende Geschlechterstereotype die Forschung zu Ge‐ schlecht und Gender an sich beeinflussen und verfälschen (vgl. Schmenk 2002). 5.2.7 Zwischenfazit: Exogene Faktoren und Geschlecht Was immer wieder in der Forschung ersichtlich wird, ist, dass geschlechter‐ stereotypenkonforme Erwartungshaltungen und damit einhergehende Unter‐ stützungs- und Ermutigungsmaßnahmen sowie Erwartungen durch Eltern, Peers und Lehrkräfte zu einer Verstärkung von Leistungsunterschieden im fremdsprachlichen Bereich beitragen können. Außerdem können diese zu geschlechtsspezifischen Disparitäten in der Fächerwahl und zur Ausprägung geschlechtsspezifischer Interessen und Motivation führen oder aber Geschlech‐ terunterschiede aufheben. Jede Sozialisationsinstanz nimmt in der Sprach‐ lernbiographie des Individuums einen eigenen Platz ein und muss in ihrer 134 5 Erklärungsansätze für Geschlechterunterschiede in der fremdsprachlichen Leistung Wirkungsweise untersucht werden. Zusammen mit Faktoren wie dem so‐ zioökonomischen, dem sprachlichen Hintergrund, gesamtgesellschaftlichen Geschlechterrollentradierungen im Schulsystem und darüber hinaus, interkul‐ turellen Begegnungsmöglichkeiten sowie geo- und sprachpolitischen Gege‐ benheiten stellen diese den soziokulturellen Überbau dar, der für Geschlech‐ terunterschiede in L2-Motivation und fremdsprachlicher Leistung teilweise verantwortlich sein kann. Daher werden in der vorliegenden Studie die wahr‐ genommenen Erwartungen durch Eltern, Peers und Lehrkräfte, die wahrge‐ nommene Unterstützung sowie die wahrgenommene geschlechtsspezifische Aufmerksamkeitsverteilung durch Lehrkräfte getrennt voneinander erhoben (vgl. Kapitel 9.3.5.1 bis 9.3.5.5). Schließlich wird wie gesagt auch die geschlech‐ terstereotyp weibliche Wahrnehmung des Französischen bzw. Spanischen im Detail erhoben (vgl. Kapitel 9.3.4.8), da davon auszugehen ist, dass diese gesellschaftlich tradiert und je nach Geschlecht der Lernenden und Zielsprache unterschiedlich stark ausgeprägt sein kannn. Dies könnte wiederum einen Einfluss auf die fremdsprachliche Leistung haben (vgl. Grein 2012; Kissau 2006a; Williams/ Burden 2002). 5.2 Exogene Faktoren 135 47 Teilweise werden innerhalb der Erforschung der individuellen Lernervariablen auch Persönlichkeitsmerkmale wie Introvertiertheit und Extrovertiertheit berücksichtigt (vgl. Edmondson/ House 2011: 209-210). Da diese jedoch in der aktuellen Forschung kaum bezüglich der geschlechtsspezifischen fremdsprachlichen Leistungen untersucht werden (vgl. Kapitel 5.1.3) und eine große Ähnlichkeit zu Konstrukten wie L2-Selbst‐ konzept, L2 WTC und L2-Angst vorliegt, werden Persönlichkeitsmerkmale in der vorliegenden Studie nicht separat erhoben. 6 Netzwerkmodell der interaktiven Faktoren des genderbezogenen Fremdsprachenlernerfolgs Wie sich bei der Aufarbeitung des Stands der Forschung gezeigt hat, erforschen die meisten Studien die Geschlechtsvariable in Korrelation zu einzelnen, teil‐ weise isolierten, Variablen, z. B. Geschlecht und fremdsprachliche Leistung (vgl. z.-B. DESI-Konsortium 2006; OECD 2014, 2016, 2019), Geschlecht und affektive Faktoren (vgl. Dörnyei/ Clément 2001; Fuchs 2013, 2014; Kissau 2006a, 2006b), Geschlecht und Lernstrategien (vgl. Jiménez Catalán 2003), Geschlecht und kognitive Fähigkeiten (vgl. Yang 2001), Geschlecht und sozioökonomischer Hin‐ tergrund sowie sprachlicher Hintergrund (vgl. Steinlen 2018) oder Geschlecht und Sprachstile (vgl. López Rúa 2006: 100). Auch die Erforschung von Gender und dessen Wirkung auf das Fremdsprachenlernen, zum Beispiel in Bezug auf die Herausbildung von Stereotypen, wird oft separat oder lediglich in Verbindung mit der Erforschung von affektiven Faktoren vorgenommen (vgl. Williams et al. 2002). Es wurden aber bisher kaum systematische Versuche unternommen, möglichst viele dieser Faktoren in ihrem Zusammenspiel und in ihrer Wechselwirkung zu untersuchen. Um dies leisten zu können, ist es vonnöten die Faktoren zu benennen, die erfolgreiche Fremdsprachenlernende auszeichen und gleichzeitig in Abhängigkeit von den Faktoren Geschlecht und Gender stehen und zum anderen eine empirisch begründete Auswahl der wichtigsten dieser Faktoren zu treffen, da niemals alle Einflussfaktoren in gleichem Maße berücksichtigt werden können. Daher wird in Abbildung 1 das Netzwerkmodell der interaktiven Faktoren des genderbezogenen Fremdsprachenlernerfolgs dargestellt, das in Anlehnung an López Rúa (2006) erstellt wurde. Mit Ausnahme der Faktoren „verbale Intelli‐ genz“, „Sprachlernstrategien“ und „Unterrichtsqualität“ werden im Forschungs‐ design der vorliegenden Studie alle aufgeführten Faktoren berücksichtigt. 47 Die einzelnen Faktoren und die dazu passenden Erhebungsinstrumente werden in den kommenden Kapiteln vorgestellt. Abb. 1: Netzwerkmodell der interaktiven Faktoren des genderbezogenen Fremdspra‐ chenlernerfolgs (Adaptation und Erweiterung des Modells von López Rúa 2006: 112) 138 6 Netzwerkmodell des genderbezogenen Fremdsprachenlernerfolgs 7 Das Forschungsdesign: Vorhaben und Erhebungsinstrumente Es gilt nun, das Forschungsdesign festzulegen und dabei dem Kriterium gerecht zu werden, im Sinne der Intersektionalitätsforschung über die additive Aufrech‐ nung von Faktoren hinauszugehen und sowohl Konnexionen als auch Korrela‐ tionen zu erforschen: Dies bedeutet, dass soziale Kategorien wie Stereotype oder Geschlechterrollen, die Kontextgebundenheit der Konstruktion von Gender und die Herausbildung affektiver Faktoren innerhalb der Geschlechtergruppen in die Untersuchung integriert werden müssen (vgl. Bührmann 2009: 38; Knapp 2008: 44; Uhl 2019: 217). Umfassendes Ziel ist es, mehr empirisch fundiertes Wissen über die ver‐ schiedenen Einflussfaktoren der fremdsprachlichen Leistung von Jungen und Mädchen zu generieren, auch um im zukünftigen Französischbzw. Spanischun‐ terricht auf die unter Umständen unterschiedlichen motivationalen Merkmale von Mädchen und Jungen besser eingehen zu können. In der quantitativen empirischen Untersuchung stehen, basierend auf dem Stand der Forschung, die sieben Forschungsfragen im Mittelpunkt, die bereits in Kapitel 1 aufgeführt wurden. Nach dem „Modell des interaktiven genderbezogenen Netzwerks von Lern‐ erfaktoren beim Fremdsprachenlernen“ (vgl. Kapitel 6) werden zunächst die kognitiven Grundfertigkeiten erhoben. Dabei erfolgt die Operationalisierung der einzelnen oben genannten Konstrukte mithilfe gezielt ausgewählter bzw. entwickelter Testinstrumente, welche in den nachfolgenden Kapiteln genau beschrieben werden: Aufmerksamkeit und Konzentration werden mithilfe des d2-R-Tests (vgl. Brickenkamp et al. 2010) und schlussfolgerndes Denken mithilfe des SPM-Tests (vgl. Raven 2009) erhoben (vgl. Kapitel 9). Die kognitiven Grundfertigkeiten dienen zum einen als Kontrollvariable und tragen somit zur gesteigerten Vergleichbarkeit der Merkmalsgruppen bei. Dies bedeutet, dass ein nicht-signifikanter Unterschied zwischen Jungen und Mädchen in den kognitiven Grundfertigkeiten die Vergleichbarkeit der fremdsprachlichen Leistungen der beiden Geschlechtergruppen erhöht. Andersherum betrachtet kann ein signifikanter Unterschied in den kognitiven Grundfertigkeiten einen möglichen Unterschied in der fremdsprachlichen Leistung teilweise erklären. Nach der Erhebung der kognitiven Grundfertigkeiten erfolgt die Erhebung der fremdsprachlichen Leistungen: Es werden die standardisierten fremdsprach‐ lichen Leistungstests lingualevel (vgl. Lenz/ Studer 2008a) in den drei Fertig‐ keiten Hörverstehen, Leseverstehen und Schreiben ausgewählt und später mit den Probandinnen und Probanden durchgeführt (vgl. Kapitel 9.2 und 11.4). Lingualevel (Lenz/ Studer 2008a) wurde ursprünglich für Englisch und Franzö‐ sisch konzipiert und wird für die Erhebung der fremdsprachlichen Leistung im Spanischen adaptiert. Im Schülerfragebogen (SFB), der das dritte große Erhebungsinstrument der quantitativen Untersuchung darstellt, werden zum einen Alter und Geschlecht und zum anderen Hintergrundinformationen zur Sprachbiographie bezüglich des sprachlichen Hintergrunds, des Migrationshintergrunds (Geburtsländer der Elternteile, eventuelles Einreisedatum nach Deutschland), die Fähigkeit der Eltern in Französisch bzw. Spanisch, die Sprachlernfolge im schulischen Kontext, die Wahrnehmung von Unterstützungsangeboten in Französisch bzw. Spanisch wie etwa Nachhilfeunterricht oder Arbeitsgemeinschaften und der bisherigen Aufenthalte im französischsprachigen bzw. spanischsprachigen Aus‐ land erhoben (vgl. Fragen 1.1 bis 2.4.2 im Schülerfragebogen, Anhang 3.2, 3.3; Kapitel 9.3). Schließlich werden im Schülerfragebogen (SFB) (vgl. Anhang 3.2, 3.3) vor‐ rangig diejenigen affektiven endogenen Faktoren erhoben, die sich für das Fremdsprachenlernen in der bisherigen Forschung als in Interaktion mit Ge‐ schlecht und Gender stehend herauskristallisiert haben: Integrative Orientie‐ rung (vgl. Items 4.1 bis 4.5 des SFB), Ideal L3 bzw. L4 Self (vgl. Items 4.6 bis 4.11 des SFB), instrumentelle Orientierung (vgl. Items 4.12 bis 4.16 des SFB), Aktivitäten auf Französisch bzw. Spanisch in der Freizeit (vgl. Frageblock 2.5 des SFB), Gesprächsbereitschaft im mündlichen kommunikativen Unterricht (L3 bzw. L4 Willingness to Communicate [WTC], vgl. Frageblock 10 des SFB; vgl. Mystkowska-Wiertelak/ Pawlak 2016), Interesse am Fach Französisch bzw. Spanisch (vgl. Rumlich 2016; Frageblock 3 des SFB) , Interessensgebiete inner‐ halb der Unterrichtsgegenstände (vgl. Frageblock 11 des SFB), Einstellungen zu den Sprechern (vgl. Items 6.1 bis 6.7 des SFB), Einstellungen zu den Be‐ wohnerinnen und Bewohnern Frankreichs bzw. Spaniens (vgl. Items 6.8 bis 6.11 des SFB), Einstellungen zu Land und Kultur (vgl. Items 6.12 bis 6.18 des SFB), genderstereotype Wahrnehmungen gegenüber der französischen bzw. spanischen Sprache, FFS bzw. SFS Selbstkonzept und L3bzw. L4-Angst (vgl. Fragen 2.5 bis 7, 10 bis 13, 14.4, 14.6, 14.9 im Schülerfragebogen, Anhang 3.2, 3.3). Um die exogene Ebene zu erfassen wird zum einen der HISEI für den sozioökonomischen Hintergrund erhoben (vgl. Fragen 1.7 und 1.8 im Schüler‐ fragebogen, Anhang 3.2, 3.3). Bezüglich der Mikroebene und des Ought-to L2 Self, d. h. des Einflusses des immanenten Lernkontextes (vgl. Kissau 2006a), 140 7 Das Forschungsdesign: Vorhaben und Erhebungsinstrumente werden die wahrgenommene Unterstützung durch die Lehrkraft, die wahr‐ genommenen Erwartungen durch die Lehrkraft sowie die wahrgenommene Aufmerksamkeitsverteilung der Lehrkraft gegenüber Jungen und Mädchen er‐ hoben. Um den Einfluss der Makroebene zu erfassen, werden wahrgenommene Erwartungen durch Eltern und Peers erfasst (vgl. Frageblöcke 8, 9, 12, 13 des Schülerfragebogens, Anhang 3.2, 3.3). Die quantitativen Daten aus den Sprach‐ tests, den kognitiven Tests und den Schülerfragebögen werden anschließend in die Statistiksoftware IBM SPSS Statistics 26 eingespeist. Um Forschungsfrage 1 nach den möglichen Geschlechterunterschieden in den Sprachtests und in den einzelnen Teilfertigkeiten zu beantworten, werden - je nach Datenlage insbesondere bezüglich einer gegebenen oder nicht gege‐ benen annähernden Normalverteilung - Mann-Whitney-U-Tests oder t-Tests eingesetzt (vgl. Kapitel 11.4). Um die Forschungsfrage 2 bezüglich der möglichen Begründung von even‐ tuell auftretenden Geschlechterunterschieden in den fremdsprachlichen Leis‐ tungen zu beantworten, werden zunächst zweifaktorielle Varianzanalysen bezüglich der Interaktion von Geschlecht und HISEI bzw. Geschlecht und sprachlichem Hintergrund im Hinblick auf die fremdsprachlichen Leistungen im Lesen, Hören und Schreiben im Französischen oder Spanischen durchgeführt (vgl. Kapitel 11.6). Um die Forschungsfragen 3 und 4 zu beantworten, werden zunächst die Skalenstrukturen der Fragebögen anhand exploratorischer Faktorenanalysen jeweils für Französisch und Spanisch separat überprüft und eventuell Dimensi‐ onsreduktionen vorgenommen (vgl. Kapitel 9.3.4). Anschließend werden erneut t-Tests und Varianzanalysen eingesetzt, um die Datensätze auf Geschlechterun‐ terschiede zu prüfen. Nach Reliabilitätsanalysen jeder einzelnen Skala werden anschließend erneut t-Tests und Varianzanalysen eingesetzt, um Geschlechter‐ unterschiede zu überprüfen (vgl. Kapitel 11.7). Um Forschungsfrage 5 nach der Prädiktorstärke der einzelnen Faktoren für die fremdsprachliche Leistung zu beantworten, werden zuerst Korrelati‐ onsanalysen zwischen allen genannten Faktoren durchgeführt, um anschlie‐ ßend entsprechende Regressionsanalysen vorzunehmen, welche insbesondere überprüfen sollen, welche Prädiktorstärke das Geschlecht für die sprachliche Leistung hat und inwiefern sich diese verändert, wenn andere Faktoren in das Regressionsmodell mit aufgenommen werden (vgl. Kapitel 11.8 und 11.9). Für die Beantwortung von Forschungsfrage 6 nach geschlechtsspezifischen Prädiktoren für die jeweilige fremdsprachliche Leistung werden geschlechts‐ spezifische Korrelations- und Regressionsanalysen vorgenommen (vgl. Kapitel 11.10). 7 Das Forschungsdesign: Vorhaben und Erhebungsinstrumente 141 Für die Beantwortung von Forschungsfrage 7 wird schließlich eine Diskrimi‐ nanzanalyse durchgeführt, wobei das Geschlecht als abhängige Variable dient und alle anderen erhobenen Faktoren auf deren Prädiktorstärke für die Gruppe der männlichen und der weiblichen Lernenden getestet werden (vgl. Kapitel 11.11). Abschließend erfolgt eine Interpretation der Ergebnisse vor dem Hintergrund des Stands der Forschung (vgl. Kapitel 12). An dieser Stelle soll klargestellt werden, dass ein direkter statistischer Ver‐ gleich der Französischstichprobe und der Spanischstichprobe nicht möglich ist, da zwei unterschiedliche Zielsprachen vorliegen, da die Schülerinnen und Schüler jeweils an unterschiedlicher Stelle der Sprachlernfolge stehen (Französisch als zweite und Spanisch als dritte Fremdsprache) und die beiden Fremdsprachen jeweils aus unterschiedlichen Gründen von den jeweiligen Schülerinnen und Schülern gewählt wurden, was unterschiedliche Zusammen‐ setzungen der beiden Stichproben zur Folge hat. Daher nehmen die unterschied‐ lichen Zielsprachen so einen großen Einfluss auf die Natur der einzelnen Un‐ tersuchungskonstrukte und auf die beiden Stichproben, dass die entsprechenden Daten nicht direkt statistisch aufeinander bezogen werden können. Aus diesem Grund werden alle Forschungsfragen zunächst für Französisch und Spanisch separat behandelt bevor die Ergebnisse im Anschluss vorsichtig aufeinander bezogen werden, jedoch ohne statistische Verfahren durchzuführen. Im Anschluss wird die durchgeführte quantitative Untersuchung genauer erläutert, wobei zunächst die Stichprobenziehung präzise dargestellt wird, anschließend die Erhebungsinstrumente und die Datenerhebungsverfahren beschrieben sowie die Ergebnisse zu den einzelnen Forschungsfragen dargelegt, erläutert und interpretiert werden. 142 7 Das Forschungsdesign: Vorhaben und Erhebungsinstrumente 48 Im IQB-Bildungstrend 2015 wurden sowohl in Deutsch beim Lesen, Zuhören und bei der Orthographie als auch in Englisch beim Leseverstehen und Hörverstehen signifikante Geschlechterunterschiede zugunsten der Mädchen gefunden, wobei die Effektstärken bei Deutsch zwischen d = .25 im Zuhören und d = .47 in der Orthographie lagen und mit d = .13 im Hörsehverstehen Englisch und d = .21 im Leseverstehen Englisch in der Fremdsprache etwas geringer ausfielen. Die Französischleistungen wurde allerdings nicht auf Geschlechterunterschiede untersucht (vgl. Böhme et al. 2016: 387). 49 Im Folgenden wird für die Angabe der Anzahl der Fälle in der Grundgesamtheit N und für die Angabe der Anzahl der Fälle innerhalb der Stichproben n verwendet (vgl. Grum/ Legutke 2016: 80). 8 Grundgesamtheit und Sampling-Strategien der quantitativen Untersuchung 8.1 Bestimmung der beiden angestrebten Grundgesamtheiten In den großen Bildungsmonitorings, die die Variable Geschlecht berücksich‐ tigten, traten Leistungsunterschiede in den Fremdsprachen insbesondere wäh‐ rend der Pubertät und vor allem im Französischen auf (vgl. Köller et al. 2010; Kapitel 4.2). In Baden-Württemberg wurden, anders als in einigen anderen Bundesländern, in der Ländervergleichsstudie 2008/ 2009 im Leseverstehen in Französisch signifikante Geschlechterunterschiede zugunsten der Mädchen mit einer kleinen Effektstärke festgestellt. Auch beim Hörverstehen in Franzö‐ sisch erlangten die Mädchen in Baden-Württemberg durchschnittlich mehr Leistungspunkte als die Jungen, wobei - im Gegensatz zum bundesdeutschen Gesamtergebnis - kein statistisch signifikanter Unterschied vorlag und die Geschlechterdisparität weniger groß war als in anderen Bundesländern (vgl. Köller et al. 2010: 18). Für Spanisch hingegen liegen derzeit noch keine flächendeckenden Bildungs‐ monitorings in Deutschland vor (vgl. Kapitel 4.2). 48 Auch aus diesem Grund werden in der vorliegenden Studie die Kompetenzleistungen von Jungen und Mädchen im Bereich des Französischen und Spanischen näher untersucht. Da in der vorliegenden Studie eine repräsentative Stichprobenziehung ange‐ strebt wird, erfolgt eine Einschränkung des geographischen Rahmens innerhalb Baden-Württembergs auf den Regierungsbezirk Tübingen. Neben der dadurch stattfindenden Reduktion der Größe der angestrebten Grundgesamtheit 49 wird 50 Französisch als erste Fremdsprache wird in Baden-Württemberg nur entlang der Rhein‐ schiene angeboten (vgl. Ministerium für Kultus, Jugend und Sport Baden-Württemberg 2003: 3). 51 Vorteile hinsichtlich der Vergleichbarkeit der beiden Gebiete sind, dass sie zum einen aneinandergrenzen und zum anderen ähnliche demographische Strukturen aufweisen: Während die größte Stadt des Bodenseekreises, Friedrichshafen am 31.06.2018 60 376 Einwohner zählte, umfasste Bad Saulgau als die größte Stadt des Landkreises Sigma‐ ringen am 31.06.2018 17 556 Einwohner (vgl. Statistisches Landesamt Baden-Württem‐ berg 2020b). Beide Landkreise verfügen somit insgesamt ausschließlich über dörfliche, land-, klein- und mittelstädtische Einzugsgebiete. 52 Für diesen Regierungsbezirk wurde ein offizieller Antrag auf Genehmigung der Studie an das Regierungspräsidium Tübingen gestellt, dem stattgegeben wurde, sodass die Untersuchung dort stattfinden konnte. 53 Es stellt sich die Frage, inwieweit von zwei verschiedenen Grundgesamtheiten gespro‐ chen werden kann, da auch Fälle vorliegen, bei denen ein und derselbe bzw. ein und die‐ selbe Lernende gleichzeitig Französisch als zweite und Spanisch als dritte Fremdsprache belegt: Insgesamt belegten im Schuljahr 2017/ 18 45% der Gymnasiasten die Kombina‐ tion Englisch-Französisch und 16% der Gymnasiasten Englisch-Französisch-Spanisch (vgl. Landesinstitut für Schulentwicklung/ Statistisches Landesamt Baden-Württem‐ berg 2018: 73). In der nachfolgenden Untersuchung werden jedoch weiterhin zwei Grundgesamtheiten angenommen, da es sich um eine andere Sprachenfolge sowie um eine andere Zielsprache handelt, was mit grundlegend unterschiedlichen Bedingungen einhergeht. auch darauf geachtet, das Risiko einer Verzerrung der Ergebnisse, beispielsweise durch die gleichzeitige Erhebung von Daten in Grenznähe zu Frankreich und im Landesinneren, zu reduzieren. Da jedoch aufgrund der immer noch sehr hohen Anzahl von Schülerinnen und Schülern die Ziehung einer repräsentativen Stichprobe als problematisch erscheint, werden die geographischen Räume erneut reduziert. Darauf basierend liegen im Falle der durchzuführenden Studie zwei konkrete angestrebte Grundgesamtheiten vor. Als erste angestrebte Grundgesamtheit werden alle Lernenden des Französi‐ schen als zweite Fremdsprache 50 in der 9.-Jahrgangsstufe an öffentlichen allge‐ meinbildenden Gymnasien des Kreises Sigmaringen und des Bodenseekreises innerhalb des Regierungsbezirks Tübingen im Schuljahr 2017/ 2018 definiert. 51 Als zweite angestrebte Grundgesamtheit werden alle Lernenden des Spa‐ nischen als dritte Fremdsprache in der 9. Jahrgangsstufe von öffentlichen allgemeinbildenden Gymnasien des Kreises Sigmaringen, des Bodenseekreises und des Kreises Ulm innerhalb des Regierungsbezirks Tübingen 52 im Schuljahr 2017/ 2018 definiert. 53 Wie hoch genau die Zahl der Mitglieder der beiden angestrebten Grundgesamtheiten ist, konnte über Recherchen auf der Internet‐ seite des Statistischen Landesamts Baden-Württemberg und über eine konkrete Anfrage an diese Institution ermittelt werden: 144 8 Grundgesamtheit und Sampling-Strategien der quantitativen Untersuchung 54 Vgl. Rückmeldung vom 05.03.2020 von Herrn Christoph Fischer, Statistisches Lan‐ desamt Baden-Württemberg, Referat 22 „Bildung und Kultur“, Böblinger Str. 68, 70199 Stuttgart: „Eine Unterteilung nach Geschlecht ist leider nicht möglich, da das Geschlecht der Schülerinnen und Schüler bei der Fremdsprachenfolge an allgemeinbildenden Gymnasien im Rahmen der amtlichen Schulstatistik nicht erhoben wird.“ In ganz Baden-Württemberg besuchten im Schuljahr 2017/ 2018 - unabhängig von der Fächerwahl - 37 677 Schülerinnen und Schüler der 9. Jahrgangsstufe öffentliche oder private allgemeinbildende Gymnasien, davon 509 im Landkreis Sigmaringen, 716 im Stadtkreis Ulm und 701 im Landkreis Bodensee (vgl. Statistisches Landesamt Baden-Württemberg 2019a). Insgesamt belegten davon in ganz Baden-Württemberg 25 442 Schülerinnen und Schüler Französisch als zweite Fremdsprache sowie 9 001 Schülerinnen und Schüler Spanisch als dritte Fremdsprache. Im Regierungsbezirk Tübingen belegten insgesamt 4 896 Lernende Französisch als zweite und 1.607 Lerndende Spanisch als dritte Fremdsprache in einer 9. Jahrgangsstufe eines öffentlichen oder privaten allge‐ meinbildenden Gymnasiums (vgl. Statistisches Landesamt Baden-Württemberg 2020). Die erste angestrebte Grundgesamtheit umfasst für das Fach Französisch als zweite Fremdsprache demnach insgesamt N = 777 Schülerinnen und Schüler in der 9. Jahrgangsstufe des Schuljahrs 2017/ 2018, davon 308 Schülerinnen und Schüler im Landkreis Sigmaringen und 469 Schülerinnen und Schüler im Boden‐ seekreis. Die zweite angestrebte Grundgesamtheit umfasst für das Fach Spanisch als dritte Fremdsprache insgesamt N = 419 Schülerinnen und Schüler der 9. Jahrgangsstufe eines öffentlichen Gymnasiums im Schuljahr 2017/ 18, davon 79 Schülerinnen und Schüler im Landkreis Sigmaringen, 218 Schülerinnen und Schüler im Bodenseekreis und 122 Schülerinnen und Schüler im Stadtkreis Ulm (vgl. Statistisches Landesamt Baden-Württemberg 2020). Für Spanisch wurde der Stadtkreis Ulm hinzugefügt, um die Anzahl der Schülerinnen und Schüler in der Grundgesamtheit sowie in der Stichprobenziehung etwas zu erhöhen und dadurch in der Zahl etwas mehr an die Grundgesamtheit des Französischen anzupassen. Jedoch muss dieser Aspekt bei einem späteren Vergleich der beiden Grundgesamtheiten und der beiden Stichproben berücksichtigt werden. Als Nächstes stellt sich die Frage, wie hoch der jeweilige Anteil von Jungen und Mädchen in den beiden Grundgesamtheiten ist. Das Statistische Landesamt Baden-Württemberg und das Statistische Bundesamt verfügen al‐ lerdings über keinerlei Informationen bezüglich des Anteils von männlichen und weiblichen Lernenden in den jeweiligen Jahrgangstufen in spezifischen Fächern und Schularten, da diese Daten bei deren jährlichen Erhebungen nicht erfasst werden. 54 Es werden lediglich allgemeine Geschlechterverteilungen nach 8.1 Bestimmung der beiden angestrebten Grundgesamtheiten 145 55 Ab dem Schuljahr 2020/ 2021 wird Englisch in Baden-Württemberg erst ab der 3. Jahr‐ gangsstufe angeboten. Somit haben die Schülerinnen und Schüler ab dem Schuljahr 2018/ 2019 keinen Englischunterricht in der ersten Jahrgangsstufe mehr (vgl. Landtag von Baden-Württemberg 2017). 56 Ausnahmen sind altsprachliche Gymnasien, in denen die zweite Fremdsprache Latein in der 5. Jahrgangsstufe beginnt und Abibac-Schulen, die Französisch ebenfalls in der 5. Klasse einführen (vgl. Landesinstitut für Schulentwicklung/ Statistisches Landesamt Baden-Württemberg 2018: 62, Ministerium für Kultus, Jugend und Sport Baden-Würt‐ temberg 2020a). Beide Schultypen werden, genauso wie die Modellschulen für G9 für die nachfolgende Stichprobenziehung aufgrund der Abweichungen ausgeschlossen. Schulart und Jahrgangsstufe, jedoch nicht nach Schulfach erhoben. Daher kann an dieser Stelle aufgrund der vorliegenden statistischen Daten lediglich eine Schätzung des Anteils von Jungen und Mädchen in den 9. gymnasialen Jahr‐ gangsstufen in Französisch als zweiter Fremdsprache einerseits und in Spanisch als dritter Fremdsprache andererseits vorgenommen werden: Im Schuljahr 2017/ 18 besuchten 157 898 Schülerinnen und 143 110 Schüler ein Gymnasium in Baden-Württemberg (vgl. Statistisches Landesamt Baden-Württemberg 2019b), davon waren 15 422 Schüler und 16 965 Schülerinnen in einer 9. Jahrgangsstufe eines G8-Gymnasiums (vgl. Statistisches Bundesamt 2020a). Im Allgemeinen, also jahrgangsstufenübergreifend und unabhängig von der Fächerwahl, lag der Anteil der weiblichen Lernerinnen an öffentlichen und privaten allgemeinbil‐ denden Gymnasien in Baden-Württemberg folglich umgerechnet bei 52.46% und in allen 9. Jahrgangsstufen der G8-Gymnasien bei 52.38% und somit ganz leicht über der Hälfte. Jedoch ist davon auszugehen, dass der Anteil der weiblichen Lernerinnen in den Fächern Französisch als zweite und Spanisch als dritte Fremdsprache aufgrund der Wahlmöglichkeiten und des bisher in anderen Bundesländern beobachteten Wahlverhaltens deutlich höher ausfallen könnte. Nachdem die Schülerinnen und Schüler in Baden-Württemberg - abgesehen von denjenigen, die die Grundschulen im Grenzgebiet zu Frankreich besuchen - bereits ab der 1. Jahrgangsstufe der Grundschule 55 die erste Fremdsprache Englisch belegen, können die Schülerinnen und Schüler am Ende der 5. Jahr‐ gangstufe des Gymnasiums in Baden-Württemberg entscheiden, welche zweite Fremdsprache sie in der 6. Jahrgangsstufe im institutionellen Kontext erlernen möchten: 56 Französisch, Latein oder in Einzelfällen auch Russisch. Am Ende der 7. Jahrgangsstufe entscheiden die Schülerinnen und Schüler wiederum, ob sie in der 8. Jahrgangsstufe eine dritte Fremdsprache (entweder Französisch, Latein, Russisch, Spanisch, Portugiesisch, Italienisch oder Griechisch) wählen oder aber das naturwissenschaftliche Profil mit dem zusätzlichen vierstündigen Kernfach Naturwissenschaft und Technik (NWT) 57 einschlagen und somit keine der genannten dritten Fremdsprachen wählen (vgl. Ministerium für Kultus, Jugend 146 8 Grundgesamtheit und Sampling-Strategien der quantitativen Untersuchung 57 Seit dem Schuljahr 2018/ 19 können die Schülerinnen und Schüler in Baden-Würt‐ temberg im naturwissenschaftlichen Profil alternativ zu NWT auch das Profilfach Informatik - Mathematik - Physik (IMP) wählen (vgl. Ministerium für Kultus, Jugend und Sport Baden-Württemberg 2020b). 58 Diese Anteile stellen keine Ausnahmen dar, sondern verhalten sich relativ konstant: Im Schuljahr 2017/ 18 waren in der 8. Jahrgangsstufe 2 681 männliche Lernende und 6 275 weibliche Lernerinnen und in der 10. Jahrgangsstufe 2 582 männliche Lernende und 6 398 weibliche Lernerinnen an Gymnasiem in Bayern im sprachlichen Profil und belegten somit eine dritte Fremdsprache (vgl. Bayerisches Landesamt für Statistik 2019b: 26, 30). 59 Die Zahlen der Schülerinnen und Schüler der 9. Jahrgangsstufe des Gymnasiums in Bayern, die eine dritte Fremdsprache belegen, verteilten sich im Schuljahr 2017/ 2018 wie folgt: Französisch: 3 771, Latein: 1, Griechisch: 730, Italienisch: 1 586, Chinesisch: 13, Russisch: 28, Sonstige: 1 (vgl. Bayerisches Landesamt für Statistik 2019b: 30-31). und Sport Baden-Württemberg 2020b). Die Dokumentation des Wahlverhaltens von Mädchen und Jungen in anderen Bundesländern zeigt den Trend auf, dass das sprachliche Profil überwiegend von Mädchen und das naturwissen‐ schaftliche Profil überwiegend von Jungen gewählt werden: Beispielsweise führte Grein (2012: 173) für die Schuljahre 2002/ 03 bis 2010/ 11 Berechnungen für die Bundesländer Bayern, Hamburg, NRW und Thüringen auf Basis der dort vorliegenden Daten aus den jeweiligen Statistischen Landesämtern durch. Er kam in der Sekundarstufe I in Französisch je nach Bundesland auf einen Anteil zwischen 54% und 61% an weiblichen Lernerinnen. Bei Spanisch ist die Schichtung der von ihm analysierten Populationen noch etwas unausgegli‐ chener: Grein (2012: 174) errechnet für die Schuljahre 2002/ 03 bis 2010/ 11 in Bayern, Hamburg, NRW und Thüringen für die Sekundarstufe I einen Anteil von weiblichen Lernerinnen zwischen 56% und 64%. Für Bayern, ein Bundesland, in dem Spanisch ebenfalls frühestens als dritte Fremdsprache von den Schülerinnen und Schülern des Gymnasiums gewählt werden kann, liegen für das sprachliche Profil im Schuljahr 2017/ 2018 konkre‐ tere Daten vor: Diejenigen Gymnasiasten in der 9. Jahrgangsstufe, die sich im sprachlichen Profil befinden, was sich durch die Wahl einer dritten Fremd‐ sprache charakterisiert, setzen sich anteilig aus 71.53% Mädchen (6 598) und 28.52% Jungen (2 631) zusammen 58 , wobei insgesamt 3 795 Neuntklässlerinnen und Neuntklässler an Gymnasiem in Bayern Spanisch als dritte Fremdsprache belegen, jedoch für diese Gruppe keine statistischen Daten zur Geschlech‐ terverteilung vorliegen (vgl. Bayerisches Landesamt für Statistik 2019b: 26, 30). 59 Somit lässt sich für die dritte Fremdsprache am Gymnasium in Bayern eine besonders starke Unausgeglichenheit der Geschlechteranteile beobachten, wenngleich keine fachspezifischen Daten vorliegen. Da in Baden-Württemberg - genauso wie in Bayern - Spanisch ausschließlich als dritte oder spätbegin‐ 8.1 Bestimmung der beiden angestrebten Grundgesamtheiten 147 nende Fremdsprache angeboten wird und da unter anderem die Berechnungen von Grein (2012) zeigen, dass der Anteil von Jungen und Mädchen über zehn Schuljahre und vier Bundesländer hinweg relativ konstant blieb, kann in Baden-Württemberg ebenfalls von einem deutlich erhöhten Anteil von weiblichen Lernerinnen im Fach Spanisch als dritte Fremdsprache ausgegangen werden. Dieses Ungleichgewicht in der Geschlechterverteilung muss sich also insbesondere für das sogenannte sprachliche Profil und somit für das Fach Spanisch als dritte Fremdsprache in der späteren Stichprobe wiederfinden, damit diese möglichst repräsentativ ist (vgl. Bortz/ Döring 2006: 425; Cohen et al. 2011: 154; Grum/ Legutke 2016: 81). Die Lehrkräfte der untersuchten Französisch- und Spanischlernenden stellen zwar in der vorliegenden Studie keinen primären Untersuchungsgegenstand dar, jedoch bilden sie einen wichtigen äußeren Einflussfaktor auf die Untersu‐ chungsergebnisse der Lernenden, weshalb durch die Schülerinnen und Schüler wahrgenommene Erwartungshaltungen und Unterstützungsmaßnahmen der Lehrkräfte in den Blick der vorliegenden Studie gerückt werden (vgl. Kapitel 9.3.5). Daher wird an dieser Stelle ebenfalls kurz auf das Geschlechterverhältnis bei den Lehrkräften eingegangen: Ähnlich wie bei den bisher aufgeführten Statistiken zu den Schülerdaten bezüglich des Geschlechterverhältnisses gibt es kaum aktuelle Statistiken darüber, wie hoch der Anteil weiblicher und männli‐ cher Französisch- und Spanischlehrkräfte an Gymnasien in Baden-Württemberg ist. Im Schuljahr 2016/ 17 waren - unabhängig von den unterrichteten Fächern - 60% der Lehrkräfte an Gymnasien in ganz Deutschland weiblich (vgl. Statis‐ tisches Bundesamt 2018: 44). Im Schuljahr 2017/ 18 lag in Baden-Württemberg an öffentlichen und privaten allgemeinbildenden Gymnasien der Anteil der weiblichen Lehrkräfte bei 60.71% und der Anteil der männlichen Lehrkräfte bei 39.29%, wobei sich diese Daten auf alle Fächer beziehen (vgl. Statistisches Lan‐ desamt Baden-Württemberg 2018: 36). Die Berechnungen von Grein (2012: 179) zeigen, dass zwischen den Jahren 1976 und 2009/ 2010 der prozentuale Anteil weiblicher Absolventen des zweiten Staatsexamens in Französisch deutschland‐ weit bei 64% bis 88% lag. Der Anteil weiblicher Absolventinnen des zweiten Staatsexamens in Spanisch lag im gleichen Zeitraum zwischen 50% und 94%. Zwischen 2009 und 2018 erreichte außerdem der Anteil der weiblichen Absol‐ ventinnen im Fach Französisch (Bachelor und Lehramtsabschlüsse im ersten Staatsexamen zusammengenommen) deutschlandweit einen Wert zwischen 84% und 88% (Statistisches Bundesamt 2020b). Für das Fach Spanisch - Bachelor und Lehramtsabschlüsse im ersten Staatsexamen zusammengerechnet - betrug der Anteil weiblicher Absolventinnen zwischen 2009 und 2018 zwischen 80% und 88% (vgl. Statistisches Bundesamt 2020c). 148 8 Grundgesamtheit und Sampling-Strategien der quantitativen Untersuchung 60 Der Prozentsatz wird vom Statistischen Landesamt Baden-Württemberg (2018) nicht angegeben, sondern lediglich die Schülerzahlen: 35 953 Gymnasiasten haben im Schul‐ jahr 2017/ 2018 einen Migrationshintergrund und 229 772 Schülerinnen und Schüler haben keinen Migrationshintergrund. Daraus ergibt sich ein Prozentsatz von 13.53%. 61 Auch hier wurden die Prozentsätze aus den durch das Statistische Landesamt Baden-Württemberg (2018: 20) angegebenen Schülerzahlen errechnet. Ein weiteres als Intersektionalitätsaxiom geltendes Merkmal in Verbindung mit dem Geschlecht ist das des Migrationshintergrunds bzw. des sprachlichen Hintergrunds (vgl. Kapitel 5.2.5). Da in den offiziellen Daten des Statistischen Landesamts Baden-Württemberg allerdings ausschließlich der Migrationshin‐ tergrund, nicht aber der sprachliche Hintergrund in den statistischen Angaben Berücksichtigung findet, wird bei der Beschreibung der statistischen Merkmale der angestrebten Grundgesamtheiten zunächst auf das Merkmal Migrationshin‐ tergrund eingegangen. Nur auf diese Weise kann in einem zweiten Schritt eine Überprüfung des Verhältnisses zwischen der Schichtung der Grundgesam‐ theiten und der später gezogenen Stichproben vorgenommen werden. Nach der Erläuterung des Verhältnisses zwischen den Grundgesamtheiten und den Stich‐ proben bezüglich des Migrationshintergrunds wird aber aus oben genannten Gründen vorwiegend das Merkmal des sprachlichen Hintergrunds mit seinen beiden Merkmalsprägungen „einsprachiger Hintergrund“ und „mehrsprachiger Hintergrund“ in der Studie Berücksichtigung finden. Der Begriff Migrationshintergrund wird für die amtliche Schulstatistik fol‐ gendermaßen definiert: „Einen Migrationshintergrund haben alle Schüler, die keine deutsche Staatsangehörigkeit besitzen oder die im Ausland geboren wurden oder in deren Familie überwiegend nicht deutsch gesprochen wird“ (Statistisches Landesamt Baden-Württemberg 2017, vgl. auch Landesinstitut für Schulentwicklung/ Statistisches Landesamt Baden-Württemberg 2018: 317). Auf Basis dieser Definition findet sich die Information, dass an öffentlichen Gymnasien in ganz Baden-Württemberg im Schuljahr 2017/ 2018 13.53% der Schülerinnen und Schüler einen Migrationshintergrund hat (vgl. Statistisches Landesamt Baden-Württemberg 2018: 1). 60 Im Regierungsbezirk Tübingen liegt der Anteil von Schülerinnen und Schülern mit Migrationshintergrund insge‐ samt bei 12.66% (vgl. Statistisches Landesamt Baden-Württemberg 2018: 20). 61 Allerdings ist aus den offiziellen Schulstatistiken nicht ablesbar, wie hoch der Anteil an Schülerinnen und Schülern mit Migrationshintergrund in den 9. Jahrgangsstufen der Gymnasien in den Fächern Französisch als zweite und Spanisch als dritte Fremdsprache im Schuljahr 2017/ 2018 ausfällt. Aufgrund der Annahme, dass mehrsprachig aufgewachsene Lernende, die gleichzeitig oftmals nach der Definition des Statistischen Landesamts Baden-Württemberg (2017) 8.1 Bestimmung der beiden angestrebten Grundgesamtheiten 149 62 Der sozioökonomische Index ISEI (International Socio-Economic Index) nimmt eine Klassifizierung nach Berufsangabe vor, wobei die Ausbildungsdauer, das Einkommen und das soziale Berufsprestige eingruppiert und hierarchisch geordnet werden. Aus den Berufsangaben von beiden Elternteilen wird standardgemäß der sogenannte HISEI, der höchste sozioökonomische berufliche Status der Eltern gebildet, indem der höchste ISEI der beiden Elternteile in den Datensatz mit aufgenommen wird (vgl. Prenzel et al. 2004: 235). Die PISA-Studie von 2012 ergibt, dass der mittlere HISEI der Eltern der Schülerinnen und Schüler in Deutschland bei einem Mittelwert von 50.9 Punkten bei einer Standardabweichung von 20.6 liegt. Den höchsten HISEI der OECD-Staaten erreicht Norwegen mit 58.9 Punkten und den niedrigsten die Türkei mit 35.0 Punkten (vgl. Prenzel et al. 2013: 250-251). 63 In ganz Deutschland liegt der durchschnittliche HISEI im Jahr 2018 bei 51.8 Punkten und somit in der Nähe des OECD-Durchschnitts von 52.4 Punkten (vgl. Reiss et al. 2019: 136). einen Migrationshintergrund haben, eventuell häufiger das sprachliche Profil wählen, weils sie annehmen, dass es ihnen leichter fallen könnte, eine weitere Fremdsprache zu erlernen (vgl. Riehl 2006: 18-19; Riemer/ Hufeisen 2010: 746), kann aber die Hypothese formuliert werden, dass der Anteil der Schülerinnen und Schüler in den neusprachlichen Fächern in der zweiten und insbesondere in der dritten Fremdsprache etwas höher ausfällt. Des Weiteren ist ebenfalls aus den offiziellen Schulstatistiken nicht er‐ kennbar, wie hoch der Anteil von Jungen und Mädchen unter denjenigen Lernenden mit und ohne Migrationshintergrund in der Jahrgangsstufe 9 im Schuljahr 2017/ 18 in den Fächern Französisch als zweite Fremdsprache einer‐ seits und Spanisch als dritte Fremdsprache andererseits ist (vgl. Statistisches Landesamt Baden-Württemberg 2018, 2019a, 2019b, 2019c, 2020a). Diesbezüg‐ lich Schätzungen anzustellen gestaltet sich als noch schwieriger als bezüglich des globalen Geschlechterverhältnisses oder des Anteils der Schülerinnen mit und ohne Migrationshintergrund. Somit kann lediglich vermutet werden, dass sich der höhere Anteil von Mädchen in den beiden Grundpopulationen sowohl in der Merkmalsgruppe der Schülerinnen und Schüler mit Migrationshinter‐ grund als auch in der Merkmalsgruppe der Schülerinnen und Schüler ohne Migrationshintergrund in ähnlicher Weise zeigt. Bezüglich des höchsten sozioökonomischen beruflichen Status der Eltern (HISEI) 62 lassen sich im IQB-Bildungstrend 2015 (vgl. Kuhl et al. 2016: 414) relevante Daten zur Grundgesamtheit finden: Die Familien der Neuntklässle‐ rinnen und Neuntklässler aller Schularten erreichten in Baden-Württemberg einen durchschnittlichen HISEI 49.7 (SE = .7 und SD = 20.5) und lagen somit knapp unter dem bundesdurchschnittlichen HISEI aller Familien von Neunt‐ klässlerinnen und Neuntklässlern von 50.0. 63 In Baden-Württemberg blieb der Wert seit dem Jahr 2009, in dem ein mittlerer HISEI von 50.2 gemessen 150 8 Grundgesamtheit und Sampling-Strategien der quantitativen Untersuchung 64 In Berlin wurde mit M = 70.3 der höchste und im Saarland mit M-=-60.8 der niedrigste mittlere HISEI bei Neuntklässlerinnen und Neuntklässlern mit Französisch ab Jahrgans‐ stufe 5 gemessen (vgl. Schipolowski et al. 2016: 184). wurde, relativ konstant. Allerdings betreffen die hier angegebenen Werte alle Schularten, in denen Neuntklässler anzutreffen sind. Empirische Analysen belegen jedoch, dass der HISEI je nach Schulart beträchtlich schwankt (vgl. Jonkmann et al. 2010, Leucht et al. 2016: 104). Prenzel et al. (2013) ermittelten beispielsweise für das Jahr 2013 bundesweit zu Beginn der fünften Jahrgangs‐ stufe einen mittleren HISEI 40.1 für die Hauptschule, 46.0 für die Realschule, 46.4 für Schulen mit mehreren Bildungsgängen und 56.6 für Gymnasien in ganz Deutschland. Der IQB-Bildungstrend 2015 ermittelt als mittleren HISEI der Neuntklässlerinnen und Neuntklässler an Gymnasien in Baden-Württemberg, die spätestens seit der 5. Jahrgangsstufe durchgehend Französischunterricht erhalten haben und den mittleren Bildungsabschluss in Französisch anstreben, einen Mittelwert von 61.8 (vgl. Schipolowski et al. 2016: 184). 64 Bezüglich des mittleren HISEI der Neuntklässlerinnen und Neuntklässler, die das Fach Französisch als zweite Fremdsprache ab Jahrgangsstufe 6 bzw. das Fach Spanisch als dritte Fremdsprache ab Jahrgangsstufe 8 in Baden-Württemberg (bzw. im Kreis Sigmaringen, im Bodenseekreis und im Stadtkreis Ulm) belegen, liegen für das Schuljahr 2017/ 18 leider keine konkreten Zahlen vor. Auch zu mögli‐ chen Geschlechterunterschieden der beiden angestrebten Grundgesamtheiten bezüglich des mittleren HISEI sind keine Daten vorhanden (vgl. Statistisches Landesamt Baden-Württemberg 2018). 8.2 Sampling-Strategien der quantitativen Untersuchung Ziel des Samplings ist es, im Rahmen der gegebenen äußeren Bedingungen, eine größtmögliche Repräsentativität der Stichprobe zu erreichen. Die Repräsentativität einer Stichprobe (‚sample representativeness‘) gibt an, wie gut bzw. unverzerrt die Merkmalszusammensetzung in der Stichprobe die Merk‐ malszusammensetzung in der Population widerspiegelt. Zu unterscheiden sind dabei merkmalsspezifisch-repräsentative sowie global-repräsentative Stichproben. (Döring/ Bortz 2016: 298) Die Art der Stichprobenziehung und die Größe der Stichprobe beeinflussen also den Grad der Sicherheit der Testergebnisse. Eine merkmalsspezifisch-re‐ präsentative Stichprobe liegt immer dann vor, wenn die Zusammensetzung einiger, für die Studie relevanter Merkmale der Zusammensetzung der Grund‐ 8.2 Sampling-Strategien der quantitativen Untersuchung 151 gesamtheit entspricht. Global-repräsentative Stichproben liegen hingegen dann vor, wenn die Zusammensetzung der Stichprobe in allen Merkmalen und Merk‐ malskombinationen die Zusammensetzung der Grundgesamtheit widerspiegelt. Globale Repräsentativität kann folglich nur dann erzielt werden, wenn eine rein probabilistische Stichprobenziehung vorgenommen werden kann und die Stichprobe zusätzlich eine gewisse Mindestgröße hat (vgl. Döring/ Bortz 2016: 298-299). Da die beiden angestrebten Gesamtpopulationen mit N = 777 für Französisch und N = 419 für Spanisch viel kleiner sind als dies beispielsweise bei bevölkerungsrepräsentativen Studien der Fall ist und da für einzelne Merkmale und Merkmalskombinationen der beiden angestrebten Grundgesamtheiten auf‐ grund fehlender offizieller statistischer Daten für bestimmte Merkmale oder Merkmalskombinationen lediglich Schätzungen vorgenommen werden können (vgl. Kapitel 8.1), wird im Folgenden die Ziehung einer merkmalsspezifisch-re‐ präsentativen Stichprobe angestrebt. Das Erreichen von Repräsentativität, unabhängig von der Ziehung einer global-repräsentativen oder merkmalsspezifisch-repräsentativen Stichprobe, ist eine wichtige Grundvoraussetzung für die Interpretation der Ergebnisse inferenzstatistischer Verfahren. Wenn die gezogenen Stichproben nicht reprä‐ sentativ für die Grundgesamtheiten wären, würden sich die späteren Studien‐ ergebnisse nicht auf diese Grundgesamtheiten übertragen lassen. Die Folge hiervon wäre wiederum, dass sich die Aussagekraft der Studie auf die beiden Stichproben selbst reduzieren würde (vgl. Grum/ Legutke 2016: 80). Da eine Vollerhebung und somit eine vollständige Erfüllung des Kriteriums der Repräsentativität (vgl. Grum/ Legutke 2016: 79) aufgrund der Größe der Grundgesamtheit zu aufwendig wäre und zu viele personelle als auch materi‐ elle Ressourcen beanspruchen würde, wird nach Möglichkeit versucht, eine probabilistische, also auf Zufall basierende merkmalsspezifisch-repräsentative Stichprobenziehungen und somit für Französisch und Spanisch jeweils eine Teilerhebung vorzunehmen (vgl. Döring/ Bortz 2016: 298). Die Stichprobenzie‐ hung erfolgt aufgrund des - als gegeben zu betrachtenden - beschränkten Zugangs zu öffentlichen Bildungseinrichtungen für außenstehende Forschende zwangsläufig über möglichst breit gefächerte Anfragen an die Schulleitungen, deren Schulen einen Teil der Schülerschaft der angestrebten Gesamtpopulation beherbergen. Allerdings können nur diejenigen Schulen, die sich dazu bereit erklären, an der Untersuchung teilzunehmen, für die Formierung der beiden Stichproben herangezogen werden. Vorausgesetzt, das jeweilige Gymnasium stimmt zu, können in einem zweiten Schritt wiederum nur diejenigen Lernenden teilnehmen, deren Eltern die Teilnahme an der Studie durch das Unterschreiben der Einverständniserklärung erlauben, da die Schülerinnen und Schüler alle 152 8 Grundgesamtheit und Sampling-Strategien der quantitativen Untersuchung 65 Eine Besonderheit gestaltet sich darin, dass nicht die minderjährigen Probandinnen und Probanden selbst über ihre Teilnahme entscheiden, wie der Terminus zu verstehen gibt, sondern dies vielmehr die Schulleiterinnen und -leiter, Lehrkräfte und Eltern anstelle der eigentlichen Probandinnen und Probanden übernehmen. 66 Auf eine Nennung der genauen Namen der Gymnasien wird aufgrund der Aufrecht‐ erhaltung der Anonymität der Daten der Probandinnen und Probanden absichtlich verzichtet. unter 18 Jahre alt sind. Daher findet eine vom Forschenden nicht kontrollierbare und allenfalls durch Aufklärungsarbeit vermeidbare zweite Vorselektion der Stichprobe statt. Aufgrund der institutionellen Einschränkungen durch die sogenannten Gatekeepers in Form von Schlüsselpersonen und -institutionen (vgl. Grum/ Legutke 2016: 79) bei Sampling-Verfahren im Bildungswesen handelt es sich also trotz der anfänglichen breiten Anfrage an zahlreiche Schulen und der somit zunächst vorhandenen Intention der probabilistischen Stichproben‐ ziehung in den in Kapitel 8.1 beschriebenen Gebieten zu einem gewissen Anteil auch um eine Selbstselektionsstichprobe 65 (vgl. Döring/ Bortz 2016: 294). Dieser Limitation bei der Stichprobenziehung, der die meisten Studien im Bildungs‐ bereich mehr oder weniger stark unterworfen sind (vgl. Grum/ Legutke 2016: 79), muss bei der Interpretation der Test- und Umfrageergebnisse Rechnung getragen werden. Aufgrund der Struktur des schulischen Bildungssystems werden also - soweit dies, wie oben erörtert, möglich ist - zufällige Klumpenstichproben gezogen. Klumpen bezeichnen dabei „natürliche Teilkollektive oder bereits bestehende Gruppen“ (Grum/ Legutke 2016: 81). In der vorliegenden Untersuchung liegen Klumpen in Form von an der Untersuchung im Klassenverband teilnehmenden Schülerinnen und Schülern vor, die ihrerseits ein Teilkollektiv aus weiteren Klumpen, nämlich den einzelnen Gymnasien, bilden. Die Gymnasien, aus denen für das Fach Französisch fünf Teilstichproben in Form von Klumpen gezogen werden, befinden sich gleichmäßig verteilt im Landkreis Sigmaringen und im Bodenseekreis. Für das Fach Spanisch befinden sich die Gymnasien, aus denen fünf Teilstichproben in Form von Klumpen gezogen werden, im Landkreis Sigmaringen, im Bodenseekreis sowie im Stadtkreis Ulm. 66 Es handelt sich folglich insgesamt um zehn sogenannte Teilstichproben (vgl. Grum/ Legutke 2016: 79), jeweils fünf für Französisch als zweite Fremdsprache und fünf für Spanisch als dritte Fremdsprache aus zwei verschiedenen, jedoch in vielen Aspekten (z. B. Jahrgangsstufe, Schulart, Durchschnittsalter, geographisches Gebiet) ähnlichen Zielpopulationen (vgl. Kapitel 8.1). Eine Möglichkeit, die Repräsentativität der Stichproben zu erhöhen, läge beispielsweise darin, zwei verschiedene Samplingstrategien anzuwenden und nach einer zufälligen Zie‐ 8.2 Sampling-Strategien der quantitativen Untersuchung 153 hung von Klumpenstichproben jeweils aus den vorhandenen Klumpenstich‐ proben nur einen Teil der Schülerinnen und Schüler durch die Ziehung von Quotenstichproben zu selektieren (vgl. Rumlich 2012: 172). Dies ist aber auf‐ grund der Schwierigkeit, Schulen zu finden, die an einer wissenschaftlichen Erhebung freiwillig teilnehmen, in der vorliegenden Studie nicht möglich, da sich dadurch der Stichprobenumfang zu stark reduzieren würde. Ein Vorteil der Klumpenstichproben ist demzufolge, dass im Rahmen des Klassenverbands bei einer Erhebung während der Unterrichtszeit möglichst viele Schülerinnen und Schüler - unabhängig von deren fremdsprachlichen Leistung oder sozialen Herkunft - dazu animiert werden können, an der Untersuchung teilzunehmen, wodurch wiederum die Qualität und somit auch die Repräsentativität der beiden Klumpenstichproben erhöht wird. Die Qualität einer Klumpenstichprobe steigt außerdem umso mehr, je größer die Heterogenität zwischen den Elementen innerhalb der Klumpen und je größer die Homogenität zwischen den Klumpen ist (vgl. Tachtsoglou/ König 2017: 265). Um die letztendliche Qualität der Klum‐ penstichprobe besser einschätzen zu können, werden die Klumpen später bezüglich der zu untersuchenden Merkmale auf Heterogenität innerhalb der Klumpen und Homogenität zwischen den Klumpen analysiert (vgl. Kapitel 11.2). Eine Herausforderung bei der merkmalsspezifisch-repräsentativen Stichpro‐ benziehung liegt außerdem darin, die Verteilung der zu untersuchenden Merk‐ malsausprägungen - hier an erster Stelle männlich und weiblich, aber auch sprachlicher Hintergrund, sozioökonomischer Status und Lerneralter - analog zur Verteilung auf verschiedene Schichten innerhalb der Grundgesamtheit in der Stichprobe replizieren zu können. Wenn die Daten aus einer geschichteten anstatt aus einer einfachen Zufallsstichprobe stammen, kann laut Döring und Bortz (2016: 297) eine genauere Schätzung von Populationsmittelwerten statt‐ finden, da diese die Gesamtpopulation besser abbilden und somit dem Qualitäts‐ merkmal der Repräsentativität besser genügen. Eine repräsentative Stichprobe stellt also „ein exaktes Miniaturabbild der Population“ dar (Döring/ Bortz 2016: 298), dem es sich bei der Stichprobenziehung bezüglich der Schichtung mög‐ lichst stark anzunähern gilt, um die Repräsentativität zu erhöhen. 154 8 Grundgesamtheit und Sampling-Strategien der quantitativen Untersuchung Abb. 2: Poweranalyse zur Ermittlung der nötigen Stichprobengröße mit Hilfe der Soft‐ ware G*Power Neben der bestmöglichen Einhaltung der Rolle des Zufalls und der möglichst genauen Abbildung der Merkmalsschichtungen innerhalb der Stichprobe ist auch deren Größe ausschlaggebend für den Grad der Repräsentativität. Stich‐ probenumfänge sind in der empirischen quantitativen Forschung dann optimal, „wenn sie einem Signifikanztest genügend Teststärke geben, um einen getes‐ teten Effekt bei vorgegebener Effektgröße entdecken und auf einem vorgege‐ benen Signifikanzniveau absichern zu können“ (Bortz/ Döring 2006: 736). Daher wird im Vorhinein eine Berechnung der nötigen Stichprobengröße mit Hilfe der Software G*Power durchgeführt, um abschätzen zu können wie groß die Stichprobe sein muss, um eine abschließende lineare multiple Regression zu berechnen, bei der ein Regressionsmodell mit 10 Prädiktoren entstehen kann, welches bei einer α-Fehler-Wahrscheinlichkeit von .05 und einem Cohens f ² ab 8.2 Sampling-Strategien der quantitativen Untersuchung 155 .15 eine mittlere Effektstärke aufweist (vgl. Bortz/ Döring 2006: 627-628; Cohen et al. 2011: 147-148). Wie Abbildung 2 zeigt, ist eine Mindeststichprobengröße von 74 Probandinnen und Probanden für dieses Ziel erforderlich. Auch bei allen anderen statistischen Verfahren, muss stets überprüft werden, ob die Stichprobengröße ausreichend ist, um diese Verfahren anzuwenden. Bevor aber die letztendliche Stichprobe, die Durchführung der Studie und die daraus resultierenden Ergebnisse näher beschrieben werden können, erfolgt zunächst eine Darlegung und Analyse der verwendeten Untersuchungsinstru‐ mente. 156 8 Grundgesamtheit und Sampling-Strategien der quantitativen Untersuchung 9 Untersuchungsinstrumente Im Folgenden werden alle Untersuchungsinstrumente, die in der Studie ein‐ gesetzt werden, im Detail vorgestellt. Nach einer kurzen Erläuterung der kognitiven Tests d2-R (Brickenkamp et al. 2010) und SPM (Raven 2009) folgt eine Analyse und Anpassung der Sprachtests lingualevel (vgl. Lenz/ Studer 2009) für Französisch und Spanisch, wobei die drei Fertigkeiten Hörverstehen, Leseverstehen und Schreiben im Zentrum der Untersuchung stehen. Schließlich werden die Konzeption und Zielsetzung der Fragebögen für Schülerinnen und Schüler näher erläutert. 9.1 Kognitive Tests Wie im Netzwerkmodell der interaktiven Faktoren des genderbezogenen Fremdsprachenlernerfolgs deutlich wird (vgl. Kapitel 6, Abbildung 1), stellen allgemeine kognitive Faktoren eine zentrale Lernervariable dar, die mit den Fak‐ toren Geschlecht und Gender interagieren. Daher wird für die Baseline-Testung der kognitiven Grundfertigkeiten der Test d2-Revision (d2-R) von Brickenkamp et al. (2010) eingesetzt, um das Maß an Aufmerksamkeit und Konzentration der Schülerinnen und Schüler zu erfassen. Für die Überprüfung der Fähigkeiten im Bereich des schlussfolgernden Denkens werden komplementär zum d2-R die Standard Progressive Matrices (SPM) von Raven (2009) eingesetzt. Alle Tests werden in Form von Gruppentests und im Paper-Pencil-Verfahren durchgeführt. 9.1.1 D2-R Das Ziel des allgemeinen Leistungstests d2-R besteht in der Erfassung der indi‐ viduellen Aufmerksamkeits- und Konzentrationsfähigkeit, des Tempos und der Genauigkeit des Arbeitsverhaltens bei der Unterscheidung ähnlicher visueller Reize, das heißt der Detail-Diskrimination (vgl. Brickenkamp et al. 2010: 10). Die Bedingungen für die Bezeichnung als Konzentrationstest werden nach Westhoff und Hagemeister (2005) wie folgt definiert: Die Leistung eines hirnorganisch gesunden Probanden erzielt durch (mündliche oder manuelle) Reaktion auf mehr oder weniger einfache (Bilder alltäglicher Gegenstände oder abstrakte Zeichen; Zahlen, Buchstaben oder andere) Reize, die er klar und ein‐ deutig wahrnehmen kann und auf die er eine einfach zu erinnernde Regel anzuwenden hat, indem er absichtsvoll Teilhandlungen so schnell wie möglich bei (sehr niedriger bis sehr hoher) Geübtheit in der Ausführung dieses Tests korrekt koordiniert, kann abgebildet werden in die (sehr niedrige bis sehr hohe) Geschwindigkeit konzentrierten Handelns und in dem (sehr niedrigen bis sehr hohen) Anteil an Konzentrationsfehlern. (Westhoff/ Hagemeister 2005: 39) Die hier beschriebenen Kriterien werden in ihrer Gänze durch den Test d2-R erfüllt, wobei die Teilleistungen aus dem Fokussieren eines Zeichens, dessen Prüfung auf Einhaltung einer Regel und bei positivem Prüfergebnis auch aus dem Durchstreichen als motorischer Reaktion bestehen (vgl. Brickenkamp et al. 2010: 10). Ein designierter Einsatzbereich des d2-R-Tests ist die pädagogische Psychologie (vgl. Brickenkamp et al. 2010: 27), weshalb er für die Testung von Schülerinnen und Schülern im institutionellen Kontext geeignet ist. Weiterhin spricht für den Einsatz des Tests in der 9. Jahrgangsstufe des Gymnasiums in Baden-Württemberg die Tatsache, dass altersspezifische Norm‐ werte aus einer Studie in den Jahren 2007/ 2008 mit einer Stichprobe von über 4 000 Personen für den Altersbereich von 9 bis 60 Jahren vorliegen (vgl. Brickenkamp et al. 2010: 68). Schließlich liegt ein weiterer Vorteil darin, dass der d2-R als Gruppentest durchgeführt werden kann, was den Anforderungen entgegenkommt, in möglichst wenig Schulzeit eine möglichst umfassende Testung durchzuführen. Bei der Bearbeitung des d2-R erhalten die Probandinnen und Probanden die Selektionsaufgabe in einer Zeit von 20 Sekunden pro Zeile so viele Zielobjekte wie möglich durchzustreichen, wobei es sich um die Zeichen handelt, die aus einem „d“, das von exakt zwei Strichen umgeben ist, bestehen. Dies bedeutet, dass jeder Proband und jede Probandin innerhalb der 20 Sekunden durch die Bearbeitung im eigenen maximalen Tempo unterschiedlich viele Zielobjekte durchstreicht. Die Probandinnen und Probanden müssen die Zielobjekte so schnell wie möglich von Distraktoren, also anderen Objekten, beispielsweise Zeichen bestehend aus einem „d“, das von einem, drei oder vier Strichen umgeben ist, oder Zeichen bestehend aus einem „p“, das von einem bis vier Strichen umgeben ist, unterscheiden. Es geht demnach um das Suchen und möglichst schnelle Unterscheiden ähnlicher Zeichen bzw. Objekte (vgl. Bricken‐ kamp et al. 2010: 9-10). Insgesamt sind im Konzentrationstest im Papier- und Bleistift-Format 14 Zeilen zu bearbeiten, die aus vier identischen Blöcken von jeweils drei Zeilen bestehen. Für jede Zeile haben die Probandinnen und Pro‐ banden exakt 20 Sekunden Zeit, wodurch die Gesamtbearbeitungszeit inklusive Instruktionen ca. fünf bis sieben Minuten beträgt. Die Konzentrationsfähigkeit zeigt sich also darin, wie schnell und wie genau große Mengen an einfachen Dis‐ kriminierungsaufgaben fortlaufend bearbeitet werden können, d. h. wie hoch 158 9 Untersuchungsinstrumente 67 Folgt man dem Modell von Ackermann et al. (2002), erfasst der Test d2-R nur einen Teil der Wahrnehmungsgeschwindigkeit: Diese besteht laut Ackermann et al. (2002) aus perceptual speed pattern recognition, processing speed memory und processing speed complex. Nur erstere wird durch den Test d2-R erfasst (vgl. Brickenkamp et al. 2010: 12) und laut Ackermann et al. (2002) korreliert diese Teilfertigkeit niedrig mit allgemeiner Intelligenz (r = .16). 68 Brickenkamp et al. (2010: 12) beziehen sich dabei auf den Berliner Intelligenz‐ struktur-Test von Jäger et al. (1997), demzufolge eine der vier Intelligenz beschreibenden Denkoperationen die Bearbeitungsgeschwindigkeit darstellt, die als „Arbeitstempo, Auffassungsleichtigkeit und Konzentrationskraft beim Lösen einfach strukturierter Aufgaben von geringem Schwierigkeitsniveau“ ( Jäger et al. 1997: 6) definiert wird. 69 Zur Definition von BZO, KL, F%, AF, VF vgl. Kapitel 9.1.1. 70 Die Korrelationsrechnungen wurden von Brickenkamp et al. (2010: 11) zwischen den Ergebnissen des d2-R und des I-S-T 2000 R von Amthauer et al. (2001) vorgenommen. Wahrnehmungsgeschwindigkeit 67 , figurale Bearbeitungsgeschwindigkeit 68 und Aufmerksamkeit bei den Probandinnen und Probanden sind. Die Schnelligkeit von Denkprozessen (mental speed) wird dabei als ein außerhalb der Intelligenz liegendes Konstrukt, das allerdings die Intelligenz wiederum klar bedingt, verstanden (vgl. Schweizer 2005: 45). Cronbachs α liegt beim d2-R-Test je nach Altersgruppe zwischen .89 und .95; die Reliabilitätswerte für die Gruppe der 15-16-Jährigen stellen .88 für die Zahl der bearbeiteten Zielobjekte (BZO), .89 für die Konzentrationsleistung (KL), .88 für die Genauigkeit der Bearbeitung (F%) und .90 für Auslassungssowie .57 für Verwechslungsfehler dar. 69 Die Retest-Reliabilität nach einem Tag bzw. zehn Tagen liegt bezüglich der Konzentrationsleistung (KL) insgesamt bei .94 bzw. .85 (vgl. Brickenkamp et al. 2010: 45-46). Während die Validität der Erfassung der Konzentrationsfähigkeit ausgesprochen hoch ist, kann nur eine schwache Korrelation mit allgemeiner Intelligenz und Reaktionsschnelligkeit festgestellt werden (vgl. Brickenkamp et al. 2010: 68). Da folglich kein statisti‐ scher Zusammenhang der Aufmerksamkeits- und Konzentrationsleistung mit dem schlussfolgernden Denken nachweisbar ist (vgl. Brickenkamp et al. 2010: 14; Krumm et al. 2008), wird für die vorliegende Studie zusätzlich der Test SPM verwendet, der im nachfolgenden Kapitel erläutert werden soll. 70 9.1.2 SPM Die Erstpublikation des Standard Progressive Matrices-Test (SPM) von Raven (2009) erfolgte im Jahr 1938 und in den letzten 50 Jahren wurde das zugrunde liegende Aufgabenformat kaum verändert, jedoch wurden die Messbereiche leicht angepasst (vgl. Heller et al. 2010: 7-8). Der SPM-Test besteht aus fünf Aufgabensets A bis E, welche jeweils zwölf Einzelaufgaben zur Mustererken‐ 9.1 Kognitive Tests 159 71 Der g-Faktor (general intelligence) bezeichnet in der psychologischen Intelligenzfor‐ schung einen allgemeinen Intelligenzfaktor, „der den spezifischen geistigen Fähigkeiten eines Menschen zugrunde liegt und daher durch jede Aufgabe in einem Intelligenztest gemessen wird“ (Myers 2014: 401). Die Intelligenztheorie von Spearman geht davon aus, dass es eine allgemeine Intelligenz gibt und daneben zusätzliche spezifische Begabungsfaktoren (s-Faktoren), die die Leistungen in einzelnen Aufgabenbereichen neben dem g-Faktor bestimmen (vgl. Spearman 1923, 1927, 1938). 72 Theoretisch ist der SPM ab dem Alter von sechs Jahren einsetzbar. Gleichzeitig merken Heller et al. (2010: 7) an, dass „Grundschüler der Klassen 1-3 […] jedoch in der Regel kaum in der Lage [sind], Aufgaben der Skala E zu lösen“. Raven et al. (1996) wiederum gehen davon aus, dass Kinder zwischen dem 8. und dem 11. Lebensjahr aufgrund ihrer kognitiven Entwicklung nur zum Lösen der Aufgabensets A und B imstande sind. Auch wenn diese pauschalisierende Aussage von Entwicklungspsychologen stark diskutiert wurde (vgl. z. B. Baltes et al. 2006; Weinert/ Helmke 1997b), werden daher meist bis zum Ende der dritten Klasse, also bis zum Alter von 10-11 Jahren die Coloured Progressive Matrices (CPM) (Raven et al. 2001) eingesetzt. nung enthalten: Jede Aufgabe beinhaltet ein Muster aus Strichzeichnungen oder Figuren mit einer Auslassung, die vom Testteilnehmenden ausgefüllt werden muss, indem er oder sie das Prinzip, nachdem das Muster aufgebaut ist, erkennt und entsprechend aus mehreren Antwortvorschlägen das passende Teilmuster auswählt. Die Aufgaben charakterisieren sich außerdem dadurch, dass sie pro Set zunächst bei einem leichten Niveau beginnen und der Schwierigkeitsgrad dann immer mehr ansteigt (vgl. Heller et al. 2010: 7). Es lassen sich hierbei perzeptuelle Aufgaben (Set A und B) und logisch-konzeptuelle Aufgaben (Set C bis E) unterscheiden, wobei letztere „neben der Wahrnehmungsleistung abstraktes, analogisierendes und induktives Denken erfordern“ (Heller et al. 2010: 8). Erfassungsgegenstand ist die „allgemeine Intelligenz“ (g-Faktor) nach Spearman (1923, 1927, 1938). 71 Die erreichte Gesamtpunktzahl wird als Indikator für allgemeine Intelligenz betrachtet, deren Grundkomponente die Geschwin‐ digkeit der Informationsverarbeitung ist (vgl. Heller et al. 2010: 20). Beim SPM-Test werden neben der Geschwindigkeit der Informationsverarbeitung weitere Komponenten der allgemeinen Intelligenz abgeprüft, insbesondere in‐ duktives Denken, räumliche Wahrnehmungsdifferenzierung sowie räumliches Vorstellen und Denken (space factors). Darüber hinaus werden auch Unterschei‐ dungsgenauigkeit (accuracy of discrimination), Analogieschlussdenken, Regel‐ erkennen und Prinzipienanwendung für die Lösung der SPM-Testaufgaben verlangt (vgl. Heller et al. 2010: 7). Die Anwendungsbreite dieses Tests ist sehr groß: Bei vielen Altersgruppen 72 können verschiedene Grade kognitiver Fähigkeiten erfasst werden und dies unabhängig von kultureller Prägung oder Erstsprache (L1). Ob das Messergebnis allerdings tatsächlich ganz unabhängig von den Wertesystemen der jeweiligen 160 9 Untersuchungsinstrumente 73 Eductive ability meint, Bedeutung aus Verwirrung zu generieren, neue Einsichten zu entwickeln und über das Wahrgenommene hinauszugehen um das wahrzunehmen, was nicht direkt offensichtlich ist, indem non-verbale Konstrukte, die das Lösen von komplexen Problemen erleichtern, geformt und mehrere voneinander abhängige Variablen involviert werden (vgl. Raven et al. 1995: G3). Lernumwelt und von sozioökonomischen Einflussfaktoren interpretiert werden kann, ist bisher noch nicht umfassend erforscht (vgl. Heller et al. 2010: 7, 12; Raven et al. 1995). Daher muss im Fall der vorliegenden Studie - trotz einer proklamierten Unabhängigkeit von kultureller Prägung oder Erstsprache (L1) - dringend auf die deutschen Normtabellen Bezug genommen werden. Die Reliabilität des SPM-Tests erreicht in unterschiedlichen kulturellen, eth‐ nischen und sozialen Testgruppen dennoch einen relativ hohen Wert (vgl. z. B. Owen 1992; Sacuzzo/ Johnson 1995): Für die Jahrgangsstufe 9 des Gymna‐ siums wurde beispielsweise in der Normierungsstichprobe mit Schülerinnen und Schülern aus Bayern und Nordrhein-Westfalen der Splithalf-Koeffizient nach Sperman-Brown von .72 und Cronbachs α von .70 erfasst (vgl. Heller et al. 2010: 15). Bezüglich der Retest-Reliabilität wurde ein Wert von .90 in der Normierungsstichprobe erreicht (vgl. Heller et al. 2010: 16). Objektivität kann durch die vorhandenen genauen Anweisungen für die Testdurchführung sowie für die Testauswertung mittels Durchschreibeverfahren sowie durch die verfügbare differenzierte Anleitung zur Interpretation der Testergebnisse gewährleistet werden (vgl. Heller et al. 2010: 14). Inhaltsvalidität ist im Falle des SPM-Tests wegen des zugrundeliegenden Konstrukts der eductive ability, die den Faktor g im Sinne Spearmans konstituiert und somit non-verbaler Art ist 73 , nur schwer nachweisbar (vgl. Heller et al. 2010: 17). In mehreren Untersu‐ chungen der Kriteriumsvalidität ergaben sich signifikante Korrelationen mit anderen Tests zur allgemeinen Intelligenz (vgl. z. B. Zhang/ Wang 1989 für den WISC-R) und zur Informationsverarbeitungsgeschwindigkeit (vgl. z. B. Heller et al 2010: 19; Oswald/ Roth 1978). Eine externe Validierung fand über Schul‐ leistungsmaße statt, wobei mittlere signifikante Zusammenhänge zwischen Schulleistungsmaßen und SPM-Ergebnissen gefunden wurden, vorausgesetzt die Daten wurden zeitgleich erhoben. Die stärksten Zusammenhänge bestanden zwischen den SPM-Ergebnissen und den Mathematiknoten (vgl. Raven et al. 1996), wobei die letzte Erfassung dieser Korrelation im Jahr 1996 stattfand und die Frage offenbleibt, inwiefern dies immer noch gemessen werden kann. Schließlich wurden auch Zusammenhänge zwischen SPM-Ergebnissen und dem Attributionsstil, gemessen durch den Attribuierungsfragebogen für Erfolg und Misserfolg in der Schule (AEM5-7) von Widdel (1977), nachgewiesen, insbeson‐ 9.1 Kognitive Tests 161 74 Zu Möglichkeiten und Schwierigkeiten bei der Vergleichbarkeit der Leistungen im Französischen und im Spanischen, vgl. Kapitel 11.2.3. dere in den Bereichen Attribution bei Misserfolg auf fehlende Begabung (vgl. Heller et al. 2010: 20). Bei der Testdurchführung ist das Arbeitstempo individuell frei wählbar (vgl. Heller et al. 2010: 7). Jedoch ist eine Obergrenze von höchstens 45 Minuten zu setzen. Schließlich ist bezüglich der Referenz der Normwerte zu beachten, dass seit der Ersterscheinung des SPM-Tests ein kontinuierlicher Anstieg der Ergebniswerte - analog zu anderen vergleichbaren Tests - verzeichnet werden kann (vgl. Heller et al. 2010: 8; Raven et al. 1995, 1996). Um eine möglichst un‐ verfälschte Interpretation zu gewährleisten, werden die aktuellsten Normwerte als Vergleichsbasis für die in dieser Studie erzielten Ergebnisse dienen. 9.2 Sprachtests Eines der Forschungsziele der vorliegenden Studie ist es, das fremdsprachliche Kompetenzniveau in den Fertigkeiten Hören, Lesen und Schreiben der weib‐ lichen und der männlichen Französischlernenden sowie der weiblichen und männlichen Spanischlernenden zu ermitteln. Der Testzweck liegt demgemäß darin, eine punktuelle Kompetenzmessung vorzunehmen, um anschließend die Ergebnisse der Jungen und der Mädchen sowie - insofern dies möglich ist 74 - deren Leistungen in den beiden Sprachen jeweils gegenüberzustellen und zu vergleichen (vgl. Forschungsfrage 1, Kapitel 1). Es wird angestrebt, im Spektrum zwischen Small-Scale und Large-Scale-Stu‐ dien nach Möglichkeit einen Large-Scale-Testeinsatz zu erreichen (vgl. Harsch 2012: 154). Large-Scale Assessments bezeichnen Reihenuntersuchungen, die im Idealfall alle Personen einer definierten Population umfassen. Idealziel der empirischen Untersuchung ist es, den aktuellen Zustand bezüglich des Verfügens über die sprachlichen Fertigkeiten Hören, Lesen und Schreiben innerhalb des Gesamtbilds der Population zu erfassen und dieses eventuell mit anderen Populationen zu vergleichen, wobei im Fall der vorliegenden Studie die erste Population aus den Französischlernenden der neunten Jahrgangsstufe des Gymnasiums im Regierungspräsidium Tübingen und die zweite Population aus den Spanischlernenden der neunten Jahrgangsstufe des Gymnasiums im Regierungspräsidium Tübingen in Baden-Württemberg besteht. Aus beiden Po‐ pulationen wird in der vorliegenden Untersuchung jeweils eine weitestgehend zufällige und weitestgehend repräsentative Klumpenstichprobe gezogen (vgl. 162 9 Untersuchungsinstrumente 75 Inwieweit die in der vorliegenden Studie gezogenen Stichproben repräsentativ sind und inwiefern die Ergebnisse generalisierbar sein können, wird ausführlich in den Kapiteln 11.2.1 und 11.2.2 behandelt. 76 Die DELF- und DALF-Diplome werden durch das Centre international d’études péda‐ gogiques (CIEP) konzipiert und validiert sowie durch das französische Ministère de l’Education Nationale offiziell ausgestellt. Die Konzeption wird durch Experten in der Testerstellung und Konzipierung von validen Korrekturrastern geleistet und die Prüfungen sind nur durch vom CIEP geprüfte Testleitende im Rahmen von DELF-/ DALF-Prüfungen zugänglich. Ausführendes Organ der Prüfungen und Testleitenden‐ Kapitel 8). Einzelleistungen sind bei einem Large-Scale Assessment nicht von Relevanz. Die weiteren Anforderungen an ein Large-Scale Assessment werden von Harsch (2016: 207) wie folgt definiert: Large-Scale Assessments setzen formale, standardisierte Sprachtests ein, operationalisieren ein theoretisches Konstrukt und genügen den Gütekriterien Reliabilität, Validität und Objektivität. Des Weiteren sind sie formal erprobt und pilotiert und führen idealerweise zu generalisierbaren Ergebnissen bei repräsentativen Stichproben. 75 In den letzten Jahrzehnten wurde die Schullandschaft mit einigen groß angelegten externen Large-Scale-Sprachtests konfrontiert, darunter die PISA-Studien für die Lese‐ kompetenz (vgl. OECD 2014a, 2016, 2019), die DESI-Studie für die Deutsch- und Englischleistungen (vgl. Beck/ Klieme 2007; DESI-Konsortium 2006; Klieme 2008; Schröder et al. 2006) und die Ländervergleichsstudien bzw. IQB-Bildungs‐ trends zur Evaluation des Erreichens der Bildungsstandards unter anderem in Englisch und Französisch (vgl. Harsch et al. 2010; Köller et al. 2011; Rupp et al. 2008; Stanat et al. 2016; vgl. Kapitel 4). Neben diesen Bildungsmonitorings gibt es eine zunehmende Vielfalt an standardisierten Tests, die zur Erlangung von Fremdsprachenzertifikaten eingesetzt werden, welche sich an den Niveau‐ stufen des GeR (Europarat 2001) orientieren - für Französisch in erster Linie das DELF-Zertifikat für die Bescheinigung der Niveaustufen A1 bis B2 für verschiedene Altersklassen und Anwendungsbereiche (DELF prim, DELF junior/ DELF scolaire, DELF pro, DELF tout public) sowie das DALF-Zertifikat für die Niveaustufen C1 und C2. Für Spanisch wiederum kann das DELE-Zertifikat für alle Niveaustufen A1 bis C2 von Lernenden abgelegt werden. Diese Sprachtests „benutzen am GeR kalibrierte und validierte Items, so dass hier eine Ähnlichkeit zu landesweiten Fremdsprachen-Assessments erkennbar ist“ (Tesch 2010: 69). In diesen Testformaten werden stets die Fertigkeiten Hören, Lesen, Schreiben und Sprechen im Sinne der Kompetenzorientierung abgeprüft. Allerdings handelt es sich bei den Fremdsprachenzertifikaten um freiwillige, kostenpflichtige Prüfungen, die nicht im Zusammenhang mit nationalen Bildungsmonitorings stehen und deren Lizenzen für Forschende nicht zu erwerben sind. 76 Während 9.2 Sprachtests 163 ausbildungen ist das Deutsch-Französische Institut (DFI) (vgl. CIEP 2015). Das spanische Sprachzertifikat DELE wird ebenfalls vom Ministerio de Educación, Cultura y Deporte de España verliehen. Für die Erstellung der standardisierten Prüfungen und Korrektur‐ raster ist allerdings ein Expertenteam der Universidad de Salamanca und keine separate, dem Ministerium zugeordnete Testinstitution, zuständig. Ausführendes Organ, das die Prüfungen und Testleiterausbildungen durchführt, ist das Instituto Cervantes (vgl. Instituto Cervantes 2016). Die Lizenzen für beide Sprachzertifikate bleiben beim CIEP und bei der Universität Salamanca und können nicht von Außenstehenden erworben werden. sich die vorgestellten Fremdsprachenzertifikate direkt am GeR (Europarat 2001) orientieren, wird innerhalb der nationalen Bildungsmonitorings darüber hinaus ein am GeR orientiertes Kompetenzmodell zugrunde gelegt, was bedeutet, dass auf theoretischer Ebene eine Zwischenstufe zwischen dem GeR und dem Test hinzugefügt wird. In Deutschland und auch in der Schweiz legen die Bildungsstandards nationale Kompetenzmodelle fest und normieren diese, um abschließend in einem Standard-Setting zu bestimmen, an welchem Zeitpunkt der Schullaufbahn die Schwellen zwischen den Niveaustufen des GeR liegen (vgl. Tesch 2010: 70). Der Unterschied zwischen zertifikatsbasierten Testungen und standardba‐ sierten Assessments, wie sie beispielsweise durch Bildungsmonitorings im Rahmen des Ländervergleichs bzw. des IQB-Bildungstrends (vgl. z. B. Köller et al. 2011; Stanat et al. 2016) durchgeführt werden, lässt sich also folgendermaßen beschreiben: Standardbasiertes Assessment unterscheidet sich […] weder durch den grundsätzli‐ chen Bezug zum GER noch etwa durch die verwendeten Aufgabenformate von zertifikatsbasierten Testungen, sondern durch das empirisch, fachdidaktisch und vor allem politisch abgesicherte Kompetenzmodell. (Tesch 2010: 70) In Deutschland werden folglich die Ländervergleichsstudien bzw. IQB-Bil‐ dungstrends entsprechend dem Ziel konzipiert, das Erreichen der in den Bildungsstandards für die erste Fremdsprache (Englisch/ Französisch) für den Mittleren Schulabschluss (KMK 2004) festgelegten Kompetenzen und somit im Allgemeinen das GeR-Niveau B1 zu überprüfen. Diese Ländervergleichsstudien messen allerdings bisher im Fach Französisch ausschließlich die rezeptiven Fertigkeiten Lesen und Hören (vgl. Köller et al. 2011: 18). Zudem werden für das Fach Spanisch derzeit noch keine Ländervergleichsstudien durchgeführt, was auch darin begründet liegen mag, dass für Deutschland bisher im fremdsprach‐ lichen Bereich ausschließlich Bildungsstandards für die erste Fremdsprache Englisch bzw. Französisch (vgl. KMK 2004) sowie für die fortgeführte Fremd‐ sprache Englisch bzw. Französisch (vgl. KMK 2012) vorliegen und die Abfassung 164 9 Untersuchungsinstrumente 77 Die Bildungslandschaft gestaltet sich in Deutschland sehr unterschiedlich: Zwölf der sechzehn Bundesländer bieten an den öffentlichen Schulen neben Französisch und Latein auch Spanisch als zweite Fremdsprache an. Nur vier Bundesländer bieten Spanisch erst als dritte oder spätbeginnende Fremdsprache an: Bayern, Baden-Würt‐ temberg, Saarland und Rheinland-Pfalz (vgl. Landeshauptstadt Mainz 2019). Auch dieses Ungleichgewicht könnte der Grund dafür sein, dass für Spanisch bisher noch keine nationalen Bildungsstandards vorliegen. 78 Für die Entwicklung der Testaufgaben im Zuge des IEF-Projekts, die durch den schulverlag unter dem Namen lingualevel publiziert wurden, werden beispielsweise im Abschlussbericht 606 100.00 CHF plus 11 838.95 CHF, die im Nachhinein zusätzlich beantragt werden mussten, deklariert. Somit lagen die Gesamtkosten bei umgerechnet circa 568-169.18 € (vgl. Lenz et al. 2006: 16). von Bildungsstandards für die dritte Fremdsprache Spanisch bis heute aussteht (vgl. Koch 2018: 36). 77 Da die eigenständige Entwicklung qualitativ hochwertiger standardisierter Testaufgaben, deren Qualität mit derjenigen von Aufgaben in den Länderver‐ gleichsstudien oder der DESI-Studie vergleichbar ist, sehr aufwändig, lang‐ wierig, äußert komplex und zudem ausgesprochen kostspielig 78 ist sowie selten zu erhöhter Qualität führt (vgl. Harsch 2012: 160), sind zunächst bereits vorhan‐ dene Tests auf deren Eignung zu prüfen. Dies schließt allerdings nicht aus, dass auch bereits vorhandene Tests auf bestimmte Probandinnen und Probandenen oder sogar auf die konkreten Forschungsfragen angepasst werden können bzw. müssen, vorausgesetzt dies geschieht in einem wissenschaftlich fundierten Rahmen (vgl. Harsch 2012: 160; Rumlich 2012: 174). Aus diesen Gründen stellt sich die Frage, ob andere Testformate ebenfalls geeignet sein könnten, um - ähnlich wie bei der DESI-Studie (vgl. Beck/ Klieme 2007; Klieme 2008; Schröder et al. 2006) nicht nur rezeptive, sondern auch produktive Fertigkeiten abzuprüfen. Des Weiteren muss geprüft werden, ob Tests vorhanden sind, die eine Einstufung in die Niveaus des GeR vornehmen und ob deren ursprünglicher Testzweck in Einklang zu bringen ist mit dem Ziel der vorliegenden Forschungsarbeit (vgl. Harsch 2012: 161). Tesch (2010) hebt vor dem Hintergrund dieser Kriterien das Evaluations‐ instrument lingualevel als besonders geeignet hervor. Dieses Testinstrument wurde in Anknüpfung an die schweizerischen Bildungsstandards für die Fremd‐ sprachen von der Schweizerischen Konferenz der kantonalen Erziehungsdirek‐ toren (EDK 2009) sowie auf Basis des Gemeinsamen europäischen Referenzrah‐ mens (GeR; Europarat 2001) im Zuge der Interkantonalen Vereinbarung über die Harmonisierung der obligatorischen Schule (HarmoS) entwickelt und baut auf den fundierten wissenschaftlichen Arbeiten des Konsortiums Fremdsprachen der Universität Freiburg auf (vgl. Konsortium HarmoS Fremdsprachen 2009). 79 9.2 Sprachtests 165 79 Übergeordnetes Ziel des Projekts IEF war eine Verbesserung der Qualität und der Effizienz des Fremdsprachenunterrichts sowie eine Verbesserung der Qualität, Kohä‐ renz und Transparenz der Beurteilungsmaßnahmen im Fremdsprachenunterricht (vgl. Lenz/ Studer 2001a: 7 (unveröffentlicht), zit. nach Lenz et al. 2006: 2). 80 Weinert (2001: 27-28) versteht Kompetenzen als „die bei Individuen verfügbaren oder durch sie erlernbaren kognitiven Fähigkeiten und Fertigkeiten, um bestimmte Probleme zu lösen, sowie die damit verbundenen motivationalen, volitionalen und sozialen Bereitschaften und Fähigkeiten, um die Problemlösungen in variablen Situationen erfolgreich und verantwortungsvoll nutzen zu können“. 81 Diese Bezeichnung tritt beim Konsortium HarmoS Fremdsprachen (2009: 3) in Zusam‐ menhang mit der Projektleitung des Lern- und Forschungszentrums Fremdsprachen der Universität Freiburg (LeFoZeF) auf. Die Projektleitung hatten namentlich Günther Schneider, Peter Lenz und Thomas Studer inne. Es handelt sich hierbei um ein exakt aufeinander abgestimmtes Konstruktge‐ füge: Die Erziehungsdirektorenkonferenz als Auftraggeber erwartet zudem, dass sich die HarmoS-Standards explizit auf den [Gemeinsamen europäischen] Referenzrahmen und im Rahmen von IEF/ lingualevel (Lenz/ Studer 2007) geschaffenen zielgruppenspezifi‐ schen Differenzierungen (Altersgruppe der 11-16-Jährigen) und Ergänzungen bezieht. (Konsortium HarmoS Fremdsprachen 2009: 5) Die schweizerischen Bildungsstandards für die Fremdsprachen weisen laut Tesch (2010: 71) Ähnlichkeiten mit den bundesdeutschen Bildungsstandards für die Erste Fremdsprache (Englisch/ Französisch) der KMK (2004) auf, da zum einen der Kompetenzbegriff ebenfalls auf der Definition Weinerts (2001: 27-28) 80 beruht und die horizontale und vertikale Dimensionierung des Kompetenzmo‐ dells der schweizerischen Bildungsstandards für die Fremdsprachen explizit dem GeR entspricht (vgl. HarmoS Konsortium Fremdsprachen 2009: 4-5). Die Verknüpfung dieser beiden Kompetenzmodelle ist auch deshalb sehr eng, weil das Leading House 81 , das für die Entwicklung der HarmoS-Standards zuständig war, sich seinerzeit auch an der Entwicklung der Kompetenzbeschreibungen des GeR aktiv beteiligte (vgl. HarmoS Konsortium Fremdsprachen 2009: 5), sodass beste Voraussetzungen für ein möglichst hohes Maß an Konformität gegeben sind. In einer ersten Zusammenfassung betrachtet, bietet das Testinstrument lingualevel die Vorteile, dass es die Einordnung fremdsprachlicher Leistungen in die Niveaustufen des GeR zulässt. Außerdem basiert dessen allgemeiner Kom‐ petenzbegriff genauso auf dem GeR wie dessen Konstrukt der Sprachkompetenz, die in Gleichklang mit dem GeR als Sprachverwendungskompetenz verstanden wird, also als „Fähigkeit […], unter Einbezug von Sprache zu handeln und dabei Aufgaben unterschiedlicher Art zu bearbeiten bzw. zu lösen“ (HarmoS Konsortium Fremdsprachen 2009: 5). 82 Da das Testinstrument lingualevel als 166 9 Untersuchungsinstrumente 82 Im Bericht des Konsortiums HarmoS Fremdsprachen (2009: 7-9) findet sich daher auch eine präzise Zusammenfassung der im GeR beschriebenen kommunikativen Sprachaktivitäten, die in den vier verschiedenen sprachlichen Handlungsmodi Rezep‐ tion, Interaktion, Produktion und Sprachmittlung stattfinden können, sowie der im GeR verankerten Allgemeinen und Kommunikativen Kompetenzen (vgl. Europarat 2001, Kapitel 4 und 5). Auf diesen Konstrukten basiert ebenfalls das Testinstrument lingualevel. 83 Summative Tests fokussieren sich auf das Können zu einem bestimmten Zeitpunkt während formative Tests den Lernprozess stärker in den Blick nehmen und zum Ziel der Lernförderung und -entwicklung eingesetzt werden (vgl. Harsch 2016). Produkt aus dem IEF-Projekt (vgl. Lenz et al. 2006: 3) die kommunikativen Fertigkeiten Lesen, Hören und Schreiben im Französischen streng am GeR orientiert misst (vgl. Studer et al. 2004: 422), entspricht der Testgegenstand dem Forschungsziel der vorliegenden Arbeit. Allerdings ist das Testinstrument nur für das Englische und Französische, nicht aber für das Spanische vorhanden, weshalb bei der Auswahl dieses Instruments eine entsprechend exakte Anpas‐ sung der jeweiligen Testaufgaben an das Spanische in einem zweiten Schritt erfolgen muss (vgl. Kapitel 9.2.1.2, 9.2.2.2 und 9.2.3.2). Zunächst einmal geht es aber darum, den Sprachtest für das Französische von lingualevel einer wissenschaftlichen Analyse zu unterziehen, um dessen konkrete Eignung für das Forschungsziel genauer zu überprüfen. Für diese Analyse des aus den oben genannten Gründen sehr geeignet erscheinenden Sprachtests lingualevel wird insbesondere auf die „Checkliste zur Auswahl und Evaluation von Testinstrumenten für Forschungszwecke“ von Harsch (2012: 161-162, 2016: 205-218) sowie auf die Richtlinien zur Qualitätssicherung bei der Bewertung von Sprachkompetenzen der European Association of Language Testing and Assessment (EALTA 2006) Bezug genommen. Dabei erfolgt zunächst eine Evaluation bezüglich des Testzwecks und der Spezifikation: Das erste übergreifende Kriterium für ein Large-Scale Assessment legt den Einsatz eines formalen und standardisierten Sprachtests nahe, der dem Ziel der punktuellen Kompetenzmessung dient (vgl. Harsch 2016: 205). Ein solcher summativer Kompetenztest 83 muss zum Zwecke der nachfolgenden Studie das Niveau in den handlungsbezogenen Sprachkompetenzen Lesen, Hören und Schreiben erfassen, darf nicht streng curricular orientiert sein und muss infol‐ gedessen unabhängig vom spezifischen Lehr-/ Lernkontext einsetzbar sein (vgl. Harsch 2016: 206-207). Ein standardisierter Kompetenztest lässt sich wie bereits erörtert vor allem dann gut interpretieren und mit anderen Testergebnissen aus anderen Studien in Beziehung setzen, wenn er eine klar definierte kriterie‐ norientierte Bezugsnorm aufweist, die eine Einordnung in die Niveaustufen des GeR (Europarat 2001) erlaubt. Da davon ausgegangen wird, dass sich das 9.2 Sprachtests 167 84 Selbstverständlich müssen bei der Anpassung des Tests auf das Spanische insbesondere sprachliche und kulturelle Aspekte sorgfältig berücksichtigt werden (vgl. Kapitel 9.2.1.2, 9.2.2.2 und 9.2.3.2). 85 Auch Aufgaben zum Sprechen sind im Testset in gleicher Form und Funktion vor‐ handen. Da aber angestrebt wird, ein möglichst großes Sample von insgesamt ca. 200 Schülerinnen und Schülern (vgl. Kapitel 8.2) zu untersuchen, kann unter anderem aus Gründen der Praktikabilität die Fertigkeit Sprechen nicht abgeprüft werden. 86 Da es sich bei den Fertigkeiten Hören, Lesen und Schreiben jeweils um äußerst kom‐ plexe Konstrukte handelt, die allesamt Teil kommunikativer Interaktionen darstellen, muss die Frage gestellt werden, inwiefern sich diese Kompetenzbereiche statistisch als empirische Dimensionen unterscheiden lassen. Wäre dies der Fall, bestünde nicht Kompetenzniveau in den 9. Klassen auf einem relativ breiten Spektrum und in den beiden Fremdsprachen Französisch und Spanisch voraussichtlich auch auf unterschiedlichen Niveauspektren des GeR bewegt (vgl. z. B. Köller et al. 2010), kann der Einstufungstest lingualevel, der ein gewisses Niveauspektrum misst und eine Einordnung jedes einzelnen Lernenden in die Niveaustufen des GeR vornimmt, das jeweilige Gesamtleistungsspektrum der Mädchen und Jungen der Stichprobe sehr gut erfassen. Bei lingualevel handelt es sich darüber hinaus - wie im Kriterienkatalog von Harsch (2016: 207) gefordert - um einen lehrwerk- und lehrplanunabhängigen Kompetenztest (proficiency test) (vgl. Harsch 2012: 155), der sowohl formativ als auch summativ eingesetzt werden kann (vgl. Lenz et al. 2004: 421, Lenz/ Studer 2008: 365). Da für die vorliegende Querschnittstudie ein summativer Testeinsatz nötig ist, können nicht einzelne aus den 80 zur formativen Evaluation angelegten Testaufgaben subjektiv ausgewählt werden; vielmehr müssen die von lingualevel summativ angelegten sogenannten „Standortbestimmungen“, in denen Aufgabenabfolgen und -kombinationen von Lenz und Studer (2008) exakt festgelegt sind, gezielt eingesetzt werden. Durch die Möglichkeit des summativen Einsatzes ist lin‐ gualevel folglich dafür geeignet, längere Lernphasen des Französischen als Fremdsprache zu bilanzieren, was sich voraussichtlich gut auf das Spanische als Fremdsprache übertragen lässt, auch weil die Tests lehrbuchübergreifend bzw. -unabhängig angelegt sowie die Arbeitsanweisungen auf Deutsch gehalten sind (vgl. Lenz/ Studer 2004: 22; Studer/ Wiedenkeller 2009: 2). 84 Die Mustersätze der Standortbestimmungen wurden im Rahmen des IEF-Projekts explizit für diesen summativen Testzweck zusammengestellt, erprobt sowie mit aussagekräftigen Beurteilungskriterien versehen (vgl. Lenz et al. 2004). Die Beurteilungskriterien in Form von Kompetenzbeschreibungen sind außerdem in ihrer Gesamtheit für den Testleitenden einsehbar. Somit sind die zu untersuchenden Konstrukte Hören, Lesen und Schreiben 85 auf den jeweiligen Niveaustufen (A1-B2) in ihrer genauen Definition und Beschreibung dem Testleitenden zugänglich. 86 Die 168 9 Untersuchungsinstrumente zwangsläufig eine Korrelation zwischen den Leistungen in diesen Fertigkeiten. Hierbei muss demnach hinterfragt werden, ob jemand, der eine hohe Kompetenz im Lesen hat, in der Regel nicht auch eine sehr hohe Kompetenz im Schreiben vorweist oder ob zwischen diesen Fertigkeiten kein Zusammenhang besteht und diese sich bei den Zielgruppen jeweils anders verteilen, weshalb es sich um zwei unabhängige Kompe‐ tenzdimensionen und somit Konstrukte handeln würde (vgl. HarmoS Konsortium Fremdsprachen 2009: 12). Kompetenzbeschreibungen, die lingualevel zugrunde liegen, stellen sogar eine Verfeinerung jener des GeR dar, da sie die Niveaus A1 bis B1 aufgreifen und in die validierten und präzise kalibrierten Zwischenstufen A1.1, A1.2, A2.1, A2.2, B1.1 und B1.2 auffächern (vgl. Lenz/ Studer 2004: 21). Als Vorteil von lingualevel kommt hinzu, dass die in dieser Testbatterie verwendeten Kompetenzbeschrei‐ bungen so gezielt wie möglich die Lebenswelt von Kindern und Jugendlichen widerspiegeln. Laut Lenz und Studer (2004: 22) wurde bei der wissenschaftlichen Konzeption und Erprobung verstärkt darauf geachtet, dass diese Deskriptoren - abhängig vom jeweiligen Leistungsniveau - kommunikative Handlungen beschreiben, die jeweils für Schülerinnen und Schüler im Alter von 11 bis 15 Jahren relevant sind. Außerdem wurden Kompetenzbeschreibungen in stark ähnlicher Form für die Testspezifizierungen bei den IQB-Tests im Rahmen der Ländervergleichsstudien verwendet (vgl. Tesch 2010: 71). Diese klare Definition der Testspezifizierungen, die Messpräzision, die Ähnlichkeit zu den IQB-Tests und insbesondere der präzise Bezug zu den Niveaustufen des GeR sind somit dem Ziel einer differenzierten Einstufung in Kompetenzniveaus der jeweiligen sprachlichen Leistungen der Merkmalsgruppen der männlichen und weiblichen Französisch- und Spanischlernenden der neunten Jahrgangsstufe am Gymna‐ sium im Bereich des Regierungspräsidiums Tübingen in Baden-Württemberg besonders dienlich. Zusätzlich zu den Niveaukonkretisierungen in Form von Deskriptoren für alle sprachlichen Grundfertigkeiten wurden hinsichtlich der produktiven Fer‐ tigkeit Schreiben außerdem Referenzleistungen in Form von kommentierten und beurteilten Schülerleistungen auf unterschiedlichen Niveaus durch das IEF-Team bereitgestellt, sodass sich die Testleitenden im Selbststudium als kompetente Prüfende und Beurteilende ausbilden können und somit ein für das Gütekriterium der Objektivität zentrales Experten-Benchmarking stattfinden kann (vgl. Lenz et al. 2004: 421). Wie genau die Testkonstrukte definiert sind, wie die Testentwicklung für die jeweilige sprachliche Fertigkeit verlief und wie die konkreten Testaufgaben bezüglich jeder einzelnen Fertigkeit im Einzelnen aussehen, wird in den Kapiteln 9.2.1 bis 9.2.3 noch einmal spezifisch dokumentiert und analysiert. 9.2 Sprachtests 169 87 Das Testleiterskript „Standortbestimmung mit lingualevel. Anleitung und Hinweise zur Durchführung“ ist nur für diejenigen Personen online unter www.lingualevel.ch [letzter Zugriff: 05.05.2020] zugänglich, die die Lizenz von lingualevel käuflich erworben haben. 88 Mehr Informationen zu den verschiedenen Wegen, durch die die Mittlere Reife in Baden-Württemberg erreicht werden kann, finden sich unter https: / / www.serv ice-bw.de/ lebenslage/ -/ sbw/ Mittlere+Reife-5000179-lebenslage-0 [letzter Zugriff am 25.10.2019]. Als nächstes gilt es nach Harsch (2012: 161), eine Prüfung des Testinstruments lingualevel bezüglich des Kriteriums der Eignung für die Adressatengruppe im Kontext der kriterienorientierten Bezugsnorm, also des zu erwartenden sprach‐ lichen Leistungsniveaus, durchzuführen: Zu Beginn der zweiten Schuljahres‐ hälfte einer neunten Jahrgangsstufe am Gymnasium in Baden-Württemberg, in der Französisch als zweite Fremdsprache im vierten Lernjahr unterrichtet wird, erscheint es angebracht, dem von Lenz und Studer (2008) verfassten Testleiter‐ skript 87 folgend, Aufgabenserien auszuwählen, die mehrheitlich das Spektrum A2.1-B1.1 abdecken. Die deutschen Bildungsstandards (KMK 2004), die als Regelstandards ausgewiesen sind, sehen für den mittleren Schulabschluss nach der zehnten Jahrgangsstufe 88 das Erreichen des Niveaus B1 beim Durchschnitt der Schülerinnen und Schüler vor, was in der Darstellungsform der Feinniveaus von lingualevel B1.2 entspricht. Die schweizerischen Bildungsstandards setzen im Gegensatz dazu das Ende der Sekundarstufe I und somit das Niveau B1.2 bereits bei Abschluss der neunten Jahrgangsstufe an (vgl. Konsortium HarmoS Fremdsprachen 2009: 3). Die zu untersuchenden Lernenden des Spanischen als dritte Fremdsprache haben am Gymnasium in Baden-Württemberg, dadurch, dass sie sich ebenfalls in der neunten Jahrgangsstufe befinden, im Durchschnitt dasselbe Lerneralter wie die Französischlernenden im vierten Lernjahr. Jedoch liegt ihr Sprachniveau voraussichtlich leicht unter dem der Lernenden des Französischen, da sie erst in der achten Jahrgangsstufe begannen, Spanisch zu erlernen und sie sich somit zum Testzeitpunkt erst am Anfang der zweiten Hälfte des zweiten Lernjahrs befinden. In Baden-Württemberg wird, wie in vielen anderen Bundesländern, die Progression im Spanischen als dritte Fremdsprache jedoch viel steiler angesetzt als im Französischen als zweite Fremdsprache, da im Spanischen bis zum Abschluss des Mittleren Schulabschlusses nach der zehnten Jahrgangsstufe ebenfalls das Niveau B1.2 erreicht werden soll (vgl. Ministerium für Unterricht und Kultus Baden-Württemberg 2016: 7). Die ge‐ plante Progression sowie der geplante Testzeitpunkt können also, in Trendlinien verallgemeinert, für die beiden romanischen Fremdsprachen graphisch wie folgt dargestellt werden (vgl. Abbildung 3): 89 170 9 Untersuchungsinstrumente 89 Die vorliegende Grafik geht der Vereinfachung halber davon aus, dass L1 Deutsch, L2 Englisch, L3 Französisch und L4 Spanisch ist. Sie hat bewusst nicht den Anspruch, die verschiedenen Herkunftssprachen der Schülerinnen und Schüler in ihrer Progression darzustellen, da diese individuell stark unterschiedlich sind. Es handelt sich wie bereits erwähnt lediglich um eine abstrahierende Darstellung der geplanten Progression in der zweiten und dritten Fremdsprache in Baden-Württemberg. Die Werte der jeweiligen Jahrgangstufen beziehen sich dabei auf die am Ende des Schuljahres zu erreichenden Niveaustufen. Abb. 3: Progression nach den Niveaustufen des GeR in der zweiten Fremdsprache Franzö‐ sisch und in der dritten Fremdsprache Spanisch am Gymnasium in Baden-Württemberg Der klare Vorteil, den das Testinstrument lingualevel bietet, liegt somit in der Möglichkeit, ein Niveauspektrum, wie zum Beispiel im vorliegenden Fall A2.1-B1.1 abprüfen, im Nachhinein die einzelnen Schülerinnen und Schüler je nach erreichter Punktzahl in die jeweiligen Niveaustufen einordnen und somit gleichzeitig eine Gesamteinordnung ganzer Merkmalsgruppen - hier insbesondere Geschlecht - vornehmen zu können. Demzufolge können mög‐ liche Abweichungen, Streuungen und Verschiebungen der in Abbildung 3 dargelegten abstrahierten Trendlinien im Querschnitt zum Testzeitpunkt erfasst werden. Hinzu kommt, dass die Aufgaben für das Niveauspektrum A2.1-B1.1 für Schülerinnen und Schüler im Alter von vierzehn bis fünfzehn Jahren bestimmt sind (vgl. Lenz/ Studer 2008), was bedeutet, dass die Adressaten von lingualevel mit den Probandinnen und Probanden der vorliegenden Studie auch bezüg‐ lich des Lerneralters durchaus vergleichbar sind. Allerdings muss angemerkt werden, dass es sich bei den Schülerinnen und Schülern der Deutschschweiz, für die dieser Test konzipiert ist, bei Französisch um die erste Fremdsprache und bei den Schülerinnen und Schülern aus Baden-Württemberg, bei denen der Test in der vorliegenden Studie eingesetzt wird, um Französisch als zweite und um Spanisch als dritte Fremdsprache handelt. 90 Doch obwohl die Progression sowohl in der Deutschschweiz als auch in Baden-Württemberg je nach Spra‐ 9.2 Sprachtests 171 90 Die Schülerinnen und Schüler erlernten in der Schweiz bis zum Schuljahr 2009/ 2010 eine erste Fremdsprache spätestens ab der fünften und eine zweite spätestens nach der 7. Jahrgangsstufe (vgl. AG Sprachen D-EDK 2014: 4), wobei lingualevel von Französisch ab der 5. Jahrgangsstufe als erste Fremdsprache ausgeht (vgl. Lenz/ Studer 2008). Seit 2010 wird in der Schweiz ab der 3. Jahrgangsstufe der Primarschule die erste Fremdsprache und ab der 5. Jahrgangsstufe der Primarschule die zweite Fremdsprache erlernt. Ein Teil der Deutschschweizer Kantone führte ab der 3. Klasse Englisch und ab der 5. Klasse Französisch ein. In Bern, Solothorn, Basel-Stadt, Basel-Landschaft sowie in den deutschsprachigen Teilen von Freiburg und Wallis wird aktuell hingegen Französisch als erste Fremdsprache ab Jahrgangsstufe 3 und meist Englisch als zweite Fremdsprache ab Jahrgangsstufe 5 unterrichtet, sodass mögliche nach 2010 entstandene standardisierte Tests, die aus der Schweiz stammen und diese Sprachenfolge berück‐ sichtigen, nicht mehr in dieser Form auf den süddeutschen Kontext angewendet werden könnten. Allerdings geht lingualevel noch vom älteren Modell von 2009/ 2010 und somit vom Französischen als erster Fremdsprache ab Klasse 6 aus (vgl. Lenz/ Studer 2008). 91 Dies zeigt auch die Tatsache, dass die Aufgaben der Englisch- und Französischtests von lingualevel stets möglichst ähnlich konstruiert sind, obwohl die Stellung der beiden Fremdsprachen innerhalb der Sprachenfolge jeweils eine andere ist. Später wurden in der Schweiz in der HarmoS-Hauptuntersuchung viele der im IEF-Projekt konzipierten Aufgaben mit den minimal notwendigen Anpassungen in allen drei dort zu erlernenden Zielsprachen Deutsch, Englisch und Französisch eingesetzt. Die Vergleichbarkeit der Ergebnisse über die Zielsprachen hinweg ist aber dennoch grundsätzlich aufgrund unterschiedlicher Testkonstrukte und sprachabhängiger Schwierigkeiten schwer zu bewerkstelligen und daher als kritisch zu betrachten (vgl. Konsortium HarmoS Fremd‐ sprachen 2009: 13). 92 In der Sekundarschule werden in der Schweiz zwei oder drei Abteilungen mit unter‐ schiedlichen Anforderungen gebildet und mit A und B, bzw. A, B und C bezeichnet, wobei A die anspruchsvollste Abteilung darstellt und daher am ehesten mit der Schulart des Gymnasiums in Deutschland vergleichbar ist (vgl. Kanton Zürich 2018). chenfolge unterschiedlich steil angesetzt ist, ermöglicht die Einordnung in die Feinniveaustufen des GeR eine übergeordnete Kategorisierung, die von diesen lokalen Unterschieden nicht tangiert wird, weshalb keine Schwierigkeiten auf‐ grund der unterschiedlichen Bildungspläne oder Sprachenfolgen zu erwarten sind. 91 Bei genauerer Analyse der Einordnung in die Kompetenzniveaus des GeR durch lingualevel wird außerdem deutlich, dass dieses Testinstrumenta‐ rium bei allen Standortbestimmungen, also Einstufungstests, die Möglichkeit bietet, explizit zwischen Variante 1, dem Aufgabenset für mittlere und stärkere Klassen mit größerem Leistungsspektrum und Variante 2, dem Aufgabenset für schwächere Klassen mit kleinerem Leistungsspektrum, zu wählen. Auf der Grundlage der bereits ausgeführten Aspekte, sprich des zu erwartenden großen Leistungsspektrums, der curricularen Vorgaben bezüglich der zu erreichenden Kompetenzniveaus (vgl. KMK 2004) und des angestrebten Vergleichs zwischen Französisch und Spanisch, wird dementsprechend die Testbatterie für das achte Schuljahr der Schweiz, Schultyp A 92 , Variante 1 (mittlere und starke 172 9 Untersuchungsinstrumente 93 Die Originaltestaufgaben von lingualevel sowie die adaptierten Testaufgaben für Fran‐ zösisch und Spanisch befinden sich in den Anhängen 3.1 bis 3.3. Klassen mit großem Leistungsspektrum) ausgewählt, da diese das Leistungs‐ spektrum A2.1-B1.1 misst. Die Auswahlentscheidung wird folglich explizit von den Kompetenzstufen ausgehend und weniger von der bei lingualevel angegebenen Jahrgangsstufe oder dem dort angegebenen Lernjahr ausgehend getroffen. Somit finden das erste Kriterium der eindeutigen kriterienorientierten Bezugsnorm, welche sich an den GeR anschließt, sowie das zweite Kriterium der Altersangemessenheit adäquate Berücksichtigung. Es darf jedoch nicht außer Acht gelassen werden, dass bei der späteren Auswertung der Testergebnisse von lingualevel voraussichtlich auch die soziale Bezugsnorm relevant sein wird, da es letztendlich darum geht, Lernende, im vorliegenden Falle vorwiegend Jungen und Mädchen, untereinander zu vergleichen (vgl. Harsch 2016: 206). Der Test sollte demnach neben der Kriterienorientierung gleichzeitig möglichst zu einer Normalverteilung der getesteten Variablen in der repräsentativen Stichprobe führen (vgl. Harsch 2012: 155-156). Nachfolgend werden für die Fertigkeiten Hörverstehen, Leseverstehen und Schreiben die jeweiligen Konstrukte erläutert, die Entwicklung und Erprobung der Testaufgaben von lingualevel geschildert und die konkrete Auswahl und minimale Anpassung der verwendeten Sprachtests für das Französische vorge‐ stellt. Schließlich wird die eigens durchgeführte Adaptation der Sprachtests zur Überprüfung der Fertigkeiten im Spanischen erörtert und begründet (vgl. Harsch 2012: 160, Rumlich 2012: 174). 93 Eine Übersicht über alle Anpassungs‐ maßnahmen der Sprachtests für das Französische und Spanische befindet sich in Anhang 2.4. 9.2.1 Der Hörverstehenstest Während für das Lesen und Schreiben eine ausführliche Hauptuntersuchung für die Erstellung von Testaufgaben und Kompetenzbeschreibungen durch das IEF-Team durchgeführt wurde, fiel die Studie zum Hörverstehen etwas kleiner aus. Die Niveaubeschreibungen für das Hörverstehen wurden insbesondere auf der Grundlage von früheren Untersuchungen vorgelegt (vgl. Konsortium HarmoS Fremdsprachen 2009: 12): Die Entwicklung der Hörverstehenstests erfolgte durch das IEF-Team zwischen 2004 und 2005 und wurde sowohl qualitativ als auch quantitativ mit statistischen Methoden validiert, wobei in einer ersten Entwicklungsphase eine umfassende Analyse der Fachliteratur und der bereits vorhandenen Aufgaben in Lehrwerken, Aufgabensammlungen und 9.2 Sprachtests 173 94 Entsprechende Nachstellungen wurden naturgemäß ebenfalls im Laufe der vorlie‐ genden Studie zum Ziel der Adaptation der Sprachtests für das Spanische durchgeführt. Da auch im Originaltest teilweise nachgestellte authentische Texte enthalten sind, ist also die Chance gegeben, den Spanischtest noch besser an den Französischtest anzupassen. 95 Einen weiteren Beitrag zur möglichst authentischen Hörhaltung liefert das Antwort‐ format der „Richtig-falsch-Items“, bei denen zwar die Ratewahrscheinlichkeit theore‐ tisch relativ hoch ist, praktisch aber der Prozess des Überprüfens von Hypothesen oder Erwartungen, wie er auch in der realen Hörsituation abläuft, dadurch begünstigt wird (vgl. Lenz et al. 2006: 10). 96 Während das Konsortium HarmoS Fremdsprachen (2009: 24) von einer „qualitativen Erprobung“ spricht, behaupten Lenz et al. (2006: 10), dass es sich um eine „quantitative Erprobung“ handelte. Da Lenz et al. (2006: 10) allerdings direkt im Anschluss anführen, dass das „Feedback zu den Aufgaben […] fast durchwegs (sic! ) positiv war.“ und dass „wichtige Verbesserungsvorschläge […] vor allem den Zeitbedarf für das vorbereitende Lesen des Aufgabenblattes“ betrafen, wird hier von einer qualitativen Erprobung ausgegangen. Eine abschließende Festlegung der Forschungsmethode scheint aber aufgrund dieses Widerspruchs nicht möglich zu sein. Zertifikatsprüfungen stattfand (vgl. Konsortium HarmoS Fremdsprachen 2009: 23). In der zweiten Entwicklungsphase erfolgte die Konstruktion erster Aufgaben‐ entwürfe auf Basis der Deskriptorensammlung, die bereits in der ersten Projekt‐ phase von IEF erarbeitet worden war (vgl. Lenz/ Studer 2004). Nach Möglichkeit wurden auf Grundlage der Kompetenzbeschreibungen und der adäquaten Hör‐ situationen authentische Hörtexte als Ausgangspunkt für die Testaufgaben des Hörens ausgewählt und nur in Einzelfällen musste die Vorlage etwas adaptiert und in entsprechender Nachstellung erneut aufgenommen werden. 94 Durch die fast durchgehende Verwendung authentischer Hörtexte und durch einleitende Situierungstexte wurde angestrebt, eine möglichst authentische Hörhaltung zu erzeugen (vgl. Lenz et al. 2006: 10). 95 Alle Aufgaben wurden durch das IEF-Team in der zweiten Phase zudem durch Durchführungsbestimmungen und Lösungsschlüssel ergänzt. In der dritten Phase der Testentwicklung kam es zur qualitativen Erpro‐ bung 96 der Aufgaben in Schulklassen und zur Überarbeitung der Entwürfe sowie einiger weiterer Änderungen und Ergänzungen des Aufgabenkorpus, der Lösungsschlüssel und der Durchführungsbestimmungen (vgl. Konsortium HarmoS Fremdsprachen 2009: 24). Schließlich wurden die Hörverstehenstests in der vierten Phase in insgesamt 85 Schulklassen unterschiedlichen Alters und Niveaus eingesetzt, wobei einige Lernende zusätzlich zur Höraufgabe einen Selbstbeurteilungsbogen, der die IEF-Deskriptoren enthielt, ausfüllten. In der fünften und letzten Phase erfolgte die Kalibrierung der Testdaten und der Daten aus den Selbstbeurteilungen durch die Programme Winsteps und 174 9 Untersuchungsinstrumente Facets. Problematische Items wurden nach der statistischen Analyse eliminiert und es erfolgte auf Basis der Selbstbeurteilungsbögen eine Zuordnung der Aufgaben zu den jeweiligen Feinniveaus des Referenzrahmens. Ergebnis dieses Prozesses waren 75 empirisch validierte Testaufgaben mit insgesamt rund 460 Items, wobei jeweils ungefähr die Hälfte für Französisch (35 Aufgaben, 223 Items) und die Hälfte für Englisch (40 Aufgaben, 227 Items) konzipiert wurden. Zwei Drittel davon sind in lingualevel enthalten und ein Drittel wurde für besondere Evaluationszwecke der Schweizer Kantone zurückbehalten (vgl. Lenz et al. 2006: 10; Konsortium HarmoS Fremdsprachen 2009: 24). Zunächst erfolgen eine Erläuterung des Hörverstehenskonstrukts, eine Vor‐ stellung der Aufgabenformate und die Begründung der jeweiligen Anzahl der Wiederholungen der Präsentation des Hörtextes, bevor auf die konkreten Tes‐ taufgaben, die in der vorliegenden Studie verwendet werden, näher eingegangen wird. Betrachtet man die mentalen Prozesse, weist das Hören viele Parallelen zum Lesen auf, wenngleich dem „Echtzeit-Prozess“ zur Verarbeitung der sprachli‐ chen Information eine weit höhere Bedeutung zukommt als bei der Rezeption schriftlicher Texte (vgl. Weir 2005): Die Flüchtigkeit der zu verarbeitenden Information stellt in der Fremdsprache aufgrund der noch unvollständigen und lückenhaften Interlanguage (vgl. Selinker 1972) eine erhöhte Schwierigkeit dar, die mit dem Verlust von Kontrollmöglichkeiten einhergeht (vgl. Konsortium HarmoS Fremdsprachen 2009: 22). Lingualevel definiert das Hörverstehen in enger Anlehnung an den GeR (Europarat 2001) als „rezeptive kommunikative Aktivität“: Es wird zwischen den vier Hörintentionen Globalverstehen, Selektivverstehen und Detailverstehen sowie der Fähigkeit, Schlussfolgerungen ziehen zu können, unterschieden. Globalverstehen meint dabei, den groben Sinnzusammenhang zu verstehen; selektives Hörverstehen bedeutet, eine bestimmte Information herauszuhören und Detailverstehen bezeichnet die Fähigkeit, das Gesprochene in allen Einzel‐ heiten zu verstehen (vgl. Europarat 2001: 71; HarmoS Fremdsprachen 2009: 22). Es erfolgt allerdings innerhalb der Testbatterien keine systematische Variation der Hörabsichten. Was die Aufgabenstellungen betrifft, so stammen diese aus Alltagssituationen und es werden möglichst authentische Kontexte aufgezeigt, die für die Schülerinnen und Schüler relevant sind bzw. sein könnten. Hierbei werden private, schulische und öffentliche Kontexte der Sprachverwendung berücksichtigt. So fallen unter private Gespräche beispielsweise Face-to-face-In‐ teraktionen, Telefondialoge oder Gruppengespräche; im öffentlichen Bereich handelt es sich wiederum um Radiosendungen, Interviews und Durchsagen (vgl. HarmoS Fremdsprachen 2009: 22). Die Hörtexte wurden entweder direkt und 9.2 Sprachtests 175 97 In dieser Variante wird durch das Konsortium Harmos Fremdsprachen (2009: 29) auch von „offenen“ Kurzantworten gesprochen. Da es sich allerdings hier nicht um eine offene Aufgabe im Sinne einer unendlichen Anzahl an möglichen Lösungen handelt, sondern die Hörtexte die Aussagen klar vorgeben, wird dieser Begriff hier vermieden, um Missverständnissen vorzubeugen. 98 Eine Ausnahme bildet hier Teilaufgabe 5 (HV-17 Erfahrungen mit Handys) aus dem verwendeten Test, bei der es sich um ein privates Gespräch handelt, das aber zweimal angehört werden kann. Alle anderen Aufgaben des ausgewählten Tests folgen dem oben beschriebenen Prinzip. ohne Veränderung aus der Zielkultur übernommen oder aber entsprechend ihrer Vorlage noch einmal mit nur wenigen Veränderungen durch Muttersprachler‐ innen und Muttersprachler aufgenommen. In der gesamten Testbatterie lassen sich drei Arten von Antwortformaten finden: Multiple Choice, Richtig/ Falsch und Kurzantworten, wobei letztere von den Probandinnen und Probanden teils komplett selbst verfasst werden müssen 97 und teils durch Stichworte oder Sätze gelenkt werden. Insbesondere die Richtig-Falsch-Antworten bedürfen aufgrund der erhöhten Ratewahrschein‐ lichkeit einer Rechtfertigung, die das HarmoS-Konsortium Fremdsprachen (2009: 23) liefert: Dieses Aufgabenformat spiegelt den Prozess des Überprüfens von Erwartungen oder Hypothesen wider, welcher in der realen Hörsituation auf die Überprüfung des Vorwissens rekurriert, und stellt eine authentische Hörhaltung dar. Die relativ hohe Ratewahrscheinlichkeit wird auch dadurch kompensiert, dass zwischen 60% und 80% der Richtig-Falsch-Aufgaben korrekt gelöst werden müssen, um die unterste vom Test erfasste Feiniveaustufe zu erreichen (vgl. Anhang 2.1.3). Je nach Kommunikationskontext werden die Hörtexte zweimal abgespielt, das heißt bei aufgenommenen Radiosendungen bzw. Podcasts oder Durchsagen besteht in der außerschulischen Realität die Möglichkeit, den Hörtext erneut anzuhören, weshalb diese Option im Gruppentest für alle Probanden gewährt wird. Hingegen wird bei Alltagskonversationen, die in der außerschulischen Realität normalerweise nicht in Form einer Audiodatei aufgezeichnet werden und somit nicht erneut abgespielt werden können, oftmals keine Wiederholung für die Probanden dargeboten, sondern es werden lediglich entsprechende Hörpausen gewährleistet, insbesondere dann, wenn eine Kurzantwort aufge‐ schrieben werden muss (vgl. Konsortium HarmoS Fremdsprachen 2009: 23). 98 Ein Spezifikum der Höraufgaben von lingualevel besteht außerdem darin, dass die Aufgabenstellungen alle auf der Schulsprache Deutsch verfasst sind. Dies wird so begründet: 176 9 Untersuchungsinstrumente Dadurch soll erstens das Aufgabenverständnis sichergestellt werden, zweitens ver‐ mieden werden, dass Leseverstehen statt Hörverstehen getestet wird, und drittens ausgeschlossen werden, dass Antworten nur gegeben werden, weil im Hörtext Wörter aus der gelesenen Aufgabenformulierung wiedererkannt werden. (Konsor‐ tium HarmoS Fremdsprachen 2009: 23) Die Verwendung der Schulsprache Deutsch stellt folglich nach Auffassung der Testautorinnen und -autoren eine Möglichkeit dar, die Konstruktvalidität der Tes‐ taufgaben zu erhöhen und soll keine Gegenposition zum Prinzip der funktionalen Einsprachigkeit des neokommunikativen Fremdsprachenunterrichts darstellen. Die Konstruktvalidität hat als Grundvoraussetzung das Verhindern einer Kon‐ strukt-Unterrepräsentation oder einer konstruktirrelevanten Varianz (vgl. Döring/ Bortz 2016: 93; Messick 1996; Schmelter 2014: 40). Von konstruktirrelevanten Varianz spricht man, wenn beispielsweise ein Testformat eine bestimmte Fähigkeit verlangt, die in der Population ungleich verteilt ist und die nicht unter das zu messende Konstrukt fällt, wie es beim Heraushören von Wortformen, die bereits abgedruckt vorliegen, der Fall wäre (vgl. Lenz et al. 2006: 7; Messick 1996: 244). Man spricht in diesem Zusammenhang auch von test-wiseness, welche die Fähigkeit einer Person bezeichnet „eine hohe Punktzahl in einem Multiple-Choice-Test zu erzielen, indem die richtige Antwort durch Nutzung spezifischer Hinweise und Charakteristika der Items identifiziert wird“ (Thoma/ Köller 2018: 65). Der Einsatz der test-wiseness wird somit durch die Verwendung des Deutschen in den Aufgabenstellungen in gewissem Maße unterbunden. Außerdem wird im Hörtest ersichtlich, dass die inhaltliche Plausibilität, beispielsweise bezüglich der Funk‐ tionen von Handys (HV-17) oder der Funktionen von bestimmten Gegenständen (vgl. HV-27, Anhang 2.1.3), nicht so offensichtlich ist, dass hierdurch der Einsatz der test-wiseness begünstigt werden kann. An dieser Praktik kann wiederum kritisiert werden, dass durch die Verwen‐ dung der Schulsprache Deutsch in den Arbeitsanweisungen und Situierungen bei den Hör- Lese- und Schreibtests das Einstellen eines Bilingual Mode verhin‐ dert werden kann (vgl. Grosjean 2013). Dennoch überwiegen laut Konsortium HarmoS Fremdsprachen (2009: 23) in Bezug auf die soeben dargelegten testthe‐ oretischen Aspekte die Vorteile der Verwendung der Schulsprache Deutsch in den Arbeitsanweisungen und Aufgabenformulierungen. - 9.2.1.1 Der Hörverstehenstest in Französisch Nach dieser Einführung in die Hörtestmaterialien von lingualevel wird nun die Testbatterie vorgestellt, die in der vorliegenden Studie zum Einsatz kommt. Die Construct Map des ausgewählten Hörverstehenstests, dessen Aufgabenrei‐ 9.2 Sprachtests 177 99 Vgl. hierzu die Vorlage für die Construct Map in Konsortium HarmoS Fremdsprachen (2009: 29). henfolge und -kombination lingualevel festgelegt sind, gestaltet sich folgender‐ maßen (vgl. Tabelle 1): 99 Nr. IEF-HV- Items, Niveaus Validierte Deskriptoren Charakterisierung der Item-Merkmale Hörtext Hörab‐ sicht Reali‐ sierung Ant‐ wortformat 1 HV-38 Auto‐ renn‐ sport A1.2-A2.2 Hö 32 (A2.1): Wenn deutlich ge‐ sprochen wird, kann ich aus kurzen Radiosen‐ dungen wie Wet‐ tervorhersagen, Konzerthinweisen oder Sportresul‐ taten wichtige In‐ formationen her‐ aushören. Eine Radio‐ nachrichten‐ sendung mit einem Bericht über ein Auto‐ rennen; infor‐ mierende und berichtende Sprachfunk‐ tion se‐ lektiv ver‐ stehen einmal Hören mit kurzen Pausen richtig/ falsch 2 HV-29 Nachrichten aus der Welt des Films, der Musik und des Sports A2.1-A2.2 Hö 32 (A2.1): Wenn deutlich ge‐ sprochen wird, kann ich aus kurzen Radiosen‐ dungen wie Wet‐ tervorhersagen, Konzerthinweisen oder Sportresul‐ taten wichtige In‐ formationen her‐ aushören. Hö 60 (A2.2): Ich kann in Radio‐ nachrichten die Hauptpunkte ver‐ stehen, wenn langsam und deut‐ lich gesprochen wird und falls ich über die Themen bereits etwas weiß. Eine Radio‐ nachrichten‐ sendung mit fünf Kurzbe‐ richten; infor‐ mierende und berichtende Sprachfunk‐ tion se‐ lektiv ver‐ stehen einmal Hören mit kurzen Pausen zwi‐ schen den Be‐ richten richtig/ falsch 178 9 Untersuchungsinstrumente Nr. IEF-HV- Items, Niveaus Validierte Deskriptoren Charakterisierung der Item-Merkmale Hörtext Hörab‐ sicht Reali‐ sierung Ant‐ wortformat 3 HV-39 Eine Ra‐ diosen‐ dung zu Liebes‐ ge‐ schichten A2.1-A2.2 Hö 46 (A2.1): Wenn eine Ge‐ schichte langsam und deutlich er‐ zählt wird, ver‐ stehe ich wichtige Informationen und komme bei der Ge‐ schichte nach. Hö 55 (B1.1): Ich kann ein Radioin‐ terview über Themen verstehen, die ich schon etwas kenne (z.-B. ein In‐ terview mit Ju‐ gendlichen über ihre Zukunftsvor‐ stellungen, mit der Autorin eines neuen Buches über die Jugendlichen oder mit einer be‐ kannten Rock‐ band); im Inter‐ view sollte aber relativ langsam und deutlich ge‐ sprochen werden, und ich sollte ab und zu etwas mehr als einmal hören können. Eine Radio‐ sendung mit zwei narra‐ tiven Inter‐ views; v.-a. er‐ zählende Sprachfunk‐ tion wich‐ tige Einzel‐ heiten ver‐ stehen zweimal Hören mit kurzen Pausen richtig/ falsch 9.2 Sprachtests 179 100 Dieser Deskriptor ist in lingualevel genau so vorzufinden, obwohl teilweise diatopisch markierte Hörtexte (Französisch der Westschweiz) vorliegen (vgl. Lenz/ Studer 2009). Nr. IEF-HV- Items, Niveaus Validierte Deskriptoren Charakterisierung der Item-Merkmale Hörtext Hörab‐ sicht Reali‐ sierung Ant‐ wortformat 4 HV-17 Erfah‐ rungen mit Handys A2.1-B1.1 Hö 54 (A2.2): Ich kann einfache technische Erklä‐ rungen verstehen, die mir jemand persönlich gibt (z.-B. wie man ver‐ schiedene Geräte in der Schule oder im Haushalt be‐ dient). Hö 43 (B1.1): Ich kann in einer län‐ geren Diskussion über alltägliche Themen, die ich etwas kenne, die wichtigsten Dinge verstehen; es sollte aber nicht zu schnell und in Standardsprache gesprochen werden. 100 Ein infor‐ melles Ge‐ spräch; infor‐ mierende, beschreibende und bezie‐ hungsunter‐ haltende Sprachfunkti‐ onen Detail‐ ver‐ stehen zweimal Hören mit zwei kurzen Pausen richtig/ falsch 180 9 Untersuchungsinstrumente 101 Dieser Deskriptor ist in lingualevel genau so vorzufinden, obwohl teilweise diatopisch markierte Hörtexte (Französisch der Westschweiz) vorliegen (vgl. Lenz/ Studer 2009). 102 Die Codes der Deskriptoren stehen jeweils bei den Aufgabenstellungen und die vollständigen Deskriptoren wurden unter www.lingualevel.ch über den lizensierten Zugang abgerufen, wobei beim Hörverstehen, anders als bei den Fertigkeiten Lesen und Schreiben, die Zuweisung der Feindeskriptoren zu den Aufgaben vom Verlagsprodukt nicht vorgegeben ist und diese somit durch die Verfasserin der Arbeit vorgenommen werden musste. Auch die Angaben zur Textsorte, zu den Textmerkmalen, zu den intendierten Lesarten und zu den Antwort-Formaten befinden sich im vom Schulverlag für lingualevel bereitgestellten Zusatzmaterial (vgl. Lenz/ Studer 2009). Nr. IEF-HV- Items, Niveaus Validierte Deskriptoren Charakterisierung der Item-Merkmale Hörtext Hörab‐ sicht Reali‐ sierung Ant‐ wortformat 5 HV-27 Werbe‐ spots im Radio A2.2-B1.2 Hö 47 (A2.2): Ich kann in kurzen Radio-Werbespots zu Angeboten, die mich interessieren (z.-B. Musik-CDs, Computerspiele, Reisen), die wich‐ tigsten Informa‐ tionen verstehen. Hö 64 (B1.2): Wenn in kurzen Beiträgen im Radio in Standard‐ sprache 101 über Themen gespro‐ chen wird, die mich interessieren, kann ich die Hauptpunkte und wichtige Einzel‐ heiten verstehen (Beispiele für Themen: Umwelt‐ schutz, „Stars“). 102 Vier Radio‐ werbespots; auffordernde, informierende und beschrei‐ bende Sprach‐ funktionen se‐ lektiv und de‐ tailliert ver‐ stehen zweimal Hören mit kurzen Pausen zwi‐ schen den Werbe‐ spots Kurz‐ ant‐ wort (ge‐ lenkt) Tabelle 1: Construct Map des Hörverstehenstests von lingualevel Die Aufgaben des Hörverstehenstests decken sowohl ein breites thematisches Spektrum als auch unterschiedliche Textsorten, Aufgabenformate und Lesein‐ tentionen ab: Während im ersten Hörtext von dem Ausgang eines Autorennens in Form einer Radionachrichtensendung berichtet wird, nimmt der zweite 9.2 Sprachtests 181 Hörtext kurze Nachrichten aus Film, Musik und Sport in den Blick. Im dritten Hörtext berichten Menschen, die in einer Radiosendung anrufen, wie sie ihren Partner kennengelernt haben, wobei es sich um narrative Interviews handelt. Im vierten Hörtext sprechen zwei Jugendliche in einer informellen Unterhaltung über die Funktionen ihrer Handys und im letzten Hörtext werden kurze Werbeslogans für schulische Phantasieprodukte eingespielt. In der Construct Map (Tabelle 1) wird deutlich, dass - mit Ausnahme von Teilaufgabe 1 (HV-38) - pro Aufgabe jeweils eine partielle Umsetzung von zwei Deskriptoren erfolgt. Außerdem ist zu berücksichtigen, dass das Kompetenzfeld Hörverstehen nicht vollends durch diese illustrativen Deskriptoren abgedeckt wird, sondern dass durch diese spezifischen Deskriptoren eine Art Querschnitt durch die Hörvers‐ tehenskompetenz erfolgt (vgl. Lenz et al. 2006: 7): Im Vordergrund stehen das selektive Hörverstehen und das Detailverstehen von meist deutlich und langsam gesprochenen Hörtexten. In den Ausgangstexten, die in der vorliegenden Studie für das Hörverstehen im Französischen eingesetzt werden, hören die Probandinnen und Probanden Beiträge von Sprecherinnen und Sprechern einer leichten Ausprägung der Varietät der Welschschweiz (Suisse Romande), welche vor allem durch eine etwas vom français standard abweichende Intonation gekennzeichnet ist und einzelne lexikalische Varietäten enthält (vgl. Berthele 2006: 71; Thibault/ Knecht 2004), die sich in erster Linie auf Numerale wie huitante anstatt quatre-vingts beziehen, welche lediglich in der fünften Teilaufgabe der in der vorliegenden Studie verwendeten Testbatterie vereinzelt auftreten. Knecht (2000: 139) hält außerdem fest, dass sich die Kantone der französischen Schweiz „in ihrem gesamten Sprachverhalten fast völlig dem ihre Schriftsprache bestimmenden Ausland angepasst“ haben und dass die sprachlichen Besonderheiten des Französischen der welschen Schweiz immer auch in den benachbarten Gebieten Frankreichs zu finden sind (vgl. Berthele 2006: 72; Knecht 2000: 165). Diese leichte diatopische Markierung wird berücksichtigt, indem kleinere Anpassungen im Sinne von Anmerkungen zu einzelnen landeskundlichen Aspekten oder geographischen Angaben ergänzt werden (vgl. Anhänge 3.1.3 und 3.4). Auch diaphasische und diamesische Markierungen sind vorzufinden: Die Alltagsgespräche weisen Elemente des français populaire und français familier (z. B. « Ah, ouais, t’as raison. », Teilaufgabe 4) auf und sind konzeptionell mündlich, enthalten also eine gewisse Anzahl an Elementen gesprochener Sprache, insbesondere die Auslassung von ne in der Verneinung (vgl. « Et puis après ça s’est jamais arrêté. », Teilaufgabe 3) Turn-Taking-Signale (« Eh, Daniel, tu as reçu un message, quoi. », Kontaktsignale (« Et puis, c’est cher l’abonnement, ou bien ? », Teilaufgabe 4), Interjektionen (« Ah, tu t’es fait 182 9 Untersuchungsinstrumente voler ! », Teilaufgabe 4) und Abtönungsphänomene (« Mais voilà, quoi. », Teilaufgabe 4) (vgl. Koch/ Oesterreicher 2011). Die konzeptionell schriftlichen Texte, die insbesondere in Form von Radiosendungen, beispielsweise innerhalb von vorgelesenen Nachrichten (vgl. Teilaufgabe 2, HV-29, Anhang 2.1.1) und Werbespots auftreten, zeichnen sich hingegen durch ein höheres Maß an Planung, Strukturiertheit, Kohärenz und Kohäsion sowie durch eine komplexere Syntax aus (vgl. Konsortium HarmoS Fremdsprachen 2009: 23). Insgesamt sind 40 Items und folglich auch 40 Berechnungspunkte vorhanden. Mettler et al. (2006: 4) legen als Mindestpunktzahl 30 an, um eine zuverlässige Niveauzuordnung machen zu können, was in dieser Testbatterie sogar um 10 Items und Berechnungspunkte überschritten wird. Dadurch wird insbesondere die Validität des Aufgabensets zur Überprüfung der Hörverstehenskompetenz erhöht. Validität bezeichnet eine möglichst präzise Entsprechung zwischen den theoretischen Konstrukten und den empirisch beobachtbaren Phänomenen und steht somit für eine gelungene Operationalisierung des jeweiligen theoretischen Konstrukts (vgl. Riemer/ Settinieri 2010: 770; Schmelter 2014: 48; Settinieri 2016: 579), die sich in den einzelnen Sprachtests lingualevel und somit auch im vorliegenden Hörverstehenstest vor allem in Form der einzelnen Items und dazugehörigen Kompetenzbeschreibungen sowie durch die jeweiligen assignierten maximal zu erreichenden und tatsächlich erreichten Punktzahlen fassen lässt. Im Fall von lingualevel bezieht sich Validität also auf die Frage, ob der Sprachtest die jeweiligen sprachlichen Fertigkeiten erfasst, die er zu messen vorgibt. Hier besteht der Vorteil, dass die einzelnen Konstrukte klar beschrieben werden und die operationalisierbaren Deskriptoren vorhanden sind (vgl. Tabelle 1). Im Sinne einer leichten Anpassung bezüglich der formalen Übersichtlichkeit und der Anpassung vom Schweizer an den deutschen Kontext (vgl. Harsch 2012: 160, Rumlich 2012: 174) wurden kleinere Veränderungen der Aufgabenblätter vorgenommen, die in der Tabelle in Anhang 2.4 vollständig erfasst werden. Auf formaler Ebene wurden beispielsweise die Nummerierungen angepasst, damit den Probandinnen und Probanden die Orientierung innerhalb des Ar‐ beitsmaterials erleichtert wird und sie noch klarer darauf hingewiesen werden, wo eine Aufgabe endet und die nächste beginnt. Außerdem wurden minimale Präzisierungen in den Aufgabenstellungen vorgenommen, zum Beispiel indem die Angabe der zur Verfügung stehenden Zeit hervorgehoben wurde. Das Seitenlayout wurde so gestaltet, dass alle zu lösenden Aufgaben auf einer Doppelseite des Testbogens einsehbar sind und für die Bearbeitung der nächsten Aufgabe eine Seite umgedreht werden muss, um die Durchführungsobjektivität zu erhöhen und allen Probandinnen und Probanden stets genau dieselbe Bear‐ 9.2 Sprachtests 183 103 Das Kriterium der Praktikabilität oder Viabilität betrifft die Durchführbarkeit, welche in erster Linie von den äußeren Gegebenheiten abhängt (vgl. Bachman/ Palmer 2010: 262-264). Bachmann und Palmer (2010: 262) definieren Praktikabilität als mathemati‐ sche Formel, in der die zur Verfügung stehenden Ressourcen von den benötigten Ressourcen subtrahiert werden: Wenn die zur Verfügung stehenden Ressourcen größer sind als die benötigten Ressourcen, so handelt es sich um eine positive Praktikabilität. Wenn die zur Verfügung stehenden Ressourcen kleiner sind als die benötigten Res‐ sourcen, handelt es sich um eine negative Praktikabilität und die Leistungsmessung ist nicht durchführbar. beitungszeit zu geben, was auch das Maß an Praktikabilität erhöht, da so die zeitgleiche Bearbeitung der jeweiligen Aufgaben von der Testleitung einfacher zu kontrollieren ist (vgl. Anhang 2.4). 103 Eine weitere kleine Veränderung auf formaler Ebene des Arbeitsauftrags bei den Richtig/ Falsch-Antwortformaten bestand darin, dass „Kreuze richtig oder falsch an“ in „Kreuze richtig oder falsch/ nicht gesagt an“ inklusive grauer Unterlegung von „richtig“ und „falsch/ nicht gesagt“ transformiert wurde, da in der Tabelle die Option „falsch/ nicht gesagt“ explizit in dieser Form auftritt und es meist einen Unterschied macht, ob eine Aussage falsch ist oder ob die Aussage nicht getätigt wurde (vgl. Schelten 1997; Schweinberger 2009). Hierauf weist die Testleiterin am Testtag auch noch einmal explizit hin (vgl. Anhang 1.2). Weitere minimale Änderungen wurden vorgenommen, um das voraussicht‐ lich geringe Vorwissen über die französische Schweiz zu kompensieren bezie‐ hungsweise um Worte, die in den Arbeitsaufträgen im Schweizerdeutschen Usus gehalten sind, durch standarddeutsche Ausdrücke zu ersetzen: In der ersten Aufgabe mit dem Titel „Autorennsport“ wurde beispielsweise innerhalb der Situierung der Ausdruck „Westschweizer Radio“ durch den Ausdruck „Radio der französischsprachigen Schweiz“ ersetzt, da nicht vorausgesetzt werden kann, dass alle Schülerinnen und Schüler die Westschweiz direkt mit der französischen Sprache in Verbindung setzen. Schließlich wurde bei der fünften Aufgabe „Werbespots im Radio“ nach der Aufgabestellung noch eine kurze Erläuterung der Zahlen septante, huitante und nonante hinzugefügt. Dieser zusätzliche Hinweis ist notwendig, damit die Probandinnen und Probanden bei Teilaufgabe B die Preisangabe „195 euros“ und bei Teilaufgabe D die Preisangabe „17.95 euros“ verstehen können (vgl. Anhang 2.1.3). - 9.2.1.2 Der Hörverstehenstest in Spanisch Um die Aufgabe auf das Spanische zu übertragen, wurden alle französischen Hörtexte zunächst transkribiert (vgl. Anhang 2.1.1). Anschließend wurde eine Übersetzung vom Französischen ins Spanische vorgenommen, wobei spezifisch auf die Erhaltung des jeweiligen Sprachregisters geachtet wurde und kulturelle 184 9 Untersuchungsinstrumente Aspekte (z. B. Toponyme, Personennamen, Veranstaltungsnamen, Namen von Musikgruppen und Radiosendern) entsprechend ersetzt wurden (vgl. Anhang 2.1.5). Beispielsweise wurde in der dritten Teilaufgabe „Eine Radiosendung zu Liebesgeschichten“ Radio Suisse Romande durch Radio Castilla y León ersetzt. In der spanischen Fassung ruft außerdem Silvia anstatt Sylvie beim Radiosender an und Silvia erzählt von ihren Skiferien in der spanischen Sierra Nevada anstatt, wie Sylvie, von den Skiferien im Wallis. Die einzelnen Items der Aufgabenstellungen wurden lediglich entsprechend dieser interkulturellen Elemente angepasst und ansonsten identisch gehalten (vgl. Anhang 2.1.5). Die Audioaufnahmen wurden zusammen mit einer muttersprachlichen Sprecherin und einem muttersprachlichen Sprecher, die aus dem Raum Madrid stammen, aufgenommen und sowohl das Sprechtempo als auch die Sprechpausen wurden so genau wie möglich an die französische Version angepasst. Außerdem wurden Signaltöne nach demselben Muster wie beim Französischtest eingefügt sowie bei der dritten Teilaufgabe, im Rahmen derer Hörerinnen und Hörer beim entsprechenden Radiosender anrufen, um ihre Liebesgeschichte zu erzählen, mithilfe des Audiodateibearbeitungsprogramms Audacity ein Telefonfilter auf die Anruferstimmen gelegt, ähnlich wie dies bei der Originalaufgabe der Fall ist. Auch diaphasische und diamesische Markierungen wurden so präzise wie möglich berücksichtigt: Die Alltagsgespräche (vgl. Teilaufgabe 3 und 4) weisen Elemente des español coloquial (z. B. «Ya veo.», Teilaufgabe 4) auf und sind konzeptionell mündlich, enthalten also eine gewisse Anzahl an Elementen gesprochener Sprache, insbesondere Turn-Taking-Signale («Eh, Daniel, has recibido un mensaje.», Teilaufgabe 4), Kontaktsignale («Y tu contrato es caro, ¿verdad? », «Y por eso la tarjeta easy me viene mejor, ¿sabes? », Teilaufgabe 4), Interjektionen («¡Genial! », Teilaufgabe 4) und Abtönungsphänomene («Bueno, muchas gracias.», Teilaufgabe 4) (vgl. Koch/ Oesterreicher 2011). Allerdings entspricht die Intonation der norma castellana und enthält nur in Ansätzen diatopische Einflüsse aus der Region um Madrid (z. B. wird verdad [berˈðaθ] anstelle von [berˈða ð ] artikuliert; vgl. RAE 2005). Eventuell hätte, im Nachhinein betrachtet, versucht werden sollen, eine etwas stärkere diatopische Markierung aus Lateinamerika zu integrieren, um das Schwierigkeitsniveau noch genauer an die französischen Hörtexte anzupassen, welche von Sprecherinnen und Sprechern aus der Suisse Romande aufgenommen wurden. Dieser Aspekt soll bei der Auswertung der Ergebnisse der Hörverstehenstests entsprechend Berück‐ sichtigung finden. Bevor aber die Ergebnisse vorgestellt werden sollen, werden zunächst der Leseverstehenstest sowie der Schreibtest genauer erläutert. 9.2 Sprachtests 185 9.2.2 Der Leseverstehenstest Ähnlich wie beim Hörverstehenstest soll auch bezüglich des Leseverstehens‐ tests kurz erörtert werden, in welchem Rahmen dieser entwickelt wurde, wie das Konstrukt des fremdsprachlichen Leseverstehens definiert wird und welche Testbatterie konkret verwendet wird. Die Erstellung der Testaufgaben zum Leseverstehen verlief durch das IEF-Team in zwei Etappen (vgl. Lenz et al. 2006: 11): Auf die Phase der Aufga‐ benentwicklung folgte zwischen Januar und September 2005 die Erprobungs‐ phase, in der die Leseaufgaben zum ersten Mal in den Schulklassen eingesetzt wurden. Nach der Bearbeitung dieser Aufgaben sollten die Schülerinnen und Schüler zusätzlich jeweils einen Selbstbeurteilungsbogen ausfüllen, der bei der Kalibrierung der Items für die statistische Zuordnung der Testergebnisse zu den Feinniveaus mit hinzugezogen wurde. Zusätzlich wurden vom Europarat bereitgestellte Anker-Items in die Untersuchung einbezogen, welche die Zuord‐ nung der Testaufgaben zu den Feinniveaus auf Grundlage der ausgefüllten Selbstbeurteilungsbögen bestätigten. Schließlich erging auch die Bitte an die Lehrkräfte, Angaben zum Zeitbedarf zu notieren sowie die Aufgaben einzeln und im Gesamten betrachtet zu kommentieren. Als Ergebnis hieraus entstanden 52 Aufgaben à 293 Items für das Leseverstehen Englisch und 41 Aufgaben à ins‐ gesamt 289 Items für das Leseverstehen Französisch, entsprechende detaillierte Lösungs- und Bewertungsschlüssel, in die alle Erfahrungen aus den Korrekturen der Schülerbearbeitungen einflossen, sowie Score-Tabellen, in denen die Tester‐ gebnisse und Kompetenzniveaus pro Aufgabe aufeinander bezogen wurden (vgl. Lenz et al. 2006: 12). Lösungs- und Bewertungsschlüssel sowie Score-Tabellen liegen in ähnlicher Form auch für das Hörverstehen vor (vgl. Anhang 2.2.4). Das Konstrukt fremdsprachliches Leseverstehen, das lingualevel als Grundlage dient, ist präzise definiert und setzt sich aus drei Teilkonstrukten zusammen: 1) Prozesse des Lesens, 2) Funktionaler Literalitätsbegriff und damit verbundene Handlungsaspekte des Lesens sowie 3) Texttypen (vgl. Konsortium HarmoS Fremdsprachen 2009: 24). Beim fremdsprachlichen Leseverstehen laufen zahl‐ reiche kognitive Prozesse gleichzeitig ab: Neben den Prozessen, die konkrete sprachliche Ebenen betreffen (z. B. Worterkennung, Zugriff auf das mentale Lexikon und syntaktische Analyse), können Prozesse der Bedeutungs(re)kon‐ struktion und -zuweisung sowie Prozesse der inhaltlichen Erschließung von Zusammenhängen unterschieden werden (vgl. Alderson 2000; Nold/ Rossa 2007; Wolff 2002). Eine besondere Aufgabe beim Leseprozess besteht für den Lesenden darin, kognitiv flexibel zu sein (vgl. Ehlers 2006: 53) und die jeweiligen Teil‐ prozesse mittels der Verwendung dezidierter Strategien auf die Erfordernisse einer konkreten Lesesituation anzupassen, entsprechend zu regulieren und 186 9 Untersuchungsinstrumente deren jeweiligen Anteil am gesamten Leseprozess jedes Mal von neuem situa‐ tionsabhängig zu bestimmen (vgl. Phakiti 2007). Fremdsprachliche Leseprozesse werden insbesondere durch die Wortschatz- und Grammatikkenntnisse in der Fremdsprache beeinflusst, laufen oft langsamer ab als Leseprozesse in der Erstsprache und charakterisieren sich durch eine reduzierte Inferenzbil‐ dung. Das bedeutet, dass das Ziehen von über den Text hinausgehenden Schlussfolgerungen meist langsamer erfolgt oder sogar ausbleiben kann (vgl. top-down-Prozesse, z. B. in Finkbeiner 2005: 126), da die fremdsprachlichen Leseprozesse oftmals auf den Ebenen der Wort- und Syntagmenerkennung kaum automatisiert ablaufen und nur teilweise mit bereits verfügbaren Wis‐ sensbeständen verknüpft werden können. Bezüglich der Leseprozesse ist im Falle von lingualevel besonders zu beachten, dass bei diesem Testinstrument auf Basis von Urquhart und Weir (1998), Weir (2005) und Sigott et al. (2007) eine dichotome Unterscheidung zwischen zwei verschiedenen Leseintentionen erfolgt (vgl. Konsortium HarmoS Fremdsprachen 2009: 33): 1) Sorgfältig-genaues Lesen (careful reading), also genaues Verstehen bzw. Detailverstehen von Textelementen, Textstellen oder des gesamten Textes und 2) erkundendes und selektives Lesen (expeditious reading), also eine Kategorie der Leseintention, die skimming als überfliegendes Lesen und scanning als durchsu‐ chendes Lesen, um Einzelinformationen und Details zu finden, zusammenfasst, wobei das Ziel ein eher rasches, zum Teil grobes Verstehen ist. Für beide Lesearten liegen präzise Konstruktbeschreibungen vor (vgl. Kon‐ sortium HarmoS Fremdsprachen 2009: 33): Sorgfältig-genaues Lesen besteht zum einen aus dem Prozess des Identifizierens, Verstehens und teilweise auch Vergleichens von Fakten, Definitionen oder Meinungen und zum anderen enthält dieses Konstrukt auch Verstehensprozesse von Hauptgedanken, die vorwiegend über das Erfassen der Textstruktur sowie die entsprechende Ge‐ wichtung von Informationen und/ oder relevanten Details, wie beispielsweise stützenden Argumenten, abläuft. Außerdem beinhaltet sorgfältig-genaues Lesen auch den Erschließungsprozess von impliziten Informationen auf Grundlage von expliziten Informationen, also das propositionale Inferieren. Sorgfältig-ge‐ naues Lesen kann durchaus entdeckendes und selektives Lesen voraussetzen, wobei beide Leseprozesse trotzdem durch den Text als zwei unterschiedliche Teilkonstrukte des Lesens aufgefasst werden. Der zweite Bereich des Konstrukts fremdsprachliches Lesen bezieht sich, wie bereits erwähnt, auf funktionale Literalität und Handlungsaspekte des Lesens. Dieser Bereich definiert das Lesen als funktionale und soziale Handlung in unterschiedlichen Handlungsbereichen (vgl. hierzu auch Kap. 4.4.1 des GeR, Europarat 2001) im rezeptiv-schriftlichen Alltag der Schülerinnen und Schüler. 9.2 Sprachtests 187 Diese Dimension umfasst zwei im Sinne der Kompetenzorientierung entschei‐ dende Vorteile, da sie zum einen die Einordnung des Lesens in das Modell der kommunikativen Sprachverwendung erlaubt und zum anderen einen direkten Anschluss an die PISA-Untersuchungen und deren Konzept der Reading Literacy ermöglicht, welches durch das HarmoS Konsortium Fremdsprachen (2009: 25) mittels einer umfassenden empirischen Studie vom erstsprachlichen auf das fremdsprachliche Lesen übertragen wurde. Als Ausgangspunkt für die Untersuchung der Reading Literacy gilt weiterhin die Definition der PISA-Stu‐ dien: “Reading literacy is understanding, using and reflecting on written texts, in order to achieve one’s goal, to develop one’s knowledge and potential and to participate in society“ (OECD 2003: 108). Im Sinne der Kompetenz- und Handlungsorientierung werden beim Lese‐ verstehen in lingualevel ferner, in Anlehnung an die fünf Diskurstypen Infor‐ mieren/ Beschreiben, Erzählen/ Berichten, Auffordern/ Veranlassen, Meinungs‐ äußerung/ Argumentieren sowie das Unterhalten von Beziehungen (vgl. Kapitel 9.2.3) und entsprechen der Kategorisierung in PISA drei Handlungsaspekte unterschieden: Informationen entnehmen, Interpretieren, (Sich) in Beziehung setzen bzw. Evaluieren (vgl. OECD 2003). Um eine Informationsentnahme handelt es sich dann, wenn in einem Lesetext Informationen gefunden und verstanden werden, was meist das Ergebnis von überfliegenden und durchsuchenden Leseprozessen ist. Hingegen handelt es sich um eine Interpretation, wenn ein breites bzw. allgemeines Verständnis des gesamten Textes durch den Lesenden geleistet wird, was durch das Erkennen von Bezügen innerhalb des Textes oder das Verstehen von übergreifenden Gedanken entsteht, und gleichzeitig ein genaues und umfassendes Verständnis erfolgt, wodurch Zusammenhänge zwischen Textteilen ein und desselben Textes oder zwischen mehreren Texten erfasst werden. Schließlich bezeichnet (Sich) in Beziehung setzen bzw. Evaluieren den Lesevorgang, bei dem textexternes Wissen (beispielsweise Weltwissen oder Wissen aus anderen Texten) herangezogen wird, um Informationen aus dem Lesetext zu verstehen; hierbei finden Prozesse des Vergleichens und In-Beziehung-Setzens zwischen dem textexternen Wissen des Lesenden und dem während des Leseprozesses aus dem Lesetext entnommenem Wissen statt (vgl. Konsortium HarmoS Fremdsprachen 2009: 25-26). Während Informationen entnehmen und Interpretieren durch das Testmaterial steuerbar sind, nimmt (Sich) in Beziehung setzen bzw. Evaluieren auf die allgemeinen Kompetenzen des lesenden Individuums und insbesondere auf sein savoir, also Weltwissen (vgl. Europarat 2001) Bezug. Allerdings wurde von den Testentwicklerteams von lingualevel nicht versucht, diese letzte Komponente des (Sich) in Beziehung Set‐ zens bzw. Evaluierens zu operationalisieren, da das Weltwissen des Lesenden im 188 9 Untersuchungsinstrumente 104 In der Literatur gibt es zahlreiche verschiedene Definitionen von Textsorten und Text‐ typen (vgl. Adamzik 2008: 168-169). Nach der hierarchischen Stufung von Text-Klassen nach Heinemann und Heinemann (2002: 143) bezeichnen Texttypen Textklassen hohen Abstraktionsniveaus, die sich nach ihrer Funktion unterscheiden. So kann ein Reise‐ wetterbericht als informierender Texttyp klassifiziert werden, wobei es sich um die Textsorte Wetterbericht und schließlich um die Textsortenvariante Reisewetterbericht handelt. Leseverstehenstest kein explizites Messkonstrukt darstellen sollte. Nichtsdesto‐ trotz wurde diese Dimension implizit berücksichtigt, indem in den Vorstudien und Pretests nach thematischen Interessen der Schweizer Jugendlichen gefragt wurde, um diese in den Sprachtests aufzugreifen und so möglichst Themen‐ gebiete zu integrieren, die bei einer breiten Mehrheit der Schülerinnen und Schüler als bekannt gelten können (vgl. Konsortium HarmoS Fremdsprachen 2009: 28). Da die Schweiz und Baden-Württemberg sowohl geographisch als auch kulturell nahe Bezüge aufweisen, kann davon ausgegangen werden, dass in beiden Regionen weitestgehend ähnliche Interessensgebiete bei Gleichaltrigen vorliegen (vgl. Shell Deutschland Holding 2019; Suter et al. 2018). Der dritte Bereich des Testkonstrukts fremdsprachliches Lesen ist neben den Prozessen des Lesens, dem funktionalen Literalitätsbegriff und den damit ver‐ bundenen Handlungsaspekten des Lesens schließlich derjenige der Texttypen. Dieser Bereich definiert den Anspruch, ein breites Spektrum an Texttypen und -sorten 104 in den Lesetests anzulegen, was durch die aus der Textlinguistik stammende Einteilung der Texttypen in informative/ deskriptive, expositorische, narrative, argumentative und instruktive Texte gewährleistet wird (vgl. Stede 2018). Die Vielfalt der Textsorten stammt aus den Bereichen „Medien“, „Schule“ und „privates Umfeld“; narrative Texte finden folglich genauso Berücksichti‐ gung wie kontinuierliche argumentative Sachtexte. Schließlich wurden auch diskontinuierliche Texte mit einbezogen, da diese im Speziellen die funktionale Literarität anwendbar werden lassen, weil sie im rezeptiv-schriftlichen lebens‐ weltlichen Alltag der Schülerinnen und Schüler besonders häufig auftreten (vgl. Konsortium HarmoS Fremdsprachen 2009: 26). Trotz der bisher genannten Bereichsspezifika stellt sich dennoch die Frage, inwiefern sich die oben genannten Teilbereiche des Konstrukts fremdsprachliche Lesekompetenz aus empirischer Sicht tatsächlich unterscheiden lassen (vgl. Alderson 2000: 95; Weir 2005: 87). Im Zuge der Erstellung von Aufgabenbatterien durch das Konsortium HarmoS Fremdsprachen (2009: 36, 42) ergab eine umfas‐ sende statistische Analyse bezüglich dieser Feinunterscheidungen in Form von Berechnungen latenter Korrelationen direkt zum Zeitpunkt der Skalierung der Items mithilfe der Statistiksoftware ConQuest, dass mit einiger statistischer 9.2 Sprachtests 189 105 Siehe hierzu das Modell von Ballstaedt (1997), das Textverarbeitung und Textverstehen als reduktive Verarbeitung auffasst, welche in basale, semantisch-syntaktische, elabo‐ rative und reduktive Verarbeitung unterteilt wird. Sicherheit sorgfältig-genaues Lesen einerseits sowie erkundendes und selektives Lesen andererseits durchaus zwei empirisch unterscheidbare Dimensionen der fremdsprachlichen Lesekompetenz darstellen könnten, da sich eine latente, messfehlerbereinigte Korrelation von .72 ergab. Während die Analyse der Handlungsaspekte zwar Indizien bezüglich einer gewissen Eigenständigkeit der Dimension (Sich) in Beziehung setzen/ Evaluieren ergab (Korrelationswert .78 zwischen (Sich) in Beziehung setzen/ Evaluieren und Informationen entnehmen und Korrelationswert .77 zwischen (Sich) in Beziehung setzen/ Evaluieren und Interpretieren), jedoch für eine abschließende Aussage zu wenig Items für diese Dimension vorlagen, wurde als Endergebnis eine fehlende Abgrenzbarkeit der Dimensionen Informationsentnahme und Interpretation festgestellt, worauf der relativ hohe Korrelationswert von .87 zwischen diesen beiden Dimensionen hinweist. Die Analyse der Texttypen hatte wiederum zum Ergebnis, dass, zusammenfassend betrachtet, Texttypen eher nicht als eigene Dimension der fremdsprachlichen Lesekompetenz zu werten sind (vgl. Konsortium HarmoS Fremdsprachen 2009: 36). Es erhärten sich also bei der Studie des Konsortiums HarmoS Fremdsprachen (2009: 42) die Hinweise darauf, dass insbesondere sorg‐ fältig-genaues Lesen und erkundendes und selektives Lesen bei Schülerinnen und Schülern jeweils anders funktionieren und folglich in den Testbatterien darauf zu achten ist, beide Leseprozesse explizit zu berücksichtigen - ein Ergebnis, das einen entscheidenden Beitrag zur empirischen Validierung des Konstrukts fremdsprachliches Lesen leisten konnte, welches aber nichtsdestotrotz noch weiterer Differenzierungen bedürfte. Auch bezüglich möglicher Geschlechter‐ unterschiede muss somit zwischen diesen beiden Teilkonstrukten differenziert werden. Schließlich weist Weir (2005: 89) in diesem Zusammenhang darauf hin, dass ein sorgfältiger Umgang mit den einzelnen Items des Lesetests in Bezug auf die Messung der fremdsprachlichen Lesekompetenz bedeutend wichtiger ist, als zu versuchen, alle Dimensionen der Lesekompetenz umfassend zu testen. Als Schlussfolgerung aus den Ausführungen zu den Dimensionalitäten des Lesens wurden durch das HarmoS Fremdsprachenkonsortium zwei wesent‐ liche methodologische Entscheidungen getroffen: Da erstens innerhalb des Forschungsdiskurses noch unklar ist, ob Konstruktkomponenten empirisch unterschieden werden können, wurden nicht-reduktive Tests, also Tests, die sich nicht auf das Zusammenfassen von Textpassagen stützen 105 , zur Messung der allgemeinen Leseverstehenskompetenz als sicherste Testvariante festgelegt (vgl. Alderson 2000: 206-207). Als zweites wurde die Entscheidung getroffen, 190 9 Untersuchungsinstrumente statistische Analysen zur Dimensionalität des Konstrukts auf Grundlage genau beschriebener Items durchzuführen, die zu den oben genannten Korrelationser‐ gebnissen führten. Mit dem Ziel der Interpretation der empirischen Itemschwie‐ rigkeit wurden außerdem die Items in Bezug auf die durch das Konstrukt fokussierte Komponenten einschließlich ausgewählter Aspekte sprachlicher Kompetenz beschrieben (vgl. Konsortium HarmoS Fremdsprachen 2009: 28). - 9.2.2.1 Der Leseverstehenstest in Französisch Um all diese Komponenten des fremdsprachlichen Lesens zusammenfassend gra‐ phisch darzustellen, wurden vom Konsortium HarmoS Fremdsprachen (2009: 28) Construct Maps zunächst in Form von Merkmalsmatrizen und Kompetenz‐ beschreibungen angefertigt. Auch die Aufgaben und Deskriptoren von IEF/ lin‐ gualevel wurden in diesem Kontext durch das Konsortium erneut analysiert. Die Construct Map des für die vorliegende Studie und die vorgesehene Stichprobe ausgewählten Lesetests, deren Zusammensetzung und Reihenfolge zum Ziel der „Standortbestimmung“ durch lingualevel in dieser Weise festgelegt wurde, setzt sich aus drei Teilbereichen zusammen (vgl. Tabelle 2). 9.2 Sprachtests 191 106 Die Handlungsaspekte sind im Gegensatz zu den anderen Konstruktmerkmalen Texttyp, intendierte Lesart/ Leseprozess und Antwort-Format nicht direkt im Testma‐ terial benannt (vgl. Anhang 2.2.1). Sie können aber ausgehend von den durch das Konsortium HarmoS Fremdsprachen (2009: 29) aufgeführten Beziehungen zwischen den Leseprozessen und den Handlungsaspekten abgeleitet werden. Nr. IEF-LV- Items und Ni‐ veau Validierte Deskriptoren Charakterisierung der Item-Merkmale Textsorte, Texttyp und Textmerk‐ male Inten‐ dierte Leseart; Hand‐ lungsas‐ pekt 106 Antwort- Formate 1 LV-32 Um‐ frage A2.1-B1.1 Le03: Ich kann ein Formular gut genug verstehen, um zu wissen, wo ich die wichtigsten Angaben zu mir selbst (beson‐ ders Namen, Geburts‐ datum, Adresse) hin‐ schreiben muss. Le40: Ich kann in einfachen Texten aus dem Alltag, wie z.-B. E-Mail, Infor‐ mations- und Werbe‐ broschüren, wichtige Informationen finden und verstehen. Umfrage der Zeitschrift „Rockland“, einfacher Fragebogen; ein diskonti‐ nuierlicher Text (erster Teil: persön‐ liche An‐ gaben zu Jé‐ rôme) und ein tenden‐ ziell deskrip‐ tiver Text (zweiter Teil: Fragen und Antworten) - Sorgfältiggenaues Lesen; In‐ formati‐ onsent‐ nahme Multiple Matching 2 LV-33 Kurze Ge‐ schichte A2.2-B1.1 Le37: Ich kann in einer kurzen, klar auf‐ gebauten Geschichte in groben Zügen verstehen, was pas‐ siert, und ich kann er‐ kennen, welches die wichtigsten Personen sind. Kurzge‐ schichte; nar‐ rativer Text Sorgfältiggenaues Lesen; In‐ formati‐ onsent‐ nahme Multiple Choice 192 9 Untersuchungsinstrumente Nr. IEF-LV- Items und Ni‐ veau Validierte Deskriptoren Charakterisierung der Item-Merkmale Textsorte, Texttyp und Textmerk‐ male Inten‐ dierte Leseart; Hand‐ lungsas‐ pekt Antwort- Formate 3 LV-30 Dafür oder Da‐ gegen? A2.2-B1.2 Le54: Ich kann kurze Texte zu aktu‐ ellen oder vertrauten Themen verstehen, in denen Meinungen, Einschätzungen oder Haltungen dargelegt werden (z.-B. kri‐ tische Beiträge in einem Internet-Dis‐ kussionsforum oder Leserbriefe). Le31: Ich kann in einfachen, kurzen Texten (z.-B. in Leserbriefen, Diskus‐ sions-beiträgen im In‐ ternet) das Wichtigste verstehen, wenn mir die Themen vertraut sind. Sechs kurze Meinungs‐ texte/ Dis‐ kussionsbei‐ träge; argumenta‐ tive Texte Erkun‐ dendes Lesen; In‐ terpre‐ tieren Multiple Matching Anmerkungen. Die Strukturierung der Construct Map orientiert sich an dem Beispiel für eine Construct Map des Konsortium HarmoS Fremdsprachen (2009: 29). Die Codes der Deskriptoren stehen jeweils bei den Aufgabenstellungen in den originalen Testunterlagen und die vollständigen Formulierungen der Deskriptoren wurden über das Begleitmaterial von Lenz/ Studer 2008d über den lizensierten Internetzugang abgerufen. Auch die Informationen zur Textsorte, zu den Textmerkmalen, zu den intendierten Lesarten und zu den Antwort Formaten befinden sich im vom Schulverlag für lingualevel bereitgestellten Zusatzmaterial (vgl. Anhang 2.2.4). Tabelle 2: Construct Map des Leseverstehenstests von lingualevel An der Construct Map ist gut ersichtlich, dass die Aufgaben dezidiert die beiden durch das Konsortium HarmoS Fremdsprachen definierten Leseprozesse sorgfältig-genaues Lesen sowie erkundendes und selektives Lesen beinhalten. Außerdem werden bewusst unterschiedliche Texttypen des Konstrukts berück‐ sichtigt: In den Aufgaben für die vorliegende Studie handelt es sich um einen diskontinuierlichen, einen narrativen Text und um sechs kurze argumentative Texte. Dennoch stand beim Konsortium HarmoS Fremdsprachen (2009: 29) bei der Aufgabenentwicklung ein ausgewogenes Verhältnis aller Konstruktkompo‐ nenten, so wie es in der ausgewählten Aufgabenkombination vorliegt, nur 9.2 Sprachtests 193 bedingt im Mittelpunkt; eine höhere Priorität hatte eine sinnvolle Kombination zwischen dem jeweiligen Leseprozess und dem jeweiligen Texttyp (vgl. Weir 2005: 69): Während sich die Messung von erkundendem und selektivem Lesen bei den argumentativen, meinungsbetonten Texten anbietet, weil diese als konstitutives Merkmal Geflechte von (neben)satzübergreifenden Zusammen‐ hängen, sogenannten Makropropositionen beinhalten, bietet sich die Messung von sorgfältig-genauem Lesen vielmehr bei deskriptiven Texten an, weil diese im Allgemeinen eine größere Anzahl an faktischen Details aufweisen. Was allerdings aus den Zusatzinformationen zu den Testmaterialien von lingualevel nicht direkt hervorgeht, ist die Antwort auf die Frage, inwieweit die Testaufgaben unterschiedliche Handlungsaspekte umfassen (Informationen entnehmen, Interpretieren, (Sich) in Beziehung setzen bzw. Evaluieren), was jedoch laut Konsortium HarmoS Fremdsprachen (2009: 28) durchaus bei der Aufgaben‐ konstruktion berücksichtigt wurde. Dies wurde daher nach einer Analyse der Lesetexte und der entsprechenden Leseaufträge bzw. Aufgabenformate rekon‐ struiert und entsprechend in der Construct Map ergänzt. Die Analyse basiert auf der Annahme, dass zwischen den jeweiligen Leseprozessen und Handlungsa‐ spekten spezifische Beziehungen existieren: Es besteht demzufolge einerseits eine enge Relation zwischen dem selektiven Lesen und der Informationsent‐ nahme. Genauso lässt sich diese Relation zwischen dem sorgfältig-genauen Lesen und der Informationsentnahme feststellen. Andererseits besteht eine lose Beziehung zwischen dem Interpretieren und dem erkundenden und/ oder dem selektiven Lesen (vgl. Konsortium HarmoS Fremdsprachen 2009: 29). Überdies ergaben die statistischen Korrelationsanalysen des HarmoS Konsortium Fremd‐ sprachen (2009: 36), wie bereits erläutert, keine trennscharfe Unterscheidung der Handlungsaspekte Informationen entnehmen und Interpretieren, weshalb eine diskutable Zuweisung der Handlungsaspekte zunächst keine statistische Auswirkung auf das eigentliche Testergebnis, sondern lediglich auf dessen Interpretation hätte. Ein sehr bedeutender Aspekt bei der Überprüfung des fremdsprachlichen Leseverstehens ist außerdem das Antwortformat, welches entsprechend neuerer Forschungen einen erheblichen Einfluss auf die Messung des Konstrukts hat (vgl. z. B. Bäuerlein 2014; Rupp et al. 2006). Daher ist das Antwortformat ein Kernelement der Testkonstruktion. Problematisch ist jedoch, dass alle derzeit existierenden Antwortformate ihre eigenen Stärken und Schwächen aufweisen und von der Forschung noch kein Antwortformat entwickelt wurde, das ausschließlich Vorteile und keinerlei Nachteile birgt: Insbesondere das Multiple-Choice-Format wird bezüglich seines Einflusses auf die Messung des Konstrukts kritisiert (vgl. Kobayashi 2002; Rupp et al. 2006), da zum 194 9 Untersuchungsinstrumente 107 Vgl. hierzu die Form der halboffenen Testaufgabe in Form von offenen Lücken in Sätzen, die durch die Probandinnen und Probanden in einer Testaufgabe der ausgewählten Testbatterie für das Hörverstehen ausgefüllt werden müssen (vgl. Teilaufgabe 5 „Wer‐ bespots“ (HV-27, vgl. Kapitel 9.2.1 und Anhang 2.1.3). einen eine Ratewahrscheinlichkeit besteht und zum anderen die Distraktoren einen unerwünschten Einfluss haben können, auch weil diese in außerschuli‐ schen oder in Nicht-Test-Situationen kaum Teil des Leseprozesses sind. Wei‐ terhin kann der Einfluss der Distraktoren für die jeweiligen Probandinnen und Probanden individuell unterschiedlich groß sein, was gleichzeitig kaum messbar ist (vgl. Konsortium HarmoS Fremdsprachen 2009: 30). Alderson (2000: 206) empfiehlt aufgrund der Defizite jedes einzelnen Antwortformats eine Kombination aus unterschiedlichen Formaten, weshalb in lingualevel sowohl Multiple-Choice-Formate, meist mit drei Antwortmöglichkeiten, wie in Teilaufgabe 2 „Kurze Geschichte“ (LV-33) der ausgewählten Testbatterie, Multiple Matching, d. h. Vergleichs- und Zuordnungsformate wie in Teilaufgabe 1 „Umfrage“ (LV-32) und Teilaufgabe 3 „Dafür oder dagegen? “ (LV-30), und schließlich auch offene Formate verwendet werden, wobei letztere nicht in der ausgewählten Testbatterie vorkommen. Offene Antwortformate haben darüber hinaus den entscheidenden Nachteil, dass die Antworten der Probandinnen und Probanden oft durch die auswertenden Forschenden interpretiert und entsprechend kategorisiert werden müssen, was trotz qualitativ hochwertiger Lösungsschlüssel und Ratertrainings zu erheblichen Unterschieden in den einzelnen Bewertungen führen kann (vgl. Konsortium HarmoS Fremdsprachen 2009: 30). 107 Die statistischen Analysen, die im Rahmen der Aufgabenverfeinerung durch das Konsortium HarmoS Fremdsprachen (2009: 36, 43) durchgeführt wurden, deuten darauf hin, dass es sich bei den drei Aufgabenformaten um empirisch unterscheidbare Dimensionen handelt, da die Werte für die latenten Korrela‐ tionen zwischen Multiple Choice und Multiple Matching bei .67 sowie zwischen Multiple Choice und Kurzantwort bei .62 liegen. Selbst die Korrelation zwischen Multiple Choice und kombinierten Formaten, die alle drei Antwortformate in sich kombinieren, liegt lediglich bei .73. Im Umkehrschluss bedeutet dies, dass eine Lernende bzw. ein Lerner durchaus unterschiedliche Leistungen bei unterschiedlichen Antwortformaten erzielen kann und nicht davon auszugehen ist, dass eine erfolgreiche Bearbeitung von Multiple-Choice-Aufgaben auch eine erfolgreiche Bearbeitung von Multiple-Matching-Aufgaben zur Folge hat und umgekehrt. Alle drei Aufgabenformate haben also einen erheblichen leistungsdifferen‐ zierenden Einfluss auf das Ergebnis. Folglich ist dringend auf die Mischung 9.2 Sprachtests 195 108 Hierbei muss einschränkend angemerkt werden, dass die tatsächliche Erfüllung der vom Test intendierten Leseintention durch die Probanden in quantitativen Tests nicht nachvollziehbar bleibt. Wenn herausgefunden werden soll, ob die unterschiedlichen Le‐ seintentionen bzw. Leseprozesse tatsächlich eingesetzt werden, bedarf es quantitativer Untersuchungen, die beispielsweise auf die Forschungsmethode des lauten Denkens zurückgreifen (vgl. Konsortium HarmoS Fremdsprachen 2009: 37). von Aufgabenformaten innerhalb des Lesetests zu achten, wobei berücksichtigt werden muss, dass Multiple-Matching-Aufgaben besser dafür geeignet sind, entdeckendes Lesen anzuregen als Multiple-Choice-Aufgaben (vgl. Konsortium HarmoS Fremdsprachen 2009: 37). 108 Diese Kriterien wurden in der für die vorlie‐ gende Studie erfolgten Testauswahl angemessen berücksichtigt (vgl. Construct Map in Tabelle 2). Somit sollte im Anschluss bei der Auswertung der Einfluss der Formate analysiert werden. Die Lesetests von lingualevel bieten schließlich noch weitere, durch das Konsortium HarmoS Fremdsprachen (2009: 29-30) und Lenz et al. (2006: 10-11) klar ausgewiesene Vorteile: Zum einen sind alle Lesetexte authentisch oder „nah-authentisch“, d. h. beispielsweise lediglich leicht gekürzt und zum anderen sind die Lesetexte aus potenziellen Handlungsbereichen der Schülerinnen und Schüler entnommen: Die Hauptquellen stellen, im Falle des für die vorliegende Studie ausgewählten Teils der Testbatterie, Zeitschriften und Magazine für junge Leserinnen und Leser sowie Internetchats und -foren dar. Zum anderen werden, nach den Kriterien der Kompetenz- und Anwendungsorientierung, alle Testaufgaben in einen Handlungsrahmen bzw. eine zielgruppenspezifische Situierung eingebettet, welche den Zweck des Lesens plausibel machen und auch die Validität des Lesetests erhöhen, da die Nähe zu Leseabsichten in realen Lebenssituationen gegeben ist (vgl. Alderson 2000: 83). Die situationelle Einbet‐ tung wird exemplarisch aus der im Textmaterial abgedruckten Hinführung zu Teilaufgabe 1 „Umfrage“ (LV-32) ersichtlich: LV_32: Die französische Jugend- und Musikzeitschrift „Rockland“ macht regelmäßig Umfragen, um über die Ansichten und Gewohnheiten ihrer Leserinnen und Leser mehr zu erfahren. Jérome aus Nyon am Genfersee ist Leser von „Rockland“ und nimmt an der Umfrage teil. (vgl. Anhang 2.2.2, Lenz/ Studer 2008d) Sowohl die Situierungen als auch die Aufgabenstellungen und Testfragen sind auch im Leseverstehenstest von lingualevel durchgehend auf Deutsch und somit in der lokalen Schulsprache verfasst. Die explizite Vermeidung der Fremdsprache in diesen Aufgabenteilen wird bezüglich der Lesetests in der Weise begründet, dass einerseits sichergestellt werden soll, dass die Schüle‐ rinnen und Schüler die Aufgabenstellung verstehen. Andererseits soll dadurch 196 9 Untersuchungsinstrumente vermieden werden, dass die fremdsprachliche Lesekompetenz in Bezug auf die Situierungs-, Aufgabenstellungs- und Testfragentexte getestet wird, welche teilweise Zusatzinformationen bzw. Distraktoren beinhalten und somit nicht Teil des zu messenden Konstrukts sind. Schließlich soll durch die Verwendung der Schulsprache Deutsch außerhalb der Lesetexte das Risiko umgangen werden, dass Antworten nur gegeben werden, weil einzelne identische Wörter sowohl im Lesetext als auch in der Testfrage bzw. in der Formulierung einer Antwortmöglichkeit, beispielsweise im Rahmen von Multiple-Choice-Aufgaben, vorkommen; die Herstellung dieses Zusammenhangs wäre als Fähigkeit zur Worterkennung zu beschreiben, aber nicht als Teilkonstrukt des fremdsprachlichen Leseverstehens (vgl. Konsortium HarmoS Fremdsprachen 2009: 30). Auch dieses Spezifikum des Leseverstehens‐ tests soll bei der Interpretation der Studienergebnisse Berücksichtigung finden. Schließlich soll darauf hingewiesen werden, dass die Originaltests im Fran‐ zösischen geringfügig adaptiert wurden: So wurde in der ersten Teilaufgabe „Eine Umfrage der Zeitschrift Rockland“ der Nachname Loosli durch den fran‐ zösischen Nachnamen Leclerc ersetzt, da Loosli nicht eindeutig als Nachname zu identifizieren ist. Außerdem wurde zum Ziel der besseren Verständlichkeit ebenfalls in der ersten Teilaufgabe die Angabe CH-1260 durch F-75000 ersetzt. Schließlich wurde in der zweiten Teilaufgabe „Eine kurze Geschichte verstehen“ das passé simple durch das passé composé ersetzt, da die Aufgabe das Niveau A2.2 bis B1.1 abprüft und das passé simple auf dieser Niveaustufe nach dem GeR noch nicht verstanden werden muss (vgl. Chauvet 2008; Europarat 2001; vgl. Anhang 2.2.1 und 2.2.2). - 9.2.2.2 Der Leseverstehenstest in Spanisch Ähnlich wie beim Hörverstehenstest wurde der Leseverstehenstest von lingu‐ alevel (vgl. Lenz/ Studer 2008a), welcher ausschließlich für das Französische vorliegt, für das Spanische adaptiert. Hierfür wurden die Lesetexte vom Franzö‐ sischen ins Spanische übersetzt und insbesondere Toponyme, Personennamen und kulturelle Besonderheiten angepasst, welche aber auf wenige Aspekte begrenzt sind. Dies betrifft insbesondere die erste Teilaufgabe „Eine Umfrage der Zeitschrift Rockland“, bei der Jerôme durch Jaime ersetzt wird, die Postleitzahl E-45001 anstelle von F-75000 verwendet wird sowie die spanische Straßenbe‐ zeichnung Calle Real n° 5 anstelle von 35, rue du Marché eingesetzt wird. Außerdem wurden in der dritten Teilaufgabe „Dafür oder dagegen? “ andere Per‐ sonennamen verwendet, welche in spanischsprachigen Ländern geläufig sind. Ansonsten treten hier weniger kulturelle Bezüge auf als im Hörverstehenstext, 9.2 Sprachtests 197 109 Hyland (2016: 4) definiert als Oberflächenelemente Vokabular und Grammatik und stellt diese der Diskursstruktur gegenüber, wobei er Diskurs folgendermaßen defi‐ niert: “Discourse refers to language in action, and tot he purposes and functions lingiustic forms serve in communication. Here the linguistic patterns of texts point to contexts beyond the page, implying a range of social constraints and choices which operate on writers in any context” (Hyland 2016: 6). sodass insgesamt weniger Veränderungen aufgrund kultureller Unterschiede stattfanden (vgl. Anhang 2.2.3). 9.2.3 Der Schreibtest Nun soll schließlich der Schreibtest von lingualevel (vgl. Lenz/ Studer 2008a) in seinen Details betrachtet werden. Hierfür soll zunächst das Schreibkonstrukt erläutert werden, bevor auf die Testentwicklung durch das IEF-Team genauer eingegangen wird und die Aufgabenformate im Detail erläutert werden. Schließ‐ lich wird die konkrete Testbatterie vorgestellt, die in der vorliegenden Studie eingesetzt wird. Als Grundlage für den Test der produktiven schriftlichen Fertigkeiten dient lingualevel das sozio-kognitive Modell des Schreibens von Hyland (2002, 2016) sowie Shaw und Weir (2007: 62), das sowohl sprachlich-kognitive Kompetenz‐ aspekte in sich integriert als auch die Fähigkeit des Lernenden, Kontextfaktoren angemessen zu berücksichtigen (vgl. Hyland 2016: 89; Konsortium HarmoS Fremdsprachen 2009: 45). Diese Kontextfaktoren in Form von Settings und Handlungsfoki, die eine Konsequenz aus dem kommunikativen und hand‐ lungsorientierten Ansatz darstellen und einen realitätsnahen kommunikativen Schreibanlass schaffen sollen, sind durch die Probanden direkt aus den Auf‐ gabenstellungen im Testmaterial zu entnehmen; dementsprechend wird bei den Schreibaufgabentypen von lingualevel zwischen den Diskurstypen Infor‐ mieren/ Beschreiben, Erzählen/ Berichten, Auffordern/ Veranlassen, Meinungsäuße‐ rung/ Argumentieren sowie Unterhalten von Beziehungen unterschieden (vgl. Konsortium HarmoS Fremdsprachen 2009: 45). Der Vorteil des Modells von Hyland (2002, 2016) ist, dass es mehr als nur die Oberflächenstruktur eines Textes 109 erfasst, da es diesen als Diskurs auffasst. Hyland (2002: 11; 2016: 6) schreibt dem Terminus ‚Diskurs‘ die Eigenschaften language as use bzw. language in action und die damit einhergehende Erfüllung von Intentionen und Funktionen durch die verwendeten sprachlichen Mittel zu. Die Ziele des bzw. der Schreibenden, in Form von einerseits Informationsvermittlung und andererseits kommunikativer Beziehungsgestaltung zum bzw. zur Lesenden, 198 9 Untersuchungsinstrumente 110 Was in der vorliegenden Studie unter sprachlicher Richtigkeit, Grammatik, Syntax oder auch Kohärenz und Kohäsion verstanden wird, wird in Kapitel 11.4.4 ausführlich dargelegt. werden in erster Linie durch Textformen erreicht, die sich dem entsprechenden sozialen Kontext anpassen (vgl. Shaw/ Weir 2007: 62). Was die sprachlich-kognitiven Aspekte des lingualevel zugrundeliegenden Schreibkonstrukts betrifft, so können die Teilkonstrukte Makroplanung (macro-planning), Gliederung (organisation), Mikroplanung (micro-planning), sprachliche Umsetzung (translation), Monitoring (monitoring) und Überarbei‐ tung (revision) unterschieden werden (vgl. Shaw/ Weir 2007: 38-42). Die Makro‐ planung umfasst das Sammeln von Ideen und das Erfassen der Rahmenbedin‐ gungen bezogen auf Textsorte, Leser(schaft) und Kommunikationsziel(e). Die Gliederung bezieht sich hingegen auf das Ordnen der Ideen und das Bestimmen des Bezugs zwischen ihnen. Außerdem umfasst sie eine Unterteilung in primäre und sekundäre Ziele, wobei letztere von weniger starker Bedeutung sind (vgl. Shaw/ Weir 2007: 38). Die Mikroplanung geht von der Fokussierung auf den als Nächstes zu produzierenden Textteil aus, wobei zwei Planungsaufgaben auf den Schreibenden bzw. die Schreibende zukommen: Zum einen muss das kommunikative Teilziel jedes einzelnen Textabschnitts und dessen Bezug zum allgemeinen Primärziel der Schreibaktivität bestimmt werden und zum anderen besteht die Notwendigkeit, innerhalb des Textabschnitts eine unmittelbare Strukturierung der niederzuschreibenden Sätze und der darin enthaltenen In‐ formationen vorzunehmen. Die sprachliche Umsetzung (translation) bezeichnet schließlich die bewusste Umwandlung von Informationen von einer individuell angelegten und abstrakten in eine konkrete sprachliche Form (vgl. Shaw/ Weir 2007: 39-40). Field (2005, zit. nach Shaw/ Weir 2007: 41) geht davon aus, dass eine individuelle interne Repräsentation des Inhalts im Gedankenkonstrukt des oder der Schreibenden vorliegt, welche ausschließlich er bzw. sie selbst versteht und die zwar noch keiner spezifischen Sprache zugeordnet werden kann, dennoch möglicherweise zum Teil auf den individuellen Erfahrungen in der L1 basiert und sich eventuell sogar dessen Lexik bedient. Während des Schreibprozesses müssen also die individuell verwendeten abstrakten Informa‐ tionsträger in das Zeichensystem der Zielsprache übertragen werden. Nachdem diese Umformung stattgefunden hat, finden Monitoring-Prozesse statt in Form einer Überprüfung des eigenen Textes bezüglich der sprachlichen Richtigkeit auf Ebene der Orthographie, Zeichensetzung, Grammatik und Syntax sowie bei fortgeschrittenen Lernenden auch bezüglich der textstrukturellen Ebene, also Kohärenz, Kohäsion und Argumentationsstruktur. 110 Als Ergebnis aus den Monitorprozessen wird der bzw. die Schreibende laut dem Modell voraussicht‐ 9.2 Sprachtests 199 111 Das Kernteam bestand aus Ruth Keller und Peter Lenz (vgl. Konsortium HarmoS Fremdsprachen 2009: 47). lich bestimmte Textteile überarbeiten, indem er diese korrigiert, anpasst oder eventuell sogar neu formuliert. Diese Überarbeitungsprozesse (revision) finden nach Beendigung der Textproduktion statt (vgl. Shaw/ Weir 2007: 42). Das Konsortium HarmoS Fremdsprachen (2009: 44-45) weist aber explizit darauf hin, dass nicht davon auszugehen ist, dass die Schreibentwicklung von Neuntkläss‐ lerinnen und Neuntklässlern weder auf sozialer noch auf kognitiver Ebene und weder in der L1 noch in den sich im Lernprozess befindenden Fremdsprachen als abgeschlossen angesehen werden kann, was bei der Testentwicklung von lingualevel berücksichtigt wurde. Im Anschluss wird die Qualität der Schreibtests von lingualevel, auch unter Bezugnahme auf deren Entwicklung, dargelegt: Im Rahmen der Erstellung und Erprobung der Schreibaufgaben innerhalb des IEF-Projekts, welche immer leicht zeitversetzt in Analogie zu den entsprechenden Instrumenten zur Überprüfung des Sprechens erfolgten, wurden zahlreiche Datenerhebungsmethoden aus der empirischen Sozialforschung angewandt (vgl. Lenz et al. 2006: 9; Studer et al. 2004: 426): Im Sinne der Evaluation cycles von Braun (2000: 268-270) wurden die Schreibaufgaben auf der Grundlage der Struktur der Construct Maps durch das Kernteam 111 entwickelt, welche anschließend dem gesamten Konsortium zur Prüfung vorgelegt wurden (vgl. Konsortium HarmoS Fremdsprachen 2009: 48). Im letzten Quartal des Jahres 2003 erfolgte dann die Erprobung erster Schreibaufgaben in 18 Deutschschweizer Französisch- und Englischklassen, um anschließend im Rahmen von Workshops für Lehrkräfte ein schriftliches Feedback in Form eines durch die Lehrkräfte ausgefüllten Fragebogens über die Eignung der Testaufgaben einzuholen und die erste Sammlung der Rohdeskrip‐ toren zu überarbeiten (vgl. Lenz et al. 2006: 9). Dies ging mit Diskussionen über Praktiken des Beurteilens von schriftlichen Leistungen einher, die sowohl zwi‐ schen den Forschenden und den Lehrkräften als auch zwischen den Lehrkräften ohne Eingreifen der Forschenden geführt wurden (vgl. Studer et al. 2004: 426). Fast ein Jahr später fand im Oktober 2004 eine empirische Untersuchung statt, in der weitere Deskriptoren zur Beurteilung von Schreibleistungen kalibriert und sodann die einzelnen Schülerleistungen klaren Referenzniveaus zugeordnet wurden (vgl. Lenz et al. 2006: 10). Hierbei wurden quantifizierende schriftliche Befragungen bezüglich der Anwendbarkeit der Bewertungskriterien auf die schriftlichen Schülertexte durchgeführt (vgl. Studer et al. 2004: 426). Ziel der Wissenschaftler war es, zusammen mit den Lehrkräften sieben Schülerproduk‐ tionen mit jeweils drei Texten für Englisch und acht Schülerproduktionen mit 200 9 Untersuchungsinstrumente 112 Beim Test-Equating, auch als Testangleichung bezeichnet, handelt es sich neben der Kalibrierung (calibrating), der statistischen Adjustierung (statistical moderation) und der prognostischen Vorhersage (predicting) um eine von vier statistischen Methoden, die es erlauben, Testaufgaben an bereits bestehende Referenzsysteme, wie beispiels‐ weise das des GeR anzubinden (vgl. North 2000: 556-557). Sie stellt eine sehr adäquate Methode für diesen Forschungszweck dar, da sie im Vergleich zu den anderen drei Methoden die stärkste Verbindung bzw. Zuordnung des Tests zum Referenzsystem erlaubt (vgl. Kecker 2016: 28). Die Herstellung der Verbindung erfolgt bei dieser Methode in Form von Anker-Tests und Anker-Items, die zuerst am GeR kalibriert werden und anschließend als Eichmaß, also als GeR-Bezugsgröße eingesetzt werden, um dadurch die entsprechende Niveaustufe des GeR abzubilden (vgl. Kecker 2016: 28). jeweils zwei Texten für Französisch als Referenzleistungen für die jeweiligen Feinniveaus auszuwählen. Diese Referenzleistungen liegen auch für die jewei‐ ligen Feinniveaustufen für die lingualevel-Tests vor (vgl. Lenz/ Studer 2008c). Diesem Studiendesign folgend wurden die handschriftlichen Schülertexte zur Verbesserung der Lesbarkeit und der Verarbeitung der Sprachdaten mithilfe von Textverarbeitungsprogrammen am Computer transkribiert. Für das Rating wurden Kriterienkataloge bezüglich Wortschatz, Grammatik, Orthographie und Text festgelegt, die letztendlich in der abschließenden Untersuchung von dreißig Lehrkräften auf die schriftlichen Textproduktionen in Englisch und Französisch angewandt wurden, indem die Textproduktionen der Lernenden nach Niveau‐ stufen sortiert und demnach kategorisiert wurden (vgl. Lenz et al. 2006: 10; Studer et al. 2004: 426). Bei dieser Art der Leistungsbeurteilung handelt es sich schwerpunktmäßig um eine qualitative Beschreibung der Schreibleistung, die eine zuverlässige Einordnung in die Referenzniveaus erlaubt (vgl. Lenz et al. 2006: 13) und somit in einen quantitativen Datensatz umgewandelt werden kann. Zur Auswertung der Daten, die beim ersten Ausfüllen der Kriteriums‐ kataloge durch die Lehrkräfte entstanden waren, führte das IEF-Projektteam eine qualitative Inhaltsanalyse nach Mayring (2003) der Protokolle zu den Gruppengesprächen über die Aspekte der Bewertung von Schreibarbeiten durch und setzte Verfahren der probabilistischen Statistik im Rahmen der Kalibrierung von Beurteilungskriterien für das Schreiben durch die Konstruktion einer Rasch-Skala mithilfe der Software Facets ein (vgl. Studer et al. 2004: 426). Auf diese Weise konnten genügend Kriterien in Form von Deskriptoren kalibriert werden, um das Niveauspektrum zwischen A1.1 und B1.2 für das Schreiben in den Bereichen Wortschatz, Grammatik, Orthographie und Text zu erfassen. Der Bezug dieser Kriterien zu den Referenzleistungen konnte im IEF-Projekt mithilfe der statistischen Methode des Equating 112 hergestellt werden, wodurch eine statistische Absicherung der vorherigen Zuweisung der Niveaustufen zu den Referenzleistungen erfolgen konnte (vgl. Lenz et al. 2006: 10; Studer 9.2 Sprachtests 201 113 Neben der statistischen Methode des Equating gibt es auch Anleitungen zur qualitativen Anpassung der Schreibaufgaben an den Gemeinsamen Europäischen Referenzrahmen. Diesbezüglich ist insbesondere das Handbuch Relating Language Examinations to the Common European Framework of Reference for Languages: Learning, Teaching, Assessment (CEFR) (Council of Europe 2003, 2009) zu nennen, das als Grundlage für die Aufgabenentwicklung und -überarbeitung diente (vgl. Konsortium HarmoS Fremd‐ sprachen 2009: 45) und ebenfalls die durch ALTE (ALTE s. a.) aufgestellten Kriterien berücksichtigt. 114 Lenz et al. (2006: 14) weisen darauf hin, dass die Kommentierung der Referenzleis‐ tungen um ein Vielfaches aufwändiger war als anfangs angenommen. Im Sinne der Durchführbarkeit und angesichts der Stickprobengröße muss daher für die Auswertung der Schriftproduktionen der ausgewählten Stichprobe über ein möglichst effektives Kommentierungsverfahren reflektiert werden. et al. 2004: 426-427). 113 Bei den letztendlich entstandenen Referenzleistungen handelt es sich im Falle des Schreibens in französischer Sprache um insgesamt sechzehn kommentierte Texte von insgesamt acht Schülerinnen und Schülern zu ausgewählten erprobten Schreibaufgaben, die jeweils prototypische Funktion haben und erreichbare Niveaustufen illustrieren, wobei die Redaktions- und Korrekturkommentare der Testentwickler vier konkrete Aspekte betreffen (vgl. Lenz et al. 2006: 14). 1) Die Art der Aufgabe sowie weitere Aufgabendetails, 2) die Merkmale der Leistung unter Handlungsaspekten gemäß dem sozio-kognitiven Modell des Schreibens nach Hyland (2002, 2016) und Shaw/ Weir (2007: 62), das Text als Diskurs und somit language in use bzw. language in action bezeichnet (vgl. Sprachhandlungskompetenz, Kapitel 11.4.3 und 11.4.3.1), 3) die Merkmale der Leistung unter sprachlich-qualitativen Aspekten und schließlich 4) die Einstu‐ fung in die europäischen Feinniveaus laut der empirischen Untersuchung. 114 Durch die kommentierten Referenzleistungen erreichte das IEF-Projektteam eine Herstellung des Bezugs zwischen den einerseits abstrakten, für jede Aufgabe konkret zugewiesenen qualitativen Deskriptoren von lingualevel und den andererseits nur im Allgemeinen auf die Niveaustufen referierenden hand‐ lungsorientierten Kompetenzbeschreibungen des GeR (vgl. Lenz et al. 2006: 14). Schließlich dienen die einführenden Texte zur Erhebung von Schreibdaten sowie die Kommentare zu den Referenzleistungen gleichzeitig auch als Materialien, die für das Prüferinnen- und Prüfertraining sowie für das Beurteilerinnen- und Beurteilertraining geeignet sind. Folglich ist ein umfassendes Angebot geschaffen worden, damit sich die Testleitenden entsprechend für die Erhebung und Auswertung der Schreibdaten qualifizieren können (vgl. Lenz et al. 2006: 14). Für den Kompetenztest in der Fertigkeit des Schreibens wurde durch das IEF-Projektteam außerdem darauf geachtet, innerhalb der von lingualevel an‐ 202 9 Untersuchungsinstrumente gebotenen Möglichkeiten, zwei kleinere Aufgaben anstatt einer großen auszu‐ wählen (vgl. Tabelle 3). Dies sorgt dafür, dass die Wahrscheinlichkeit erhöht wird, dass zumindest eine der beiden Aufgaben das Mitteilungsbedürfnis der Lernenden weckt, was zur erhöhten Reliabilität der Ergebnisse beiträgt, da Messfehler durch Unlust oder Desinteresse vergrößert werden können (vgl. Rumlich 2012: 173-174). Ein weiterer Vorteil bei der Wahl von zwei kleineren anstatt einer größeren Schreibaufgabe besteht darin, dass von lingualevel, ähnlich wie bei den Berei‐ chen Hören und Lesen, auch beim Schreibtest durch die zwei Textaufgaben zwei unterschiedliche Schwierigkeitsgrade abgeprüft werden. Dies hat zur Folge, dass der Test besser diskriminiert und durch diese Testform sowohl Bodenals auch Deckeneffekte verringert werden. Deckeneffekte und somit verfälschte Endergebnisse können nämlich dann auftreten, wenn sich die Testteilnehm‐ enden bei zu leichten Aufgaben darauf konzentrieren, keine Fehler zu machen. Um dieser Verfälschung vorzubeugen, muss der Schwierigkeitsgrad präzise bestimmt werden (vgl. Kapitel 9.2). Außerdem verhindert ein angemessenes Spektrum an Korrekturkriterien, das neben Sprachrichtigkeit auch Komplexität der syntaktischen Strukturen und Reichhaltigkeit des Wortschatzes integriert, eine Verfälschung des Endergebnisses (vgl. Kapitel 11.4.3; vgl. Rumlich 2012: 174). Schließlich zeigen beispielsweise Studien wie diejenige von Verspoor et al. (2012), die 437 fremdsprachliche Texte von 12bis 14-jährigen niederländi‐ schen Englischlernenden untersuchten, dass bereits kurze Textproduktionen von Lernenden ausreichend Datenmaterial liefern können, um zwischen den Niveaustufen A1 bis B1 des GeR (Europarat 2001) unterscheiden zu können. Zusammenfassend lässt sich also festhalten, dass im Rahmen des IEF-Pro‐ jekts eine qualitative Auswertung der Schreibtexte stattfand, die dann durch verschiedene statistische Verfahren auf deren Korrektheit im Sinne einer kor‐ rekten Zuweisung zu Deskriptoren der Feinniveaus überprüft wurde bzw. die Niveaubeschreibungen und Referenzleistungen dementsprechend angepasst bzw. ausgewählt wurden. Die Aufgabe der vorliegenden Studie liegt nun darin, von der qualitativen Beschreibung von Schreibleistungen, wie in lingualevel vorgeschlagen (vgl. Lenz/ Studer 2008c), zu einer quantitativen Beschreibung in Form von in Zahlen kodierten Schreibleistungen zu gelangen, um somit später Berechnungen zu Geschlechterunterschieden oder zu Korrelationen zu anderen Lernervariablen vornehmen zu können (vgl. Anhang 2.3.4). 9.2 Sprachtests 203 9.2.3.1 Der Schreibtest in Französisch Die Construct Map der Kombination der Schreibaufgaben im Schreibtest, die, basierend auf dem sozio-kognitiven Modell des Schreibens (Hyland 2002, 2016; Shaw/ Weir 2007: 52), im Rahmen der sogenannten Standortbestimmung von lingualevel die abzuprüfenden Schreibhandlungskonstrukte definiert, gestaltet sich für die vorgesehene Studie wie in Tabelle 3 dargelegt (vgl. Studer et al. 2009: 29): Nr. IEF-SC- Items, Niveaus Validierte Deskriptoren (Sprachhand‐ lungskompe‐ tenzen) Charakterisierung der Item-Merkmale Schreib‐ anlass Thema Erwartete Charak‐ teristika des Schüler(-innen)texts 1 Zimmer (SC-06) A2.1-A2.2 Sc-31: Ich kann je‐ mandem be‐ schreiben, wie mein Zimmer ein‐ gerichtet ist. Kontakt mit Gleich‐ altriger/ m Zim‐ merein‐ rich‐ tung • Adressat: gleichalt‐ riger Freund/ gleichaltrige Freundin • Textsorte: Kurz‐ nachricht • Diskurstyp/ Text‐ funktion: Infor‐ mieren/ Beschreiben • Textproduktion: gelenkt durch vier Leitfragen, Rahmen der Nachricht • erwartete Text‐ länge: einige Sätze zu den Leitfragen 204 9 Untersuchungsinstrumente Nr. IEF-SC- Items, Niveaus Validierte Deskriptoren (Sprachhand‐ lungskompe‐ tenzen) Charakterisierung der Item-Merkmale Schreib‐ anlass Thema Erwartete Charak‐ teristika des Schüler(-innen)texts 2 Termin ver‐ schieben (SC-22) A2-1-B1.1 Sc 16: Ich kann mit einfachen Worten auf eine Einladung reagieren und Ver‐ abredungen ab‐ sagen oder ver‐ schieben (z.-B. per SMS). -Sc-27: Ich kann kurze, einfache Notizen und Mit‐ teilungen schreiben, wie sie zum Beispiel nötig sind, um eine Ab‐ machung zu bestä‐ tigen oder zu än‐ dern. -Sc-47: Ich kann eine einfache, all‐ tägliche Notiz oder Mitteilung schreiben; ich kann also z.-B. schreiben, was der andere von mir wissen wollte oder was er nun tun soll. Kontakt mit Gleich‐ altriger/ m Abma‐ chung ver‐ schieben • Adressat: gleichalt‐ riger Freund/ gleichaltrige Freundin • Textsorte: Kurz‐ nachricht • Diskurstypen/ Textfunktionen: In‐ formieren/ Beschreiben, Auf‐ fordern/ Veran‐ lassen, Unterhalten von Beziehungen • Textproduktion: gelenkt durch drei Leitfragen, Rahmen der Nachricht • erwartete Text‐ länge: nicht vorge‐ geben (bearbeiten der Leitfragen) Anmerkungen. Die Codes der Deskriptoren stehen jeweils bei den Aufgabenstellungen und die vollständigen Deskriptoren wurden unter www.lingualevel.ch über den lizensierten Zugang abgerufen. Auch die Angaben zum Schreibanlass, zum Thema und zu den erwarteten Charakte‐ ristika des Schülertexts befinden sich im Zusatzmaterial von lingualevel, das vom Schulverlag durch ein lizensiertes Nutzungsrecht limitiert wurde (vgl. Lenz/ Studer 2008d) Tabelle 3: Construct Map des Schreibtests von lingualevel Beide Schreibaufgaben aus dem ausgewählten Aufgabenset legen den Fokus auf die schriftliche Interaktion (vgl. Studer et al. 2009: 45). Sie repräsentieren insgesamt drei Hauptdiskurstypen: Informieren/ Beschreiben, Auffordern/ Veran‐ lassen und Unterhalten von Beziehungen, wobei auch der Diskurstyp Meinung Äußern/ Argumentieren teilweise durch die zweite Aufgabe erfasst wird, da durch die Probanden schriftlich innerhalb der persönlichen Nachricht begründet 9.2 Sprachtests 205 115 Kontextvalidität beschreibt das Maß, in dem die Schreibaufgabe authentischen Schreib‐ anlässen wie sie den Lernenden auch im außerschulischen Leben begegnen, gleicht (vgl. Shaw/ Weir 2007: 63). 116 Der Situierungstext zur ersten Aufgabe des Schreibtests „Beschreiben, wie das eigene Zimmer eingerichtet ist“ lautet beispielsweise „Entscheide dich zunächst, ob du ent‐ weder Jérémy oder Lea schreiben möchtest.“; „In den Ferien hast du in Belgien Jérémy bzw. Lea kennen gelernt und seitdem schreibt ihr euch ab und zu. Da Jérémy bzw. Lea plant, sein/ ihr Zimmer neu einzurichten, möchte er/ sie wissen, wie dein Zimmer eingerichtet ist. Du bist gerade nicht zu Hause und kannst daher kein Bild von deinem Zimmer machen, um es mit dem Handy zu verschicken. Deshalb schreibst du ihm/ ihr eine Kurznachricht, in der du erklärst, wie es in deinem Zimmer aussieht.“ (vgl. Anhang 2.3.2) 117 In der ersten Teilaufgabe, in der das eigene Zimmer beschrieben werden soll, lautet diese beispielsweise: „Welche Möbel (Bett, Schreibtisch) hast du? Welche Farben haben sie? Wo stehen die Möbel? Was ist speziell in deinem Zimmer (z. B. Poster, Computer …)? “ (vgl. Anhang 2.3.2) 118 Die kognitive Validität einer Schreibaufgabe gibt an, wie genau diese Aufgabe die kognitiven Prozesse, die auch in natürlichen Schreibkontexten außerhalb von Testsi‐ werden muss, weshalb der geplante Kinobesuch nicht zustande kommt (vgl. Konsortium HarmoS Fremdsprachen 2009: 45). Somit werden im Verhältnis zum Umfang der Schreibaufgaben relativ viele Diskurstypen des Modells von Hyland (2002, 2016) abgeprüft. Die Aufgaben enthalten im Sinne der Kontextvalidität 115 stets allgemeine Arbeitsanweisungen und kommunikative Situierungen auf der Schulsprache Deutsch 116 inklusive Hinweisen bezüglich der zur Verfügung stehenden Zeit. Im vorliegenden Fall handelt es sich um je fünfzehn Minuten Bearbeitungszeit pro Schreibaufgabe. Da die Zeit relativ knapp bemessen ist und die Aufgaben kommunikativ ausgerichtet sind, erfolgt stets ein Hinweis folgender Art: „Natürlich ist es gut, wenn man korrekt schreibt. Das Wichtigste ist aber, dass Lea lesen und verstehen kann, was du schreibst“ (lingualevel, Anhang 2.3.2). Nach langem Abwägen entschied sich das Konsortium HarmoS Fremdsprachen (2009: 46) für das Hinzufügen eines solchen Hinweises, da letzten Endes das Interesse, die Lernenden zum Schreiben zu motivieren schwerer wog als die Befürchtung einer Fehlinterpretation dieses Hinweises hinsichtlich einer sehr hohen Fehlertoleranz. Schließlich wird in der Aufgabenstellung durch sog. „Leitpunkte“ die inhaltliche Strukturierung auf Deutsch genau angegeben. 117 Zum einen wird auf diese Weise die Wahrschein‐ lichkeit erhöht, dass die Schülerinnen und Schüler innerhalb der kurzen Zeit einen vollständigen Text formulieren, da die grundlegende Struktur des Textes bereits vorgegeben ist und somit umfassende Planungsvorgänge nicht mehr stattfinden müssen, was allerdings gleichzeitig mit einer Einschränkung der kognitiven Validität einhergeht, da die Makroplanung bereits vorgegeben ist (vgl. Shaw/ Weir 2007: 34) 118 ; zum anderen wird dadurch die Vergleichbarkeit der 206 9 Untersuchungsinstrumente tuationen stattfinden, misst. Umso mehr die Parameter Makroplanung, Gliederung, Mikroplanung, sprachliche Umsetzung, Monitoring und Überarbeitung durch die Schreibaufgabe repräsentiert werden, umso höher ist die kognitive Validität (vgl. Shaw/ Weir 2007: 34). Textproduktionen und somit die Möglichkeit eines erhöhten Grads an objektiver Bewertung gesteigert (vgl. Aguado 2000: 121; Döring/ Bortz 2016: 442; Harsch 2016: 212; Schmelter 2014: 39; Studer et al. 2009: 47). Insbesondere Vermeidungsstrategien werden durch die inhaltliche Engfüh‐ rung schneller offensichtlich und damit verbunden sprachliche Schwächen, vor allem im lexikalischen, aber auch im grammatischen Bereich. Während der gesamten Bearbeitungszeit von zweimal fünfzehn Minuten sind keinerlei Hilfsmittel oder Wörterbücher erlaubt, was jedoch laut Shaw und Weir (2007: 34) ebenfalls, aufgrund der eingeschränkten Messbarkeit von Revisionsprozessen, zur Einschränkung der kognitiven Validität beiträgt. Auch hier wurde in den Aufgabenstellungen inklusive Leitpunkten, Situierungen und Hinweisen be‐ wusst die Schulsprache Deutsch verwendet, wofür mehrere Argumente genannt werden (vgl. Studer et al. 2009: 47): Vorrangig geht es darum, Handlungskontext und Schreibabsicht für alle Schülerinnen und Schüler verständlich zu machen, da diese ausschlaggebend für die gesamte Aufgabe sind und in der außerschulischen Realität bei au‐ thentischen Schreibanlässen meist von Anfang an gegeben sind. Außerdem soll ausschließlich die fremdsprachliche Schreibkompetenz und eben nicht die fremdsprachliche Schreibkompetenz abhängig von der fremdsprachlichen Lesekompetenz gemessen werden. Des Weiteren werden durch die Verwendung des Deutschen keine sprachli‐ chen Mittel, die für den Schülertext dienlich sein könnten, in der Situierung, in der Aufgabenstellung oder in den Leitpunkten vorgegeben. Schließlich soll die Erfassung der Aufgabenstellung sehr zügig erfolgen, da insgesamt nur eine begrenzte Zeit für die Bearbeitung der Schreibaufgaben vorgesehen ist, jeder Lernende die Aufgabe in Einzelarbeit erfüllt und nicht davon auszugehen ist, dass eine entsprechende Vorbereitung auf das Aufgabenformat im vorherge‐ henden Unterricht stattfand (vgl. Konsortium HarmoS Fremdsprachen 2009: 48). Bezüglich der kognitiven Validität stehen also die kognitiven Prozesse der Mikroplanung und der sprachlichen Umsetzung im Vordergrund, da Makropla‐ nung und Gliederung weitestgehend vorgegeben sind und Monitoring- und Überarbeitungsprozesse anhand des Testformats nur teilweise nachvollzogen werden können, da beispielsweise keine Videoaufzeichnung der Schülerinnen und Schüler bei der Ausführung des Schreibtests gemacht wird oder diese nicht zu ihrem Schreibprozess befragt werden. Da aber insbesondere Mikroplanung 9.2 Sprachtests 207 und sprachliche Umsetzung bei den Schreibaufgaben und in den Teilkonstrukten der Korrekturraster (vgl. z. B. die Kriterien Wortschatz, Grammatik, Orthographie und Text im dritten Rating) im Vordergrund stehen), wird bezüglich dieser beiden Prozesse kognitive Validität hergestellt. Abschließend erfolgt eine Erläuterung der Durchführung minimaler Anpas‐ sungsmaßnahmen in den Schreibtests: Um auch die Aufgaben genderneutral zu formulieren, wurde den Schülerinnen und Schülern die Wahl gelassen, ob sie einer männlichen oder einer weiblichen Person schreiben, auch weil die Beschreibung des eigenen Zimmers sowie die Absage eines Treffens informelle, persönliche Interaktionen darstellen. Außerdem wurden sprachlich kleine Än‐ derungen im Deutschen vorgenommen: In Aufgabe 1 wird zudem der Begriff „Brieffreund, -in“ durch den Begriff „Austauschpartner, -in“ ersetzt, da zum einen eine Kurznachricht geschrieben wird und kein Brief und zum anderen das Konzept des Austauschpartners heutzutage eher bei Jugendlichen bekannt ist als das Konzept des Brieffreunds bzw. der Brieffreundin. In der zweiten Schreibaufgabe wird anstatt „SMS“ der Begriff „Kurznachricht“ verwendet, da Jugendliche in der Aktualität nur noch sehr selten SMS schreiben, sondern viel‐ mehr kostenlose Kurznachrichtendienste nutzen. Auch wird das schweizerische Wort „Kinobillet“ durch das standarddeutsche Wort „Eintrittskarte fürs Kino“ ersetzt. Ein Spezifikum des Originaltests ist schließlich, dass keine Wortanzahl vor‐ gegeben ist. Dies wurde dabei belassen, da auch die Anzahl der geschriebenen Wörter einen Indikator für die jeweilige Niveaustufe darstellt (vgl. z. B. ALTE s. a.) und diese Einteilung später aufgegriffen werden soll (vgl. Kapitel 11.4.3). - 9.2.3.2 Der Schreibtest in Spanisch Der Schreibtest für Spanischen ist identisch gestaltet wie der Schreibtest für Französisch. Es wurden lediglich die Namen angepasst sowie die Orte, aus denen die jeweiligen Personen stammen. So soll in der ersten Schreibaufgabe eine Kurznachricht mit der Beschreibung ihres Zimmers an Juan oder Ana ge‐ schrieben werden, die aus Chile stammen. Im Französischtest war die Auswahl zwischen Jérémy und Lea gegeben, die beide aus Belgien stammen. In der zweiten Teilaufgabe haben die Probandinnen und Probanden die Wahl, ob sie Jaime oder Laura, jeweils Austauschschüler(-innen) aus Spanien schreiben. Dies wurde in Analogie zum Französischtest konzipiert, in dem in der zweiten Teilaufgabe entweder Julien oder Laure geschrieben werden soll, um einen Termin per Kurznachricht zu verschieben. Abgesehen von diesen Adjustierungen bleiben alle Situierungen und Schreibaufträge im Schreibtest 208 9 Untersuchungsinstrumente für das Spanische identisch zu den Aufgaben im Französischen (vgl. Anhang 2.3.3). 9.3 Der Schülerfragebogen Der Schülerfragebogen wird eingesetzt, um die relevanten Hintergrundinforma‐ tionen bezüglich Alter, Geschlecht, sprachlichem Hintergrund, sozioökonomi‐ schem Hintergrund und Sprachlernbiographie zu erheben. Des Weiteren dient er als Instrument zur Erfassung von affektiven Faktoren und schließlich werden konkrete Verhaltensweisen beobachtet, indem die Häufigkeit der Nutzung von Französischbzw. Spanischangeboten in der Freizeit (vgl. Sachse et al. 2012: 312) ein Konstrukt des Fragebogens darstellt. Im Vordergrund steht dabei die Operationalisierung der Konstrukte der Forschungsfragen 1.2, 2 und 3 (vgl. Kapitel 7) sowie einiger zusätzlicher Hintergrundvariablen. Die Operationali‐ sierung der Forschungsgegenstände erfolgt, indem die entsprechenden Begriffe und Konstrukte im Hinblick auf ihre empirische Überprüfbarkeit durch den Schülerfragebogen messbar gemacht werden (vgl. Settinieri 2014: 59; Skiba 2010: 234). Die affektiven Faktoren werden dabei wie Testskalen betrachtet, als deren Ergebnis ein Testwert zur summarischen Beschreibung der Ausprägung des geprüften Merkmals ermittelt wird. Bei den Verhaltensweisen geht es im Gegensatz dazu nicht um Merkmalsausprägungen, sondern um Beschreibungen konkreter Sachverhalte durch die befragte Person (vgl. Bortz/ Döring 2006: 253; Raab-Steiner/ Benesch 2015: 51). Am Ende des Entwicklungsprozesses steht ein vollstandardisierter Frage‐ bogen, da die Items vorformuliert und für alle Schülerinnen und Schüler dieselben sind, die Antwortmöglichkeiten vorgegeben sind, die Reihenfolge der Fragen klar vorgegeben ist und die Ausfüllbedingungen im Klassenraum während der Unterrichtszeit im Paper-Pencil-Verfahren und ohne fremde Ein‐ wirkung immer dieselben sind. 9.3.1 Pilotierung des Schülerfragebogens Der gesamte vorläufige Fragebogen wurde einem Pretest unterzogen, um ihn vor der Hauptuntersuchung auf Brauchbarkeit und Qualität zu untersuchen (vgl. Raab-Steiner/ Benesch 2015: 63). Zu diesem Zweck wurde der Fragebogen in einer 9. Klasse, die nicht zu den Stichproben der Hauptuntersuchung gehörte, während der Unterrichtszeit im Fach Spanisch ausgeteilt, um in drei unter‐ schiedlichen Verfahren Rückmeldungen durch die Schülerinnen und Schüler zu 9.3 Der Schülerfragebogen 209 erhalten. Das Fach Spanisch wurde deshalb ausgewählt, weil die Probandinnen und Probanden in dieser Sprache wahrscheinlich über weniger persönliche in‐ terkulturelle Erfahrungen verfügen als dies bei Französisch der Fall ist. Da einige der Items des Fragebogens ein gewisses Maß an interkultureller Kompetenz voraussetzen, z. B. bezüglich des soziokulturellen Vorwissens oder bezüglich des Kontakts mit den Zielkulturen (vgl. Skalen zur integrativen Orientierung und zum Ideal L4 Self, vgl. Kapitel 9.3.4.1), wurde insbesondere überprüft, inwiefern diese für Spanischlernende der 9.-Jahrgangsstufe überhaupt angemessen sind. Aus diesem Grund wurden ein männlicher Spanischlernender und eine weib‐ liche Spanischlernende gebeten, an einem kognitiven Interview (vgl. Erkinger 2012; Prüfer/ Rexroth 2005) teilzunehmen. Kognitive Interviews stellen eine spezifische Forschungsmethode für die Entwicklungsphase von Fragebögen dar und geben Einblicke in die kognitiven Prozesse, die beim Ausfüllen des Bogens und bei der Beantwortung der einzelnen Fragen ablaufen. Im Mittelpunkt stehen Untersuchungen zum Verständnis und zur Interpretation der Begriffe und Formulierungen durch die Probandinnen und Probanden. Aber auch die kognitiven Prozesse beim Abrufen von Informationen aus dem Gedächtnis und beim Treffen von Entscheidungen für oder gegen eine Antwort werden durch diese Forschungsmethode untersucht (vgl. Rexroth/ Prüfer 2005: 3). In diesem Sinne wurden die beiden ausgewählten Versuchspersonen nach der Beantwortung jedes einzelnen Abschnitts des Fragebogens und teilweise auch nach jedem einzelnen Item persönlich-mündlich durch die Testleiterin gebeten, laut über die Prozesse bei der Beantwortung nachzudenken (vgl. Rexroth/ Prüfer 2005: 4). Zu diesem Ziel hatte die Testleiterin bereits im Voraus über mögliche Schwierigkeiten beim Ausfüllen der einzelnen Items reflektiert und entspre‐ chend, neben Fragen zum allgemeinen Verständnis, spezifische Fragen zur Bearbeitung vorbereitet, die insbesondere die Verständlichkeit der Formulie‐ rungen, die Antwortbereitschaft, das Erinnerungsvermögen und die Anpassung an die Zielgruppe betrafen. Alle Fragen des kognitiven Interviews bezüglich des vorläufigen Fragebogens (vgl. Anhang 3.1.2) befinden sich im entsprechenden Testleiterskript (vgl. Anhang 3.1.1). Die durch die Schülerinnen und Schüler getätigten Äußerungen wurden außerdem aufgezeichnet und transkribiert; diese können in Anhang 3.1.3 eingesehen werden. Die Probandin und der Pro‐ band des kognitiven Interviews fanden sowohl einzelne Redundanzen als auch leicht unverständliche Formulierungen und hatten teilweise Schwierigkeiten, die Fragen zu beantworten, weil sie beispielsweise selbst noch nie in Spanien waren, was in den anschließenden Änderungen des Fragebogens entsprechend berücksichtigt wurde. 210 9 Untersuchungsinstrumente Eine zweite Gruppe (n = 12) wurde gebeten, den Fragebogen auszufüllen und Verständnisschwierigkeiten zu markieren sowie weitere Unklarheiten, Fragen und Anmerkungen zum Fragebogen zu notieren. Dabei handelte es sich um eine komplementären Beobachtungs-Pretest (vgl. Prüfer/ Rexroth 1996), der eine etwas unsystematischere Beobachtung bewirkte als das kognitive Interview, jedoch ermöglichte, den Schülerfragebogen nah an den Bedingungen der Hauptstudie einzusetzen und spontan geäußerte Bemerkungen zu erfassen. Das Protokoll zu den Rückfragen und Anmerkungen der Schülerinnen und Schüler befindet sich in Anhang 3.1.4. Eine dritte Gruppe (n = 9) wurden schließlich gebeten, in Einzelarbeit den Fragebogen von Anfang bis Ende ohne Unterbrechung auszufüllen und genau die Dauer zu dokumentieren, die sie für das Ausfüllen des Fragebogens benötigte. Durch diese Rückmeldung konnte bezüglich der Hauptuntersuchung besser abgeschätzt werden, wie viel Zeit eingeplant werden musste, da bei einer zu knappen Zeitplanung ein sorgfältiges Ausfüllen des Bogens nicht mehr garantiert werden kann. Im Anschluss an den Pretest wurden aufgrund der Anmerkungen der Schü‐ lerinnen und Schüler aus der ersten und der zweiten Gruppe einige Änderungen vorgenommen sowie einzelne Items und Konstrukte, die sich zu ähnlich waren und den Schülerinnen und Schülern als redundant erschienen, noch einmal auf Grundlage der Fachliteratur auf deren Relevanz geprüft. Alle Änderungen sind in Anhang 3.1.5 genau dokumentiert. Durch diesen Prozess entstand die Endversion des Schülerfragebogens, welche in ihren Details und in ihrer wissenschaftlichen Fundierung in den nachfolgenden Kapiteln präzise erläutert wird. 9.3.2 Erfassung der Hintergrundvariablen Der erste Bereich des Fragebogens (Allgemeine Angaben zu Deiner Person), in dem das Geschlecht und das Alter der Testpersonen sowie deren sprachliche und sozioökonomische Hintergründe erfragt werden, und der zweite Bereich (Deine Erfahrungen mit Fremdsprachen), bei dem die Sprachlernbiographie im Mittelpunkt steht, enthalten jeweils unterschiedliche Antwortformate (vgl. Anhänge 4.2 und 4.3). Beim Geschlecht wird die Auswahl zwischen weiblich, männlich und keine Angabe gegeben. Das biologische Geschlecht wird im Schülerfragebogen zum einen als soziodemografische Variable zur Stichprobenbeschreibung verwendet. Zum anderen handelt es sich um eine theoretisch relevante Variable zur Überprüfung der Forschungsfragen. Es wird also aufgrund der Erkenntnisse 9.3 Der Schülerfragebogen 211 aus der Geschlechterforschung im Fragebogen die Möglichkeit eröffnet, neben „weiblich“ und „männlich“ die dritte Kategorie keine Angabe anzukreuzen, um das Kriterium der Exhaustivität zu erfüllen und eine erschöpfende Abdeckung aller denkbaren biologischen Geschlechtsausprägungen zu gewährleisten. Auch wenn von Döring (2013: 102) an diesem Item kritisiert wird, dass eine gewisse Hierarchisierung erkennbar gemacht werden könnte und diesem Item sym‐ bolisches Othering unterstellt werden könnte, soll an dieser Stelle bewusst darauf verzichtet werden, einzelne Kategorien der dritten Variante (z. B. Mann-zu-Frau-transsexuell/ transident Frau-zu-Mann-transsexuell/ transident, intersexuell/ zwischengeschlechtlich) anzugeben, da der Fokus der Studie nicht auf dem biologischen Geschlecht liegt und vermieden werden soll, dass die Jugendlichen aus Überraschung über diese noch nicht weit verbreitete Art und Weise das Geschlecht zu erfragen eine nicht zutreffende Antwort ankreuzen. Auch soll aus forschungsethischen Gründen die Gefahr eines ungewollten Outings vermieden werden. Hinzu kommt, dass aufgrund der medizinischen Statistiken davon ausgegangen werden kann, dass bei einer Sample-Größe von 200 Teilnehmenden voraussichtlich nicht mehr als ein Teilnehmender bzw. eine Teilnehmerin in die dritte Kategorie einzuordnen sein wird (vgl. Döring 2013: 100-101). Nichtsdestotrotz soll aufgrund des Themas der Forschungsar‐ beit eine dritte Kategorie beibehalten werden, um dem aktuellen Stand der Geschlechterforschung gerecht zu werden. Um eine exakte Auswertung der Testergebnisse vornehmen zu können, wird das Geschlecht anschließend in der Dummykodierung dichotome kodiert, d. h. 0 steht für weiblich und 1 für männ‐ lich. Probandinnen und Probanden, die die dritte Kategorie wählen, werden je nach Anzahl entweder ausgeschlossen, da ein bis zwei Probandinnen und Probanden, die eine separate Geschlechtergruppe bilden, als nicht repräsentativ für die dritte Variable angesehen werden können, oder, falls wider Erwarten eine ausreichende Anzahl an Probandinnen und Probanden anzutreffen sein sollte, als dritte Kategorie gewertet. Im Laufe der statistischen Auswertung kann durch diese Art der Erhebung der Geschlechtervariable überprüft werden, ob es sich vielmehr um eine unabhängige Variable bzw. einen Ursachenfaktor handelt, wovon ausgegangen wird, oder sogar um eine vermittelnde Moderatorvariable, d. h. dass ein bestimmter Ursache-Wirkungs-Mechanismus im Sinne der Inter‐ sektionalitätsforschung, beispielsweise bezogen auf den sozioökonomischen Status bei einer Geschlechtergruppe stärker ausgeprägt ist als bei einem anderen (vgl. Döring 2013: 96). Bei Frage 1.3 werden die Studienteilnehmerinnen und -teilnehmer gebeten, Geburtsmonat und Geburtsjahr einzutragen, um deren Alter bestimmen zu können. In 1.4 bis 1.6 werden Nationalitäten und Geburtsländer der Schüle‐ 212 9 Untersuchungsinstrumente 119 „Einen Migrationshintergrund haben alle Schüler, die keine deutsche Staatsangehörig‐ keit besitzen oder die im Ausland geboren wurden oder in deren Familie überwiegend nicht deutsch gesprochen wird“ (Landesinstitut für Schulentwicklung/ Statistisches Landesamt Baden-Württemberg 2018: 317; Statistisches Landesamt Baden-Württem‐ berg 2017; vgl. Kapitel 11.2.1). rinnen und Schüler sowie deren (beider) Elternteile ermittelt und die Sprache(n) sowie deren Anteil(e) erfragt, die zu Hause in der Familie gesprochen werden (vgl. Anhänge 4.2 und 4.3). Dieser Bereich dient der Erfassung der Kategorien „Migrationshintergrund“ sowie „sprachlicher Hintergrund“. Für die Erfassung des Migrationshintergrunds 119 werden laut der Definition des Statistischen Landesamts Baden-Württemberg (2017) Daten zur Staatsangehörigkeit, zum Geburtsland und zur Herkunftssprache benötigt: Wenn die Staatsangehörigkeit nicht deutsch ist, der Proband bzw. die Probandin im Ausland geboren wurde oder in der Familie zu mehr als 50%, d. h. überwiegend, nicht deutsch gesprochen wird, wird ein Migrationshintergrund zugewiesen. Mehrsprachigkeit ist immer dann gegeben, wenn in der Familie neben deutsch noch eine weitere Sprache gesprochen wird oder wenn ausschließlich eine andere Sprache als Deutsch gesprochen wird (vgl. Kapitel 11.2.1). Die Fragen 1.7 und 1.8 haben offene Antwortformate: Die Schülerinnen und Schüler sollen selbst den jeweiligen Beruf der beiden Elternteile angeben sowie eine kurze Tätigkeitsbeschreibung der Berufe hinzufügen. Folglich wird der sozioökonomische Hintergrund mithilfe der Berufsangaben der Eltern (Fragen 1.7 bis 1.8) und der Tätigkeitsbeschreibungen operationalisiert. Die Berufsan‐ gaben werden zunächst in die Internationale Standardklassifikation der Berufe (ISCO-08) überführt (vgl. Statistisches Bundesamt 2009), aus der anschließend der International Socio-Economic Index (ISEI-08) (vgl. Ganzeboom 2010) abge‐ leitet wird. Der Vorteil der ISEI-Skala liegt darin, dass diese Indexbildung über die Berufsangaben auch das Einkommen und den Bildungsstand berücksichtigt und dadurch ein standardisierter Index für den sozioökonomischen Hintergrund angegeben werden kann. Für alle Berechnungen bezüglich des sozioökonomi‐ schen Hintergrunds der Schülerinnen und Schüler wird jeweils der höchste ISEI-Wert des Haushaltes (HISEI) herangezogen (vgl. Lühe et al. 2017: 507). Diese aktuellste Kodierung - vorher wurden ISCO-68 und ISCO-88 verwendet - dient auch in den PISA-Studien seit 2012 zur Erfassung des sozioökonomischen Status, wodurch die hier vorliegende Studie mit den großen Bildungsmonitorings vergleichbar wird (vgl. OECD 2014b: 147-148). Die Fragen 1.9 und 1.10 zu den Kenntnissen des Französischen bzw. Spa‐ nischen der beiden Elternteile, sind jeweils mit einer Ratingskala versehen, auf der die Schülerinnen und Schüler die Sprachkenntnisse ihrer beiden El‐ 9.3 Der Schülerfragebogen 213 ternteile von keine über geringe, mittlere, gute bis sehr gute Französischbzw. Spanischkenntnisse einordnen sollen. Diese beiden Items sollen lediglich als Hintergrundinformation für das Potenzial der Unterstützung durch die Eltern genutzt werden. Frage 2.1 soll die Sprachenfolge innerhalb der schulischen Laufbahn erfassen und die Fragen 2.2 bis 2.4 sind den Freizeitaktivitäten, die das Lernen des Franzö‐ sischen bzw. Spanischen begünstigen, gewidmet, insbesondere den Fragen nach der Teilnahme an außerschulischem Französischbzw. Spanischunterricht oder Nachhilfe (Fragen 2.2 und 2.3), bei denen die Stundenzahl eingetragen werden kann und die Dauer möglicher bisheriger Auslandsaufenthalte (vgl. Frage 2.4, Anhang 3.2). Skala 2.5 dient als Messinstrument für die Ausführung konkreter Freizeitaktivitäten in der jeweiligen Fremdsprache in den letzten sechs Monaten vor dem Messzeitpunkt (vgl. Sachse et al. 2012: 312). Bei Häufigkeitsangaben sind die Antwortskalen so entworfen, dass sie genaue Häufigkeiten abfragen und nicht nur Kategorien wie zum Beispiel selten, oft, manchmal, welche subjektiv unterschiedlich interpretiert werden können (vgl. Dörnyei 2007, 2010). Sußerdem befinden sich keine metrischen Ratingskalen in Bereich 11, in dem die Lernenden ihre Interessensgebiete im Rahmen des Französischbzw. Spanischunterrichts angeben sollen (vgl. S. 8 des Fragebogens, Anhang 3.2). Hier können so viele Interessensgebiete wie gewünscht angekreuzt und teil‐ weise auch eigene Interessensgebiete ergänzt werden, weshalb es sich um ein gemischtes Antwortformat handelt (vgl. Raab-Steiner/ Benesch 2015: 53). Auch wird in Frage 8.1 das Geschlecht der Lehrkraft in einer dichotomen Variable abgefragt, um die jeweilige Repräsentation der Geschlechtergruppen in der jeweiligen Lehrerschaft zu erfassen (vgl. Anhang 3.2). 9.3.3 Erfassung der affektiv-motivationalen Variablen Ab dem dritten Bereich des Schülerfragebogens werden Skalen zu affektiven Faktoren eingesetzt, welche aus Sicht der bisherigen Forschung mit der Variable Geschlecht in Interaktion treten und in den Kapiteln 9.3.4.1 bis 9.3.5.2 detailliert erläutert werden. Zum einen beinhaltet der Fragebogen Skalen zu integrativer Orientierung, Ideal L3 bzw. L4 Self, instrumenteller Orientierung, Aktivitäten auf Französisch bzw. Spanisch in der Freizeit, L3/ L4 WTC, Interesse am Fach Französisch bzw. Spanisch, Einstellungen zu den Sprecherinnen und Sprechern, zu den Bewohnerinnen und Bewohnern Frankreichs bzw. Spaniens, zum Land und zur Kultur, genderstereotype Einstellungen gegenüber der französischen bzw. spanischen Sprache, FFS bzw. SFS Selbstkonzept und L3bzw. L4-Angst. Zum anderen soll erfasst werden, wie die Wahrnehmung der Unterstützung 214 9 Untersuchungsinstrumente 120 Eine Likert-Skala liegt dann vor, wenn die Antwortkategorien für die Testperson eine Rangordnung darstellen, und diese sich zwischen den Alternativen entscheiden kann. Die Kategorien sind itemunspezifisch formuliert, d. h., die Benennung der Antwortkate‐ gorien gilt für mehrere oder alle Items eines Fragebogens. Mithilfe dieser Skalen können Fremd- und Selbstbeurteilungen vorgenommen werden (vgl. Raab-Steiner/ Benesch 2015: 58). und Erwartung der Lehrkraft, der Peers und der Eltern der Schülerinnen und Schüler ist. Aufgrund der Absicht, mehrere motivationsbezogene Merkmale mit Hilfe des Fragebogens zu erfassen, spricht man in der Literatur auch von multidimensionalen Tests (vgl. Moosbrugger/ Kelava 2008: 34). Auch wenn es einige Studien gibt, die Geschlechterunterschiede bei af‐ fektiv-motivationalen Dispositionen mit gut begründeten psychometrischen Instrumenten messen (vgl. z. B. Dörnyei/ Clément 2002; Fuchs 2013; Kissau 2006a; Meißner et al. 2008; Rumlich 2016; Venus 2017a), muss eine gezielte Auswahl und Anpassung von Skalen und Items erfolgen, wobei die Zielgruppe der Neuntklässlerinnen und Neuntklässler in Baden-Württemberg sowie die Zielsprachen Französisch und Spanisch verstärkt in den Fokus gerückt werden müssen. Dies bedeutet beispielsweise, dass, wenn die Skalen ausschließlich auf Englisch vorliegen (vgl. Kissau 2006a), eine wissenschaftlich fundierte Übertragung ins Deutsche stattfinden muss (vgl. z. B. Brislin et al. 1973) oder dass, wenn die Zielsprache der vorliegenden Skalen Englisch ist, überprüft werden muss, ob die jeweiligen Items auch für das Französische als zweite bzw. das Spanische als dritte Fremdsprache verwendet werden können (vgl. Riemer 2016a: 160). Um zu sicherzustellen, dass das Befragungsinstrument geeignete psychometrische Eigenschaften besitzt, werden vorzugsweise Skalen und Items aus etablierten Fragebögen zum Thema Motivation eingesetzt, die ausreichend hohe Validitäts- und Reliabilitätskoeffizienten aufwiesen (vgl. Riemer 2016a). Für die Befragungen zu den affektiven Faktoren wird deshalb das Antwort‐ format der diskret gestuften, verbalen Ratingskalen in Form von vierstufigen Likert-Skala 120 gewählt, wobei die Optionen trifft überhaupt nicht zu, trifft eher nicht zu, trifft eher zu, trifft voll zu angegeben sind und entsprechend von 1-4 kodiert werden. Da mit steigender Anzahl der Abstufungen die Dif‐ ferenzierungsfähigkeit der Testpersonen stärker gefordert wird, werden hier lediglich vier Auswahlmöglichkeiten angeboten (vgl. Raab-Steiner/ Benesch 2015: 60). Hierbei werden die genannten verbalen Etikettierungen numerischen Etikettierungen vorgezogen, da die Bedeutung der Antwortstufen durch eine sprachliche Beschreibung für die Personen intersubjektiv vereinheitlicht wird (vgl. Raab-Steiner/ Benesch 2015: 61). Es handelt sich um eine bipolare Skala, da sie von einem negativen Pol (trifft überhaupt nicht zu) über einen fiktiven 9.3 Der Schülerfragebogen 215 121 Bipolar bedeutet, dass die Skalen von einem negativen Pol über einen Indifferenzbereich zu einem positiven Pol reichen (z. B. vierstufige Skala: 1 = trifft überhaupt nicht zu, 2 = trifft eher nicht zu, 3 = trifft eher zu, 4 = trifft voll zu) und intervallskaliert sind. 122 Andersherum betrachtet zwingt dieses 4-stufige Skala die Befragten dazu, sich zu entscheiden, auch wenn sie bewusst unentschieden sind (vgl. Riemer 2016a: 159). oder vorgegebenen Nullpunkt (als Mittelkategorie) bis hin zu einem positiven Pol (trifft voll zu) verläuft (vgl. Moosbrugger/ Kelava 2012: 52). 121 Die Skalen sind symmetrisch, d. h. sie haben die gleiche Anzahl von Kategorien auf jeder Seite, um die Testpersonen nicht in eine gewisse Richtung zu drängen (vgl. Raab-Steiner/ Benesch 2015: 59). Zudem gibt es durch die vier Ankreuzoptionen keine reale sondern nur eine fiktive Mittelkategorie, die nicht als Ankreuzoption vorzufinden ist, um die Tendenz zur Mitte bei wenig entscheidungsfreudigen Testpersonen oder bei Testpersonen mit der Tendenz zur Antwortverweigerung zu vermeiden (vgl. Riemer 2016a: 159). 122 Negativ formulierte Items (z. B. InSub3, InSub6) werden stets rekodiert (1 = 4, 2 = 3, 3 = 2, 4 = 1). Alle rekodierten Items sind in den folgenden Tabellen zur Beschreibung der Skalen mit dem Symbol „(-)“ hinter der Itemaussage gekennzeichnet. Die Datenaufbereitung erfolgte, indem jedes Item der ausgefüllten Fragebögen nach den Kodierungen, die im Skalenhandbuch festgehalten sind (vgl. Anhang 3.4), in eine SPSS-Tabelle eingetragen wurde. Fehlende Werte wurden mit -999 gekennzeichnet. Da es sich bei den einzelnen affektiven Faktoren um komplexe abstrakte Konstrukte handelt, sind Skalen, die aus mehreren Items bestehen (multi-item scales) gegenüber einfachen Items vorzuziehen (vgl. Dörnyei 2007: 103-104; Dörnyei 2010: 23-26). Die Skalen sind so konzipiert, dass sie mindestens vier und meistens mehr Items besitzen, auch, damit im Laufe der exploratorischen Fak‐ torenanalyse (vgl. Bühner 2011), die nachfolgend näher erläutert wird, noch eine Dimensionsreduktion in Form der Streichung von Items aus der Skala erfolgen kann, wenn diese schließlich nicht gut in der darunterliegenden Faktorstruktur agieren. Eine Anzahl von drei Items pro Skala stellt das untere Limit dar, wobei hier beispielsweise fehlende Angaben in Form der Auslassung eines Items eine gewisse Instabilität der Skala bewirken (vgl. Costello/ Osborne 2005: 5). Außerdem liefern Skalen, die auf drei Items beruhen, geringere Informationen über die statistische Diskriminanz zwischen Teilnehmerinnen und Teilnehmern mit einer ähnlichen Ausprägung der Variable als Skalen, die aus vier und mehr Items bestehen (vgl. Bühner 2011: 344; Rumlich 2016: 277). Nach der kurzen Darstellung der Vorgehensweise bei der Pilotierung des Fragebogens werden die einzelnen Skalen zu den affektiven Faktoren genauer erläutert. 216 9 Untersuchungsinstrumente 123 Dabei gelten KMO-Koeffizienten kleiner als .50 als inkompatibel, zwischen .50 und .59 als schlecht, zwischen .60 und .69 als mäßig, zwischen .70 und .79 als mittel, zwischen .80 und .89 als gut und größer als .89 als sehr gut (vgl. Bühner 2011: 347). 124 Die in der Anti-Image-Korrelationsmatrix ausgegebenen Variablen beschreiben den Grad der Korrelation zwischen den beobachteten Variablen. Dem Anti-Image-Maß liegt die Überlegung zugrunde, dass, wenn zwei beobachtete Variablen miteinander korrelieren, sich deren Varianz teilweise durch die Varianz der jeweils anderen Variable erklären lässt. Je stärker also die Korrelation zwischen den beiden Variablen ist, desto größer ist folglich der Varianzanteil, der sich durch die jeweils andere Variable erklären lässt (vgl. Brosius 2018: 917). 125 Items sollten nicht ausschließlich auf Grundlage des statistischen Kennwerts von .5 aus der Skala entfernt werden, sondern die Auffälligkeit des Items nach MSA-Koeffizienten, d. h. ein Wert unter .5, soll zunächst auf deren genaue Ursache untersucht werden, die beispielsweise in der Itemschwierigkeit, in der zu hohen Ähnlichkeit zu anderen Items oder in der niedrigen Reliabilität eines Items durch zu großen Interpretationsspielraum begründet sein kann (vgl. Bühner 2011: 347). 9.3.4 Die Skalen der affektiv-motivationalen Konstrukte Im Folgenden werden alle untersuchten affektiv-motivationalen Konstrukte und Skalen im Detail vorgestellt, wobei gleichzeitig die Ergebnisse der ex‐ ploratorischen Faktorenanalysen (EFA) dargelegt werden. Diese statistischen Clusteranalysen erklären die Zusammenhänge zwischen den einzelnen Items (manifeste Variablen) durch eine geringe Anzahl dahinterliegender homogener Faktoren (latente Variablen; vgl. Bühner 2011: 419). Ziel der Faktorenanalyse ist eine Dimensionsreduktion, d. h. eine Informationsverdichtung, welche der Komplexitätsreduktion, der Verringerung von Messfehlern gegenüber Einzel‐ items oder Summenwerten sowie der Erhöhung der faktoriellen Validität dient, wobei letzteres bedeutet, dass die Items in der erhobenen Stichprobe auch tatsächlich empirisch zusammengehören (vgl. Bühner 2011: 64, 296). Eine Grundvoraussetzung zur Bildung einer Skala aus mehreren Items ist, im Gegensatz zu einem Index, dass die erzielten Mittelwerte in den einzelnen Items signifikant untereinander korrelieren. Daher wird dies nachfolgend für jede Skala überprüft und gegebenenfalls erfolgt eine Reduktion um die nicht korrelierenden Items (vgl. Kuckartz et al. 2013: 242). Um die Durchführbarkeit einer Faktorenanalyse bewerten zu können, werden nachfolgend stets drei Richtwerte geprüft: Der Kaiser-Meyer-Olkin-Koeffizient (KMO) gibt Anhaltspunkte über die Eig‐ nung der Itemauswahl (vgl. Bühner 2011: 347). 123 MSA-Koeffizienten (Measure of Sample Adequacy), die in SPSS in der Anti-Image-Korrelationsmatrix 124 ausgegeben werden, beziehen sich auf die Frage der Eignung jedes einzelnen Items. 125 Schließlich prüft der Bartlett-Test die globale Nullhypothese, dass alle Korrelationen der Korrelationsmatrix gleich null sind. Wenn der Bartlett-Test 9.3 Der Schülerfragebogen 217 126 Hierbei muss eine ausreichende Stichprobengröße (n ≥ 60) vorliegen, was bei der vorliegenden Studie der Fall ist. 127 Zu den jeweiligen Richtwerten von Cronbachs α siehe Blanz 2015: 256; Cronbach 1951; Rost/ Schwemer 2007. signifikant ist, sind alle Korrelationen der Korrelationsmatrix größer null, was ebenfalls eine Voraussetzung der Faktorenanalyse darstellt und bei jeder nachfolgenden Skala separat geprüft wird. 126 Die exploratorischen Faktorenanalysen werden mithilfe der Statistiksoftware IBM SPSS Statistics 26 und jeweils separat für die Französisch- und für die Spanischstichprobe durchgeführt, da insbesondere die Faktorladungen auf die einzelnen Items je nach Zielgruppe und je nach Bezug auf Französisch oder Spanisch schwanken können. Die rotierten Faktorladungen (FL) werden nach der Methode der Hauptachsenanalyse extrahiert und dementsprechend für Französisch und Spanisch sowie für jedes Item separat angegebenen. Die Haupt‐ achsenanalyse wird bewusst der Maximum-Likelihood-Methode vorgezogen, da erstere bessere Ergebnisse liefert, wenn die Kommunalitäten gering sind oder nur wenige Items bei einer vergleichsweise niedrigen Stichprobenzahl (n < 100) einen Faktor bilden (vgl. Bühler 2011: 318). Falls es bei der Faktorenanalyse Items gibt, die mit den anderen Items nicht signifikant korrelieren, oder auf mehrere Faktoren laden, werden diese aus den oben genannten Gründen entweder aus der Skala entfernt oder aber aufgrund inhaltlicher Relevanz und bei nur niedrigen Abweichungen in der Skala belassen, was in jedem Einzelfall begründet wird. Die Items, die auf Grundlage der Faktorenanalysen entfernt werden, werden in den nachfolgenden Tabellen mit „—“ in den Feldern Faktorladung (FL), Mittel‐ wert (M) und Standardabweichung (SD) gekennzeichnet, wenn sie nur ein Fach betreffen oder ganz aus der tabellarischen Darstellung entfernt, wenn sie weder bei der Französischnoch bei der Spanischstichprobe aufgenommen wurden. Dennoch sind alle verwendeten Items in den Anhängen 4.2 und 4.3 vollständig einsehbar. Für jede Skala wird anschließend mithilfe einer Reliabilitätsanalyse Cronbachs α als Maß der internen Konsistenz der Skala bestimmt. 127 Die bei den einzelnen Skalen erzielten Werte werden abschließend errechnet, indem die Werte aller Items, die in die Skalen aufgenommen wurden, summiert und durch deren Anzahl dividiert werden. Wenn bei einzelnen Probandinnen oder Probanden ein oder zwei Items einer Skala nicht bearbeitet wurden, der Rest der Skala jedoch bearbeitet wurde, wird der Mittelwert aus den verbleibenden Items gebildet, sodass durch einzelne nicht bearbeitete Items keine fehlenden Werte in der Skala entstehen. Wenn allerdings weniger als drei bearbeitete Items innerhalb einer Skala anzutreffen sind, wird entsprechend 218 9 Untersuchungsinstrumente bei der Skala ein fehlender Wert eingetragen. Dies kommt insgesamt aber nur vereinzelt vor. Die Auswertung der Ergebnisse befindet sich in den Kapiteln 11.7.1 und 11.7.5 sowie in Anhang 6. - 9.3.4.1 Skalen zur integrativen Orientierung gepaart mit dem Ideal L3/ L4 Self Die Items zur integrativen Orientierung wurden ausgehend von den Items der Skalen von Dörnyei und Clément (2002: 412, 427-428), Kissau (2006a: 81, 92) sowie Meißner et al. (2008: 51) adaptiert und befinden sich in den Punkten 4.1 bis 4.5 des Schülerfragebogens (vgl. Anhang 3.2 und 3.3). Die Items von Kissau (2006a: 81, 92), die sich auf das Erlernen des Französischen als Fremdsprache in den englischsprachigen Teilen Kanadas beziehen, sowie die Items von Dörnyei und Clément (2002: 412, 427-428), die an ungarische Fremdsprachenlernende gerichtet waren, wurden hierfür zunächst nach der Methode von Brislin et al. (1973) aus dem Englischen ins Deutsche übertragen und anschließend, auch mithilfe des Pretests der Pilotierung (vgl. Kapitel 9.3.1) auf den deutschen Kontext sowie die Zielsprachen Französisch und Spanisch angepasst. Obwohl sich das Konstrukt der integrativen Orientierung in der Fremdspra‐ chenforschung weitestgehend etabliert hat, können teilweise bei der Erhebung dieses Konstrukts Probleme auftreten, insbesondere wenn bis zum Testzeit‐ punkt zu wenig Kontakt zwischen den Probandinnen und Probanden und Muttersprachlerinnen und Muttersprachlern bestand: Gardner (2001: 1) weist darauf hin, dass einzelne Items aufgrund der unterschiedlichen Vorerfahrungen der Probandinnen und Probanden mit der jeweiligen Zielkultur unterschiedlich verstanden werden können (vgl. Kapitel 5.1.3.1.1). Aus diesem Grund wird zusätzlich das Ideal L3 bzw. L4 Self erhoben (vgl. Punkte 4.6 bis 4.11 des Schülerfragebogens im Anhang 3.2 und 3.3), dessen Konzeption sich in der Forschung insbesondere für diejenigen Kontexte, in denen die entsprechende Zielsprache lediglich im schulischen Kontext und nicht bzw. kaum im außer‐ schulischen Kontext verwendet wird, als leichter nachweisbar herausgestellt hat als das Konstrukt der integrativen Orientierung (vgl. Henry/ Cliffordson 2013a). Dieses Phänomen zeigt auch die Studie von Csizér und Dörnyei (2005), die zu dem Ergebnis kommt, dass integrativ motivierte L2-Lernende ein Ideal L2 Self konstruieren, auch wenn sie noch nicht in Kontakt mit Muttersprachlerinnen und Muttersprachlern der Zielsprache sind (vgl. Kapitel 5.1.3.1.3). Dies deutet darauf hin, dass es zwischen der integrativen Motivation und dem Ideal L3 bzw. L4 Self in der vorliegenden Studie zu einer möglichen signifikanten Korrelation zwischen den Items der beiden Konstrukte kommen könnte, welche womöglich von den individuellen Sprachlernerfahrungen und interkulturellen 9.3 Der Schülerfragebogen 219 128 IdSelSub 6: „Meine Pläne für die Zukunft setzen voraus, dass ich später einmal Französisch/ Spanisch sprechen kann.“ (vgl. Henry/ Cliffordson 2013b: 3; Ryan 2009: 143; Taguchi et al. 2009: 91). Kontakten abhängt und sowohl für die Französischstichprobe als auch für die Spanischstichprobe separat überprüft werden soll. Aus diesen Gründen werden neben der integrativen Orientierung auch das Ideal L3 Self für Französisch und das Ideal L4 Self für Spanisch mithilfe des Schülerfragebogens erhoben. Die sechs Items zum Ideal L3/ L4 Self wurden auf Grundlage der Skalen von Henry und Cliffordson (2013b: 3), Ryan (2009: 143) und Taguchi et al. (2009: 91) an die vorliegende Studie angepasst und entsprechend weiterentwickelt. Zunächst werden daher exploratorische Faktorenanalysen separat für die Skalen zur integrativen Motivation und zum Ideal L3/ L4 Self durchgeführt, bevor in einer jeweils gemeinsamen Faktorenanalyse mit den Skalen aus beiden Konstrukten überprüft werden, ob diese tatsächlich statistisch trennscharf sind und eine hohe Konstruktvalidität aufweisen. In der Französischstichprobe korrelieren alle Items der Skala zur integrativen Orientierung (vgl. IntOrSub1 bis IntOrSub5) signifikant miteinander. Der KMO-Koeffizient liegt für die Skala zur integrativen Motivation bei .838 und der Bartlett-Test fällt mit p = .000 hoch signifikant aus. Die MSA-Koeffizienten liegen zwischen .819 und .860, was ebenfalls für eine hohe Eignung aller Items für die Skalenbildung spricht. Die Faktorladungen liegen zwischen .568 und .730 und Cronbachs α beträgt .812 (vgl. Anhang 5.1). Die Items zum Ideal L3/ L4 Self werden zum Ziel der Skalenbildung ebenfalls einer ersten exploratorischen Faktorenanalyse unterzogen. Dabei wird zunächst ersichtlich, dass das sechste Item (IdSelSub6 128 ) in der Französischstichprobe keine signifikante Korrelation mit den anderen Items des Konstrukts des Ideal L3/ L4 Self aufweist (vgl. Anhang 5.2 ohne IdSelSub6). Dass die Werte dieses Items nicht signifikant mit den anderen Items korrelieren, könnte unter anderem mit der Zuweisung einer, auch im Vergleich zum Englischen betrachteten, subjektiv weniger relevanten Rolle des Französischen für die zukünftigen privaten und beruflichen Pläne der Schülerinnen und Schüler zusammenhängen (vgl. Bittner 2003: 334; Küster 2007: 220). Alle anderen Items des Konstrukts Ideal L3 Self korrelieren in der Französischstichprobe signifikant miteinander. Der KMO-Koeffizient liegt nach Ausschluss des Items IdSelSub6 für die Skala des Ideal L3 Self unter Ausschluss von IdSelSub6 bei der Französischstichprobe zunächst bei .762 und der Bartlett-Test auf Sphärizität ist mit p = .000 hoch signifikant. Die MSA-Koeffizienten liegen zwischen .736 und .783 und somit alle deutlich über dem Grenzwert von .5, wodurch die Voraussetzungen für eine exploratorische Faktorenanalyse erfüllt sind. Diese ergibt, dass alle Items auch 220 9 Untersuchungsinstrumente auf einen Faktor laden; Cronbachs α liegt für das Ideal L3 Self in Französisch bei .755, wodurch ein akzeptabler Wert erzielt werden kann (vgl. Blanz 2015: 256; Anhang 5.2). Führt man jedoch in der Französischstichprobe eine explora‐ torische Faktorenanalyse mit allen Items aus den beiden vorläufigen Skalen zur integrativen Motivation und zum Ideal L3 Self (vgl. Anhang 5.1 und 5.2) durch, wird die Nähe der beiden Konstrukte statistisch äußerst deutlich: Mit Ausnahme von IdSelSub5 („Jedes Mal, wenn ich an meine zukünftige berufliche Karriere denke, stelle ich mir vor wie ich Französisch spreche.“) korrelieren alle Items der beiden Konstrukte integrative Motivation und Ideal L3 Self signifikant miteinander, weshalb IdSelSub5 entfernt wird. Die Voraussetzungen für eine exploratorische Faktorenanalyse der restlichen Items sind nun sehr gut, da der KMO-Koeffizient bei .889 liegt, die Signifikanz nach Bartlett sich bei p = .000 verortet und die MSA-Koeffizienten Werte zwischen .773 und .930 vorweisen. Eine Hauptachsenanalyse zeigt, dass nach vier Iterationen alle verbleibenden neun Items auf ausschließlich einen Faktor laden und somit eine gemeinsame Skala des Konstrukts „integrative Orientierung gepaart mit Ideal L3 Self“ bilden. Die Faktorladungen liegen alle deutlich über .5 und der Reliabilitätskoeffizient erreicht mit einem Cronbachs α von .879 einen hohen Wert (vgl. Tabelle 4). Die umfassenden exploratorischen Faktorenanalysen zeigen also, dass in der Französischstichprobe keine Unterscheidung zwischen Integrativer Motivation und Ideal L3 Self gemacht werden kann, da die Mehrzahl der Items beider Konstrukte signifikant korrelieren und auf ein und denselben Faktor laden, was auch auf Grundlage der Ergebnisse der Studie von Csizér und Dörnyei (2005) inhaltlich plausibel erscheint. Für die Spanischstichprobe wird nach derselben Forschungsmethodik vorge‐ gangen: Für die gesamte Skala der integrativen Orientierung zeigt sich jedoch zunächst, dass IntOrSub1 („Gute Kenntnisse in Spanisch erlauben mir, mich in Gesellschaft von spanischen Muttersprachlerinnen und Muttersprachlern wohlzufühlen.“) und IntOrSub2 („Spanischlernen ist wichtig für mich, da es mir ermöglichen wird, neue Menschen kennenzulernen und mit vielen unter‐ schiedlichen Menschen zu sprechen.“) nicht signifikant mit den anderen Items korrelieren. Deshalb werden diese zunächst entfernt. Die fehlende Korrelation kann gut anhand der Hintergrundinformationen, die im Schülerfragebogen in der Spanischstichprobe erhoben wurden, begründet werden: Nur wenige Probandinnen und Probanden hatten bis zum Testzeitpunkt Kontakt mit spa‐ nischsprachigen L1-Sprecherinnen und -Sprechern, was die Antworten auf Frage 2.4 des Fragebogens zeigen: 45 von 94 Spanischlernenden, also 47.9% der Spanischstichprobe, geben an, noch nie im spanischsprachigen Ausland gewesen zu sein, während von den 87 Französischlernenden lediglich 16, 9.3 Der Schülerfragebogen 221 also 17.4% noch nie im französischsprachigen Ausland waren. Somit kann zurückverfolgt werden, dass zum Testzeitpunkt die Integrativitätsziele bei der Spanischstichprobe weniger deutlich definiert sind, in dem Sinne, dass diese Ziele für die Spanischstichprobe noch als wenig umsetzbar erscheinen. Auch die exploratorische Faktorenanalyse mit den Items IntOrSub3, IntOrSub4 und IntOrSub5 zeigt, dass das Konstrukt der integrativen Orientierung aufgrund des fehlenden Kontakts zu Muttersprachlerinnen und Muttersprachlern in der Spanischstichprobe insgesamt noch sehr vage zu sein scheint: Der KMO-Ko‐ effizient liegt bei .591, die Signifikanz nach Bartlett bei p = .004 und die MSA-Koeffizienten zwischen .574 und .622. Die drei Items laden zwar alle auf denselben Faktor, aber die Reliabilität liegt mit .469 unter einem akzeptablen Wert (vgl. Anhang 5.1). Eine Analyse der Skala zum Ideal L4 Self in der Spanischstichprobe zeigt hingegen ein vielversprechenderes Bild: Zunächst muss ebenfalls IdSelSub6 ausgeschlossen werden, da dieses, genauso wie in der Französischstichprobe, nicht signifikant mit den anderen Items zum Ideal L4 Self korreliert. Nach dessen Ausschluss werden die Voraussetzungen für eine exploratorische Fak‐ torenanalyse erneut geprüft: Der KMO-Koeffizient erreicht einen Wert von .765 und der Bartlett-Test auf Sphärizität ist mit p = .000 hochsignifikant. Die MSA-Koeffizienten liegen zwischen .719 und .809. Dadurch liegen gute Voraussetzungen für eine exploratorische Faktorenanalyse vor, welche ergibt, dass alle Items auf ein und denselben Faktor laden. Cronbachs α erreicht für das Ideal L4 Self in Spanisch einen Wert von .782, was einen durchaus akzeptablen Reliabilitätskoeffizienten darstellt (vgl. Blanz 2015: 256; vgl. Anhang 5.2). Eine erste Korrelationsanalyse der Items aus den Skalen integrative Orientierung und Ideal L4 Self zeigt, dass auch in der Spanischstichprobe überwiegend signifikante Korrelationen zwischen den ursprünglich separat angelegten Konstrukten vor‐ liegen. Lediglich IdSelSub4 („Ich kann mir vorstellen, dass ich eines Tages Spanisch wie ein Muttersprachler/ eine Muttersprachlerin sprechen kann.“) muss aufgrund der fehlenden signifikanten Korrelation mit den anderen Items entfernt werden. Schließlich liegt der endgültige KMO-Koeffizient für diese beide Konstrukte gleichermaßen umfassende Skala bei .818 und die Signifikanz nach Bartlett bei p = .000. Die MSA-Koeffizienten liegen zwischen .778 und .867. Die Hauptachsenanalyse zeigt, dass alle sieben verbleibenden Items auch auf ein und denselben Faktor laden und somit in der Spanischstichprobe ebenfalls ein gemeinsames Konstrukt „Integrative Orientierung und Ideal L4 Self“ vorliegt. Die Hauptfaktorladung liegt hier auf Item IdSelSub3 („Ich stelle mir mein zukünftiges Ich als jemanden vor, der gut Spanisch sprechen kann.“) 222 9 Untersuchungsinstrumente 129 Der Ursprung jedes einzelnen Items und die Art der Anpassung werden stets genau dokumentiert. Um nicht alle Items doppelt, d. h. separat für Französisch und für Spanisch aufzuführen, werden in den Tabellen die Items jeweils für Französisch und Spanisch gemeinsam formuliert, wohingegen diese in den Fragebögen selbstverständ‐ lich separat auftreten. IdSelSub1 Französisch („Ich kann mir vorstellen, später einmal im französischsprachigen Ausland zu leben und dort erfolgreich Französisch zu sprechen.“ vgl. Anhang 3.2) und IdSelSub1 Spanisch („Ich kann mir vorstellen, später einmal im spanischsprachigen Ausland zu leben und dort erfolgreich Spanisch zu sprechen.“ vgl. Anhang 3.3) wurden beispielsweise in Tabelle 4 zur besseren Übersichtlichkeit der Darstellung zu „Ich kann mir vorstellen, später einmal im französisch-/ spanisch‐ sprachigen Ausland zu leben und dort erfolgreich Französisch/ Spanisch zu sprechen.“ zusammengefasst. und Cronbachs α liegt bei .773 und somit bei einem akzeptablen Wert (vgl. Blanz 2015: 256; Tabelle 4). 129 - Franzö‐ sischstich‐ probe (n-=-85, MV = 7) Spa‐ nischstich‐ probe (n = 94, MV = 0) Itemname Itemaussage FL FL - IdSel Sub1 Ich kann mir vorstellen, später einmal im franzö‐ sisch-/ spanischsprachigen Ausland zu leben und dort erfolgreich Französisch/ Spanisch zu sprechen. .559 .670 IdSel Sub2 Ich kann mir gut vorstellen, dass ich in der Zu‐ kunft Französisch/ Spanisch mit internationalen Freundinnen und Freunden oder Kolleginnen und Kollegen sprechen werde. .685 .577 IdSel Sub3 Ich stelle mir mein zukünftiges Ich als jemanden vor, der gut Französisch/ Spanisch sprechen kann. .561 .742 IdSel Sub4 Ich kann mir vorstellen, dass ich eines Tages Französisch/ Spanisch wie ein Muttersprachler/ eine Muttersprachlerin sprechen kann. .707 -- IdSel Sub5 Jedes Mal, wenn ich an meine zukünftige berufliche Karriere denke, stelle ich mir vor wie ich Franzö‐ sisch/ Spanisch spreche. -- .553 IntOr Sub1 Gute Kenntnisse in Französisch/ Spanisch erlauben mir, mich in Gesellschaft von französischen/ spani‐ schen Muttersprachlern wohlzufühlen. .714 -- 9.3 Der Schülerfragebogen 223 Franzö‐ sischstich‐ probe (n-=-85, MV = 7) Spa‐ nischstich‐ probe (n = 94, MV = 0) IntOr Sub2 Französischlernen/ Spanischlernen ist wichtig für mich, da es mir ermöglichen wird, neue Menschen kennenzulernen und mit vielen unterschiedlichen Menschen zu sprechen. .728 -- IntOr Sub3 Es ist für mich wichtig, Französisch/ Spanisch zu lernen, da ich so die Kultur französischsprachiger Länder besser verstehen kann. .561 .396 IntOr Sub4 Ich mag es einfach, Französisch/ Spanisch mit an‐ deren Menschen zu sprechen. .731 .568 IntOr Sub5 Französisch/ Spanisch zu lernen ist wichtig für mich, da ich so an Aktivitäten anderer kultureller Gruppen, z. B. im Rahmen eines Schüleraustauschs, besser teilnehmen kann. .615 .490 - Cronbachs α (Skala aus allen neun bzw. sieben Items) α-=-.879 α = .773 Anmerkungen. Die Items zum Ideal L3/ L4 Self wurden aus Ryan (2009: 143; vgl. IdSelSub2), Taguchi et al. (2009: 91; vgl. IdSelSub1, IdSelSub2, IdSelSub4, IdSelSub5) sowie Henry und Cliffordson (2013b: 3; vgl. IdSelSub2, IdSelSub3, IdSelSub5) entnommen und adaptiert. Henry und Cliffordson (2013b: 3) messen ein Cronbachs α von .93, Ryan (2009) α = .85, Taguchi et al. (2009: 75) α-=-.89 in Japan, α = .78 in China und α = .79 im Iran. Die Items zur integrativen Orientierung stammen aus Kissau (2006a: 92; vgl. IntOrtSub1, IntOrSub2, IntOrSub3, IntOrSub5), Meißner et al. (2008: 51; vgl. IntOrSub1, IntOrSub2) sowie Dörnyei und Clément (2002: 427; vgl. IntOrSub3), wurden teilweise aus dem Englischen übersetzt und angepasst. Kissau (2006a: 81, 92) misst ein Cronbachs α von .83, Meißner et al. (2008: 51) messen α-=-.60 und Dörnyei und Clément (2002: 412) α-=-.72. Tabelle 4: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen zur „integra‐ tiven Orientierung (IntOr) gepaart mit dem Ideal L3/ L4 Self (IdSel) für Französisch bzw. Spanisch“ Die exploratorischen Faktorenanalysen ergaben somit, dass, im Gegensatz zur bisherigen Forschung, auf statistischer Ebene keine zwei trennscharfen Kon‐ strukte „integrative Orientierung“ und „Ideal L3/ L4 Self“ vorliegen, sondern dass diese innerhalb der beiden untersuchten Stichproben jeweils ein gemeinsames Konstrukt „integrative Orientierung und Ideal L3/ L4 Self“ bilden. - 9.3.4.2 Skalen zur instrumentellen Orientierung Komplementär zur integrativen Orientierung und zum Ideal L2 Self kristal‐ lisierte sich die instrumentelle Motivation in der bisherigen Forschung als 224 9 Untersuchungsinstrumente 130 Hierbei wurden erneut die Items von Kissau (2006a: 92) sowie Dörnyei und Clément (2002) nach der Methode von Brislin et al. (1973) aus dem Englischen ins Deutsche übertragen und anschließend auf den deutschen Kontext und die Zielsprachen Franzö‐ sisch und Spanisch angepasst. 131 InstOrSub2: „Französisch zu lernen ist für mich wichtig, da ich später einen Teil meines Studiums im französischsprachigen Ausland absolvieren möchte“ (vgl. Meißner et al. 2008: 52). Prädiktor für den Fremdsprachenlernerfolg und gleichzeitig als zum Faktor Geschlecht interdependente Variable heraus (vgl. Kapitel 5.1.3.1.1). Die instru‐ mentelle Motivation beruht auf der utilitaristischen Dimension des Fremdspra‐ chenlernens bezüglich der zukünftigen Karrierepläne, aber auch bezogen auf die Möglichkeit, zu verreisen oder aufgrund der eigenen Fremdsprachenkenntnisse ein gewisses Prestige zu erlangen (vgl. Csizér/ Dörnyei 2005: 21). Die in der vorliegenden Studie verwendeten Items zur instrumentellen Orientierung wurden auf Grundlage der Skalen von Meißner et al. (2008: 52), Dörnyei und Clément (2002: 314), Dörnyei (2009: 93) sowie Kissau (2006a: 92) angepasst. 130 Die Items befinden sich im Schülerfragebogen unter den Punkten 4.12 bis 4.16 (vgl. Anhang 3.2 und 3.3). Für die Französischstichprobe zeigt sich, dass ausschließlich drei Items signi‐ fikant miteinander korrelieren (InstOrSub1, InstOrSub3, InstOrSub5). Daher wird die Skala zunächst mit drei Items gebildet, auch wenn die ideale Mindest‐ anzahl von Items bei vier liegt (vgl. Costello/ Osborne 2005: 5). Oft werden in anderen Studien allerdings trotzdem und gerade im Bereich der Instrumentalität Skalen gebildet, die lediglich aus drei Items bestehen (vgl. Dörnyei/ Clément 2002: 412; Meißner et al. 2008: 51; Taguchi et al. 2009: 75, 93). Der Vorteil bei der Berücksichtigung der Korrelationen zwischen den Items liegt in einer gesteigerten Reliabilität, die als noch wichtiger eingestuft wird als das Beharren auf der Beibehaltung von vier Items. Inhaltlich lässt sich die Reduktion insofern erläutern, als dass in der Französischstichprobe, insbesondere zur Rolle des Französischen in ihrem möglichen zukünftigen Studium, zu vage Vorstellungen zu existieren scheinen, da vor allem das Item InstOrSub2 131 nicht mit den anderen Items korrelier. Auch für Reisen ins Ausland scheint der Nützlichkeitsaspekt des Französischen durch die Probandinnen und Probanden nur ein vages Konstrukt zu sein, weshalb sich auch das Item InstOrSub4 als statistisch problematisch erweist. Somit wird für Französisch eine Skala aus den verbleibenden drei Items gebildet, welche einen KMO-Koeffizienten von .582, eine Signifikanz nach Bartlett von p = .000 sowie MSA-Koeffizienten zwischen .582 und .636 aufweisen, wodurch alle Voraussetzungen für die exploratorische Faktorenana‐ lyse erfüllt sind. Eine Hauptachsenanalyse ergibt, dass alle drei Items auf 9.3 Der Schülerfragebogen 225 denselben Faktor laden und die Hauptladung für die instrumentelle Orientie‐ rung deutlich auf InstOrSub3 liegt, wodurch vor allem der Bildungsaspekt und der daraus resultierende Prestigegewinn einen großen Teil des bei den Schülerinnen und Schülern ausgebildeten Nützlichkeitskonzepts bezüglich des Französischlernens einnehmen. Cronbachs α liegt bei .538 (vgl. Tabelle 5) und somit eher niedrig (vgl. Blanz 2015: 256). In der Spanischstichprobe muss lediglich das zweite Item (InstOrSub2: „Spa‐ nisch zu lernen ist für mich wichtig, da ich später einen Teil meines Studiums im spanischsprachigen Ausland absolvieren möchte.“) getilgt werden, da es nicht signifikant mit den anderen Items korreliert und daher auf einen anderen Faktor lädt. Auch bei der Spanischstichprobe scheint also ein Studium im spanischsprachigen Ausland (noch) nicht Teil des Instrumentalitätskonstrukts zu sein. Nach dieser Korrektur der Skala betragen der KMO-Koeffizient .674 und die Signifikanz nach Bartlett p = .000. Die MSA-Koeffizienten liegen zwischen .640 und .710, wodurch die Voraussetzungen für die Faktorenanalyse erfüllt sind. Die Hauptachsenanalyse zeigt, dass die Hauptladung auf InstOrSub4 („Spanisch wird mir bei zukünftigen Reisen ins Ausland nützlich sein.“; vgl. Tabelle 5) liegt, was besonders interessant ist, da dieses aus der Skala der instrumentellen Orientierung für Französisch entfernt werden musste. Schließlich liegt Cron‐ bachs α in der Spanischstichprobe bei .544 (vgl. Tabelle 5), also ebenfalls bei einem niedrigen, aber noch verwendbaren Wert (vgl. Blanz 2015: 256). Diese etwas niedrigeren Reliabilitätswerte entsprechen den Tendenzen anderer, größer angelegten Studien: Bei der Skala zur Integrativität von Meißner et al. (2008: 52) lag in der 9. Jahrgangsstufe in Deutschland Cronbachs α bei .7. Kissau (2006a: 83) erreichte bei der Instrumentalität bezüglich des Französischen im englischsprachigen Teil Kanadas in Grade 9 ein Cronbachs α von .641. Taguchi et al. (2009: 75) kamen auf ein Cronbachs α von .64 in Japan, von .63 in China und von .56 im Iran. Dörnyei und Clément (2002: 412) erreichten schließlich in einer großen Stichprobe (n = 4 765) von dreizehnbis vierzehnjährigen Acht‐ klässlerinnen und Achtklässlern in Ungarn in ihren Skalen zur Instrumentalität unterschiedliche Reliabilitätswerte je nach Zielsprache, welche zwischen .73 für Englisch und Französisch und .81 für Russisch lagen. Selbst wenn der Kritik von Csizér und Dörnyei (2005: 21) am Konstrukt der Instrumentalität, dass diese für die Probandinnen und Probanden manchmal nicht eindeutig sei, nach der exploratorischen Faktorenanalyse also in Teilen zugestimmt werden muss, was sich in der stattgefundenen notwendigen Elimi‐ nation einzelner Items niederschlägt, konnten dennoch für beide Stichproben akzeptable Skalen zum subjektiven utilitaristischen Nutzen der beiden roma‐ nischen Sprachen generiert werden. Die von Csizér und Dörnyei (2005: 21) 226 9 Untersuchungsinstrumente vorgebrachten Bedenken gegenüber der möglicherweise geringen Relevanz des utilitaristischen Nutzens von Fremdsprachen hinsichtlich der subjektiven Bewertung von gesteigerten Berufsaussichten durch adoleszente Lernende (vgl. InstOrSub5, Tabelle 5) können daher verworfen werden. Aus den Skalen wird nämlich ersichtlich, dass diese zum Instrumentalitätskonstrukt der adoleszenten Französisch- und Spanischlernenden gehören, was die jeweilige Faktorladung von InstOrSub5 für beide romanischen Sprachen erkennen lässt (vgl. Tabelle 5). - Franzö‐ sischstich‐ probe (n-=-87, MV = 5) Spa‐ nischstich‐ probe (n = 93, MV = 1) Itemname Itemaussage FL FL InstOr Sub1 Meine Französisch-/ Spanischkenntnisse werden mir helfen, später eine gute Arbeit zu finden. .482 .444 InstOr Sub3 Französischlernen/ Spanischlernen ist wichtig für mich, da ich dadurch zu einer gebildeten Person werde. .763 .548 InstOr Sub4 Französisch/ Spanisch wird mir bei zukünftigen Reisen ins Ausland nützlich sein. -- .702 InstOr Sub5 Französisch/ Spanisch ist wichtig für mich, da mich die Leute mehr respektieren werden, wenn ich Französisch-/ Spanischkenntnisse habe. .373 .377 - Cronbachs α (Skala aus allen drei bzw. vier Items) α = .538 α = .544 Anmerkungen. Die Items wurden auf Grundlage der Skalen von Meißner et al. (2008: 52, vgl. InstOrSub1), Dörnyei und Clément (2002: 412, 427-428; vgl. InstOrSub1, InstOrSub3, InstOrSub4), Taguchi et al. (2009: 75, 93, vgl. InstOrSub1), Kissau (2006a: 92, vgl. InstOrSub1, InstOrSub3, InstOrSub4, InstOrSub5) und wurden teilweise entsprechend adaptiert. InstMotSub2 „Franzö‐ sisch/ Spanisch zu lernen ist für mich wichtig, da ich später einen Teil meines Studiums im französisch-/ spanischsprachigen Ausland absolvieren möchte.“, ursprünglich aus Meißner et al. (2008: 52) adaptiert, wurde in beiden Skalen entfernt und ist daher nicht in der Tabelle enthalten. Tabelle 5: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen zur „instru‐ mentellen Orientierung (InstOr) für Französisch bzw. Spanisch“ 9.3 Der Schülerfragebogen 227 9.3.4.3 Skalen zur Häufigkeit der Freizeitaktivitäten auf Französisch bzw. Spanisch Um im Sinne einer Hintergrundvariable komplementär zur Motivation zu überprüfen, inwiefern die Probandinnen und Probanden das Französische bzw. Spanische in ihrer Freizeit, d. h. außerhalb des Unterrichts in den sechs Monaten vor dem Erhebungszeitpunkt verwendet haben, wird die in den Formulierungen lediglich leicht angepasste Skala des IQB-Ländervergleichs von 2008/ 2009 von Sachse et al. (2012: 312) verwendet (vgl. Absatz 2.5 des Schülerfragebogens; An‐ hang 3.2 und 3.3). Die dreizehn Items reichen vom „Ansehen von Spielfilmen auf Französisch bzw. Spanisch“ über „Spielen von Computerspielen auf Französisch bzw. Spanisch“ bis hin zu „Teilnehmen an einer mündlichen Unterhaltung auf Französisch bzw. Spanisch“. Dabei wurde für die Angabe der Häufigkeit dieser Freizeitaktivitäten dieselbe Codierung verwendet wie im IQB-Ländervergleich 2008/ 2009, d. h. 1 steht für nie, 2 steht für einmal, drei für zweibis dreimal, 4 für vierbis fünfmal und 5 für mehr als fünfmal (Sachse et al. 2012: 312). Durch die ungleichen Abstände zwischen den Merkmalsausprägungen ist diese Skala nicht intervallsondern ordinalskaliert. Da es sich bei diesem Konstrukt nicht um das eindimensionale Instrument einer Skala handelt, sondern ein Index in Form eines mehrdimensionalen Konstrukts vorliegt, welcher für die Häufigkeit der Freizeitaktivitäten in der Fremdsprache steht, wird hier keine Faktorenanalyse durchgeführt. Es ist nämlich bei einem Index nicht erforderlich, dass alle Items miteinander korrelieren (vgl. Kuckartz et al. 2013: 242). Die Abfrage dieser Informationen dient unter anderem als Interpretationshilfe für die Skalen zu den Bereichen Interesse und Motivation, da davon ausgegangen werden kann, dass insbesondere bei hohem Interesse am Fach und hoher integrativer Motivation die jeweilige Fremdsprache auch in der Freizeit häufiger verwendet wird (vgl. Kapitel 11.7). - 9.3.4.4 Skalen zur L3/ L4 Willingness to communicate (WTC) Eine weitere Art und Weise, die Motivation implizit und komplementär zur di‐ rekten Erhebung der integrativen und instrumentellen Orientierung zu messen, ist die Befragung zur L3/ L4 WTC im Fremdsprachenunterricht, welche meist stark mit dem tatsächlichen aktiven, kommunikativen und somit lernförderli‐ chen Verhalten im Fremdsprachenunterricht im Sinne eines hohen Outputs in der Fremdsprache sowie dem Einsatz von Kompensationsstrategien, z. B. bei fehlendem Wortschatz korreliert (vgl. Mystkowska-Wiertelak/ Pawlak 2016: 21). Die In-class L3/ L4 Willingness to communicate (WTC), also die fremdsprachliche Gesprächsbereitschaft während des Fremdsprachenunterrichts wird komple‐ mentär zu den Aktivitäten auf Französisch bzw. Spanisch in der Freizeit, d. h. 228 9 Untersuchungsinstrumente zu den fremdsprachlichen Aktivitäten außerhalb des Klassenzimmers, erhoben werden. Zu diesem Forschungszweck wird eine angepasste Skala zur L3/ L4 WTC verwendet, die vorwiegend auf der Forschungsarbeit von Myst‐ kowska-Wiertlak/ Pawlak (2016) basiert. Die beiden polnischen Forschenden berücksichtigten alle relevanten L2 WTC-Skalen, welche überwiegend in Ka‐ nada, den USA, Japan und China eingesetzt wurden (vgl. z. B. MacIntyre et al. 2002, 2003; McCroskey/ Bear 1985; Ryan 2009) und passen diese nach einer ausführlichen theoriegeleiteten Analyse entsprechend an den aktuellen europäischen Kontext an. Die Skala zur L3 WTC im Französischen muss zunächst einmal um das Item WTCSub3 verkleinert werden, da dieses nicht signifikant mit den anderen Items korreliert. Bei der anschließenden exploratorischen Faktorenanalyse ergibt sich ein KMO-Koeffizient von .800 und eine Signifikanz nach Bartlett von p = .000. Die MSA-Koeffizienten liegen zwischen .776 und .849 und Hauptladung liegt auf WTCSub1 („Ich spreche gerne Französisch, wenn die ganze Klasse zuhört.“). Cronbachs α liegt bei .765 (vgl. Tabelle 6). In der Spanischstichprobe korrelieren die Items WTCSub4 („Ich frage meine Französisch-/ Spanischlehrkraft, wenn ich etwas nicht weiß.“) und WTCSub5 („Ich führe gerne französische/ spanische Rollenspiele vor der Klasse auf.“) nicht signifikant mit den restlichen Items, weshalb diese entfernt werden. Die anschließende exploratorische Faktorenanalyse offenbart einen KMO-Ko‐ effizienten von .613 und eine Signifikanz nach Bartlett von p = .000. Die MSA-Koeffizienten verorten sich zwischen .580 und .796 und liegen daher noch über dem Grenzwert von .5. Auch hier ist die Hauptladung bei WTCSub1 anzutreffen und Cronbachs α liegt für diese reduzierte Skala, die nunmehr aus vier Items besteht, bei .646 (vgl. Tabelle 6). - Franzö‐ sischstich‐ probe (n = 86, MV = 6) Spanischstich‐ probe (n = 92, MV = 2) Itemname Itemaussage FL FL WTC Sub1 Ich spreche gerne Französisch/ Spanisch, wenn die ganze Klasse zuhört. .731 .888 WTC Sub2 Ich nehme gerne an kleinen Diskussionsrunden auf Französisch/ Spanisch unter Mitschülerinnern und Mitschülern teil. .706 .651 9.3 Der Schülerfragebogen 229 Franzö‐ sischstich‐ probe (n = 86, MV = 6) Spanischstich‐ probe (n = 92, MV = 2) WTC Sub4 Ich frage meine Französisch-/ Spanischlehrkraft, wenn ich etwas nicht weiß. .591 .412 WTC Sub5 Ich führe gerne französische/ spanische Rollen‐ spiele vor der Klasse auf. .641 -- WTC Sub6 Ich spreche im Unterricht gerne mit meinem Sitz‐ nachbarn/ meiner Sitznachbarin Französisch/ Spa‐ nisch. .492 .365 - Cronbachs α (Skala aus allen fünf bzw. vier Items) α = .765 α = .646 Anmerkungen. Die Skala wurde auf Basis des Tool for Measuring the Interrelationships between L2 WTC, Confidence, Beliefs, Motivation and Context angepasst (vgl. Mystokwaska-Wiertelak/ Pawlak 2016: 31; vgl. WTCSub1, WTCSub2, WTCSub3, WTCSub4, WTCSub5, WTCSub6; Kissau 2006a: 91; vgl. WTCSub4). WTCSub3 „Ich frage meine Mitschülerinnen und Mitschüler nach franzö‐ sischen/ spanischen Wörtern, wenn ich diese nicht weiß.“ wurde aufgrund nicht signifikanter Korrelation mit den anderen Items aus der Skala entfernt. Tabelle 6: Items, Faktorladungen, Mittelwerte und Standardabweichungen der Skalen zur „L3/ L4 WTC” - 9.3.4.5 Skalen zum Interesse am Fach Französisch bzw. Spanisch In seiner Studie zum Bilingualen Unterricht Deutsch/ Englisch erarbeitete Rum‐ lich (2016) eine Skala für Interesse am Fach Englisch, die in der 6. und 8. Jahr‐ gangsstufe umfassend erprobt wurde und sich bei einer Stichprobe von 820 Schülerinnen und Schülern der 8. Jahrgangsstufe mit einem Cronbachs α von .89 bewährte. Da die einzelnen Items aus Studien wie KESS 10/ 11 (Vieluf et al. 2011), DESI (Wagner et al. 2009) und PISA 2003 (vgl. Ramm et al. 2006) abgeleitet wurden, welche als Zielgruppe Schülerinnen und Schüler in Deutschland am Ende der Sekundarstufe I oder am Anfang von Sekundarstufe II hatten, wird deren Altersangemessenheit und Verständlichkeit als sehr hoch eingeschätzt (vgl. Sparfeldt et al. 2004). Aus diesem Grund und auch weil keines der Items in seiner Gültigkeit ausschließlich auf das Fach Englisch bezogen ist, wird die Skala übernommen und an die Fächer Französisch und Spanisch angepasst (vgl. Tabelle 7). Die Skala zum Interesse am Fach Französisch bzw. Spanisch befindet sich in den Unterpunkten 3.1 bis 3.3 des Schülerfragebogens (vgl. Anhang 3.2 und 3.3) Außerdem erwies sich das Item ESpra7, das ursprünglich als Teil des 230 9 Untersuchungsinstrumente 132 Die relativ hohe Anzahl fehlender Werte kommt in der Französischstichprobe daher, dass teilweise einzelne Items nicht bearbeitet wurden. Bei fehlender Behandlung vereinzelter Items, z. B. wenn sechs der sieben Items bearbeitet wurden, wird im Anschluss jedoch trotzdem eine Skala gebildet (vgl. Kapitel 9.3.3). Konstrukts „Einstellung zur Fremdsprache“ aufgelistet war und sich im Frage‐ bogen unter Punkt 6.7 befindet, in den skalenübergreifenden Faktorenanalysen als deutlich zu der Skala Interesse am Fach Französisch/ Spanisch zugehörig, weshalb dieses als InSub8 in die Skala aufgenommen wurde (vgl. Tabelle 7, vgl. Kapitel 9.3.4.6). Der KMO-Test für die endgültige Skala Interesse am Fach Französisch ergibt einen KMO-Koeffizienten von .907; der Bartlett-Test auf Sphärizität kommt zu einem signifikanten Ergebnis (p = .000). Außerdem liegen alle MSA-Koeffizienten zwischen .882 und .923, wodurch die Voraussetzungen für die exploratorische Faktorenanalyse erfüllt sind. Die Durchführung der Haupt‐ achsenanalyse ergibt, dass alle Items der Skala Interesse am Fach Französisch in der Französischstichprobe (n = 80, MV = 12) 132 auf dieselbe Komponente laden, so wie dies auch durch die Konzeption vorgesehen war. Daher muss keine Elimination von Items oder eine erneute Rotation vorgenommen werden. Die Hauptladung liegt bei der Französischstichprobe auf InSub4 („Mein Interesse am Fach Französisch/ Spanisch ist hoch.“; vgl. Tabelle 7). In der Spanischstichprobe wird ein KMO-Koeffizient von .905 erreicht und der Bartlett-Test ist mit p = .000 ebenfalls signifikant. Die MSA-Koeffizienten liegen zwischen .897 und .934 und somit deutlich über .5. Cronbachs α beträgt hier .889 und erreicht somit einen sehr hohen Wert. Die Hauptladung bei der Spanischstichprobe liegt bei InSub6 („Ich würde das Fach Französisch/ Spanisch sofort abwählen und ein anderes Fach wählen, wenn ich es könnte. (-)“; vgl. Tabelle 7). 9.3 Der Schülerfragebogen 231 Franzö‐ sischstich‐ probe (n-=-80, MV = 12) Spanischstich‐ probe (n = 93, MV = 1) Itemname Itemaussage FL FL InSub1 Ich würde gerne mehr Unterricht im Fach Franzö‐ sisch/ Spanisch haben. .745 .749 InSub2 Französisch/ Spanisch gehört für mich zu den wichtigen Fächern. .768 .715 InSub3 Ich finde das Fach Französisch/ Spanisch lang‐ weilig. (-) .780 .718 InSub4 Mein Interesse am Fach Französisch/ Spanisch ist hoch. .806 .703 InSub5 Ohne das Fach Französisch/ Spanisch würde mir etwas fehlen. .633 .697 InSub6 Ich würde das Fach Französisch/ Spanisch sofort abwählen und ein anderes Fach wählen, wenn ich es könnte. (-) .645 .833 InSub7 Ich freue mich normalerweise auf den Franzö‐ sisch-/ Spanischunterricht. .784 .692 InSub8 Ich mag Französisch/ Spanisch nicht. (-) .805 .722 - Cronbachs α (Skala aus allen acht Items) α =-.905 α =-.899 Anmerkungen. Die hier vorliegenden Items (InSub1 bis InSub7) wurden von Rumlich (2016: 289-290) in leicht angepasster Form übernommen. Die Skala wies in ihrer ursprünglichen Form für die 8. Klasse Englisch ein Cronbachs α von .89 auf. Rumlich (2016) leitete die Items wiederum aus folgenden Quellen ab: Nikolova (2011: 145), Köller (1998: 203), Wagner et al. (2009: 51, 53), Sachse et al. (2012: 95), Ramm et al (2006: 246) und Rheinberg/ Wendland (2002: 23). Item InSub8 stammt von Venus (2017a: 167). Tabelle 7: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen zum „Interesse am Fach Französisch bzw. Spanisch“ Schulfachspezifische Interessen und Fachleistungen weisen oft einen positiven Zusammenhang auf, z. B. was das Lesen von Texten betrifft, und erweisen sich oft als abhängig vom Geschlecht (vgl. z. B. Lazarides 2011: 164; Schiefele 1996; Sparfeldt et al. 2004). Um genauer nachvollziehen zu können, für welche landeskundlichen Inhalte sich die Schülerinnen und Schüler interessieren, werden daher komplementär zum „Interesse am Fach Französisch/ Spanisch“ 232 9 Untersuchungsinstrumente 133 Diatopische Varietäten sind räumliche Variationen einer Sprache, diastratische Varie‐ täten beziehen sich auf soziale Variationen einer Sprache und diaphasische Varietäten bezeichnen die stilistischen Variationen einer Sprache (vgl. Kabatek/ Pusch 2011: 46). die einzelnen Interessensgebiete innerhalb der von den Bildungsplänen für Französisch und Spanisch in Baden-Württemberg (Landesinstitut für Schulent‐ wicklung 2016a, 2016b) in Abschnitt 11 des Schülerfragebogens erfasst (vgl. Anhang 3.2 und 3.3). - 9.3.4.6 Skalen zu den Einstellungen zur französischen bzw. spanischen Sprache Im Schülerfragebogen steht die Einstellung zu den Sprachen Französisch und Spanisch in ihrer „Einheit“ im Vordergrund (vgl. Punkte 6.1 bis 6.7 in den Anhängen 4.2 und 4.3). Diatopische, diastratische und diaphasische Va‐ rietäten 133 , welche strenggenommen selbstverständlich differenzierter berück‐ sichtigt werden müssten und oft im Zentrum von soziolinguistischen Unter‐ suchungen stehen, werden in den Formulierungen, die an die Schülerinnen und Schüler gerichtet sind, bewusst ausgeklammert (vgl. Meißner et al. 2008: 114). Zum einen sollen die Formulierungen hierdurch leichter verständlich gemacht werden und zum anderen soll die Konstruktvalidität dadurch erhöht werden (vgl. Riemer 2016a). Es ist davon auszugehen, dass die Schülerinnen und Schüler ein teilweise noch wenig ausgeprägtes Bewusstsein über die einzelnen Varietäten haben, auch weil die eigenen Erfahrungen mit Muttersprachlerinnen und Muttersprachlern aus verschiedenen französisch- und spanischsprachigen Ländern vermutlich noch begrenzt sind, weshalb das jeweilige Konstrukt zu vage werden würde. Die in der vorliegenden Studie verwendeten Items und Skalen wurden aus den Studien von Venus (2017a: 167) und Meißner et al. (2008: 50) abgeleitet. Einzelne Items von Venus (2017a: 167), wie beispielsweise „Für meinen späteren Beruf könnte Französisch wichtig sein“, wurden allerdings von Anfang an nicht in den Fragebogen aufgenommen, da diese als zu wenig trennscharf zum Bereich der instrumentellen Orientierung bewertet wurden. Ein Vorteil der Skalen von Venus (2017a) liegt darin, dass diese für das Fach Französisch in Deutschland sowie eine ähnliche Altersklasse konzipiert wurden und die Reliabilität der jeweiligen Skalen sehr genau analysiert wurde. Allerdings wurden von Venus (2017a) keine Faktorenanalysen vorgenommen, weshalb diese für die beiden vorliegenden Stichproben nun vorgenommen werden sollen. In der Französischstichprobe korrelieren die Items ESpraSub2 und ESpraSub6 nicht mit den anderen Items, weshalb diese zum Ziel der Skalenbildung aus‐ geschlossen werden. Für die korrigierte Skala wird für das Französische ein 9.3 Der Schülerfragebogen 233 KMO-Koeffizient von .751 und eine Signifikanz nach Bartlett von p = .000 berechnet. Die MSA-Koeffizienten liegen zwischen .706 und .806 und somit deutlich jenseits des Grenzwerts von .5. Die Hauptladung liegt auf ESpraSub7 „Ich mag Französisch nicht.“, welches entsprechend in rekodierter Form ausge‐ wertet wurde (vgl. Anhang 5.3). In der Spanischstichprobe korrelieren die Items ESpraSub1, ESpraSub3, ESpraSub5 und ESpraSub6 nicht signifikant mit den anderen Items. Die verbleibenden drei Items korrelieren zwar untereinander, erfüllen aber die Voraussetzungen für eine exploratorische Faktorenanalyse nur knapp: Der KMO-Koeffizient liegt bei .597, die Signifikanz nach Bartlett liegt bei p = .000 und die MSA-Koeffizienten liegen zwischen .565 und .564. Cronbachs α liegt jedoch mit .727 bei einem durchaus akzeptablen Wert (vgl. Anhang 5.3). Exploratorische Faktorenanalysen zwischen den bisher erhobenen Items der unterschiedlichen Skalen zeigen jedoch, dass die Skalen „Einstellung zu Französisch bzw. Spanisch“ stark mit den Skalen „Interesse am Fach Franzö‐ sisch/ Spanisch“ korrelieren und hier unklare Faktorladungen auftreten. Da das Item ESpraSub7 („Ich mag Französisch/ Spanisch nicht.“) sich für beide fremdsprachlichen Fächer sogar als sehr klar zur Skala des „Interesses am Fach Französisch/ Spanisch“ zugehörig herausstellt, wird dieses Item zur Skala „Interesse am Fach Französisch/ Spanisch“ hinzugezogen und die restliche Skala zur „Einstellung zu Französisch bzw. Spanisch“ für die weitere Untersuchung entfernt. Inhaltlich bedeutet dies, dass, anders als ursprünglich angenommen, die Probandinnen und Probanden in ihren Einstellungen und Interessen keine Differenzierung zwischen dem Fach Französisch und der französischen Sprache vornehmen. Eine differenziertere Bewertung und somit eine Verwendung beider Skalen wäre somit eventuell bei älteren Lernenden und eventuell auch in außerschulischen Kontexten möglich und zielführender. - 9.3.4.7 Skalen zu den Einstellungen zu den Zielkulturen Die Einstellungen zu den Sprecherinnen und Sprechern des Französischen und Spanischen werden in der vorliegenden Studie zunächst bewusst auf die Sprecherinnen und Sprecher des Französischen in Frankreich und auf die Sprecherinnen und Sprecher des Spanischen in Spanien begrenzt und nicht auf den gesamten frankophonen bzw. hispanophonen Raum bezogen. Ein Grund hierfür ist, dass davon ausgegangen wird, dass insgesamt noch relativ wenig direkter Kontakt zwischen den Probandinnen und Probanden und Menschen aus frankophonen bzw. hispanophonen Räumen außerhalb Frankreichs und Spaniens stattfand (vgl. auch Frage 2.4 des Fragebogens, Anhang 3.2 und 3.3). Außerdem sieht der Bildungsplan für das Gymnasium in Baden-Württemberg 234 9 Untersuchungsinstrumente (vgl. Landesinstitut für Schulentwicklung 2016a: 1) eine verstärkte Auseinander‐ setzung mit der Frankophonie jenseits von Frankreich schwerpunktmäßig erst in der gymnasialen Oberstufe vor. Auch der Bildungsplan für das Fach Spanisch als dritte Fremdsprache am Gymnasium fasst die Jahrgangsstufen 8, 9 und 10 zusammen und sieht erst ab dem Niveau A2 eine erste Auseinandersetzung mit Lateinamerika vor, wobei sich dies zunächst auf die Themen Lebensgewohn‐ heiten und Migration beschränkt (vgl. Landesinstitut für Schulentwicklung 2016b: 2). Das wichtigste Argument für die Beschränkung auf Frankreich bzw. Spanien ist die Konstruktvalidität der Skalen, welche bei einem Bezug auf die gesamten Sprachräume stark verringert werden würde (vgl. Meißner et al. 2008: 114). Die ursprünglich von Venus (2017a: 169) angelegte Skala zu den „Einstel‐ lungen zu den Sprecherinnen und Sprechern“ erweist sich für beide Sprachen als äußerst reliabel und stabil und es muss kein Item aufgrund fehlender signi‐ fikanter Korrelation oder Ladungen auf andere Komponenten entfernt werden (vgl. Anhang 5.4). Auch die ursprünglich angelegte Skala zu „Einstellungen zu Land und Kultur“ für Französisch ist stabil und reliabel, wobei lediglich das Item ELaKSub4 „Französischsprachige Filme finde ich gut.“ aufgrund fehlender Korrelation mit den anderen Items entfernt werden muss. (vgl. Anhang 5.5). Für Spanisch jedoch ist die Skala zu „Einstellungen zu Land und Kultur“ eher instabil und es müssen zunächst drei Items aufgrund mangelnder Korrelationen zu den anderen Items entfernt werden (vgl. Anhang 5.5) und die Reliabilität bleibt mit Cronbachs α von .511 in Spanisch zunächst niedrig. Skalenübergreifende exploratorische Faktorenanalysen mit allen Items aus den von Venus (2017a) getrennt angelegten Skalen „Einstellung zu den Spre‐ cherinnen und Sprechern“ und „Einstellungen zu Land und Kultur“ zeigen jedoch, dass die beiden Skalen untereinander in ihren einzelnen Items zum Großteil signifikante Korrelationen aufweisen und in den beiden untersuchten Stichproben daher nicht als getrennte Konstrukte angesehen werden können. Aus diesem Grund wird auf Grundlage der exploratorischen Faktorenanalysen aus den beiden, von Venus (2017a) separat angelegten Skalen jeweils eine gemeinsame Skala zum Konstrukt „Einstellungen zur Zielkultur“ angelegt. Allerdings müssen ELaKSub1 („Frankreich ist ein schönes Urlaubsziel.“), ELaKSub6 („Frankreich ist ein wichtiger Partner Deutschlands.“) und ELaKSub7 („Frankreich ist ein bedeutendes Land.“) aufgrund nicht signifikanter Korrela‐ tionen mit den anderen Items entfernt werden. Insbesondere für ELaKSub6 und ELaKSub7 ist auch auf inhaltlicher Ebene erkennbar, dass die Einschätzung der allgemeinen Bedeutsamkeit Frankreichs von den subjektiven Einstellungen zum Land abweichen kann. 9.3 Der Schülerfragebogen 235 Bei der Skala in Spanisch müssen ebenfalls ELaKSub1 („Spanien ist ein schönes Urlaubsziel.“), ELaKSub3 („Ich mag spanischsprachige Musik.“), ELaKSub4 („Spanischsprachige Filme finde ich gut.“) und ELaKSub7 („Spanien ist ein bedeutendes Land.“) entfernt werden (vgl. Tabelle 8). Bezüglich der Items ELaKSub3 und ELaKSub4 könnte wiederum die noch geringe Erfahrung der Probandinnen und Probanden mit spanischsprachigen Liedern und Filmen ausschlaggebend dafür sein, dass diese Items getilgt werden müssen. Die am Ende der exploratorischen Faktorenanalysen stehende Skala für das Fach Französisch weist einen KMO-Koeffizienten von .839 sowie eine Signifi‐ kanz nach Bartlett von p = .000 auf. Die MSA-Koeffizienten liegen zwischen .793 und .920 und sind somit sehr hoch, wodurch sehr gute Voraussetzungen zur Skalenbildung erreicht werden. Die Hauptladung liegt nach der Hauptach‐ senanalyse auf Item ESpreSub3 „Ich hätte gerne Freunde in Frankreich.“ und Cronbachs α erreicht einen Wert von .841. In der Skala für Spanisch liegt der KMO-Koeffizient bei .730, die Signifikanz nach Bartlett bei p = .000, die MSA-Koeffizienten zwischen .661 und .868 und Cronbachs α liegt bei .809. Somit ergeben sich trotz anfänglicher Schwierigkeiten beim Einsatz der Skalen von Venus (2017a) zwei stabile und reliable Skalen, die die Einstellungen zur Zielkultur messen. - Franzö‐ sischstich‐ probe (n-=-75, MV = 17) Spanischstich‐ probe (n = 87, MV = 7) Itemname Itemaussage FL FL ESpre Sub1 Die Menschen, die in Frankreich/ Spanien leben, sind mir sympathisch. .546 .522 ESpre Sub2 Ich möchte gerne Kontakte mit den Menschen in Frankreich/ Spanien knüpfen. .835 .837 ESpre Sub3 Ich hätte gerne Freunde in Frankreich/ Spanien. .784 .845 ESpre Sub4 Die Lebensart der Menschen in Frankreich/ Spa‐ nien gefällt mir sehr. .672 .675 ELaK Sub2 Frankreich/ Spanien und die französische/ spani‐ sche Kultur interessieren mich nicht. (-) .634 .484 ELaK Sub3 Ich mag französisch-/ spanischsprachige Musik. .461 -- 236 9 Untersuchungsinstrumente Franzö‐ sischstich‐ probe (n-=-75, MV = 17) Spanischstich‐ probe (n = 87, MV = 7) Itemname Itemaussage FL FL ELaK Sub4 Französisch-/ spanischsprachige Filme finde ich gut. .431 -- ELaK Sub5 Ich möchte gerne nach Frankreich/ Spanien reisen, um das Land und die Kultur besser kennen zu lernen. .703 .481 ELaK Sub6 Frankreich/ Spanien ist ein wichtiger Partner Deutschlands. -- .398 - Cronbachs α (Skala aus allen sieben bzw. acht Items) α = .841 α = .809 Anmerkungen. Die Items wurden auf Grundlage der Skalen von Venus (2017: 169, 170) angepasst. Bei Venus (2017: 167) erreichte die Skala zu den Einstellungen zu Land und Kultur ein Cronbachs α von .711 und die Skala zu den Einstellungen zu den Sprecherinnen und Sprechern der Zielsprache .844. Die Items ELaKSub1 („Frankreich/ Spanien ist ein schönes Urlaubsziel“) und ELaKSub7 („Frankreich/ Spanien ist ein bedeutendes Land“) wurden aufgrund fehlender Korrelationen mit den anderen Items aus der vorliegenden Skala entfernt. Tabelle 8: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „Einstellungen zur französischen bzw. spanischen Zielkultur“ - 9.3.4.8 Skalen zu den genderstereotyp weiblichen Wahrnehmungen des Französischen bzw. Spanischen Um die genderstereotypen Wahrnehmungen gegenüber der französischen Sprache einerseits und der spanischen Sprache andererseits zu erheben, wurde am Ende des Schülerfragebogens eine Skala eingesetzt, die aus sechs Items besteht (vgl. Punkte 14.1, 14.2, 14.3, 14.5, 14.7 14.8 des Schülerfragebogens im Anhang 3.2 und 3.3). Sie umfasst die genderstereotype Wahrnehmung des Französischen und Spanischen als weiblich geprägte Sprachen (vgl. Grein 2012: 172; Kissau 2006a; Leupold 2007: 15; Piller/ Pavlenko 2007: 15; Williams et al. 2002: 520) und als Sprachen, die von Mädchen und Frauen eher dominiert werden als von Jungen und Männern, beispielsweise aufgrund einer angeblich höheren Begabung (vgl. Decke-Cornill/ Volkmann 2007b). Für diese Skalen wurden einzelne Items der Studie von Kissau (2006a: 95) adaptiert und andere spezifisch für die vorliegende Studie entworfen. Da hierzu 9.3 Der Schülerfragebogen 237 noch keine Skalen vorliegen und die Skala von Kissau (2006a: 95, vgl. StWeSub1 und StWeSub3) zur Student Perception of French neben genderstereotypen Items wie “I think girls are better at learning French than boys.“ auch Items enthält, die das Ought-to Self betreffen, wie z. B. “I am afraid of what people will think of me if I study French.” ist seine Skala inhaltlich wenig kohärent und musste vor dem Einsatz in der vorliegenden Studie überarbeitet und erweitert werden. Dabei wird explizit mit Item StWeSub2 („Französisch/ Spanisch klingt eher weiblich.“) die Frage von Grein (2012: 177) in die Skala mit aufgenommen: „Spielt die Aussprache eine Rolle bei dieser Wahrnehmung? Werden Laute als ‚männlich‘ oder ‚weiblich‘ beschrieben und warum? “ (Grein 2012: 177; vgl. Tabelle 9). Genderstereotypisierungen sind laut Kissau et al. (2010: 714) und Grein (2012: 172) insbesondere für das Französische auszumachen und für das Spanische bisher kaum festgestellt worden (vgl. Kapitel 5.1.3.1.12). Daher soll an dieser Stelle überprüft werden, ob diese Befunde bestätigt werden können oder mittlerweile verworfen werden müssen, indem in beiden Fächern ähnliche Skalen zu genderstereotypen Wahrnehmungen eingesetzt werden. Für die Französischstichprobe zeigen ersten Korrelationsanalysen bezüglich der Skala zur genderstereotyp weiblichen Wahrnehmung des Französischen, dass die Items StWeSub4 („Ich denke, dass es für Mädchen hinsichtlich ihrer beruflichen Zukunft wichtiger ist als für Jungen, Französisch zu lernen.“), StWeSub5 („Ich denke, dass Jungen in ihrem späteren Beruf seltener Franzö‐ sisch/ Spanisch brauchen als Mädchen.“) und StWeSub6 („Ich denke, dass von Mädchen eher erwartet wird, Französisch/ Spanisch zu können als von Jungen.“) zunächst getilgt werden müssen, da diese nicht signifikant mit den anderen Items korrelieren. Übrig bleibt eine Skala, die aus drei Items besteht, aber alle Voraussetzungen für eine exploratorische Faktorenanalyse erfüllt: Der KMO-Koeffizient liegt bei .577, die Signifikanz nach Bartlett bei p = .000 und die MSA-Koeffizienten zwischen .547 und .625. Positiv an dieser Skala ist, dass die Faktorladungen für alle drei Items jeweils sehr hoch sind, wobei die höchste auf StWeSub3 („Ich denke, dass Französisch eher zu Mädchen passt als zu Jungen.“) liegt. Cronbachs α erreicht mit .807 ebenfalls einen hohen Wert (vgl. Tabelle 9). Für die Spanischstichprobe zeigen erste Korrelationsanalysen, dass alle Items signifikant miteinander korrelieren. Der KMO-Koeffizient beträgt .783 und die MSA-Koeffizienten liegen zwischen .762 und .847. Die Durchführung einer exploratorischen Faktorenanalyse zu allen Items der Skala "Genderstereotyp weibliche Wahrnehmung des Spanischen" zeigt, dass nach einer Hauptach‐ senanalyse diese Items auch alle auf ein und denselben Faktor laden. Die Hauptladung liegt ebenfalls auf Item StWeSub3 und Cronbachs α weist mit .826 einen hohen Wert auf (vgl. Tabelle 9). 238 9 Untersuchungsinstrumente Franzö‐ sischstich‐ probe (n = 85, MV = 7) Spanischstich‐ probe (n = 91, MV = 3) Itemname Itemaussage FL FL StWe Sub1 Ich denke, dass Mädchen für Französisch/ Spanisch begabter sind als Jungen. .628 .777 StWe Sub2 Französisch/ Spanisch klingt eher weiblich. .728 .599 StWe Sub3 Ich denke, dass Französisch/ Spanisch eher zu Mädchen passt als zu Jungen. .999 .847 StWe Sub4 Ich denke, dass es für Mädchen hinsichtlich ihrer beruflichen Zukunft wichtiger ist als für Jungen, Französisch/ Spanisch zu lernen. -- .552 StWe Sub5 Ich denke, dass Jungen in ihrem späteren Beruf seltener Französisch/ Spanisch brauchen als Mäd‐ chen. -- .652 StWe Sub6 Ich denke, dass von Mädchen eher erwartet wird, Französisch/ Spanisch zu können als von Jungen. -- .600 - Cronbachs α (Skala aus allen drei bzw. sechs Items) α = .807 α = .826 Anmerkungen. StWeSub1 und StWeSub3 wurden in Anlehnung an Kissau (2006a: 95) formuliert. StWeSub2, StWeSub4, StWeSub5 und StWeSub6 wurden auf Grundlage der Arbeiten von Grein (2012) und Williams et al. (2002) eigenständig entwickelt. Tabelle 9: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „genderste‐ reotyp weibliche Wahrnehmung des Französischen bzw. Spanischen“ - 9.3.4.9 Skalen zum FFS bzw. SFS Selbstkonzept Um das FFS Selbstkonzept und das SFS Selbstkonzept zu messen, wird die Skala von Rumlich (2016: 278-279) in leicht angepasster Form verwendet, welche bereits erfolgreich in der 6. und in der 8. Jahrgangsstufe für das Fach Englisch eingesetzt wurde. Auch wenn in der vorliegenden Studie die 9. Jahrgangsstufe sowie die Fächer Französisch und Spanisch in den Blick genommen werden, erscheint die Skala dennoch passend, da alle Items (vgl. Tabelle 10) sehr klar formuliert sind und keinerlei Aspekte beinhalten, die ausschließlich für Englisch, nicht aber für Französisch oder Spanisch zutreffen würden. Ein großer 9.3 Der Schülerfragebogen 239 Vorteil dieser Skala liegt darin, dass sie mit acht Items sehr stabil ist und alle Items auf Grundlage bisheriger Studien, die sich als valide und reliabel erwiesen haben, entwickelt wurden (vgl. Anmerkungen zu Tabelle 10). Auch bei den meisten Vorgängerstudien wurde dabei eine 4-stufige-Likert-Skala eingesetzt (vgl. Sachse et al. 2012: 87; Wagner et al. 2009: 63), was den Vorteil hat, dass bei der Einschätzung der eigenen Wahrnehmung, welche per se einen sehr komplexen Prozess darstellt, keine allzu feinen Abstufungen von den Probandinnen und Probanden vorgenommen werden müssen (vgl. Rumlich et al. 2016: 277). Negativ formulierte Items (SkSub1, SkSub2, SkSub6, SkSub7, SkSub8) dienen dazu, die Aufmerksamkeit der Probandinnen und Probanden stärker an sich zu binden, damit diese die Items genau lesen (vgl. Tabelle 10). Die exploratorische Faktorenanalyse ergibt für die Skala des FFS Selbstkon‐ zepts einen KMO-Koeffizienten von .904 und eine Signifikanz nach Bartlett von p = .000. Die MSA-Koeffizienten liegen zwischen .864 und .940. Die Faktorenanalyse zeigt weiterhin, dass alle Items auf ein und denselben Faktor laden. Eine Reliabilitätsanalyse ergibt ein Cronbachs α von .917 für die Franzö‐ sischstichprobe (vgl. Tabelle 10). Für Spanisch liegt der KMO-Koeffizient bei .882 und die Signifikanz nach Bartlett bei p = .000. Die MSA-Koeffizienten liegen zwischen .811 und .930. Folglich sind die Voraussetzungen für die exploratorische Faktorenanalyse sehr gut erfüllt, welche auch für die Spanischstichprobe zu dem Ergebnis kommt, dass alle Items mit jeweils hohen Faktorladungen auf ausschließlich einen Faktor laden (vgl. Tabelle 10). Cronbachs α liegt in der Spanischstichprobe bei .905 und bescheinigt somit eine sehr hohe Reliabilität. 240 9 Untersuchungsinstrumente Franzö‐ sischstich‐ probe (n = 85, MV = 7) Spa‐ nischstich‐ probe (n = 89, MV = 5) Itemname Itemaussage FL FL SkSub1 Für das Fach Französisch/ Spanisch habe ich ein‐ fach keine Begabung. (-) .863 .817 SkSub2 Bei manchen Sachen im Fach Französisch/ Spa‐ nisch weiß ich sofort: „Das verstehe ich nie.“ (-) .797 .744 SkSub3 Das Fach Französisch/ Spanisch liegt mir beson‐ ders. .803 .730 SkSub4 Im Fach Französisch/ Spanisch lerne ich schnell. .794 .820 SkSub5 Was wir in Französisch/ Spanisch durchnehmen, verstehe ich meistens. .806 .707 SkSub6 Ich finde das Fach Französisch/ Spanisch schwer. (-) .758 .515 SkSub7 Mir fällt das Fach Französisch/ Spanisch schwerer als vielen meiner Mitschülerinnen und Mit‐ schüler. (-) .627 .785 SkSub8 Die anderen sind viel besser im Fach Franzö‐ sisch/ Spanisch als ich. (-) .667 .726 - Cronbachs α (Skala aus allen acht Items) α = .917 α = .905 Anmerkungen. Die Skala wurde von Rumlich (2016: 278-279) übernommen und leicht adaptiert. Rumlich (2016: 284) verzeichnete in seiner Studie in der 8.-Jahrgangsstufe ein Cronbachs α von .90. Die einzelnen Items wurden von Rumlich (2016) adaptiert und stammen in Teilen von Wagner et al. (2009: 65; vgl. SkSub1, SkSub4, SkSub5, SkSub7), Sachse et al. (2012: 88; vgl. SkSub1, SkSub4, SkSub5, SkSub7), Bos et al. (2009b: 71-72; vgl. SkSub1, SkSub2, SkSub3, SkSub4, SkSub7), Baumert et al. (1997; vgl. SkSub1, SkSub2, SkSub3), Jopt (1978: 78-79; vgl. SkSub1, SkSub2, SkSub3, SkSub7), Faber (2009: 194; vgl. SkSub1, SkSub2, SkSub3), Finkbeiner (2005: LVI; vgl. SkSub1, SkSub5, SkSub7), Helmke et al. (2000: 9; vgl. SkSub3), Kunter et al. (2002: 106, 169; vgl. SkSub7) und Ramm et al. (2006: 246, 251; vgl. SkSub4). Tabelle 10: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „FFS bzw. SFS Selbstkonzept“ - 9.3.4.10 Skalen zur L3bzw. L4-Angst Selbstwirksamkeit bezieht sich auf die Beurteilung der eigenen Fähigkeit, eine Aufgabe erfolgreich zu erfüllen (vgl. Bandura 1986) beziehungsweise auf die 9.3 Der Schülerfragebogen 241 Überzeugung des Lernenden, bestimmte Leistungen in Zukunft erbringen zu können (vgl. Kirchner 2004: 5). Mit Selbstwirksamkeit eng verbunden ist auch der Begriff der Angst bzw. Ängstlichkeit oder des Gefühls des Unbehagens und des Selbstzweifels (vgl. Oxford 1999). Angst stellt eine Zwischenkategorie zwischen Motivation, Persönlichkeitsfaktor und Emotion dar und L2-Angst kann das Fremdsprachenlernen stark beeinflussen (vgl. Dörnyei 2005). Die An‐ nahme, dass Angst das Fremdsprachenlernen grundsätzlich negativ beeinflusst, wurde inzwischen allerdings widerlegt. Stattdessen werden zwei grundlegende Arten von Angst unterschieden: debilitating anxiety hemmt die Lernenden und hat somit einen negativen Einfluss auf den Lernerfolg, während facilitating anxiety als Ansporn für die Bewältigung einer Aufgabe wahrgenommen wird (vgl. Martinović/ Sorić 2018: 40). Die negativen Effekte von L2-Angst können dadurch erklärt werden, dass eine erhöhte L2-Angst zu einer erhöhten Selbst‐ fokussierung führt, welche den Lernvorgang und die L2 WTC (Willingness to Communicate) hemmt sowie zu abwertenden Gedanken gegenüber sich selbst führt (vgl. MacIntyre et al. 2002: 539). Eng mit dieser Dichotomie verknüpft ist der Konkurrenzgeist im Rahmen des Unterrichts, den Bailey (1983) genauer untersuchte und als Bedürfnis versteht, sich mit anderen Lernenden vergleichen zu wollen. Auch diese competitiveness kann zum einen anspornend wirken und zum anderen aber auch Angst auslösen, mit den Mitschülerinnen und Mitschülern nicht mithalten zu können und folglich die Motivation einschränken (vgl. Kirchner 2004: 5). Dies wiederum verringert die Qualität der L2-Kommunikation und geht oft mit einem geringen Selbstkonzept der eigenen Kommunikationsfähigkeiten einher, wobei deren Wahrnehmung durchaus von den tatsächlichen Kommunikationsfähigkeiten abweichen kann (vgl. MacIntyre et al. 2002: 540). Außerdem kann zwischen einer im Charakter angelegten Angst bzw. Ängst‐ lichkeit (Trait Anxiety), die sich über längere Zeit hin stabil zeigt, und einer auf einen gewissen Zustand bezogenen Angst (State Anxiety), die variabel ist, unterschieden werden (vgl. Martinović/ Sorić 2018: 40). Schließlich kann genauer zwischen Prüfungsangst, Angst vor dem Sprechen einer Fremdsprache (Xenoglossophobie) und Angst vor dem Fremdsprachenunterricht differenziert werden. Horwitz et al. (1986) entwickelten beispielsweise das spezifische Kon‐ zept der „Angst vor der Fremdsprache im Klassenzimmer“, der Foreign Language Classroom Anxiety Scale (FLCAS), welche sowohl Kommunikationsangst, Prü‐ fungsangst als auch die Angst vor einer negativen Bewertung einschließt. Außerdem konnte die bisherige Forschung bestätigen, dass Sprachangst ein situationsspezifisches Konstrukt ist, welches von allgemeineren Arten von Angst unterschieden werden kann und negative Auswirkungen auf das L2bzw. 242 9 Untersuchungsinstrumente L3-Selbstkonzept, auf motivationale Faktoren sowie auf die Leistung in einer L2 oder L3 haben kann (vgl. Horwitz 2001; MacIntyre et al. 2002; Oxford 1999). Aus diesem Grund stellt L2-Angst einen Faktor dar, der Teil vieler L2-Motivations‐ modelle ist (vgl. Dörnyei 1994a; Gardner 1985, 2010; Tremblay/ Gardner 1995) und in aktuelleren Studien auch als Teil der Persönlichkeit der Lernenden an‐ gesehen wird, da eine enge Korrelation zwischen beiden Faktoren existiert (vgl. Dawaele et al. 2008; MacIntyre/ Doucette 2010). Einige Studien fanden zudem eine hohe Korrelation zwischen der Kommunikationsangst (Communication apprehension) und der Gesprächsbereitschaft in der Fremdsprache (L2 WTC), was bedeutet, dass Menschen, die ein hohes Maß an Kommunikationsangst verspüren, versuchen, die Kommunikation zu meiden (vgl. Baker/ MacIntyre 2002; MacIntyre et al. 2002: 539). Daher werden in der vorliegenden Studie sowohl die Angst vor dem Sprechen im Fremdsprachenunterricht als auch die L2 WTC hinsichtlich Geschlechterunterschieden untersucht (vgl. Kapitel 9.3.4.4). Die Skala zur L3bzw. L4-Angst wurde auf Grundlage der Studien von Mar‐ tinović und Sorić (2018: 47) sowie Kissau (2006a: 92) angepasst. AngSub5 („Ich habe keine Angst davor, vor der ganzen Klasse etwas auf Französisch/ Spanisch zu sagen. (-)“) und AngSub6 („Ich habe keine Angst davor, Fehler beim Sprechen zu machen. (-)“) wurden selbst konzipiert und zur Skala hinzugefügt. Bei der hier gemessenen L3bzw. L4-Angst handelt es sich um die Angst vor der Verwendung der Fremdsprache vorwiegend innerhalb des Klassenzimmers, aber auch außerhalb des Fremdsprachenunterrichts (vgl. AngSub2, AngSub6, vgl. Tabelle 11). In der vorliegenden Kodierung steht der Wert 1 für die geringste und der Wert 4 für die größte L3bzw. L4-Angst. Somit ist eine negative Kor‐ relation zwischen L3-/ L4-Angst und der fremdsprachlichen Leistung möglich und inhaltlich begründbar. Die Faktorenanalyse ergibt, dass die Skala in sich sehr stimmig ist und keine Items entfernt werden müssen, da alle signifikant miteinander korrelieren und in der Hauptachsenanalyse ausschließlich auf einen Faktor laden. In der Französischstichprobe beträgt der KMO-Koeffizient .879, die Signifi‐ kanz nach Bartlett liegt bei p = .000 und die MSA-Koeffizienten erreichen Werte zwischen .893 und .903. Für die Spanischstichprobe liegt der KMO-Koeffizient bei .867, die Signifikanz nach Bartlett ist p = .000 und die MSA-Koeffizienten nehmen Werte zwischen .846 und .921 an. Die Hauptladung konzentriert sich für beide fremdsprachlichen Fächer jeweils auf dem Item AngSub1 („Es ist mir peinlich, im Französisch-/ Spanischunterricht freiwillig Unterrichtsbeiträge zu geben.“), wodurch auch der hohe Einfluss der Klassenkameradinnen und -kameraden, die ihrerseits zur Gruppe der Peers gehören, ersichtlich wird. 9.3 Der Schülerfragebogen 243 134 Es wird kein Elternfragebogen eingesetzt, da zum einen die Rücklaufquote bei dieser Altersstufe erwartungsgemäß relativ gering ist und zum anderen die Wahrnehmungen der Eltern voraussichtlich von den Wahrnehmungen der Schülerinnen und Schüler ab‐ weichen. Dies wird am Angebot-Nutzungs-Modell der Wirkungsweise des Unterrichts von Helmke (2015: 71) deutlich, bei dem die Wahrnehmung und Interpretation zwischen dem Angebot (Unterricht) und der Nutzung (Lernaktivität) steht. Franzö‐ sischstich‐ probe (n = 86, MV = 6) Spanischstich‐ probe (n = 93, MV = 1) Itemname Itemaussage FL FL Ang Sub1 Es ist mir peinlich, im Französisch-/ Spanischun‐ terricht freiwillig Unterrichtsbeiträge zu geben. .825 .839 Ang Sub2 Ich fühle mich niemals richtig sicher, wenn ich Französisch/ Spanisch spreche. .770 .731 Ang Sub3 Ich werde nervös und komme durcheinander, wenn ich im Französisch-/ Spanischunterricht etwas sagen muss. .772 .784 Ang Sub4 Ich habe Angst davor, dass die anderen Schüle‐ rinnen und Schüler lachen, wenn ich etwas auf Französisch/ Spanisch sage. .714 .613 Ang Sub5 Ich habe keine Angst davor, vor der ganzen Klasse etwas auf Französisch/ Spanisch zu sagen. (-) .762 .689 Ang Sub6 Ich habe keine Angst davor, Fehler beim Sprechen zu machen. (-) .791 .762 - Cronbachs α (Skala aus allen sechs Items) α = .898 α = .875 Anmerkungen. Die Items wurden auf Grundlage der Skalen von Kissau (2006a: 81, 92, vgl. AngSub1, AngSub2, AngSub3) sowie derjenigen von Martinović und Sorić (2018: 47, vgl. AngSub3) angepasst. Die Skala von Kissau (2006a: 81, 92) erreicht ein Cronbachs α von .77 und die Skala von Martinović und Sorić (2018: 47) von .95. Tabelle 11: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „L3-/ L4-Angst“ 9.3.5 Skalen zum Ought-to-L3/ L4 Self Neben den von den Lernenden wahrgenommenen Erwartungen der Eltern 134 und Peers werden in der vorliegenden Studie bezüglich der Konstruktionspro‐ 244 9 Untersuchungsinstrumente zesse von Gender des jeweiligen Fremdsprachenunterrichts insbesondere die von den Lernenden wahrgenommenen Erwartungen der Lehrkraft sowie die wahrgenommene Unterstützung durch die Lehrkraft in den Blick genommen. Dennoch hätten noch weitere Aspekte wie beispielsweise die Unterrichts‐ methodologie oder das Maß an Strukturiertheit des Unterrichts untersucht werden können (vgl. López Rúa 2006: 112). Nichtsdestotrotz ist das Erleben der Methodologie der Lehrkraft für alle Schülerinnen und Schüler einer Klasse voraussichtlich ähnlich, während Erwartungen und Unterstützung durch ein und dieselbe Lehrkraft, je nachdem ob diese männlich oder weiblich ist, welche Geschlechterstereotype sie im Unterricht tradiert und wie sie mit Jungen oder Mädchen interagiert, stark variieren können; durch Erwartungs- und Unterstützungshaltungen der Lehrkraft werden demzufolge wiederum Prozesse des Doing Gender innerhalb der Schulkultur angestoßen (vgl. Budde 2006: 51; Hannover et al. 2017). Im Folgenden werden die einzelnen Skalen, die das Ought-to L3/ L4 Self erfassen werden, dargelegt. - 9.3.5.1 Skalen zur wahrgenommenen Unterstützung durch die Französischbzw. Spanischlehrkraft Die in der vorliegenden Studie verwendete Skala zur Unterstützung durch die Lehrkraft basiert auf dem DESI-Skalenhandbuch (vgl. Wagner et al. 2009: 108). Sie ist somit altersangemessen und für Schülerinnen und Schüler, die in Deutschland leben und dort eine Schule besuchen bestimmt. In der DESI-Studie wurde sie allerdings für das Fach Englisch eingesetzt (vgl. Wagner et al. 2009: 108), während die Skala der vorliegenden Studie für Französisch und Spanisch in angepasster Form verwendet wird. Eine exploratorische Faktorenanalyse ergibt für die Französischstichprobe einen KMO-Koeffizienten von .787 und beim Bartlett-Test eine Signifikanz von p = .000. Die MSA-Koeffizienten liegen zwischen .759 und .861. Alle Items korrelieren signifikant miteinander, laden auf ein und denselben Faktor und weisen jeweils relativ hohe Faktorladungen auf. Die Hauptladung von .886 liegt auf Item ULkSub1 „Wenn ich Hilfe brauche, bekomme ich sie von meiner Französisch-/ Spanischlehrkraft.“ und Cronbachs α liegt bei .816 (vgl. Tabelle 12). In Spanisch erreicht der KMO-Koeffizient einen Wert von .797 und der Bartlett-Test ist ebenfalls hoch signifikant (p = .000). Die MSA-Koeffizienten weisen Werte zwischen .758 und .844 auf. Die Hauptladung befindet sich ebenfalls auf ULkSub1 und Cronbachs α liegt bei .871 (vgl. Tabelle 12). 9.3 Der Schülerfragebogen 245 Französischstichprobe (n = 86, MV = 6) Spanischstichprobe (n = 93, MV = 1) Itemname Itemaussage FL FL ULk Sub1 Wenn ich Hilfe brauche, bekomme ich sie von meiner Französisch-/ Spa‐ nischlehrkraft. .833 .886 ULk Sub2 Meine Französisch-/ Spanischlehrkraft gibt mir Hinweise, wie ich mich ver‐ bessern kann. .783 .746 ULk Sub3 Meine Französisch-/ Spanischlehrkraft achtet darauf, dass ich im Unterricht mitkomme. .758 .785 ULk Sub4 Meine Französisch-/ Spanischlehrkraft behandelt mich fair. .543 .787 - Cronbachs α (Skala aus allen vier Items) α = .816 α = .871 Anmerkungen. Die Skala wurde von DESI (Wagner et al. 2009: 108, vgl. ULkSub1, ULkSub2, ULkSub3, UlkSub4) übernommen und angepasst. Bei DESI lag Cronbachs α bei .86 (vgl. Wagner et al. 2009: 107). Tabelle 12: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „wahrge‐ nommene Unterstützung durch die Französischbzw. Spanischlehrkraft“ - 9.3.5.2 Skalen zu den wahrgenommenen Erwartungen der Französischbzw. Spanischlehrkraft Zur Erfassung der durch die Lernenden subjektiv wahrgenommenen Erwar‐ tungen der Französisch- oder Spanischlehrkraft wird in der vorliegenden Studie ebenfalls eine Skala aus dem DESI-Skalenhandbuch (vgl. Wagner et al. 2009: 123) eingesetzt, welche durch ein Item von Keller (1998) ergänzt wurde. In der Französischstichprobe muss zunächst das Item ELkSub4 („Meine Französischlehrkraft sagt mir, dass sie mir bessere Leistungen zutraut als ich bisher gezeigt habe.“) entfernt werden, da es nicht signifikant mit den anderen Items korreliert. Danach liegt der KMO-Koeffizient bei .676 und der Bartlett-Test ist mit p = .000 höchst signifikant. Die MSA-Koeffizienten nehmen Werte zwi‐ schen .635 und .762 an, wodurch alle Voraussetzungen für die exploratorische Faktorenanalyse erfüllt sind. Die Hauptachsenanalyse mit Promax-Rotation zeigt, dass alle restlichen Items auf einen Faktor laden und die Hauptladung 246 9 Untersuchungsinstrumente auf Item ELkSub2 („Meine Französischlehrkraft erwartet von mir, dass ich mich anstrenge.“) liegt (vgl. Tabelle 13). Cronbachs α befindet sich mit .618 in einem noch akzeptablen Bereich (vgl. Blanz 2015: 256). Bei der Skala für die wahrgenommenen Erwartungen der Spanischlehrkraft müssen zunächst die Items ELkSub3 („Meine Spanischlehrkraft lässt nicht zu, dass ich schlampige Arbeiten abliefere.“) und ELkSub4 („Meine Spanischlehr‐ kraft sagt mir, dass sie mir bessere Leistungen zutraut als ich bisher gezeigt habe.“) entfernt werden, da sie nicht signifikant mit den anderen Items korre‐ lieren und somit keine gemeinsame Skala bilden können. Dadurch entsteht mit drei Items eine Skala, die bei der Itemanzahl am unteren Limit ist. Der KMO-Koeffizient beträgt .564, der Bartlett-Test erbringt ein höchst signifikantes Ergebnis (p = .000) und die MSA-Koeffizienten liegen zwischen .543 und .724. Die Hauptladung weilt nach der Hauptachsenanalyse, anders als bei der Französischstichprobe, auf Item ELkSub1 („Meine Spanischlehrkraft erwartet gute Leistungen von mir.“) und die zwei verbleibenden Items laden auf einen einzigen Faktor. Cronbachs α ist mit .577 eher niedrig (vgl. Blanz 2015: 356; Tabelle 13), liegt aber dennoch über dem Wert, der in der DESI-Studie erzielt wurde: Hier betrug Cronbachs α .54 für Englisch und .58 für Deutsch (Wagner et al. 2009: 123). - Französischstichprobe (n = 85, MV = 7) Spanischstichprobe (n = 93, MV = 1) Itemname Itemaussage FL FL ELk Sub1 Meine Französisch-/ Spanischlehrkraft erwartet gute Leistungen von mir. .572 .849 ELk Sub2 Meine Französisch-/ Spanischlehrkraft erwartet von mir, dass ich mich an‐ strenge. .755 .648 ELk Sub3 Meine Französisch-/ Spanischlehrkraft lässt nicht zu, dass ich schlampige Ar‐ beiten abliefere. .423 -- 9.3 Der Schülerfragebogen 247 Französischstichprobe (n = 85, MV = 7) Spanischstichprobe (n = 93, MV = 1) ELk Sub5 Im Französisch-/ Spanischunterricht erwartet die Lehrkraft, dass ich mit‐ komme. .446 .313 - Cronbachs α (Skala aus allen vier bzw. drei Items) α = .618 α = .577 Anmerkungen. Die Skala wurde aus dem DESI-Skalenhandbuch (Wagner et al. 2009: 123; vgl. ELkSub2, ELk Sub3 und ELkSub4) übernommen und an die Fächer Französisch und Spanisch angepasst. ELKSub 5 stammt von Keller (1998). ELKSub1 wurde für die vorliegende Studie neu konzipiert. Bei DESI betrug Cronbachs α .54 für Englisch und .58 für Deutsch. Das Item ELkSub4 („Meine Französisch-/ Spanischlehrkraft sagt mir, dass sie mir bessere Leistungen zutraut als ich bisher gezeigt habe.“) wurde aufgrund nicht vorhandener signifikanter Korrelation mit den anderen Items sowohl für Französisch als auch für Spanisch entfernt. Tabelle 13: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „wahrge‐ nommene Erwartungen der Französischbzw. Spanischlehrkraft“ - 9.3.5.3 Skalen zur wahrgenommenen Aufmerksamkeitsverteilung der Französischbzw. Spanischlehrkraft zugunsten der Mädchen Bezüglich der Wahrnehmung einer genderstereotypen Aufmerksamkeitsvertei‐ lung durch die Lehrkraft, in dem Sinne, dass im Französischbzw. Spanischun‐ terricht den Mädchen mehr Aufmerksamkeit seitens der Lehrkraft gewidmet wird als den Jungen (vgl. Budde 2006; Hannover et al. 2017), kann in beiden Gruppen, wie vorgesehen, jeweils eine Skala aus drei Items, die signifikant miteinander korrelieren, gebildet werden. In Französisch liegt der KMO-Koeffizient bei .612, die Signifikanz nach Bart‐ lett bei p = .001 und die MSA-Koeffizienten zwischen .578 und .713. Die Hauptla‐ dung befindet sich bei Item GeUSub1 („Ich denke, dass im Französischunterricht wenige Themen durchgenommen werden, die Mädchen interessieren.“) In Spanisch liegt der KMO-Koeffizient bei .571, die Signifikanz nach Bartlett bei p = .000 und die MSA-Koeffizienten zwischen .547 und .747. Cronbachs α verzeichnet einen Wert von .621 und befindet sich somit in einem akzepta‐ blen Bereich. Die Hauptladung ist bei Spanisch ebenfalls bei Item GeUSub1 anzutreffen (vgl. Tabelle 14). 248 9 Untersuchungsinstrumente Franzö‐ sischstich‐ probe (n = 84, MV = 8) Spanischstich‐ probe (n = 93, MV = 1) Itemname Itemaussage FL FL Auf Lk Sub1 Ich denke, dass im Französisch-/ Spanischunter‐ richt wenige Themen durchgenommen werden, die Mädchen interessieren. (-) .874 .679 Auf Lk Sub2 Ich denke, dass die Mädchen im Französisch-/ Spa‐ nischunterricht weniger Aufmerksamkeit be‐ kommen als die Jungen. (-) .457 .325 Auf Lk Sub3 Im Französisch-/ Spanischunterricht werden meis‐ tens Themen durchgenommen, die in erster Linie die Jungen interessieren. (-) .636 .835 - Cronbachs α (Skala aus allen drei Items) α = .682 α = .621 Anmerkungen. Die Items wurden eigens für die vorliegende Studie konzipiert. Die Items befinden sich unter 14.4, 14.6 und 14.9 im Schülerfragebogen. Tabelle 14: Items, Faktorladungen, Mittelwerte und Standardabweichungen der Skalen „wahrgenommene Aufmerksamkeitsverteilung der Französischbzw. Spanischlehrkraft zugunsten der Mädchen“ - 9.3.5.4 Skalen zu den wahrgenommenen Erwartungen der Peers Schließlich werden im Bereich 12 des Schülerfragebogens (vgl. Anhänge 4.2 und 4.3) die wahrgenommenen Erwartungen der Peers gemessen, wobei sich die Skala vorwiegend aus adaptierten Items von Dörnyei und Ushioda (2009: 92), Kissau (2006a: 95) und Meißner et al. (2008: 51) zusammensetzt. Item ErwPSub3 („Meine Freundinnen und Freunde machen sich über mich lustig, weil ich Französisch/ Spanisch lerne. (-)“) stellt sich bei der Korrelations‐ analyse als nicht den Skalen zugehörig heraus, was eventuell dadurch begründet sein mag, dass ein Großteil der Peers der Lernenden ebenfalls die Fächer Französisch bzw. Spanisch belegt. Aus der Skala für Französisch muss außerdem das Item ErwPSub4 entfernt werden („Ich kann meine Freundinnen und Freunde dadurch beeindrucken, dass ich schon etwas Französisch kann.“). Für Franzö‐ sisch verbleibt folglich eine Skala mit vier Items, die einen KMO-Koeffizienten von .659, eine Signifikanz nach Bartlett von p = .000 und MSA-Koeffizienten zwischen .620 und .762 aufweist. Die Hauptladung liegt auf Item ErwPSub2 9.3 Der Schülerfragebogen 249 („Meine Freundinnen und Freunde finden es gut, dass ich Französisch lerne.“). Cronbachs α ist mit .646 in einem fragwürdigen bis akzeptablen Bereich (vgl. Blanz 2015: 256). Wie unterschiedlich die Items innerhalb der Skalen in den beiden Fremdspra‐ chen wirken, zeigt sich am Konstrukt der wahrgenommenen Erwartungen der Peers deutlich: In Spanisch müssen nach der Korrelationsanalyse die Items ErwPSub1 und ErwPSub6 entfernt werden. Zurück bleiben drei Items, die gemeinsam einen KMO-Koeffizienten von .583, eine Signifikanz nach Bartlett von .000 und MSA-Koeffizienten zwischen .559 und .556 aufweisen, aber mit einem Cronbachs α von .675 einen höheren Reliabilitätswert erreichen als die Skala zu den wahrgenommenen Erwartungen der Peers für das Französische. Die Hauptladung liegt im Gegensatz zur Skala für das Französische bei Item ErwPWub5 („Meine Freundinnen und Freunde sagen, es würde sich lohnen, Spanisch zu lernen.“; vgl. Tabelle 15). - Franzö‐ sischstich‐ probe (n = 82, MV = 10) Spanischstich‐ probe (n = 93, MV = 1) Itemname Itemaussage FL FL ErwP Sub1 Ich lerne Französisch/ Spanisch, weil enge Freunde von mir denken, dass es wichtig ist. .476 -- ErwP Sub2 Meine Freundinnen und Freunde finden es gut, dass ich Französisch/ Spanisch lerne. .750 .766 ErwP Sub4 Ich kann meine Freundinnen und Freunde da‐ durch beeindrucken, dass ich schon etwas Franzö‐ sisch/ Spanisch kann. -- .359 ErwP Sub5 Meine Freundinnen und Freunde sagen, es würde sich lohnen, Französisch/ Spanisch zu lernen. .723 .845 250 9 Untersuchungsinstrumente Franzö‐ sischstich‐ probe (n = 82, MV = 10) Spanischstich‐ probe (n = 93, MV = 1) ErwP Sub6 Für mich ist Französisch-/ Spanischlernen wichtig, da ich dadurch Anerkennung von meinen Freun‐ dinnen und Freunden bekomme. .331 -- - Cronbachs α (Skala aus allen vier bzw. drei Items) α = .646 α = .675 Anmerkungen. Die Skala wurde aus den Studien von Dörnyei und Ushioda (2009: 92; vgl. Item ErwPSub1, ErwPSub6), Kissau (2006a: 95; vgl. Item ErwPSub3), Meißner et al. (2008: 51; vgl. Item ErwPSub5) adaptiert, sowie aus dem Artikel von Braun und Schwemer (2013; vgl. ErwPSub4) abgeleitet. Ein Item wurde eigenständig entwickelt (ErwPSub2). ErwPSub3 („Meine Freundinnen und Freunde machen sich über mich lustig, weil ich Französisch/ Spanisch lerne. (-)“) wurde bei beiden Skalen entfernt, da es nicht mit den anderen Items korrelierte. Tabelle 15: Items, Faktorladungen, Mittelwerte und Standardabweichungen der Skalen „wahrgenommene Erwartungen der Peers“ - 9.3.5.5 Skalen zu den wahrgenommenen Erwartungen der Eltern Gardner (2010: 128) sieht die elterliche Unterstützung als ein Konstrukt an, das den Fremdsprachenlernerfolg insbesondere von jüngeren Kindern positiv beeinflussen kann. Neben der elterlichen Unterstützung lässt sich auch eine Erwartungshaltung der Eltern bezüglich des Erreichens gewisser Zensuren und fremdsprachlicher Kenntnisse beobachten. Wenngleich bekannt ist, dass sich Jugendliche in der Adoleszenz eher an den Erwartungen der Peers orientieren und diese einen wesentlichen Teil ihrer Selbstwirksamkeit beeinflussen (vgl. Schunk/ Miller 2002), werden in der vorliegenden Studie in Bereich 13 des Fragebogens (vgl. Anhänge 4.2 und 4.3) auch die Wahrnehmung der elterli‐ chen Erwartungen erhoben. Zum einen kann so getestet werden, ob, gemäß der gängigen Genderstereotype, die elterlichen Erwartungen bezüglich der fremdsprachlichen Kompetenzen von den Mädchen als höher wahrgenommen werden als von den Jungen. Zum anderen kann späterer überprüft werden, ob die wahrgenommenen Erwartungen der Eltern entgegen der Annahme von Schunk und Miller (2002) mit der fremdsprachlichen Leistung korrelieren (vgl. Kapitel 11.8). Korrelationsanalysen zeigen, dass sowohl für Französisch als auch für Spanisch das Item ErwESub3 („Meine Eltern ermutigen mich, mein Franzö‐ sisch/ Spanisch bei jeder möglichen Gelegenheit zu benutzen (z. B. zu sprechen und zu lesen).“) entfernt werden muss, da dieses nicht mit den jeweils anderen 9.3 Der Schülerfragebogen 251 Items korreliert, eventuell, weil hier vielmehr die Unterstützung der Eltern als deren Erwartung im Zentrum steht. Eine erste exploratorische Faktorenanalyse für Französisch ergibt, dass das Item ErwESub5 („Wenn ich keine guten Noten in Französisch/ Spanisch habe, sind meine Eltern enttäuscht.“) auf einen anderen Faktor lädt, obwohl es mit den anderen Items korreliert, sodass auch dieses entfernt werden muss. Eine Erklärung könnte eventuell sein, dass das Item aufgrund der doppelt negativen Formulierung „keine guten Noten“ und „enttäuscht“ von einzelnen Teilnehme‐ rinnen und Teilnehmern inkorrekt gelesen wurde und eine Ersetzung der For‐ mulierung „keine guten Noten“ durch „schlechte Noten“ in kommenden Studien eventuell Abhilfe schaffen könnte. Jedoch zeigt sich für die Spanischstichprobe, dass dieses Item sogar eine der Hauptladungen einnimmt, sodass dies nur eine vage Hypothese bleibt. Nachdem die beiden Items entfernt wurden, zeigt die Skala für Französisch einen KMO-Koeffizienten von .727, eine Signifikanz nach Bartlett von p = .000 und MSA-Koeffizienten zwischen .717 und .729. Interessant ist, dass das Item ErwESub6 („Meine Eltern denken, dass ich keine gute Arbeit nach der Schule finden werde, wenn ich keine guten Noten in Französisch habe.“) die Hauptladung trägt, sodass hier die Kombination aus der Erwartung von guten Noten im Französischen und der Erwartung, dass die Söhne und Töchter später eine gute Arbeit finden, dasjenige Teilkonstrukt darstellt, das die wahrgenommenen elterlichen Erwartungen am besten repräsentiert. Bei der Skala für Spanisch muss neben Item ErwESub3 auch Item ErwESub7 („Meine Eltern denken, dass das Lernen für Spanisch wichtiger ist als das Lernen für andere Fächer.“) entfernt werden, da dieses nicht mit den anderen Items korreliert. Dies könnte eventuell daran liegen, dass den Eltern die Leistung in Spanisch als dritte Fremdsprache weniger wichtig erscheint als in anderen Fächer wie etwa Englisch, Mathematik oder Deutsch. Nach der genannten Reduktion von Items zeigt die exploratorische Faktorenanalyse für die Skala bezüglich des Fachs Spanisch eine relativ hohe Stabilität, wobei der KMO-Ko‐ effizient bei .715 liegt, die Signifikanz nach Bartlett p = .000 beträgt und die MSA-Koeffizienten Werte zwischen .651 und .747 annehmen. Cronbachs α liegt mit .748 bei einem mittleren Wert (vgl. Tabelle 16). 252 9 Untersuchungsinstrumente Franzö‐ sischstich‐ probe (n = 86, MV = 6) Spanischstich‐ probe (n = 89, MV = 5) Itemname Itemaussage Französisch FL FL ErwE Sub1 Meine Eltern erwarten von mir gute Noten in Französisch/ Spanisch. .428 .557 ErwE Sub2 Meine Eltern sagen, ich müsse Französisch/ Spa‐ nisch unbedingt beherrschen. .719 .697 ErwE Sub4 Meine Eltern denken, dass ich Französisch/ Spa‐ nisch lernen muss, um eine gebildete Person zu sein. .707 .622 ErwE Sub5 Wenn ich keine guten Noten in Französisch/ Spa‐ nisch habe, sind meine Eltern enttäuscht. -- .606 ErwE Sub6 Meine Eltern denken, dass ich keine gute Arbeit nach der Schule finden werde, wenn ich keine guten Noten in Französisch/ Spanisch habe. .741 .671 ErwE Sub7 Meine Eltern denken, dass das Lernen für Franzö‐ sisch/ Spanisch wichtiger ist als das Lernen für andere Fächer. .469 -- - Cronbachs α (Skala aus allen fünf Items) α = .735 α = .748 Anmerkungen. Die Skala wurde aus den Studien von Dörnyei und Ushioda (2009: 93, vgl. ErwESub3, ErwESub4, ErwESub5), Meißner et al. (2008: 51; vgl. ErwESub2, ErwESub7) sowie Wendland und Rheinberg (2004; vgl. ErwESub6) adaptiert. Item ErwESub3 („Meine Eltern ermutigen mich, mein Französisch/ Spanisch bei jeder möglichen Gelegenheit zu benutzen (z.-B. zu sprechen und zu lesen).“) wurde aufgrund nicht signifikanter Korrelation mit den anderen Items aus beiden Skalen entfernt. Tabelle 16: Items, Faktorladungen, Mittelwerte und Standardabweichungen der Skalen „wahrgenommene Erwartungen der Eltern in Französisch bzw. Spanisch“ 9.3.6 Limitationen des Schülerfragebogens Obwohl die Faktorladungen je nach Zielsprache teilweise zwischen verschie‐ denen Items schwanken, ergeben sich insgesamt gut bis sehr gut verwendbare Skalen, um die affektiven Faktoren zu erfassen. Dennoch hätten im Nachhinein einzelne Aspekte verbessert werden können: Beispielsweise wäre es ideal gewesen, eine Pilotierung mit zwei Stichproben von mehr als 100 Probandinnen und Probanden für jede Zielsprache durchzuführen. So hätten die Skalen 9.3 Der Schülerfragebogen 253 im Anschluss an den Pretest durch explorative Faktorenanalysen auf deren Gültigkeit geprüft und eventuell noch einmal in ihrem Umfang reduziert und teilweise leicht verändert zusammengesetzt werden können. Allerdings waren diesbezüglich zum einen das Problem der Durchführbarkeit und zum anderen die Herausforderung der Gatekeepters gegeben, da nicht ausreichend Schulen gefunden wurden, die bereit waren, an der Studie teilzunehmen. Auch in der Hauptuntersuchung ist die Stichprobengröße für eine Faktorenanalyse eher am unteren Limit: Hierfür gibt Bortz (2010: 396) beispielsweise folgende Richtwerte an: Wenn auf einem Faktor mindestens vier Variablen Ladungen über .60 aufweisen, kann die Faktorenstruktur ungeachtet der Stichprobengröße gene‐ ralisierend interpretiert werden. Wenn weniger als zehn Variablen eine Ladung größer als .40 aufweisen, sollte eine Interpretation nur erfolgen, wenn die untersuchte Stichprobe mindestens 300 Probandinnen und Probanden enthält. Betrachtet man die einzelnen Skalen, so ist es beispielsweise in den Subskalen der L2-Motivation teilweise etwas schwierig, auf reliable und stabile Skalen zu kommen: Während die Skalen des Ideal L3 bzw. L4 Self sehr gut funktionieren, zeigen die Skalen zur integrativen und instrumentellen Orientierung teilweise ihre Grenzen: Insbesondere für das Spanische als dritte Fremdsprache scheint die integrative Orientierung durch die Probandinnen und Probanden noch nicht in dem Maße definiert worden zu sein, wie dies bei anderen Studien für andere Fremdsprachen und teilweise auch in anderen Ländern der Fall war (vgl. Dörnyei/ Clément 2002; Henry/ Cliffordson 2013a). Um dieses Problem zu umgehen, scheint es im Nachhinein eine sehr gute Lösung zu sein, ausschließ‐ lich mit dem Ideal L3/ L4 Self zu arbeiten. Bezüglich der Instrumentalität wird in aktuellen Studien (vgl. z. B. Martinović/ Sorić 2018: 45) außerdem eine Trennung zwischen Instrumentality - promotion und Instrumentality - prevention vorge‐ nommen. In der vorliegenden Studie wird ausschließlich das erste Konstrukt, d. h. der Nützlichkeitsaspekt bezüglich zukünftiger Handlungen in der jewei‐ ligen Fremdsprache, untersucht, welcher auf relativ niedrige Reliablitätswerte kommt. Für den schulischen Kontext des Fremdsprachenlernens eventuell sta‐ biler und reliabler würde sich möglicherweise die Instrumentality - prevention, also die Instrumentalität im Sinne des Vermeidens negativer Konsequenzen wie beispielsweise schlechter Noten erweisen, welche das Lernverhalten im utilitaristischen Sinne bestimmt und vermutlich einen größeren Einfluss auf den Lernerfolg hat als man zunächst annehmen möchte. Schließlich ist die Skala zur genderstereotyp weiblichen Wahrnehmung des Französischen bzw. Spanischen noch nicht vollständig ausgereift (vgl. Kapitel 9.3.4.8). In Anlehnung an Kissau (2006a: 95) wurden die Probandinnen und Probanden direkt nach genderspezifischen Einstellungen und Wahrnehmungen und mög‐ 254 9 Untersuchungsinstrumente lichen Geschlechterstereotypen befragt. Da durch die Art der Fragestellung im Schülerfragebögen für die Probandinnen und Probanden zwar die Möglichkeit besteht, diesen Geschlechterstereotypen gezielt zu widersprechen, indem sie „trifft nicht zu“ ankreuzen, jedoch keine Möglichkeit gegeben wird, maskulin konnotierte Wahrnehmungen des Französischen oder Spanischen anzugeben oder genauer zwischen der Ablehnung der Aussage, dass Mädchen bessere Französischlernende seien als Jungen und der Meinung, dass es prinzipiell keine Geschlechterunterschiede in diesem Bereich gäbe, zu unterscheiden, müsste die Skala eventuell um Items erweitert werden, die später nicht in die Auswertung einfließen, um eine neutralere Gestaltung und weniger Präsuppositionen anzu‐ legen. Insgesamt wäre es außerdem etwas zielführender gewesen, sich auf be‐ stimmte, klarer abgrenzbare affektive Konstrukte zu beschränken, da sich beispielsweise gezeigt hat, dass die Schülerinnen und Schüler der 9. Jahrgans‐ stufe weniger stark differenzieren als ursprünglich angenommen. Zum Beispiel machen sie kaum einen statistisch messbaren Unterschied zwischen ihrer Ein‐ stellung zur Sprache Französisch/ Spanisch (vgl. Venus 2017a) und dem Interesse am Fach Französisch/ Spanisch (vgl. Rumlich 2016). Daher musste zwischen diesen beiden Skalen eine sehr starke Dimensionsreduktion vorgenommen werden. 9.3 Der Schülerfragebogen 255 10 Durchführung der Studie Vor der Durchführung der Studie wurde die Genehmigung des Regierungs‐ präsidiums Tübingen eingeholt. Außerdem wurden mit den Schulleiterinnen und Schulleitern sowie mit den verantwortlichen Lehrkräften intensive Vor‐ gespräche geführt und schließlich die Einverständniserklärungen aller Eltern eingeholt, welche ausführlich über das Projekt, über die Freiwilligkeit der Teilnahme und über die Erfüllung der datenschutzrechtlichen Vorgaben nach den Richtlinien des Regierungspräsidiums Tübingen informiert worden waren. An den Erhebungstagen wurden vor Ort innerhalb der Unterrichtszeit die in Kapitel 9 beschriebenen Untersuchungsinstrumente eingesetzt, wobei durch den Einsatz von Testleiterskripten (vgl. Anhang 1) ein stets gleicher Ablauf der Tests und Befragungen in den einzelnen Klassen gesichert wurde. Um interne Validität, das heißt eine eindeutige Interpretierbarkeit der Ergebnisse und die Möglichkeit einer logischen Auswertung zu gewährleisten (vgl. Schmelter 2014: 38), wurden beim Einsatz der kognitiven Tests, der Sprachtests und des Fragebogens möglichst alle Störfaktoren, wie beispielsweise das Ausbleiben der Teilnahme von Versuchspersonen, das Abschreiben beim Sitznachbarn bzw. bei der Sitznachbarin oder auch Hintergrundgeräusche vermieden. In allen Klassen wurden die Tests auf zwei Doppelstunden an zwei unterschiedlichen Testtagen verteilt. Nach einer kurzen Vorstellung der Person und des Hintergrunds der Testlei‐ terin wurde der Ablaufs der Studie zu Beginn des ersten Testtags erläutert. Danach erfolgte die Durchführung der kognitiven Tests d2-R (vgl. Brickenkamp et al. 2010) und SPM (vgl. Raven 2009; Kapitel 9) in Form von Gruppentestungen. Damit die Konzentration der Teilnehmenden möglichst wenig Varianz aufgrund der Tagesform erfuhr, wurden diese kognitiven Tests in allen teilnehmenden Gruppen als erstes durchgeführt. Die Sprachtests wurden im Anschluss an die kognitiven Tests, ebenfalls in Form von Gruppentestungen, durchgeführt, wobei zuerst der Hörverstehenstest eingesetzt wurde, anschließend der Lese‐ verstehenstest und schließlich der Schreibtest. Um eine möglichst hohe Objektivität, also eine möglichst hohe Unabhängig‐ keit der Beurteilung vom Beurteilenden zu gewähren, muss die Durchführung der Tests durch unterschiedliche Forschende in gleichem Maße replizierbar 135 Pygmalioneffekte bezeichnen interpersonale Erwartungseffekte im Schulunterricht, d. h. es handelt sich, im Gegensatz zu intrapersonalen Erwartungseffekten, um Erwar‐ tungen, die sich auf das Verhalten einer anderen Person beziehen. Mittlerweile wurde der Begriff auch auf nicht-schulische Kontexte ausgeweitet und als Synonym für „sich selbst erfüllende Prophezeiung“ verwendet (vgl. Ludwig 2010: 145; vgl. Kapitel 5.2). sein. Folglich impliziert Objektivität das Vermeiden von Pygmalion-Effekten 135 zwischen dem bzw. der Forschenden und den Probandinnen und Probanden, weshalb versucht wurde, dieselbe Leistungserwartung jeweils an alle Klassen zu richten (vgl. Harsch 2016: 212; Schmelter 2014: 39). Um Durchführungs-, Auswertungs- und Interpretationobjektivität zu erreichen, wurden bei den Sprachtests die in lingualevel vorliegenden Beschreibungen zur Testvorberei‐ tung, -durchführung und -auswertung sowie zur Interpretation der Ergebnisse der Tests minutiös berücksichtigt (vgl. Lenz/ Studer 2008). Diese wurden zuvor mithilfe der Adaptation der Testsleiterskripte an die Zielgruppe angepasst (vgl. Anhang 1). Dadurch konnte beispielsweise organisiert werden, dass alle Probandinnen und Probanden gleich viel Zeit für die Bearbeitung der jeweiligen Teilaufgaben zur Verfügung hatten, dieselben Vorinformationen erhielten und eine nachträgliche Überarbeitung nach der Durchführung nicht mehr möglich war. Am Ende des zweiten Erhebungstags wurden die Schülerinnen und Schüler schließlich gebeten, den Fragebogen auszufüllen, wobei die Bearbeitungszeit etwas flexibler gehandhabt wurde als bei den Testverfahren. Jedoch wurde darauf geachtet, dass sich die Schülerinnen und Schüler mindestens 20 Minuten mit dem Dokument auseinandersetzten und möglichst alle Items ordnungs‐ gemäß ausfüllten. Am Ende des zweiten Testtags wurde der Aufwand der Probandinnen und Probanden durch ein kleines Überraschungsgeschenk ent‐ sprechend gewürdigt. 258 10 Durchführung der Studie 11 Auswertung der Ergebnisse Nachdem in den vorherigen Kapiteln alle Testinstrumente sowie die Durchfüh‐ rung der Tests vorgestellt wurden, werden nun die Auswertungsverfahren sowie die Ergebnisse der kognitiven Tests, der Sprachtests und der im Fragebogen erhobenen Faktoren dargestellt. Hierbei stehen die Forschungsfragen 1 bis 4 im Fokus und es wird eine Antwort darauf gegeben, inwieweit Geschlechterunter‐ schiede in den einzelnen kognitiven Grundfertigkeiten, den einzelnen sprach‐ lichen Fertigkeiten, den affektiv-motivationalen und den wahrgenommenen exogenen Faktoren bei den Französisch- und Spanischlernenden auftreten, bevor weitere statistische Analysen durchgeführt werden, um Erklärungsan‐ sätze für mögliche Geschlechterunterschiede näher zu erforschen. 11.1 Umgang mit fehlenden Werten Bevor die Auswertung vorgenommen werden kann, muss definiert werden, wie mit den fehlenden Werten im Datensatz umgegangen wird. Während des Testvorgangs wurde versucht, fehlende Werte zu vermeiden, indem die Tests und schriftlichen Befragungen im Rahmen der regulären Schulzeit durchgeführt und die Termine langfristig angesetzt wurden. Außerdem wurde durch mög‐ lichst klare Erläuterungen der Aufgabenstellungen bei den Tests, durch eine angemessene Länge der einzelnen Aufgaben und ausreichend Zeit, um diese zu erfüllen sowie durch die Ankündigung, es gebe keine Noten aber durchaus ein Feedback für die ganze Klasse versucht, fehlende Werte zu vermeiden. Dennoch kamen einzelne fehlende Werte dadurch zustande, dass einzelne Schülerinnen und Schüler an einem von zwei Testtagen erkrankt waren, zu spät zum Unterricht erschienen oder aber einzelne Aufgaben verweigerten. Daher wurden die stark unvollständigen Testmaterialien von zwei Probanden von Anfang an aus dem Sample ausgeschlossen. In Bezug auf die schriftliche Befragung mit Hilfe des Fragebogens kommt außerdem als mögliche Ursache von fehlenden Werten hinzu, dass einzelne Fragebogen-Items eventuell bewusst übersprungen oder bewusst oder unbe‐ wusst für eine weitere Auswertung unzureichend ausgefüllt wurden, wie dies beispielsweise bei der Frage nach dem jeweiligen Beruf der beiden Elternteile vereinzelt der Fall war (vgl. Döring/ Bortz 2016: 590). 136 Dies trifft zum Beispiel auf die zweite der folgenden beiden Lücken des Fragebogens zu, die automatisch unausgefüllt bleibt, wenn die erste Antwort „Deutschland“ ist: „1.5 Dein Geburtsland: __________________. Falls Du nicht in Deutschland geboren bist, wie alt warst Du, als Du nach Deutschland kamst? - Ich war _______ Jahre alt.“ Die Antwortmöglichkeiten wurden im Nachhinein numerisch codiert (vgl. Anhang 3.4). System-defined Missings wurden beispielsweise auch für die Variablen v11_16_5 bis v11_16_21 verwendet, die ausschließlich im Fragebogen für die Spanischlernenden ent‐ halten sind. Somit wurde für diese bei den Französischlernenden in den entsprechenden nummerischen Zellen der Datenmatrix ein Punkt eingetragen, welcher in IBM SPSS 26 ein system-defined Missing definiert (vgl. Anhang 3.4). Bevor also entschieden werden kann, wie mit den einzelnen fehlenden Werten umgegangen wird, müssen zunächst unterschiedliche Arten von feh‐ lenden Werten definiert werden: Das Statistikprogramm IBM SPSS 26 unter‐ scheidet zwischen zwei Arten von fehlenden Werten: Als system-defined Missings wurden im vorliegenden Datensatz diejenigen fehlenden Werte be‐ handelt, die bei nicht bearbeiteten optionalen Items im Fragebogen zustande kamen 136 , da sich die fehlenden Werte aus dem System des Datensatzes logisch ergeben. Außerdem wurde darauf geachtet, dass keine Zeilen nach dem letzten Eintrag in der sog. „Datenansicht“ mit Punkten versehen sind, wodurch SPSS automatisch weitere fehlende Probanden bzw. Fälle zählen würde. Für alle anderen fehlenden Werte wurden user-defined Missings bestimmt. Diese wurden zunächst mit dem Wert -999 kodiert. Inwiefern für die einzelnen statistischen Untersuchungen bei den fehlenden Werten Funktionen für listenweise und/ oder fallweise Ausschlüsse oder aber imputationsbasierte Verfahren verwendet werden, wird bei jedem einzelnen Analyseschritt separat erläutert und begründet, wobei hier als oberstes Gebot gilt, keinerlei Verzerrung der Ergebnisse durch einen inkorrekten Umgang mit fehlenden Werten zu bewirken (vgl. Döring/ Bortz 2016: 591). 11.2 Statistische Merkmale der Stichproben Bevor die Auswertung der kognitiven und fremdsprachlichen Tests sowie der endogenen und exogenen Variablen, die durch den Fragebogen erhoben wurden, vorgenommen wird, werden zunächst grundlegende Merkmale bezüglich der Zusammensetzung der jeweiligen Klumpen hinsichtlich der Merkmalsgruppen Geschlecht, sprachlicher Hintergrund, Migrationshintergrund und HISEI, die über den ersten Teil des Schülerfragebogen erhoben wurden (vgl. Kapitel 9.3.2), berichtet. Im Zentrum steht dabei auch der Vergleich mit den Merkmalen der 260 11 Auswertung der Ergebnisse 137 Eine Person kreuzte außerdem die Option „keine Angabe“ beim Item Geschlecht des Fragebogens an, weshalb diese aufgrund der sehr geringen Repräsentation dieser dritten Kategorie aus dem Sample ausgeschlossen wurde (vgl. Döring 2013; Kapitel 8.2). Grundgesamtheit und eine entsprechende Prüfung der Repräsentativität der Stichprobe (vgl. Kapitel 8.1). 11.2.1 Spezifische Merkmale der Französischstichprobe Angestrebt war aus den oben genannten Gründen, jeweils eine Stichprobe für Französisch und Spanisch mit mindestens 100 Probandinnen und Probanden zu ziehen, die in ihrer Schichtung der Merkmale Geschlecht, sprachlicher Hin‐ tergrund und sozioökonomischer Hintergrund die beiden Grundgesamtheiten möglichst repräsentativ widerspiegeln. Obwohl ursprünglich etwas mehr als 100 Probandinnen und Probanden eingeplant waren, kam es durch spontane Nicht-Teilnahmen einzelner Probanden an den Tests und schriftlichen Befra‐ gungen, überwiegend bedingt durch Krankheitsfälle, aber auch durch fehlende Einverständniserklärungen der Eltern, zu einer leichten Reduzierung des Stich‐ probenumfangs. Dieser liegt daher in den beiden Stichproben jeweils leicht unter einhundert Probanden: Für Französisch können n = 92 Probandinnen und Probanden verzeichnet werden, wobei mit n (w) = 52 und n (m) = 40 das Geschlechterverhältnis von 57% weiblichen Schülerinnen und 43% männ‐ lichen Schülern innerhalb des von Grein (2012) berechneten Prozentsatzes liegt, welcher für die Schuljahre 2002/ 2003 bis 2010/ 11 zwischen 56% und 64%, lag und somit in etwa der Gesamtpopulation entspricht (vgl. Kapitel 8.1). 137 Es handelt sich um das Fach Französisch als zweite Fremdsprache ab der sechsten Jahrgangsstufe, wobei alle Schülerinnen und Schüler seit der ersten Jahrgangsstufe Englisch als erste Fremdsprache und lediglich 14 Schülerinnen und Schüler zusätzlich Spanisch als dritte Fremdsprache belegen. Außerdem erhalten zwei der 92 Lernenden regelmäßig Nachhilfeunterricht in Französisch. 77.2% der Probandinnen und Probanden waren bereits mindestens einmal im französischsprachigen Ausland. Die einzelnen Klumpen in Form von Französischklassen setzen sich folgen‐ dermaßen zusammen: n (Klasse A) = 13, n (Klasse B) = 20, n (Klasse C) = 15, n (Klasse D) = 21, n (Klasse E) = 23. Die Französischlehrkräfte dieser fünf Klassen sind alle weiblich und die Schülerinnen und Schüler sind zum Erhebungszeit‐ punkt durchschnittlich 14.58 Jahre alt. Auch wenn, wie bereits erörtert, die Verwendung der Kategorie Migrati‐ onshintergrund mittlerweile in der Fremdsprachenforschung eher kontrovers diskutiert wird (vgl. Kapitel 8.1), soll zunächst der Anteil der Schülerinnen 11.2 Statistische Merkmale der Stichproben 261 138 Dieser Grenzwert von 50% oder mehr wird festgelegt, da in der Definition von Migrati‐ onshintergrund von Personen „in deren Familie überwiegend nicht deutsch gesprochen wird“ die Rede ist (Statistisches Landesamt Baden-Württemberg 2017, vgl. auch Lan‐ desinstitut für Schulentwicklung/ Statistisches Landesamt Baden-Württemberg 2018: 317). und Schüler mit Migrationshintergrund innerhalb der Stichprobe angegeben werden, um diese Variable mit den vorhandenen Angaben zur Grundgesamtheit vergleichen zu können. Dabei wird von der durch das Statistische Bundesamt Baden-Württemberg (2017) festgelegten Definition von Migrationshintergrund ausgegangen (vgl. Kapitel 8.1). Obwohl diese Definition problematisiert werden kann, da beispielsweise offenbleibt, ob auch das deutschsprachige Ausland, also Österreich und die Schweiz in der Definition genauso als Ausland zählen wie das Ausland, in dem kein Deutsch gesprochen wird. Auch bleibt unklar, wie viele Jahre nach der Geburt ein Mensch im Ausland verbracht haben muss, um in die Kategorie „Migrationshintergrund“ eingeordnet zu werden oder inwiefern Geburtsort und Nationalität der Eltern neben der Familiensprache eine Rolle spielen. Da all dies durch die Definition des Statistischen Bundesamts Baden-Württemberg (2017) nicht festgelegt wird, wurden nach sorgfältiger Abwägung letztendlich bei der Auswertung alle Fälle in die Kategorie „Mi‐ grationshintergrund“ aufgenommen, die entweder angaben, keine deutsche Staatsangehörigkeit zu besitzen (vgl. Frage 1.4 des Fragebogens), die angaben, nicht in Deutschland geboren zu sein (vgl. Frage 1.5 des Fragebogens) oder die angaben, zu einem Zeitanteil von 50% oder mehr 138 zu Hause mit den Fami‐ lienangehörigen eine andere Sprache als Deutsch zu sprechen (vgl. Frage 1.6 des Fragebogens). Alle anderen Faktoren, wie z.-B. ein anderes Geburtsland als Deutschland eines Elternteils, wurden entsprechend nicht berücksichtigt. Durch diese eher enge Definition des Migrationshintergrunds ergibt sich im Vergleich zur Variable sprachlicher Hintergrund, die im Anschluss analysiert werden soll, ein etwas anderes Bild: In der Französischstichprobe besitzen 65 Probandinnen und Probanden (n (w) = 39, n (m) = 29) keinen Migrationshintergrund und entsprechend haben 19 Probandinnen und Probanden (n (w) = 11, n (m) = 8) einen Migrationshintergrund. Bei fünf Fällen, die aufgrund von Absenzzeit den Fragebogen nicht ausfüllten, treten jeweils fehlende Werte auf. Somit liegt der Anteil der Probandinnen und Probanden mit Migrationshintergrund in der Stichprobe des Fachs Französisch bei ca. 22%. Dieser Wert liegt infolgedessen leicht über den vom Statistischen Landesamt Baden-Württemberg (2018: 1) errechneten Wert von 14%, welcher sich allerdings auf die gesamte Schüler‐ schaft und nicht nur auf die neunte Jahrgangsstufe mit zweiter Fremdsprache Französisch bezieht. Es könnte allerdings durchaus angenommen werden, dass 262 11 Auswertung der Ergebnisse 139 Auch muss berücksichtigt werden, dass die fünf fehlenden Werte den angegebenen Prozentsatz leicht nach unten oder nach oben verschoben haben könnten, wobei in beiden Fällen noch von einer Abbildung der Grundgesamtheit gesprochen werden könnte. mehrsprachig aufwachsende Schülerinnen und Schüler im Durchschnitt eine moderne zweite Fremdsprache anstatt Latein wählen, da sie davon ausgehen, dass ihnen das Lernen einer weiteren Sprache leichter fällt (vgl. Riehl 2006: 18-19; Riemer/ Hufeisen 2010: 746). Deshalb wird angenommen, dass dieser leicht erhöhte Anteil an Schülerinnen und Schülern mit Migrationshintergrund in der vorliegenden Französischstichprobe die angestrebte Grundgesamtheit durchaus repräsentiert. 139 Auch die Verteilung der Stichprobe hinsichtlich des sprachlichen Hinter‐ grunds soll an dieser Stelle genau analysiert werden, auch wenn hierzu keine Informationen für die angestrebte Grundgesamtheit vorliegen. Unterschieden werden in dieser Kategorie einsprachig und mehrsprachig aufgewachsene Probandinnen und Probanden: Ein mehrsprachiger Hintergrund wird einem Lernenden dann attestiert, wenn er über den entsprechenden Schülerfragebogen entweder eine andere Erstsprache als Deutsch oder zusätzlich zum Deutschen eine weitere oder mehrere weitere Erstsprachen angegeben hat (vgl. Frage 1.6 des Fragebogens). Innerhalb der Französischstichprobe können 56 Proban‐ dinnen und Probanden (n (w) = 34, n (m) = 22) als monolingual aufwachsend und 31 Probandinnen und Probanden (n (w) = 16, n (m) = 15) als zwei- oder mehrspra‐ chig aufwachsend kategorisiert werden; auch hier liegen bei fünf Probandinnen und Probanden aufgrund der Absenz an einem Testtag keine Angaben zum sprachlichen Hintergrund vor. Wenn man das Geschlechterverhältnis innerhalb der Kategorie Mehrsprachigkeit betrachtet, ist dies leicht unausgeglichen: 61% der einsprachig aufwachsenden Französischlernenden sind weiblich und ent‐ sprechend 39% männlich. Bei den mehrsprachig aufwachsenden Schülerinnen und Schülern innerhalb der Französischstichprobe gestaltet sich das Verhältnis etwas ausgeglichener: 52% sind weiblich und 48% männlich. Innerhalb der Französischstichprobe hat außerdem keiner der Probandinnen und Probanden Französisch als Erstsprache, wodurch bei der Auswertung aufgrund dieses Aspekts keine Fälle ausgeschlossen werden müssen. Tabelle 17 fasst Häufigkeitsverhältnisse innerhalb der Klumpen bezüglich der Geschlechterverteilung und bezüglich des sprachlichen Hintergrunds noch einmal detailliert zusammen: 11.2 Statistische Merkmale der Stichproben 263 140 In Klasse A ist ein fehlender Wert, in Klasse D sind zwei fehlende Werte und in Klasse E ebenfalls zwei fehlende Werte im Bereich des sprachlichen Hintergrunds zu verzeichnen. Französischstichprobe - Geschlecht Sprachlicher Hintergrund 140 und Geschlecht - n n(w) n(m) n(ml) n(w, ml) n(m, ml) n(pl) n(w, pl) n(m, pl) Klasse A 13 7 6 10 4 6 2 2 0 Klasse B 20 9 11 15 9 6 5 0 5 Klasse C 15 10 5 11 7 4 4 3 1 Klasse D 21 14 7 8 7 1 11 7 4 Klasse E 23 12 11 12 7 5 9 4 5 Gesamte Stich‐ probe 92 52 40 56 34 22 31 16 15 Anmerkungen. w = weiblich, m = männlich, ml = monolingual, pl = plurilingual Tabelle 17: Übersicht über die statistischen Merkmale der Klumpenstichprobe im Fach Französisch (9. Jgst. Gymnasium) bezüglich der Merkmalsgruppen Geschlecht und sprachlicher Hintergrund, aufgeteilt nach den einzelnen Klumpen Es wird ersichtlich, dass innerhalb der Klumpen in dem Sinne eine ausreichende Heterogenität vorherrscht, dass stets sowohl Jungen und Mädchen sowie so‐ wohl Schülerinnen und Schüler mit und ohne mehrsprachigem Hintergrund in den Klassen sind. Lediglich in Klasse A findet sich kein Junge und in Klasse B kein Mädchen mit mehrsprachigem Hintergrund. Wenn die Klumpen hinsichtlich der gewünschten Homogenität untereinander (vgl. Döring/ Bortz 2016: 315) verglichen werden, fällt auf, dass, entgegen des allgemeinen Trends, nur in Klasse B etwas mehr Jungen als Mädchen und nur in Klasse D etwas mehr Schülerinnen und Schüler mit mehrsprachigem als mit einsprachigem Hinter‐ grund sind. Abgesehen davon sind die Anteile von Jungen und Mädchen sowie von Schülerinnen und Schülern mit und ohne mehrsprachigem Hintergrund in den Klumpen relativ homogen. Zusätzlich wurden die Lernenden nach den Französischkenntnissen ihrer 264 11 Auswertung der Ergebnisse 141 Dabei steht 1 für keine, 2 für geringe, 3 für mittlere, 4 für gute und 5 für sehr gute Französischkenntnisse. 142 Für eine Erläuterung des HISEI siehe Kapitel 8.1. Eltern befragt (vgl. Fragen 1.9 und 1.10 des Fragebogens, Anhang 3.2) 141 : In der Französischstichprobe erreichen die Einschätzungen der Französischkenntnisse der Mütter (bzw. ersten Elternteile) der Mädchen einen Mittelwert von 2.24 und diejenigen der Mütter der Jungen 2.27. Hingegen erreichen die Väter der Mädchen einen Mittelwert von 1.71 und die Väter der Jungen einen Mittelwert von 1.94. Somit ist das Verhältnis zwischen Jungen und Mädchen bezüglich der Französischkenntnisse der jeweiligen Eltern ausgeglichen, wenngleich auffällt, dass den Müttern beider Geschlechtergruppen durchschnittlich höhere Französischkenntnisse zugeschrieben werden als den Vätern. Abschließend wird die Stichprobe ebenfalls bezüglich des sozioökonomi‐ schen beruflichen Status (HISEI) dessen Verhältnis zur Grundgesamtheit über‐ prüft. Der durchschnittliche HISEI 142 in der Französischstichprobe liegt bei 62.77 und damit deutlich über dem von Prenzel et al. (2013) ermittelten Wert von 56.6 für die Schülerinnen und Schüler zu Beginn der fünften Jahrgangsstufe des Gymnasiums. Allerdings nähert sich der mittlere HISEI der Französischstich‐ probe an den von Schipolowski et al. (2016: 184) im Rahmen des IQB-Bildungs‐ trends ermittelten mittleren HISEI von Neuntklässlerinnen und Neuntklässlern an Gymnasien in Baden-Württemberg, die spätestens seit der 5. Jahrgangs‐ stufe durchgehend Französischunterricht erhalten haben und den mittleren Bildungsabschluss anstreben, von 61.8. Somit ist auch davon auszugehen, dass, obwohl es sich in der vorliegenden Studie nicht um Französisch als erste, sondern als zweite Fremdsprache handelt, der mittlere HISEI der Stichprobe repräsentativ für die angestrebte Grundgesamtheit ist. Dies bleibt dennoch eine Annahme, da konkrete Zahlen für die Lernenden der 9. Jahrgansstufe an Gymnasien in Baden-Württemberg mit Französisch als zweiter Fremdsprache für das Schuljahr 2017/ 18 in den offiziellen Statistiken fehlen (vgl. Kapitel 8.1). In Tabelle 18 befinden sich die genauen HISEI-Werte für die Französischs‐ tichprobe, aufgeteilt nach den einzelnen Klumpen und nach Geschlecht: 11.2 Statistische Merkmale der Stichproben 265 Französischstichprobe Datenquelle gesamt weiblich männlich Klasse A (n-=-11, MV-=-2) (n (w) = 5; n (m) = 6) M-=-61.46 SD-=-22.74 SEM-=-6.86 M-=-55.40 SD-=-29.46 SEM-=-13.17 M-=-66.51 SD-=-16.52 SEM-=-6.74 Asymptotische Signifikanz (zweiseitiger Test) - p-=-.740 Klasse B (n-=-18, MV-=-2) (n (w) = 8, n (m) = 10) M-=-65.26 SD-=-18.73 SEM-=-4.42 M-=-75.25 SD-=-14.10 SEM-=-4.99 M-=-57.27 SD-=-18.67 SEM-=-5.90 Asymptotische Signifikanz (zweiseitiger Test) - p-=-.058 Klasse C (n-=-14, MV-=-1) (n (w) = 9, n (m) = 5) M-=-65.40 SD-=-18.28 SEM-=-4.89 M-=-62.50 SD-=-22.23 SEM-=-7.41 M-=-70.64 SD-=-6.65 SEM-=-2.98 Asymptotische Signifikanz (zweiseitiger Test) - p-=-.577 Klasse D (n-=-19, MV-=-2) (n (w) = 14, n (m) = 5) M-=-63.77 SD-=-20.25 SEM-=-4.65 M-=-58.37 SD-=-20.79 SEM-=-5.56 M-=-78.90 SD-=-7.17 SEM-=-3.21 Asymptotische Signifikanz (zweiseitiger Test) - p-=-.089 Klasse E (n-=-20, MV-=-3) (n (w) = 11, n (m) = 9) M-=-58.47 SD-=-22.69 SEM-=-5.07 M-=-64.46 SD-=-21.14 SEM-=-6.37 M-=-51.14 SD-=-23.55 SEM-=-7.85 Asymptotische Signifikanz (zweiseitiger Test) - p-=-.178 266 11 Auswertung der Ergebnisse 143 Eine Abweichung von der Normalverteilung äußert sich zum einen in einer asymme‐ trischen Streuung um den Mittelwert und somit entweder in einer stark linksschief oder stark rechtsschief gelagerten Verteilung. Eine Nicht-Normalverteilung charakterisiert sich zudem darin, dass die Höhe der Verteilungskurve nach oben (positive Kurtosis) oder nach unten (negative Kurtosis) abweicht, wobei sich gleichzeitig die Breite der Verteilungsform ändert (vgl. Kline 2016: 74-75). Eine Prüfung der Datenstruktur ergab für die Verteilung der HISEI-Werte der Französischstichprobe lediglich eine leichte univariate Abweichung von der Normalverteilung (Schiefe γ = -.612; Standardfehler der Schiefe .266) und Kurtosis ꞷ = -.821; Standardfehler der Kurtosis .526), welche eindeutig unter den in der Literatur genannten Grenzwerten liegt (Schiefe < 2 bzw. 3, Kurtosis < 7 bzw. 10, vgl. Curran et al. 1996: 26; Kline 2016: 76-77). Französischstichprobe - - Datenquelle gesamt weiblich männlich Gesamte Stichprobe (n-=-82, MV-=-10) (n (w) = 47, n (m) = 35) M-=-62.77 SD-=-20.26 SEM-=-2.24 M-=-63.14 SD-=-21.22 SEM-=-3.10 M-=-62.28 SD-=-19.19 SEM-=-3.24 Zweiseitige Signifikanz nach t-Test 143 - p-=-.850 Anmerkungen: Die Ergebnisse zu den Signifikanzniveaus wurden aufgrund der kleinen Größen der einzelnen Klumpen durch den Mann-Whitney-U-Test ermittelt. Tabelle 18: Übersicht über die statistischen Merkmale der Klumpenstichprobe im Fach Französisch bezüglich der Merkmale sozioökonomischer beruflicher Status (HISEI) und Geschlecht, aufgeteilt nach den einzelnen Klumpen (9. Jgst. Gymnasium) Tabelle 18 zeigt, dass die Mittelwerte des HISEI der einzelnen Klumpen zwischen 58.47 und 65.40 liegen und somit zwischen den Klumpen eine gewisse Homoge‐ nität vorhanden ist. Die Standardabweichungen liegen zwischen 18.28 und 22.74 und sind daher ebenfalls relativ homogen. Der Kruskal-Wallis-Test ergibt, dass im Bereich des mittleren HISEI keine signifikanten Unterschiede zwischen den einzelnen Klumpen vorliegen (p = .878). Die Mädchen erreichen innerhalb der unterschiedlichen Klumpen mittlere HISEI-Werte 55.40 und 75.25. Die Jungen erreichen mittlere HISEI-Werte zwischen 51.14 und 78.90. Hierbei ist festzu‐ stellen, dass die HISEI-Werte zwischen den Geschlechtergruppen innerhalb der Klumpen nicht immer gleich verteilt sind: In drei Klumpen haben die männli‐ chen Lernenden einen höheren HISEI-Wert und in zwei Klumpen die weiblichen. Jedoch ergeben sich nach der Durchführung des Mann-Whitney-U-Tests für keinen der Klumpen signifikante Unterschiede zwischen Jungen und Mädchen. Innerhalb der gesamten Französischstichprobe erreichen die Mädchen einen mittleren HISEI von 63.14 und die Jungen von 62.28. Die Durchführung des 11.2 Statistische Merkmale der Stichproben 267 t-Tests ergibt eine zweiseitige Signifikanz von .850 und somit liegt kein signi‐ fikanter Unterschied zwischen den beiden Gruppen vor. Auch hier liegen die Standardabweichungen mit 21.22 für die Mädchen der Französischstichprobe und 19.19 für die Jungen der Französischstichprobe eng beieinander. Der Standardfehler des Mittelwerts (SEM) gibt an, wie hoch die mittlere Abweichung des aus der Stichprobe berechneten Mittelwerts von dem tatsächli‐ chen Mittelwert der Grundgesamtheit ist. Umso größer der Stichprobenumfang ist, umso kleiner ist der Standardfehler des Mittelwerts (vgl. Döring/ Bortz 2016: 642), was erklärt, warum die SEM in den einzelnen Klumpen etwas höher sind als in der gesamten Klumpenstichprobe. Für die gesamte Französischstichprobe (n = 82, MV = 10) liegt der Standardfehler des Mittelwerts bei 2.24 und ist somit sehr gering. Auch die Standardfehler der Mittelwerte von 3.10 für den mittleren HISEI der Mädchen und von 3.24 für den mittleren HISEI der Jungen fallen vergleichbar und insgesamt sehr gering aus. Da bei den Angaben zum HISEI 10 fehlende Werte vorliegen, was einen Anteil von 9.2% ausmacht, muss später eventuell geprüft werden, ob im Rahmen einer multiplen Regression eine multiple Imputation zur Schätzung der fehlenden HISEI-Werte eingesetzt werden sollte (vgl. IBM 2019). 11.2.2 Spezifische Merkmale der Spanischstichprobe Für Spanisch als dritte Fremdsprache können 94 Probandinnen und Probanden verzeichnet werden, wobei mit 73 weiblichen Probandinnen und 21 männlichen Probanden ein unausgeglichenes Geschlechterverhältnis vorliegt. Wie auch in der Gesamtpopulation liegt in der Stichprobe für Spanisch als dritte Fremd‐ sprache ein stark erhöhter Anteil an Mädchen vor. Dieses zunächst unausgegli‐ chen scheinende Verhältnis von 78% Mädchen und 22% Jungen repräsentiert demnach durchaus die Schichtungen der Geschlechtergruppen innerhalb der Gesamtpopulation in Spanisch als dritte Fremdsprache: In Bayern, das aufgrund fehlender Daten in Baden-Württemberg zum Geschlechterverhältnis im gymna‐ sialen sprachlichen Profil als Vergleichsgröße herangezogen wird, bestand das sprachliche Profil im Schuljahr 2017/ 18 ebenfalls aus 71.53% Mädchen (N = 6 598) und 28.52% Jungen (N = 2 631) (vgl. Bayerisches Landesamt für Statistik 2019a, 2019b; Kapitel 8.1). Die Spanischschülerinnen und -schüler lernen außerdem Englisch als erste Fremdsprache seit der ersten Jahrgangsstufe. 83 der 94 Spanischlernenden lernen als zweite Fremdsprache seit der 6. Jahrgangsstufe Französisch und die restlichen 11 Spanischlernenden belegen Latein als zweite Fremdsprache. Lediglich 5 der 94 Lernenden erhalten Nachhilfeunterricht in 268 11 Auswertung der Ergebnisse 144 Für das Fach Spanisch - Bachelor und Lehramtsabschlüsse im ersten Staatsexamen zusammengenommen - betrug der Anteil weiblicher Absolventinnen in Deutschland zwischen 2009 und 2018 zwischen 80 und 88% (vgl. Statistisches Bundesamt 2020c). Spanisch und 52.1% waren bereits mindestens einmal im spanischsprachigen Ausland. In der Stichprobe für Spanisch setzen sich die Klumpen folgendermaßen zu‐ sammen: n (Klasse F) = 21, n (Klasse G) = 18, n (Klasse H) = 18, n (Klasse I) = 20 und n (Klasse J) = 17. Wie hier festzustellen ist, erreicht die Anzahl der Schülerinnen und Schüler pro Klasse in keinem der Klumpen den in Baden-Württemberg angesetzten Klassenteiler von 30 Schülerinnen und Schülern (vgl. KMK 2018: 2), was die Repräsentativität der Gesamtstichprobe erhöht, da mehr Teilstich‐ proben notwendig sind, gleichzeitig aber auch die Organisation der zahlreichen Testdurchführungen vor Herausforderungen stellte. Die Spanischlehrkräfte dieser fünf Klassen sind alle weiblich. 144 Die Schülerinnen und Schüler des Spanischen sind zum Erhebungszeitpunkt durchschnittlich 14.66 Jahre alt und liegen damit sehr nah an der Französischs‐ tichprobe, die einen Altersdurchschnitt von 14.58 vorweist. Dieser minimale Unterschied im durchschnittlichen Alter erklärt sich eventuell auch daraus, dass der Erhebungszeitraum für Französisch zwischen März und Mai 2018 und für Spanisch zwischen April und Juni 2018 und somit ganz leicht zeitversetzt liegt. Zum Ziel des Vergleichs der Stichprobe mit der Grundgesamtheit soll an dieser Stelle ebenfalls zunächst die Kategorie des Migrationshintergrunds be‐ rücksichtigt werden: Innerhalb der Spanischstichprobe haben nach der oben genannten Definition von Migrationshintergrund des Statistischen Landesamts Baden-Württemberg (2017) 69 Probandinnen und Probanden (n (w) = 54, n-(m)-=-15) keinen und 24 Probandinnen und Probanden (n-(w)-=-19, n-(m)-=-5) einen Migrationshintergrund; bei einem Fall fehlen hierzu Angaben. Somit liegt der Anteil von Schülerinnen und Schülern in der Spanischstichprobe mit Migrationshintergrund bei 26% und damit deutlich über dem in Baden-Würt‐ temberg für Gymnasien im Jahr 2018 errechneten Wert von 14% (Statistisches Landesamt Baden-Württemberg 2018: 1), welcher sich allerdings auf die gesamte Schülerschaft am Gymnasium bezieht. Aufgrund der Hypothese, dass mehr‐ sprachig aufwachsende Schülerinnen und Schüler davon ausgehen könnten, dass ihnen das Erlernen fremder Sprachen etwas leichter fällt als monolingual aufgewachsenen Lernenden (vgl. Riehl 2006: 18-19; Riemer/ Hufeisen 2010: 746) und sie sich deshalb im Durchschnitt etwas öfter für eine dritte Fremdsprache entscheiden könnten als einsprachig aufwachsende Schülerinnen und Schüler, wird hier trotzdem von einer weitestgehenden Repräsentativität der Stichprobe ausgegangen. 11.2 Statistische Merkmale der Stichproben 269 Wenn man den sprachlichen Hintergrund als Kategorie anlegt, ergibt sich folgendes Ergebnis: Innerhalb der Spanischstichprobe wachsen - nach den Angaben im Schülerfragebogen - 53 Probandinnen und Probanden (n (w) = 42, n (m) = 31) monolingual auf und 41 Probandinnen und Probanden (n-(w) = 31, n (m) = 10) hingegen zwei- oder mehrsprachig. Zu berücksichtigen ist hier, dass innerhalb der Gruppe der einsprachig Aufgewachsenen und innerhalb der Gruppe der Schülerinnen und Schüler mit mehrsprachigem Hintergrund jeweils eine leicht unterschiedliche Geschlechterproportion vorherrscht. Wenngleich 41 Probandinnen und Probanden mehrsprachig sind, wird Deutsch von allen Probandinnen und Probanden als Familiensprache angegeben. Drei Lernende geben außerdem an, zu Hause Spanisch zu sprechen, weshalb diese Fälle im Folgenden näher analysiert werden und nach dieser Analyse entschieden wird, ob diese im Sample bleiben oder nicht: Probandin 1017 gibt zwar als Nationalität deutsch, als Geburtsland Deutschland und als Geburtsländer der Eltern Deutsch‐ land und Österreich an, behauptet jedoch, ein Viertel der Zeit zu Hause Spanisch zu sprechen. Außerdem gibt diese Lernende an, noch nie im spanischsprachigen Ausland gewesen zu sein. Die Textproduktionen im Rahmen der Testaufgaben zum Schreiben dieser Probandin lassen ebenfalls nicht auf einen muttersprach‐ lichen Hintergrund schließen, weshalb dieser Fall nicht als muttersprachlich Spanisch betrachtet und somit in der Stichprobe gelassen wird. Proband 1034 gibt ebenfalls einen Zeitanteil von 25% Spanisch als Familiensprache an und indiziert, dass seine Stiefmutter aus Ecuador stammt. Jedoch zeigt auch hier die Textproduktion dieses Probanden keinerlei muttersprachliche Kompetenz und im Hörverstehenstest (vgl. Kapitel 11.4.1.2) erreicht der Lernende 33.5 von 40 Punkten. Daher wird dieser Proband nicht aus der Stichprobe entfernt. Der dritte Proband 1059, der bezüglich eines möglichen Ausschlusses aufgrund der Muttersprache Spanisch genauer betrachtet werden muss, gibt, vergleichbar mit Probandin 1017 als Nationalität deutsch, als Geburtsland Deutschland und als Geburtsland seiner beiden Elternteile Deutschland an. Neben einem Zeitanteil von 100% Deutsch als Familiensprache gibt der Proband trotzdem 25% Spanisch an. Hinzu kommt, dass der Proband im Fragebogen berichtet, noch nie im spanischsprachigen Ausland gewesen zu sein. Im Schreibtest kommt er beim dritten Rating, das ausschließlich sprachliche Aspekte berücksichtigt, auf 4.521 Punkte und somit auf ein Niveau zwischen A2.2 und B1.1. Daher wird auch dieser Fall nicht als muttersprachlich Spanisch eingestuft und entsprechend nicht aus der Stichprobe entfernt. Tabelle 19 zeigt die Häufigkeitsverteilungen bezüglich des Geschlechts und des sprachlichen Hintergrunds für alle fünf Klumpen der Spanischstichprobe: 270 11 Auswertung der Ergebnisse Spanischstichprobe - Geschlecht Sprachlicher Hintergrund und Geschlecht - n n(w) n(m) n(ml) n(w, ml) n(m, ml) n(pl) n(w, pl) n(m, pl) Klasse F 21 18 3 6 4 2 15 14 1 Klasse G 18 17 1 12 12 0 6 5 1 Klasse H 18 17 1 14 14 0 4 3 1 Klasse I 20 12 8 6 5 1 14 7 7 Klasse J 17 9 8 15 7 8 2 2 0 Gesamte Stich‐ probe 94 73 21 53 42 11 41 31 10 Anmerkungen. In der Spanischstichprobe sind im Bereich des sprachlichen Hintergrunds keine fehlenden Werte zu verzeichnen. w = weiblich, m = männlich, ml = monolingual, pl = plurilingual Tabelle 19: Übersicht über die statistischen Merkmale der Klumpenstichprobe im Fach Spanisch (9. Jgst. Gymnasium) bezüglich der Merkmalsgruppen Geschlecht, sprachlicher Hintergrund, aufgeteilt nach den einzelnen Klumpen Der Anteil von Jungen pro Klumpen schwankt zwischen 5.56 und 47.06%. Während Klasse G mit 66.67%, Klasse H mit 77.78% und Klasse J mit 88.24% einen vergleichsweise homogenen Anteil von Lernenden mit einsprachigem Hintergrund aufweisen, ist die Tendenz in Klasse F mit einem Anteil von 28.57% einsprachigem Hintergrund und Klasse I mit einem Anteil von 30% gegenläufig. Die Befragung zu den Spanischkenntnissen der Eltern (vgl. Fragen 1.9 und 1.10) des Fragebogens ergibt durchschnittlich keine bis geringe Spanischkennt‐ nisse beider Elternteile, wobei 1 für keine und 2 für geringe Kenntnisse steht: Die Mütter der weiblichen Spanischlernenden erreichen einen Mittelwert von 1.67 und ihre Väter 1.79. Die Mütter der männlichen Spanischlernenden liegen bei einem Mittelwert von 1.76 und die Väter bei 1.67. Der mittlere HISEI der Spanischstichprobe liegt bei 58.48 und damit leicht unter demjenigen der Französischstichprobe, der bei 62.77 liegt. Die Durchfüh‐ rung eines t-Tests zeigt jedoch, dass der Unterschied zwischen den beiden Stichproben statistisch nicht signifikant ist (p = .162). Da wie gesagt von Seiten der statistischen Landesämter oder von der KMK keine Daten zum mittleren HISEI der Neuntklässlerinnen und Neuntklässler, die am Gymnasium 11.2 Statistische Merkmale der Stichproben 271 in Baden-Württemberg Spanisch als dritte Fremdsprache belegen, vorliegen, kann kein direkter Vergleich der Stichprobe mit der Grundgesamtheit vorge‐ nommen werden. Jedoch liegt die Spanischstichprobe mit einem mittleren HISEI von 58.48 eng bei den vorliegenden Werten zu ähnlichen Grundgesamtheiten: Der Wert der Spanischstichprobe liegt nahe an dem von Prenzel et al. (2013) ermittelten Wert von 56.6 für Gymnasiasten in ganz Deutschland oder dem von Schipolowski et al. (2016: 184) ermittelten Wert von 61.8 als im Rahmen des IQB-Bildungstrends ermittelten mittleren HISEI von Neuntklässlerinnen und Neuntklässlern an Gymnasien in Baden-Württemberg, die spätestens seit der 5. Jahrgangsstufe durchgehend Französischunterricht erhalten haben und den mittleren Bildungsabschluss in Französisch anstreben. Tabelle 20 zeigt eine zusammenfassende Darstellung der statistischen Daten der einzelnen Klumpen hinsichtlich der Kategorien HISEI und Geschlecht: Spanischstichprobe - - Datenquelle gesamt weiblich männlich Klasse F (n-=-21) (n-(w) = 18, n (m) = 3) M-=-52.03 SD-=-22.45 SEM-=-4.90 M-=-55.75 SD-=-21.62 SEM-=-5.10 M-=-29.71 SD-=-13.86 SEM-=-8.00 Asymptotische Signifikanz (zweiseitiger Test) - p-=-.074 Klasse G (n-=-17, MV-=-1) (n-(w) = 16, n (m) = 1) M-=-58.05 SD-=-21.41 SEM-=-5.19 M-=-59.90 SD-=-20.66 SEM-=-5.17 M-=-28.48 - Asymptotische Signifikanz (zweiseitiger Test) - p-=-.331 Klasse H (n-=-18) (n-(w) = 17, n (m) = 1) M-=-64.88 SD-=-20.23 SEM-=-4.77 M-=-65.71 SD-=-20.53 SEM-=-4.98 M-=-50.73 - Asymptotische Signifikanz (zweiseitiger Test) - p-=-.412 Klasse I (n-=-20) (n-(w) = 12, n (m) = 8) M-=-53.62 SD-=-16.76 SEM-=-3.75 M-=-57.03 SD-=-15.48 SEM-=-4.47 M-=-48.50 SD-=-18.33 SEM-=-6.48 Asymptotische Signifikanz (zweiseitiger Test) - p-=-.068 272 11 Auswertung der Ergebnisse 145 Innerhalb der Gesamtstichprobe liegt eine Quasi-Normalverteilung vor: Die Schiefe liegt bei γ = -.341 und die Kurtosis bei ꞷ = -1.225. Von einer Quasi-Normalverteilung kann ausgegangen werden, wenn die Werte von Schiefe und Kurtosis zwischen -1.65 und 1.65 liegen (vgl. Curran et al. 1996: 26; Kline 2016: 76-77). Spanischstichprobe - - Datenquelle gesamt weiblich männlich Klasse J (n-=-17) (n-(w) = 9, n (m) = 8) M-=-65.82 SD-=-16.57 SEM-=-4.02 M-=-62.76 SD-=-18.83 SEM-=-6.28 M-=-69.26 SD-=-14.92 SEM-=-4.96 Asymptotische Signifikanz (zweiseitiger Test) - p-=-.229 Gesamte Stichprobe (n-=-93, MV-=-1) (n-(w) = 72; n (m) = 21) M-=-58.48 SD-=-20.08 SEM-=-2.08 M-=-60.12 SD-=-19.73 SEM-=-2.32 M-=-52.88 SD-=-20.76 SEM-=-4.53 Zweiseitige Signifikanz nach t-Test 145 - p-=-.147 Anmerkungen. Die Ergebnisse zu den Signifikanzniveaus wurden aufgrund der kleinen Größen der einzelnen Klumpen durch den Mann-Whitney-U-Test ermittelt. In den Klassen G und H können für die männlichen Probanden weder Standardabweichungen noch Standardfehler des Mittelwerts angegeben werden, da hier nur jeweils ein männlicher Lernender in der Klasse ist. Tabelle 20: Übersicht über die statistischen Merkmale der Klumpenstichprobe im Fach Spanisch bezüglich der Merkmale sozioökonomischer beruflicher Status (HISEI) und Geschlecht, aufgeteilt nach den einzelnen Klumpen (9. Jgst. Gymnasium) Tabelle 20 zeigt, dass die Werte des mittleren HISEI der einzelnen Klumpen in einem Spektrum von 52.03 bis 65.82 liegen. Der Kruskal-Wallis-Test ergibt, dass keine signifikanten Unterschiede zwischen den einzelnen Klumpen vorliegen (p = .090). Betrachtet man die gesamte Spanischstichprobe, so liegt der mittlere HISEI bei 58.48 und die beiden Geschlechtergruppen zeigen keinen signifikanten Unterschied, auch wenn tendenziell die Mädchen mit 60.12 einen höheren mittleren HISEI aufweisen als die Jungen mit 52.88. Die Standardabweichungen bezogen auf die gesamte Stichprobe bewegen sich ebenfalls mit 19.73 bei den Mädchen und 20.76 bei den Jungen zwischen äußerst nahe beieinanderliegenden Werten. Auch wenn sich die Tendenz eines etwas höheren mittleren HISEI bei den Mädchen mehrheitlich in den einzelnen Klumpen widerspiegelt, so treten bei keinem Klumpen signifikante Unterschiede zwischen dem mittleren HISEI der weiblichen und dem der männlichen Lernenden auf, wobei von einem Signifikanzniveau von p ≤ .05 ausgegangen wird. Die Spannweite der Werte 11.2 Statistische Merkmale der Stichproben 273 des mittleren HISEI zwischen den einzelnen Klumpen liegt bei den Mädchen zwischen 55.75 und 65.71. Bei den Jungen liegt sie wiederum zwischen 28.48 und 69.26, was zunächst als äußerst großes Spektrum mittlerer HISEI-Werte erscheint. Der sehr niedrige Wert von 28.48 als mittlerer HISEI der männlichen Probanden von Klasse G rührt aber daher, dass in dieser Klasse nur ein Junge ist. Somit kann auch hinsichtlich des mittleren HISEI von einer relativen Heterogenität innerhalb, aber auch zwischen den Klumpen gesprochen werden, die sich jedoch innerhalb der Klumpen und der Merkmalsgruppe Geschlecht nicht in signifikanten Werten niederschlägt. Die Standardfehler der Mittelwerte sind auch hier erwartungsgemäß in den einzelnen Klumpen etwas höher als in der gesamten Klumpenstichprobe. Für die gesamte Spanischstichprobe (n = 93, MV = 1) liegt der Standardfehler des Mittelwerts bezüglich des mittleren HISEI bei 2.08, was einen sehr geringen Wert darstellt. Auch die Standardfehler der Mittelwerte von 2.32 für den mittleren HISEI der Mädchen sowie von 4.53 für den mittleren HISEI der Jungen fallen vergleichbar und insgesamt sehr gering aus, was bedeutet, dass der aus der Stichprobe berechnete Mittelwert nur relativ gering von dem tatsächlichen Mittelwert der Grundgesamtheit abweicht (vgl. Döring/ Bortz 2016: 642). Somit kann die gesamte Spanischstichprobe hinsichtlich ihres durchschnitt‐ lichen mittleren HISEI als repräsentativ eingestuft werden, es muss aber bedacht werden, dass die Werte des mittleren HISEI zwischen den Klumpen und zwi‐ schen den Geschlechtergruppen innerhalb der Klumpen durchaus schwanken, aber keine signifikanten Unterschiede weder zwischen den Klumpen (vgl. Kruskal-Wallis-Test) noch innerhalb der Klumpen (vgl. Mann-Whitney-U und t-Test) bezogen auf das Merkmal Geschlecht vorliegen, weshalb sehr gute Voraussetzungen gegeben sind, um innerhalb dieser Stichprobe explizit das Merkmal Geschlecht und die sprachlichen Leistungen von Jungen und Mädchen zu untersuchen. 11.2.3 Zwischenfazit: Merkmale der Französisch- und Spanischstichprobe im Vergleich Insgesamt wurden 186 Schülerinnen und Schüler der neunten Jahrgangsstufe im Gebiet des Regierungspräsidiums Tübingen getestet. Dabei handelt es sich um 92 Französischlernende, von denen 52 weiblich und 40 männlich sind und von denen 56 einsprachig und 31 mehrsprachig aufgewachsen sind. Die Spanischstichprobe umfasst 94 Schülerinnen und Schüler, von denen 73 weiblich und 21 männlich, 53 einsprachig und 41 mehrsprachig aufgewachsen sind. Es handelt sich um eine Klumpenstichprobe, weshalb die einzelnen Klassen auf 274 11 Auswertung der Ergebnisse Unterschiede bezüglich der Verteilungen der Merkmalsgruppen Geschlecht und sprachlicher Hintergrund überprüft wurden. Außerdem wurde die Zusammen‐ setzung der Klumpen bezüglich des sozioökonomischen Hintergrunds (HISEI) statistisch genau analysiert: Weder in der Französischnoch in der Spanischs‐ tichprobe treten signifikante Geschlechterunterschiede bezüglich des sozioöko‐ nomischen Status auf. Außerdem können zwischen den einzelnen Klassen keine signifikanten Unterschiede diesbezüglich festgestellt werden. Betrachtet man die Merkmale Geschlecht, sprachlicher Hintergrund und sozioökonomischer Hintergrund, so weisen die beiden Stichproben große Ähnlichkeiten zu ihrer jeweiligen angestrebten Grundgesamtheit auf. Insgesamt kann deshalb von weitestgehend repräsentativen Stichproben ausgegangen werden. Zusammenfassend betrachtet ist der Anteil an weiblichen Lernerinnen in beiden Stichproben höher als derjenige der männlichen. In Französisch be‐ trägt der Anteil an weiblichen Lernerinnen 57%. Besonders ausgeprägt ist die ungleiche Geschlechterverteilung jedoch in der Spanischstichprobe, von der 78% weiblich sind. Da diese ungleiche Verteilung aber auch in den beiden angestrebten Grundgesamtheiten in ähnlicher Weise vorhanden ist (vgl. Kapitel 11.2.1 und 11.2.2), können im Hinblick auf die Verteilung der Geschlechter‐ gruppen beide Stichproben als repräsentativ angesehen werden. Der Anteil an Schülerinnen und Schülern mit Migrationshintergrund liegt in der Französischstichprobe bei 21.84% und in der Spanischstichprobe bei 25.81%. Beide Werte liegen über dem durch das Statistische Landesamt Baden-Würt‐ temberg (2018: 20) für den Regierungsbezirk Tübingen an privaten und öffent‐ lichen Gymnasien errechneten Anteil von 12.66%. Da aber davon ausgegangen wird, dass Schülerinnen und Schüler mit Migrationshintergrund wegen ihrer bisherigen interkulturellen und mehrsprachigen Erfahrungen (vgl. Riehl 2006: 18-19; Riemer/ Hufeisen 2010: 746) eventuell öfter moderne Fremdsprachen und insbesondere öfter eine dritte Fremdsprache wählen als Schülerinnen und Schüler ohne Migrationshintergrund, wird diese Schichtung als weitestgehend repräsentativ vermutet. Ein für den Kontext des Fremdsprachenlernens geeigne‐ teres Merkmal stellt jedoch der sprachliche Hintergrund dar, wobei hierfür keine statistischen Daten bezüglich der beiden Grundgesamtheiten existieren. 64.37% der Französischstichprobe sind einsprachig aufgewachsen und 35.63% zwei- oder mehrsprachig. Innerhalb der Spanischstichprobe sind hingegen 56.38% einsprachig aufgewachsen und 43.62% zwei- oder mehrsprachig. Der in der Spanischstichprobe deutlich höhere Anteil an Schülerinnen und Schülern mit mehrsprachigem Hintergrund muss entsprechend bei der Interpretation der Ergebnisse der Sprachtests berücksichtigt werden. 11.2 Statistische Merkmale der Stichproben 275 146 Brickenkamp et al. (2010: 18) nennen als Gründe für die Unterlassung der Auswertung der ersten Zeile den oft nicht gleichzeitigen Beginn der Probandinnen und Probanden bei Gruppentestungen und als Grund für die Unterlassung der Auswertung der letzten Schließlich gibt es zwischen der Französisch- und der Spanischstichprobe keinen signifikanten Unterschied bezüglich des mittleren sozioökonomischen Status (HISEI, Französisch M = 62.77, Spanisch M = 58.48, p = .162). Auch zwischen den Geschlechtergruppen und den vier Gruppen 1) weibliche Franzö‐ sischlernerinnen, 2) männliche Französischlernende, 3) weibliche Spanischler‐ nerinnen, 4) männliche Spanischlernende gibt es keine signifikanten Unter‐ schiede, wobei letzteres mithilfe einer einfaktoriellen ANOVA überprüft wurde (p = .254). Jedoch wurde ersichtlich, dass in den beiden Stichproben die Mädchen tendenziell, aber nicht signifikant über einen etwas höheren HISEI verfügen als die Jungen (Französisch: M (w) = 63.14; M (m) = 62.28; p = .850; vgl. Tabelle 18; Spanisch: M-(w) = 60.12; M-(m) = 52.88; p = .147; vgl. Tabelle 20). Nachdem die Stichproben nun umfassend in ihren einzelnen Charakteristika vorgestellt wurden, werden nun die Ergebnisse der einzelnen Tests erläutert. 11.3 Ergebnisse der kognitiven Tests Im Folgenden werden die Auswertungsverfahren der beiden kognitiven Tests dargelegt sowie deren Ergebnisse insbesondere in Bezug auf Unterschiede zwischen der Französisch- und der Spanischstichprobe sowie zwischen Jungen und Mädchen untersucht. Eine zentrale Frage, die sich hierbei stellt, ist, inwie‐ fern die einzelnen Merkmalsgruppen, d. h. weibliche Französischlernerinnen, männliche Französischlernende, weibliche Spanischlernerinnen und männliche Spanischlernende bezüglich ihrer kognitiven Grundfertigkeiten Arbeitstempo, Konzentration, Sorgfalt der Arbeitsweise (d2-R, Brickenkamp et al. 2010) und schlussfolgerndes Denken (SPM, Raven 2009) überhaupt vergleichbar sind. 11.3.1 Ergebnisse des d2-R-Tests Zum Ziel der Auswertung der Testergebnisse des d2-R-Tests werden die bearbei‐ teten Zielobjekte (BZO), die durch die Probandinnen und Probanden korrekt und inkorrekt durchgestrichen wurden, auf dem Durchschreibbogen eingesehen und anschließend die Rohwerte (RW) in einer Excel-Tabelle ausgezählt (vgl. Brickenkamp et al. 2010: 32-33). Bei der Auswertung wird beachtet, dass die erste und die letzte Zeile des Testbogens aufgrund der Bearbeitungsbedingungen in Gruppenuntersuchungen 146 nicht ausgewertet werden dürfen (vgl. Bricken‐ 276 11 Auswertung der Ergebnisse Zeile das oft nicht gleichzeitige Beenden der Bearbeitung nach dem Stoppsignal durch die Testleitung. 147 Als Zielobjekt wird jedes „d“ mit zwei Strichen, das heißt jedes korrekt durchgestrichene Zeichen, gewertet. 148 Verwechslungsfehler lassen sich wiederum in drei Kategorien unterteilen: 1) d mit falscher Strichzahl, 2) p mit zwei Strichen, 3) p mit falscher Strichzahl. Dabei lässt sich erkennen, ob der Test regulär bearbeitet wurde, oder ob es sich bei dem Verhalten einzelner Probandinnen und Probanden um ein faking bad handelt, d. h. um ein absichtliches Durchstreichen inkorrekter Objekte. Bei einer regulären Bearbeitung liegt die Fehlerhäufigkeit für Typ 1 bei .6%, für Typ 2 bei .1% und für Typ 3 bei .0%. Bei faking bad liegt die Fehlerhäufigkeit von Typ 1 bei 10.3%, bei Typ 2 bei 9.5% und bei Typ 3 bei .03% (vgl. Brickenkamp et al. 2010: 23). 149 Zusätzlich ist es möglich den Konzentrationsverlauf, also die Konstanz bzw. Variabilität der Testleistung zu bestimmen, indem die Konzentrationsleistung in den vier identi‐ schen Testabschnitten analysiert wird. Jedoch erläutern Brickenkamp et al. (2010: 22), dass im Regelfall nur kleinere und somit unbedeutende Schwankungen festzustellen sind. Die Analyse der Unterschiede zwischen den einzelnen Ergebnissen wird also nur punktuell im Falle des Auftretens unnatürlich hoher Schwankungen empfohlen. kamp et al. 2010: 18). Außerdem erfolgt die Auswertung blockweise, d. h. die Er‐ gebnisse der vier identischen, jeweils aus drei Zeilen bestehenden Konglomerate werden in der Excel-Tabelle jeweils zusammengefasst, wobei der erste Block, wegen der besagten Auslassung der ersten Zeile beim Auswertungsverfahren, in der zweiten Zeile beginnt und entsprechend bis zur vierten Zeile reicht. Die Nummer des zuletzt markierten Feldes im Durchschreibbogen indiziert das Arbeitstempo des Probanden bzw. der Probandin in Form der Anzahl der bearbeiteten Zielobjekte (BZO) 147 . Für jeden bearbeiteten Block werden zusätzlich die Auslassungsfehler (AF), also die Anzahl ausgelassener Zielobjekte, die Verwechslungsfehler (VF) 148 , sprich die Anzahl markierter Distraktoren, sowie die Konzentrationsleistung (KL) in Form der Anzahl der entdeckten Zielobjekte abzüglich der Anzahl der Verwechslungsfehler ermittelt. Schließlich wird durch die Formel {(AF + VF} / BZO) * 100 = F% die Sorgfalt und Genauigkeit bei der Testbearbeitung (F%) ermittelt (vgl. Brickenkamp et al. 2010: 19). 149 Der nicht standardisierte Rohwert F% kann folgendermaßen interpretiert werden: Je niedriger der erreichte Kennwert liegt, desto besser ist die Leistung im Bereich Genauigkeit und Sorgfalt, was sich aus der bereits beschriebenen Ope‐ rationalisierungsweise für diesen Kennwert ergibt: Je weniger Auslassungs- und Verwechslungsfehler ein Proband bzw. eine Probandin macht, desto sorgfältiger und genauer ist seine bzw. ihre Arbeitsweise. Diese Logik ist auch aus dem umgekehrten Verhältnis zwischen Rohwerten und Standardwerten in Tabelle 22 ersichtlich, d. h. umso niedriger der Rohwert liegt, desto höher ist der Standardwert (vgl. Brickenkamp et al. 2010: 81). 11.3 Ergebnisse der kognitiven Tests 277 150 Insgesamt werden 12 fehlende Werte verzeichnet, die durch Krankheit einzelner Probandinnen und Probanden an den jeweiligen Testtagen bedingt sind. 151 Die Q-Q-Plots werden in der vorliegenden Fassung lediglich beschrieben, aber nicht abgedruckt. Um die Unterschiedshypothese testen zu können, wird der Datensatz der Gesamtstichprobe (n = 174, MV-=-12) 150 bezüglich der Kennwerte BZO, F% und KL zunächst auf Normalverteilung geprüft. Hierbei werden die jeweiligen Ver‐ teilungskurven für die Gesamtstichprobe untersucht, da alle Probandinnen und Probanden sowohl in der Französischals auch in der Spanischstichprobe den‐ selben Test abgelegt haben. Die Prüfung auf Normalverteilung erfolgt jeweils für die Verteilungen der Standardwerte (vgl. zur Übertragung der Rohwerte in Standardwerte Tabelle 22), da mit den Standardwerten im Anschluss bezüg‐ lich der Testung der Unterschiedshypothese weitergerechnet wird. Außerdem erfolgt sie sowohl analytisch über die Berechnung von Schiefe und Kurtosis (vgl. Tabelle 21), deren Standardfehler und Quotienten als auch graphisch über Q-Q-Plots (vgl. Lienert/ Raatz 1998: 147 ff.). Während Schiefe und Kurtosis bei der Konzentrationsleistung (KL) und bei der Anzahl der bearbeiteten Zielobjekte (BZO) relativ nahe bei 0 liegen, ist bei der Sorgfalt der Arbeitsweise (F%) mit einer Kurtosis von 16.650 eine stark gipflige und mit einer Schiefe von 1.120 eine leicht linkssteile Verteilung zu erkennen (vgl. Tabelle 21). Diese Ergebnisse spiegeln sich auch in den Q-Q-Plots wider, die bei der Konzentrationsleistung (KL) und bei der Anzahl der bearbeiteten Zielobjekte (BZO) eine annähernde Normalverteilung anzeigen, und bei der Sorgfalt der Arbeitsweise (F%) deutliche Ausreißer erkennen lassen. 151 - BZO (SW) KL (SW) F% (SW) n, MV n = 174, MV = 12 n = 174, MV = 12 n = 174, MV = 12 Schiefe .611 .426 1.119 Standardfehler der Schiefe .184 .184 .184 Quotient Schiefe/ Standard‐ fehler der Schiefe 3.321 2.315 6.082 278 11 Auswertung der Ergebnisse 152 Aufgrund der nicht signifikanten Ergebnisse des Kolmogorov-Smirnov-Tests wird trotz der signifikant von Null abweichenden Schiefe bei BZO und KL von einer annä‐ hernden Normalverteilung ausgegangen, auch weil aufgrund der Stichprobengröße der Kolmogorov-Smirnov-Test aussagekräftiger erscheint als die Berechnung durch den Quotienten (vgl. Brosius 2018). BZO (SW) KL (SW) F% (SW) Kurtosis .148 -.047 16.650 Standardfehler der Kurtosis .366 .366 .366 Quotient Schiefe/ Standard‐ fehler der Schiefe .404 -.128 45.492 Tabelle 21: Schiefe und Kurtosis der Verteilungen von BZO (SW), KL (SW) und F% (SW) des d2-R-Tests (Brickenkamp et al. 2010) Auch weitere statistische Tests zur Normalverteilung bestätigen dieses Er‐ gebnis: Es kann festgehalten werden, dass sowohl die Ergebnisse der Standard‐ werte der Konzentrationsleistung (KL) (p = .200) als auch die Anzahl der bearbeiteten Zielobjekte (BZO) (p = .077) nach dem Kolmogorov-Smirnov-Test normalverteilt sind. 152 Anders gestaltet es sich bei der Sorgfalt der Arbeitsweise (F%): Roh- und Standardwerte kommen sowohl beim Kolmogorov-Smirnov-Test als auch beim Shapiro-Wilk-Test auf ein höchst signifikantes Ergebnis (p = .000), wodurch die Verteilung nach keinem der möglichen Testverfahren als annä‐ hernd normalverteilt angesehen werden kann. Somit wird die Überprüfung der Unterschiedshypothese jeweils auf Basis der Standardwerte, im Falle von BZO und KL durch t-Tests und im Falle von F% durch den Mann-Whitney-U-Test vorgenommen. Die mittleren Rohwerte (RW) dienen dem Vergleich mit den Normwerten (NW). Die Standardwerte (SW) gehen hingegen stets von einem Normwert von 100 aus. Somit kann aus dem mittleren Standardwert genau abgelesen werden, in welchem Maß die Leistungen der untersuchten Merkmalsgruppen über oder unter dem Altersdurchschnitt liegen (vgl. Brickenkamp et al. 2010: 36). Für die vorliegenden Stichproben wird die Tabelle „Normen Altersgruppe 15-16“ verwendet (vgl. Brickenkamp et al. 2010: 81). Die Mittelwerte (M) der jeweiligen Merkmalsgruppen werden sowohl für die Rohwerte (RW) als auch für die zugewiesenen Standardwerte (SW) angegeben (vgl. Tabelle 22). Zunächst werden die von den Französisch- und Spanischlernenden erreichten Ergebnisse zu den Normwerten für die Altersgruppe 15-16 (vgl. Brickenkamp et al. 2010: 81) in Bezug gesetzt (vgl. Tabelle 22): Während die Französischs‐ 11.3 Ergebnisse der kognitiven Tests 279 153 Zur Ermittlung und Verbalisierung der im d2-R erreichten standardisierten Kennwerte vgl. Brickenkamp et al. (2010: 36-37): Beispielsweise sagt der Wert BZO (SW) = 115 aus, dass die Probandin bzw. der Proband für den Kennwert KL im Vergleich zu der für die Normierung des Tests herangezogenen Vergleichsgruppe, die sich in derselben Altersgruppe befindet, 1.5 Standardabweichungen über dem Durchschnitt liegt, was einer hohen Abweichung von der Norm und somit einem überdurchschnittlichen Ergebnis entspricht. tichprobe hinsichtlich des Arbeitstempos, gemessen am Kennwert BZO, mit einem Mittelwert (SW) von 100.01 genau in der Altersnorm liegt, bewegt sich die Spanischstichprobe mit dem BZO-Mittelwert (SW) von 105.59 .56 Standardabweichungen oberhalb der Vergleichsgruppe, aus der die Altersnorm abgeleitet wurde, und somit bereits knapp im überdurchschnittlichen Bereich (vgl. Brickenkamp et al. 2010: 36-37). 153 Dieser Unterschied zugunsten der Spa‐ nischlernenden ist so deutlich, dass er statistisch höchst signifikant ist (p = .000), wobei Cohens d mit -.591 einen mittleren Effekt indiziert. Ähnlich verhält es sich bei der Konzentrationsleistung (KL), bei der die Französischstichprobe mit .12 Standardabweichungen zur Vergleichsgruppe von Brickenkamp et al. (2010: 36-37) innerhalb der Altersnorm liegt. Die Spanischstichprobe erzielt mit .61 Standardabweichungen einen Wert, der deutlich über dem Durchschnitt der Vergleichsgruppe von Brickenkamp et al. (2010: 36-37) liegt, was einem Prozentrang (PR) von 73 entspricht und bedeutet, dass die Spanischstichprobe bessere Ergebnisse erreicht als 73% der Referenzgruppe (vgl. Brickenkamp et al. 2010: 81). Auch hier ist der Unterschied zwischen den beiden Merkmalsgruppen höchst signifikant (p = .000) und d indiziert mit -.575 erneut einen mittleren Effekt. Bezüglich der Sorgfalt der Arbeitsweise (F%) ergeben sich wiederum nach der Durchführung des Mann-Whitney-U-Tests keine signifikanten Unterschiede zwischen den beiden Fächergruppen: Die Gruppe der Französischlernenden und die Gruppe der Spanischlernenden liegen beide mit .26 respektive .20 Standardabweichungen zur Vergleichsgruppe innerhalb der Altersnorm, mit ganz leichter Tendenz zur überdurchschnittlichen Sorgfalt der Arbeitsweise (vgl. Tabelle 22). 280 11 Auswertung der Ergebnisse Französisch Spanisch n, MV - n = 83, MV = 9 n = 91, MV = 3 Kennwert RW: NW SW: NW RW: M (SD) SW: M (SD) M Rang (siehe Anm.) RW: M (SD) SW: M (SD) M Rang BZO - 160-162 100 159.57 (25.654) 100.01 (8.600) 177.74 (30.497) 105.59 (10.143) t-Test - - t (172) = -3.896, p = .000, d = -.591 KI 95% für d [-.897, -.285] KL 141-143 100 - 144.37 (25.962) 101.23 (8.182) 159.12 (27.969) 106.12 (8.801) t-Test - - t (172) = -3.787, p = .000 d = -.575 KI 95% für d [-.880, -.269] F% 10 100 9.34 (8.234) - 102.58 (9.402) 86.85 10.28 (10.575) 102.01 (15.154) 88.10 Mann- Whitney- U-Test - - U = 3722.000, Z = -.164 p = .869, d = .025 Anmerkungen. In diese Tabelle wurden sowohl die Rohwerte (RW) als auch die Standardwerte (SW) aufgenommen, da nur die Rohwerte (RW) aus den Tests ablesbar sind und für diese spezi‐ fischen Normwerte (NW) vorgegeben sind. Die Standardwerte (SW) wurden bei Brickenkamp et al. (2010) nachgeschlagen und entsprechend für das Ergebnis jedes Probanden bzw. jeder Probandin eingetragen. Die t-Tests und Mann-Whitney-U-Tests werden mit den Standardwerten (SW) berechnet. M Rang wird lediglich bei F% für die Standardwerte angegeben, da auf dessen Basis der Mann-Whitney-U-Test durchgeführt wurde. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 22: Ergebnisse aus dem Test d2-R, aufgeteilt nach den Merkmalsgruppen Fran‐ zösisch und Spanisch Tabelle 23 zeigt die von den unterschiedlichen Merkmalsgruppen (Französisch, Spanisch, Französisch weiblich, Französisch männlich, Spanisch weiblich, Spa‐ nisch männlich) erreichten Werte für BZO, F% und KL, für die jeweils die mittleren Rohwerte (RW) und die entsprechenden mittleren Standardwerte (SW) angegeben sind. 11.3 Ergebnisse der kognitiven Tests 281 Französisch weiblich Französisch männlich n, MV - n = 50, MV = 2 n = 33, MV = 7 Kennwert NW (RW) NW (SW) RW: M (SD) SW: M (SD) M Rang RW: M (SD) SW: M (SD) M Rang BZO - 160-162 100 161.56 (25.618) 100.82 (8.639) 156.55 (25.805) 98.79 (8.525) t-Test - - t (81) = 1.054, p = .295, d = .236 KI 95% für d [-.211, .684] KL 141-143 100 143.30 (25.168) 100.96 (7.822) 146.00 (27.436) 101.64 (8.806) t-Test - - t (81) = -.367, p = .715, d = -.082 KI 95% für d [-.529, 0.364] F% 10 100 10.96 (9.357) 101.18 (10.534) 36.72 6.88 (5.418) 104.67 (7.004) 50.00 Mann- Whitney- U-Test - - U = 561.000, Z = -2.461, p = .014, d = .560 - - Spanisch weiblich Spanisch männlich n, MV - n = 70, MV = 3 n = 21, MV = 0 Kennwert NW (RW) NW (SW) RW: M (SD) SW: M (SD) M Rang RW: M (SD) SW: M (SD) M Rang BZO - 160-162 100 179.96 (32.064) 106,33 (10.626) 170.33 (23.739) 103,14 (8.076) t-Test - - t (89) = 1.267, p = .209, d = .315 KI 95% für d [-.181, .821] KL 141-143 100 160.94 (28.560) 106.69 (9.050) 153.05 (25.608) 104.24 (7.822) t-Test - - t (89) = 1.119, p = .266, d = .278 KI 95% für d [-.218, .774] 282 11 Auswertung der Ergebnisse - Spanisch weiblich Spanisch männlich F% 10 100 10.85 (11.452) - 101.68 (6.757) 45.54 8.38 (6.767) 103.10 (7.801) 47.55 Mann- Whitney- U-Test - - U = 702.500, Z = -.307, p = .759, d = .064 Anmerkungen. In diese Tabelle wurden sowohl die Rohwerte (RW) als auch die Standardwerte (SW) aufgenommen, da nur die Rohwerte (RW) aus den Tests ablesbar sind und für diese spezifischen Normwerte (NW) vorgegeben sind. Die Standardwerte (SW) wurden bei Brickenkamp et al. (2010) nachgeschlagen und entsprechend für das Ergebnis jedes Probanden bzw. jeder Probandin eingetragen. Die t-Tests und Mann-Whitney-U-Tests werden mit den Standardwerten (SW) berechnet. M Rang wird lediglich bei F% für die Standardwerte angegeben, da auf dessen Basis der Mann-Whitney-U-Test durchgeführt wurde. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 23: Ergebnisse aus dem Test d2-R, aufgeteilt nach den Merkmalsgruppen Fran‐ zösisch weiblich, Französisch männlich, Spanisch weiblich, Spanisch männlich Ein Vergleich der Geschlechtergruppen innerhalb der Französischstichprobe zeigt, dass sowohl die Mädchen als auch die Jungen innerhalb der Norm des Arbeitstempos (BZO) liegen, wenngleich die Jungen mit einem mittleren Standardwert von 98.79 eine ganz leichte Tendenz zu unterdurchschnittlichem Arbeitstempo manifestieren. Hier kann kein signifikanter Unterschied zwischen den Geschlechtergruppen festgestellt werden, aber Cohens d indiziert mit .236 einen schwachen Effekt zugunsten der Mädchen. Im Bereich der Konzentrati‐ onsleistung (KL) liegen die weiblichen Französischlernerinnen mit einem mitt‐ leren Standardwert von 100.96 und die männlichen Französischlernenden mit 101.64 jeweils innerhalb der Norm mit minimalen Tendenzen nach oben, wobei ebenfalls kein signifikanter Unterschied zwischen den Geschlechtergruppen vorliegt. Allerdings ist die Sorgfalt der Arbeitsweise (F%) der Jungen der Französischstichprobe laut Testergebnis des d2-R mit einem mittleren Effekt signifikant besser (p = .014, d = .560) als diejenige der Mädchen und liegt .46 Standardabweichungen über dem Durchschnitt der Vergleichsgruppe von Brickenkamp et al. (2010: 36-37), was noch der Altersnorm entspricht, jedoch mit klarer Tendenz zum Überdurchschnittlichen (vgl. Tabelle 23). Zusätzlich wurde zum Ziel der Überprüfung einer möglichen hierarchischen Struktur der Daten eine einfaktorielle Varianzanalyse (ANOVA) durchgeführt. Es wurde also analysiert, ob zwischen den fünf Schulklassen Unterschiede bezüglich des Arbeitstempos (BZO) und der Konzentrationsleistung (KL) be‐ stehen. Bezüglich der Konzentrationsleistung (KL) sind die Unterschiede der 11.3 Ergebnisse der kognitiven Tests 283 fünf Schulklassen in Französisch nicht signifikant (p = .581). Das partielle Eta-Quadrat liegt bei .036 und das über Psychometrica (Lenhard/ Lenhard 2016) berechnete Cohens d bei .126. Demzufolge ist der Effekt des Unterschieds der Konzentrationsleistung zwischen den Klassen vernachlässigbar. Für das Arbeitstempo ergibt die einfaktorielle Varianzanalyse (ANOVA) ebenfalls kei‐ nerlei signifikante Unterschiede zwischen den fünf Klassen (p-=-.396, d-=-.136). Eine Kruskal-Wallis-Rangvarianzanalyse für die Sorgfalt der Arbeitsweise (F%), die aufgrund der nicht normalverteilten Daten eingesetzt wird, ergibt eben‐ falls keine signifikanten Unterschiede zwischen den fünf Französischklassen (p = .213, d = .310), wobei ein schwacher Effekt zu verzeichnen ist. Somit sind insgesamt zwischen den Französischklassen keinerlei nennenswerte Un‐ terschiede in der Konzentrationsleistung, im Arbeitstempo oder in der Sorgfalt der Arbeitsweise zu beobachten. In der Spanischstichprobe zeigt die statistische Prüfung auf Unterschiede zwischen Jungen und Mädchen weder im Arbeitstempo (BZO) noch in der Kon‐ zentrationsleistung (KL) oder bei der Sorgfalt der Arbeitsweise (F%) signifikante Geschlechterunterschiede. Allerdings liegen die Spanischschülerinnen mit einer Standardabweichung von .63 beim Arbeitstempo nach der Klassifizierung von Brickenkamp et al. (2010: 37) deutlich über der Norm, während es sich bei den männlichen Spanischlernenden mit einer Standardabweichung von .31 noch um eine durchschnittliche Abweichung von der Altersnorm mit Tendenz zum Überdurchschnittlichen handelt. Dies erweist sich mit einem Cohens d von .315 als schwacher Effekt. Ähnlich verhält es sich bei der Konzentrationsleistung (KL), bei der innerhalb der Spanischstichprobe die Mädchen .66 Standardabweichung und die Jungen .42 Standardabweichungen über dem Durchschnitt der Vergleichsgruppe von Brickenkamp et al. (2010: 36-37) liegen. Während schließlich die Jungen bei der Sorgfalt der Arbeitsweise (F%) mit .20 Standardabweichungen über dem Durchschnitt der Vergleichsgruppe innerhalb der Altersnorm mit einer leichten Tendenz nach oben liegen, befinden sich die Mädchen mit -.10 Standardabwei‐ chungen unter dem Durchschnitt der Vergleichsgruppe ebenfalls innerhalb die Norm, erzielen aber Ergebnisse mit einer ganz leichten Tendenz nach unten. Auch bei F% ist kein signifikanter Geschlechterunterschied innerhalb der Spanischstichprobe zu verzeichnen (vgl. Tabelle 23). Einfaktorielle Varianzanalysen (ANOVAs) ergeben sowohl für die Konzent‐ rationsleistung (KL) (p = .649, d = .112) als auch für das Arbeitstempo (BZO) (p = .382 d = .128) keine statistisch signifikanten Unterschiede zwischen den Spanischklassen. Die Kruskal-Wallis-Rangvarianzanalyse für die Sorgfalt der 284 11 Auswertung der Ergebnisse 154 Da alle Probandinnen und Probanden, auch diejenigen, die mehrsprachig aufwachsen, Deutsch als Erstsprache (L1) haben, keine hörgeschädigten Lernenden unter den Probandinnen und Probanden sind und die Testung ausschließlich im Klassenverband möglich war, musste in keinem der Fälle eine nonverbale Instruktion durchgeführt werden (vgl. Heller et al. 2010: 29-30). Arbeitsweise (F%) kommt ebenfalls zu keinen signifikanten Unterschieden zwischen den Spanischklassen (p-=-.471, d-=-.146). Abschließend lässt sich festhalten, dass alle Normwerte von den weiblichen und männlichen Französischlernenden sowie von den weiblichen und männli‐ chen Spanischlernenden im Durchschnitt fast immer erreicht und oft sogar deutlich übertroffen werden; leichte Tendenzen nach unten treten lediglich bei den erreichten Kennwerten von BZO der männlichen Französischlernenden und von F% bei den weiblichen Spanischlernerinnen auf. In der Französischstich‐ probe treten Geschlechterunterschiede zugunsten der Jungen bei der Sorgfalt der Arbeitsweise (F%) auf, was bei der Interpretation der Ergebnisse der Fran‐ zösischtests eventuell berücksichtigt werden muss (vgl. Kapitel 11.8.1, 12.1). In der Spanischstichprobe treten hingegen keinerlei Geschlechterunterschiede auf. Schließlich können die signifikant höheren Werte der Spanischlernenden im Vergleich zu den Französischlernenden im Bereich des Arbeitstempos und der Konzentration später eventuell ebenfalls beim Vergleich der fremdsprachlichen Leistungen der beiden Gruppen als Erklärungsansatz dienen. 11.3.2 Ergebnisse des SPM-Tests Der SPM-Test von Raven (2009) wurde in allen Klassen als Gruppentest durch‐ geführt. Für die Durchführung wurden die Beschreibung der Testsituation sowie eine leichte Anpassung der sprachlichen Instruktion von Heller et al. (2010: 28-29) verwendet. 154 Die Testauswertung erfolgt zunächst durch das Übertragen der angegebenen Lösungsziffern in eine Excel-Tabelle, die zuvor mithilfe der Funktion „WENN“ so programmiert wurde, dass nur die richtigen Lösungen jeweils als ein Punkt gezählt und die inkorrekten Lösungen automatisch mit null Punkten versehen werden (vgl. Heller et al. 2010: 30). Die letztendliche Stichprobengröße beträgt insgesamt n-=-181 (MV = 5). Zuerst werden die Ergebnisse auf Normalverteilung geprüft. Aufgrund des großen Anwendungsbereichs bezüglich der Altersgruppen ist allerdings davon auszugehen, dass Abweichungen von der Normalverteilung bei den Ergebnissen des SPM-Tests die Regel darstellen: 11.3 Ergebnisse der kognitiven Tests 285 In unserer Stichprobe finden wir in keiner der Altersgruppen eine bimodale Ver‐ teilung, vielmehr zeigt sich bereits bei den Siebenjährigen eine leicht linksschiefe eingipflige Verteilung, die noch der Normalverteilung entspricht; ab einem Alter von acht Jahren erreicht die Linksschiefe der Verteilung Signifikanz. (Heller et al. 2010: 12) Dies bestätigt sich auch bei der graphischen und analytischen Prüfung auf Normalverteilung (vgl. Lienert/ Raatz 1998: 147 ff.): Die Kurtosis von 13.043 (Standardfehler der Kurtosis .359) zeigt eine stark gipflige und die Schiefe von -2.503 (Standardfehler der Schiefe .181) eine relativ starke rechtssteile Verteilung an (vgl. Tabelle 24). Dies wird im Q-Q-Plot auch graphisch deutlich ersichtlich. - Schlussfolgerndes Denken n, MV n-=-181, MV = 5 Schiefe -2.503 Standardfehler der Schiefe .181 Quotient Schiefe/ Standardfehler der Schiefe -13.829 Kurtosis 13.043 Standardfehler der Kurtosis .359 Quotient Schiefe/ Standardfehler der Schiefe 36.331 Tabelle 24: Schiefe und Kurtosis der Verteilung der Ergebnisse im schlussfolgernden Denken, erhoben durch den SPM-Test (Raven 2009) Da bei den Ergebnissen des SPM-Tests keine Normalverteilung vorliegt, wird zur Überprüfung der Unterschiedshypothese jeweils der Mann-Whitney-U-Test eingesetzt. Da die Ergebnisse auch mit der schulspezifischen Klassenstufennorm verglichen werden, welche in Form von Mittelwerten vorliegen (vgl. Heller et al. 2010: 53), werden in Tabelle 25 sowohl Mittelwerte als auch mittlere Ränge dokumentiert. 286 11 Auswertung der Ergebnisse Franzö‐ sisch Spa‐ nisch Franzö‐ sisch weib‐ lich Franzö‐ sisch männ‐ lich Spa‐ nisch weib‐ lich Spa‐ nisch männ‐ lich n, MV - n = 89, MV = 3 n = 92, MV = 2 n = 52, MV = 0 n = 37, MV = 3 n = 71, MV = 2 n = 21, MV = 0 Kenn‐ wert NW M (SD) M Rang M (SD) M Rang M (SD) M Rang M (SD) M Rang M (SD) M Rang M (SD) M Rang SPM 53.03 48.79 (6.593) 87.17 49.62 (5.237) 94.71 48.27 (7.829) 44.42 49.51 (4.299) 45.81 49.31 (5.502) 44.49 50.67 (4.163) 53.29 Mann- Whitney- U-Test - U = 3753.000, Z = -.970 p = .722, d = .144 U = 932.000, Z = -.250 p = .802, d = .053 U = 603.000, Z = -1,330 p = .183, d = .279 Anmerkungen. Der angegebene Normwert (NW) bezieht sich auf die 9.-Jahrgangsstufe des Gymnasiums (vgl. Heller et al. 2010: 53). Die schulartunspezifische Altersnorm für 14-Jährige liegt unabhängig von der Schulart bei M = 48.85 und für 15-Jährige bei M = 50.07 (vgl. Heller et al. 2010: 51). Werte von p < .05 werden als signifikant definiert. Tabelle 25: Ergebnisse des SPM-Tests, aufgeteilt nach den Merkmalsgruppen Französisch, Spanisch, Französisch weiblich, Französisch männlich, Spanisch weiblich und Spanisch männlich Bei einem Vergleich der erzielten Leistungen mit den Normwerten von Heller et al. (2010: 53) wird deutlich, dass alle Merkmalsgruppen im Durchschnitt leicht unter dem gymnasialspezifischen Normwert für die 9. Jahrgangsstufe liegen, wobei die männlichen Spanischlernenden mit einem Mittelwert von 50.67 am nächsten an diesen Normwert kommen. Einzig die weiblichen Französischler‐ nerinnen bleiben unter dem schulartunspezifischen Normwert für 14-Jährige. Die Durchführung des Mann-Whitney-U-Tests ergibt keinen signifikanten Unterschied zwischen den Ergebnissen der Französisch- und der Spanischstich‐ probe. Zwischen den männlichen und den weiblichen Französischlernenden sowie zwischen den männlichen und den weiblichen Spanischlernenden können ebenfalls keine statistisch signifikanten Unterschiede festgestellt werden. Die Effektstärken zeigen lediglich bei der Testung des Unterschieds zwischen männ‐ lichen und weiblichen Spanischlernenden einen schwachen und ansonsten einen vernachlässigbaren Effekt (vgl. Tabelle 25). Auch ein zusätzlich durchge‐ führter Kruskal-Wallis-Test ergibt keinerlei weitere signifikante Unterschiede (z. B. zwischen den männlichen Spanischlernenden und den weiblichen Fran‐ zösischlernerinnen) zwischen den vier Subgruppen (p = .460). Neben der 11.3 Ergebnisse der kognitiven Tests 287 statistischen Überprüfung der Signifikanz der Unterschiede weisen Heller et al. (2010: 30, 53) auch explizit kritische Rohwert-Differenzen aus, an denen sie Unterschiede festmachen. Die kritische Rohwertdifferenz liegt für den gymnasialspezifischen Normwert für die 9. Jahrgangsstufe von 53.03 bei 4.86 (vgl. Heller et al. 2010: 53). Diese kritische Rohwert-Differenz besteht ebenfalls zwischen keiner der untersuchten Merkmalsgruppen. Somit lassen sich im Erfassungsgegenstand des SPM-Tests der allgemeinen Intelligenz (g-Faktor) nach Spearman (1923, 1927, 1938), deren Grundkomponente die Geschwin‐ digkeit der Informationsverarbeitung ist, die aber auch induktives Denken, räumliche Wahrnehmungsdifferenzierung, räumliches Vorstellen und Denken (space factors), Unterscheidungsgenauigkeit (accuracy of discrimination), Ana‐ logieschlussdenken, Regelerkennen und Prinzipienanwendung verlangt (vgl. Heller et al. 2010: 7), keinerlei signifikante Unterschiede zwischen den ge‐ nannten Merkmalsgruppen feststellen. Schließlich kommt eine Überprüfung der Unterschiede zwischen den einzelnen Schulklassen in Französisch mittels Kuskal-Wallis-Tests zu einem schwachen, nicht signifikanten Effekt bei der allgemeinen Intelligenz (p = .100, d = .435). In Spanisch treten hingegen keinerlei statistisch relevante Unterschiede zwischen den einzelnen Klassen auf (p = .473, d = .147). 11.3.3 Zwischenfazit: Ergebnissen der kognitiven Tests Zwischen den Ergebnissen der Französisch- und der Spanischstichprobe gibt es bezüglich der allgemeinen Intelligenz nach Spearman (1923, 1927, 1938), welche mittels des SPM-Tests von Raven (2009) gemessen wurde, keine statistisch relevanten Unterschiede. Beide Stichproben liegen jedoch leicht unterhalb der Altersnorm (vgl. Tabelle 25). Auch bei der Sorgfalt der Arbeitsweise (F%), welche mittels des d2-R-Tests von Brickenkamp et al. (2010) erhoben wurde, treten keinerlei statistisch relevante Unterschiede zwischen der Französisch- und der Spanischstichprobe auf. Jedoch erzielen die Spanischlernenden sowohl beim Arbeitstempo (BZO) als auch bei der Konzentrationsleistung (KL) im d2-R-Test signifikant höhere Ergebnisse als die Französischlernenden (vgl. Tabelle 22). Untersucht man die Ergebnisse zu den kognitiven Grundfertigkeiten auf Ge‐ schlechterunterschiede, so tritt das einzige signifikante Ergebnis bei der Sorgfalt der Arbeitsweise (F%) auf, in der die männlichen Französischlernenden signi‐ fikant höhere Ergebnisse erzielen als die weiblichen Französischlernerinnen, wobei ein mittlerer Effekt zu verzeichnen ist (vgl. Tabelle 23). Alle anderen sta‐ tistischen Testverfahren ergeben keinerlei signifikante Unterschiede zwischen den weiblichen und den männlichen Lernenden. Jedoch kann innerhalb der 288 11 Auswertung der Ergebnisse Französischstichprobe ein schwacher Effekt zugunsten der Mädchen beim Arbeitstempo (BZO) verzeichnet werden. Auch die weiblichen Spanischlerne‐ rinnen erzielen beim Arbeitstempo und bei der Konzentrationsleistung (KL) tendenziell etwas höhere Werte bei jeweils schwachen Effektstärken (vgl. Ta‐ belle 23). Folglich zeigen die Geschlechtergruppen in der Französischstichprobe, mit Ausnahme der Sorgfalt der Arbeitsweise, sehr ausgeglichene Ergebnisse, was eine gute Voraussetzung für die Erforschung möglicher Ursachen von möglichen Geschlechterunterschieden in den fremdsprachlichen Leistungen darstellt. Als positive Voraussetzung für die weiteren Tests hervorzuheben ist au‐ ßerdem die Tatsache, dass weder zwischen den fünf Französischklassen noch zwischen den fünf Spanischklassen statistisch relevante Unterschiede im Ar‐ beitstempo, in der Konzentrationsleistung oder in der Sorgfalt der Arbeitsweise gefunden wurden. Zwischen den Spanischklassen gibt es außerdem keinerlei statistisch relevante Unterschiede bezüglich der allgemeinen Intelligenz. Hin‐ gegen weisen die Französischklassen zwar keinen signifikanten Unterschied in der allgemeinen Intelligenz, allerdings einen schwachen Effekt auf. Zusammenfassend kann also von relativ ausgeglichenen Ergebnissen sowohl zwischen den Geschlechtergruppen (mit Ausnahme der Sorgfalt der Arbeits‐ weise in der Französischstichprobe) als auch zwischen den jeweiligen Klassen ausgegangen werden, wohingegen insbesondere die hochsignifikanten Unter‐ schiede zwischen der Französischstichprobe und der Spanischstichprobe beim Arbeitstempo und bei der Konzentrationsleistung bei der weiteren Datenaus‐ wertung im Blick behalten werden müssen. 11.4 Ergebnisse der Sprachtests Auf Grundlage der gemeinsamen Skalen der Sprachtests ist es möglich, die Testergebnisse über die Klassen hinweg miteinander zu vergleichen (vgl. Kon‐ sortium HarmoS Fremdsprachen 2009: 39). Auch bezüglich der beiden Fremd‐ sprachen Französisch und Spanisch können erste Vergleiche angestellt werden, auch wenn diesbezüglich aufgrund der Unterschiedlichkeit der fremdsprachli‐ chen, affektiv-motivationalen und exogenen Konstrukte keinerlei statistische Verfahren angewendet werden können. Im Anschluss werden die Auswer‐ tungsverfahren der einzelnen Subtests zum Hörverstehen, Leseverstehen und Schreiben genauer dargelegt, bevor die Ergebnisse insbesondere hinsichtlich der Variable Geschlecht ausgewertet werden, wobei für die jeweiligen Teilaufgaben 11.4 Ergebnisse der Sprachtests 289 155 Bei dem Abspielgerät handelt es sich um das Modell Philips MP3/ WMA - CD Playback AZ783/ 12. und die Gesamtergebnisse statistisch geprüft wird, inwiefern Gemeinsamkeiten und Unterschiede bezüglich der Leistungen der Mädchen und Jungen vorliegen. 11.4.1 Auswertung und Ergebnisse der Hörverstehenstests Der Hörverstehenstest besteht, wie in Kapitel 9.2.1 erläutert, aus fünf Teilen: Die erste Teilaufgabe „Autorennsport“ (HV-38) beinhaltet einen Bericht über ein Autorennen in Form einer Radionachricht, wodurch es sich um einen informierenden Text handelt. Hier wird selektives Hörverstehen geprüft und das Aufgabenformat richtig/ falsch verwendet. Die zweite Teilaufgabe „Nachrichten aus der Welt des Films, der Musik und des Sports“ (HV-29) beinhaltet fünf Kurzberichte innerhalb der Radionachrichten, die ebenfalls eine informierende und berichtende Sprachfunktion erfüllen. Wie die erste Teilaufgabe prüft diese Aufgabe das selektive Hörverstehen und verwendet als Aufgabenformat richtig/ falsch. Die dritte Teilaufgabe „Eine Radiosendung zu Liebesgeschichten“ (HV-39) enthält zwei narrative Interviews innerhalb einer Radiosendung, die insbesondere die erzählende Sprachfunktion beinhalten. Hier wird das Detailverstehen im richtig/ falsch-Antwortformat abgeprüft. Bei der vierten Teilaufgabe „Erfahrungen mit Handys“ (HV-17) handelt es sich um ein informelles Gespräch, das informierende, beschreibende und gleichzeitig beziehungserhaltende Sprachfunktionen erfüllt und das Detailverstehen mittels richtig/ falsch-Antworten abprüft. Schließlich werden in der fünften Teilauf‐ gabe „Werbespots am Radio“ (HV-27) vier Radiowerbespots präsentiert, die auffordernde, informierende und beschreibende Sprachfunktionen erfüllen, teils selektives, teils detailliertes Hörverstehen abprüfen und als Antwortformat gelenkte Kurzantworten in Form von Lücken, die vervollständigt werden sollen, vorgeben (vgl. Anhang 2.1.3). Die Durchführung des Hörverstehenstests erfolgte als Gruppentest immer genau nach Testleiterskript (vgl. Anhang 1.2). Die Schülerinnen und Schüler wurden so im Raum verteilt und wenn nötig durch Trennwände voneinander abgegrenzt, dass ein Abschreiben nicht möglich war. Die Testleiterin hatte stets ihr eigenes Abspielgerät 155 dabei und sorgte dafür, dass keine Hintergrundge‐ räusche zu hören waren (vgl. Kapitel 10). Die Auswertung und Interpretation erfolgen nach den Richtlinien von lingu‐ alevel (Lenz/ Studer 2008d): Zunächst werden für die ersten vier Teilaufgaben (HV-38, HV-29, HV-39, HV-17) für jedes Item und jeden Lernenden 0 für 290 11 Auswertung der Ergebnisse eine falsche Antwort und 1 für eine richtige Antwort in eine Excel-Tabelle eingetragen. Bei der fünften Teilaufgabe (HV-27) wird für die Items 1, 7, 8, 9 und 10 pro richtige Antwort ein Punkt vergeben. Bei den Items 2 bis 6 sowie 11 wird ein Punkt vergeben, wenn die gesamte Antwort richtig ist und .5 Punkte werden berechnet, wenn eine Teilantwort richtig ist. Bei den Beträgen für die Währung gilt, dass 1 Punkt für den Betrag und die richtige Währung und ein halber Punkt für entweder die richtige Währung oder den richtigen Betrag vergeben wird (vgl. Lenz/ Studer 2008d). Die jeweiligen Ergebnisse für die fünf Teilaufgaben und die Gesamtpunktzahl werden anschließend mithilfe der Summenfunktion von Excel errechnet und in die Gesamttabelle in IBM SPSS 26 übertragen. Fehlende Werte werden dabei stets mit -999 gekennzeichnet und in der SPSS-Ge‐ samttabelle nach der Übertragung erneut überprüft. Die Messbereiche für jede Teilaufgabe sind durch lingualevel klar vorgegeben (vgl. Lenz/ Studer 2008d; Anhang 2.1.5). Durch das von lingualevel vorgegebene Punktesystem ist sowohl beim Hörverstehenstest als auch später beim Leseverstehenstest eine sehr hohe Bewerterkonsistenz gegeben. - 11.4.1.1 Ergebnisse der Hörverstehenstests in Französisch Die Ergebnisse des Hörverstehenstests in Französisch liegen für n-=-85 Schüle‐ rinnen und Schüler vor (n (w) = 51, n (m) = 34) und in sieben Fällen müssen fehlende Werte verzeichnet werden. In der gesamten Stichprobe werden fol‐ gende Ergebnisse erzielt: Bei der ersten Teilaufgabe HV-38 liegt der Mittelwert der Gesamtstichprobe bei 2.84 (SD = 1.056) und somit nicht innerhalb des Messbereichs. In der zweiten Teilaufgabe HV-29 liegt der Mittelwert bei 6.45 (SD = 1.658) und somit ebenfalls unterhalb des Messbereichs, jedoch beinahe auf Niveau A2.1. In der dritten Teilaufgabe HV-39 liegt der Mittelwert der erreichten Punktzahl bei 4.55 (SD = 1.029) und folglich innerhalb von Niveau A2.1; in der vierten Teilaufgabe erreichen die Schülerinnen und Schüler des Französischen einen Mittelwert von 4.74 (SD = 1.264) und liegen dadurch knapp unter Niveau A2.1. In der fünften Teilaufgabe liegen die Probandinnen und Probanden mit einem Mittelwert von 4.56 (SD = 2.324) schließlich auf einem Niveau relativ deutlich unter A2.2. Insgesamt erzielen die Schülerinnen und Schüler der Fran‐ zösischstichprobe einen Mittelwert von 23.37 Punkten (SD = 4.5075) und damit ein Niveau unter A2.1 (vgl. Auswertungstabelle in Anhang 2.1.5, Lenz/ Studer 2008d). Da dieses Ergebnis schwächer ausfällt als erwartet, wird im Rahmen der Interpretation der Studienergebnisse auf mögliche Ursachen eingegangen werden (vgl. Kapitel 12). Um die Forschungsfragen beantworten zu können, ob Geschlechterunter‐ schiede beim Hörverstehen im Französischen zu beobachten sind, inwiefern 11.4 Ergebnisse der Sprachtests 291 diese signifikant sind und wie groß die jeweiligen zu beobachtenden Effekte sind, müssen die Verteilungskurven zunächst auf Normalverteilung geprüft werden. Die Prüfung der Datenstruktur bezüglich Kurtosis und Schiefe (vgl. Tabelle 26) ergibt für die fünf Variablen des Hörverstehenstests in Französisch lediglich eine leichte bis moderate univariate Abweichung von der Normalver‐ teilung (Schiefe-Index-Spannweite: -1.219 bis .372; Kurtosis-Index-Spannweite: -.658 bis 3.505, vgl. Tabelle 26), welche eindeutig unter den in der Literatur genannten Grenzwerten liegt (Schiefe < 2 bzw. 3, Kurtosis < 7 bzw. 10, vgl. Curran et al. 1996: 26, Kline 2016: 76-77) und überwiegend nicht signifikant von Null abweichen (vgl. Lienert/ Raatz 1998: 147 ff., vgl. Quotienten in Tabelle 26). Ausschließlich bei der dritten Teilaufgabe (HV-39) weichen Schiefe und Kurtosis jeweils signifikant von Null ab, sodass hier nicht von einer annähernden Normalverteilung ausgegangen werden kann. - 1. (HV-38) 2. (HV-29) 3. (HV-39) 4. (HV-17) - 5. (HV-27) Gesamtpunkt‐ zahl n, MV n = 85, MV = 7 n = 85, MV = 7 n = 85, MV = 7 n = 85, MV = 7 n = 85, MV = 7 n = 85, MV = 7 Schiefe -.159 -.105 -1.219 -.219 .372 .015 Standardfehler der Schiefe .261 .261 .261 .261 .261 .261 Quotient Schiefe/ Standardfehler -.609 -.402 -4.671 -.839 1.425 .057 Kurtosis -.658 -.530 3.505 -.229 -.643 .261 Standardfehler der Kurtosis .517 .517 .517 .517 .517 .517 Quotient Kur‐ tosis/ Standardfehler -1.273 -1.025 6.779 -.443 -1.244 .505 Anmerkungen: Die Signifikanz der Abweichung der Schiefe- und Kurtosiswerte von Null wird ermittelt, indem der jeweilige Schiefebzw. Kurtosiswert durch seinen Standardfehler geteilt wird. Ist dieses Ergebnis kleiner als -1.96 bzw. größer als 1.96 liegt bei einem Signifikanzniveau von 5% eine signifikante Schiefe bzw. eine signifikante Kurtosis vor und somit kann keine annähernde Normalverteilung mehr angenommen werden (vgl. Hair et al. 1998, 2014: 95). Tabelle 26: Schiefe und Kurtosis der Verteilungskurven der erreichten Punktzahlen im Hörverstehenstest in Französisch, unterteilt in die jeweiligen Teilaufgaben und die Gesamtpunktzahl 292 11 Auswertung der Ergebnisse Aufgrund der nicht parametrischen Verteilung wird für die Ergebnisse von Teil‐ aufgabe 3 „Liebesgeschichten“ ein Mann-Whitney-U-Test eingesetzt, während bei den anderen Teilaufgaben t-Tests verwendet werden (vgl. Tabelle 27): - Französisch weiblich - Französisch männlich - n, MV n = 51, MV = 1 n = 34, MV = 6 1. Autorennsport (HV-38) (Höchstpunktzahl 5) M = 2.80 (SD = 1.059, SEM = .148) Mdn = 3.00 M Rang = 42.25 M = 2.88 (SD = 1.066, SEM = .183) Mdn = 3.00 M Rang = 44.13 t-Test t (83) = -.334, p = .739, d = -.074 KI 95% für d [-.514, .367] 2. Nachrichten (HV-29) (Höchstpunktzahl 10) M = 6.41 (SD = 1.675, SEM = .235) Mdn = 6.00 M Rang = 42.08 M = 6.50 (SD = 1.656, SEM = .284) Mdn = 7.00 M Rang = 44.38 t-Test t (83) = -.239 p-= .812, d = -.053 KI 95% für d [-.493, .388] 3. Liebesgeschichten (HV-39) (Höchstpunktzahl 6) M = 4.57 (SD = 1.136, SEM = .159) Mdn = 5.00 M Rang = 44.39 M = 4.53 (SD =.861, SEM = .148) Mdn = 5.00 M Rang = 40.91 Mann-Whitney-U-Test U = 796.000, Z = -.677 p = .498, d = .138 4. Handy (HV-17) (Höchstpunktzahl 8) M = 4.88 (SD = 1.160, SEM = .162) Mdn = 5.00 M Rang = 45.53 M = 4.53 (SD = 1.398, SEM = .240) Mdn = 4.50 M Rang = 39.22 t-Test t (83) = 1.265, p = .209, d = .280 KI 95% für d [-.161, .716] 5. Werbung (HV-27) (Höchstpunktzahl 11) M = 4.97 (SD = 2.275, SEM = .319) Mdn = 4.50 M Rang = 45.16 M = 4.44 (SD = 2.401, SEM = .411) Mdn = 4.00 M Rang = 39.76 t-Test t (83) = 1.029, p = .306, d = .228 KI 95% für d [-.212, .663] 11.4 Ergebnisse der Sprachtests 293 156 Der Vorteil der Berechnung der Effektstärke (Cohens d) liegt darin, dass die erzielten Ergebnisse mit anderen Studien vergleichen werden können, die dieses Maß ebenfalls angeben, unabhängig von der Stichprobengröße, den Standardabweichungen und den Mittelwertsdifferenzen (vgl. Böhme et al. 2016: 382). Da die Signifikanz stark von der Stichprobengröße abhängt, ist die Effektstärke in vielerlei Hinsicht aussagekräftiger. Französisch weiblich - Französisch männlich - Gesamtpunktzahl Hörverstehen (Höchstpunktzahl 40) M = 23.69 (SD = 4.494, SEM = .629) Mdn = 23.50 M Rang = 44.47 M = 22.88 (SD = 4.551, SEM = .781) Mdn = 22.50 M Rang = 40.65 t-Test t (83) = .804, p = .424, d = .178 KI 95% für d [-.263, .619] Anmerkungen. Werte von p < .05 werden als signifikant definiert. Tabelle 27: Ergebnisse im Hörverstehenstest Französisch, aufgeteilt nach Teilaufgaben und Geschlecht Die Hörverstehensleistungen der beiden Geschlechtergruppen liegen bei allen Teilaufgaben sehr nahe beieinander. Die statistischen Prüfungen auf Geschlech‐ terunterschiede (vgl. Tabelle 27) zeigen, dass weder in den einzelnen Teilauf‐ gaben noch im Gesamtergebnis des Hörverstehenstests signifikante Geschlech‐ terunterschiede vorliegen. Die Effektstärken sind vernachlässigbar, außer bei Teilaufgabe 4 (HV-17), bei der ein Cohens d von .280 gemessen wird, und bei Teilaufgabe 5 (HV-27), bei der Cohens d .228 beträgt. In diesen beiden Fällen wird demnach ein schwacher Effekt zugunsten der Mädchen ersichtlich (vgl. Sedl‐ meier/ Renkewitz 2013: 293). 156 Insgesamt finden sich jedoch keine statistisch relevanten Geschlechterunterschiede im Gesamtergebnis des Hörverstehenstets in Französisch (p = .424, d = .178; vgl. Tabelle 27). Bei der Gesamtpunktzahl kommen die Jungen (SD-= 4.551) und die Mädchen (SD-=-4.494) zudem auf eine sehr ähnliche Standardabweichung (vgl. Tabelle 27) und auf eine ähnlich große Streuung, wobei die Leistungsspitzen in der Gruppe der Mädchen zu finden sind (vgl. ). 294 11 Auswertung der Ergebnisse Abb. 4: Boxplots zur Verteilung der Punktzahlen im gesamten Hörverstehenstest Fran‐ zösisch, aufgeteilt nach Geschlecht - 11.4.1.2 Ergebnisse des Hörverstehenstests in Spanisch Die Ergebnisse des Hörverstehenstests in Spanisch werden zunächst wieder auf Normalverteilung geprüft (vgl. Lienert/ Raatz 1998: 147 ff.). Aufgrund signi‐ fikanter Abweichungen der Schiefe- und Kurtosiswerte von Null sind die Ergeb‐ nisse aus der ersten, zweiten und dritten Teilaufgabe sowie das Gesamtergebnis nicht normalverteilt. Lediglich bei den Ergebnissen der vierten und fünften Teilaufgabe liegen annähernde Normalverteilungen vor (vgl. Tabelle 28). 11.4 Ergebnisse der Sprachtests 295 1. (HV-38) 2. (HV-29) 3. (HV-39) 4. (HV-17) - 5. (HV-27) Gesamtpunkt‐ zahl n, MV n = 94 n = 94 n = 94 n = 94 n = 94 n = 94 Schiefe -1.157 -.547 -.903 -.384 -.188 -.582 Standardfehler der Schiefe .249 .249 .249 .249 .249 .249 Quotient Schiefe/ Standardfehler -4.650 -2.199 -3.632 -1.544 -.756 -2.340 Kurtosis 2.011 .333 .207 .131 -.447 .832 Standardfehler der Kurtosis .493 .493 .493 .493 .493 .493 Quotient Kur‐ tosis/ Standardfehler .082 .675 .421 .267 -.907 1.690 Tabelle 28: Schiefe und Kurtosis der Verteilungskurven der Punktezahlen im Hörverste‐ henstest in Spanisch, unterteilt in die jeweiligen Teilaufgaben und die Gesamtpunktzahl Bei der statistischen Prüfung möglicher Geschlechterunterschiede in der Hör‐ verstehensleistung in Spanisch ergeben sich folgende Ergebnisse (vgl. Tabelle 29): - Spanisch weiblich - Spanisch männlich - n, MV n = 73, MV = 0 n = 21, MV = 0 1. Autorennsport (HV-38) (Höchstpunktzahl 5) M = 3.42 (SD = .956, SEM = .112) Mdn = 4.00 M Rang = 46.01 M = 3.67 (SD = 1.111, SEM = .242) Mdn = 4.00 M Rang = 52.67 Mann-Whitney-U-Test U = 658.000, Z = -1.069 p = .285, d = .204 2. Nachrichten (HV-29) (Höchstpunktzahl 10) M = 6.04 (SD = 2.163, SEM = .253) Mdn = 6.00 M Rang = 46.60 M = 6.38 (SD = 1.910, SEM = .417) Mdn = 7.00 M Rang = 50.64 Mann-Whitney-U-Test U = 700.500, Z = -.606 p = .544, d = .124 296 11 Auswertung der Ergebnisse Spanisch weiblich - Spanisch männlich - 3. Liebesgeschichten (HV-39) (Höchstpunktzahl 6) M = 5.15 (SD = .861, SEM = .101) Mdn = 5.00 M Rang = 46.13 M = 5.33 (SD =.856, SEM = .187) Mdn = 6.00 M Rang = 52.26 Mann-Whitney-U-Test U = 666.500, Z = -.979 p = .328, d = .188 4. Handy (HV-17) (Höchstpunktzahl 8) M = 4.55 (SD = 1.434, SEM = .168) Mdn = 5.00 M Rang = 46.47 M = 4.81 (SD = 1.470, SEM = .321) Mdn = 5.00 M Rang = 51.07 t-Test t (92) = -.733, p = .466, d = -.182 KI 95% für d [-.674, .311] 5. Werbung (HV-27) (Höchstpunktzahl 11) M = 6.11 (SD = 2.052, SEM = .240) Mdn = 6.00 M Rang = 45.08 M = 6.91 (SD = 1.455, SEM = .317) Mdn = 7.50 M Rang = 55.93 t-Test t (92) = -1.657, p = .101, d = .410 KI 95% für d [-.906, .085] Gesamtpunktzahl Hörverstehen (Höchstpunktzahl 40) M = 25.28 (SD = 5.140, SEM = .602) Mdn = 25.50 M Rang = 45.35 M = 27.10 (SD = 4.167, SEM = .602) Mdn = 26.50 M Rang = 54.98 Mann-Whitney-U-Test U = 609.500, Z = -1.426 p = .154, d = .298 Anmerkungen. Werte von p < .05 werden als signifikant definiert. Tabelle 29: Ergebnisse im Hörverstehenstest Spanisch, aufgeteilt nach Teilaufgaben und Geschlecht Im Hörverstehenstest in Spanisch (n (w) = 73, n (m) = 21) kommt es weder in den einzelnen Teilaufgaben noch in der Gesamtleistung zu signifikanten Geschlechterunterschieden. Jedoch treten in der ersten (Autorennsport, HV-38; p = .285, d = .204, vgl. Tabelle 29) und in der fünften Teilaufgabe (Werbung, HV-27; p = .101, d = .410, vgl. Tabelle 29) schwache Effekte zugunsten der Jungen auf, während bei allen anderen Teilaufgaben vernachlässigbare Effekte vorliegen. Die Tendenz der höheren Leistungen der Jungen, die in jeder der Teilauf‐ gaben - und daher auch unabhängig von traditionellen „Jungenbzw. Mädchen‐ 11.4 Ergebnisse der Sprachtests 297 themen“ (vgl. 1. Autorennsport und 3. Liebesgeschichten) - ersichtlich wird, zeigt sich auch im Geschlechtervergleich der erreichten Gesamtpunktzahlen: Während die Jungen mit einem Mittelwert von 27.10 laut Lenz und Studer (2008d) durchschnittlich knapp das Niveau A2.1 erreichen, bleiben die Mädchen mit einem Mittelwert von 25.28 unter Niveau A2.1. Es lässt sich die Tendenz erkennen, dass die Leistungen der Mädchen eine größere Spannweite abdecken, welche von 9.5 Punkten (vgl. Ausreißerin mit der Fallnummer 141, vgl. Abbil‐ dung 5) bis zu 37 Punkten reicht und somit 27.5 beträgt. Im Gegensatz dazu liegen die Werte der Jungen zwischen 18.0 und 33.5 Punkten, wodurch die Spannweite lediglich 15.5 Punkte beträgt. Der Mann-Whitney-U-Test ergibt schließlich bezogen auf das Gesamtergebnis im Hörverstehen Spanisch einen nicht signifikanten Unterschied zwischen den mittleren Rängen der Ergebnisse der beiden Geschlechtergruppen bei schwachem Effekt zugunsten der Jungen (p-=-.154, d-=-.298, vgl. Tabelle 29). Abb. 5: Boxplots zur Verteilung der Punktzahlen im gesamten Hörverstehenstest Spa‐ nisch, aufgeteilt nach Geschlecht 298 11 Auswertung der Ergebnisse 11.4.1.3 Vergleich der Ergebnisse der Hörverstehenstests in Französisch und Spanisch Festzuhalten bleibt, dass in keiner der beiden romanischen Sprachen im Hör‐ verstehenstest signifikante Geschlechterunterschiede festgestellt wurden. Den‐ noch zeichnet sich die Tendenz ab, dass in Französisch die Mädchen teilweise etwas höhere Ergebnisse erzielen als die Jungen, wobei bezüglich des Gesamt‐ ergebnisses lediglich ein vernachlässigbarer Effekt zugunsten der Mädchen gemessen wird (d-=-.178; vgl. Tabelle 27). In Spanisch lässt sich ein gegenläufiger Trend feststellen, da die Jungen ten‐ denziell etwas höhere Ergebnisse erzielen als die Mädchen und ein schwacher, nicht signifikanter Effekt zugunsten der Jungen gemessen wird (d = .298, vgl. Tabelle 29). Außerdem liegt ein Unterschied in der Einordnung in Feinniveau‐ stufen vor: Während die Mädchen unter Niveau A2.1 bleiben, erreichen die Jungen das Niveau A2.1 (vgl. Lenz/ Studer 2008d). Während die Spannweite der gesamten Hörverstehensergebnisse der Mäd‐ chen (14.5 bis 33.5 Punkte) in Französisch ähnlich groß ist wie diejenige der Jungen (12.5 bis 30.5 Punkte, vgl. Abbildung 4), weichen die Spannweiten der Mädchen und Jungen im Gesamtergebnis im Hörverstehenstest Spanisch stärker voneinander ab (vgl. Abbildung 5). Dies könnte eventuell aber auch auf die unterschiedlich großen Merkmalsgruppen in der Spanischstichprobe zurückzuführen sein (n (w) = 73, n (m) = 21). Insgesamt liegen die Leistungen im Spanischen sowohl bei den Mädchen (M = 25.28, SD = 5.140; vgl. Tabelle 29) als auch bei den Jungen (M = 27.10, SD = 4.167) etwas höher als im Französischen (Mädchen: M = 23.69, SD = 4.494; Jungen: M = 22.88, SD = 4.551; vgl. Tabelle 27), wobei diesbezüglich aufgrund der Unterschiedlichkeit der Testkonstrukte keinerlei statistische Tests durchgeführt werden können. Inwiefern die Ergeb‐ nisse der Hörverstehenstests der vorliegenden Studie tatsächlich auf ein etwas höheres Niveau im Spanischen als im Französischen zurückzuführen sind oder ob möglicherweise eine unterschiedliche Testschwierigkeit ausschlaggebend ist, wird diskutiert, sobald die Ergebnisse aus den anderen Sprachtests, den Fragebögen und den weiteren statistischen Untersuchungen für die beiden Fremdsprachen vorliegen (vgl. Kapitel 12.1, 12.2). Schließlich fallen die Leistungen insgesamt bezüglich der Feinniveaustufen, die laut Auswertungstabelle von Lenz/ Studer (2008d) zugewiesen werden können, etwas geringer aus als aufgrund der vorgeschriebenen Progression in den Bildungsplänen (vgl. Landesinstitut für Schulentwicklung 2016a, 2016b) und Bildungsstandards (KMK 2004) zu erwarten gewesen wäre: Die Mädchen erreichen im Hörverstehen in Französisch ein Niveau unter A2.1 und die Jungen ebenfalls. Die weiblichen Spanischlernenden erreichen ein Niveau unter A2.1 11.4 Ergebnisse der Sprachtests 299 und die männlichen Spanischlernenden erreichen als einzige Merkmalsgruppe Niveau A2.1. 11.4.2 Auswertung und Ergebnisse der Leseverstehenstests Der Leseverstehenstest besteht, wie in Kapitel 9.2.2 in der Construct Map (vgl. Tabelle 2) erläutert, aus drei Teilen: Die erste Teilaufgabe „Umfrage“ (LV-32) beinhaltet einen diskontinuierlichen Text in Form einer Umfrage der Zeitschrift „Rockland“ und eines dazugehörigen Fragebogens. Hier wird sorgfältig-genaues Lesen geprüft und das Aufgabenformat Multiple Matching kommt zum Einsatz. Die zweite Teilaufgabe „Kurze Geschichte“ (LV-33) besteht aus einer Kurzge‐ schichte über eine Reise und somit aus einem literarischen narrativen Text. Sie überprüft ebenfalls das sorgfältig-genaue Lesen und verwendet als Aufga‐ benformat Multiple Choice. Schließlich enthält die dritte Teilaufgabe „Dafür oder dagegen? “ (LV-30) sechs kurze argumentative Meinungstexte, überprüft suchendes und erkundendes Lesen und verwendet, genauso wie die erste Teilauf‐ gabe, die Aufgabenform Multiple Matching. Die Auswertung und Interpretation der Ergebnisse im Leseverstehenstest er‐ folgen, wie beim Hörverstehenstest, nach den Richtlinien von lingualevel (Lenz/ Studer 2008d, vgl. Anhang 2.2.3): Zunächst werden für jedes Item und jeden Lernenden 0 für eine falsche Antwort und 1 für eine richtige Antwort in eine Excel-Tabelle eingetragen. Die jeweiligen Ergebnisse für die drei Teilaufgaben und die Gesamtpunktzahl werden anschließend mithilfe der Summenfunktion von Excel errechnet und in die Gesamttabelle in IBM SPSS 26 übertragen. Fehlende Werte werden dabei stets mit -999 gekennzeichnet und in der SPSS-Ge‐ samttabelle nach der Übertragung erneut überprüft. Die Messbereiche für jede Teilaufgabe sind durch lingualevel klar definiert (vgl. Lenz/ Studer 2008d, Anhang 2.2.4). - 11.4.2.1 Ergebnisse des Leseverstehenstests in Französisch Ergebnisse des Leseverstehenstests liegen für n-=-88 Schülerinnen und Schüler des Französischen vor (n-(w)-=-51, n (m) = 37). Bei vier Fällen müssen fehlende Werte verzeichnet werden. In der gesamten Stichprobe werden im Durchschnitt folgende Ergebnisse erzielt: In der ersten Aufgabe „Umfrage“ (LV-32) liegt der Mittelwert der Gesamtstichprobe bei 7.72 (SD = 1.501) und somit ganz leicht unter Niveau B1.1 (vgl. Lenz/ Studer 2008d). In der zweiten Aufgabe „Kurze Geschichte“ erreicht die gesamte Französischstichprobe den Mittelwert 4.3 (SD = .937) und somit ein Niveau ganz leicht über B1.1 (vgl. Lenz/ Studer 2008d). In der dritten Aufgabe „Dafür oder dagegen? “ (LV-30) wird ein Mittelwert von 4.14 300 11 Auswertung der Ergebnisse (SD = 1.106) erzielt, womit die Französischlernenden das Niveau B1.2 leicht über‐ treffen (vgl. Lenz/ Studer 2008d). Der Mittelwert des Gesamtergebnisses liegt bei 16.15 (SD = 2.494) und somit erreicht die Französischstichprobe durchschnittlich die Kategorie „mehr als A2.2“, sprich mindestens B1.1 (vgl. Lenz/ Studer 2008d, vgl. Anhang 2.2.4). Bei der Prüfung auf Normalverteilungen zeigt sich, dass weder bei den Ergebnissen von Teilaufgabe 1 (LV-32, Umfrage) noch bei den Ergebnissen von Teilaufgabe 2 (LV-33, Kurze Geschichte) eine Normalverteilung vorliegt, da die Kurtosis-Werte in beiden Fällen stark gipflige Verteilungen anzeigen (vgl. Tabelle 30). Dies war vor dem Hintergrund der von lingualevel (Lenz/ Studer 2008d) vorliegenden Aufschlüsselung der Punktzahlen in Niveaustufen zu erwarten, da jeweils die Mindestpunktzahl für das Erreichen des Niveaus A1.2 bzw. A2.2 mehr als die Hälfte der Gesamtpunktzahl beträgt. Die Ergebnisse von Teilaufgabe 3 (LV-30, Dafür oder dagegen? ) kommen zwar bei einer graphischen Analyse des Q-Q-Plots einer annähernden Normalverteilung nahe, die Berechnung der Quotienten aus Schiefe und dessen Standardfehler sowie aus Kurtosis und dessen Standardfehler (vgl. Hair et al. 2014) offenbart aber, dass Schiefe und Kurtosis signifikant von Null abweichen (vgl. Tabelle 30). Be‐ züglich des Gesamtergebnisses im Leseverstehenstest gestaltet sich wiederum ein anderes Bild: Sowohl die graphische als auch die statistische Analyse halten die Vermutung einer gegebenen Normalverteilung aufrecht, da die Werte von Kurtosis und Schiefe jeweils nahe bei Null und die Quotienten jeweils zwischen den Signifikanzniveaus von -1.96 bzw. 1.96 liegen (vgl. Tabelle 30). Daher wird die Verteilungskurve zum Gesamtergebnis des Leseverstehens als annähernd normalverteilt und somit als parametrischer Datensatz eingeordnet. - 1. LV-32 2. LV-33 - 3. LV-30 - Gesamt‐ punktzahl n, MV n = 88, MV = 4 n = 88, MV = 4 n = 88, MV = 4 n = 88, MV = 4 Schiefe -1.149 -1.745 -.955 -.472 Standardfehler der Schiefe .257 .257 .257 .257 Quotient Schiefe/ Standard‐ fehler der Schiefe -4.471 -6.790 -3.716 -1.837 11.4 Ergebnisse der Sprachtests 301 157 Zu diesem Ziel wurden die Daten der Punktzahlen in den Teilaufgaben eins bis drei sowie in der Gesamtpunktzahl jeweils nach den Geschlechtergruppen standardisiert mit Hilfe der Funktion en „In Dateien aufteilen“ und „Standardisierte Werte als Variablen speichern“. Diese nach Gruppen aufgeteilten z-standardisierten Werte für die vier Kategorien (drei Teilaufgaben und Gesamtpunktzahl) wurden anschließend mit Hilfe des nicht-parametrischen Verfahrens für zwei unabhängige Stichproben dem Kolmogorov-Smirnov-Z-Test unterzogen. Wenn die asymptotische zweiseitige Signifikanz über dem Signifikanzniveau von .05 liegt, wird davon ausgegangen, dass beide Merkmalsgruppen eine annährend gleiche Verteilung aufweisen. 1. LV-32 2. LV-33 - 3. LV-30 - Gesamt‐ punktzahl Kurtosis 3.560 4.310 .141 .164 Standardfehler der Kurtosis .508 .508 .508 .508 Quotient Kur‐ tosis/ Standardfehler der Kurtosis 7.008 8.484 .276 .323 Tabelle 30: Schiefe und Kurtosis der Verteilungskurven in den drei Teilaufgaben des Leseverstehenstests sowie der erreichten Gesamtpunktzahlen in Französisch Auf dieser Grundlage können nun die Ergebnisse im Leseverstehen hin‐ sichtlich statistischer Unterschiede zwischen den weiblichen und den männlichen Lernenden des Französischen anhand des non-parametrischen Mann-Whitney-U-Test für die drei Teilaufgaben und anhand des t-Test für die Gesamtpunktzahl untersucht werden. Um die Ergebnisse des Mann-Whitney-U-Tests im Anschluss korrekt ein‐ ordnen zu können, wird vorab noch überprüft, ob bei den weiblichen Ler‐ nenden jeweils gleiche Verteilungsformen vorliegen wie bei den männlichen Lernenden (vgl. Divine et al. 2018; Hart 2001): 157 Eine annährend gleiche Verteilung der Daten liegt nach dem Kolmogorov-Smirnov-Z-Test sowohl bei der ersten Teilaufgabe (LV-32, Umfrage) (p = .120) sowie beim Gesamtergebnis des Leseverstehenstests (p = .671) vor. Deutlich voneinander abweichende Verteilungen zwischen den Geschlechtergruppen findet sich wiederum in der zweiten Teilaufgabe (LV-33, Kurze Geschichte) (p = .003) und in der dritten Teilaufgabe (LV-30, Dafür oder dagegen? ) (p = .000), was durch die signifikanten Ergebnisse des Kolmogorov-Smirnov-Z-Tests deutlich wird. Folglich können zur ersten Teilaufgabe (LV-32, Umfrage) Aussagen über die Mediane und bezüglich der zweiten Teilaufgabe (LV-33, Kurze Geschichte) und Teilaufgabe 302 11 Auswertung der Ergebnisse 3 (LV-30) lediglich Aussagen hinsichtlich möglicher signifikanter Unterschiede bei den mittleren Rängen getroffen werden (vgl. Divine et al. 2018; Hart 2001). - Französisch weiblich (n = 51, MV = 1) Französisch männlich (n = 37, MV = 3) 1. Umfrage (LV-32) (Höchstpunktzahl 10) M-=-7.75 (SD = 1.598, SEM = .224) Mdn = 8.00 M Rang >= 45.37 M-=-7.68 (SD = 1.375, SEM = .226) Mdn = 8.00 M Rang = 43.30 Mann-Whitney-U-Test U = 899.000, Z = -.386, p-=-.700, d = .080 2. Kurze Geschichte (LV-33) (Höchstpunktzahl 5) M-=-4.59 (SD = .698, SEM = .098) Mdn = 5.00 M Rang >= 52.27 M-=-3.89 (SD = 1.075, SEM = .177) Mdn = 4.00 M Rang = 33.78 Mann-Whitney-U-Test U = 547.000, Z = -3.693, p-=-.000 , d = .765 3. Dafür oder dagegen? (LV-30) (Höchstpunkzahl 5) M-=-4.25 (SD = 1.017, SEM = .142) Mdn = 5.00 M Rang = 46.76 M-=-3.97 (SD = 1.213, SEM = .199) Mdn = 4.00 M Rang >= 41.38 Mann-Whitney-U-Test U = 828.000, Z = -1.084, p-= .279, d = .209 Gesamtpunktzahl Leseverstehen (Höchstpunktzahl 20) M-=-16.59 (SD = 2.334, SEM = .327) Mdn = 17.00 M Rang >= 49.04 M-=-15.54 (SD = 2.610, SEM = .429) Mdn = 15.00 M Rang = 38.24 t-Test t (86) = 1.978, p = .051, d = .427 KI 95% für d [-.007, .861] Anmerkungen. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 31: Statistische Ergebnisse der Französischstichprobe im Leseverstehenstest, aufgeteilt nach Teilaufgaben und Geschlecht Bezüglich der Ergebnisse aus der ersten Teilaufgabe (Umfrage, LV-32), die das sorgfältig-genaue Lesen und die Informationsentnahme aus einem diskontinu‐ ierlichen Text in Form eines Umfrageformulars einer Zeitschrift überprüfte, ergibt der Mann-Whitney-U-Test unter der Voraussetzung der stark ähnlichen Verteilung der beiden Geschlechtergruppen, dass sich die Mediane nicht signi‐ fikant voneinander unterscheiden (p = .700, d = .080; vgl. Tabelle 31). Bei den 11.4 Ergebnisse der Sprachtests 303 158 Nach Lakens (2013), APA (2013) sowie Döring und Bortz (2016: 821) soll bei einem signifikanten Ergebnis auch immer die Effektstärke berechnet werden. Ergebnissen der zweiten Teilaufgabe (Kurze Geschichte, LV-33), die das sorg‐ fältig-genaue Lesen eines narrativen Textes abprüfte, wird vor dem Hinblick der ungleichen Verteilungsform der beiden Gruppen ein signifikanter Unterschied zwischen den mittleren Rängen der Leseleistung der Mädchen (M Rang = 52.75) und der Leseleistung der Jungen (M Rang- = 33.78) festgestellt. D. h. die Mädchen schneiden in dieser Aufgabe signifikant besser ab als die Jungen (p = .000, vgl. Tabelle 31). Die Effektstärke 158 liegt bezüglich des Geschlechterunterschieds bei den Ergebnissen aus der zweiten Teilaufgabe bei d = .765, was bedeutet, dass es sich hier um einen starken Effekt handelt (vgl. Sedlmeier/ Renkewitz 2013: 293). Als Schlussfolgerung daraus können hinsichtlich der Ergebnisse der zweiten Teilaufgabe (Kurze Geschichte, LV-33) die Alternativhypothese klar bestätigt bzw. die Nullhypothese eindeutig verworfen werden. Während der erreichte Mittelwert der Mädchen (M (w) = 4.59) über Niveau B1.1 liegt, erzielen die Jungen einen Mittelwert (M (m) = 3.89) knapp unter Niveau B1.1 (vgl. Lenz/ Studer 2008d; Tabelle 31). Mögliche Gründe für diesen Unterschied, der eine ganze Feinniveaustufe darstellt, werden im Laufe der kommenden statistischen Analysen und der Interpretation der gesamten Studienergebnisse genauer untersucht werden (vgl. Kapitel 11.10 und 12.1). Bezüglich der dritten Teilaufgabe (Dafür oder dagegen? , LV-30), die das erkundende Lesen von sechs kurzen argumentativen Texten abprüfte, ergibt der Mann-Whitney-U-Test, vor dem Hintergrund einer ungleichen Verteilungsform der mittleren Ränge ausgehend, keinen signifikanten Unterschied zwischen der Leistung der Mädchen (M Rang = 46.76) und der Leistung der Jungen (M Rang = 41.38), wobei ein schwacher Effekt zugunsten der Mädchen gemessen wird (p = .279, d = .209, vgl. Tabelle 31). Während der Mittelwert der Mädchen (M (w) = 4.25) über Niveau B1.2 liegt, erreichen die Jungen einen Mittelwert (M (m) = 3.97) knapp unter Niveau B1.2, das nach Lenz/ Studer (2008d) bei Erreichen der Vier-Punkte-Marke zugewiesen wird. Schließlich zeigt die Überprüfung der Alternativhypothese hinsichtlich der Gesamtpunktzahl im Leseverstehen ein besonderes Ergebnis: Da parametrische Daten vorliegen, wurde die Alternativhypothese anhand des t-Test überprüft und das Ergebnis ist ganz knapp nicht signifikant (p = .051), weist aber mit einem Cohens d von .427 einen mittleren Effekt auf (vgl. Tabelle 31). Bei der zusätzlichen Durchführung eines Mann-Whitney-U-Tests ergibt sich jedoch ein signifikantes Ergebnis (U = 712.000, Z = -1.974, p = .048, d = .427), sodass davon auszugehen ist, dass bei einer etwas größeren Stichprobe auch im t-Test 304 11 Auswertung der Ergebnisse ein signifikantes Ergebnis erzielt worden wäre. Sowohl die Mädchen als auch die Jungen liegen durchschnittlich auf Niveau B1.1 (vgl. Lenz/ Studer 2008d). Die Boxplots, die die Geschlechtergruppenverteilungen im Gesamtergebnis abbilden, geben zusätzlichen Aufschluss: 50% der Mädchen erreichen eine Gesamtpunktzahl zwischen 10 und 17 Punkten und die anderen 50% liegen zwischen 17 und 20 Punkten, wobei 20 Punkte die Höchstpunktzahl darstellen und das Niveau B1.2 repräsentieren (vgl. Lenz/ Studer 2008d). Hingegen liegen 50% der Jungen bei einer Gesamtpunktzahl zwischen 9 und 15 und und die anderen 50% zwischen 15 und 20 Punkten (vgl. Abbildung 6). Abb. 6: Boxplots zur Verteilung der Punktzahlen im gesamten Leseverstehenstest Fran‐ zösisch, aufgeteilt nach Geschlecht Eine abschließende Analyse der nichtparametrischen Korrelationen zwischen den drei Teilaufgaben im Leseverstehenstest in Französisch ergibt außerdem eine höchst signifikante latente Korrelation mit einem Spearman-Rho zwischen .295 und .326, wodurch bestätigt wird, dass alle Aufgaben das Leseverstehen in ähnlicher Weise messen, aber nicht genau deckungsgleiche Teilkonstrukte dar‐ stellen, da ansonsten der Korrelationskoeffizient höher gewesen wäre. Dies war 11.4 Ergebnisse der Sprachtests 305 bei der Planung des Tests auch so vorgesehen (vgl. Tabelle 2, vgl. Konsortium HarmoS Fremdsprachen 2009: 28). - 11.4.2.2 Ergebnisse des Leseverstehenstests in Spanisch 90 Lernerinnen und Lerner (n (w) = 69, n (m) = 21) des Spanischen legten einen vollständigen Leseverstehenstest ab und in vier Fällen müssen fehlende Werte verzeichnet werden. Im Durchschnitt werden in der gesamten Stichprobe der Spanischlernenden folgende Ergebnisse erzielt: In der ersten Teilaufgabe (Umfrage, LV-32) liegt der Mittelwert der Gesamtstichprobe bei 6.99 (SD = 1.480) und somit ganz leicht unter Niveau A2.2. In der zweiten Aufgabe (Kurze Geschichte, LV-33) erreicht die Gruppe den Mittelwert 4.50 (SD = .797) und somit ein Niveau leicht über B1.1. Schließlich wird in der dritten Teilaufgabe (Dafür oder dagegen? LV-30) ein Mittelwert von 4.67 (SD = .719) erzielt, womit die Spanischstichprobe in diesem letzten Testteil das Niveau B1.2 deutlich übertrifft. Der Mittelwert des Gesamtergebnisses liegt bei 16.16 (SD = 2.182), was nach Lenz und Studer (2008d) der Kategorie „mehr als A2.2“ und somit mindestens B1.1 entspricht. Die statistische Analyse zur Überprüfung der Normalverteilung ergibt, dass ausschließlich bei den Ergebnissen der ersten Teilaufgabe (Umfrage, LV-32) eine annähernde Normalverteilung vorliegt, da die Quotienten von Kurtosis und Schiefe durch ihre jeweiligen Standardfehler innerhalb des Bereichs von -1.96 bis 1.95 liegen (vgl. Hair et al. 2014; vgl. Tabelle 32). Wie bereits erwähnt, ist bei diesem Test eine nicht vorhandene Normalverteilung erwartbar, da jeweils die Mindestpunktzahl für das Erreichen des Niveaus A1.2 bzw. A2.2 mehr als die Hälfte der Gesamtpunktzahl beträgt (vgl. Lenz/ Studer 2008d; Tabelle 32; Anhang 2.2.4). - 1. LV-32 2. LV-33 - 3. LV-30 - Gesamt‐ punktzahl n, MV n = 90, MV = 4 n = 90, MV = 4 n = 90, MV = 4 n = 90, MV = 4 Schiefe -.427 -1.840 -2.000 -1.040 Standardfehler der Schiefe .254 .254 .254 .254 Quotient Schiefe/ Standard‐ fehler der Schiefe -1.681 -7.244 -7.872 -4.092 306 11 Auswertung der Ergebnisse 159 Zu diesem Ziel werden die Daten der Punktzahlen in den Teilaufgaben eins bis drei sowie in der Gesamtpunktzahl in IBM SPSS Statistics 26 jeweils nach den Geschlechter‐ gruppen standardisiert. Diese nach Gruppen aufgeteilten z-standardisierten Werte für die vier Kategorien (drei Teilaufgaben und Gesamtpunktzahl) werden anschließend mit Hilfe des nicht-parametrischen Verfahrens für zwei unabhängige Stichproben jeweils einem Kolmogorov-Smirnov-Z-Test unterzogen. Wenn die asymptotische zweiseitige Signifikanz über dem Signifikanzniveau von .05 liegt, wird davon ausgegangen, dass beide Merkmalsgruppen eine annähernd gleiche Verteilung aufweisen. 1. LV-32 2. LV-33 - 3. LV-30 - Gesamt‐ punktzahl Kurtosis .165 3.894 2.745 1.559 Standardfehler der Kurtosis .503 .503 .503 .503 Quotient Kur‐ tosis/ Standardfehler der Kurtosis .329 7.742 5.459 3.100 Tabelle 32: Schiefe und Kurtosis der Verteilungskurven der Ergebnisse drei Teilaufgaben und des Gesamtergebnisses des Leseverstehenstests in Spanisch Auf dieser Grundlage wird nun die Alternativhypothese bezüglich der Ergeb‐ nisse im Leseverstehenstest in Spanisch der weiblichen und der männlichen Lernenden anhand des t-Tests für die erste Teilaufgabe und anhand des non-pa‐ rametrischen Mann-Whitney-U-Tests für die zweite und dritte Teilaufgabe sowie für das Gesamtergebnis geprüft. Um die Ergebnisse des Mann-Whitney-U-Tests im Anschluss korrekt ein‐ ordnen zu können, wird zuvor wieder untersucht, ob bei den Ergebnissen der weiblichen Lernerinnen jeweils gleiche Verteilungsformen vorliegen wie bei denen der männlichen Lernenden (vgl. Divine et al. 2018; Hart 2001): 159 Eine annähernd gleiche Verteilung der Daten liegt nach dem Kolmo‐ gorov-Smirnov-Z-Test sowohl beim Ergebnis der ersten Teilaufgabe (Umfrage, LV-32; p = .120) als auch beim Gesamtergebnis (p = .671) vor. Deutlich vonein‐ ander abweichende Verteilungen finden sich wiederum bei den Ergebnissen der zweiten (Kurze Geschichte, LV-33; p-=-.003) und dritten Teilaufgabe (Dafür oder dagegen? LV-30; p = .000). Folglich können hinsichtlich möglicher statisti‐ scher Unterschiede zur ersten Teilaufgabe (Umfrage, LV-32) Aussagen über die Mediane und bezüglich der zweiten (Kurze Geschichte, LV-33) und dritten Teil‐ aufgabe (Dafür oder dagegen? LV-30) lediglich Aussagen bezüglich der mittleren Rängen getroffen werden (vgl. Divine et al. 2018; Hart 2001). Die jeweilige 11.4 Ergebnisse der Sprachtests 307 Prüfung der Alternativhypothese ergibt schließlich folgende Ergebnisse (vgl. Tabelle 33): - Spanisch weiblich (n = 69, MV = 4) Spanisch männlich (n = 21, MV = 0) 1. Umfrage (LV-32) (Höchstpunktzahl 10) M-=-6.94 (SD = 1.474, SEM = .177) Mdn = 7.00 M Rang = 45.01 M-=-7.14 (SD = 1.526, SEM = .333) Mdn = 7.00 M Rang = 47.12 t-Test t (88) = -.542, p = .589, d = -.135, KI 95% für d [-.631, .361] 2. Kurze Geschichte (LV-33) (Höchstpunktzahl 5) M-=-4.48 (SD = .759, SEM = .091) Mdn = 5.00 M Rang = 44.41 M-=-4.57 (SD = .926, SEM = .202) Mdn = 5.00 M Rang = 49.10 Mann-Whitney-U-Test U = 649.000, Z = -.851, p-=-.395, d = .152 3. Dafür oder dagegen? (LV-30) (Höchstpunkzahl 5) M-=-4.67 (SD = .721, SEM = .087) Mdn = 5.00 M Rang = 45.42 M-=-4.67 (SD = .730, SEM = .159) Mdn = 5.00 M Rang = 45.76 Mann-Whitney-U-Test U = 719.000, Z = -.075, p-=-.940, d = .011 Gesamtpunktzahl Le‐ severstehen (Höchstpunktzahl 20) M-=-16.09 (SD = 2.085, SEM = .251) Mdn = 16.00 M Rang = 44.31 M-=-16.38 (SD = 2.519, SEM = .550) Mdn = 17.00 M Rang = 49.40 Mann-Whitney-U-Test U = 642.500, Z = -.792, p-=-.428, d = .165 Anmerkungen. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 33: Statistische Ergebnisse der Spanischstichprobe im Leseverstehenstest, aufge‐ teilt nach Teilaufgaben und Geschlecht Bezüglich der Ergebnisse im Leseverstehenstest Spanisch lässt sich festhalten, dass in keiner der drei Teilaufgaben statistisch relevante Geschlechterunter‐ schiede vorliegen, wobei die Jungen im Gesamtergebnis tendenziell ganz leicht höhere durchschnittliche Werte erzielen als die Mädchen (vgl. Tabelle 33). Beide Geschlechtergruppen erreichen Niveau B1.1. Die Boxplot-Diagramme zur Verteilung der Gesamtpunktzahlen aufgeteilt nach Geschlecht zeigen, dass die 308 11 Auswertung der Ergebnisse Leistungsspitzen sowohl von den Jungen als auch von den Mädchen erzielt werden, ein Junge (Fall 140) jedoch die mit Abstand schwächste Leselesitung erzielt, wodurch sich eine größere Spannweite der Leistungen der Jungen als derjenigen der Mädchen ergibt (vgl. Abbildung 7). Abb. 7: Boxplots zur Verteilung der Punktzahlen im gesamten Leseverstehenstest Spa‐ nisch, aufgeteilt nach Geschlecht - 11.4.2.3 Vergleich der Ergebnisse der Leseverstehenstests in Französisch und Spanisch In Französisch kommen die Mädchen im Leseverstehenstest auf einen Gesamt‐ durchschnitt von 16.59 (SD = 2.334) von maximal 20 Punkten. Die Jungen er‐ zielen im Durchschnitt 15.54 Punkte (SD = 2.610; vgl. Tabelle 31). Somit erreichen beide Geschlechtergruppen im Leseverstehen im Französischen durchschnitt‐ lich Niveau B1.1 (vgl. Lenz/ Studer 2008d; Anhang 2.2.4). In Spanisch kommen die Mädchen im Gesamtdurchschnitt auf 16.09 (SD-= 2.085) Punkte und die Jungen erzielen durchschnittlich 16.38 (SD = 2.518) von 20 Punkten (vgl. Tabelle 33) und somit erreichen beide Geschlechtergruppen durchschnittlich ebenfalls Niveau B1.1. Die Mädchen der Französischstichprobe erzielen also tendenziell ein etwas 11.4 Ergebnisse der Sprachtests 309 höheres Ergebnis als die Mädchen der Spanischstichprobe, wobei aufgrund der unterschiedlichen statistischen Konstrukte der Leseverstehensergebnisse keinerlei statistische Tests eingesetzt werden können. Die größte Differenz findet sich zwischen den männlichen Französischlernenden und den männli‐ chen Spanischlernenden. Während in der Spanischstichprobe im Leseverstehen, ähnlich wie bereits beim Hörverstehen, keinerlei signifikante Geschlechterunterschiede auftreten, findet sich in der Französischstichprobe ein signifikanter Unterschied zugunsten der Mädchen in der zweiten Teilaufgabe (Kurze Geschichte, LV-33; p = .000, d = .765). Auch im Gesamtergebnis des Leseverstehens in Französisch zeigt sich ein schwacher Effekt zugunsten der Mädchen (p = .051, d = .427). Welche Gründe dafür ausschlaggebend sein könnten, wird insbesondere in den Kapiteln 11.10 und 12.1 genauer erörtert. 11.4.3 Auswertung und Ergebnisse des Schreibtests Schließlich werden die Ergebnisse des dritten und letzten durchgeführten Sprachtests, der aus einem Schreibtest besteht, ausgewertet. Bevor dies erfolgt, werden zunächst die Auswertungsprozesse detailliert erläutert, welche aus drei komplementären Ratingverfahren bestehen. Im Zuge dessen erfolgt eine präzise Darlegung der einzelnen Teilkonstrukte des Schreibens sowie der entsprechenden Kompetenzbeschreibungen bezüglich der einzelnen Ratingver‐ fahren. Schließlich werden die Testergebnisse des Schreibtests auf potenzielle Geschlechterunterschiede untersucht. Harsch und Martin (2013) kamen in ihrer Vergleichsstudie zu Ratingme‐ thoden des Schreibens zu dem Ergebnis, dass insbesondere eine Kombination aus holistischem und analytischem, deskriptorbasiertem Rating zu einer verbes‐ serten Ratingqualität und somit auch zu einer verbesserten Ratingvalidität, also einer Verringerung der Messfehler führt. Um die Validität des in dieser Studie an‐ gewandten Evaluationsverfahrens zu verbessern und um dem sozio-kognitiven Modell des Schreibens von Hyland (2002, 2016) sowie Shaw und Weir (2007) Rechnung zu tragen, wurden daher zwei unterschiedliche Ratingverfahren gewählt: Zunächst wurde in einem holistischen Rating auf Grundlage der vorlie‐ genden Deskriptoren zu den Sprachhandlungskompetenzen der Construct Map (vgl. Tabelle 3) unter Zuhilfenahme der Referenzleistungen von lingualevel (vgl. Lenz/ Studer 2008c) eine globale Einordnung der Sprachhandlungskompetenz im Schriftlichen in die Feinniveaustufen des GeR vorgenommen. Nach der Datenerhebung mithilfe des Testleiterskripts (vgl. Anhang 1.3) sowie der angepassten Testunterlagen (vgl. Anhang 2.3.4) wurden die Schüler‐ 310 11 Auswertung der Ergebnisse texte in der Software MAXQDA 2018 transkribiert, auch um einen Einfluss der Handschrift auf den Ratingprozess auszuschließen und somit die Scoring-Vali‐ dität zu erhöhen (vgl. Brown 2004, Shaw/ Weir 2007: 176-177). Mit dem Ziel einer möglichst hohen Bewerter- und Auswertungsreliabilität (vgl. Harsch/ Martin 2012, 2013) wird ausschließlich mit Korrekturrastern geratet, die klare Ratingkriterien aufweisen. Vor diesem Hintergrund wird auf Grundlage der transkribierten Texte das erste, holistische Rating vorgenommen. Dieses um‐ fasst im Rahmen des Teilkonstrukts Sprachhandlungskompetenz (vgl. Construct Map, Tabelle 3) und angelehnt an die Diskurstypen Informieren/ Beschreiben, Auffordern/ Veranlassen und Unterhalten von Beziehungen von Hyland (2002, 2016) eine erste Einordnung der Texte in die Feinniveaustufen A1.1-B1.2. Dabei werden die Deskriptoren von lingualevel (vgl. Lenz/ Studer 2008c: 13-33), welche in den Schreibaufgaben SC-06 Beschreiben, wie das eigene Zimmer eingerichtet ist und SC-22 Einen Termin per Kurznachricht verschieben (vgl. Anhang 2.3.2) abge‐ prüft wurden, als Bewertungskriterien angesetzt. Der angestrebte Messbereich der Aufgaben liegt zwischen A1.2 und B1.1 (vgl. Tabelle 34), wobei durchaus auch Sprachhandlungskompetenzen auf Niveau A1.1 und Niveau B1.2 gemessen werden können, wenn die in den Deskriptoren beschriebenen Leistungen stark unterschritten beziehungsweise stark übertroffen werden (vgl. Lenz/ Studer 2008c). Aufgabe und Messbereich Deskriptor, Niveaustufe und Referenznr. in lingua‐ level nicht erfüllt teil‐ weise erfüllt er‐ füllt über‐ troffen 1 Beschreiben, wie das eigene Zimmer eingerichtet ist A1.2-A2.2 Kann jemandem be‐ schreiben, wie sein/ ihr Zimmer eingerichtet ist (A1.2, Sc31). - - - - 2 Einen Termin per Kurznachricht verschieben A2.1-B1.1 -- Kann mit einfachen Worten auf eine Einladung reagieren und Verabredungen absagen oder verschieben (z.-B. per SMS) (A2.1, Sc16). - - - - Kann kurze, einfache No‐ tizen und Mitteilungen schreiben, wie sie zum Bei‐ spiel nötig sind, um eine Ab‐ machung zu bestätigen oder zu ändern (A2.1, Sc27). - - - - 11.4 Ergebnisse der Sprachtests 311 Aufgabe und Messbereich Deskriptor, Niveaustufe und Referenznr. in lingua‐ level nicht erfüllt teil‐ weise erfüllt er‐ füllt über‐ troffen Kann eine einfache, alltäg‐ liche Notiz oder Mitteilung schreiben; kann also z.-B. schreiben, was der andere von ihm/ ihr wissen wollte oder was dieser nun tun soll (A2.2, Sc47). - - - - Anmerkungen. Bei der globalen Niveaubestimmung werden jeweils folgende Kodierungen für folgende Feinniveaustufen eingetragen: .0 = nicht vorhanden; 0.5-=-A1.1 teilweise erreicht; 1.0 = A1.1 erreicht; 1.5 = A1.2 teilweise erreicht; 2.0 = A1.2 erreicht; 2.5 = A2.1 teilweise erreicht; 3.0 = A2.1 erreicht; 3.5 = A2.2 teilweise erreicht; 4.0 = A2.2 erreicht; 4.5 = B1.1 teilweise erreicht; 5.0 = B1.1 erreicht; 5.5 = B1.2 erreicht; 6.0 =-B1.2 erreicht. Die globale Niveaubestimmung stellt nicht den Durchschnitt, sondern den höchsten der erreichten Werte dar. Tabelle 34: Holistisches Rating der Sprachhandlungskompetenz im Schriftlichen, in An‐ lehnung an Lenz/ Studer (2008c) Zusätzlich zu den in Tabelle 34 aufgeführten Deskriptoren werden die ent‐ sprechenden Referenzleistungen von lingualevel, die diese Deskriptoren und vor allem die Sprachniveaus zwischen A1.1 und B1.2 praktisch abbilden, als Orientierung für den ersten Ratingvorgang hinzugezogen (vgl. Lenz/ Studer 2008c: 10-37). Da das genaue Verhältnis zwischen der Sprachhandlungskom‐ petenz im Schreiben bezogen auf einzelne konkrete sprachliche Handlungen und der sprachlichen Richtigkeit in der Forschung noch nicht geklärt ist (vgl. Lenz/ Studer 2008d), sollte ein zweites Rating vorgenommen werden, welches unabhängig von der Messung des Erfolgs oder Misserfolgs einzelnen Sprach‐ handlungen ist. Auf mögliche Beziehungen oder inhaltliche Überschneidungen zwischen den einzelnen Teilkonstrukten kann aber am Ende des Auswertungs‐ prozesses im Rahmen einer Korrelations- und Reliabilitätsanalyse erneut einge‐ gangen werden. Im zweiten Ratingdurchgang wird ein differenziertes analytisches Rating vorgenommen, in dem neben den strukturellen, formalen und inhaltlichen Eva‐ luationskriterien (Wortanzahl, Befolgung der Arbeitsanweisung, Inhalt 1, Inhalt 2) sprachliche Subkategorien (Kohärenz und Kohäsion, Wortschatzspektrum, Ver‐ wendung des Wortschatzes, Lexikalische Orthographie und Interpunktion, Syntax, Verwendung der Tempi und Modi, Morphosyntax und grammatische Orthographie) im Fokus stehen. Somit wird im zweiten Ratingdurchgang, angelehnt an die DESI-Studie (vgl. Hartig/ Jude 2008: 204) sowie an die Evaluationsverfahren bei den schriftlichen DELF-Prüfungen (vgl. CIEP s. a.) eine sehr differenzierte Unterteilung in Subkompetenzen des Schreibens vorgenommen. Dies dient 312 11 Auswertung der Ergebnisse zum einen einer Verbesserung der Validität des Auswertungsverfahrens und zum anderen einer sehr differenzierten Erfassung einzelner Teilkompetenzen des Schreibens, die insbesondere Makroplanung, Gliederung, Mikroplanung und sprachliche Umsetzung der sprachlich-kognitiven Kompetenz des sozio-kogni‐ tiven Modells des Schreibens betreffen (vgl. Hyland 2002, 2016; Shaw/ Weir 2007 sowie Kapitel 9.2.3). Schließlich wurde in einem dritten und abschlie‐ ßenden, rein sprachlich ausgerichteten Rating, das keine erneute Textanalyse sondern vielmehr eine rechnerische Zusammenfassung der sprachlichen Sub‐ kompetenzen darstellt, eine auf den Ergebnissen des zweiten Ratingvorgangs beruhende Einstufung in die GeR-Feinniveaustufen nach dem Prinzip von lingualevel vorgenommen, indem beispielsweise der Mittelwert der Ergebnisse aus Wortschatzspektrum und Verwendung des Wortschatzes zur Kategorie Wort‐ schatz zusammengefasst wurde. Zunächst soll jedoch das zweite Rating genau beschrieben werden, bevor das dritte Ratingverfahren näher erläutert und anschließend die Testergebnisse dargelegt werden. Das zweite Rating wurde auch deshalb vor das dritte geschaltet, weil Testex‐ perten an den Kompetenzbeschreibungen des GeR, die im IEF/ lingualevel-Pro‐ jekt ausdifferenziert und durch die Aufgabensets operationalisiert wurden, oft das Fehlen eines festen Sets von Bestimmungsfaktoren (vgl. Weir 2005a), insbesondere hinsichtlich der zur Verfügung stehenden Textinventare, Text‐ merkmale, Wortschatz- und Grammatikelemente oder auch der erschwerenden und erleichternden Rahmenbedingungen kritisieren (vgl. HarmoS Konsortium Fremdsprachen 2009: 11). Selbst wenn bei lingualevel die Bandbreite der möglichen Leistungen nicht nur in den Kompetenzbeschreibungen definiert wird, sondern die Referenzleistungen auf Grundlage des vorgegebenen Kom‐ petenzrasters (vgl. Anhang 2.3.4) exemplarische Zuordnungen zu den Feinni‐ veaustufen illustrieren, sodass die evaluierenden Personen die Möglichkeit haben, sich mit der Evaluationsform genauestens vertraut zu machen (vgl. Kapitel 9.2.3; Lenz/ Studer 2008c), fehlen dennoch in den Deskriptoren teilweise klare Angaben zu Wortschatz- und Grammatikelementen, die einzelnen Feinni‐ veaustufen zugeordnet werden können (vgl. Anhang 2.3.4). Außerdem ist es unerlässlich, möglichst an die Schreibaufgabe angepasste Ratingkriterien heran‐ zuziehen, damit eine hohe Standardisierung der Testung erfolgt (vgl. Shaw/ Weir 2007: 171). Aus diesen Gründen wird für das zweite Rating ein Korrekturraster erstellt, das gezielte Verfeinerungen der Kriterien, welche explizit auf die beiden Schreibaufgaben bezogen sind, enthält. Das Korrekturraster (vgl. Tabelle 35) wurde erarbeitet, indem, ausgehend von den genannten Quellen (Chauvet 2008; CIEP s. a.; Europarat 2001; Instituto Cervantes 2006, 2007; Lenz/ Studer 2008a, 2008b, 2008c) mehrere Korrekturdurchgänge vorgenommen wurden, bis 11.4 Ergebnisse der Sprachtests 313 160 Während das Ideal der Einheit der spanischen Sprache zunächst über Jahrhunderte (von der Entwicklung der ersten Grammatik durch Antonio de Nebrija im Jahr 1492 bis hin zum Ende der Franko-Diktatur 1975) eine monozentrische Norm in Form der kasti‐ lischen präskriptiven Norm verankert war, erkennen die Real Academia española sowie das Instituto Cervantes, welches für die Durchführung der DELE-Tests zuständig ist, seit den 90er Jahren verstärkt die Existenz regionaler Standards an. Die Kodifizierung regionaler oder nationaler Normen im Rahmen eines gemeinsamen panhispanischen Standards bezeichnet man als plurizentrische Sprachkultur (vgl. Polzin-Haumann 2013: 50-52). schließlich alle Details konkret festgelegt wurden und dann eine finale Version des Korrekturrasters mit sehr konkreten Deskriptoren, welche sich jeweils auf die Punktzahlen 0-6 beziehen, vorlag. Somit wurden die Deskriptoren und Referenzleistungen von lingualevel zum einen um Aspekte aus dem Référentiel de programmes pour l’Alliance Française élaboré à partir du Cadre européen commun von Chauvet (2008) ergänzt. In diesem Werk sind unter anderem für Expression écrite und für alle GeR-Niveaustufen vertiefte Beschreibungen und Inventare sprachlicher Mittel in den Bereichen Contenus grammaticaux und Lexique Socioculturel angelegt (vgl. Chauvet 2008). Komplementär dazu wurden für die Verfeinerung des Korrekturrasters, das im Rahmen des zweiten Rating‐ verfahrens zur Ermittlung der sprachlichen Leistungen eingesetzt werden wird, Deskriptoren des GeR (Europarat 2001) zu den einzelnen sprachlichen Subkom‐ petenzen herangezogen. Schließlich wird zur Erstellung des Korrekturrasters auch das für die DELF-B1-Prüfung vorhandene Korrekturraster berücksichtigt (vgl. CIEP s. a.). Für Spanisch wird außerdem der Plan Curricular del Instituto Cervantes (PCIC) ( Instituto Cervantes 2006, 2007) herangezogen, der den Vorteil hat, unter anderem alle sprachlichen Mittel, die auf den einzelnen Niveaustufen des GeR erforderlich sind, im Detail darzulegen, wobei dem Spanischen als pluri‐ zentrische Sprache 160 Rechnung getragen wird, indem die norma centro-norte peninsular española zwar zuerst berücksichtigt wird, aber danach immer auch Anmerkungen zu allen anderen anerkannten lateinamerikanischen Normen des Spanischen enthalten sind. Da es zu weit führen würde, alle entsprechenden Varianten in den einzelnen Deskriptoren darzulegen, werden lateinamerikani‐ sche Normen nur dann aufgeführt und entsprechend der Feinniveaustufen eingeordnet, wenn diese tatsächlich auch in den Schülertexten vorkommen. Für Französisch wird die Standardnorm als Kriterium für sprachliche Richtig‐ keit herangezogen, da in der (europäischen) Frankophonie vor allem in der Schriftlichkeit regionale Merkmale des Französischen weniger ausgeprägt sind und die Mehrheit der muttersprachlichen Französischsprechenden durch die Schulbildung zu einer mehr oder weniger ausgeprägten Beherrschung der 314 11 Auswertung der Ergebnisse 161 Die Begriffe Grammatikalität, Akzeptabilität und Adäquatheit werden in der deskrip‐ tiven Linguistik unterschiedlich verwendet und teilweise kontrovers diskutiert. Hier sollen die Definitionen von Helbig (2016: 300) als Grundlage dienen: „Akzeptabel ist ein Satz, wenn er wahrscheinlicher produziert, leichter verstanden wird, wenn er natürlich ist. Grammatisch dagegen ist ein Satz, wenn er dem Regelwerk der Grammatik genügt.“ Die Grammatik muss schließlich in ihrer Adäquatheit geprüft werden, anhand des (oft unbewussten) Wissens des Muttersprachlers, an seiner muttersprachlichen Kompetenz. Die generative Grammatik erforscht wiederum, über welche impliziten Wissensstände muttersprachliche Sprecher verfügen. hexagonal-französischen Standardnorm, des bon usage, verpflichtet wird (vgl. Pöll 2017: 15). Für alle sprachlichen Kategorien werden als Referenz zur Bestimmung der Norm für das Französische die Grammatiken von Klein und Kleineidam (2009), Dethloff und Wagner (2014), Riegel et al. (2018) sowie Grevisse und Goosse (2016), das Wörterbuch Le Grand Robert de la langue française (Rey et al. 2008) sowie der Band L’orthographe von Fayol und Jaffré (2014) herangezogen. Die Norm des Spanischen wird durch die Ortografía de la lengua española (RAE 2010a), die Nueva gramática de la lengua española (RAE 2010b), De Bruyne (2001), Vera Morales (2013) und das Diccionario de la lengua española (RAE 2014) markiert, wobei, wie gesagt, darauf geachtet wird, alle anerkannten Normen des Spanischen mit zu berücksichtigen. Im Rahmen des zweiten Ratings wird folglich das output- und kompetenz‐ orientierte Korrekturraster (vgl. Tabelle 35) für jede Probandin und jeden Probanden ausgefüllt. Dabei wird, wie in Kapitel 9.2.3 erläutert, dem kompe‐ tenzorientierten Ansatz insofern Rechnung getragen, als dass es sich um eine Evaluation handelt, bei der sowohl korrekter als auch inkorrekter sprachlicher Output entsprechend berücksichtigt und deren Charakteristika gegeneinander abgewogen werden, wodurch für jede Lernende und jeden Lernenden ein individuelles Profil bezüglich der Schreibleistung entsteht. Sprachliche Fehler werden dabei wie folgt definiert: „Abweichung von geltenden Normen, ein Ver‐ stoß gegen sprachliche Richtigkeit, Regelhaftigkeit oder Angemessenheit, eine Form, die zu Mißverständnissen [sic! ] und Kommunikationsschwierigkeiten führt oder führen kann“ (Lewandowski 1990: 297; vgl. auch Bohnensteffen 2010: 92-93) definiert. Bezüglich der Schwere der Fehler können drei Bereiche aus‐ gemacht werden: Grammatikalität, Akzeptabilität durch Muttersprachlerinnen und Muttersprachler sowie Adäquatheit bezüglich der Kommunikationssitua‐ tion (vgl. Achten 2005: 30). 161 Die Punktevergabe erfolgt auf Basis der im Folgenden dargelegten konkreten, an die Schreibaufgaben angepassten, Korrekturrichtlinien. Im Abschnitt „Be‐ gründung“ werden jeweils die konkreten Gründe, die stets am Schülertext belegt 11.4 Ergebnisse der Sprachtests 315 162 Hierbei wurde die typographische Norm festgelegt, dass Zitate aus den Schülertexten in den Anführungszeichen der jeweiligen Fremdsprache gehalten werden und fremd‐ sprachliche Ausdrücke, die nicht direkt aus dem Schülertext übernommen wurden, kursiv gehalten werden. Fehlerhafte Äußerungen werden stets mit einem Asterisk (*) gekennzeichnet und bei eventuell missverständlichen Angaben von sprachlichen Fehlern wird durch Unterstreichung markiert, welches sprachliche Phänomen gemeint ist. werden, eingetragen, welche die Punktevergabe untermauern. 162 Dadurch wird eine möglichst hohe Objektivität gewährleistet. Außerdem kann die Ratingex‐ pertin zu keiner Zeit sehen, ob es sich beim jeweiligen Text um denjenigen eines weiblichen Lernenden oder um denjenigen eines männlichen Lernenden handelt, da lediglich die Codenamen ersichtlich sind (vgl. Scoring-Validität nach Shaw/ Weir 2007). Wortanzahl 0 1 2 3 4 5 6 Begründungen: Befolgung der Arbeitsanweisung 0 1 2 3 4 5 6 Begründungen: Inhalt 1 0 1 2 3 4 5 6 Begründungen: Inhalt 2 0 1 2 3 4 5 6 Begründungen: Kohärenz und Kohäsion 0 1 2 3 4 5 6 Begründungen: Wortschatzspektrum 0 1 2 3 4 5 6 Begründungen: Verwendung des Wortschatzes 0 1 2 3 4 5 6 Begründungen: Lexikalische Orthographie und Inter‐ punktion 0 1 2 3 4 5 6 Begründungen: 316 11 Auswertung der Ergebnisse Syntax 0 1 2 3 4 5 6 Begründungen: Verwendung der Tempi und Modi (und von ser/ estar/ hay im Spanischen) 0 1 2 3 4 5 6 Begründungen: Morphosyntax und grammatische Orthographie 0 1 2 3 4 5 6 Begründungen: Tabelle 35: Evaluationsraster für das zweite, analytische Ratingverfahren der Schüle‐ rinnen- und Schülertexte aus dem Schreibtest Im Gegensatz zu der Grille de production écrite für DELF B1 (vgl. CIEP s. a.) oder der Escala de calificación de la prueba de Expresión e Interacción escritas für DELE B1 (Instituto Cervantes 2014), bei denen bei jedem Evaluationskriterium eine andere mögliche Höchstpunktzahl erreicht werden kann, werden im vorliegenden Evaluationsraster bewusst für jedes Kriterium jeweils immer eine Skala von 0 bis 6 Punkten angesetzt. So können die Skalen direkt zueinander in Bezug gesetzt werden, ohne erneut standardisiert werden zu müssen und die Skala ist groß genug, um als metrisch kategorisiert werden zu können - bei einer Maximalpunktzahl von 2 kann man beispielsweise nicht mehr von einer metri‐ schen Skala ausgehen. Während die Vergabe der Punktzahlen der Kategorien Befolgung der Arbeitsanweisung, Inhalt 1 und Inhalt 2 spezifisch an die beiden Schreibaufgaben angepasst wurden und aufgrund fehlender Deskriptoren in diesen Bereichen (vgl. Europarat 2001) nicht direkt auf Feinniveaustufen des GeR bezogen sind, steht die Vergabe der Punktzahlen innerhalb der restlichen Kriterien direkt in Bezug zu den Feinniveaustufen. 1 Punkt steht für Niveau A1.1, 2 Punkte für A1.2, 3 Punkte für A2.1, 4 Punkte für A2.2, 5 Punkte für B1.1 und 6 Punkte stehen für B1.2. Um die Punktzahl in der ersten Kategorie Wortanzahl zu ermitteln, werden alle Wörter, die ein Proband oder eine Probandin in den beiden Textprodukti‐ onen zu Papier gebracht hat gezählt und gemäß den Niveaustufen klassifiziert: 1-30 Wörter entsprechen dem Niveau A1.1 (1 Punkt), 31-60 Wörter dem Niveau A1.2 (2 Punkte), 61-90 Wörter dem Niveau A2.1 (3 Punkte), 91-130 Wörter dem Niveau A2.2 (4 Punkte), 131-170 Wörter dem Niveau B1.1 (5 Punkte) und mehr als 171 Wörter dem Niveau B1.2 (6 Punkte). Diese Einteilung der Wortanzahl wurde bestimmt, indem die Richtlinien von ALTE (2020) und die Wortanzahlen in den Referenzleistungen von lingualevel (vgl. Lenz/ Studer 11.4 Ergebnisse der Sprachtests 317 163 Einige Probandinnen und Probanden verwenden anstatt ihres Klarnamens in den Schreibtexten den ihnen zugewiesenen Codenamen um ihre Anonymität zu wahren. Falls der Klarname verwendet wurde, wurde dieser aus demselben Grund in der Transkription durch einen anderen Namen ersetzt. 2008c) als Orientierung genommen und entsprechend der zur Verfügung ste‐ henden Zeit von zweimal fünfzehn Minuten angepasst wurden. Durch die Einteilung in Feinniveaustufen, die unter sich denselben Abstand aufweisen, kann trotz einer intervallskalierten Wortanzahl von einer metrisch skalierten Punktzahl, welche die Feinniveaustufen repräsentiert, ausgegangen werden. In der Kategorie Befolgung der Arbeitsanweisung werden zwei Punkte für die in den beiden Aufgabenstellungen verlangte Form der informellen persönlichen Kurznachricht (vgl. Anhang 2.3.2) vergeben sowie jeweils ein Punkt für die beiden Begrüßungsformeln und für die beiden Verabschiedungsformeln: Sobald eine Begrüßung oder eine Verabschiedung fehlt, wird folglich beim Kriterium Begrüßung/ Verabschiedung ein Punkt weniger vergeben. Hierbei gilt eine bloße Nennung des Vornamens oder des Codenamens 163 nicht als Begrüßung oder Verabschiedung, sondern es müssen tatsächliche Begrüßungs- und Verabschie‐ dungsformeln vorhanden sein. Die Kategorie Inhalt 1 umfasst die Bewertung des Inhalts der ersten Text‐ aufgabe (Beschreiben, wie das eigene Zimmer eingerichtet ist, SC-06), wobei hierfür die Leitpunkte der Aufgabenstellung ausschlaggebend sind: Auf die erste Leitfrage: „Welche Möbel hast du? “ werden bei der Nennung von drei oder mehr Möbelstücken zwei Punkte und bei der Nennung von zwei Möbelstücken ein Punkt vergeben. Bei einer oder keiner Nennung werden für diesen Leitpunkt jeweils null Punkte erteilt, da die Frage nach den vorhandenen Möbeln im Plural gestellt ist. Dabei wird die Definition von ‚Möbelstück‘ sehr weit gefasst und neben den gängigen Möbelstücken wie Schrank, Tisch oder Stuhl werden auch elektronische Geräte wie Computer oder Fernseher, Elemente aus Papier wie Poster oder Postkarten an der Wand und auch Fenster oder Türen als Möbelstücke im weiteren Sinne gewertet. Zudem wird die Nennung des Möbel‐ stücks auch gewertet, wenn es im Schülertext als nicht vorhanden beschrieben wird (z. B. 024: *« Malheureusement je n’ai pas un TV. »). Die zweite Leitfrage der ersten Textaufgabe lautet „Welche Farben haben sie [die Möbel]? “. Hier wird für die Nennung von mindestens zwei verschiedenen Farben ein Punkt vergeben, da oftmals die Möbel eines Zimmers in ähnlichen oder gleichen Farben gehalten sind, die Frage nach den Farben jedoch im Plural gestellt ist, sodass sie impliziert, dass mindestens zwei Farben genannt werden sollen. Bei der Nennung nur einer oder keiner Farbe werden für diesen inhaltlichen Leitpunkt daher keine Punkte vergeben. Die dritte Leitfrage lautet „Wo stehen die Möbel? “. 318 11 Auswertung der Ergebnisse Mindestens zwei Positionsangaben im Raum werden hierbei mit zwei Punkten und eine Positionsangabe mit einem Punkt bewertet. Bei keiner Positionsangabe werden erneut null Punkte zugewiesen. Schließlich wird entsprechend der vierten Leitfrage „Was ist speziell an deinem Zimmer? “ von den Probandinnen und Probanden die Beschreibung eines für sie speziellen Gegenstands oder aber die Anmerkung dazu, dass es keinen speziellen Gegenstand in ihrem Zimmer gibt, verlangt. Sobald hier ein Gegenstand ersichtlich ist, der sich auf diese Frage bezieht, wird hier ebenfalls ein Punkt vergeben. Die Kategorie Inhalt 2 steht für die Messung der inhaltlichen Aspekte im Schülertext zur zweiten Schreibaufgabe (Einen Termin per Kurznachricht ver‐ schieben, SC-22), wobei die inhaltlichen Items entsprechend der in der zweiten Schreibaufgabe ausgewiesenen Leitpunkte wie folgt verteilt wurden: Ein Punkt für die Information zur Kinokarte, ein Punkt für die Zeitangabe „nächster Montag“, ein Punkt für die Information, dass die Kinokarte gewonnen wurde und ein Punkt für die Angabe, dass sich dies bei einem Wettbewerb ereignet hat. Für den Vorschlag, das geplante Treffen zu verschieben wird ein weiterer Punkt vergeben und schließlich für den Vorschlag, das Treffen am Mittwoch nachzuholen noch ein weiterer. Die Schwierigkeit bei der Bewertung der Inhaltskategorien besteht in einer klaren Regelung bei interlingualen Transfers, bei denen der Grad der Bewusst‐ heit bezüglich der Wahl der Sprache nur teilweise nachvollziehbar ist (vgl. Schafroth 2014: 233). Es wurde daher festgelegt, dass, nur wenn Wörter aus anderen Sprachen als bewusst auf in dieser Sprache formuliert eingestuft werden können, z. B. wenn mehrere Wörter hintereinander auf Deutsch ge‐ schrieben werden oder Wörter verwendet werden, die eindeutig nicht dem panromanischen Wortschatz zuzuordnen sind wie beispielsweise dt. „Kleider‐ schrank“ für frz. armoire oder sp. armario), diese auch nicht als gelungene Inhaltsaspekte gewertet werden. Sprachliche Phänomene, die als unbewusste interlinguale Interferenzen (vgl. Meißner 2017: 145-146) eingeordnet werden können, auch weil sie eine gewisse formale Ähnlichkeit zur sprachlichen Form der Zielsprache haben (vgl. falsche Freunde, z. B. in Mehlhorn 2017: 377), werden innerhalb der Inhaltskategorien hingegen als vollwertig angesehen, allerdings in der Kategorie Wortschatzspektrum als sprachliche Fehler berücksichtigt, z. B. im Falle des Französischen *un régal (dt. das Regal) für une étagère, *un/ une computer, oder *un ordenador für un ordinateur, *un couch für un sofa/ un canapé, *une placat für une affiche oder im Spanischen *un regalo (dt. das Regal) für una estantería. Die Kategorie Kohärenz und Kohäsion der Schülertexte wird zunächst quali‐ tativ ausgewertet, bevor in einem zweiten Schritt eine Übertragung in das Punk‐ 11.4 Ergebnisse der Sprachtests 319 164 Beispielsweise ist der Deskriptor für A2.2 sehr stark an der Produktion von narrativen Texten im Sinne des Diskurstyps Erzählen/ Berichten, verfasst, welcher aber in den beiden vorliegenden Schreibaufgaben kaum abgeprüft wird: „Kann eine kleine Erzäh‐ lung oder eine kurze (fiktive) Biografie schreiben; verwendet Mittel wie Fragen, direkte Rede und temporale Ausdrücke (z. B. dann, später, am Anfang), um den Text zu strukturieren“ (vgl. A2.2: Text in Lenz/ Studer 2008b, Anhang 2.3.4). Auch bei Text, B1.1 „Kann kürzere Geschichten (nach)erzählen sowie persönliche Briefe schreiben und dabei Pronomen und adverbiale Ausdrücke brauchen, um personale, zeitliche und räumliche Kohärenz herzustellen.“ ist zwar ein erster Anhaltspunkt gegeben, es bleibt aber offen, auf welche Pronomen und adverbialen Ausdrücke sich dieser Deskriptor bezieht (vgl. B1.2: Text in Lenz/ Studer 2008b, Anhang 2.3.4). tesystem von null bis sechs Punkten im Rahmen der Einordnung in die Feinni‐ veaustufen des GeR stattfindet. Für die Auswertung dieser Kategorie werden die Deskriptoren des Kompetenzbereichs Text von lingualevel (vgl. Lenz/ Studer 2008b, Anhang 2.3.4) explizit aufgenommen und durch die Hinzunahme der Anhaltspunkte bei Chauvet (2008) verfeinert und erweitert, da die Deskriptoren von lingualevel nur eine sehr grobe Einordnung der produktiven Textkompetenz erlauben und nicht spezifisch auf die einzelnen Aufgabenstellungen oder auf einzelne Aspekte im Bereich Kohärenz und Kohäsion eingehen (vgl. Lenz/ Studer 2008b, Anhang 2.3.4). 164 Um dieser Kategorie in der Auswertung gerecht zu werden und um eine möglichst hohe Scoring-Validität nach Shaw und Weir (2007) zu erreichen, soll zunächst kurz auf die hier vorliegende definitorische Grundlage nach Blumenthal (1997: 114-128), Brinker (2010) und Adamzik (2016) eingegangen werden. Brinker (2010: 18) macht deutlich, dass in zahlreichen textlinguistischen Arbeiten zwischen Kohärenz und Kohäsion unterschieden wird. Dabei definiert sich Kohäsion als „Verknüpfung der Oberflächenelemente des Textes durch bestimmte grammatische Mittel“ und Kohärenz als „konzeptionellen Zusam‐ menhang des Textes, d. h. die zugrundeliegende Konstellation von Begriffen und Relationen“ (Brinker 2010: 18). Er geht jedoch von einem umfassenden Kohärenzkonzept aus, das nach grammatischen, thematischen, pragmatischen, kognitiven, expliziten, impliziten und weiteren Aspekten differenziert wird. Die Frage nach der Identifikation von Kohäsionsmitteln beschäftigt die Text‐ linguistik bis heute (vgl. Adamzik 2016: 269 ff.): Allen voran können deiktische Ausdrücke, die je nach Text außertextliche und bzw. oder textinterne Bezüge herstellen, als Kohäsionsmittel genannt werden, welche Personendeixis (z. B. frz. je, tu, nous; sp. yo, tú, nosotros sowie die entsprechende Verbalmorphologie, die wegen nicht obligatorischer Personalpronomina im Spanischen oft die Personendeixis in alleiniger Funktion ausfüllt), Lokaldeixis (z. B. frz. ici, sp. aquí) und Temporaldeixis (z. B. frz. hier, demain, mercredi prochain, sp. ayer, mañana, el 320 11 Auswertung der Ergebnisse próximo miércoles) herstellen. Rekurrenz stellt ein weiteres Kohäsionsmittel dar, wobei hier insbesondere grammatische Rekurrenz durch einen Kohärenzeffekt erzielende Wiederholungen von beispielsweise desselben Tempus gemeint ist (vgl. Linke/ Nussbaumer 2000: 311). Zudem lässt sich Koreferenz als Kohäsions‐ mittel benennen. Damit ist gemeint, dass durch Anaphern und Kataphern, z. B. in Form von Pronomen, aber auch in Form von semantischen Relationen, zum Beispiel durch die Nennung desselben Lexems, von (Quasi-)Synonymen oder aber durch Hyperonyme und Hyponyme eine Wiederaufnahme eines Begriffs erfolgt (vgl. Adamzik 2016: 159). Auch Konnektoren, d. h. Satzverknüpfungen, meist in Form von Konjunktionen (z. B. frz. mais, parce que; sp. pero, porque) und adverbialen Ausdrücken (vgl. z. B. frz. premièrement, deuxièmement; sp. primero, segundo) zählen dazu (vgl. Adamzik 2016: 261). Schließlich stellt auch der Tempusgebrauch durch die Schaffung zeitlicher Bezüge Kohäsion her, indem beispielsweise durch die Verwendung von Vergangenheitstempora und deren Bezug zur ‚erzählten Welt‘ Handlungsverläufe nachvollziehbar gemacht werden (vgl. Adamzik 2016: 258; Blumenthal 1997: 115). In der Evaluation beider Schreibaufgaben sollen in erster Linie die Verwen‐ dung von Konnektoren sowie die Herstellung von Koreferenz bewertet werden. Bezüglich der ersten Schreibaufgabe, in der eine Beschreibung des eigenen Zimmers produziert werden soll, steht außerdem die Lokaldeixis im Mittelpunkt des Ratings. Bezüglich der zweiten Schreibaufgabe, in der eine Abmachung verschoben werden soll, stehen hingegen die Temporaldeixis und in diesem Zusammenhang auch die Herstellung von Kohäsion mittels Tempusgebrauch im Mittelpunkt. Da die Personendeixis von beiden Aufgabenformaten bereits sehr klar vorgeschrieben ist und maximal Deiktika bezüglich des Schreibenden und bezüglich des Adressaten auftreten können, wird diese Kategorie hier nicht als Bewertungskriterium aufgenommen. Außerdem kann Kohärenz auch (alleinig) durch Inferenzprozesse des Le‐ senden erzeugt werden, welche sich auf gedankliche Brücken zwischen nicht explizit verbundenen Sätzen, die vom Lesenden hergestellt werden können bzw. sollen, beziehen. Hier nennt Blumenthal (1997: 115) das Beispiel „In den Decken der Hörsäle wurde Asbest entdeckt. Der Rektor hätte fast einen Herz‐ infarkt bekommen“. Vom Lesenden erwartete Inferenzen kommen ebenfalls in den Textproduktionen der Schülerinnen und Schüler vor, z. B. Fall 1007: *“Gané una entrevista del cine para el lunes próximo. Yo sé que queremos quedar el lunes, pero quiero cambiar el día, en él que quedamos.” Jedoch liegen hierzu keine Deskriptoren bei lingualevel, dem GeR (Europarat 2001), Chauvet (2008) Hinweise im PCIC (Instituto Cervantes 2006, 2007) vor und es ist sehr komplex zu beurteilen, inwiefern Sprecher des Französischen bzw. 11.4 Ergebnisse der Sprachtests 321 Spanischen als Erstsprache die vom Schreibenden geforderte Inferenzleistung im Einzelnen erkennen. Außerdem werden viele der vom Lesenden durchzu‐ führenden Inferenzleistungen von den sehr eng geführten Aufgabenstellungen vorweggenommen, sodass hier nur noch wenig Trennschärfe zu den Kategorien Inhalt 1 und Inhalt 2 besteht. Ähnlich verhält es sich mit dem Faktor ‚Weltwissen‘ (vgl. Adamzik 2016: 275; Blumenthal 1997: 115): Vom Lesenden und vom Schreibenden wird neben geteiltem grammatischem und lexikalischem Wissen auch durch geteiltes Weltwissen Kohärenz hergestellt, was bedeutet, dass einem Lesenden, der - theoretisch betrachtet - ausschließlich seine grammatischen und lexikalischen Kenntnisse in das Textverstehen einbringt, ein Großteil der Satzfolgen unverständlich bleiben kann. Auch dieser Faktor des ‚Weltwissens‘ bleibt aus den oben genannten Gründen in diesem Rating unberücksichtigt. Aufgrund der bisherigen Erläuterungen werden in Anlehnung an die Auf‐ listung der Kohäsionsmittel (vgl. Adamzik 2016; Blumenthal 1997; Brinker 2010) und unter Einbeziehung der Deskriptoren von lingualevel, des GeR (Europarat 2001) sowie der Anhaltspunkte in Chauvet (2008) schließlich also vier ausgewählte Subkategorien der Kohärenz und Kohäsion der Schülerinnen- und Schülertexte für das zweite Ratingverfahren festgelegt. Die Punktevertei‐ lung stellt hierbei immer das Ergebnis einer kriterienorientierten qualitativen Analyse dar und nicht etwa eine Attribuierung von einzelnen konkreten Items zu Punktzahlen, wie dies in den drei vorherigen Kategorien Befolgung der Arbeitsanweisung, Inhalt 1 und Inhalt 2 der Fall war. Zum Ziel einer umfassenden Bewertung der Kohärenz und Kohäsion der Schülertexte erfolgt in jeder der nachfolgenden vier Kategorien eine Punktevergabe von null bis sechs, aus der anschließend der Durchschnitt errechnet und auf eine ganze Zahl gerundet wird. Für das dritte Rating wird später noch einmal derselbe Wert auf zwei Nachkommastellen gerundet zur Niveaueinstufung im Bereich Text herange‐ zogen, wobei hier Text im Sinne von Textkompetenz nach den Deskriptoren von Lenz/ Studer 2008b (vgl. Anhang 2.3.4 und Tabelle 36) zu verstehen ist. Folglich wird das von Lenz und Studer (2008b) ausgewiesene Evaluationskriterium Text und die Subkriterien Verwendung von Konnektoren, Herstellung von räumlichen und zeitlichen Bezügen sowie Herstellung von Koreferenz ergänzt. Die erste Subkategorie Text im Sinne von Textkompetenz fasst im Rahmen des kompetenzorientierten Ansatzes grundlegende Merkmale der produktiven Textkompetenz zusammen und orientiert sich präzise an den von lingualevel in der Kategorie Text festgelegten Deskriptoren von Lenz und Studer (2008b, vgl. Tabelle 36). Die Deskriptoren stellen eine globale Beschreibung grammatischer Kohäsion (Wortstellung, Koreferenz, Tempora) sowie semantisch/ referentieller Kohäsion (außersprachliche zeitliche, kausale, oppositive oder spezifizierende 322 11 Auswertung der Ergebnisse Bezüge) dar, berücksichtigen gleichzeitig aber auch bestimmte Sprechakte (z. B. „Gefühle beschreiben“) und Textsorten (B1.1: „eine persönliche Mitteilung“) sowie gewissermaßen auch die Textlänge (z. B. B1.2 „längere zusammenhän‐ gende Texte“), wobei die Wortanzahl hier, wie oben beschrieben, eine eigene Bewertungskategorie darstellt. Da die Deskriptoren so umfassende Bereiche umfassen, kann hier nur eine erste holistische Zuordnung stattfinden. Punktzahl Kohärenz und Kohäsion: Text (vgl. Lenz/ Studer 2008b, An‐ hang 2.3.4) Niveau‐ stufe 0 Punkte Kein Text auf Französisch/ Spanisch vorhanden, auch nicht in Form einer Wortliste) unter A1.1 1 Punkt Kann mit bekannten Wörtern eine kurze Liste erstellen. A1.1 2 Punkte Kann einige Angaben in aufzählender Form machen; ver‐ wendet dafür kurze Sätze mit fixem Schema, z.-B. frz. Il y a un lit. sp. Hay una cama. A1.2 3 Punkte Kann in kürzeren Texten ganz einfache Aufzählungen ma‐ chen und dabei die Wörter mit und ohne Komma verbinden. A2.1 4 Punkte Kann eine kurze persönliche Mitteilung schreiben; ver‐ wendet Mittel wie Fragen, direkte Rede und temporale Aus‐ drücke, um einen Text zu strukturieren. A2.2 5 Punkte Kann eine persönliche Mitteilung schreiben und dabei Pro‐ nomen und adverbiale Ausdrücke gebrauchen, um personale, zeitliche und räumliche Kohärenz herzustellen. B1.1 6 Punkte Kann auch längere zusammenhängende Texte über Themen schreiben, die ihn/ sie interessieren, und dabei z.-B. präzise Fragen stellen, genauere Begründungen geben, Gefühle be‐ schreiben und Details hervorheben. B1.2 Anmerkungen. Die Deskriptoren wurden leicht auf die Aufgabenstellung angepasst - so wurde beispielsweise im Deskriptor für A1.1 „z.B. Einkaufslisten“ entfernt, da es in den Aufgabenstel‐ lungen nicht darum geht, eine Einkaufsliste zu schreiben. Außerdem wurden bei Bedarf passende sprachliche Beispiele, die an die Aufgabenstellungen angepasst sind, eingefügt. Tabelle 36: Deskriptoren zu Text (im Sinne von produktiver Textkompetenz) als Subka‐ tegorie von Kohärenz und Kohäsion Um komplementär zur holistischen Zuordnung ein analytisches Rating zu erreichen, werden die Schülertexte auf drei weitere Aspekte der Kohärenz und Kohäsion untersucht: Eine weitere Subkategorie innerhalb von Kohärenz und Kohäsion beinhaltet den Gebrauch von Konnektoren, d. h. textstrukturierenden Elementen in Form von Konjunktionen und gewissen Satzadverbialen (z. B. frz. premièrement, deuxièmement, sp. primero, segundo), da diese bei Chauvet (2008) 11.4 Ergebnisse der Sprachtests 323 und auch durch das Instituto Cervantes (2006, 2007) präzise zu den GeR-Ni‐ veaus A1, A2 und B1 als Teil der contenus grammaticaux zugeordnet sind und nach Blumenthal (1997: 115) einen wichtigen Bestandteil der grammatischen Kohäsion darstellen. Bezüglich der Konnektoren wird daher die in Tabelle 37 ersichtliche Punkteverteilung nach Chauvet (2008) vorgenommen, die im Zuge der Auswertung auf die Feinniveaustufen ausdifferenziert wurde und ein hohes Maß an Objektivität erlaubt. Punkt‐ zahl Kohärenz und Kohäsion: Verwendung von Konnektoren (vgl. Chauvet 2008: 39, 63, 90; Instituto Cervantes 2006, 2007) Niveau‐ stufe 0 Punkte Kein Text auf Französisch/ Spanisch vorhanden, auch nicht in Form einer Wortliste. unter A1.1 1 Punkt Verwendet keine Konnektoren. A1.1 2 Punkte Verwendet einen einfachen Konnektor im Rahmen von kurzen Aufzählungen korrekt (frz. et, ou, alors; sp. y, o, entonces/ pues). A1.2 3 Punkte Verwendet zwei einfache Konnektoren korrekt (z.-B. et, ou, alors; sp. y, o, entonces/ pues). A2.1 4 Punkte Verwendet ein bis zwei einfache und einen weiteren Kon‐ nektor korrekt (z. B. frz. mais, parce que, quand, puis, pendant, en plus oder pour + inf.; sp. pero, porque, cuando, durante, además, para + inf.). A2.2 5 Punkte Verwendet ein bis zwei einfache Konnektoren und mindes‐ tens zwei weitere Konnektoren korrekt (z. B. frz. mais, parce que, quand, puis, pendant, en plus oder pour + inf.; sp. pero, porque, cuando, durante/ mientras, además, para + inf). B1.1 6 Punkte Verwendet neben einzelnen Konnektoren aus den Niveau‐ stufen A1 und A2 zusätzlich mindestens einen weiteren temporalen, kausalen, adversativen, finalen oder konseku‐ tiven Konnektor korrekt (z.-B. frz. d’abord, premièrement, en premier lieu, deuxièmement, ensuite, enfin, depuis, donc, puisque, comme, c’est pourquoi, à cause de cela, pour ce motif, pourtant, alors que/ tandis que, pour que; sp. cuando, mientras, primero, primeramente, en primer lugar, segundo, segundamente, luego, entonces, al final/ al fin, por fin, desde, desde hace, así, pues, ya que, como, por eso, por esto, de aquí que, por lo cual, por este motivo, sin embargo, mientras (adversativ), para que). B1.2 Tabelle 37: Deskriptoren zu Verwendung von Konnektoren als Subkategorie von Kohärenz und Kohäsion 324 11 Auswertung der Ergebnisse Die dritte Subkategorie von Kohärenz und Kohäsion betrifft den Grad der Her‐ stellung von räumlichen und zeitlichen Bezügen - und somit die semantische bzw. referentielle Kohäsion, auch in Form von außersprachlichen Bezügen (vgl. Blumenthal 1997: 115), wobei in der ersten Schreibaufgabe SC-06 Beschreiben, wie das eigene Zimmer eingerichtet ist vorwiegend das Herstellen von räumlichen Bezügen und in der zweiten Schreibaufgabe SC-22 Einen Termin per Kurznach‐ richt verschieben vorwiegend das Herstellen von zeitlichen Bezüge abgeprüft wird. Falls beispielsweise bei räumlichen Bezügen die Punktzahl 5 erreicht wird und bei zeitlichen Bezügen die Punktzahl 3, werden 4 Punkte zugewiesen. Bei der Zuteilung von einmal drei und einmal vier Punkten wird erneut analysiert, welche Deskriptoren der Leistung am ehesten entsprechen und eine - qualitativ und nicht rechnerisch begründete - Entscheidung zwischen drei und vier Punkten getroffen. Die Punktevergabe erfolgt nach den in Tabelle 38 angeführten Deskriptoren. Punktzahl Kohärenz und Kohäsion: Räumliche und zeitliche Bezüge (vgl. Chauvet 2008: 38, 39, 63, 91; Instituto Cervantes 2006, 2007) Niveau‐ stufe 0 Punkte Keine räumlichen oder zeitlichen Bezüge unter A1.1 1 Punkt Stellt kaum oder aber unklare räumliche und zeitliche Bezüge bzw. maximal einen räumlichen und einen zeitlichen Bezug in Form von einfachen Auflistungen oder der Nennung eines Wochentags her. A1.1 2 Punkte Stellt sehr elementare räumliche Bezüge her (z.-B. frz. Dans ma chambre, il y a […], sp. En mi habitación hay […]). Stellt elementare zeitliche Bezüge in Form der Nennung von zwei Wochentagen bei Verwendung des Präsens her. A1.2 3 Punkte Stellt elementare räumliche Bezüge (z.-B. frz. Dans ma chambre, il y a […]/ On y trouve, sp. En mi habitación/ Allí/ Allá hay […]) her und verwendet mindestens eine Präposition bzw. ein Adverb des Ortes (z. B. frz. à gauche, à droite, sur, sous, dessus, devant, derrière etc., sp. a la izquierda, a la derecha, en, sobre, encima, debajo, delante, etc.). Stellt elementare zeitliche Bezüge in Form der Nennung von zwei Wochentagen und der Herstellung eines Bezugs zwi‐ schen den beiden Wochentagen bei Verwendung des Präsens her. A2.1 11.4 Ergebnisse der Sprachtests 325 Punktzahl Kohärenz und Kohäsion: Räumliche und zeitliche Bezüge (vgl. Chauvet 2008: 38, 39, 63, 91; Instituto Cervantes 2006, 2007) Niveau‐ stufe 4 Punkte Stellt elementare, etwas differenziertere räumliche Bezüge unter Verwendung von mehreren Präpositionen und Adver‐ bien des Ortes her (z. B. frz. à gauche, à droite, sur, sous, dessus, devant, derrière, près de etc., sp. a la izquierda, a la derecha, en, sobre, encima, arriba, debajo, delante, detrás, cerca de etc.). Stellt elementare, etwas differenzierte zeitliche Bezüge und eine klare Referenz zur Vergangenheit her, wobei keine Tem‐ pora der Vergangenheit verwendet werden. A2.2 5 Punkte Stellt elementare, etwas differenziertere räumliche Bezüge unter Verwendung von mehreren Präpositionen und Adver‐ bien des Ortes (z.-B. frz. à gauche, à droite, sur, sous, dessus, devant, derrière etc., sp. a la izquierda, a la derecha, en, sobre, encima, debajo, delante, etc.) und vereinzelt räumliche Bezüge zwischen den einzelnen Objekten her. Stellt elementare, etwas differenziertere zeitliche Bezüge her und stellt eine klare Referenz zur Vergangenheit her, auch unter Verwendung entsprechender Tempora. B1.1 6 Punkte Stellt elaborierte räumliche Bezüge in Form von genauen Beschreibungen von räumlichen Verhältnissen zwischen den einzelnen Objekten her (z.-B. frz. Mon lit est à droite, sous la petite fenêtre; Quand on entre dans ma chambre, on voit une étagère et sur la droite il y a une armoire.; Mon lit se trouve près de la porte et ma table est devant mon lit à gauche.; sp. Mi cama está a la derecha, debajo de la ventana pequeña; Cuando entras en mi habitación, ves una estantería y a su derecha hay un armario.; Mi cama está cerca de la puerta y mi mesa está delante de mi cama a la izquierda.) Stellt elaborierte zeitliche Bezüge her in Form von detail‐ lierten Beschreibungen persönlicher Erfahrungen in der Ver‐ gangenheit, Wünschen und Bedingungen (z.-B. in Form von Bedingungssätzen) für die Zukunft. B1.2 Tabelle 38: Deskriptoren zu räumlichen und zeitlichen Bezügen als Subkategorie von Kohärenz und Kohäsion Die vierte Subkategorie von Kohärenz und Kohäsion innerhalb des zweiten Ratingverfahrens betrifft schließlich ebenfalls die semantische bzw. referentielle Kohäsion (vgl. Blumenthal 1997: 115) in Form der zu Koreferenz führenden Wie‐ deraufnahmen von zuvor Genanntem durch Pronomen und Lexeme, beispiels‐ weise indem Synonyme oder Hyperonyme verwendet werden. Hierbei muss beim Spanischen berücksichtigt werden, dass es sich um eine Pro-Drop-Sprache oder Nullsubjektsprache handelt, das heißt Personalpronomen, vor allem in Funktion des Subjekts finiter Sätze werden im Spanischen systematisch nicht gesetzt, jedoch wird trotzdem - in der Terminologie der generativen Grammatik 326 11 Auswertung der Ergebnisse 165 Deutsche Übersetzung: In meinem Zimmer gibt es einen Schrank. Er ist schön. ausgedrückt (vgl. Müller et al. 1998) - durch ein pro, ein unsichtbares, phonetisch leeres Pronomen eine Subjektfunktion impliziert. Auf Textebene erzeugt aber im Spanischen vielmehr als dieses leere Pronomen die entsprechende Verbalmor‐ phologie Kohäsion (z. B. En mi habitación hay un armario. Es bonito.) 165 , was in der Evaluation der spanischen Textproduktionen ebenfalls als Maßnahme zur Herstellung von Koreferenz berücksichtigt wird. All diese Maßnahmen zur Herstellung von Koreferenz dienen in erster Linie der Reduktion sprachlicher Redundanzen und der Herstellung sprachlicher Beziehungen zwischen Sätzen (vgl. Blumenthal 1997). Während in dieser Subkategorie der Schwerpunkt auf der Tatsache der reinen Verwendung der zu Koreferenz führenden Wie‐ deraufnahme liegt, fokussiert das später erläuterte Evaluationskriterium der Morphosyntax und grammatischen Orthographie die korrekte orthographische Markierung der Konkordanz von zuvor Genanntem und Pronomen, beispiels‐ weise in Bezug auf Genus und Numerus. Folglich werden alle Koreferenzen die über die Wiederholung von Lexemen in Form eines anaphorischen Gebrauchs (z. B. frz. une photo - la photo/ cette photo) hinausgehen im Korrekturraster be‐ rücksichtigt. Personalpronomen, die zur Herstellung von Koreferenz zwischen den Gesprächspartnern dienen, werden dabei als Mindestvoraussetzung für Niveau A1.1 gewertet, sind aber für höhere Niveaustufen nur bedingt relevant (vgl. Tabelle 39). Punktzahl Kohärenz und Kohäsion: Koreferenz (vgl. Chauvet 2008: 39, 63, 91) Niveaustufe 0 Punkte Produziert häufige sprachliche Redundanzen und keinerlei Wiederaufnahmen von zuvor Genanntem durch Pronomen oder Lexeme unter A1.1 1 Punkt Produziert häufige sprachliche Redundanzen und keinerlei Wiederaufnahmen von zuvor Genanntem durch Pronomen oder Lexeme, verwendet Personalpronomen bzw. im Spani‐ schen pros zur Herstellung der Bezüge zwischen den Ge‐ sprächspartnern überwiegend kohärent. A1.1 2 Punkte Produziert häufige sprachliche Redundanzen und eine oder zwei Wiederaufnahmen von zuvor Genanntem durch Perso‐ nalpronomen oder Demonstrativpronomen (z.-B. frz. c’est, ce sont, sp. esto/ esta/ ese/ esa está; estos/ estas/ esos/ esas están). Im Spanischen fallen darunter auch Herstellungen von Ko‐ referenz mithilfe von pros in Kombination mit der entspre‐ chenden Verbmorphologie (z.-B. sp. [eso] es/ [eso] está). A1.2 11.4 Ergebnisse der Sprachtests 327 Punktzahl Kohärenz und Kohäsion: Koreferenz (vgl. Chauvet 2008: 39, 63, 91) Niveaustufe 3 Punkte Produziert teilweise sprachliche Redundanzen und lediglich eine oder zwei Wiederaufnahmen von zuvor Genanntem durch Personalpronomen oder Demonstrativpronomen (z. B. frz. c’est, ce sont, sp. esto/ esta/ ese/ esa es/ está; estos/ estas/ esos/ esas son/ están), durch Relativpronomen (frz. qui, que; sp. que), Indefinitpronomen frz. tout, toute, tous; sp. todo, todos, todas), dem französischen Pronomen y (außer in il y a) bzw. den spanischen Adverbien allí/ ahí, direkten oder indirekten Objektpronomen (frz. z.B. le, la, les, lui, leur, sp. z.-B. lo, la, los, las, le, les) oder aber durch lexikalische Mittel (z.-B. Hyperonyme, Synonyme). Im Spanischen fallen darunter auch Herstellungen von Ko‐ referenz mithilfe von pros in Kombination mit der entspre‐ chenden Verbmorphologie (z.-B. sp. [eso] es/ [eso] está). A2.1 4 Punkte Produziert teilweise sprachliche Redundanzen und drei Wie‐ deraufnahmen von zuvor Genanntem durch Personalpro‐ nomen oder Demonstrativpronomen (z.-B. frz. c’est, ce sont, sp. esto/ esta/ ese/ esa está; estos/ estas/ esos/ esas están), durch Relativpronomen (frz. qui, que; sp. que), Indefinitpronomen frz. tout, toute, tous; sp. todo, todos, todas), dem französischen Pronomen y (außer in il y a) bzw. den spanischen Adverbien allí/ ahí, direkten oder indirekten Objektpronomen (frz. z.B. le, la, les, lui, leur, sp. z. B. lo, la, los, las, le, les) oder aber durch lexikalische Mittel (z.-B. Hyperonyme, Synonyme). Im Spanischen fallen darunter auch Herstellungen von Ko‐ referenz mithilfe von pros in Kombination mit der entspre‐ chenden Verbmorphologie (z.-B. sp. [eso] es/ [eso] está). A2.2 5 Punkte Produziert wenige sprachliche Redundanzen und vier Wie‐ deraufnahmen von zuvor Genanntem durch Personalpro‐ nomen oder Demonstrativpronomen (z.-B. frz. c’est, ce sont, sp. esto/ esta/ ese/ esa es/ está; estos/ estas/ esos/ esas son/ están), durch Relativpronomen (frz. qui, que; sp. que), Indefinitpro‐ nomen frz. tout, toute, tous; sp. todo, todos, todas), dem fran‐ zösischen Pronomen y (außer in il y a) bzw. den spanischen Adverbien allí/ ahí, direkten oder indirekten Objektpronomen (frz. z.-B. le, la, les, lui, leur, sp. z.-B. lo, la, los, las, le, les) oder aber durch lexikalische Mittel (z.-B. Hyperonyme, Synonyme). Im Spanischen fallen darunter auch Herstellungen von Ko‐ referenz mithilfe von pros in Kombination mit der entspre‐ chenden Verbmorphologie (z.-B. sp. [eso] es/ [eso] está). B1.1 328 11 Auswertung der Ergebnisse 166 Ein Wortfeld ist nach Coseriu (1967: 294) ein „lexikalisches Paradigma, das durch die Aufteilung eines lexikalischen Inhaltskontinuums unter verschiedene in der Sprache als Wörter gegebene Einheiten entsteht, die durch einfache inthaltsunterscheidende Züge in unmittelbarer Opposition zueinander stehen“. 167 Selbstverständlich ist es möglich, dass in den Schülertexten über die in der Skala konkretisierten Wortfelder hinaus weitere Wörter aus anderen semantischen Feldern auftreten. Diese werden dann entsprechend der Angaben in Chauvet (2008) eingestuft und bei dort fehlenden Angaben nach den Kriterien Frequenz, rezeptive Disponibilität, Gebrauchswert gewichtet (vgl. Reinfried 2017: 176-177). Beispielsweise wird deshalb frz. *mes choses pour l’école einem geringeren Niveau zugeschrieben als frz. une batterie oder frz. une figurine. Punktzahl Kohärenz und Kohäsion: Koreferenz (vgl. Chauvet 2008: 39, 63, 91) Niveaustufe 6 Punkte Produziert kaum sprachliche Redundanzen und mehr als vier Wiederaufnahmen von zuvor Genanntem durch Perso‐ nalpronomina oder Demonstrativpronomina (z.-B. frz. c’est, ce sont, sp. esto/ esta/ ese/ esa es/ está; estos/ estas/ esos/ esas son/ están), durch Relativpronomen (frz. qui, que; sp. que), Inde‐ finitpronomen frz. tout, toute, tous; sp. todo, todos, todas), dem französischen Pronomen y (außer in il y a) bzw. den spanischen Adverbien allí/ ahí, direkten oder indirekten Ob‐ jektpronomen (frz. z. B. le, la, les, lui, leur, sp. z. B. lo, la, los, las, le, les) oder aber durch lexikalische Mittel (z. B. Hyperonyme, Synonyme). Im Spanischen fallen darunter auch Herstellungen von Ko‐ referenz mithilfe von pros in Kombination mit der entspre‐ chenden Verbmorphologie (z.-B. sp. [eso] es/ [eso] está). B1.2 Tabelle 39: Deskriptoren zu Koreferenz als Subkategorie von Kohärenz und Kohäsion Der Bereich Wortschatz wird im zweiten Ratingverfahren mittels zwei Katego‐ rien bewertet: Wortschatzspektrum und Verwendung des Wortschatzes. Wortschatzspektrum. Die beiden Aufgaben messen einen bestimmten Aus‐ schnitt aus dem Wortschatzspektrum der Schülerinnen und Schüler. Die Deskriptoren bezüglich des Wortschatzspektrums wurden aus den Feinniveau‐ stufen von lingualevel übernommen und durch Wortfelder 166 aus Chauvet (2008) konkretisiert. 167 Hier wird zum einen der Umfang und der Grad der Differenziertheit des Wortschatzes berücksichtigt und zum anderen werden interlinguale Interferenzen (vgl. Meißner 2017: 145-146) als Kriterium für die Einordnung der Leistung in die jeweilige Feinniveaustufe aufgenommen. Beim Rating des Wortschatzspektrums werden zunächst alle französischen bzw. spanischen Lexeme identifiziert. Anschließend werden alle interlingualen Interferenzen analysiert. Teilweise kann es vorkommen, dass ein von einem Probanden oder einer Probandin verwendetes Lexem im Französischen bzw. 11.4 Ergebnisse der Sprachtests 329 168 Ähnlich verhält es sich bei frz. régal (dt. ‚Gaumenfreude‘) oder sp. regalo (dt. ‚Ge‐ schenk‘) die, wenn sie im Schülertext mit der Bedeutung von dt. ‚Regal‘ verwendet werden, sowohl intralinguale Interferenzen mit dem Deutschen darstellen und somit in die Kategorie Wortschatzspektrum fallen, als auch, da es sich um im Französischen bzw. Spanischen tatsächlich existierende Lexeme handelt, welche jedoch inkorrekt verwendet wurden, als intralinguale Interferenzen auch in die Kategorie Verwendung des Wortschatzes fallen. Spanischen zwar existiert und damit als Teil des Wortschatzspektrums ange‐ sehen werden muss, aber gleichzeitig eine interlinguale lexikalisch-semanti‐ sche Interferenz vorliegt: Beispielsweise existiert das französische Lexem une carte mit den Bedeutungen ‚(geographische) Karte‘, ‚Spielkarte‘, ‚(Post)karte‘, ‚(Speise)karte‘, ‚(Visiten)karte‘, ‚(Kredit)karte‘, ‚Ausweis‘, aber nicht im Sinne von ‚Eintrittskarte‘(vgl. Dralle et al. 2015); das spanische Lexem una cartawie‐ derum bedeutet ‚Brief ‘, ‚Schreiben‘ ‚Urkunde‘, ‚Spielkarte‘, ‚(geographische) Karte‘, ‚(Speise)karte‘, aber kann ebenfalls nicht für dt. ‚Eintrittskarte‘ verwendet werden (vgl. Hald/ Schmitz 2008). Wenn nun frz. carte bzw. sp. carta im Sinne von ‚Eintrittskarte‘ auftritt, wird dieses Lexem zwar als Teil des Wortschatzspekt‐ rums des jeweiligen Probanden gewertet, die Verwendung der Ausdrücke frz. *une carte de cinéma für un ticket de cinéma bzw. sp. *una carta de cine für una entrada para el cine für dt. ‚Kinokarte‘ stellt aber eine lexikalisch-semantische interlinguale Interferenz (vgl. Kathra 2013: 70) dar, die hier bei der Zuweisung der Feinniveaustufe im Bereich des Wortschatzspektrums negativ ins Gewicht fällt, wenngleich es im Sinne des outputorientierten Ansatzes immer gilt, Versuche einer Äußerung auf der Zielsprache zu würdigen und frz. *une carte de cinéma bzw. sp. *una carta de cine grundsätzlich als höhere Leistung eingestuft wird als die bloße Wiedergabe auf Deutsch Kinokarte innerhalb des französischen bzw. spanischen Textes. Gleichzeitig wird dieser Fehler auch als inkorrekte Verwendung des Wortschatzes in der nachfolgenden Kategorie Verwendung des Wortschatzes gewertet, da es sich gleichzeitig auch um eine intralinguale Interferenz handeln kann (vgl. z. B. Rattunde 1977). 168 Neben interlingualen Interferenzen werden im Bereich Wortschatzspektrum auch Wort‐ neuschöpfungen und Paraphrasen im Sinne von Kompensationsstrategien im Bereich des proaktiven Umgangs mit unbekanntem Wortschatz berücksichtigt (vgl. z.-B. Abel 2000; Tabelle 40). 330 11 Auswertung der Ergebnisse Punktzahl Wortschatzspektrum (Deskriptoren vgl. Lenz/ Studer 2008b (Wortschatz), GeR (Euro‐ parat 2001) Wortschatzspektrum, Anhang 2.3.4, Wortfelder vgl. Chauvet 2008: 40, 64, 91; PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 0 Punkte Verfügt kaum über Wortschatz im Französischen/ Spanischen und benutzt fast ausschließlich deutsche oder englische Le‐ xeme bzw. lässt große Lücken im Text. unter A1.1 1 Punkt Verfügt über ein sehr eingeschränktes Repertoire an ein‐ zelnen Wörtern und Wendungen, um in ganz einfacher Form schriftlich Kontakt aufzunehmen sowie kurze persönliche Informationen zu geben und zu erfragen. -Beherrscht folgende Wortfelder überwiegend: • frz. les lieux (la maison, la chambre), les couleurs • sp. los lugares (la casa, la habitación), los colores A1.1 2 Punkte Verfügt über eine kleine Anzahl gebräuchlicher Wörter und Wendungen, mit denen er/ sie z.-B. kurze Mitteilungen über eigene Vorlieben, z.-B. Farben, schreiben kann. -Beherrscht folgende Wortfelder überwiegend: • frz. les lieux (la maison, la chambre, le cinéma), les couleurs, les jours de la semaine, les loisirs-(aller au cinéma), les sentiments (aimer qc) • sp. los lugares (la casa, la habitación, el cine), los colores, los días de la semana, el ocio (ir al cine), los sentimientos (gustar) A1.2 3 Punkte Der Wortschatz reicht aus, um mit Hilfe von einigen Um‐ schreibungen über Themen wie Hobbys oder Interessen schriftlich zu kommunizieren. -Beherrscht folgende Wortfelder überwiegend: • frz. les lieux (la maison, la chambre, le cinéma), les couleurs, les jours de la semaine, les meubles (la table, le lit, la chaise), les loisirs-(aller au cinéma), les sentiments (aimer qc) • sp. los lugares (la casa, la habitación, el cine), los colores, los días de la semana, los muebles (la mesa, la cama, la silla), el ocio (ir al cine), los sentimientos (gustar) A2.1 11.4 Ergebnisse der Sprachtests 331 Punktzahl Wortschatzspektrum (Deskriptoren vgl. Lenz/ Studer 2008b (Wortschatz), GeR (Euro‐ parat 2001) Wortschatzspektrum, Anhang 2.3.4, Wortfelder vgl. Chauvet 2008: 40, 64, 91; PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 4 Punkte ----------- Verfügt über genügend häufig verwendete sprachliche Mittel, um kürzere, lineare Texte über vertraute Themen zu schreiben, muss sich aber gelegentlich in dem, was er/ sie ausdrücken will, einschränken. -Beherrscht folgende Wortfelder überwiegend: • frz. les lieux (la maison, la chambre, le cinéma), les couleurs, les jours de la semaine, les meubles (la table, le lit, la chaise, la fenêtre, la porte), la décoration (le poster, la carte postale), le cinéma (le film), les loisirs (aller au cinéma), les actions de la vie quotidienne (pouvoir, devoir, se rencontrer, se retrouver, gagner un ticket, sortir ensemble, prendre rendez-vous), les sentiments (aimer qc) • sp. los lugares (la casa, la habitación, el cine), los colores, los días de la semana, los muebles (la mesa, la cama, la silla, la ventana, la puerta), la decoración (el póster, la carta postal), el cine (la película), el ocio (ir al cine), las acciones de la vida cotidiana (poder, deber/ tener que/ hay que, quedar, ganar una entrada, salir juntos, citarse), los sentimientos (gustar) A2.2 ----------- 5 Punkte Verfügt über einen genügend großen Wortschatz, um die Hauptaspekte eines Gedankens oder eines Problems aus dem vertrauten Bereich zu erklären. Dieses Repertoire reicht aber nicht aus, um sich in Bezug auf komplexere Sachverhalte oder wenig vertraute Themen genau genug auszudrücken. -Beherrscht folgende Wortfelder überwiegend: • frz. les lieux (la maison, la chambre, le cinéma), les couleurs, les jours de la semaine, les meubles (la table, le lit, la chaise, la fenêtre, la porte, l’armoire, l’étagère, le bureau, la télévision), la décoration (le poster, la carte postale), le cinéma (le film), les loisirs (aller au cinéma), les actions de la vie quotidienne (pouvoir, devoir, se rencontrer, se retrouver, gagner un ticket, sortir ensemble, s’excuser, prendre rendez-vous, se rejoindre, participer à un concours), les sentiments (aimer, se réjourir triste, heureux, être désolé) • sp. los lugares (la casa, la habitación, el cine), los colores, los días de la semana, los muebles (la mesa, la cama, la silla, la ventana, la puerta, el armario, la estantería, el escritorio, la televisión), la decoración (el póster, la carta postal), el cine (la película), el ocio (ir al cine), las acciones de la vida cotidiana (poder, deber/ tener que/ hay que, quedar, ganar una entrada, salir juntos, citarse, disculparse, reunirse, participar en un concurso/ en una competición), los sentimientos (gustar, alegrarse, triste, feliz, sentirlo/ lamentarlo) B1.1 332 11 Auswertung der Ergebnisse 169 Idiomatik bezeichnet die Gesamtheit der idiomatischen Ausdrücke (Idiome) einer Sprache, welche Satzglieder oder satzwertige Phraseologismen bezeichnen, deren Gesamtbedeutung sich nicht oder nur teilweise aus der Bedeutung der einzelnen Punktzahl Wortschatzspektrum (Deskriptoren vgl. Lenz/ Studer 2008b (Wortschatz), GeR (Euro‐ parat 2001) Wortschatzspektrum, Anhang 2.3.4, Wortfelder vgl. Chauvet 2008: 40, 64, 91; PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 6 Punkte Verfügt über ein hinreichend breites Spektrum sprachlicher Mittel, um alltägliche Situation recht genau zu beschreiben und eigene Überlegungen zu Themen wie z.-B. Film auszu‐ drücken. -Beherrscht folgende Wortfelder überwiegend: • fr. les lieux (la maison, la chambre, le cinéma), les couleurs, les jours de la semaine, les meubles (la table, le lit, la chaise, l’armoire, l’étagère, le bureau, la télévision, le pouf poire, la console de jeux vidéo, le hamac), la décoration (le poster, la carte postale), le cinéma-(le film, captivant/ passionant, la séance de cinéma), les actions de la vie quotidienne (pouvoir, devoir, se rencontrer, se retrouver, gagner un ticket, sortir ensemble, s’excuser, prendre rendez-vous, se rejoindre, participer à un concours, remettre/ repousser une rencontre, convenir à qn), les sentiments (aimer, se réjourir triste, heureux, être désolé), évenements et incidents, (avoir un problème/ être confronté(e) à un problème) • sp. los lugares (la casa, la habitación, el cine), los colores, los días de la semana, los muebles (la mesa, la cama, la silla, la ventana, la puerta, el armario, la estantería, el escritorio, la televisión, el puf, la videoconsola, la hamaca), la decoración (el póster, la carta postal), el cine (la película), el ocio (ir al cine), las acciones de la vida cotidiana (poder, deber/ tener que/ hay que, quedar, ganar una entrada, salir juntos, citarse, disculparse, reunirse, participar en un concurso/ en una competición, posponer una cita, aplazar una cita para, venir bien), los sentimientos (gustar, alegrarse, triste, feliz, sentirlo/ lamentarlo), eventos e incidentes (tener un problema/ encontrarse ante un problema) B1.2 Anmerkungen. Die Deskriptoren von Lenz/ Studer 2008b wurden leicht an die Aufgabenstellungen angepasst; beispielsweise wurde im Deskriptor für A1.1 der Zusatz „z.B. Einkaufslisten“ entfernt, da es in den Aufgabenstellungen nicht darum geht, eine Einkaufsliste zu erstellen. Tabelle 40: Deskriptoren zu Wortschatzspektrum Das Kriterium Verwendung des Wortschatzes stellt eine erneute Spezifizierung und Differenzierung des Kriteriums Wortschatzspektrum dar. Innerhalb dieses Kriteriums stellt sich die Frage, ob der den Schülern zur Verfügung stehende Wortschatz auch jeweils korrekt und idiomatisch 169 verwendet wurde oder 11.4 Ergebnisse der Sprachtests 333 Komponenten ergibt (vgl. z. B. alt aussehen, durch die Bank). Idiome bezeichnen aber auch Spracheigentümlichkeiten eines Sprechers (vgl. Idiolekt) oder einer regionalen oder sozialen Gruppe von Sprechern (vgl. Dialekt, Soziolekt). Somit stellt die Idiomatik einen Teilbereich der Phraseologie dar (vgl. Korhonen 2016a, 2016b: 279). 170 Es stellt sich hierbei beispielsweise für beide Aufgaben die Frage nach der angemes‐ senen Begrüßungs- und Verabschiedungsformel. Bezüglich der französischen Sprache lässt sich diskutieren, ob die Verabschiedungsformel au revoir in einer Kurznachricht sprachlich angemessen ist. Da es sich bei der Textsorte ‚informelle Kurznachricht‘ um eine relativ neue Textsorte handelt, die im Zuge der Implementierung von kosten‐ losen Kurznachrichtendiensten auf Smartphones entstanden ist, kann die subjektiv empfundene sprachliche Angemessenheit kontextbedingt stark variieren. Da bezüglich informeller Briefe teilweise frz. au revoir als Verabschiedungsformel in der Literatur vorzufinden ist (vgl. Bourdais/ Talon 2017: 142), wird diese Wendung nicht als sprach‐ lich unangemessen gewertet. Die Verabschiedungsformel frz. Je vous prie d’accepter l’expression de mes sentiments respectueux. wäre allerdings zu formell und somit sprach‐ lich innerhalb der durch die Aufgaben vorgegebenen Kommunikationssituationen unangemessen (vgl. Diasystematik nach Koch/ Oesterreicher 2011). ob und inwiefern innerhalb des verfügbaren, aktiven Wortschatzes intralin‐ guale Interferenzen auftreten bzw. die Lexeme in einem wenig idiomatischen sprachlichen Kontext verwendet werden. Zudem stellt sich hier die Frage der sprachlichen Angemessenheit und somit der soziolinguistischen Kompetenz (vgl. Europarat 2001) im Rahmen der Lexik. 170 Lexeme, die durch inkorrekte Orthographie eine andere Bedeutung erlangen, was beispielsweise bei Homo‐ phonen der Fall ist (vgl. frz. toit vs. toi, sp. halla vs. haya), werden sowohl als Fehler in der Verwendung des Wortschatzes als auch als Fehler im Bereich Lexi‐ kalische Orthographie und Interpunktion kategorisiert. Selbst wenn die Intention des oder der Lernenden bezüglich des Ausdrucks einer bestimmten Bedeutung durch die evaluaierende Person meist nachvollziehbar ist, liegt de facto im Text eine nicht normgerechte Verwendung des Wortschatzes vor. Insgesamt wird bei der Auswertung berücksichtigt, dass das Französische tendenziell über deutlich mehr Homophone verfügt als das Spanische, allerdings kommen Interferenzen dieser Art in beiden Stichproben nur sehr selten vor (vgl. Anhänge 3.3.5 und 3.3.6 sowie Anhang 9). Da es sich immer um die erneute Analyse des Wortschatzspektrums han‐ delt, kann die Punktzahl bei der Bewertung des Kriteriums Verwendung des Wortschatzes niemals über der beim Kriterium Wortschatzspektrum erreichten Punktzahl liegen (vgl. CIEP s.a.). Vielmehr stellt sich hier die Frage, ob die Lexeme aus den im Kriterium Wortschatzspektrum jeweils angegebenen Wort‐ feldern tatsächlich auch feinniveaustufengerecht verwendet werden. Da im GeR (Europarat 2001) lediglich Deskriptoren für Niveau A2.2 und Niveau B1.2 vorhanden sind und in lingualevel lediglich für A2.1 konkrete 334 11 Auswertung der Ergebnisse 171 Lingualevel differenziert nicht zwischen Wortschatzspektrum und Verwendung des Wortschatzes, sondern gibt lediglich für jede Teilniveaustufe einen Deskriptor in der Kategorie Wortschatz an, der in erster Linie das Wortschatzspektrum erfasst. Dennoch soll hier zum Ziel des differenzierten Ratings eine Unterscheidung vorgenommen werden (vgl. Lenz/ Studer 2008b, Anhang 2.3.4). Deskriptoren zur Verwendung des Wortschatzes vorliegen (vgl. Lenz/ Studer 2008b, Anhang 2.3.3) 171 , wurden die anderen Feinniveaustufen entsprechend sinngemäß während mehrerer Korrekturdurchgänge ergänzt (vgl. Tabelle 41). Punktzahl Verwendung des Wortschatzes (vgl. GeR, Europarat 2001, lingualevel, Lenz/ Studer 2008b, An‐ hang 2.3.4) Niveau‐ stufe 0 Punkte Verwendet das sehr stark eingeschränkte Repertoire an ein‐ zelnen Wörtern und Wendungen überwiegend inkorrekt. unter A1.1 1 Punkt Beherrscht einen stark begrenzten Wortschatz in Zusammen‐ hang mit einzelnen konkreten Alltagsbedürfnissen, wort‐ schatzbedingte Wiederholungen, Ungenauigkeiten und For‐ mulierungsschwierigkeiten sind innerhalb dieses begrenzten Wortschatzes allerdings überwiegend offensichtlich. A1.1 2 Punkte Beherrscht einen stark begrenzten Wortschatz in Zusam‐ menhang mit konkreten Alltagsbedürfnissen, wortschatz‐ bedingte Wiederholungen, Ungenauigkeiten und Formu‐ lierungsschwierigkeiten sind innerhalb dieses begrenzten Wortschatzes allerdings überwiegend offensichtlich. A1.2 3 Punkte Beherrscht einen begrenzten Wortschatz in Zusammenhang mit konkreten Alltagsbedürfnissen, wortschatzbedingte Wie‐ derholungen, Ungenauigkeiten und Formulierungsschwie‐ rigkeiten sind innerhalb dieses begrenzten Wortschatzes al‐ lerdings teilweise offensichtlich. A2.1 4 Punkte Beherrscht einen begrenzten Wortschatz in Zusammenhang mit konkreten Alltagsbedürfnissen, wortschatzbedingte Wie‐ derholungen, Ungenauigkeiten und Formulierungsschwie‐ rigkeiten treten nur vereinzelt auf. A2.2 5 Punkte Zeigt eine gute Beherrschung des Grundwortschatzes, macht aber noch häufiger elementare Fehler, wenn es darum geht, komplexere Sachverhalte auszudrücken oder wenig vertraute Themen und Situationen zu bewältigen. B1.1 6 Punkte Zeigt eine gute Beherrschung des Grundwortschatzes, macht aber noch elementare Fehler, wenn es darum geht, kom‐ plexere Sachverhalte auszudrücken oder wenig vertraute Themen und Situationen zu bewältigen. B1.2 Tabelle 41: Deskriptoren zu Verwendung des Wortschatzes 11.4 Ergebnisse der Sprachtests 335 172 Fehlende Akzente (frz. accents) auf Majuskeln werden gemäß der Académie française (2020) dabei nicht als Fehler gewertet, da es sich um eine Empfehlung, aber nicht um eine verbindliche Regel handelt. 173 An dieser Stelle sei auf eine Kommaregel des Französischen hingewiesen: Die Abtren‐ nung einer vorangestellten adverbialen Bestimmung (complément circonstanciel) durch ein Komma ist meist obligatorisch (Dethloff/ Wagner 2014: 695; Narjoux 2014: 49), es sei denn es folgt danach eine Inversion (z. B. frz. Ainsi passait la vie dans la cour.). Aus diesem Grund wird eine fehlende Kommasetzung nach vorangestellter adverbialer Bestimmung (complément circonstanciel) ohne nachfolgende Inversion im Korrekturverfahren als Fehler behandelt. Lexikalische Orthographie und Interpunktion: Im Bereich der lexikalischen Or‐ thographie (frz. orthographe lexicale) wird die Fähigkeit, exakt so zu schreiben, wie die Wörter im Wörterbucheintrag vorkommen, gemessen (vgl. Fayol/ Jaffré 2014). Dies betrifft im Französischen die Graphie, die Groß- und Kleinschreibung sowie die Setzung der Akzente und anderer Diakritika, also insbesondere der Akzente Akut, Gravis und Zirkumflex (frz. accents aigu, circonflexe et grave, z. B. in répondre, fenêtre, très) 172 , der Cedille (frz. cédille, z. B. in français) und des Trema (frz. tréma, z. B. in Noël), aber auch des Bindestrichs (frz. trait-d’union) und des Apostrophs (frz. apostrophe) in feststehenden Ausdrücken (z. B. in frz. dira-t-il, aujourd’hui). Des Weiteren umfasst die lexikalische Orthographie die korrekte Apostrophierung von Artikeln oder Präpositionen (z. B. frz. l’école vs. le handicap; à l’école vs. au handicap) und die korrekte Worttrennung am Zeilenende (z. B. frz. ou-blier) (vgl. Fayol/ Jaffré 2014). Im Spanischen zählen zu den frequentesten Akzenten und anderen diakritischen Zeichen der graphische Akzent (sp. tilde/ acento gráfico, z. B. in miércoles), das Trema (sp. diéresis, z. B. in bilingüe) und die Tilde (sp. virgulilla/ tilde) als Teil des Graphems <ñ> (z. B. in sp. mañana). Hinzu kommt schließlich der Bindestrich (sp. guion) in feststehenden Ausdrücken (z. B. sp. franco-alemán) und zur Worttrennung (vgl. RAE 2010a). Teilweise verwischen die Grenzen zwischen inkorrekter lexikalischer Orthographie (z. B. frz. *ordenadeur für ordinateur oder frz. *marci für merci) und Wortneuschöpfungen, welche für das Kriterium Wortschatzspektrum relevant sind (z. B. frz. *armadies für armoires). Die Zuordnung hängt vor allem davon ab, wie viele Grapheme substituiert oder getilgt wurden bzw. inwiefern das Wort in isolierter Form noch als solches erkennbar ist. Bei Grenzfällen werden die entsprechenden Ausdrücke beiden Kategorien zugewiesen (vgl. z. B. frz. *let für lit; vgl. Tabelle 42). Zur lexikalischen Orthographie kommt als Bewertungskriterium die Interpunktion hinzu, welche die Zeichensetzungsregeln betrifft. Hierbei folgt die Korrektur und Auswertung den Zeichensetzungsregeln im Französischen Narjoux (2014) und im Spanischen der RAE (2010a). 173 Eine korrekte Interpunktion wird im 336 11 Auswertung der Ergebnisse GeR (Europarat 2001) erst ab Niveau B1.2 erwartet, daher ist die Interpunktion erst im Rahmen der Unterscheidung von Niveau B1.1 und Niveau B1.2 ein entscheidender Faktor. Für das Spanische wird hier bewusst auf die Bezugnahme auf den Plan Curricular del Instituto Cervantes (PCIC; vgl. Instituto Cervantes 2006, 2007) verzichtet, da dieser lediglich Grapheminventare beschreibt, jedoch nicht auf niveaustufenübliche Orthographiefehler eingeht. Punktzahl Lexikalische Orthographie und Interpunktion (Deskriptoren vgl. GeR (Europarat 2001), lingualevel (Lenz/ Studer 2004b) Niveau‐ stufe 0 Punkte Kann kein französisches bzw. spanisches Wort korrekt schreiben. unter A1.1 1 Punkt Kann einige Wörter und kurze Wendungen aufschreiben, geht aber bei der Umsetzung von Lauten in Buchstaben unsystematisch vor bzw. verwendet eigene Regeln dafür. A1.1 2 Punkte Kann einige Wörter und kurze Redewendungen auf‐ schreiben, geht aber bei der Umsetzung von Lauten in Buchstaben teilweise unsystematisch vor bzw. verwendet eigene Regeln dafür. A1.2 3 Punkte Kann kürzere Texte zu vertrauten Anlässen insgesamt eini‐ germaßen korrekt schreiben; Orthographiefehler sind aber noch ziemlich häufig. A2.1 4 Punkte Macht auch in kürzeren Texten noch oft Orthographiefehler wie z. B. Verdoppelung, Weglassung oder Verwechslung von Konsonanten, Weglassung von stummem <e> (e muet) im Französischen, inkorrekte Akzentsetzung; gröbere orthogra‐ phische Fehler sind selten. A2.2 5 Punkte Kann so korrekt schreiben, dass man das Geschriebene meis‐ tens verstehen kann; Einflüsse der Erstsprache oder von anderen Sprachen auf die Orthographie können offensicht‐ lich sein, z.-B. frz. *kilométre statt kilomètre, sp. *thema statt tema. B1.1 11.4 Ergebnisse der Sprachtests 337 Punktzahl Lexikalische Orthographie und Interpunktion (Deskriptoren vgl. GeR (Europarat 2001), lingualevel (Lenz/ Studer 2004b) Niveau‐ stufe 6 Punkte Kann auch längere Texte und Texte über allgemeinere Themen so korrekt schreiben, dass man sie normalerweise leicht lesen kann. Kann zusammenhängend schreiben; die Texte sind durch‐ gängig verständlich. Orthographie, Interpunktion und Ge‐ staltung sind exakt genug, sodass man sie meistens verstehen kann. B1.2 Anmerkungen. In den Deskriptoren wurde stets „Rechtschreibung“ durch „Orthographie“ und „Zeichensetzung“ durch „Interpunktion“ ersetzt, um insgesamt eine einheitliche Terminologie zu verwenden. In den Deskriptoren des GeR (Europarat 2001) wird bis zu Niveau A2.2 lediglich das Abschreiben genannt. Da in den vorliegenden Aufgabenstellungen keine Abschreibaufgaben integriert sind, werden die Deskriptoren von lingualevel verwendet und entsprechend angepasst. Bei B1.1 und B1.2 wird in den Deskriptoren jeweils das Kriterium der Verständlichkeit angelegt, das hier noch einmal als „leichte Lesbarkeit“ spezifiziert werden soll (vgl. auch Deskriptor für B1.2 für Orthographie von lingualevel von Lenz/ Studer 2008b, Anhang 2.3.3). Tabelle 42: Deskriptoren zu lexikalischer Orthographie und Interpunktion Da bei lingualevel die Deskriptoren zum Bereich Grammatik teilweise auf Satzarten, teilweise auf die Verwendung der Tempi und Modi und teilweise auf die morphosyntaktischen Strukturen Bezug nehmen (vgl. Lenz/ Studer 2008b, Anhang 2.3.3), werden für den Bereich der Grammatik drei Subkompetenzen angelegt, so, wie dies beispielsweise auch bei den DELF-Prüfungen für B1 der Fall ist (vgl. CIEP s.a.). Diese werden im dritten Ratingverfahren wieder zur Kategorie Grammatik zusammengefasst. Dieses Vorgehen erklärt, weshalb die Deskriptoren je nach grammatischem Evaluationskriterium entweder von lingualevel (vgl. Lenz/ Studer 2008b, Anhang 2.3.3) übernommen wurden oder dem GeR (Europarat 2001) entstammen, auf dem lingualevel aufbaut. Komple‐ mentär dazu werden die konkreten sprachlichen Phänomene für Französisch aus dem Référentiel von Chauvet (2008) und für Spanisch aus dem PCIC (Instituto Cervantes 2006, 2007) für die jeweiligen Niveaustufen übernommen. Hierbei ist zu berücksichtigen, dass GeR, Chauvet (2008) und PCIC sich lediglich auf die Stufen A1.2, A2.2 und B1.2 beziehen. Die Teilniveaustufen A1.1, A2.1 und B1.1 wurden daher zum einen durch lingualevel markiert und zum anderen aber als Abstufungen aus GeR, Chauvet (2008) und PCIC erarbeitet. Syntax. Syntax wird aus der didaktischen Sicht des GeR folgendermaßen definiert: „Die Syntax behandelt die Anordnung von Wörtern zu Sätzen gemäß den beteiligten Kategorien, Elementen, Klassen, Strukturen, Prozessen und Beziehungen, die oft als Regelmenge repräsentiert werden“ (Europarat 2001). Das Regelsystem der Syntax beschreibt in der Sprachwissenschaft laut Buß‐ 338 11 Auswertung der Ergebnisse mann (2002: 676) wie aus einem Inventar von Grundelementen bestehend aus Morphemen, Wörtern und Satzgliedern durch spezifische syntaktische Mittel, in erster Linie morphologische Markierungen sowie Wort- und Satz‐ gliedstellungen, alle wohlgeformten Sätze einer Sprache abgeleitet werden können. Syntax umfasst weiterhin das Verhältnis zwischen Wortgruppen bzw. Konstituenten und Ordnungsrelationen in Form von linearen und hierarchi‐ schen Beziehungen auf Satzebene (vgl. Dufter/ Stark 2017: 7). Die Analyse der Syntax beschäftigt sich mit Funktionen wie Subjekt, Objekt, Prädikat, Ad‐ verbialen, usw. sowie mit Konstituenten wie Nominalphrasen, Verbalphrasen, Adjektivalphrasen, Adverbialphrasen, Präpositionalphrasen und Komplemen‐ tärphrasen (Nebensätzen), wobei insbesondere deren Anordnung und Funktion Untersuchungsgegenstände darstellen. Im Rating der Schreibproduktionen wird auch die korrekte oder inkorrekte Auswahl und Stellung der Negationspartikel als der Syntax zugehörig gewertet (z. B. 004 frz. *Je n’ai pas quelque chose special dans ma chambre). Außerdem stehen die korrekte Wortfolge und das Spektrum an syntaktischen Konstruktionen im Vordergrund (vgl. Tabelle 43). Eine Herausforderung innerhalb des Ratingverfahrens besteht bei der Syntax des Französischen in der Frage, ob der korrekte oder inkorrekte Gebrauch der Verben être und il y a in Verbindung mit Ortsangaben (auch im Vergleich zum Gebrauch der spanischen Verben ser, estar und haber) in die Kategorie Syntax fällt oder vielmehr der Verwendung des Wortschatzes oder der Verwendung von Tempi und Modi im Sinne von Verbalaspekt zuzuordnen ist. Im Französischen kann nämlich das Verb être nicht bei Inversion von Subjekt und Verb durch Voranstellung einer adverbialen Bestimmung des Ortes verwendet werden. Stattdessen muss ein sog. verbe présentatif wie z. B. frz. il y a, s’étendre, se trouver, (se) placer, (s’)installer, être situé oder être hébergé gebraucht werden. Somit handelt es sich bei frz. *Dans ma chambre est un lit um eine fehlerhafte, nicht normgetreue Konstruktion, während sowohl frz. Un lit est dans ma chambre als auch frz. Dans ma chambre, il y a un lit korrekte Äußerungen darstellen. Aufgrund der inversiven Satzstellung von Subjekt und Verb, die durch eine vorangestellte adverbiale Bestimmung des Ortes bedingt wird, welche ihrerseits bewirkt, dass das französische Verb être nicht gebraucht werden kann, wird die Entscheidung getroffen, diese fehlerhafte Verwendung von être als Syntaxfehler zu klassifizieren (vgl. Dethloff/ Wagner 2014: 657). 11.4 Ergebnisse der Sprachtests 339 Punktzahl Syntax (Deskriptoren vgl. lingualevel, Lenz/ Studer 2008b, Anhang 2.3.4, vgl. Chauvet 2008: 39, 63, 90, PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 0 Punkte Verwendet keinerlei vollständige Sätze in der Fremdsprache. unter A1.1 1 Punkt Kann einige wenige einfache syntaktische Muster einiger‐ maßen korrekt verwenden, z.-B. Wortfolge in einfachen Deklarativsätzen. A1.1 2 Punkte Kann einige wenige einfache syntaktische Muster einiger‐ maßen korrekt verwenden, z.-B. Wortfolge in einfachen Deklarativsätzen, koordinierte Deklarativsätze mit frz. et/ ou bzw. sp. y/ o und beherrscht die Stellung des Adjektivs wei‐ testgehend. A1.2 3 Punkte Verwendet einige wenige einfache syntaktische Muster teil‐ weise korrekt und teilweise mit starken Einflüssen der Erst‐ sprache, z. B. Wortfolge in einfachen Deklarativsätzen, koor‐ dinierte Deklarativsätze mit frz. et/ ou bzw. sp. y/ o, Negationen (frz. ne pas, ne jamais, ne rien, ne personne, sp. no, nunca, nada, nadie), Interrogativsätze (frz. Intonationsfrage, est-ce que, qui est-ce que, qu’est-ce que, où, quand, combien, comment, pourquoi, sp. Intonationsfrage,-quién, qué, dónde, cuándo, por qué, cómo), Infinitivsätze, Exklamativsätze und beherrscht die Stellung des Adjektivs. A2.1 4 Punkte Verwendet eine Reihe verschiedener gebräuchlicher Satz‐ muster überwiegend korrekt, z. B. einfache Deklarativsätzen, koordinierte Deklarativsätze mit frz. et/ ou bzw. sp. y/ o, Nega‐ tionen (frz. ne pas, ne jamais, ne rien, ne personne, sp. no, nunca, nada, nadie), Interrogativsätze (frz. Intonationsfrage, est-ce que, qui est-ce que, qu’est-ce que, où, quand, combien, comment, pourquoi, quel sp. Intonationsfrage,-quién, qué, dónde, cuándo, por qué, cómo, cuál), Infinitivsätze, Exkla‐ mativsätze und beherrscht die korrekte Stellung des Adjek‐ tivs, die Stellung von Objektpronomen in Verbindung mit Indikativ Präsens, Infinitiv und Imperativ (sp. lo escribo/ esc‐ ríbelo/ escribirlo/ escribéndolo); verwendet zusätzlich einen Adversativ- oder einen Kausalsatz korrekt. A2.2 340 11 Auswertung der Ergebnisse Punktzahl Syntax (Deskriptoren vgl. lingualevel, Lenz/ Studer 2008b, Anhang 2.3.4, vgl. Chauvet 2008: 39, 63, 90, PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 5 Punkte Beherrscht frequente syntaktische Strukturen, z. B. Wortstel‐ lung in einfachen und koordinierten Deklarativsätzen mit frz. et/ ou bzw. sp. y/ o, Negationen (frz. ne pas, ne jamais, ne rien, ne personne, sp. no, nunca, nada, nadie), Interrogativsätze (frz. Intonationsfrage, est-ce que, qui est-ce que, qu’est-ce que, où, quand, combien, comment, pourquoi, quel sp. Intonations‐ frage, quién, qué, dónde, cuándo, por qué, cómo, cuál), Infinitiv‐ sätze, Exklamativsätze und beherrscht die korrekte Stellung des Adjektivs sowie die Stellung von Objektpronomen-in Verbindung mit Indikativ Präsens, Infinitiv und Imperativ (sp. lo escribo/ escríbelo/ escribirlo/ escribéndolo). Verfügt über ein kleines Repertoire (mindestens zwei) kom‐ plexer syntaktischer Strukturen: eingeleitete Nebensätzen (Relativsätze mit frz. qui, que, dont, où; sp. que, de quien/ de que, a quien/ a que; Temporalsätze, Kausalsätzen, Finalsätze, Adversativsätze, Konzessivsätze, Konditionalsätze) und kann diese teilweise korrekt verwenden. B1.1 6 Punkte Beherrscht frequente syntaktische Strukturen, Wortstellung in einfachen und koordinierten Deklarativsätzen mit frz. et/ ou bzw. sp. y/ o, Negationen (frz. ne pas, ne jamais, ne rien, ne personne, sp. no, nunca, nada, nadie), Interrogativsätze (frz. Intonationsfrage, est-ce que, qui est-ce que, qu’est-ce que, où, quand, combien, comment, pourquoi, quel sp. Intonations‐ frage, quién, qué, dónde, cuándo, por qué, cómo, cuál), Infinitiv‐ sätze, Exklamativsätze und beherrscht die korrekte Stellung des Adjektivs sowie die Stellung von Objektpronomen in Ver‐ bindung mit Indikativ Präsens, Infinitiv und Imperativ und Extraposition des Objekts (sp. lo escribo/ escríbelo/ escribirlo/ escribéndolo; exklusive enklitische Satzstellungen: A Luis le doy el libro./ Conviene aprenderlo./ Siento molestarte./ Parece entenderlo). Verfügt über ein breiteres Repertoire komplexer syntakti‐ scher Strukturen: eingeleitete Nebensätzen (Relativsätze mit frz. qui, que, dont, où; sp. que, de quien/ de que, a quien/ a que; Temporalsätze, Kausalsätze, Finalsätze, Adversativsätze, Konzessivsätze, Konditionalsätze) und kann diese teilweise korrekt verwenden. B1.2 Anmerkungen. Zum Ziel der einheitlichen Verwendung der Fachterminologie wird in den Deskriptoren die deutsche Terminologie (z.-B. „Aussagesatz“) immer durch die lateinische Terminologie (z.-B. „Deklarativsatz“) ersetzt. Das Schema in Tabelle 43 wird so gelesen, dass, wenn die genannten Elemente zwar vorhanden, jedoch in der Satzstellung stark fehlerhaft sind, ein Punkt abgezogen wird. Tabelle 43: Deskriptoren zu Syntax 11.4 Ergebnisse der Sprachtests 341 174 Es wird vor allem zwischen imperfektivem Aspekt, also nicht abgeschlossenen Hand‐ lungen (z. B. ausgedrückt mit frz. imparfait bzw. sp. pretérito imperfecto) und dem perfektiven Aspekt, im Sinne von Darstellungen von Handlungen oder Sachverhalten mit ihren zeitlichen Konturen, unterschieden (z. B. ausgedrückt mit frz. passé simple, passé composé, sp. pretérito indefinido). Bezüglich der Aktionsart wird zwischen iterativen und durativen Handlungen unterschieden. Die Kategorie des Aspekts kann somit von der Kategorie der Aktionsart überlagert werden (vgl. inchoative, durative, iterative und resultative Verben). Die Situationsgebundenheit und somit Abhängigkeit von der Kommunikationssituation manifestiert sich, indem Bezüge zu Sprecherinnen und Sprechern, Sprechzeitpunkten und Sprechsituationen hergestellt werden (vgl. RAE 2010b: 430-436; Dethloff/ Wagner 2014: 250-251, 264-265). 175 Ser wird im Spanischen in der Regel mit Attributen kombiniert, die permanente Charakteristika der Subjekte ausdrücken, während estar in der Regel mit Attributen kombiniert wird, die transitorische und zufällige Eigenschaften beschreiben. Nominal‐ prädikate werden ausschließlich mit ser kombiniert (z. B. Ésta es mi habitación). Hinzu kommt ein lexikalischer Gesichtspunkt: El muchacho es alto. beschreibt die Eigenschaft des Jungen, groß gewachsen zu sein. El muchacho está alto. beschreibt vielmehr den Eindruck des Sprechenden, dass der Junge größer geworden ist, seitdem er/ sie ihn das letzte Mal gesehen hat, sodass auch hier permanente und transitorische Aspekte auf die Bedeutung übertragen werden. Folglich können bei ein und demselben Adjektiv je nach kontextueller und diskursiver Beschränkung beide Verben gebraucht werden (vgl. de la Torre/ Ainciburu 2019: 169). Schließlich werden in der ersten Schreibaufgabe insbesondere lokative Attribute in Verbindung mit estar gebraucht (z. B. La mesa está a la izquierda.) sowie in der zweiten Schreibaufgabe temporale Attribute mit ser (z. B. La proyección será el lunes.) (vgl. zu weiteren Regeln zu ser/ estar, z.-B. auch im Kontext der voz pasiva RAE 2010b: 711-715). Verwendung der Tempi und Modi (sowie ser/ estar/ hay im Spanischen). In dieser Kategorie werden die korrekte Verwendung der Tempi und Modi vor dem Hintergrund von Aspekt 174 und Kommunikationssituation sowie im Spanischen auch die Unterscheidung zwischen ser/ estar/ hay evaluiert, wobei im Falle von ser und estar semantische, syntaktische, lexikalische und pragmatische Gesichts‐ punkte sowie oft eine Kombination davon in die Unterscheidung einfließen (vgl. RAE 2010b: 711-715, de la Torre/ Ainciburu 2019: 169). 175 Die Klassifizierung der Konstruktionen mit ser/ estar/ hay in die Feinniveaustufen gestaltet sich besonders komplex, weshalb hier explizit auf das PCIC (Instituto Cervantes 2006, 2007) Bezug genommen wird. Bei der Punkteverteilung im Spanischen wird somit eine Punktzahl für die Tempi und Modi und eine für ser/ estar/ hay gegeben und anschließend das Niveau für die Gesamtkategorie Verwendung der Tempi und Modi und von ser/ estar/ hay bestimmt. Im Mittelpunkt bei den beiden Aufgabenstellungen stehen die korrekte Verwendung des frz. présent de l’indicatif bzw. des sp. presente de indicativo sowie des frz. passé composé bzw. des sp. pretérito indefinido oder pretérito perfecto 176 , wenn in der zweiten Schreibaufgabe davon berichtet werden muss, 342 11 Auswertung der Ergebnisse 176 Hier können beide Tempora verwendet werden, da in der Aufgabenstellung der zweiten Teilaufgabe nicht spezifiziert wird, wann das Kinoticket gewonnen wurde (vgl. Anhang 2.3.4). dass eine Eintrittskarte fürs Kino gewonnen wurde. Außerdem wird in der zweiten Schreibaufgabe nach dem frz. conditionnel du présent bzw. dem sp. condicional simple verlangt, das im Rahmen höflicher Bitten eingesetzt werden soll. Darüber hinaus bieten sich in der zweiten Schreibaufgabe auch die Ver‐ wendung des frz. futur proche und futur simple bzw. des sp. futuro próximo und futuro simple an, wenn von Plänen für die Zukunft gesprochen wird, und auch der Einsatz des französischen impératif positif bzw. des spanischen imperativo positivo im Sinne von Aufforderungen wird durch die zweite Aufgabenstellung angeregt. Obwohl Zeitformen wie das frz. imparfait und plus-que-parfait bzw. das sp. pretérito imperfecto und pretérito pluscuamperfecto in den beiden gefor‐ derten Textproduktionen nicht direkt verlangt werden, werden sie aufgrund eines möglichen Auftretens sowie der Vollständigkeit halber ins Schema unter den entsprechenden Niveaustufen mit aufgenommen, auch wenn davon ausge‐ gangen wird, dass diese in den Texten kaum wiederzufinden sind und deren Auftreten somit nicht als ausschlaggebend sondern nur als zusätzliches Indiz für die Einordnung in eine Feinniveaustufe gewertet werden kann. Zu bedenken sind außerdem Grenzfälle, die zwischen einer korrekten Ver‐ wendung und einer inkorrekten Bildung der Zeitform stehen, was insbesondere im frz. passé composé oft vorkommt: Während Formen wie frz. *j’ai gagne, *j’ai gagner, *je suis faite und *j’ai won noch als korrekte Verwendung des passé composé bei inkorrekter Bildung gewertet werden, da hier klar ersichtlich wird, dass der oder die Schreibende bewusst das passé composé verwenden wollte, werden Formen wie frz. *je gagné, *je gewonnen, *je gagner nicht mehr als korrekte Verwendung des passé composé gewertet, da die Absicht, diese Zeitform zu verwenden, nicht mehr eindeutig nachvollziehbar ist. Teilweise ist es auch bei diesem Kriterium nötig, Mittelwerte zu bestimmen, das heißt beispielsweise bei der korrekten Verwendung von frz. présent de l’indicatif und conditionnel du présent bzw. sp. presente de indicativo und condicional simple werden vier Punkte vergeben. 11.4 Ergebnisse der Sprachtests 343 Punktzahl Verwendung der Tempi und Modi (sowie von ser/ estar/ hay im Spanischen) (Deskriptoren vgl. Chauvet 2008: 39, 63, 90; PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 0 Punkte Verwendet keine Tempi und Modi korrekt. unter A1.1 1 Punkt Verwendet das frz. présent de l’indicatif/ sp. presente de indica‐ tivo bei sehr frequenten Verben (z. B. frz. avoir, être, sp. tener, ser [s.-u.]) in der 1. und 3. Person Singular korrekt. -Spanisch: Verwendet folgende Funktion von ser überwiegend korrekt: ser ohne Adjektiv mit Funktion der Identifikation, z.-B. soy alumno, es él A1.1 2 Punkte Verwendet das frz. présent de l’indicatif/ sp. presente de indi‐ cativo bei sehr frequenten Verben (z. B. frz. avoir, être, aller, il y a, regelmäßige Verben auf -er, -ir, -re, sp. tener, ir, regelmäßige Verben auf -ar, -ir; ser/ estar siehe unten) in der 1. und 3. Person Singular und Plural überwiegend korrekt und benutzt feststehende Höflichkeitsfloskeln (in Form von chunks) wie z.-B. frz. je voudrais, sp. querría. -Spanisch: Verwendet folgende Funktionen von ser/ estar/ hay überwiegend korrekt: • ser ohne Adjektiv in Verbindung mit einem Material, einer Identifikation oder einer Zeitangabe, z.-B. soy alumno, es él, es lunes • ser in Verbindung mit Farbadjektiven (z.-B. Mi mesa es roja.) • estar in Verbindung mit einer Ortsangabe, z.-B. está aquí; la mesa está a la derecha. • estar in den folgenden Wendungen: ¿Qué tal estás? ¿Cómo estás? A1.2 344 11 Auswertung der Ergebnisse 177 Da im PCIC (Instituto Cervantes 2007) das futuro simple/ futuro imperfecto erst bei Niveau B1 aufgeführt wird, wird es hier erst bei Niveau B1.1 und nicht wie in Französisch schon bei Niveau A2.1 aufgenommen. Punktzahl Verwendung der Tempi und Modi (sowie von ser/ estar/ hay im Spanischen) (Deskriptoren vgl. Chauvet 2008: 39, 63, 90; PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 3 Punkte Verwendet zwei der folgenden Tempi und Modi überwiegend korrekt: • frz. présent de l’indicatif, passé composé, imparfait, impératif positif et négatif (bei einigen Verben auf -er, -ir), passé récent (venir de faire qc), futur proche, futur simple • sp. presente de indicativo, pretérito indefinido, pretérito perfecto, pretérito imperfecto, imperativo afirmativo, pasado reciente (acabar de hacer algo), futuro próximo, futuro simple 177 Spanisch: Verwendet folgende Funktionen von ser/ estar/ hay überwiegend korrekt: • ser ohne Adjektiv in Verbindung mit einem Material, einer Identifikation oder einer Zeitangabe, z.-B. soy alumno, es él, es lunes • ser ohne Adjektiv zum Ausdruck eines Besitzes, z. B. es mi libro; zur Angabe einer Menge oder Anzahl, z.-B. somos tres • ser in Verbindung mit einem Adjektiv, das ausschließlich mit ser verwendet werden kann, z.-B. es útil, soy sincero, es posible, es importante, es gratis, es especial • estar in Verbindung mit einer Ortsangabe, z.-B. está aquí; la mesa está a la derecha. • estar in folgenden Wendungen: ¿Qué tal estás? ¿Cómo estás? • haber in Verbindung mit einer Ortsangabe, z.-B. hay una cama A2.1 11.4 Ergebnisse der Sprachtests 345 178 Das Präsens wird im Französischen nicht so häufig anstelle des Futurs verwendet wie im Deutschen und ist vor allem im gesprochenen Französisch geläufig (z. B. frz. Demain, je vais au cinéma), wenn in der Zukunft liegende Geschehen, Vorgänge, Ereignisse als sicher eintretend angesehen werden oder wenn die Zukunft in Form einer adverbialen Bestimmung eindeutig markiert wird (vgl. Dethloff/ Wagner 2014: 253). Daher muss stets geprüft werden ob die Verwendung des Präsens mit Bezug auf die Zukunft im jeweiligen Kontext akzeptabel ist. 179 Da im PCIC (Instituto Cervantes 2007) der imperativo negativo erst bei Niveau B1 aufgeführt wird, wird er hier erst bei Niveau B1.1 und nicht wie in Französisch schon bei Niveau A2.1 aufgenommen. Punktzahl Verwendung der Tempi und Modi (sowie von ser/ estar/ hay im Spanischen) (Deskriptoren vgl. Chauvet 2008: 39, 63, 90; PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 4 Punkte Verwendet drei der folgenden Tempi und Modi überwiegend korrekt: • frz. présent de l’indicatif 178 , passé composé, imparfait, impératif positif et négatif (de quelques verbes en -er, -ir), passé récent (venir de faire qc), futur proche, futur simple • sp. presente de indicativo (inkl. futuro programado o natural: Mañana voy al cine.), pretérito indefinido, pretérito perfecto, pretérito imperfecto, imperativo afirmativo 179 , pasado reciente (acabar de hacer algo) Spanisch: Verwendet folgende Funktionen von ser/ estar/ hay überwiegend korrekt: • ser ohne Adjektiv zum Ausdruck eines Besitzes, z. B. es mi libro; zur Angabe einer Menge oder Anzahl, z.-B. somos tres; zur Angabe eines Grunds, z.-B. es por tu culpa; zur Angabe einer Finalität, z.-B. es para escribir • ser in Verbindung mit einem Adjektiv, das ausschließlich mit ser verwendet werden kann, z.-B. es útil, soy sincero, es posible, es importante, es gratis, es especial • estar in Verbindungen mit Adjektiven, die ausschließlich mit estar verwendet werden können, z. B. estoy triste, estoy contenta, estoy feliz • estar in folgenden Wendungen: ¿Qué tal estás? ¿Cómo estás? • estar in festen Wendungen, z.-B. estar de acuerdo • haber in Verbindung mit einer Ortsangabe, z.-B. hay una cama A2.2 346 11 Auswertung der Ergebnisse Punktzahl Verwendung der Tempi und Modi (sowie von ser/ estar/ hay im Spanischen) (Deskriptoren vgl. Chauvet 2008: 39, 63, 90; PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 5 Punkte --------------- Verwendet zusätzlich zu den bei A2.2 genannten Tempi und Modi eines der folgenden Tempi und Modi überwiegend korrekt: • frz. participe présent, impératif positif et négatif (von einigen Verben auf -er, -ir, -re), Unterschied zwischen passé composé und imparfait, passif, subjonctif, si + imparfait + conditionnel présent (Hypothese), si + passé composé + présent ou futur ou impératif (Bedingung), conditionnel présent (zum Ausdruck eines Wunsches oder einer Bitte), conditionnel passé (zum Ausdruck des Bedau‐ erns), plus-que-parfait • sp. gerundio (ohne estar), imperativo afirmativo y negativo, futuro simple, Unterschied zwischen pretérito indefinido, pretérito perfecto y pretérito imperfecto, voz pasiva, subjuntivo de presente, si + pretérito imperfecto de subjuntivo + condicional (Bedingung/ Hypothese), condicional simple (zum Ausdruck eines Wunsches oder einer Bitte), condicional compuesto (zum Ausdruck des Bedauerns), pretérito pluscuamperfecto Spanisch: Beherrscht neben den in A2.2 genannten Aspekten folgende Bereiche von ser/ estar/ hay überwiegend: • (estar in Verbindung mit gerundio) • (estar in Verbindung mit dem participio perfecto) • ser ohne Adjektiv in unpersönlichen Konstruktionen, z. B. es de noche, es tarde, es una pena que no pueda ir al cine otro día • ser in Verbindung mit der Ortsangabe von Veranstal‐ tungen und Terminen, z.-B. La cita es en el cine Callao. vs. El cine está en la plaza de Callao.; La presentación de la película es en el cine de Stuttgart. • ser in Verbindung mit Adjektiven, die sowohl mit ser als auch mit estar vorkommen können: es agradable vs. está agradable, es especial vs. está especial, es pequeño vs. está pequeño, es perfecto vs. está perfecto, es bonito vs. está bonito, es chulo vs. está chulo; Farbadjektive mit Ausnahme von verde (siehe unten) (es rojo vs. está rojo) B1.1 --------------- 11.4 Ergebnisse der Sprachtests 347 Punktzahl Verwendung der Tempi und Modi (sowie von ser/ estar/ hay im Spanischen) (Deskriptoren vgl. Chauvet 2008: 39, 63, 90; PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 6 Punkte Verwendet zusätzlich zu den für A2.2 genannten Tempi und Modi zwei der folgenden Tempi und Modi korrekt: • frz. participe présent, impératif positif et négatif (von einigen Verben auf -er, -ir, -re), Unterschied zwischen passé composé und imparfait, passif, subjonctif, si + imparfait + conditionnel présent (Hypothese), si + passé composé + présent ou futur ou impératif (Bedingung), conditionnel présent (zum Ausdruck eines Wunsches oder einer Bitte), conditionnel passé (zum Ausdruck des Bedau‐ erns), plus-que-parfait • sp. gerundio (ohne estar), imperativo afirmativo y negativo, futuro simple, Unterschied zwischen pretérito indefinido, pretérito perfecto y pretérito imperfecto, voz pasiva, subjuntivo de presente, si + pretérito imperfecto de subjuntivo + condicional simple (Bedingung/ Hypothese), condicional simple (zum Ausdruck eines Wunsches oder einer Bitte), condicional compuesto (zum Ausdruck des Bedauerns), pretérito pluscuamperfecto Spanisch: Beherrscht neben den bei A2.2 genannten As‐ pekten folgende Bereiche von ser/ estar überwiegend: • ser ohne Adjektiv in unpersönlichen Konstruktionen, z. B. es de noche, es tarde, es una pena que no pueda ir al cine otro día • estar bien, ser/ estar bueno; estar mal, ser/ estar malo; ser/ estar mejor; ser/ estar peor • ser und estar in Verbindung mit Adjektiven, die sowohl mit ser als auch mit estar vorkommen können und eine Bedeutungsänderung erfahren, z. B. es listo (vs. está listo), es verde (vs. está verde). • Unterschiede zwischen: estar bien, ser/ estar bueno; estar mal, ser/ estar malo; ser/ estar mejor; ser/ estar peor B1.2 Anmerkungen. Die eingeklammerten Funktionen von ser und estar werden für das Vergeben der entsprechenden Punktzahl nicht vorausgesetzt, da deren Verwendung für die Erfüllung der Aufgaben kaum erforderlich ist. Tabelle 44: Deskriptoren zu Verwendung der Tempi und Modi (sowie von ser/ estar/ hay im Spanischen) Morphosyntax und grammatische Orthographie: Morphosyntax ist nicht immer eindeutig von Syntax abgrenzbar. Dennoch versuchen Dufter und Stark (2017) eine Abgrenzung vorzunehmen: Morphosyntax stellt nicht lediglich die Verbin‐ dung zwischen Morphologie und Syntax dar, sondern “the interface of grammar in which the components of morphology and syntax interact” (Dufter/ Stark 348 11 Auswertung der Ergebnisse 180 Der Terminus der Valenz steht im Zentrum der Tradition der Dependenzgrammatik (vgl. Tesnières 1988; Dürscheid 2007: 109). Die Konstruktionsgrammatik legt den Fokus wiederum auf die Rolle lexikalischer Information in Strukturen von Satzgliedern und Sätzen. Auch innerhalb konstruktionsgrammatischer Diskussionen zum Kontinuum zwischen Grammatik und Lexik tritt der Valenzbegriff auf (vgl. Fillmore 2013: 118-126). 2017: 8). Demnach behandelt Morphosyntax flektierende Morpheme innerhalb der Kategorien Person, Numerus, Genus, Kasus, Tempus, Aspekt und Modus. Wortbildung und somit sowohl Komposition als und Derivation gehören auf‐ grund der nicht vorhandenen Intersektionalität zur Syntax wiederum nicht zur Morphosyntax. Was jedoch unter Morphosyntax fällt, sind neben Flexion die damit verbundenen Kategorien Kongruenz und Rektion (vgl. Dufter/ Stark 2017: 8). Kongruenz bezeichnet die regelhafte Übereinstimmung von systematisch interdependenten Wörtern oder Satzteilen hinsichtlich ihrer grammatischen Merkmale. Dabei kann es sich um Konkordanz in Genus und Numerus von Nomen und Adjektiv (z. B. frz. une lampe bleue, sp. una lámpara roja) handeln, aber auch um Konkordanz von Personalpronomen und konjugierten Verben in Person und Numerus (z.-B. frz. ils écrivent, sp. [ellos] escriben). Darunter fallen weiterhin die Konkordanz aller Arten von Determinanten mit dem Nomen (z. B. frz. une chambre, la chambre, ma chambre, cette chambre, toute la chambre; sp. una habitación, la habitación, mi habitación, esta habitación, toda la habitación) oder die Konkordanz von einem Pronomen mit dem Nomen, auf das es sich bezieht (z. B. frz. Les livres avec lesquels j’apprends le français […], sp. Los libros con los cuales estudio español.). Im Französischen existiert schließlich auch die Kon‐ kordanz des participe passé mit dem Subjekt bei der Bildung von passé composé mit être (z. B. frz. Elle est venue.). Rektion bezeichnet die Tatsache, dass bestimmte Merkmale der grammatischen Form, wie zum Beispiel Kasusmerkmale einseitig durch einen Ko-Konstituenten auferlegt werden können. Es handelt es sich also um die Beziehung zwischen einem Regens und einem Dependens bzw. Rektum, wobei grammatische Merkmale wie Kasus vom regierenden an das regierte Element zugewiesen werden. In diesem Zusammenhang wird bei der Beziehung zwischen Verben (aber auch Nomen oder Adjektiven) und deren Komplementen für die spezielle Kombination aus syntaktischer Interdependenz und Rektion einerseits und semantischen und pragmatischen Interdependenz‐ merkmalen andererseits der Begriff der Valenz verwendet. 180 Zusammenfassend können die morphologischen, syntaktischen und teilweise auch semantischen Interdependenzbeziehungen zwischen Determinant und Nomen (z. B. frz. un livre; sp. un libro), zwischen Nomen und Adjektiv (z. B. frz. un livre vert, sp. un libro verde), zwischen Nomen und Verb (z. B. frz. le livre est […], sp. el libro es […]), zwischen Verb und Adverb (z. B. frz. Ça va bien; Il marche lentement.; 11.4 Ergebnisse der Sprachtests 349 sp. Estoy bien; Va despacio.), zwischen Verb und Objekt (z.-B. frz. Je te donne un conseil.; sp. Te doy un consejo.), zwischen Präposition und Nomen (z. B. frz. à droite, sp. a la derecha) und zwischen Nomen und Pronomen (z. B. frz. Le livre que je vourdrais lire.; sp. El libro que querría leer.) im Rahmen der Kategorien Flexion, Rektion und Kongruenz zur Morphosyntax gezählt werden. In der Grammatik des Französischen gibt es des Weiteren den Begriff der grammatischen Ortho‐ graphie (frz. orthographe grammaticale) (vgl. Blanche-Benveniste 2003; Priet 2014), der als ortografía gramatical oder morfografemática auch im Kontext des Spanischen anzutreffen ist (vgl. z. B. Bizcarrondo Ibañez/ Urrutia Cárdenas 2010: 135-162), wobei aufgrund der unterschiedlichen Strukturen der beiden Sprachen nicht immer eine synonyme Verwendung dieser beiden Termini möglich ist. Neben der schriftlichen Markierung der Konkordanz, Flexion und Rektion werden hierunter auch die korrekte Schreibung von homophonen Grammemen, oft unter Verwendung von diakritischen Zeichen (z. B. frz. où vs. ou; çe vs. ce vs. se; est vs. et; sp. sé vs. se, dé vs. de, mas vs. más, esta, está vs. ésta, dónde vs. donde), bezeichnet. Auch beispielsweise eine korrekte Schreibung der Interrogativadverbien (z. B. frz. est-ce que oder qu’est-ce que, sp. por qué vs. porque, siehe oben) zählt zu dieser Kategorie. Während des Ratingvorgangs muss also genau zwischen lexikalischer und grammatischer Orthographie unterschieden werden. Teilweise können sogar innerhalb ein und desselben Wortes sowohl Fehler in der lexikalischen Orthographie als auch Fehler in der grammatischen Orthographie auftreten. Beispielsweise handelt es sich bei frz. *j’éspere beim ersten Akzentfehler um einen Fehler in der lexikalischen Orthographie und beim zweiten, fehlenden Akzent um einen Fehler in der grammatischen Orthographie, da ersterer den Verbstamm und zweiterer die Flexion des Verbs betrifft (vgl. Priet 2014). 350 11 Auswertung der Ergebnisse 181 Hier wurde „grammatischer Strukturen“ durch „morphosyntaktischer Strukturen“ ersetzt, um konkret auf die Morphosyntax einzugehen. 182 Il y a wird als feststehende Wendung gewertet, sodass das Pronomen y innerhalb von dieser Wendung nicht noch einmal separat als korrektes Pronomen gewertet wird. Punktzahl Morphosyntax und grammatische Orthographie (Deskriptoren vgl. Lenz/ Studer 2008b (vgl. Anhang 2.3.4; Chauvet 2008: 39, 63, 90; Europarat 2001 (grammatische Kor‐ rektheit); PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 0 Punkte Verwendet keine fremdsprachlichen morphosyntaktischen Formen, keine Konjugationsformen oder Pluralmarkie‐ rungen. unter A1.1 1 Punkt Verwendet einige wenige morphosyntaktische Formen wie besonders einzelne Konjugationsformen und Pluralmarkie‐ rungen, dies aber unsystematisch. • Unbestimmte und bestimmte Artikel • Angleichung sehr frequenter Adjektive (z.-B. frz. grand, petit, sp. grande, pequeño) • Formen des frz. présent de l’indicatif bzw. sp. presente de indicativo bei sehr frequenten Verben (z. B. frz. avoir, être, sp. tener, ser/ estar) in der 1. und 3. Person Singular und Plural A1.1 2 Punkte Zeigt nur eine begrenzte Beherrschung einiger weniger ein‐ facher morphosyntaktischer Strukturen in einem auswendig gelernten Repertoire. 181 • Unbestimmte und bestimmte Artikel • Possessivbegleiter (frz. mon, ton, son, sp. mi, tu, su) • Genus der Substantive • Numerus der Substantive • Angleichung sehr frequenter Adjektive (z.-B. frz. grand, petit; sp. grande, pequeño) • Personalpronomen (Spanisch: Absenz des Subjekts bzw. des Subjektpronomens bei evidentem Bezug, z.-B. hago mis deberes) • Zeitangaben: Präposition + Datum, Monat, Jahreszeit oder Jahr • Ortsangaben: frz. à + Stadt; sp. en + Stadt • Formen des frz. présent de l’indicatif bzw. sp. presente de indicativo bei sehr frequenten Verben (z. B. frz. avoir, être, sp. tener, ser/ estar) in der 1. und 3. Person Singular und Plural • Frz. il y a 182 / sp. hay und frz. aller à/ sp. ir a + Ortsangabe • Feststehende Höflichkeitsfloskeln wie z.-B. frz. je voudrais, sp. querría A1.2 11.4 Ergebnisse der Sprachtests 351 Punktzahl Morphosyntax und grammatische Orthographie (Deskriptoren vgl. Lenz/ Studer 2008b (vgl. Anhang 2.3.4; Chauvet 2008: 39, 63, 90; Europarat 2001 (grammatische Kor‐ rektheit); PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 3 Punkte Zeigt eine begrenzte Beherrschung einiger elementarer mor‐ phosyntaktischer Strukturen (siehe unten). Verwendet häufige Konjugationsformen wichtiger Verben im Präsens, macht dabei aber oft Fehler (z.-B. Übergeneralisie‐ rung der 3. Person Singular auf andere Personalformen). -Morphosyntaktische Strukturen: • Unbestimmte und bestimmte Artikel • Possessivbegleiter, Demonstrativbegleiter • Genus der Substantive • Numerus der Substantive • Angleichung frequenter Adjektive (z.-B. frz. grand, petit, sp. grande, pequeño) • Unterschied zwischen frz. très und beaucoup, sp. muy und mucho • Personalpronomen (Spanisch: Absenz des Subjekts bzw. des Subjektpronomens bei evidentem Bezug, z.-B. hago mis deberes, gané un ticket) • Zeitangaben: Präposition + Datum, Monat, Jahreszeit oder Jahr • Ortsangaben: frz. à + Stadt; sp. en + Stadt • Frz. il y a/ sp. hay und frz. aller à/ sp. ir a + Stadt/ Land • Formen des frz. présent de l’indicatif bzw. sp. presente de indicativo bei sehr frequenten Verben (z. B. frz. avoir, être) • Infinitivkonstruktionen (z.-B. frz. vouloir/ pouvoir/ devoir faire qc, sp. querer/ poder/ tener que hacer algo) • Feststehende Höflichkeitsfloskeln wie z.-B. frz. je voudrais; sp. querría A2.1 352 11 Auswertung der Ergebnisse 183 Hier ist insbesondere auf die Komplexität der Angleichung von Farbadjektiven im Französischen im Rahmen der ersten Aufgabe hinzuweisen: Während Farbadjektive wie bleu, rouge, jaune, vert, blanc, noir, châtain ebenso wie von Substantiven abgeleitete Farbadjektive écarlate, mauve, pourpre, rose veränderlich sind und somit in Numerus und Genus angeglichen werden, sind einige substantivische Farbbezeichnungen unver‐ änderlich (z. B. orange, marron, kaki, lilas, beige, turquoise). Ebenso bleiben zusammen‐ gesetzte Adjektive, die Farbnuancierungen ausdrücken, unveränderlich (z. B. bleu clair, bleu foncé, gris bleu, jaune doré, bleu marine, châtain roux). Werden zwei Farbadjektive, die unterschiedliche Farben bezeichnen und dasselbe bzw. dieselben Objekte charakte‐ risieren, nebeneinandergestellt und durch et verbunden, ist der Gebrach schwankend (z. B. des pommes rouge(s) et vert(es), des drapeaux blanc(s) et bleu(s)) (vgl. Dethloff/ Wagner 2014: 63-64). Punktzahl Morphosyntax und grammatische Orthographie (Deskriptoren vgl. Lenz/ Studer 2008b (vgl. Anhang 2.3.4; Chauvet 2008: 39, 63, 90; Europarat 2001 (grammatische Kor‐ rektheit); PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe 4 Punkte ------------------------- Kann einige einfache morphosyntaktische Strukturen kor‐ rekt verwenden, macht aber noch systematisch elementare Fehler, z. B. bei der Markierung der Subjekt-Verb-Kongruenz; trotzdem wird in der Regel klar, was er/ sie ausdrücken möchte. -Morphosyntaktische Strukturen: • Unbestimmte und bestimmte Artikel • Possessivbegleiter (sp. auch betonte Formen, z.-B. amigo mío), Demonstrativ-, Indefinit- und Interrogativbegleiter • Genus der Substantive • Numerus der Substantive • Angleichung von Adjektiven 183 • Personalpronomen und Demonstrativpronomen (Spa‐ nisch: Präsenz eines Pronomens um eine Ambiguität aufzulösen, z. B. Él preguntó y ella contestó; yo no puedo ir, pero tú igual sí) • Das französische Pronomen y bzw. das spanische Adverb allí/ allá • Interrogativpronomen und -adverbien • Relativpronomen frz. qui und que, sp. que • Direkte und indirekte Objektpronomen, Valenz der Verben mit indirektem Pronomen (z.-B. frz. parler/ demander à qqn, sp. hablar con alguien, preguntar algo a alguien) • Zeitangaben: Präposition + Datum, Monat, Jahreszeit oder Jahr • Ortsangaben: frz. à + Stadt; sp. en + Stadt; Präpositionen des Ortes (z.B. frz. à droite, à gauche, derrière, devant, sp. a la derecha, a la izquierda, detrás, delante), Ortsadverbien (z.-B. frz. devant, derrière, dessus, au-dessus, au-dessous, dedans, à côté, près, loin; sp. arriba, abajo, delante, detrás, encima, debajo, al lado, cerca, lejos) 184 A2.2 -------------------------- 11.4 Ergebnisse der Sprachtests 353 184 Einige Präpositionen können im Französischen als Ortsadverb benutzt werden (z. B. derrière, devant, dessus, au-dessus, dedans). So stellt derrière in La gare se troive derrière la mairie eine Präposition und La gare se trouve derrière ein Ortsadverb dar (vgl. Dethloff/ Wagner 2014: 93). 185 Beispielsweise hat das Verb acheter im présent de l’indicatif zwei Verbstämme: j’achète, tu achètes, il achète, nous achetons, vous achetez, ils achètent. Zwei Verbstämme haben auch préférer und appeler: je préfère, tu préfères, il préfère, nous préférons, vous préférez, ils préfèrenz bzw. j’appelle, tu appelles, il appelle, nous appelons, vous appelez, ils appellent. Schließlich zählen hierzu auch envoyer und payer (j’envoie vs. nous envoyons) sowie voir und croire (je vois vs. nous voyons). Punktzahl Morphosyntax und grammatische Orthographie (Deskriptoren vgl. Lenz/ Studer 2008b (vgl. Anhang 2.3.4; Chauvet 2008: 39, 63, 90; Europarat 2001 (grammatische Kor‐ rektheit); PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe • Formen des frz. présent de l’indicatif (bei Verben mit ein und zwei Verbstämmen 185 ) und des sp. presente de indicativo • Frz. il y a; aller à, être à, venir de, entrer dans + Ortsangabe; • sp. hay; ir a, estar en, venir de, entrar en + Ortsangabe • Reflexive Verben (z.-B. frz. se lever, sp. levantarse, imaginarse) und reziproke Verben (z.-B. frz. se retrouver, se voir, sp. verse) • Infinitivkonstruktionen (frz. vouloir/ pouvoir/ devoir faire qc; sp. querer/ poder/ tener que hacer algo) • Formen des frz. passé composé; sp. pretérito indefinido und pretérito perfecto • Formen des frz. imparfait; sp. pretérito imperfecto 5 Punkte Kann verschiedene Verbformen verwenden, um zeitliche Ver‐ hältnisse anzuzeigen, macht dabei aber noch häufig Fehler. Kann einige einfache morphosyntaktische Strukturen kor‐ rekt verwenden, macht aber noch systematisch elementare Fehler, z. B. bei der Markierung der Subjekt-Verb-Kongruenz; trotzdem wird in der Regel klar, was er/ sie ausdrücken möchte. -Morphosyntaktische Strukturen: • Unbestimmte und bestimmte Artikel • Possessiv-, Demonstrativ-, Indefinit- und Interrogativbe‐ gleiter • Genus der Substantive • Numerus der Substantive • Angleichung von Adjektiven • Adverbien auf frz. -ment, sp. -mente • Das französische Pronomen y bzw. das spanische Adverb allí/ allá • Personalpronomen und Demonstrativpronomen (im Spa‐ nischen inklusive Präsenz und Absenz des Subjektprono‐ mens) B1.1 354 11 Auswertung der Ergebnisse Punktzahl Morphosyntax und grammatische Orthographie (Deskriptoren vgl. Lenz/ Studer 2008b (vgl. Anhang 2.3.4; Chauvet 2008: 39, 63, 90; Europarat 2001 (grammatische Kor‐ rektheit); PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe • Interrogativpronomen und -adverbien • Relativpronomen frz. qui und que, sp. que • Direkte und indirekte Objektpronomen, Valenz der Verben mit indirektem Pronomen (z.-B. frz. parler/ demander à qqn, sp. hablar con alguien, preguntar algo a alguien) • Zeitangaben: Präposition + Datum, Monat, Jahreszeit oder Jahr • Ortsangaben: frz. à + Stadt; sp. en + Stadt; Präpositionen des Ortes (z.B. frz. à droite, à gauche, derrière, devant, sp. a la derecha, a la izquierda, detrás, delante), Ortsadverbien (z.-B. frz. devant, derrière, dessus, au-dessus, au-dessous, dedans, à côté, près, loin, sp. arriba, abajo, delante, detrás, encima, debajo, al lado, cerca, lejos) • Formen des frz. présent de l’indicatif (bei Verben mit ein und zwei Verbstämmen) und des sp. presente de indicativo • Frz. il y a; aller à, être à, venir de, entrer dans + Ortsangabe; • sp. hay; ir a, estar en, venir de, entrar en + Ortsangabe • Reflexive Verben (z.-B. frz. se lever, sp. levantarse, imaginarse) und reziproke Verben (z.-B. frz. se retrouver, se voir, sp. verse) • Infinitivkonstruktionen (frz. vouloir/ pouvoir/ devoir faire qc; sp. querer/ poder/ tener que hacer algo) • Formen des frz. passé composé; sp. pretérito indefinido und pretérito perfecto • Formen des frz. imparfait; sp. pretérito imperfecto • Formen des frz. conditionnel présent, sp. condicional simple 6 Punkte Kann sich in vertrauten Situationen ausreichend korrekt verständigen; im Allgemeinen gute Beherrschung der mor‐ phosyntaktischen Strukturen trotz deutlicher Einflüsse der Erstsprache. Zwar kommen Fehler vor, aber es bleibt klar, was ausgedrückt werden soll. -Morphosyntaktische Strukturen: • Unbestimmter und bestimmter Artikel • Possessiv-, Demonstrativ-, Indefinit- und Interrogativbe‐ gleiter • Genus der Substantive • Numerus der Substantive • Angleichung der Adjektive • Adverbien auf frz. -ment, sp. -mente • Das französische Pronomen y bzw. das spanische Adverb allí/ allá • Personalpronomen und Demonstrativpronomen (im Spa‐ nischen inklusive Präsenz und Absenz des Subjektprono‐ mens) • Interrogativpronomen und -adverbien B1.2 11.4 Ergebnisse der Sprachtests 355 Punktzahl Morphosyntax und grammatische Orthographie (Deskriptoren vgl. Lenz/ Studer 2008b (vgl. Anhang 2.3.4; Chauvet 2008: 39, 63, 90; Europarat 2001 (grammatische Kor‐ rektheit); PCIC, Instituto Cervantes 2006, 2007) Niveau‐ stufe • Relativpronomen und -adverbien frz. qui, que, dont, où, sp. que, el que/ la que/ los que/ las que, el cual/ la cual/ los cuales/ las cuales, quien/ quienes, cuyo/ cuya/ cuyos/ cuyas, cuanto/ cuanta/ cuantos/ cuantas, donde, cuando, como • Direkte und indirekte Objektpronomen, Valenz der Verben mit indirektem Pronomen (z.-B. frz. parler/ demander à qqn, sp. hablar con alguien, preguntar algo a alguien) • Indefinitpronomen • Zeitangaben: Präposition + Datum, Monat, Jahreszeit oder Jahr; frz. pendant, depuis, dans (une semaine), il y a (une semaine); sp. durante, desde, dentro de (una semana), hace (una semana) • Ortsangaben: frz. à + Stadt; sp. en + Stadt; Präpositionen des Ortes (z.B. frz. à droite, à gauche, derrière, devant, sp. a la derecha, a la izquierda, detrás, delante), Ortsadverbien (z.-B. frz. devant, derrière, dessus, au-dessus, au-dessous, dedans, à côté, près, loin; sp. arriba, abajo, delante, detrás, encima, debajo, al lado, cerca, lejos) • Formen des frz. présent de l’indicatif (bei Verben mit ein und zwei Verbstämmen) und des sp. presente de indicativo • Reflexive Verben (z.-B. frz. se lever, sp. levantarse, imaginarse) und reziproke Verben (z.-B. frz. se retrouver, se voir, sp. verse) • Infinitivkonstruktionen (frz. vouloir/ pouvoir/ devoir faire qc; sp. querer/ poder/ tener que hacer algo) • Unpersönliche Ausdrücke (frz. il est interdit de, il est utile de, il est important de/ que; sp. está prohibido de, es útil de, es importante de/ que) • Formen des frz. passé composé, sp. pretérito indefinido und pretérito perfecto • Formen des frz. imparfait, sp. pretérito imperfecto • Formen des frz. conditionnel du présent, sp. condicional simple • Formen des frz. conditionnel passé, sp. condicional compuesto • Formen des frz. subjonctif du présent, sp. subjuntivo de presente • Formen des frz. passif, sp. voz pasiva Tabelle 45: Deskriptoren zu Morphosyntax und grammatischer Orthographie Im dritten Ratingverfahren wurden letzenendes ausschließlich die sprachlichen Leistungen betrachtet, wobei für Wortschatz der Mittelwert aus Wortschatz‐ spektrum und Verwendung des Wortschatzes, für Grammatik der Mittelwert aus Syntax, Verwendung der Tempi und Modi sowie Morphosyntax und grammati‐ 356 11 Auswertung der Ergebnisse schen Orthographie aus dem zweiten Ratingverfahren berechnet wurde (vgl. Tabelle 46). Bei Orthographie und Text wurden die Werte aus dem zweiten Rating von Orthographie und Interpunktion sowie von Kohärenz und Kohäsion übernommen (bei Text/ Kohärenz und Kohäsion allerdings mit zwei Nachkom‐ mastellen und nicht als ganze Zahl). Der Mittelwert aus allen vier Kategorien bildet schließlich die endgültige sprachliche Einstufung in die Feinniveaustufen von lingualevel (vgl. Lenz/ Studer 2008b). Merkmale der Leistung: Qualitative Aspekte - A1.1 A1.2 A2.1 A2.2 B1.1 B1.2 - - - - - - - - Wortschatz Grammatik Orthografie Text B1.2 (6) - - - - B1.1 (5) - - - - A2.2 (4) - - - - A2.1 (3) - - - - A1.2 (2) - - - - A1.1 (1) - - - - Tabelle 46: Korrekturraster des dritten Ratings (vgl. Lenz/ Studer 2008a, 2008b, 2008c) Abschließend bleibt festzuhalten, dass die Einstufung sprachlicher Phänomene als Fehler, d. h. als Normabweichungen, in der vorliegenden Studie auf Grund‐ lage der Testmaterialien von lingualevel und einschlägigen Werken, welche die sprachlichen Normen festlegen (vgl. Chauvet 2008; De Bruyne 2001; Deth‐ loff/ Wagner 2014; Europarat 2001; Fayol/ Jaffré 2014; Grevisse/ Goose 2016, Instituto Cervantes 2006, 2007; Klein/ Kleineidam 2009; Rey et al. 2008; RAE 2010a, 2010b, 2014; Riegel et al. 2018; Vera Morales 2013), erfolgt. Auch wenn diese Werke durchaus diatopische, diaphasische und diastratische Varietäten berücksichtigen, bleibt eine recht normative Sichtweise des Fehlerbegriffs be‐ stehen. Für zukünftige Testformate wäre es eventuell zielführend, gezielt Werke zum mündlichen Gebrauch der jeweiligen Sprachen (vgl. z.B Wojnesitz/ Kon‐ zett-Firth 2022) auch stärker in die Formulierung der jeweiligen Deskriptoren 11.4 Ergebnisse der Sprachtests 357 186 Hierfür werden, wie auch in den Leseverstehenstests, zunächst die Verteilungskurven genauer analysiert, indem Schiefe und Kurtosis sowie deren Standardfehler berechnet und auf Signifikanz untersucht werden. Außerdem wird eine graphische Analyse der Q-Q-Plots vorgenommen. mit einzubeziehen, insbesondere, wenn informelle Kurznachrichten evaluiert werden. - 11.4.3.1 Ergebnisse der Schreibtests im Französischen Ergebnisse des Schreibtests liegen für n = 89 Schülerinnen und Schüler des Französischen vor (n (w) = 52, n (m) = 37). In drei Fällen müssen fehlende Werte verzeichnet werden. Alle ausgefüllten Schreibraster der drei Ratings befinden sich in Anhang 9.1. Um die Alternativhypothese bezüglich potenzieller Geschlechterunter‐ schiede statistisch angemessen testen zu können, werden die Ergebnisse aus allen drei Ratingphasen zunächst auf Normalverteilung geprüft (vgl. Lienert/ Raatz 1998: 147 ff.). 186 Für das erste Rating, in dem eine erste globale Ein‐ schätzung bezüglich der Sprachhandlungskompetenz im Schriftlichen stattfand, führen die Berechnung von Schiefe und Kurtosis der Verteilungskurve zu folgenden Ergebnissen (vgl. Tabelle 47): Der Kurtosis-Wert von 1.023 zeigt, dass es sich um eine nach oben stärker gipflige Verteilung handelt und der negative Wert der Schiefe von -.561 gibt eine leicht rechtssteile Verteilung an. Dies ist inhaltlich begründbar, da zahlreiche Probandinnen und Probanden das Niveau A2.2 (kodiert als 4) oder höher erreichen. Die Quotienten von Schiefe und Kurtosis durch ihren jeweiligen Standardfehler liegen jeweils knapp außerhalb des Bereichs zwischen -1.96 und +1.96, weshalb hier nicht mehr von einer annähernden Normalverteilung ausgegangen werden kann. Rating 1, Schreibtest Französisch - Sprachhandlungskompe‐ tenz n, MV n = 89, MV = 3 Schiefe -.561 Standardfehler der Schiefe .255 Quotient Schiefe/ Standardfehler der Schiefe -2.197 358 11 Auswertung der Ergebnisse Rating 1, Schreibtest Französisch - Sprachhandlungskompe‐ tenz Kurtosis 1.023 Standardfehler der Kurtosis .506 Quotient Kurtosis/ Standardfehler der Kurtosis 2.024 - Tabelle 47: Schiefe und Kurtosis der Verteilungskurve in der Sprachhandlungskompetenz im Schreibtest in Französisch (Rating 1) In Ratingphase 2 erfolgte eine differenzierte Auswertung der Teilkonstrukte Wortanzahl, Befolgung der Arbeitsanweisung, Inhalt 1, Inhalt 2, Kohärenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, Lexikalische Or‐ thographie und Interpunktion, Syntax, Verwendung der Tempi und Modi sowie Morphosyntax und grammatische Orthographie. Bei den Ergebnissen der Wortanzahl, die nach GeR-Feinniveaustufen von 1 = Niveau A1.1 bis 6 = Niveau B1.2 klassifiziert wurden (vgl. Kapitel 11.4.3), liegt klar eine annähernde Normalverteilung vor, da die Quotienten der Schiefe durch ihren Standardfehler und der Kurtosis durch ihren Standardfehler innerhalb des Bereichs -.1.96 bis +1.96 liegen (vgl. Tabelle 48). Für die eher planerisch angelegte Kategorie Befolgung der Arbeitsanweisung zeigt sich hingegen erwartungsgemäß eine stark rechtssteile Verteilung (γ = -2.550), was bedeutet, dass die Mehrheit der Schülerinnen und Schüler die Arbeitsanweisung befolgt und zwei Kurznach‐ richten verfasst hat, welche zum größten Teil durch eine Begrüßungsformel eingeleitet und durch eine Verabschiedungsformel beendet wurden. Sowohl der Quotient aus Schiefe und dessen Standardfehler als auch aus Kurtosis und dessen Standardfehler liegen bei der Befolgung der Arbeitsanweisung ganz deut‐ lich jenseits des Bereichs zwischen -1.96 und +1.96, sodass hier eindeutig keine Normalverteilung vorliegt (vgl. Tabelle 48). Für Inhalt 1 zeigt sich eine ähnliche Verteilung: Der negative Wert der Schiefe von -1.536 gibt eine ausgeprägte rechtssteile Verteilung an und die Kurtosis von 2.899 zeigt eine deutlich gipflige Verteilung. Sowohl der Quotient aus Schiefe und deren Standardfehler als auch aus Kurtosis und deren Standardfehler liegen bei Inhalt 1 daher deutlich jenseits von -1.96 und +1.96, sodass hier ebenfalls eindeutig keine Normalverteilung vorliegt (vgl. Tabelle 48). Anders verhält es sich bei der Kategorie Inhalt 2, bei der sowohl nach Berechnung von Schiefe und Kurtosis und deren Quotienten durch ihre jeweiligen Standardfehler als auch nach der graphischen Analyse des 11.4 Ergebnisse der Sprachtests 359 187 Schiefe -.597, Quotient Schiefe/ Standardfehler der Schiefe -2.337, Kurtosis .404, Quo‐ tient Kurtosis/ Standardfehler der Kurtosis .799. 188 Schiefe -.040, Quotient Schiefe/ Standardfehler der Schiefe -.157, Kurtosis -.995, Quotient Kurtosis/ Standardfehler der Kurtosis -1.968. 189 Schiefe -.499, Quotient Schiefe/ Standardfehler der Schiefe -1.954, Kurtosis -.564, Quo‐ tient Kurtosis/ Standardfehler der Kurtosis -1.115. Q-Q-Plots von einer Normalverteilung ausgegangen werden kann (vgl. Tabelle 48). Die zweite Schreibproduktionsaufgabe war somit für die Schülerinnen und Schüler inhaltlich deutlich anspruchsvoller als die erste. Rating 2, Schreibtest Französisch - Wortanzahl (klassifi‐ ziert) Befolgung der Arbeits‐ anweisung Inhalt 1 Inhalt 2 n, MV n = 89, MV = 3 n = 89, MV = 3 n = 89, MV = 3 n = 89, MV = 3 Schiefe -.428 -2.550 -1.536 -.353 Standardfehler der Schiefe .970 .255 .255 .255 Quotient Schiefe/ Stan‐ dardfehler der Schiefe -.441 -9.985 -6.013 -1.382 Kurtosis .070 7.168 2.899 -.290 Standardfehler der Kurtosis .506 .506 .506 .506 Quotient Kur‐ tosis/ Standardfehler der Kurtosis .138 14.176 5.734 .574 Tabelle 48: Schiefe und Kurtosis der Teilkonstrukte Wortanzahl (klassifiziert), Befolgung der Arbeitsanweisung, Inhalt 1 und Inhalt 2 im Schreibtest in Französisch (Rating 2) Die Verteilungskurven des zweiten Ratings, die sich auf sprachlichen Subkom‐ petenzen beziehen, verlaufen deutlich homogener als diejenigen, die Inhalts‐ aspekte und die Befolgung der Arbeitsanweisungen abzeichnen (vgl. Lienert/ Raatz 1998: 147 ff.; vgl. Tabelle 49): Bei der Kategorie Kohärenz und Kohäsion kann von einer annähernden Normalverteilung ausgegangen werden. Eine Analyse der Verteilungen der einzelnen Teilkonstrukte ergibt bei Text im Sinne von Textkompetenz  187 und Koreferenz  188 knapp keine und bei Konnektoren  189 und räumlichen und zeitlichen Bezüge  190 jeweils eine annähernde Normalvertei‐ 360 11 Auswertung der Ergebnisse 190 Schiefe -.203, Quotient Schiefe/ Standardfehler der Schiefe -.795, Kurtosis -.979, Quotient Kurtosis/ Standardfehler der Kurtosis -1.936. lung. Die Ergebnisse der Verteilungen der Teilkonstrukte Wortschatzspektrum, Verwendung des Wortschatzes, lexikalische Orthographie und Interpunktion sowie Morphosyntax und grammatische Orthographie können ebenfalls als annähernd normalverteilt bezeichnet werden. Hingegen weist das Teilkonstrukt Syntax aufgrund des Quotienten aus Schiefe und dessen Standardfehler, welcher deutlich unter -1.96 liegt, keine annähernde Normalverteilung mehr auf und auch bei der Verwendung der Tempi und Modi liegt knapp keine annähernde Normalverteilung mehr vor. Das Gesamtergebnis des zweiten Ratingdurchlaufs, das für jede Schülerin und jeden Schüler als durchschnittlicher Wert aus allen oben genannten Teilkonstrukten berechnet wurde, besteht ebenfalls die Testverfahren zur Normalverteilung (vgl. Tabelle 49). Rating 2, Schreibtest Französisch - Kohärenz und Kohä‐ sion Wortschatz‐ spektrum Verwen‐ dung des Wort‐ schatzes Lexikalische Orthogra‐ phie und In‐ terpunktion n, MV n = 89, MV = 3 n = 89, MV = 3 n = 89, MV = 3 n = 89, MV = 3 Schiefe - -.281 -.366 -.272 -.412 Standardfehler der Schiefe .255 .255 .255 .255 Quotient Schiefe/ Standardfehler der Schiefe -1.100 -1.435 -1.065 -1.649 Kurtosis - -.489 -.258 -.488 -.518 Standardfehler der Kurtosis .506 .506 .506 .506 Quotient Kurtosis/ Standardfehler der Kurtosis -.967 -.510 -.965 -1.025 11.4 Ergebnisse der Sprachtests 361 Syntax Verwen‐ dung der Tempi und Modi Morpho‐ syntax und grammati‐ sche Ortho‐ graphie Gesamt‐ durch‐ schnitt n, MV n = 89, MV = 3 n = 89, MV = 3 n = 89, MV = 3 n = 89, MV = 3 Schiefe - -.512 -.011 -.426 -.447 Standardfehler der Schiefe .255 .255 .255 .255 Quotient Schiefe/ Standardfehler der Schiefe -2.040 -.043 -1.668 -1.753 Kurtosis - -.469 -1.175 -.578 -.138 Standardfehler der Kurtosis .506 .506 .506 .506 Quotient Kurtosis/ Standardfehler der Kurtosis -.927 -2.324 -1.145 -.273 Tabelle 49: Schiefe und Kurtosis der Kategorien Kohärenz und Kohäsion, Wortschatz‐ spektrum, Verwendung des Wortschatzes, lexikalische Orthographie und Interpunktion, Verwendung der Tempi und Modi, Morphosyntax und grammatische Orthographie sowie der gesamten durchschnittlichen Punktzahl im Schreibtest in Französisch (Rating 2) Nachdem die Prüfungen auf Normalverteilungen für die Ergebnisse aus den Ra‐ tingverfahren 1 und 2 abgeschlossen sind, wird nun gemäß der Forschungsfrage die Alternativhypothese in den Teilkonstrukten der einzelnen Ratingverfahren überprüft. Bei der Sprachhandlungskompetenz, angelehnt an der Verifizierung der Erreichung der in den vier Deskriptoren beschriebenen Niveaustufen (vgl. Kapitel 11.4.3), die im ersten Ratingverfahren untersucht wurde, kommt der Mann-Whitney-U-Test zum folgenden Ergebnis (vgl. Tabelle 50): 362 11 Auswertung der Ergebnisse Rating 1, Schreibtest Französisch - Französisch weiblich (n = 52, MV = 0) Französisch männlich (n = 37, MV = 3) Sprachhandlungs‐ kompetenz M-=-3.817 (SD = .913, SEM = .127) Mdn = 4.00 M Rang >= 49.80 M-=-3.405 (SD = .999, SEM = .164) Mdn = 3.50 M Rang >= 38.26 Mann-Whitney-U-Test U = 712.500, Z = -2.153 p = .031, d = .452 Anmerkungen. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 50: Statistische Ergebnisse der Französischstichprobe im Teilkonstrukt Sprach‐ handlungskompetenz des Schreibtests, aufgeteilt nach Geschlecht (Rating 1) Abb. 8: Boxplots zur Sprachhandlungskompetenz im Schreibtest Französisch, aufgeteilt nach Geschlecht Der Kolmogorov-Smirnov-Z-Test ergibt, dass die Verteilungskurven der Ergeb‐ nisse der weiblichen und der männlichen Französischlernenden im Teilkonst‐ 11.4 Ergebnisse der Sprachtests 363 rukt Sprachhandlungskompetenz weitestgehend dieselben Verteilungsformen aufweisen (p = .240), was eine Voraussetzung für den Mann-Whitney-U-Test und seine Aussagekraft bezüglich der Unterschiede der Medianwerte dar‐ stellt (vgl. Devine et al. 2018: 278-286; Hart 2001: 391-393). Somit zeigt der Mann-Whitney-U-Tests, dass ein signifikanter Unterschied mit schwachem Effekt zugunsten der Mädchen bezüglich der erzielten Medianwerte in der Sprachhandlungskompetenz besteht (p = .031, d = .452; vgl. Tabelle 50). Betrachtet man die Mittelwerte zum Ziel der Einordnung in die GeR-Feinniveaustufen zeigt sich, dass sich die Mädchen an Niveau A2.2 (M (w) = 3.817) annähern, während die Jungen (M (m) = 3.405) näher an Niveau A2.1 liegen. Folglich entspricht der Unterschied ungefähr einer halben Feinniveaustufe. Die äußerst große Spannweite bezüglich der Sprachhandlungskompetenz innerhalb der beiden Geschlechtergruppen reicht jeweils von Niveau A1.1 (Minimalwert: 1 Punkt) bis hin zu Niveau B1.2 (Maximalwert: 6 Punkte; vgl. Abbildung 8). Das erste Ra‐ tingverfahren bietet aber nur einen holistischen, sprachhandlungsorientierten Einblick in die Leistungen der Lernenden. Im zweiten Ratingverfahren wird ein verfeinerter Einblick in die einzelnen Teilkonstrukte ermöglicht. Zunächst werden neben der Wortanzahl, welche direkt auf die GeR-Feinniveaustufen bezogen wird, die Teilkonstrukte Befolgung der Arbeitsanweisung, Inhalt 1 und Inhalt 2 erhoben, welche nicht direkt in GeR-Feinniveaustufen kategorisiert werden können (vgl. Tabelle 51). Rating 2, Schreibtest Französisch - - Französisch weiblich (n = 52, MV = 0) Französisch männlich (n = 37, MV = 3) Wortanzahl (klassifi‐ ziert) M-=-4.58 (SD = .915, SEM = .127) Mdn = 5.00 M Rang = 50.25 M-=-4.08 (SD = .983, SEM = .162) Mdn = 4.00 M Rang = 37.62 t-Test t (87) = 2.443, p = .017, d = .525 KI 95% für d [.091, .960] Befolgung des Arbeits‐ auftrags M-=-5.71 (SD = .605, SEM = .084) Mdn = 6.00 M Rang = 44.81 M-=-5.70 (SD = .661, SEM = .109) Mdn = 6.00 M Rang = 45.27 Mann-Whitney-U-Test U = 952.000, Z = -.155 p = .909, d = .065 364 11 Auswertung der Ergebnisse 191 Die Wortanzahl wird nach Niveaustufen klassifiziert: 1-30 Wörter entsprechen dem Niveau A1.1 (1 Punkt), 31-60 Wörter dem Niveau A1.2 (2 Punkte), 61-90 Wörter dem Niveau A2.1 (3 Punkte), 91-130 Wörter dem Niveau A2.2 (4 Punkte), 131-170 Wörter dem Niveau B1.1 (5 Punkte) und mehr als 171 Wörter dem Niveau B1.2 (6 Punkte; vgl. Kapitel 11.4.3). Rating 2, Schreibtest Französisch - - Französisch weiblich (n = 52, MV = 0) Französisch männlich (n = 37, MV = 3) Inhalt 1 M-=-5.04 (SD = .989, SEM = .137) Mdn = 5.00 M Rang = 49.54 M-=-4.38 (SD = 1.552, SEM = .255) Mdn = 5.00 M Rang = 38.62 Mann-Whitney-U-Test U = 726.000, Z = -2.074 p = .038, d = .426 Inhalt 2 M-=-4.06 (SD = 1.378, SEM = .191) Mdn = 4.00 M Rang = 50.27 M-=-3.51 (SD = 1.044, SEM = .172) Mdn = 3.00 M Rang = 37.59 t-Test t (87) = 2.023, p = .046, d = .435 KI 95% für d [.003, .867] Anmerkungen. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 51: Statistische Ergebnisse der Französischstichprobe in den Teilkonstrukten Wortanzahl, Befolgung der Arbeitsanweisung, Inhalt 1 und Inhalt 2 im Schreibtest, aufge‐ teilt nach Geschlecht (Rating 2) Im Bereich der Wortanzahl  191 erzielen die weiblichen Französischlernerinnen ein signifikant höheres Ergebnis als die männlichen Französischlernenden (p = .017, d = .525; vgl. Tabelle 51). Die Mädchen kommen im Durchschnitt auf 138.67 Wörter zu den beiden Aufgabenstellungen, während die Jungen durchschnittlich 114.35 Wörter produzieren. Auch innerhalb der zugewiesenen Klassifikation, bei der 138.67 Wörter Niveau B1.1 und 114.35 Wörter Niveau A2.2 entsprechen, beträgt der Unterschied ungefähr eine Feinniveaustufe des GeR. Mit d-=-.525 handelt es sich um einen mittleren Effekt. Im Teilkonstrukt Befolgung des Arbeitsauftrags erzielen beide Geschlechter‐ gruppen sehr hohe durchschnittliche Werte, welche sich stark an die maximale Höchstpunktzahl 6 annähern. Da keine Normalverteilung vorliegt, wird zur 11.4 Ergebnisse der Sprachtests 365 192 Der Kolmogorov-Smirnov-Z-Test zur Überprüfung der gleichen Verteilungsform der beiden Verteilungskurven der Leistungspunkte von Jungen und Mädchen in Inhalt 1 ergab zwar ein nicht signifikantes Ergebnis (p = .117), allerdings kann aufgrund der identischen Medianwerte bei den Jungen und Mädchen von jeweils 5.0 keine Aussage zu einem signifikanten Unterschied der Medianwerte gemacht werden, weshalb hier der Kolmogorov-Smirnov-Z-Test nicht greift (vgl. Divine et al. 2018: 278-286; Hart 2001: 391-393). Prüfung der Alternativhypothese ein Mann-Whitney-U-Test durchgeführt, wel‐ cher ein nicht signifikantes Ergebnis hat. Aufgrund eines zuvor signifikant ausgefallenen Kolmogorov-Smirnov-Z-Tests (p = .000) liegen zwei ungleiche Verteilungsformen vor, weshalb das Ergebnis des Mann-Whitney-U-Test aus‐ schließlich Aussagekraft bezüglich der mittleren Ränge und nicht bezüglich der Medianwerte hat (vgl. Divine et al. 2018: 278-286; Hart 2001: 391-393). Somit besteht kein signifikanter Geschlechterunterschied bei der Befolgung der Arbeitsanweisung und der Effekt ist vernachlässigbar (p = .909, d = .065). Das Ergebnis der Jungen (M Rang -= 45.27) fällt jedoch tendenziell minimal höher aus als dasjenige der Mädchen (M Rang -=-44.81, vgl. Tabelle 51). Im Gegensatz dazu treten in den beiden inhaltlich ausgerichteten Teilkonst‐ rukten Inhalt 1 und Inhalt 2 deutliche Geschlechterunterschiede auf: In beiden Teilkonstrukten erzielen die weiblichen Französischlernerinnen signifikant höhere Punktzahlen. In Inhalt 1 unterscheiden sich die mittleren Ränge nach dem Mann-Whitney-U-Test signifikant (M Rang (w) = 49.54, M Rang (m) = 38.62, p = .038) 192 , wobei es sich mit einem Cohens d von .426 um einen schwachen Effekt handelt. In Inhalt 2 erzielen die Mädchen ebenfalls ein signifikant höheres Ergebnis (p = .046), wobei die Alternativhypothese hier aufgrund der gegebenen Normalverteilung mithilfe eines t-Tests überprüft wurde. Bei diesem Unterschied handelt es sich ebenfalls um einen schwachen Effekt (d = .435; vgl. Tabelle 51). Die signifikanten Unterschiede in den Teilkonstrukten Inhalt 1 und Inhalt 2 bedeuten in erster Linie, dass sich die Mädchen signifikant genauer an die beiden Aufgabenstellungen gehalten haben und deuten weniger darauf hin, dass die Mädchen komplexere Inhalte wiedergegeben haben, da die beiden Aufgabenstellungen jeweils präzise, jedoch sehr alltägliche Inhalte, wie die Beschreibung der eigenen Zimmereinrichtung (Inhalt 1) oder die Bitte um Verlegung eines Treffens (Inhalt 2), verlangten (vgl. Kapitel 11.4.2.2). Neben der Auslassung inhaltlicher Aspekte muss folglich auch die Ersetzung inhaltlicher Aspekte als Ursache für die niedrigeren Punktzahlen der Jungen in diesen beiden Kategorien berücksichtigt werden. Vor allem bei der Ersetzung der geforderten inhaltlichen Aspekte durch andere kann somit der jeweilige Proband und die jeweilige Probandin bei eher niedrigen Punktzahlen bei Inhalt 1 und Inhalt 366 11 Auswertung der Ergebnisse 2 in allen anderen Teilkonstrukten durchaus potenziell höhere Punktzahlen erreichen. Nach den Geschlechtervergleichen bezüglich der geschriebenen Wortanzahl und der Präzision der Befolgung der Arbeitsanweisungen (gemessen durch Befolgung der Arbeitsanweisung, Inhalt 1, Inhalt 2) im Schreibtest Französisch werden nun die sprachlich ausgerichteten Teilkonstrukte, die im Rahmen des zweiten Ratingdurchgangs im Detail ausgewertet wurden, sowie der Gesamt‐ durchschnitt aller im zweiten Rating erhobenen Teilkonstrukte auf mögliche Geschlechterunterschiede untersucht. Die im Folgenden beschriebenen Ergeb‐ nisse können gemäß der in Kapitel 11.4.3 vorgestellten Einteilung auf die Feinniveaustufen des GeR bezogen werden, wobei die niedrigste Punktzahl 1 für Niveau A1.1 und die höchste Punktzahl 6 für Niveau B1.2 stehen (vgl. Tabelle 52). Rating 2, Schreibtest Französisch - Französisch weiblich (n = 52, MV = 0) Französisch männlich (n = 37, MV = 3) Kohärenz und Kohä‐ sion M-=-4.06 (SD = 1.320, SEM = .183) Mdn = 4.00 M Rang = 48.18 M-=-3.76 (SD = 1.188, SEM = .195) Mdn = 4.00 M Rang = 40.53 t-Test t (87) = 1.104, p = .272, d = .237 KI 95% für d [-.192, .666] Wortschatzspektrum M-=-3.98 (SD = 1.306, SEM = .181) Mdn = 4.00 M Rang = 49.04 M-=-3.49 (SD = 1.239, SEM = .204) Mdn = 3.00 M Rang = 39.32 t-Test t (87) = 1.699 p = .093, d = .365 KI 95% für d [-.066, .796] Verwendung des Wort‐ schatzes M-= 3.44 (SD = 1.392, SEM = .193) Mdn = 4.00 M Rang = 48.64 M-=-3.03 (SD = 1.190, SEM = .196) Mdn = 3.00 M Rang = 39.88 t-Test t (87) = 1.471, p = .145, d = .316 KI 95% für d [-.114, .746] 11.4 Ergebnisse der Sprachtests 367 193 Verwendung von Konnektoren: Französisch weiblich: M = 4.08, SD = 1.296, SEM = .180; Französisch männlich: M = 3.84, SD = 1.424, SEM = .234; t-(87) = .823, p = .413, d = .177, KI 95% für d [-.251, .605] 194 Herstellung räumlicher und zeitlicher Bezüge: Französisch weiblich: M = 3.85, SD = 1.500, SEM = .208; Französisch männlich: M = 3.27, SD = 1.387, SEM = .228; t-(87) =-1.841, p = .069, d = .396 KI 95% für d [-.036, .827] 195 Text(kompetenz): Französisch weiblich: M Rang = 49.69, Mdn = 4.5; Französisch männlich: M Rang = 38.41, Mdn-=-4.0; U-=-718.000, Z-=--2.125, p-=-.034, d = .441 Rating 2, Schreibtest Französisch - Französisch weiblich (n = 52, MV = 0) Französisch männlich (n = 37, MV = 3) Lexikalische Orthogra‐ phie und Interpunk‐ tion M-=-4.02 (SD = 1.379, SEM = .191) Mdn = 4.00 M Rang = 44.47 M-=-4.11 (SD = 1.308, SEM = .215) Mdn = 4.00 M Rang = 45.74 t-Test t (87) = -.306, p = .760, d = -.066 KI 95% für d [-.493, .362] Anmerkungen. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 52: Statistische Ergebnisse der Französischstichprobe in den Teilkonstrukten Kohärenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, lexikalische Orthographie und Interpunktion im Schreibtest in Französisch, aufgeteilt nach Geschlecht (Rating 2) Im Teilbereich Kohärenz und Kohäsion erzielen die Mädchen (M = 4.06) mit einem schwachen Effekt (d = .237) höhere Leistungen als die Jungen (M = 3.76), wobei der Unterschied nicht signifikant ist (p = .272). Jedoch erreichen die Mädchen im Durchschnitt das Niveau A2.2, da sie im Mittelwert knapp über dem Wert von 4 Punkten liegen, während die Jungen mit ihrem Mittel‐ wert unter 4 dieses Niveau nicht ganz erreichen. Da hier die Subkategorien Text(kompetenz) (vgl. Lenz/ Studer 2008b, Anhang 2.3.4), Verwendung von Kon‐ nektoren, zeitliche und räumliche Bezüge sowie Herstellung von Koreferenz (vgl. Kapitel 11.4.3) erhoben wurden, werden diese ebenfalls bezüglich potenzieller Geschlechterunterschiede untersucht. Ein t-Test für Verwendung von Konnek‐ toren  193 und Herstellung räumlicher und zeitlicher Bezüge  194 , welche normalver‐ teilte Ergebnisse vorweisen, ergibt jeweils keine signifikanten Unterschiede. Der Mann-Whitney-U-Test für für die beiden Subkategorien, die jeweils keine Normalverteilung aufweisen, ergibt für Textkompetenz  195 ein - bei schwachem Effekt - signifikant höheres Ergebnis der Mädchen (p = .034, d = .441) und 368 11 Auswertung der Ergebnisse 196 Herstellung von Koreferenz: Französisch weiblich: M Rang = 47.49, Mdn = 3.50; Franzö‐ sisch männlich: 41.50, Mdn-= 3.00; U-=-832.000, Z-=--1.097, p-=-.272, d = .231 bei Herstellung von Koreferenz  196 keinen signifikanten Unterschied. In allen Subkategorien von Kohärenz und Kohäsion erzielen jedoch die Mädchen durch‐ schnittlich höhere Punktzahlen, auch wenn diese nur im Falle der Textkompetenz signifikant sind und jeweils lediglich vernachlässigbare bis schwache Effekte aufweisen (vgl. Sedlmeier/ Renkewitz 2013: 293). In den lexikalisch ausgerichteten Teilkonstrukten Wortschatzspektrum und Verwendung des Wortschatzes erreichen die weiblichen Französischlernerinnen ebenfalls tendenziell eine etwas höhere Punktzahl als die männlichen, jedoch ist der Geschlechterunterschied in keiner der beiden Kategorien signifikant und die Effekte sind jeweils lediglich schwach. Wenn man sich jedoch auf die GeR-Feinniveaustufen bezieht, so erreichen die Mädchen im Wortschatz‐ spektrum mit einem Mittelwert von 3.98 knapp Niveau A2.2, während die Jungen mit einem Mittelwert von 3.49 dieses Niveau nur teilweise erreichen. Auch bei der Verwendung des Wortschatzes lässt sich ein Unterschied von knapp einer halben Feinniveaustufe des GeR erkennen: Während die Mädchen mit einem Mittelwert von 3.44 das Niveau A2.2 teilweise erreichen, liegen die Jungen mit dem Mittelwert 3.03 deutlich im Niveau A2.1. Bei der lexikalischen Orthographie und Interpunktion zeichnet sich schließlich ein anderes Bild: In diesem Teilkonstrukt liegen die Leistungen der weiblichen und der männlichen Französischlernenden sehr nahe beieinander, wobei die Jungen minimal höhere Punktzahlen erzielen. Der t-Test führt zu keinem signi‐ fikanten Ergebnis und die Effektstärke ist vernachlässigbar (p = .760, d = -.066). Zudem sind die Standardabweichungen fast und die jeweiligen Spannweiten völlig identisch (mit Werten von 1 bis 6). Durchschnittlich erreichen beide Geschlechtergruppen das Niveau A2.2. Bemerkenswert an allen bisher untersuchten Teilkonstrukten ist die große Heterogenität der Leistungen innerhalb der beiden Geschlechtergruppen, welche fast durchgehend von Niveau A1.1 (1 Punkt) - oder wie in der Gruppe der männlichen Lernenden im Bereich Verwendung des Wortschatzes auch darunter - bis Niveau B1.2 (6 Punkte) reicht. Im Folgenden werden die grammatisch ausgerichteten Teilkonstrukte Syntax, Verwendung der Tempi und Modi sowie Morphosyntax und grammatische Or‐ thographie auf Geschlechterunterschiede untersucht. Am Schluss steht die Untersuchung des Gesamtdurchschnitts aus allen im zweiten Ratingverfahren untersuchten Teilkonstrukten (vgl. Tabelle 53). 11.4 Ergebnisse der Sprachtests 369 Rating 2, Schreibtest Französisch - Französisch weiblich (n = 52, MV = 0) Französisch männlich (n = 37, MV = 3) Syntax M-=-3.98 (SD = 1.590, SEM = .221) Mdn = 4.00 M Rang = 48.38 M-=-3.49 (SD = 1.677, SEM = .276) Mdn = 4.00 M Rang = 40.24 Mann-Whitney-U-Test U = 786.000, Z = -1.493 p = .135, d = .314 Verwendung der Tempi und Modi M-=-3.13 (SD = 1.387, SEM = .192) Mdn = 3.00 M Rang = 48.34 M-=-2.62 (SD = 1.587, SEM = .261) Mdn = 3.00 M Rang = 40.31 Mann-Whitney-U-Test U = 788.500, Z = -1.505 p = .132, d = .310 Morphosyntax und grammatische Ortho‐ graphie M-=-3.85 (SD = 1.195, SEM = .166) Mdn = 4.00 M Rang = 50.62 M-=-3.14 (SD = 1.357, SEM = .223) Mdn = 3.00 M Rang = 37.11 t-Test t (87) = 2.615, p = .011, d = .562 KI 95% für d [.127, .998] Gesamtdurchschnitt Schreiben M-=-4.17 (SD = .947, SEM = .131) Mdn = 4.20 M Rang = 49.63 M-=-3.76 (SD = .949, SEM = .156) Mdn = 3.82 M Rang = 38.49 t-Test t (87) = 2.023, p = .046, d = .435 KI 95% für d [.003, .867] Anmerkungen. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 53: Statistische Ergebnisse der Französischstichprobe in den Teilkonstrukten Syntax, Verwendung der Tempi und Modi, Morphosyntax und grammatische Orthographie sowie im Gesamtdurchschnitt des Schreibtests, aufgeteilt nach Geschlecht (Rating 2) 370 11 Auswertung der Ergebnisse Abb. 9: Boxplots zum Gesamtdurchschnitt im Schreibtest Französisch (Rating 2), aufge‐ teilt nach Geschlecht Im Bereich der Syntax erzielen die Mädchen durchschnittlich höhere Punkt‐ zahlen, wobei die Unterschiede zwischen den Mittleren Rängen nach dem Mann-Whitney-U-Test nicht signifikant sind (p = .135) und der gemessene Effekt nur schwach ist (d = .314, vgl. Tabelle 53). Mit einem Mittelwert von 3.98 liegen die Mädchen durchschnittlich knapp im Niveau A2.2, während die Jungen mit einem Mittelwert von 3.49 das Niveau A2.2 durchschnittlich nicht ganz erreichen. Beide Geschlechtergruppen erreichen die maximal mögliche Spannweite, da in beiden Merkmalsgruppen der Minimalwert 0 (unter A1.1) und der Maximalwert 6 (B1.2) beträgt, wodurch im Bereich Syntax die höchste Heterogenität festzustellen ist. Bei der Verwendung der Tempi und Modi verhält es sich ähnlich: Auch hier erlangen die Mädchen bei schwachem Effekt (d = .310) durchschnittlich eine etwas höhere Punktzahl als die Jungen, wobei der Unterschied nach dem Mann-Whitney-U-Test nicht signifikant ist (p = .132, vgl. Tabelle 53). Bezogen auf die GeR-Feinniveaustufen lässt sich ein durchschnittlicher Unterschied von einer halben Feinniveaustufe erkennen: Während die Mädchen mit einem Mittelwert von 3.13 das Niveau A2.1 knapp überschreiten, befinden sich die Leistungen der Jungen mit einem Mittelwert von 2.62 zwischen A1.2 und A2.1. 11.4 Ergebnisse der Sprachtests 371 197 Im zweiten Rating wurde hingegen eine Rundung auf eine ganze Zahl und somit eine Einteilung in die Feinniveaustufen 1 = A1.1, 2 = A1.2, 3 = A2.1, 4 = A2.2, 5-=-B1.1, 6-=-B1.2 vorgenommen, während im dritten Rating Zwischenstufen mit zwei Nachkommastellen beachtet werden. Schließlich tritt bei Morphosyntax und grammatische Orthographie ein signi‐ fikanter Geschlechterunterschied mit mittlerem Effekt (p = .011, d = .562, vgl. Tabelle 53) zugunsten der Mädchen auf. Mit einem Mittelwert von 3.85 erreichen die Französischlernerinnen durchschnittlich teilweise A2.2, während die Jungen mit einem Mittelwert von 3.14 durchschnittlich nur knapp über dem Niveau A2.1 stehen. Der Gesamtdurchschnitt aus den zweiten Rating, das gleichermaßen formale, inhaltliche und sprachliche Teilkonstrukte berücksichtigt, wird schließlich bezüglich eines Geschlechterunterschieds mit Hilfe eines t-Tests statistisch un‐ tersucht. Dieses Gesamtergebnis fällt zugunsten der Mädchen knapp signifikant aus (p = .046), wobei ein schwacher Effekt beobachtet werden kann (d = .435). Außerdem ist die Spannweite der Leistungen der Mädchen deutlich größer als diejenige der Jungen (vgl. Abbildung 9). Da die formalen und inhaltlichen Aspekte nicht direkt auf die GeR-Feinni‐ veaustufen bezogen werden können und die sehr ausdifferenzierten Teilkonst‐ rukte bezüglich des Gesamtergebnisses noch schwer zu interpretieren sind, da noch nicht ersichtlich wird, ob der am Ende signifikante Unterschied in der Schreibleistung zugunsten der Mädchen nicht vor allem auf formale und inhalt‐ liche Kategorien zurückgeht, soll abschließend der Blick auf die Ergebnisse aus Rating 3 gerichtet werden. In Rating 3 wurden die Kategorien Wortschatz (berechnet aus Wortschatz‐ spektrum und Verwendung des Wortschatzes), Grammatik (berechnet aus Syntax, Verwendung der Tempi und Modi und Morphosyntax und grammatische Ortho‐ graphie), Orthographie (übernommen aus Rating 2) und Text (berechnet aus dem genauen Durchschnitt zwischen Textkompetenz, Konnektoren, räumliche und zeitliche Bezüge und Herstellung von Koreferenz) 197 gleichwertig miteinander verrechnet, um die gesamte fremdsprachliche Leistung - frei von inhaltlichen und formalen Aspekten - zu ermitteln. Dies erlaubt auch eine Einordnung des Sprachniveaus im Schriftlichen der beiden Geschlechtergruppen in die GeR-Feinniveaustufen. Hierbei ergeben die Prüfungen auf Normalverteilung folgende Ergebnisse (vgl. Lienert/ Raatz 1998: 147 ff.; Tabelle 54, Anhang 4.7.3): Alle Verteilungskurven der Ergebnisse in den fünf Kategorien sind annähernd normalverteilt. 372 11 Auswertung der Ergebnisse Rating 3, Schreibtest Französisch - Wort‐ schatz Gram‐ matik Ortho‐ graphie Text Sprach‐ niveau gesamt n, MV n = 89, MV = 3 n = 89, MV = 3 n = 89, MV = 3 n = 89, MV = 3 n = 89, MV = 3 Schiefe -.332 -.193 -.142 -.512 -.421 Standardfehler der Schiefe .255 .255 .255 .255 .255 Quotient Schiefe/ Standard‐ fehler der Schiefe -1.299 -1.421 -1.649 -1.327 -1.807 Kurtosis -.364 -.561 -.518 -.488 -.035 Standardfehler der Kurtosis .506 .506 .506 .506 .506 Quotient Kurtosis/ Standardfehler der Kurtosis -.719 -1.110 -1.025 -.965 -.068 Tabelle 54: Schiefe und Kurtosis der Verteilungskurven in den Teilkonstrukten Wort‐ schatz, Grammatik, Orthographie und Text der Schreibleistung in Französisch (Rating 3) Nach der Analyse der vier Teilkonstrukte Wortschatz, Grammatik, Orthographie und Text und der fremdsprachlichen Gesamtleistung zeigt sich, dass in allen fünf Bereichen annähernde Normalverteilungen vorliegen. Die statistische Überprü‐ fung der Alternativhypothese wird daher anhand von t-Tests vorgenommen (vgl. Tabelle 55): 11.4 Ergebnisse der Sprachtests 373 Rating 3, Schreibtest Französisch - Französisch weiblich (n = 52, MV = 0) Französisch männlich (n = 37, MV = 3) Wortschatz M-=-3.71 (SD = 1.311, SEM = .182) Mdn = 4.00 M Rang = 49.03 M-=-3.27 (SD = 1.182, SEM = .194) Mdn = 3.00 M Rang = 39.34 t-Test t (87) = 1.629, p = .107, d = .350 KI 95% für d [-.080, .781] Grammatik M-=-3.65 (SD = 1.190, SEM = .165) Mdn = 3.67 M Rang = 49.66 M-=-3.08 (SD = 1.340, SEM = .220) Mdn = 3.33 M Rang = 38.45 t-Test t (87) = 2.122, p = .037, d = .456 KI 95% für d [.024, .889] Orthographie M-=-4.02 (SD = 1.379, SEM = .191) Mdn = 4.00 M Rang = 44.47 M-=-4.11 (SD = 1.308, SEM = .215) Mdn = 4.00 M Rang = 45.74 t-Test t (87) = -.306, p = .760, d = -.066 KI 95% für d [-.493, .362] Text M-=-4.00 (SD = 1.241, SEM = .172) Mdn = 4.00 M Rang = 49.35 M-=-3.60 (SD = 1.117, SEM = .184) Mdn = 3.50 M Rang = 38.89 t-Test t (87) = 1.555, p = .123, d = .334 KI 95% für d [-.096, .765] Sprachliche Gesamt‐ leistung Schreiben M-=-3.85 (SD = 1.135, SEM = .157) Mdn = 3.82 M Rang = 48.44 M-=-3.52 (SD = 1.092, SEM = .180) Mdn = 3.48 M Rang = 40.16 t-Test t (87) = 1.377, p = .172, d = .296 KI 95% für d [-.134, .726] Anmerkungen. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 55: Statistische Ergebnisse der Französischstichprobe in den Teilkonstrukten Wortschatz, Grammatik, Orthographie und Text sowie in der sprachlichen Gesamtleistung im Schreibtest in Französisch, aufgeteilt nach Geschlecht (Rating 3) 374 11 Auswertung der Ergebnisse Abb. 10: Boxplots zur sprachlichen Gesamtleistung im Schreibtest Französisch (Rating 3) In der zusammenfassenden Darlegung der sprachlichen Ergebnisse des Schreib‐ tests Französisch wird erneut deutlich, dass im Bereich der Orthographie von beiden Geschlechtergruppen etwa gleich gute Leistungen erzielt werden, wobei die Jungen einen etwas höheren Mittelwert erreichen, der Effekt hier aber vernachlässigbar ist (p = .760, d = -.066; vgl. Tabelle 55). In allen anderen sprachlichen Bereichen liegt die Leistung der Mädchen ungefähr eine halbe Feinniveaustufe höher als diejenige der Jungen, wobei lediglich im Bereich der Grammatik, welcher die zuvor gemessenen Bereiche Syntax, Verwendung der Tempi und Modi sowie Morphosyntax und grammatische Orthographie in sich vereint, signifikante Unterschiede gemessen werden können (p = .037) und hier mit einem Cohens d von .456 auch der höchste Effekt gemessen wird, welcher nach Sedlmeier und Renkewitz (2013: 293) aber noch als schwacher Effekt gilt. Die sprachliche Gesamtleistung zeigt - auch aufgrund des Ergebnisses in der Orthographie - nur einen relativ schwachen Effekt (d = .296) bezüglich der Geschlechterunterschiede zugunsten der Mädchen und ein nicht signifikantes Ergebnis des t-Tests (p = .172), wobei auch hier bei Erhöhung der Stichproben‐ größe eventuell ein signifikantes Ergebnis zustande kommen würde. Die Gruppe der weiblichen Französischlernerinnen (SD = 1.135) weist in der sprachlichen 11.4 Ergebnisse der Sprachtests 375 Gesamtleistung zudem eine etwas größere Standardabweichung auf als die Gruppe der Jungen (SD-= 1.092). Im Boxplot-Diagramm wird ebenfalls deutlich ersichtlich, dass die Spannweite der fremdsprachlichen Leistungen der weibli‐ chen Lernenden etwas größer ist als diejenige der männlichen (vgl. Abbildung 10). Reliabilität des Schreibtests Französisch. Am Ende soll die Reliabilität der verwendeten Skalen, welche Bewerterreliabilität als auch Test-Retest-Reliabi‐ lität der offenen Schreibaufgaben erfasst durch Korrelationsindizes mithilfe einer statistischen Realibilitätsprüfung ermittelt werden (vgl. Bortz/ Döring 2016: 83; Harsch 2012: 153; Rost 2013: 178; Schnell et al. 2011: 143-145). Die Reliabilität wird statistisch durch den Index Cronbachs α geprüft, welcher zur Abschätzung der internen Homogenität der Testaufgaben in Verbindung mit den Evaluationsskalen genutzt wird (vgl. Harsch 2012: 153). Die Reliabilitäts‐ analyse der 12 Items des zweiten Ratings Wortanzahl (klassifiziert), Befolgung des Arbeitsauftrags, Inhalt 1, Inhalt 2, Kohärenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, Lexikalische Orthographie, Syntax, Verwendung von Tempi und Modi, Morphosyntax und grammatische Orthographie ergibt ein Cronbachs α von .924. Ein Wert größer als .9 deutet darauf hin, dass zwischen einzelnen Items eine gewisse inhaltliche Redundanz gegeben ist (vgl. Streiner 2003: 99-103), was hier aufgrund der präzisen Untersuchung von Geschlechter‐ unterschieden auch teilweise erwünscht war (z. B. ist der inhaltliche Unterschied zwischen Wortschatzspektrum und Verwendung des Wortschatzes eher gering). Das beste Ergebnis der Reliabilitätsprüfung entsteht, wenn, wie in Rating 3 Wortschatz, Grammatik, Orthographie und Text als Items in die Reliabilitätsana‐ lyse aufgenommen und zudem Wortanzahl, Befolgung des Arbeitsauftrags, Inhalt 1 und Inhalt 2 aufgenommen werden. Hier liegt zwischen allen Items eine klare inhaltliche Unterscheidung vor und gleichzeitig erreicht Cronbachs α den bestmöglichen Wert knapp unter .9, nämlich .892. Diese Ergebnisse zeigen, dass der Schreibtest von lingualevel in Kombination mit der innerhalb dieser Studie verfeinerten Beurteilungsskala eine sehr hohe Reliabilität aufweist. Zwischenfazit. Betrachtet man die Ergebnisse aller drei Ratingverfahren, so zeigt sich, dass es vor allem in den Teilkonstrukten Sprachhandlungskompetenz, Wortanzahl sowie im Bereich der inhaltlichen Kategorien Inhalt 1 und Inhalt 2 zu signifikanten Geschlechterunterschieden zugunsten der Mädchen kommt. In den sprachlichen Teilkonstrukten Wortschatz und Text (sowie in deren Subkonstrukten) erzielen die Mädchen tendenziell höhere Durchschnittswerte als die Jungen, wobei die Unterschiede nicht signifikant sind und lediglich schwache Effekte aufweisen. Hingegen zeichnen sich im Bereich der Grammatik signifikante Geschlechterunterschiede zugunsten der Mädchen ab: Im zweiten 376 11 Auswertung der Ergebnisse Rating wird bei Morphosyntax und grammatischer Orthographie (p = .011, d = .562) der höchste Signifikanzwert bei gleichzeitig größtem Effekt innerhalb der untersuchten Teilbereiche des Schreibens gemessen, der sich nach Sedlmeier und Renkewitz (2013: 293) als mittelstark interpretieren lässt. Auch bei der Zusammenfassung der drei Teilkonstrukte Syntax, Verwendung der Tempi und Modi sowie Morphosyntax und grammatische Orthographie zum Teilkonstrukt Grammatik bleibt ein signifikanter Unterschied bestehen, wobei hier unter allen Teilkonstrukten des Schreibens der zweithöchste Effekt gemessen wird (p = .037, d = .456, vgl. Tabelle 55). Einzig im Bereich der Orthographie und Interpunktion erzielen die Jungen ein leicht höheres Ergebnis, wobei der Effekt hier vernachlässigbar und das Ergebnis nicht signifikant ist (p = .760, d = -.066). Mögliche Gründe für die zumeist leicht höheren Leistungen der Mädchen im Schreibtest werden im Laufe der Kapitel 11.10 und 12.1 genauer analysiert und diskutiert. - 11.4.3.2 Ergebnisse der Schreibtests im Spanischen Die Ergebnisse zum Schreiben liegen für n = 90 Schülerinnen und Schüler des Spanischen vor (n (w) = 69, n (m) = 21); vier Lernende konnten nicht am Schreibtest teilnehmen, weswegen bei ihnen fehlende Werte verzeichnet werden müssen. Die transkribierten Schreibtests und die ausgefüllten Schreib‐ raster sind im Anhang 9.2 dieser Arbeit zugänglich. Die Ergebnisse werden zunächst auf Normalverteilung geprüft: Für das erste Rating, in dem eine erste globale Einschätzung bezüglich der Sprachhandlungs‐ kompetenz im Schriftlichen stattfand, führen die Berechnung von Schiefe und Kurtosis (vgl. Tabelle 56) sowie die graphische Analyse der Verteilungskurve zu folgenden Ergebnissen: Rating 1, Schreibtest Spanisch - Sprachhandlungskompe‐ tenz n, MV n = 90, MV = 4 Schiefe -1.037 Standardfehler der Schiefe .254 Quotient Schiefe/ Standardfehler der Schiefe -4.083 11.4 Ergebnisse der Sprachtests 377 Rating 1, Schreibtest Spanisch - Sprachhandlungskompe‐ tenz Kurtosis 1.627 Standardfehler der Kurtosis .503 Quotient Kurtosis/ Standardfehler der Kurtosis 3.235 - Tabelle 56: Schiefe und Kurtosis der Verteilungskurve in der Sprachhandlungskompetenz im Schreibtest in Spanisch (Rating 1) Der Kurtosis-Wert von 1.627 zeigt, dass es sich um eine nach oben stärker gipflige Verteilung handelt und der negative Wert der Schiefe gibt eine deutlich rechtssteile Verteilung an. Dies ist dadurch begründbar, dass 62 der Proban‐ dinnen und Probanden und somit die Mehrheit das Niveau A2.2 (kodiert als 4) oder höher erreichen konnten. Die Quotienten aus Schiefe und Kurtosis und dem jeweiligen Standardfehler liegen jeweils deutlich außerhalb des Bereichs zwischen -1.96 und 1.96, weshalb hier nicht mehr von einer annähernden Normalverteilung ausgegangen werden kann (vgl. Tabelle 56). In Ratingphase 2 erfolgte eine differenzierte Auswertung der Teilkonstrukte Wortanzahl, Befolgung der Arbeitsanweisung, Inhalt 1, Inhalt 2, Kohärenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, lexikalische Or‐ thographie und Interpunktion, Syntax, Verwendung der Tempi und Modi sowie Morphosyntax und grammatische Orthographie. Die Prüfung auf Normalvertei‐ lung ergibt folgende Ergebnisse (vgl. Lienert/ Raatz 1998: 147 ff.; Tabelle 57): Rating 2, Schreibtest Spanisch - Wortanzahl (klassifi‐ ziert) Befolgung der Arbeits‐ anweisung Inhalt 1 Inhalt 2 n, MV n = 90, MV = 4 n = 90, MV = 4 n = 90, MV = 4 n = 90, MV = 4 Schiefe .050 -3.462 -1.151 -.107 Standardfehler der Schiefe .254 .254 .254 .254 Quotient Schiefe/ Stan‐ dardfehler der Schiefe .197 -13.630 -4.531 -.421 378 11 Auswertung der Ergebnisse Rating 2, Schreibtest Spanisch - Wortanzahl (klassifi‐ ziert) Befolgung der Arbeits‐ anweisung Inhalt 1 Inhalt 2 Kurtosis -.199 13.529 .905 -.955 Standardfehler der Kurtosis .503 .503 .503 .503 Quotient Kur‐ tosis/ Standardfehler der Kurtosis -.396 26.897 1.799 -1.899 Tabelle 57: Schiefe und Kurtosis der Teilkonstrukte Wortanzahl, Befolgung der Arbeitsan‐ weisung, Inhalt 1 und Inhalt 2 im Schreibtest in Spanisch (Rating 2) Bezüglich der Wortanzahl (klassifiziert) liegt eine annähernde Normalverteilung vor. Die durchschnittliche Wortanzahl der Spanischstichprobe liegt bei 126.52 und damit sehr nahe an den durchschnittlich 126.51 Wörtern der Französischs‐ tichprobe, was unter anderem für ein hohes Maß an Vergleichbarkeit der beiden Schreibtests spricht. Bei der Befolgung der Arbeitsanweisung zeigt sich im Gegensatz dazu eine sehr stark rechtssteile und somit keine Normalverteilung (vgl. Tabelle 57), was bedeutet, dass die Mehrheit der Schülerinnen und Schüler die Arbeitsanweisung, zwei Kurznachrichten zu verfassen, die jeweils mit einer Begrüßung beginnen und einer Verabschiedungsformel enden, erfüllte. Schiefe und Kurtosis der Verteilungskurve der Ergebnisse der Kategorie Inhalt 1 weichen signifikant von Null ab (vgl. Tabelle 57). Es handelt sich um eine ausgeprägte rechtssteile und minmal gipflige Verteilung. Bei Inhalt 2 liegt hingegen eine Normalverteilung vor (vgl. Tabelle 57). Die zweite Schreibpro‐ duktionsaufgabe war somit für die Schülerinnen und Schüler des Spanischen, ähnlich wie für diejenigen des Französischen inhaltlich deutlich anspruchsvoller als die erste. Die Verteilungskurven des zweiten Ratings, die sich auf die sprachlichen Sub‐ kompetenzen beziehen, verlaufen insgesamt deutlich homogener als diejenigen, die Inhaltsaspekte und die Befolgung der Arbeitsanweisungen abzeichnen (vgl. Tabelle 58). 11.4 Ergebnisse der Sprachtests 379 Rating 2, Schreibtest Spanisch - Kohärenz und Kohä‐ sion Wortschatz‐ spektrum Verwen‐ dung des Wort‐ schatzes Lexikalische Orthogra‐ phie und In‐ terpunktion n, MV n = 90, MV = 4 n = 90, MV = 4 n = 90, MV = 4 n = 90, MV = 4 Schiefe - -.305 .081 .077 -.343 Standardfehler der Schiefe .254 .254 .254 .254 Quotient Schiefe/ Standardfehler der Schiefe -1.202 .318 .302 -1.350 Kurtosis - -.068 .294 .222 -.521 Standardfehler der Kurtosis .503 .503 .503 .503 Quotient Kurtosis/ Standardfehler der Kurtosis -.134 .585 -.441 -1.035 - Syntax Verwen‐ dung der Tempi und Modi Morpho‐ syntax und grammati‐ sche Ortho‐ graphie Gesamt‐ durch‐ schnitt n, MV n = 90, MV = 4 n = 90, MV = 4 n = 90, MV = 4 n = 90, MV = 4 Schiefe - -.796 -.136 -.129 -.392 Standardfehler der Schiefe .254 .254 .254 .254 Quotient Schiefe/ Standardfehler der Schiefe -3.133 -.536 -.509 -1.541 380 11 Auswertung der Ergebnisse 198 Konnektoren: Schiefe -.630, Quotient Schiefe/ Standardfehler der Schiefe -2.480, Kurtosis -.596, Quotient Kurtosis/ Standardfehler der Kurtosis 1.184. 199 Koreferenz: Schiefe -.804, Quotient Schiefe/ Standardfehler der Schiefe -3.165, Kurtosis .006, Quotient Kurtosis/ Standardfehler der Kurtosis .013. 200 Text(kompetenz): Schiefe .081, Quotient Schiefe/ Standardfehler der Schiefe .038, Kur‐ tosis .294, Quotient Kurtosis/ Standardfehler der Kurtosis .585. 201 Räumliche und zeitliche Bezüge: Schiefe .142, Quotient Schiefe/ Standardfehler der Schiefe .560, Kurtosis -.776, Quotient Kurtosis/ Standardfehler der Kurtosis -1.544. Syntax Verwen‐ dung der Tempi und Modi Morpho‐ syntax und grammati‐ sche Ortho‐ graphie Gesamt‐ durch‐ schnitt Kurtosis - .155 -.371 -.585 .275 Standardfehler der Kurtosis .503 .503 .503 .503 Quotient Kurtosis/ Standardfehler der Kurtosis .307 -.739 -1.162 .546 Tabelle 58: Schiefe und Kurtosis der Kategorien Kohärenz und Kohäsion, Wortschatz‐ spektrum, Verwendung des Wortschatzes, lexikalische Orthographie und Interpunktion, Verwendung der Tempi und Modi, Morphosyntax und grammatische Orthographie sowie die gesamte durchschnittliche Punktzahl im Schreibtest in Spanisch Bei Kohärenz und Kohäsion liegt eine annähernde Normalverteilung vor (vgl. Tabelle 58). Eine Analyse der Verteilungen der einzelnen Teilkonstrukte ergibt bei Konnektoren  198 und Koreferenz  199 keine Normalverteilung, bei Text im Sinne von Textkompetenz  200 und räumlichen und zeitlichen Bezüge  201 hingegen jeweils eine annähernde Normalverteilung. Die Teilkonstrukte Wortschatzspektrum, Verwendung des Wortschatzes, lexi‐ kalische Orthographie und Interpunktion, Verwendung der Tempi, Modi und ser/ estar/ hay sowie Morphosyntax und grammatische Orthographie weisen ebenfalls annähernde Normalverteilungen auf (vgl. Tabelle 58). Lediglich die Ergebnisse des Teilkonstrukts Syntax können aufgrund des Quotienten aus Schiefe und dessen Standardfehler, der außerhalb des Bereichs zwischen -1.96 und 1.96 liegt (vgl. Tabelle 58), nicht als annähernd normalverteilt betrachtet werden. Das Gesamtergebnis des zweiten Ratings, das durch die Berechnung des Mittelwerts aus allen oben genannten Teilkonstrukten erhoben wurde, ist schließlich ebenfalls annähernd normalverteilt, weshalb bei der statistischen 11.4 Ergebnisse der Sprachtests 381 Untersuchung parametrische Testverfahren eingesetzt werden können (vgl. Tabelle 58). Nachdem die Prüfung auf Normalverteilung für die Ergebnisse aus den Ratingverfahren 1 und 2 abgeschlossen ist, wird nun statistisch getestet, ob und inwiefern bei den einzelnen Teilkonstrukten Geschlechterunterschiede vor‐ liegen. Bei der Sprachhandlungskompetenz kommt der Mann-Whitney-U-Test zu folgendem Ergebnis (vgl. Tabelle 59): Rating 1, Schreibtest Spanisch - Spanisch weiblich (n = 69, MV = 4) Spanisch männlich (n = 21, MV = 0) Sprachhandlungs‐ kompetenz M-=-3.725 (SD = .811, SEM = .098) Mdn = 4.00 M Rang = 44.41 M-=-3.857 (SD = .951, SEM = .207) Mdn = 4.00 M Rang = 49.07 Mann-Whitney-U-Test U = 649.500, Z = -.776 p = .438, d = -.151 Tabelle 59: Statistische Ergebnisse der Spanischstichprobe im Teilkonstrukt Sprachhand‐ lungskompetenz des Schreibtests, aufgeteilt nach Geschlecht (Rating 1) Abb. 11: Boxplots zur Sprachhandlungskompetenz im Schreibtest Spanisch, aufgeteilt nach Geschlecht 382 11 Auswertung der Ergebnisse 202 Das nicht signifikante Ergebnis des Kolmogorov-Smirnov-Z-Test (p = .832) ist derart zu deuten, dass die Verteilungskurven der Ergebnisse der weiblichen und der männli‐ chen Spanischlernenden im Teilkonstrukt Sprachhandlungskompetenz weitestgehend dieselben Verteilungsformen aufweisen. Daher bezieht sich der Mann-Whitney-U-Test auf die Medianwerte der Mädchen und Jungen (vgl. Devine et al. 2018: 278-286; Hart 2001: 391-393). In der Sprachhandlungskompetenz liegen keine statistisch relevanten Geschlech‐ terunterschiede vor (p = .438, d = -.151; vgl. Tabelle 59) 202 , wobei die Jungen tendenziell etwas höhere durchschnittliche Punktzahlen erzielen als die Mäd‐ chen. Die Mittelwerte zeigen, dass beide Geschlechtergruppen durchschnittlich beinahe Niveau A2.2 erreichen. An den Boxplots gut ersichtlich ist zudem, dass die Spannweiten der Ergebnisse der Mädchen und der Jungen jeweils gleich groß sind. Im Unterschied zu Französisch erreicht in Spanisch keiner der Lernenden 6 Punkte und damit keiner das Niveau B1.2 (vgl. Abbildung 11). Das erste Ratingverfahren liefert allerdings nur einen ersten holistischen Ein‐ blick in die Leistungen der Lernenden. Im Kontext des zweiten Ratingverfahrens wird nun eine detaillierte Analyse der einzelnen Teilkonstrukte bezüglich even‐ tuell auftretender Geschlechterunterschiede vorgenommen. Hierfür werden zuerst die Wortanzahl in klassifizierter Form sowie die Teilkonstrukte Befolgung der Arbeitsanweisung, Inhalt 1 und Inhalt 2 untersucht (vgl. Tabelle 60). Rating 2, Schreibtest Spanisch - Spanisch weiblich (n = 69, MV = 4) Spanisch männlich (n = 21, MV = 0) Wortanzahl (klassifi‐ ziert) M-=-4.42 (SD = .847, SEM-=-.102) Mdn = 4.00 M Rang = 45.48 M-=-4.33 (SD = .966, SEM-=-.211) Mdn = 5.00 M Rang = 45.57 t-Test t (88) = .398, p = .691, d = .099 KI 95% für d [-.396, .595] Befolgung des Arbeits‐ auftrags M-= 5.86-(SD =-.605, SEM = .052) Mdn = 6.00 M Rang = 47.40 M-=-5.43 (SD = 1.121, SEM = .245) Mdn = 6.00 M Rang = 39.26 Mann-Whitney-U-Test U = 593.500, Z = -1.984 p = .047, d = .266 11.4 Ergebnisse der Sprachtests 383 203 1-30 Wörter entsprechen dem Niveau A1.1 (1 Punkt), 31-60 Wörter dem Niveau A1.2 (2 Punkte), 61-90 Wörter dem Niveau A2.1 (3 Punkte), 91-130 Wörter dem Niveau A2.2 (4 Punkte), 131-170 Wörter dem Niveau B1.1 (5 Punkte) und mehr als 171 Wörter dem Niveau B1.2 (6 Punkte; vgl. Kapitel 11.4.3). 204 In Französisch schrieben die Mädchen durchschnittlich 138.67 Wörter, während die Jungen auf durchschnittlich 114.35 Wörter kamen. Rating 2, Schreibtest Spanisch - Spanisch weiblich (n = 69, MV = 4) Spanisch männlich (n = 21, MV = 0) Inhalt 1 M-=-4.91 (SD = 1.197, SEM = .144) Mdn = 5.00 M Rang = 49.54 M-=-4.29 (SD = 1.347, SEM = .945) Mdn = 5.00 M Rang = 38.62 Mann-Whitney-U-Test U = 505.000, Z = -2.192 p = .028, d = .453 Inhalt 2 M-=-3.41 (SD = 1.180, SEM = .191) Mdn = 4.00 M Rang = 50.27 M-=-3.76 (SD = 1.044, SEM = .228) Mdn = 3.00 M Rang = 37.59 t-Test t (88) = -1.242, p = .217, d = -.310 KI 95% für d [-.807, .188] Anmerkungen. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 60: Statistische Ergebnisse der Spanischstichprobe in den Teilkonstrukten Wort‐ anzahl, Befolgung der Arbeitsanweisung, Inhalt 1 und Inhalt 2 im Schreibtest in Spanisch, aufgeteilt nach Geschlecht (Rating 2) Im Bereich der Wortanzahl (klassifiziert)  203 sind, im Gegensatz zum Schreibtest in Französisch, bei dem die Mädchen signifikant mehr Wörter schrieben (vgl. Kapitel 11.4.3.1), keine statistisch relevanten Geschlechterunterschiede messbar (p = .691, d = .099; vgl. Tabelle 60). Die Mädchen schrieben im Durchschnitt 128.22 Wörter und die Jungen 124.81. 204 Es besteht außerdem kein Unterschied in der Niveauzuweisung: Beide Geschlechtergruppen bewegen sich im oberen Bereich von Niveau A2.2. Im Teilkonstrukt Befolgung des Arbeitsauftrags erzielen beide Geschlechter‐ gruppen sehr hohe Maße der zentralen Tendenz, welche sich stark an die maximale Höchstpunktzahl von 6 Punkten annähern (vgl. Tabelle 60). Das Ergebnis des Mann-Whitney-U-Tests zeigt, im Gegensatz zum Schreibtest in 384 11 Auswertung der Ergebnisse 205 Der Kolmogorov-Smirnov-Z-Test ergibt p = .742. Somit wird von zwei annähernd gleichen Verteilungen bei den Ergebnissen der Jungen und den Ergebnissen der Mädchen in der Kategorie Befolgung der Arbeitsanweisung ausgegangen, was bedeutet, dass der Mann-Whitney-U-Test sich auf die Medianwerte und nicht auf die mittleren Ränge bezieht (vgl. Devine et al. 2018: 278-286; Hart 2001: 391-393). Französisch, ein signifikantes Ergebnis mit schwachem Effekt zugunsten der Mädchen (p = .047, d = .266). 205 Die größere Tendenz der Jungen, aus den formalen Vorgaben auszubrechen, wird auch durch die Ergebnisse in Inhalt 1 bestätigt: Hier liegt ein signifikanter Unterschied mit schwachem Effekt zugunsten der Mädchen vor (p = .028, d = .453; vgl. Tabelle 60). Jedoch wird diese Tendenz durch das Ergebnis des t-Tests bezüglich der Kategorie Inhalt 2 durchbrochen: Hier erreichen die Jungen mit 3.76 einen tendenziell höheren Mittelwert als die Mädchen (M = 3.41), wobei der Unterschied nicht signifikant ist, jedoch einen schwachen Effekt aufweist (p = .217, d = -.310; vgl. Tabelle 60). Bei Französisch wurden in dieser Kategorie im Gegensatz dazu ein signifikanter Unterschied zugunsten der Mädchen mit einem schwachen Effekt gefunden (p = .046, d = .435, vgl. Tabelle 51). Somit kann die im Schreibtest Französisch erfasste Tendenz, dass sich die Mädchen signifikant genauer an die beiden Aufgabenstellungen halten, für den Schreibtest Spanisch letztendlich nicht bestätigt werden. Nach den Geschlechtervergleichen bezüglich der inhaltlichen und formalen Kategorien des Schreibtests in Spanisch werden nun die sprachlichen Teil‐ konstrukte sowie der Gesamtdurchschnitt aller Ergebnisse aus dem zweiten Ratingverfahren genauer auf mögliche Geschlechterunterschiede untersucht (vgl. Tabelle 61). Rating 2, Schreibtest Spanisch - Spanisch weiblich (n = 69, MV = 4) Spanisch männlich (n = 21, MV = 0) Kohärenz und Kohä‐ sion M-=-4.36 (SD = 1.000, SEM = .120) Mdn = 4.00 M Rang = 44.62 M-=-4.48 (SD = .814, SEM = .178) Mdn = 5.00 M Rang = 48.38 t-Test t (88) = -.476, p = .635, d = -.119 KI 95% für d [-.614, .377] 11.4 Ergebnisse der Sprachtests 385 206 Textkompetenz: Spanisch weiblich: M-= 4.33, SD = .869, SEM = .105; Spanisch weiblich: M = 4.38, SD = .921, SEM = .201. t(88) = -.217, p = .829, d = -.054, KI 95% für d [-.549, .441] Rating 2, Schreibtest Spanisch - Spanisch weiblich (n = 69, MV = 4) Spanisch männlich (n = 21, MV = 0) Wortschatzspektrum M-=-4.20 (SD = 1.065, SEM = .128) Mdn = 4.00 M Rang = 45.86 M-=-4.05 (SD = 1.024, SEM = .223) Mdn = 4.00 M Rang = 44.33 t-Test t (88) = .590, p = .557, d = .147 KI 95% für d [-.349, .643] Verwendung des Wort‐ schatzes M-= 3.61 (SD = 1.178, SEM = .142) Mdn = 3.00 M Rang = 45.66 M-=-3.43 (SD = 1.121, SEM = .245) Mdn = 4.00 M Rang = 44.98 t-Test t (88) = .620, p = .537, d = .155 KI 95% für d [-.341, .650] Lexikalische Orthogra‐ phie und Interpunk‐ tion M-=-4.42 (SD = 1.143, SEM = .138) Mdn = 4.00 M Rang = 45.50 M-=-4.38 (SD = 1.465, SEM = .320) Mdn = 4.00 M Rang = 45.50 t-Test t (88) = .129, p = .896, d = .032 KI 95% für d [-.463, .527] Tabelle 61: Statistische Ergebnisse der Spanischstichprobe in den Teilkonstrukten Ko‐ härenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, lexikalische Orthographie und Interpunktion im Schreibtest in Spanisch, aufgeteilt nach Geschlecht (Rating 2) Im Teilkonstrukt Kohärenz und Kohäsion werden keine statistisch relevanten Geschlechterunterschiede gemessen (p-=-.635, d-=--.119; vgl. Tabelle 61), wobei die Jungen (M = 4.48) tendenziell einen etwas höheren Mittelwert erzielen als die Mädchen (M = 3.36). Beide Geschlechtergruppen erreichen somit ein Niveau zwischen A2.2 und B1.1. Da innerhalb von Kohärenz und Kohäsion mehrere Subkategorien (vgl. Kapitel 11.4.3) erhoben wurden, werden diese ebenfalls hinsichtlich Geschlechterunterschieden untersucht: Weder die t-Tests für Textkompetenz  206 , Herstellung räumlicher und zeitlicher Bezüge  207 noch die Mann-Whitney-U-Tests für Verwendung von Konnektoren  208 und Herstellung von Koreferenz  209 ergeben statistisch relevante Unterschiede zwischen weibli‐ 386 11 Auswertung der Ergebnisse 207 Herstellung räumlicher und zeitlicher Bezüge: Spanisch weiblich: M = 3.75, SD = 1.311, SEM-= .158; Spanisch männlich: M-= 3.71, SD 1.271, SEM-= .277. t(87) = .121, d-= .030, KI 95% für d [-.465, .525] 208 Verwendung von Konnektoren: Spanisch weiblich: M Rang = 45.67, Mdn = 5.00; Spanisch männlich: M Rang -=-44.93, Mdn = 5.00; U-= 712.500, Z-=--.874, p-=-.382, d-= .179 209 Herstellung von Koreferenz: Spanisch weiblich: M Rang = 44.22, Mdn = 4.00; Spanisch männlich: M Rang -=-49.71, Mdn = 5.00; U-= 636.000, Z-=--.121, p-=-.903, d-= .024 chen und männlichen Spanischlernenden. Die Ergebnisse sind folglich deutlich ausgeglichener als beim Schreibtest in Französisch, bei dem in allen vier Bereichen die Mädchen leicht höhere durchschnittliche Punktzahlen erzielen, wobei alle Unterschiede eine schwache Effektstärke aufwiesen und im Falle der Text(kompetenz) sogar signifikant waren (vgl. Kapitel 11.4.3.1). In den lexikalischen Teilkonstrukten Wortschatzspektrum und Verwendung des Wortschatzes treten im Spanischen genauso wie bei Kohärenz und Kohä‐ sion keine statistisch relevanten Geschlechterunterschiede auf, wenngleich die Mädchen tendenziell minimal höhere Mittelwerte erzielen (vgl. Tabelle 61). Sowohl die Mädchen (M = 4.20) als auch die Jungen (M = 4.05) erreichen im Bereich Wortschatzspektrum das Niveau A2.2, wodurch, im Gegensatz zum Schreibtest Französisch (vgl. Kapitel 11.4.3.1) auch keinerlei Unterschiede in den Feinniveaustufen feststellbar sind. Bei der Verwendung des Wortschatzes liegen beide Geschlechtergruppen mit Niveaus zwischen A2.1 und A2.2 ebenfalls gleich auf (M (w) = 3.61, M (m) = 3.43). Schließlich erzielen sowohl die Spanischlernerinnen (M = 4.42) als auch die Spanischlerner (M = 4.38) in lexikalischer Orthographie und Interpunktion jeweils ein Durchschnittsniveau zwischen A2.2 und B1.1 und es liegt kein statistisch relevanter Unterschied vor (p = .896, d-=-.032, vgl. Tabelle 61). In den vier bisher untersuchten sprachlichen Teilkonstrukten im Spanischen können bei beiden Geschlechtergruppen geringere Standardabweichungen als im Schreibtest in Französisch beobachtet werden. Die einzige Ausnahme stellt der Bereich lexikalische Orthographie und Interpunktion dar, bei dem die Jungen der Spanischstichprobe eine größere Standardabweichung als die Jungen der Französischstichprobe vorweisen, (vgl. Tabelle 52, Tabelle 61). Im Folgenden werden die grammatischen Teilkonstrukte Syntax, Verwendung der Tempi und Modi sowie Morphosyntax und grammatische Orthographie sowie das Gesamtergebnis aus dem zweiten Rating auf Geschlechterunterschiede untersucht (vgl. Tabelle 62): 11.4 Ergebnisse der Sprachtests 387 Rating 2, Schreibtest Spanisch - Spanisch weiblich (n = 69, MV = 4) Spanisch männlich (n = 21, MV = 0) Syntax M-=-4.58 (SD = 1.193, SEM = .144) Mdn = 5.00 M Rang = 43.45 M-=-4.95 (SD = 1.161, SEM = .253) Mdn = 5.00 M Rang = 52.24 Mann-Whitney-U-Test U = 583.000, Z = -1.402 p = .161, d = .288 Verwendung der Tempi, Modi und ser/ estar/ hay M-=-3.42 (SD = 1.322, SEM = .159) Mdn = 3.00 M Rang = 45.81 M-=-3.38 (SD = 1.322, SEM = .288) Mdn = 3.00 M Rang = 44.48 t-Test t (88) = ,119, p = .905, d = .030 KI 95% für d [-.466, .525] Morphosyntax und grammatische Ortho‐ graphie M-=-4.03 (SD = 1.236, SEM = .149) Mdn = 4.00 M Rang = 46.20 M-=-3.86 (SD = 1.195, SEM = .261) Mdn = 4.00 M Rang = 43.21 t-Test t (88) = .562, p = .576, d = .140 KI 95% für d [-.356, .636] Gesamtergebnis Schreiben M-=-4.28 (SD = .795, SEM = .096) Mdn = 4.25 M Rang = 45.72 M-=-4.20 (SD = .848, SEM = .185) Mdn = 4.50 M Rang = 44.76 t-Test t (88) = .405, p = .686, d = .101 KI 95% für d [-.395, .596] Tabelle 62: Statistische Ergebnisse der Spanischstichprobe in den Teilkonstrukten Syntax, Verwendung der Tempi und Modi, Morphosyntax und grammatische Orthographie sowie im Gesamtergebnis des Schreibtests in Spanisch, aufgeteilt nach Geschlecht (Rating 2) 388 11 Auswertung der Ergebnisse 210 Verwendung der Tempi und Modi: Spanisch weiblich: M Rang = 45.65, Mdn = 3.00; Spanisch männlich: M Rang -=-45.00, Mdn-= 3.00; U-=-714.000, Z-= -.103, p-=-.918, d =-.021 211 Verwendung von ser/ estar/ hay: Spanisch weiblich: M = 3.67, SD = 1.411, SEM = .169; Spanisch männlich: M-=-3.52, SD-=-1.365, SEM-=-.340; t (88)-=-.409, p-=-.683, d-=-.102, KI 95% für d [-.395, .597] Abb. 12: Boxplots zum Gesamtdurchschnitt im Schreibtest Spanisch (Rating 2), aufgeteilt nach Geschlecht Im Bereich Syntax erreichen die Jungen durchschnittlich beinahe das Niveau B1.1 (M = 4.95), während die Leistungen der Mädchen zwischen Niveau A2.2 und B1.1 (M = 4.58) anzusiedeln sind (vgl. Tabelle 62). Laut Whitney-U-Test besteht kein signifikanter Unterschied, jedoch ein schwacher Effekt zugunsten der Jungen (p = .161, d = -.288; vgl. Tabelle 62). Dieser stellt den stärksten gemessenen Effekt innerhalb des Schreibtests in Spanisch dar. Bei der Untersuchung der beiden Subkategorien Verwendung der Tempi und Modi  210 und Verwendung von ser/ estar/ hay  211 auf Geschlechterunterschiede ergeben sich hingegen keine statistisch relevanten Effekte. Bei der Kategorie, die beide Subkategorien in sich vereint, nämlich bei Verwendung der Tempi, Modi und ser/ estar/ hay erlangen im Spanischen wiederum die Mädchen einen minimal höheren Mittelwert (M = 3.42) als die Jungen (M = 3.38), was bedeutet, dass sich beide Merkmalsgruppen auf einem Durchschnittsniveau zwischen A2.1 und A2.2 bewegen. Ein t-Test ergibt allerdings auch hier keinen statistisch relevanten 11.4 Ergebnisse der Sprachtests 389 212 Bei den Ergebnissen der Jungen tritt das Phänomen auf, dass der Median (Mdn =-4.50) größer ist als der Mittelwert (M = 4.20), was durch eine leicht linksschiefe Verteilung bedingt ist. Geschlechterunterschied (p = .905, d = .030, vgl. Tabelle 62). Auch dieses Ergebnis steht im Gegensatz zu den Befunden aus dem Schreibtests in Französisch, bei denen bei der Verwendung von Tempi und Modi zwar auch kein signifikanter Unterschied, jedoch ein schwacher Effekt zugunsten der Mädchen erfasst wurde (vgl. Tabelle 53). In der letzten Kategorie Morphosyntax und grammatische Orthographie er‐ langen in Spanisch schließlich die Mädchen einen tendenziell höheren Mittel‐ wert (M = 4.03) als die Jungen (M = 3.86), wobei hier nach der Einteilung in die Feinniveaustufen insofern ein Unterschied vorliegt, als dass die Mädchen im Durchschnitt Niveau A2.2 erreichen und die Jungen leicht darunter bleiben. Jedoch zeigt ein t-Test keine statistische Relevanz (p = .576, d = .140; vgl. Tabelle 62). Das Gesamtergebnis aus dem zweiten Rating könnte schließlich, was die Leistungen der Jungen und Mädchen betrifft, kaum ausgeglichener sein: Die Spanischlernerinnen erreichen einen Mittelwert von 4.28 und die Jungen 4.20 (vgl. Tabelle 62). Dementsprechend ergibt der t-Test kein statistisch relevantes Ergebnis (p = .686, d = .101; vgl. Tabelle 62). 212 Im Vergleich zum Gesamtergebnis aus dem zweiten Rating des Schreibtests in Französisch zeigt sich somit, dass die Mädchen im Spanischen einen etwas höheren Mittelwert erreichen (M = 4.28) als die Mädchen im Französischen (M = 4.17). Die männlichen Spanischlernenden erzielen mit einem Mittelwert von 4.20 allerdings ein deutlich höheres Ergebnis als die Jungen im Schreibtest in Französisch, die bei durchschnittlich 3.76 Punkten lagen (vgl. Tabelle 53). Während also das Ergebnis in Französisch zugunsten der Mädchen knapp signifikant ausfällt (p = .046, d = .435, vgl. Tabelle 53), treten im Spanischen im Gesamtdurchschnitt des zweiten Ratings keinerlei Geschlechterunterschiede auf. Im dritten Rating wurden die Kategorien Wortschatz (berechnet aus Wort‐ schatzspektrum und Verwendung des Wortschatzes), Grammatik (berechnet aus Syntax, Verwendung der Tempi, Modi und ser/ estar/ hay sowie Morphosyntax und grammatischer Orthographie), Orthographie (übernommen aus Rating 2) und Text (berechnet aus dem genauen Durchschnitt zwischen Textkompetenz, Konnektoren, räumliche und zeitliche Bezüge und Herstellung von Koreferenz) gleichwertig miteinander verrechnet, um die fremdsprachliche Leistung - frei von inhaltlichen und formalen Aspekten - zu ermitteln und entsprechend eine Einstufung in Feinniveaustufen vornehmen zu können. Hierbei ergeben die Prüfungen auf Normalverteilung (vgl. Lienert/ Raatz 1998: 147 ff.), dass in allen 390 11 Auswertung der Ergebnisse vier Bereichen sowie in der gesamten fremdsprachlichen Leistung im Schreiben annähernde Normalverteilungen vorliegen (vgl. Tabelle 63): Rating 3, Schreibtest Spanisch - Wort‐ schatz Gram‐ matik Ortho‐ graphie Text Sprach‐ niveau gesamt n, MV n = 90, MV = 4 n = 90, MV = 4 n = 90, MV = 4 n = 90, MV = 4 n = 90, MV = 4 Schiefe .035 -.407 -.343 -.432 -.452 Standardfehler der Schiefe .254 .254 .254 .254 .254 Quotient Schiefe/ Standard‐ fehler der Schiefe .137 -1.601 -1.350 -1.700 -1.779 Kurtosis -.233 -.090 -.521 .094 .210 Standardfehler der Kurtosis .503 .503 .503 .503 .503 Quotient Kurtosis/ Standardfehler der Kurtosis -.463 -.180 -1.035 .186 .417 Tabelle 63: Schiefe und Kurtosis der Verteilungskurven in den Teilkonstrukten Wortschatz, Grammatik, Orthographie und Text der Schreibleistung in Spanisch (Rating 3) Die Tests auf Unterschiede zeigen erneut ein ausgeglichenes Geschlechterver‐ hältnis (vgl. Tabelle 64): 11.4 Ergebnisse der Sprachtests 391 Rating 3, Schreibtest Spanisch - Spanisch weiblich (n = 69, MV = 4) Spanisch männlich (n = 21, MV = 0) Wortschatz M-=-3.91 (SD = 1.086, SEM = .131) Mdn = 4.00 M Rang = 45.85 M-=-3.74 (SD = .995, SEM = .217) Mdn = 4.00 M Rang = 44.36 t-Test t (88) = .631, p = .529, d = .157 KI 95% für d [-.339, .653] Grammatik M-=-4.01 (SD = 1.104, SEM = .133) Mdn = 4.00 M Rang = 45.14 M-=-4.06 (SD = 1.104, SEM = .133) Mdn = 4.00 M Rang = 46.67 t-Test t (88) = -.198, p = .844, d = -.049 KI 95% für d [-.545, .446] Orthographie M-=-4.42 (SD = 1.143, SEM = .138) Mdn = 4.00 M Rang = 45.50 M-=-4.38 (SD = 1.465, SEM = .321) Mdn = 4.00 M Rang = 45.50 t-Test t (88) = .129, p = .898, d = .032 KI 95% für d [-.463, .527] Text M-=-4.24 (SD = .979, SEM = .119) Mdn = 4.25 M Rang = 44.54 M-=-4.35 (SD = .934, SEM = .204) Mdn = 4.5 M Rang = 48.67 t-Test t (88) = -.425, p = .672, d = -.106 KI 95% für d [-.601, .390] Sprachliche Gesamt‐ leistung Schreiben M-=-4.14 (SD = .945, SEM = .114) Mdn = 4.08 M Rang = 45.51 M-=-4.13 (SD = .998, SEM = .218) Mdn = 4.43 M Rang = 45.45 t-Test t (88) = .053, p = .958, d = .013 KI 95% für d [-.482, .508] Tabelle 64: Statistische Ergebnisse der Spanischstichprobe in den Teilkonstrukten Wort‐ schatz, Grammatik, Orthographie und Text sowie in der sprachlichen Gesamtleistung im Schreibtest in Spanisch, aufgeteilt nach Geschlecht (Rating 3) 392 11 Auswertung der Ergebnisse Abb. 13: Boxplots zur sprachlichen Gesamtleistung im Schreibtest Spanisch (Rating 3), aufgeteilt nach Geschlecht Bei der Untersuchung auf Geschlechterunterschiede in den vier unterschiedli‐ chen sprachlichen Kategorien wird der größte Effekt beim Wortschatz zugunsten der Mädchen gemessen (d = .157), wobei selbst dieser vernachlässigbar ist. Der zweitgrößte Effekt wird bei der Kategorie Text(kompetenz) zugunsten der Jungen gefunden, beträgt d = -.106 und ist folglich ebenfalls vernachlässigbar (vgl. Tabelle 64). Bei der Grammatik fällt der Effekt vernachlässigbar zugunsten der Jungen (d = -.049) und bei der Orthographie schließlich vernachlässigbar zugunsten der Mädchen (d = .032) aus. Mit Ausnahme des Bereichs Wortschatz liegen alle sprachlichen Leistungen leicht über Niveau A2.2, wobei die Mädchen in der Orthographie mit dem Mittelwert von 4.42 den höchsten und die Jungen mit einem Mittelwert von 3.74 im Bereich Wortschatz den jeweils niedrigsten Mittelwert in Rating 3 erzielen. Während also im Schreibtest Französisch in Text(kompetenz), Wortschatz und Grammatik schwache Effekte zugunsten der Mädchen gefunden wurden, treten im Schreibtest Spanisch vernachlässigbare Effekte in den sprachlichen Bereichen auf, die teilweise zugunsten der Jungen, teilweise zugunsten der Mädchen ausfallen. Daher erzielen beide Geschlechtergruppen in Spanisch in der sprachlichen Gesamtleistung vergleichbare Ergebnisse (p = .958, d = .013; vgl. Tabelle 64): Der 11.4 Ergebnisse der Sprachtests 393 Mittelwert der Mädchen liegt bei 4.14 bei einer Standardabweichung von .945 und der Mittelwert der Jungen liegt bei 4.13 bei einer Standardabweichung von .998 (vgl. Tabelle 64). Bei den Jungen stellt Fall 140 (Codenummer 1048) einen Ausreißer nach unten dar (vgl. Abbildung 13). Abschließend wird eine Reliabilitätsanalyse mithilfe von IBM SPSS Statistics 26 durchgeführt, die für das zweite Ratingverfahren ein Cronbachs α von .925 und für das dritte Ratingverfahren ein Cronbachs α von .898 ergibt, wodurch belegt werden kann, dass beide Verfahren ein hohes Maß an Reliabilität aufweisen. - 11.4.3.3 Zwischenfazit: Ergebnisse der Schreibtests in Französisch und Spanisch Bezüglich des Schreibtests in Französisch finden sich einige signifikante Ge‐ schlechterunterschiede: Bei der Sprachhandlungskompetenz, die im ersten Ra‐ ting erfasst wurde, tritt ein signifikanter Unterschied zugunsten der Mädchen auf (p = .031, d = .452; vgl. Tabelle 50); im zweiten Rating werden bei Wortanzahl (p = .017, d = .525), Inhalt 1 (p = .038, d = .426), Inhalt 2 (p = .046, d = .435) sowie bei Morphosyntax und grammatische Orthographie (p = .011, d = .562) signifikante Geschlechterunterschiede zugunsten der Mädchen gemessen und auch beim Gesamtergebnis des zweiten Ratings erzielen die Mädchen signifikant höhere Ergebnisse (p = .046, d = .435, vgl. Tabelle 51). Beim dritten Rating, das sich ausschließlich auf sprachliche Teilkonstrukte bezieht, wird schließlich bei Grammatik ein signifikanter Unterschied zugunsten der Mädchen erfasst. Schwache, nicht signifikante Effekte zugunsten der Mädchen finden sich im zweiten Rating bei den nicht signifikanten Ergebnissen bei Kohärenz und Kohäsion (p = .272, d = .237), Wortschatzspektrum (p = .093, d = .365), Verwendung des Wortschatzes (p = .145, d = .316), Syntax (p = .135, d = .314) sowie Verwendung der Tempi und Modi (p = .132, d = .310, vgl. Tabelle 53). Auch beim dritten Rating treten bei Wortschatz (p-=-.107, d-=-.350) und Text (p-=-.123, d-=-.334) schwache, nicht signifikante Effekte zugunsten der Mädchen auf. Einzig die Befolgung des Arbeitsauftrags (p = .909, d = .065, vgl. Tabelle 51) und die lexikalische Orthographie und Interpunktion (p-=-.760, d-=--.066, vgl. Tabelle 52) werden von beiden Geschlechtergruppen gleich gut bewältigt, wobei bei der lexikalischen Orthographie und Interpunktion die Jungen (M = 4.11) einen minimal höheren Mittelwert erzielen als die Mädchen (M = 4.02), was jedoch statistisch nicht relevant ist. In Spanisch zeichnet sich hingegen ein sehr ausgeglichenes Geschlechter‐ verhältnis bezüglich der Schreibleistungen ab: Signifikante Geschlechterun‐ terschiede zugunsten der Mädchen treten lediglich bei der Befolgung des 394 11 Auswertung der Ergebnisse Arbeitsauftrags (p = .047, d = .266) und bei Inhalt 1 (p = .028, d = .453) auf. Alle anderen statistischen Prüfungen eines möglichen Unterschieds ergeben keine signifikanten Ergebnisse. Bei Inhalt 2 (p = .217, d = -.310) und Syntax (p-=-.161, d-= .288) treten jeweils schwache Effekt zugunsten der Jungen auf. In allen anderen Teilkonstrukten finden sich vernachlässigbare Effekte, die teils zugunsten der Jungen, teils zugunsten der Mädchen ausfallen: Darunter fallen Sprachhandlungskompetenz (p = .438, d = -.151, vgl. Tabelle 59), Wortanzahl (p = .691, d = .099), Kohärenz und Kohäsion (p = .635, d = -.119), Wortschatz‐ spektrum (p = .557, d = .147), Verwendung des Wortschatzes (p = .537, d = .155), lexikalische Orthographie und Interpunktion (p = .896, d = .032, vgl. Tabelle 61), Verwendung der Tempi und Modi sowie von ser/ estar/ hay (p = .905, d = .030), Morphologie und grammatische Orthographie (p = .576, d = .140) sowie das Gesamtergebnis des zweiten Ratings (p = .686, d = .101, vgl. Tabelle 62). Im dritten Rating finden sich ebenfalls überall, d. h. beim Wortschatz (p = .529, d = .157), bei der Grammatik (p = .844, d = -.049), bei der Orthographie (p = .844, d = -.049), bei der Kategorie Text (p = .672, d = -.106) und bei der sprachlichen Gesamtleistung (p-=-.958, d-=-.013, vgl. Tabelle 64) ausgeglichene Ergebnisse. Über beide Sprachen hinweg sind folglich Geschlechterunterschiede zu‐ gunsten der Mädchen lediglich in den Bereichen, bei denen es um die Genau‐ igkeit der Umsetzung des Arbeitsauftrags geht, zu beobachten. Durchbrochen wird diese Tendenz jedoch durch das Ergebnis in Inhalt 2 im Schreibtest Spanisch, bei dem die Jungen zwar nicht signifikante, aber mit einem schwachen Effekt (p = .217, d = -.310; vgl. Tabelle 60) höhere durchschnittliche Punktzahlen erzielen. Da die Mädchen in den formalen Kategorien häufig signifikant besser sind und Inhalt 1 die einzige Kategorie darstellt, bei der in beiden Sprachen die Mädchen signifikant höhere Punktzahlen erlangen, stellt sich die Frage, inwiefern die Aufgaben und Arbeitsaufträge tatsächlich die Interessen beider Geschlechtergruppen widerspiegelten und ob diese Effekte durch andere Aufga‐ benstellungen bzw. eine andere Themenwahl vollständig ausgeglichen werden könnten. Dieser Aspekt wird in den Kapiteln 12.1 und 12.2 ausführlicher diskutiert. Betrachtet man die Ergebnisse der Schreibtests in Französisch und im Spa‐ nisch im Vergleich, so erreichen die Spanischlernenden im Durchschnitt etwas höhere Punktzahlen als die Französischlernenden; zudem ist die Streuung in den Leistungen des Französischen tendenziell größer als diejenige der Spani‐ schleistungen; beispielsweise kommen die Mädchen im zweiten Rating des Schreibtests in Französisch auf durchschnittlich 4.17 Punkte und die Mädchen im Schreibtest in Spanisch auf durchschnittlich 4.28 Punkte. Deutlich höher fällt die Differenz im Gesamtergebnis des zweiten Ratings bei den Jungen aus: In der 11.4 Ergebnisse der Sprachtests 395 Französischstichprobe erreichen die Jungen einen Mittelwert von 3.76 und in der Spanischstichprobe einen Mittelwert von 4.20 (vgl. Tabelle 65). - Französisch weiblich (n = 52, MV = 0) Französisch männlich (n = 37, MV = 3) Rating 2: Gesamter‐ gebnis Schreiben M-=-4.17 (SD =-.947) Mdn = 4.20 M Rang = 49.63 M-=-3.76 (SD = .949) Mdn = 3.82 M Rang = 38.49 t-Test t (87) = 2.023, p = .046, d = .435 KI 95% für d [.003, .867] Rating 3: Sprach‐ liche Gesamtleistung Schreiben M-=-3.85 (SD = 1.135) Mdn = 3.82 M Rang = 48.44 M-=-3.52 (SD = 1.092) Mdn = 3.48 M Rang = 40.16 t-Test t (87) = 1.377, p = .172, d = .296 KI 95% für d [-.134, .726] - Spanisch weiblich (n = 69, MV = 4) Spanisch männlich (n = 21, MV = 0) Rating 2: Gesamter‐ gebnis Schreiben M-=-4.28 (SD = .795) Mdn = 4.25 M Rang = 45.72 M-=-4.20 (SD = .848) Mdn = 4.50 M Rang = 44.76 t-Test t (88) = .405, p = .686, d = .101 KI 95% für d [-.395, .596] Rating 3: Sprach‐ liche Gesamtleistung Schreiben M-=-4.14 (SD = .945) Mdn = 4.08 M Rang = 45.51 M-=-4.13 (SD = .998) Mdn = 4.43 M Rang = 45.45 t-Test t (88) = .053, p = .958, d = .013 KI 95% für d [-.482, .508] Anmerkungen. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 65: Gesamtergebnisse des Schreibtests aus Rating 2 und Rating 3 in Französisch und Spanisch im Vergleich, aufgeteilt nach Geschlecht 396 11 Auswertung der Ergebnisse 11.4.3.4 Limitationen der Auswertung der Schreibtests Die Ergebnisse zeigen, dass eventuell beide Aufgabenstellungen, insbesondere diejenige, das eigene Zimmer zu beschreiben - trotz des Einfügens der Option eines männlichen oder eines weiblichen Adressaten - mehr an den weiblichen Schülerinnen ausgerichtet sein könnten, da insbesondere bei den Teilkonstrukte Inhalt 1 und Inhalt 2 starke Geschlechterunterschiede zugunsten der Mädchen auftreten. Diese Überlegung wird in den folgenden Kapiteln verstärkt überprüft (vgl. Kapitel 11.10.1.4, 11.10.3.4, 12.1 und 12.2). Außerdem bestätigt die Auswertung der Schreibtests, dass bereits kurze Schreibproduktionen ausreichend sein können, um eine reliable Niveauzuord‐ nung vorzunehmen. Dennoch wäre es unter Umständen zielführender gewesen, bei der zweiten Schreibaufgabe noch einen zweiten Inhaltspunkt hinzuzufügen, für dessen Versprachlichung eine Vergangenheitszeit benötigt wird, um die Messung der Verwendung der Tempi und Modi sowie der grammatischen Ortho‐ graphie und Morphosyntax im Bereich der Vergangenheitstempora auf eine breitere Basis zu stellen, anstatt diese fast ausschließlich vom Verb frz. gagner bzw. sp. ganar abhängig zu machen. Dies hätte einen noch breiteren Einblick in die zielsprachliche Kompetenz der Probandinnen und Probanden erlaubt. Menschlichen Raterinnen und Ratern gelingt es zudem oft nicht, den Ein‐ fluss der Aufgabenschwierigkeit auf die Leistung abzuschätzen und in den Beurteilungen als relativierendes Element angemessen zu berücksichtigen (vgl. Konsortium HarmoS Fremdsprachen 2009: 50). Wichtig wäre daher, dass mehrere Raterinnen und Rater ein und denselben Text beurteilen, was eine Schätzung der Interrater-Reliabilität, also der (internen) Konsistenz des ein‐ zelnen Beurteilers bzw. der einzelnen Beurteilerin und der Beurteilungsstrenge erlauben würde (vgl. z. B. Konsortium HarmoS Fremdsprachen 2009: 50). Da dies im Rahmen einer Qualifikationsarbeit nicht zulässig ist, wurde die Lösung gefunden, möglichst adäquate und konkrete Beurteilungskriterien anzulegen. Außerdem führte ein und dieselbe Raterin mehrere Ratingprozesse pro Text mit zeitlichen Abstand zwischen den einzelnen Ratingverfahren durch. Bei dabei entstandenen Abweichungen in der Punktevergabe wurde stets eine erneute Analyse durchführt. Die sehr guten Reliabilitätswerte für beide Sprachtests zeigen, dass der fehlende Einbezug mehrerer Raterinnen und Rater durch die Anlegung adäquater und konkreter Beurteilungskriterien und die mehrfachen, zeitlich versetzten Ratings weitestgehend ausgeglichen werden konnte. 11.4 Ergebnisse der Sprachtests 397 213 Die erzielten Punktzahlen im Hörverstehenstest werden mit 1.65 multipliziert, sodass der höchste zu erzielende Wert ebenfalls 66 darstellt (40 * 1.65 = 66) und die erzielten Punktzahlen im Leseverstehenstest werden mit 3.3 multipliziert, sodass auch hier die maximale Höchstpunktzahl 66 beträgt (20-*-3.3-=-66). 11.5 Gesamtleistungen in den Sprachtests in Französisch und Spanisch Beim Hörverstehenstest konnte eine Maximalpunktzahl von 40 erreicht werden, während beim Leseverstehenstest eine Maximalpunktzahl von 20 zu erzielen war. Beim Schreibtest wurde hingegen bisher mit den Mittelwerten der zwischen den möglichen Punktzahlen 0 bis 6 bei jeder Subkategorie und beim Gesamter‐ gebnis gerechnet, um transparente Bezüge zu den GeR-Feinniveaustufen her‐ stellen zu können. Aufgrund dieser unterschiedlichen Vorgehensweise und um eine gleichwertige Gewichtung der Hörverstehens-, der Leseverstehens- und der Schreibleistung in der Berechnung des Gesamtergebnisses zu ermöglichen, muss zunächst eine Standardisierung der Werte der drei Sprachtests erfolgen. Darum wird der Maßstab des Schreibens aus dem zweiten Rating, bei dem, wenn man alle Punkte addiert, eine Maximalpunktzahl von 66 erreicht werden konnte, als Richtlinie gesetzt. Auf Grundlage dessen werden die Ergebnisse des Leseverstehens- und des Hörverstehenstests standardisiert, damit bei allen Teilfertigkeiten 66 Punkte die Maximalpunktzahl darstellen. 213 Um eine Skala für die Gesamtleistung zu erstellen, werden alle drei Ergebnisse schließlich addiert und durch drei geteilt. Aufgrund der überwiegend hoch signifikanten Korrelation (p < .01) zwischen den Ergebnissen des Leseverstehenstests, des Hörverstehenstests und des Schreibtests (vgl. Anhänge 9.1 und 9.3) sowie aufgrund der wenigen fehlenden Werte in den einzelnen Sprachtests werden auch diejenigen SuS berücksichtigt, von denen nur zwei Testergebnisse (z. B. nur der Hörverstehens- und der Schreibtest) oder aber nur ein Testergebnis (z. B. nur der Schreibtest) vorliegen. Wenn zwei Testergebnisse vorliegen, werden diese addiert und durch zwei geteilt um die Skala der Gesamtleistung zu erhalten und wenn nur ein Testergebnis vorliegt, wird dieses als Gesamtleistung übernommen. Sowohl die Gesamtergebnisse der Französischtests als auch die Gesamtergebnisse der Spanischtests sind annähernd normalverteilt (vgl. Tabelle 66). Während in Französisch alle Testergebnisse annähernde Normal‐ verteilungen aufweisen, weichen die Ergebnisse des Hörverstehens und des Leseverstehens in Spanisch knapp von einer Normalverteilung ab (vgl. Kapitel 11.4.1.2 und 11.4.2.2), weshalb hier nonparametrische Tests eingesetzt werden (vgl. Lienert/ Raatz 1998: 147 ff.). 398 11 Auswertung der Ergebnisse Gesamtergebnis Fran‐ zösisch Gesamtergebnis Spa‐ nisch n, MV n = 92, MV = 0 n = 94, MV = 0 Schiefe -.262 -.482 Standardfehler der Schiefe .251 .249 Quotient Schiefe/ Standardfehler der Schiefe -1.041 -1.938 Kurtosis -.230 .096 Standardfehler der Kurtosis .498 .493 Quotient Kurtosis/ Standard‐ fehler der Kurtosis -.463 .194 Tabelle 66: Schiefe und Kurtosis der Verteilungskurven der Gesamtergebnisse aus allen Sprachtests in Französisch und Spanisch In Tabelle 67 befindet sich eine Zusammenfassung aller Ergebnisse der Sprach‐ tests in Französisch und Spanisch, die Aufschluss über die Leistungen der Geschlechtergruppen gibt. - Französisch weiblich Französisch männlich n, MV n = 51, MV = 1 n = 34, MV = 6 Hörverstehen M-= 39.082 SD =-7.416 SEM = 1.038 M-= 37.756 SD =-7.509 SEM =1.288 t-Test t (83) = .804, p = .424, d = .178 KI 95% für d [-.263, .619] n, MV n = 51, MV = 1 n = 37, MV = 3 Leseverstehen M-= 54.741 SD =-7.701 SEM = 1.078 M-=-51.284 SD =-8.612 SEM =1.416 t-Test t (86) = 1.978, p = .051, d = .427 KI 95% für d [-.007, .861] 11.5 Gesamtleistungen in den Sprachtests in Französisch und Spanisch 399 Französisch weiblich Französisch männlich n, MV n = 52, MV = 0 n = 37, MV = 3 Schreiben (2. Rating) M-=-45.846 SD =-10.425 SEM =1.446 M-=-41.324 SD =-10.432 SEM = 1.715 t-Test t (87) = 2.023, p = .046, d = .435 KI 95% für d [.003, .867] n, MV n = 52, MV = 0 n = 40, MV = 0 Gesamtergebnis in den Sprachtests M-=-46.440 SD =-7.106 SEM = .985 M-=-43.135 SD = 7.431 SEM = 1.175 t-Test t (90) = 2.168, p = .033, d = .456 KI 95% für d [.033, .879] - Spanisch weiblich Spanisch männlich n, MV n = 73, MV = 0 n = 21, MV = 0 Hörverstehen M-=-41.702 SD =-8.479 SEM = .992 M-= 44.707 SD =-6.876 SEM = 1.500 Mann-Whitney-U-Test U = 609.500, Z = -1.426, p = .154, d = .298 n, MV n = 69, MV = 2 n = 21, MV = 0 Leseverstehen M-= 53.087 SD =-6.879 SEM = .828 M-=-54.057 SD =-8.314 SEM =1.814 Mann-Whitney-U-Test U = 642.500, Z = -.792, p-=-.428, d = .165 400 11 Auswertung der Ergebnisse Spanisch weiblich Spanisch männlich n, MV n = 69, MV = 2 n = 21, MV = 0 Schreiben (2. Rating) M-=-47.098 SD =-8.747 SEM = 1.053 M-= 46.202 SD =-9.333 SEM = 2.037 t-Test t (88) = .405, p = .686, d = .101 KI 95% für d [-.395, .596] n, MV n = 73, MV = 0 n = 21, MV = 0 Gesamtergebnis in den Sprachtests M-=-46.686 SD = 6.906 SEM = .808 M-=-48.322 SD = 6.530 SEM = 1.425 t-Test t (92) = -.968, p = .336, d = -.240 KI 95% für d [-.733, .253] Anmerkungen. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 67: Gesamtergebnisse in Französisch und Spanisch, ermittelt über die Hörvers‐ tehenstests, die Leseverstehenstests und die Schreibtests (Rating 2), aufgeteilt nach Geschlecht In Tabelle 67 wird ersichtlich, dass im Französischen im Hörverstehen (p = .424, d = .178) keine statistisch relevanten Unterschiede messbar sind, während im Leseverstehen (p = .051, d = .427) knapp nicht signifikante Geschlechterunter‐ schiede mit mittlerer Effektstärke zugunsten der Mädchen gemessen werden. Signifikante Geschlechterunterschiede treten im Französischen beim Schreiben (p-=-.046, d-=-.435) sowie im Gesamtergebnis (p-=-.033, d-=-.456) auf. Im Spanischen werden hingegen keine signifikanten Geschlechterunter‐ schiede gemessen: Im Hörverstehen (p = .154, d = .298) treten schwache, nicht signifikante Effekte zugunsten der Jungen auf; im Leseverstehen (p = .428, d = .165) und im Schreiben (p = .686, d = .101) werden vernachlässigbare Effekte gemessen und im Gesamtergebnis (p = .336, d = -.240) wird ein schwacher, nicht signifikanter Effekt zugunsten der Jungen festgestellt. Die Mädchen schneiden im Gesamtergebnis im Französischen (M (w) = 46.440) fast identisch ab wie die Mädchen im Gesamtergebnis im Spanischen (M-(w) = 46.686), während die Jungen im Französischen (M (m) = 43.135) etwas geringere Mittelwerte erzielen als die Jungen im Spanischen (M-(m)-=-48.322). 11.5 Gesamtleistungen in den Sprachtests in Französisch und Spanisch 401 Abb. 14: Boxplots zur sprachlichen Gesamtleistung in Französisch (Hörverstehenstest, Leseverstehenstest und Schreibtest), aufgeteilt nach Geschlecht Abb. 15: Boxplots zur sprachlichen Gesamtleistung in Spanisch (Hörverstehenstest, Leseverstehenstest und Schreibtest), aufgeteilt nach Geschlecht 402 11 Auswertung der Ergebnisse In Französisch zeigt sich sowohl bei den Jungen als auch bei den Mädchen eine größere Spannweite der Gesamtleistungen als in Spanisch. Während es im Gesamtergebnis bei Französisch keine Ausreißer gibt, stellen in Spanisch ein Mädchen (Fall 169, Codenummer 1077) und ein Junge (Fall 140, Codenummer 1048) Ausreißer dar (vgl. Abbildung 14 und Abbildung 15). 11.5.1 Zwischenfazit: Antwort auf Forschungsfrage 1 für Französisch Um Forschungsfrage 1 beantworten zu können, wurde ermittelt, in welchen fremdsprachlichen Leistungen bezüglich des Leseverstehens, des Hörverstehens und des Schreibens im Französischen Geschlechterunterschiede und -gemein‐ samkeiten bei Schülerinnen und Schülern der 9. Jahrgangsstufe auftreten. Dabei werden beim Hörverstehenstest (vgl. Kapitel 11.4.1.1) keine signifikanten Geschlechterunterschiede festgestellt, wobei die Mädchen tendenziell höhere durchschnittliche Punktzahlen erzielen als die Jungen. Lediglich bei den Ergeb‐ nissen der vierten Teilaufgabe (Handy, HV-17; p = .209, d = .280), die das De‐ tailverstehen einfacher technischer Erklärungen eines Mobiltelefons abprüfte, und der fünften Teilaufgabe (Werbung, HV-27; p = .306, d = .228; vgl. Tabelle 27), die das selektive und detaillierte Verstehen von kurzen Radio-Werbespots überprüfte, liegen schwache, nicht signifikante Effekte zugunsten der Mädchen vor. Bei allen anderen Aufgaben und im gesamten Hörverstehensergebnis sind keine relevanten Effekte messbar. Die Mädchen erreichen durchschnittlich 23.69 von 40 Punkten im Gesamtergebnis des Hörverstehenstest in Französisch und somit nach Lenz und Studer (2008d) ein Niveau unter A2.1; die Jungen erzielen im gesamten Hörverstehenstest im Durchschnitt 22.88 von 40 Punkten und liegen daher ebenfalls unter Niveau A2.1. Im Leseverstehenstest wird bei der ersten Teilaufgabe (Umfrage, LV-32), die das sorgfältig-genaue Lesen eines diskontinuierlichen und eines deskrip‐ tiven Textes abprüfte, ein vergleichbares Ergebnis von Jungen und Mädchen gemessen (p = .700, d = .080). Bei der zweiten Teilaufgabe (Kurze Geschichte, LV-33), die das sorgfältig-genaue Lesen einer Kurzgeschichte erforderte, errei‐ chen die Mädchen jedoch ein signifikant höheres Ergebnis als die Jungen (p = .000, d = .765). Schließlich schneiden die Mädchen in der dritten Teilaufgabe (Dafür oder dagegen? , LV-30), die das erkundende Lesen sechs kurzer argumen‐ tativer Texte verlangte, ebenfalls mit einem schwachen, nicht signifikanten Effekt (p = .279, d = .209) besser ab als die Jungen. Daraus ergibt sich für die Ge‐ samtleistung im Leseverstehenstest ein knapp nicht signifikanter Unterschied mit schwachem Effekt zugunsten der Mädchen (p = .051, d = .427, vgl. Tabelle 11.5 Gesamtleistungen in den Sprachtests in Französisch und Spanisch 403 214 Im Teilbereich Textkompetenz, der einer von vier Teilbereichen von Kohärenz und Kohäsion darstellt, wurde jedoch ebenfalls ein signifikanter Unterschied (p = .034, d = .441) zugunsten der Mädchen gemessen. 31). Insgesamt liegen beide Geschlechtergruppen (M (w) = 16.59, M (m) = 15.54) im Leseverstehen jedoch jeweils durchschnittlich auf Niveau B1.1, das ab einer Gesamtpunktzahl von 15 Punkten (vgl. Lenz/ Studer 2008d) erreicht wird. Auch im Schreibtest treten immer wieder leicht höhere Leistungen der Mädchen zutage: Im ersten Rating, in dem die Feinniveaustufen der Sprachhand‐ lungskompetenz bestimmt wurden, erzielen die Mädchen ein signifikant höheres Ergebnis (p = .031, d = .452, vgl. Tabelle 50), wobei der Unterschied zwischen den beiden Geschlechtergruppen etwas weniger als eine halbe Feinniveaustufe des GeR beträgt (M-(w) = 3.817, M-(m) = 3.405), in dem Sinne, dass die Mädchen nahe bei Niveau A2.2 und die Jungen etwas näher bei Niveau A2.1 liegen. Im zweiten Rating wurde festgestellt, dass signifikante Unterschiede zugunsten der Mädchen bei Wortanzahl (p = .017, d = .525), Inhalt 1 (p = .038, d = .426), Inhalt 2 (p = .046, d = .435), Morphosyntax und grammatischer Orthographie (p = .011, d = .562) und im Gesamtdurchschnitt (p = .046, d = .435) vorliegen (vgl. Tabellen 51 bis 53). Nicht signifikante, schwache Effekte zugunsten der Mädchen wurden außerdem in den Kategorien Kohärenz und Kohäsion  214 (p = .272, d = .237), Wortschatzspektrum (p-=-.093, d-=-.365), Verwendung des Wortschatzes (p-=-.093, d = .365), Syntax (p = .135, d = .314) sowie Verwendung der Tempi und Modi (p = .132, d = .310) festgestellt (vgl. Tabellen 51 bis 53). Einzig in lexikalischer Orthographie und Interpunktion (p = .760, d = -.066) treten keine Unterschiede zwischen Jungen und Mädchen auf. Das dritte Rating fasst ausschließlich die sprachlichen Leistungen zusammen und offenbart, dass insbesondere bei der Indexbildung einer Oberkategorie Grammatik aus den Subkategorien Syntax, Verwendung der Tempi und Modi und Morphosyntax und grammatische Ortho‐ graphie ein signifikanter Unterschied zugunsten der Mädchen auftritt (p = .037, d-=-.456). Sowohl die Mädchen (M = 3.85) als auch die Jungen (M = 3.52) erreichen im Schreibtest in Französisch ein Niveau zwischen A2.1 und A2.2, wobei sich die Mädchen stärker an Niveau A2.2 annähern als die Jungen. Schließlich wurde aus den Ergebnissen des Hörverstehenstests, des Leseverstehenstests und des zweiten Ratings des Schreibtests das fremdsprachliche Gesamtergebnis in Französisch berechnet, bei dem ebenfalls signifikante Unterschiede zugunsten der Mädchen auftreten (p-=-.033, d-=-.456; vgl. Tabelle 67). 404 11 Auswertung der Ergebnisse 11.5.2 Zwischenfazit: Antwort auf Forschungsfrage 1 für Spanisch Vor dem Hintergrund von Forschungsfrage 1 wurde ermittelt, in welchen fremdsprachlichen Teilkompetenzen bezüglich des Leseverstehens, des Hör‐ verstehens und des Schreibens im Spanischen Geschlechterunterschiede und -gemeinsamkeiten bei Schülerinnen und Schülern der 9. Jahrgangsstufe auf‐ treten: Beim Hörverstehen wird ein schwacher, nicht signifikanter Effekt zugunsten der Jungen ermittelt (p = .154, d = .298; vgl. Tabelle 29; Kapitel 11.4.1.2). Während die Effekte bei der zweiten Teilaufgabe (Nachrichten, HV-29; p = .544, d = .124), der dritten (Liebesgeschichten, HV-39; p = .328, d = .188) und der vierten Teilaufgabe (Handy, HV-17, p = .466, d = -.182) vernachlässigbar sind, liegen bei der ersten (Autorennsport, HV-38, p = .285, d = .204) und der fünften Teilaufgabe (Werbung, HV-27, p = .101, d = .410) schwache, nicht signifikante Effekte zugunsten der Jungen vor (vgl. Tabelle 29; Kapitel 11.4.1.2). Die Mädchen erreichen durchschnittlich 25.28 von 40 Punkten im Hörverstehenstest in Spanisch und somit nach Lenz und Studer (2008d) ein Niveau unter A2.1; die Jungen erzielen im gesamten Hörverstehenstest im Durchschnitt 27.10 von 40 Punkten und liegen daher nach der Klassifikation von Lenz und Studer (2008d) auf dem Niveau A2.1. Im Leseverstehenstest werden bei den einzelnen Teilaufgaben und auch im Gesamtergebnis (p = .428, d = .165) keine statistisch relevanten Unter‐ schiede zwischen weiblichen und männlichen Spanischlernenden gemessen (vgl. Tabelle 33; Kapitel 11.4.2.2). Insgesamt liegen beide Geschlechtergruppen (M (w) = 16.09, M (m) = 16.38) im Leseverstehen durchschnittlich auf Niveau B1.1 (vgl. Lenz/ Studer 2008d). Beim Schreibtest sind die Ergebnisse ebenfalls sehr ausgeglichen: Bei der Sprachhandlungskompetenz (p = .438, d = -.151; vgl. Tabelle 59), die im Laufe des ersten Ratings ausgewertet wurde, liegen keinerlei statistisch relevante Geschlechterunterschiede vor. Im zweiten Rating werden bei Befolgung des Arbeitsauftrags (p = .047, d = .266) und Inhalt 1 (p = .028, d = .453; vgl. Tabelle 60) signifikante Unterschiede zugunsten der Mädchen gemessen. In Syntax (p = .161, d = .288; vgl. Tabelle 62) liegt hingegen ein schwacher, nicht signifikanter Effekt zugunsten der Jungen vor. Ansonsten finden sich bei Wortanzahl (p = .691, d = .099), Inhalt 2 (p = .217, d = -.310; vgl. Tabelle 60), Kohärenz und Kohäsion (p = .635, d = -.119), Wortschatzspektrum (p = .557, d = .147), Verwendung des Wortschatzes (p = .537, d = .155), lexikalischer Orthographie und Interpunktion (p = .896, d = .032; vgl. Tabelle 61), Verwendung der Tempi, Modi und ser/ estar/ hay (p = .905, d = .030), Morphosyntax und grammatischer Orthographie (p = .576, d = .140) sowie beim Gesamtergebnis des zweiten Ratings (p = .686, d = .101; vgl. Tabelle 62) vernachlässigbare Effekte. Auch bei allen sprachlichen Kategorien 11.5 Gesamtleistungen in den Sprachtests in Französisch und Spanisch 405 215 Vor den zweifaktoriellen Varianzanalysen wird immer mittels eines Levene-Tests die Varianzhomogenität überprüft: Ist der Levene-Test nicht signifikant, kann von homogenen Varianzen ausgegangen werden, was eine Voraussetzung für die zweifak‐ torielle Varianzanalyse darstellt. Diese Voraussetzung wurde für alle berechneten Varianzanalysen erfüllt. Weitere Voraussetzungen liegen darin, dass die abhängige Variable mindestens intervallskaliert oder aber metrisch ist, die unabhängigen Varia‐ blen (Faktoren) kategorial sind, d. h. nominal- oder ordinalskaliert und die durch die Faktoren gebildeten Gruppen unabhängig sind, was hier ebenfalls gegeben ist (vgl. Bühner/ Ziegler 2009: 391 ff.). 216 Wenn mehr als zwei Gruppen vorhanden sind (z. B. bei der Einteilung des HISEI in drei Gruppen), müssen bei signifikanten Ergebnissen im F-Test zusätzliche Post-Hoc-Tests vorgenommen werden, um zu überprüfen, ob sich alle drei Gruppen oder nur zwei bestimmte signifikant voneinander unterscheiden. Hier wird der Tukey-Test gewählt (vgl. Bühner/ Ziegler 2009: 391 ff.). des dritten Ratings, sprich bei Wortschatz (p = .529, d = .157), Grammatik (p = .844, d = -.049), Orthographie (p = .898, d = .032), Text (p = .672, d = -.106) und bei der sprachlichen Gesamtleistung (p = .958, d = .013; vgl. Tabelle 64) treten im Schreibtest im Spanischen vernachlässigbare Effekte und somit keinerlei Geschlechterunterschiede auf. Sowohl die Mädchen (M = 4.14) als auch die Jungen (M = 4.13) erreichen im Schreibtest in Spanisch Niveau A2.2. Beim fremdsprachlichen Gesamtergebnis in Spanisch wird schließlich ein schwacher, nicht signifikanter Effekt zugunsten der Jungen festgestellt (p = .336, d = -.240; vgl. Tabelle 67). 11.6 Analyse möglicher Interaktionseffekte des Geschlechts mit den Intersektionalitätsaxiomen sozioökonomischer Status und sprachlicher Hintergrund Nachdem die Untersuchung der Geschlechterunterschiede bezüglich der fremd‐ sprachlichen Leistungen abgeschlossen ist, wird im Rahmen von Forschungs‐ frage 2 untersucht, ob bei den sprachlichen Leistungen Interaktionseffekte des Geschlechts mit dem sozioökonomischen Status (HISEI) und dem sprachlichen Hintergrund auftreten, wobei letztere über den Schülerfragebogen erhoben wurden (vgl. Kapitel 9.3.2). Um diese Frage zu beantworten, werden zweifakto‐ rielle Varianzanalysen zunächst für die Ergebnisse in Französisch und anschlie‐ ßend für die Ergebnisse in Spanisch durchgeführt (vgl. Bühner/ Ziegler 2009: 391 ff.; Steinlen 2018). 215 Während für den sprachlichen Hintergrund die Kodie‐ rung 0 für einsprachig und 1 für mehrsprachig verwendet wird und somit zwei Gruppen vorliegen, wird der HISEI in drei Gruppen eingeteilt: 216 Ein niedriger sozioökonomischer Status wird dann zugewiesen, wenn der HISEI unter 33 liegt, 406 11 Auswertung der Ergebnisse 217 Nach Cohen (1988) ist der Effekt bei η p2 > .01 klein, bei η p2 > .06 mittel und bei η p2 > .13 groß. Das partielle Eta-Quadrat gibt an, welchen Anteil der Gesamtvarianz ein einzelner Faktor erklärt. Das Eta-Quadrat von .058, das hier beim sozioökonomischen Status hinsichtlich des Hörverstehens vorliegt, erklärt daher 5.8% der Gesamtvarianz. ein mittlerer sozioökonomischer Status wird zwischen den HISEI-Werten 34 und 51 zugeteilt und ein hoher sozioökonomischer Status liegt bei einem HISEI-Wert von 52 und höher vor (vgl. Ditton 2007: 133). Bei dieser Einteilung sind die verschiedenen Merkmalsgruppen teilweise unterschiedlich groß, weshalb die Ergebnisse der zweifaktoriellen Varianzanalysen mit Vorsicht zu interpretieren sind. Bezüglich der Sprachtests werden schließlich die standardisierten Ergeb‐ nisse verwendet, sodass jeweils die höchstmögliche Maximalpunktzahl bei 66 liegt, wodurch die Leistungen in den verschiedenen Tests untereinander besser vergleichbar sind (vgl. Kapitel 11.5). 11.6.1 Analyse möglicher Interaktionen zwischen Geschlecht, sprachlichem Hintergrund und sozioökonomischem Status bezüglich der Französischleistungen Zunächst werden also die Interaktionen zwischen sozioökonomischem Status und Geschlecht hinsichtlich der Teilfertigkeiten Hörverstehen, Leseverstehen und Schreiben sowie hinsichtlich des Gesamtergebnisses in allen Französisch‐ tests analysiert. Die Analysen werden stets mit graphischen Interaktionspro‐ filen illustriert, die die genauen Kurvenverläufe aufzeigen. Misst man den Einfluss des Geschlechts in Abhängigkeit vom sozioökonomi‐ schen Status auf die Hörverstehensleistung, so wird zum einen kein statistisch relevanter Effekt des Geschlechts (p = .871, η p ² = .000) und zum anderen ein schwacher, nicht signifikanter Effekt 217 des sozioökonomischen Status (p = .114, η p ²-=-.058) festgestellt. Allerdings gibt es einen signifikanten Interaktionseffekt zwischen sozioökonomischem Status und Geschlecht (p = .026, η p ² = .096) bezüglich des Hörverstehens (vgl. Tabelle 68). Bei der Betrachtung des graphi‐ schen Interaktionsprofils (vgl. Abbildung 16) wird deutlich, dass die Jungen mit niedrigem sozioökonomischen Status (M (m niedr. SöS ) = 45.58) tendenziell bessere Leistungen im Hörverstehen erzielen als die Mädchen mit niedrigem sozioökonomischen Status (M (w niedr. SöS ) = 37.02). Die Jungen mit niedrigem sozioökonomischen Status (M (m niedr. SöS ) = 45.58) erzielen aber auch bessere Leistungen als die Jungen und Mädchen mit mittlerem und mit hohem sozioöko‐ nomischen Status (M (m mittl. SöS ) = 31.76, M (m hoh. SöS ) = 37.30, M (w mittl. SöS ) = 38.09, M (w hoh. SöS ) = 40.58; vgl. Abbildung 16). Dieser ungewöhnlich hohe Wert der Jungen mit niedrigem sozioökonomischem Status könnte darauf hindeuten, dass 11.6 Analyse möglicher Interaktionseffekte 407 es sich eventuell um Ausreißer handeln könnte, auch weil dieses Phänomen in den anderen gemessenen fremdsprachlichen Leistungen im Französischen nicht beobachtbar ist. Bezüglich des Leseverstehens werden keine signifikanten Ergebnisse ge‐ messen. Es ist aber zu beobachten, dass der Effekt des sozioökonomischen Status (p = .116, η p ² = .057) ungefähr doppelt so groß ist wie derjenige des Geschlechts (p-= .165, η p ² = .026) und dass kein statistisch relevanter Interakti‐ onseffekt vorliegt (p = .880, η p ² = .003). In beiden Geschlechtergruppen nimmt die Leseleistung mit steigendem HISEI stetig zu, wobei die Mädchen stets tendenziell höhere Ergebnisse erzielen als die Jungen (M (m niedr. SöS ) = 46.20, M (m mittl. SöS ) = 50.60, M (m hoh. SöS ) = 52.39, M (w niedr. SöS ) = 51.15, M (w mittl. SöS ) = 52.25, M (w hoh. SöS ) = 56.31; vgl. Abbildung 17). Beim Schreiben werden ebenfalls keinerlei signifikante Ergebnisse gemessen. Der Effekt des sozioökonomischen Status (p = .084, η p ² = .066) ist hier aber rund dreimal so groß wie derjenige des Geschlechts (p = .213, η p ² = .021) und auch bei dieser Teilfertigkeit liegt kein signifikanter Interaktionseffekt zwischen Geschlecht und sozioökonomi‐ schem Status vor (p = .676, η p ² = .011; vgl. Tabelle 68). Die Jungen mit nied‐ rigem sozioökonomischem Status (M (m niedr. SöS ) = 43.33) und die Mädchen dieser Kategorie (M (w niedr. SöS ) = 42.88) erzielen vergleichbare Ergebnisse, während die Mädchen mit mittlerem und hohem sozioökonomischen Status (M (w mittl. SöS ) = 41.83, M (w hoh. SöS ) = 48.00) jeweils tendenziell höhere Ergeb‐ nisse erlangen als die Jungen mit mittlerem und hohem sozioökonomischen Status (M (m mittl. SöS ) = 34.60, M (m hoh. SöS ) = 43.04; vgl. Abbildung 18). Auch bezüglich des Gesamtergebnisses in Französisch ergeben die zweifaktoriellen Varianzanalysen keinerlei signifikante Ergebnisse. Schwache Effekte werden sowohl beim Geschlecht (p-= .290, η p ² = .015), beim sozioökonomischen Status (p-=-.293, η p ² = .032) als auch bei der Interaktion aus beiden Faktoren (p-=-.604, η p ² = .013) gemessen (vgl. Tabelle 68). Die deskriptiven Statistiken zeigen, dass die weiblichen Französischlernerinnen mit niedrigem sozioökonomischen Status (M (w niedr. SöS ) = 43.63) und die männlichen Französischlerner mit nied‐ rigem sozioökonomischen Status (M-(m niedr.-SöS )-=-44.04; vgl. Abbildung 19) ver‐ gleichbare Gesamtleistungen im Französischen erreichen. Außerdem zeigen die deskriptiven Statistiken, dass die Mädchen mit mittlerem und hohem sozioöko‐ nomischen Status (M-(w mittl.-SöS ) = 44.06, M-(w hoh.-SöS ) = 48.01) jeweils tendenziell höhere Gesamtleistungen im Französischen als die Jungen mit mittlerem und hohem sozioökonomischen Status (M (m mittl. SöS ) = 41.40, M (m hoh. SöS ) = 43.79) erzielen. Folglich kann als allgemeine Tendenz im Gesamtergebnis beobachtet werden, dass die Jungen und Mädchen mit niedrigem sozioökonomischen Status 408 11 Auswertung der Ergebnisse vergleichbare Leistungen erzielen, während die Schere zwischen Jungen und Mädchen bei steigendem HISEI tendenziell immer weiter auseinandergeht. Test Geschlecht Sozioökono‐ mischer Status Interaktion Ge‐ schlecht * sozioökonomischer Status R² (korri‐ giertes R²) Hörverste‐ henstest Französisch F-(1, 73) = .027 p = .871 η p ² = .000 F (2, 73) = 2.238 p = .114 η p ² = .058 F (2, 73) = 3.857 p = .026 η p ² = .096 .141 (.083) Leseverste‐ henstest Französisch F (1, 73) = 1.965 p = .165 η p ² = .026 F (2, 73) = 2.215 p = .116 η p ² = .057 F (2, 73) = .128 p = .880 η p ² = .003 .103 (.041) Schreibtest Französisch F (1, 73) = 1.581 p = .213 η p ² =.021 F (2, 73) = 2.565 p = .084 η p ² = .066 F (2, 73) = .394 p = .676, η p ² = .011 .125 (.065) Gesamter‐ gebnis Fran‐ zösischtests F (1, 76) = 1.133 p = .290 η p ² = .015 F (2, 76) = 1.248 p = .293 η p ² = .032 F (2, 76) = .508 p = .604 η p ² = .013 .105 (.046) Anmerkungen. n (w niedriger SöS ) = 8, n (w mittlerer SöS ) = 6, n (w hoher SöS ) = 32-33, n (m niedriger SöS ) = 3-4, n (m mittlerer SöS ) =-6, n-(m hoher SöS ) = 24-25. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 68: Zweifaktorielle Varianzanalysen bezüglich der Interaktion von Geschlecht und sozioökonomischem Status (HISEI) in den einzelnen Französischtests und im Gesamtergebnis in Französisch 11.6 Analyse möglicher Interaktionseffekte 409 Abb. 16: Geschätzte Randmittel der Ergebnisse des Hörverstehenstests in Französisch (SöS, Geschlecht) Abb. 17: Geschätzte Randmittel der Ergebnisse des Leseverstehenstests in Französisch (SöS, Geschlecht) 410 11 Auswertung der Ergebnisse Abb. 18: Geschätzte Randmittel der Ergebnisse des Schreibtests in Französisch (SöS, Geschlecht) Abb. 19: Geschätzte Randmittel der Gesamtergebnisse in den Französischtests (SöS, Geschlecht) 11.6 Analyse möglicher Interaktionseffekte 411 Geht man nun mittels zweifaktorieller Varianzanalysen der Frage nach, ob es signifikante Interaktionseffekte zwischen dem sprachlichem Hintergrund und dem Geschlecht hinsichtlich der Leistungen in den einzelnen Teilfertigkeiten des Französischen gibt, dann offenbaren sich folgende Ergebnisse (vgl. Tabelle 69): Bei einer vertieften Untersuchung der Hörverstehensleistungen wird ein schwacher, nicht signifikanter Effekt des Geschlechts gemessen (p = .325, η p ² = .012), allerdings kein statistisch relevanter Effekt des sprachlichen Hin‐ tergrunds (p = .456, η p ² = .007) oder der Interaktion zwischen den beiden Faktoren (p = .744, η p ² = .001). Insgesamt liegen die Ergebnisse der vier Merk‐ malsgruppen der einsprachigen und mehrsprachigen Jungen und Mädchen sehr eng beieinander, wobei tendenziell die mehrsprachigen Schülerinnen im Hör‐ verstehen in Französisch die höchsten durchschnittlichen Punktzahlen erzielen (M-(w ml ) - = 38.61, M-(w pl ) - = 40.48, M-(m ml ) - = 37.46, M-(m pl ) = 38.19; vgl. Abbildung 20). Demgegenüber stehen die Ergebnisse der zweifaktoriellen Varianzanalysen bezüglich des Leseverstehenstests in Französisch, bei denen ein schwacher, nicht signifikanter Effekt des Geschlechts (p = .080, η p ² = .038), kein Effekt des sprach‐ lichen Hintergrunds (p-= .414, η p ² = .008) und ein schwacher, nicht signifikanter Interaktionseffekt zwischen Geschlecht und sprachlichem Hintergrund deutlich wird (p-= .243, η p ² = .017; vgl. Tabelle 69). Das Profildiagramm (vgl. Abbildung 21) illustriert, dass die Mittelwerte der einsprachigen Jungen (M-(m ml ) - =-53.27) und der einsprachigen Mädchen (M-(w ml ) - =-54.40) sehr nahe beieinanderliegen, während der Abstand zwischen den Mittelwerten der mehrsprachigen Mädchen (M-(w pl ) - = 55.07) und der mehrsprachigen Jungen (M (m pl ) = 49.50) etwas größer ausfällt, wobei innerhalb der vier Merkmalsgruppen erneut die mehrsprachigen Mädchen tendenziell am meisten Punkte im Leseverstehenstest in Französisch erzielen und hingegen die mehrsprachigen Jungen tendenziell am schwächsten abschneiden. Die beim Leseverstehen beobachtete Schere erweist sich bei der Schreib‐ leistung als noch größer: Hier werden ein signifikanter Haupteffekt des Ge‐ schlechts (p = .036, η p ² = .054), ein vernachlässigbarer Effekt des sprachlichen Hintergrunds (p = .651, η p ² = .003) sowie ein nicht signifikanter schwacher Interaktionseffekt des Geschlechts mit dem sprachlichen Hintergrund gemessen (p = .278, η p ² = .015; vgl. Tabelle 69). Das Profildiagramm für den Schreibtest (vgl. Abbildung 22) veranschaulicht eindrücklich, dass der Leistungsunterschied zwischen den einsprachigen Jungen (M (m ml ) = 43.25) und den einsprachigen Mädchen (M (w ml ) = 45.76), ähnlich wie beim Leseverstehen, vernachlässigbar ist, während bei den mehrsprachigen Jungen (M (m pl ) = 39.50) und mehrspra‐ chigen Mädchen (M (w pl ) = 47.31) die Schere relativ stark auseinanderklafft, 412 11 Auswertung der Ergebnisse wobei erneut die mehrsprachigen Mädchen tendenziell höhere Ergebnisse erzielen als alle drei anderen Merkmalsgruppen. Auch für das Gesamtergebnis in Französisch werden ein statistisch signifi‐ kanter Effekt des Geschlechts (p-= .028, η p ² = .057), kein Effekt des sprachlichen Hintergrunds (p = .801, η p ² = .001) und ein schwacher, nicht signifikanter Interaktionseffekt zwischen Geschlecht und sprachlichem Hintergrund festge‐ stellt (p = .227, η p ² = .018; vgl. Tabelle 69). Insgesamt wird im Gesamtergebnis in Französisch erneut sichtbar, dass die Ergebnisse in den Sprachtests bei den einsprachigen Jungen (M (m ml ) = 44.30) und den einsprachigen Mädchen (M (w ml ) = 46.00) sehr eng beisammen liegen, während die mehrsprachigen Mädchen (M-(w pl ) - = 47.52) tendenziell die höchsten Ergebnisse erzielen und die mehrsprachigen Jungen (M-(m pl ) - =-41.84) die niedrigsten (vgl. Abbildung 23). Test Geschlecht Sprachli‐ cher Hinter‐ grund Interaktion Geschlecht * sprachlicher Hintergrund R² (korri‐ giertes R²) Hörverste‐ henstest Französisch F-(1, 80) = .980 p = .325 η p ² = .012 F (1, 80) = .560 p = .456 η p ² = .007 F-(1, 80) = .108 p = .744 η p ² = .001 .018 (-.018) Leseverste‐ henstest Französisch F-(1, 79) = 3.144 p = .080 η p ² = .038 F (1, 79) = .675 p = .414 η p ² = .008 F (1, 79) = 1.382 p = .243 η p ² = .017 .050 (.014) Schreibtest Französisch F-(1, 80) = 4.533 p = .036 η p ² = .054 F (1, 80) = .206 p = .651 η p ² = .003 F (1, 80) = 1.193 p = .278 η p ² = .015 .060 (.025) Gesamter‐ gebnis Fran‐ zösischtests F (1, 83) = 4.975 p = .028 η p ² = .057 F (1, 83) = .064 p = .801 η p ² = .001 F (1, 83) = 1.482 p = .227 η p ² = .018 .062 (.028) Anmerkungen. n (w ml ) = 33-34, n (w pl ) = 16, n (m ml ) = 20-22, n (m pl ) =-13-15. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 69: Zweifaktorielle Varianzanalysen bezüglich der Interaktion von Geschlecht und sprachlichem Hintergrund in den einzelnen Französischtests und im Gesamtergebnis in Französisch 11.6 Analyse möglicher Interaktionseffekte 413 Abb. 20: Geschätzte Randmittel der Ergebnisse des Hörverstehenstests in Französisch (sprachlicher Hintergrund, Geschlecht) Abb. 21: Geschätzte Randmittel der Ergebnisse des Leseverstehenstests in Französisch (sprachlicher Hintergrund, Geschlecht) 414 11 Auswertung der Ergebnisse Abb. 22: Geschätzte Randmittel der Ergebnisse des Schreibtests in Französisch (sprach‐ licher Hintergrund, Geschlecht) Abb. 23: Geschätzte Randmittel der Gesamtergebnisse in den Französischtests (sprachli‐ cher Hintergrund, Geschlecht) 11.6 Analyse möglicher Interaktionseffekte 415 11.6.2 Zwischenfazit: Antwort auf Forschungsfrage 2 für Französisch Forschungsfrage 2 fragt danach, ob bei den unterschiedlichen sprachlichen Leistungen Interaktionseffekte des Geschlechts mit dem sozioökonomischen Status oder mit dem sprachlichen Hintergrund auftreten. Als Antwort darauf kann festgehalten werden, dass für Französisch lediglich ein signifikanter Interaktionseffekt zwischen Geschlecht und sozioökonomischem Status (p = .026, η p ² = .096; vgl. Tabelle 68), und zwar beim Hörverstehen gemessen werden kann. Allerdings ist dieser Interaktionseffekt mit Vorsicht zu interpretieren, da die Größen der einzelnen Merkmalsgruppen stark unterschiedlich sind und ein solcher Interaktionseffekt in keiner anderen sprachlichen Fertigkeit und auch nicht im Gesamtergebnis der Französischtests messbar ist. Jedoch kann bezüglich des Gesamtergebnisses in den Französischtests die Tendenz festgehalten werden, dass keine Geschlechterunterschiede bei niedrigem sozio‐ ökonomischen Status vorhanden sind und die Unterschiede zugunsten der Mädchen mit steigendem HISEI tendenziell größer werden (vgl. Abbildung 23). Außerdem kristallisieren sich die Effekte des sozioökonomischen Status bei allen drei Sprachtestergebnissen als höher heraus als diejenigen des Geschlechts (vgl. Tabelle 68). Untersucht man mögliche Interaktionen zwischen Geschlecht und sprachli‐ chem Hintergrund, so ist eine solche bei der Hörverstehensleistung im Fran‐ zösischen nicht vorhanden (p = .744, η p ² = .001). Ein sehr schwacher, nicht signifikanter Haupteffekt liegt beim Geschlecht (p = .325, η p ² = .012); der sprach‐ liche Hintergrund (p = .456, η p ² = .007) spielt für die Hörverstehensleistung keine Rolle. Im Falle des Leseverstehens (p = .243, η p ² = .017), des Schreibens (p = .278, η p ² = .015) und des Gesamtergebnisses (p = .227, η p ² = .018) treten indes jeweils schwache, nicht signifikante Interaktionseffekte zwischen Geschlecht und sprachlichem Hintergrund auf. Allerdings zeigen die zweifaktoriellen Varianzanalysen sowohl beim Leseverstehen (p-= .080, η p ² = .038) als auch beim Schreiben (p = .036, η p ² = .054) und beim fremdsprachlichen Gesamtergebnis (p = .028, η p ² = .057) in Französisch jeweils viel stärkere Haupteffekt des Geschlechts zugunsten der Mädchen (vgl. Tabelle 69). Dies bedeutet, dass das Geschlecht separat betrachtet deutlich mehr Einfluss auf die Leistung im Leseverstehen, Schreiben und auf die Gesamtleistung hat als die Interaktion zwischen Geschlecht und sprachlichem Hintergrund. Darüber hinaus kann beobachtet werden, dass die Ergebnisse in den Sprachtests bei den einsprachigen Mädchen und Jungen eng beieinanderliegen, während die mehrsprachigen Mädchen tendenziell die höchsten Mittelwerte erzielen und die mehrsprachigen 416 11 Auswertung der Ergebnisse Jungen, mit Ausnahme des Hörverstehenstests, die niedrigsten. Mögliche Gründe hierfür werden in den Kapiteln 11.10 und 12.1 präziser analysiert und diskutiert. 11.6.3 Analyse einer möglichen Interaktion zwischen Geschlecht, sprachlichem Hintergrund und sozioökonomischem Status bezüglich der Spanischleistungen Bezüglich des sozioökonomischen Status sind die Merkmalsgruppen in der Spanischstichprobe relativ klein und teilweise ungleich verteilt, sodass die Ergebnisse nur mit Vorsicht interpretiert werden können: Betrachtet man den Einfluss des sozioökonomischen Hintergrunds und des Geschlechts auf die Spanischleistung, so scheint sich beim Hörverstehen ein schwacher, nicht signifikanter Effekt des Geschlechts (p = .141, η p ² = .025) zugunsten der Jungen zu zeigen und kein statistisch relevanter Einfluss des sozioökonomischen Status (p = .695, η p ² = .008). Auch ein Interaktionseffekt zwischen beiden Variablen bleibt aus (p = .890, η p ² = .003; vgl. Tabelle 70). Sowohl bei niedrigem als auch bei mittlerem und hohem sozioökonomischem Status erreichen die Jungen tendenziell etwas höhere Mittelwerte als die Mädchen (M (w niedr. SöS ) =39.83, M (m niedr. SöS ) = 44.82, M (w mittl. SöS ) = 40.55, M (m mittl. SöS ) = 43.11, M (w hoh. SöS ) = 42.53, M (m hoh. SöS ) = 45.23; vgl. Abbildung 24). Bei den Ergebnissen im Leseverstehen in Spanisch liegen kein Effekt des Ge‐ schlechts (p = .469, η p ² = .006), ein kleiner Effekt des sozioökonomischen Status (p = .607, η p ² = .012) und ein schwacher, nicht signifikanter Interaktionseffekt der beiden Variablen (p-= .460, η p ² = .019) vor (vgl. Tabelle 70). Letzteres liegt daran, dass die Jungen mit niedrigem sozioökonomischem Status (M (m niedr. SöS ) = 57.20) etwas besser abschneiden als die Mädchen mit niedrigem sozioökonomischem Status (M-(w niedr.-SöS ) = 52.29), während Mädchen und Jungen mit mittlerem und hohem sozioökonomischem Status jeweils vergleichbare durchschnittliche Leis‐ tungen erzielen (M-(w mittl.-SöS )-=-51.98, M-(m mittl.-SöS )-=-51.97, M-(w hoh.-SöS )-=-53.57, M-(m hoh.-SöS )-=-53.10; vgl. Abbildung 25). Bei den Ergebnissen des Schreibtests in Spanisch zeigt sich kein Effekt des Ge‐ schlechts (p = .744, η p = .001), kein Effekt des sozioökonomischen Status (p = .987, η p ² = .000) und ein nicht signifikanter mittlerer Interaktionseffekt zwischen den beiden Variablen (p-= .080, η p ² = .059; vgl. Tabelle 70). Dieser Interaktions‐ effekt kommt zustande, weil Jungen mit niedrigem sozioökonomischem Status (M (m niedr. SöS ) = 50.08) tendenziell höhere Punktzahlen erzielen als Mädchen dieser Kategorie (M-(w niedr.-SöS ) = 43.17), wohingegen bei mittlerem und hohem 11.6 Analyse möglicher Interaktionseffekte 417 sozioökonomischem Status die Mädchen tendenziell höhere durchschnittliche Punktzahlen im Schreibtest erzielen (M-(w mittl.-SöS )-=-50.21, M-(m mittl.-SöS )-=-42.56, M-(w hoh.-SöS )-=-47.02, M-(m hoh.-SöS )-=-45.41; vgl. Abbildung 26). Beim Gesamtergebnis in Spanisch werden schließlich ein kleiner, nicht signifikanter Effekt des Geschlechts (p = .292, η p ² = .013), kein Effekt des sozioökonomischen Status (p = .837, η p ² = .004) und ein nicht signifikanter schwacher Interaktionseffekt zwischen beiden Variablen gemessen (p = .335, η p ² = .025; vgl. Tabelle 70). Im Profildiagramm wird ersichtlich, dass Mädchen und Jungen mit mittlerem sozioökonomischem Status (M (w mittl. SöS ) = 46.49, M (m mittl. SöS ) = 45.88) sowie Mädchen und Jungen mit hohem sozioökonomischen Status M (w hoh. SöS ) = 47.12, M (m hoh. SöS ) = 47.91) vergleichbare Ergebnisse erzielen, während bei niedrigem sozioökonomischem Status tendenziell Ge‐ schlechterunterschiede zugunsten der Jungen auftreten (M (w niedr. SöS ) = 44.69, M-(m niedr.-SöS )-=-50.70; vgl. Abbildung 27). Test Geschlecht Sozioökono‐ mischer Status Interaktion Geschlecht * sozioökono‐ mischer Status R² (korrigiertes R²) Hörverste‐ henstest Spanisch F (1, 87) = 2.212 p = .141 η p ² = .025 F (2, 87) = .365 p = .695 η p ² = .008 F-(2, 87) = .117, p = .890 η p ² = .003 .014 (-.014) Leseverste‐ henstest Spanisch F (1, 83) = .530 p = .469 η p ² = .006 F (2, 83) = .503 p = .607 η p ² = .012 F (2, 83) = .785 p = .460 η p ² = .019 .030 (-.029) Schreibtest Spanisch F (1, 83) = .107 p = .744 η p ² = .001 F (2, 83) = .013 p = .987 η p ² = .000 F (2, 83) = 2.610 p = .080 η p ² = .059 .070 (.014) Gesamter‐ gebnis Spa‐ nischtests F (1, 76) = 1.122 p = .292 η p ² = .013 F (2, 76) = .179 p = .837 η p ² = .004 F (2, 76) = 1.107 p = .335 η p ² = .025 .040 (-.015) Anmerkungen. n (w niedriger SöS ) = 13-14, n (w mittlerer SöS ) = 12-13, n (w hoher SöS ) = 43-45, n (m niedriger SöS ) = 6, n (m mittlerer SöS ) =-4, n-(m hoher SöS ) = 11 Tabelle 70: Zweifaktorielle Varianzanalysen bezüglich der Interaktion von Geschlecht und sozioökonomischem Status (HISEI) in den einzelnen Spanischtests und im Gesamt‐ ergebnis in Spanisch 418 11 Auswertung der Ergebnisse Abb. 24: Geschätzte Randmittel des Hörverstehenstests in Spanisch (SöS, Geschlecht) Abb. 25: Geschätzte Randmittel des Leseverstehenstests in Spanisch (SöS, Geschlecht) 11.6 Analyse möglicher Interaktionseffekte 419 Abb. 26: Geschätzte Randmittel des Schreibtests in Spanisch (SöS, Geschlecht) Abb. 27: Geschätzte Randmittel der Gesamtergebnisse der Spanischtests (SöS, Ge‐ schlecht) 420 11 Auswertung der Ergebnisse Im Laufe der Analyse der Wirkung des sprachlichen Hintergrunds in Abhän‐ gigkeit vom Geschlecht auf die Spanischleistungen ergeben sich folgende Ergebnisse: Beim Hörverstehen tritt ein schwacher nicht signifikanter Effekt des Geschlechts (p = .149, η p ² = .023) auf. Der sprachliche Hintergrund hat hingegen keinen Effekt auf die Hörverstehensleistung (p = .741, η p ² = .001) und ein Interaktionseffekt zwischen Geschlecht und sprachlichem Hintergrund liegt auch nicht vor (p = .952, η p ² = .000; vgl. Tabelle 71). Im Interaktionsprofil wird ersichtlich, dass sowohl die einsprachigen (M (m ml ) = 44.33) als auch die mehrsprachigen Jungen (M-(m pl ) = 45.13) tendenziell etwas höhere Mittelwerte erzielen als die einsprachigen (M (w ml ) = 41.47) und mehrsprachigen Mädchen (M (w pl ) = 42.02), wobei die mehrsprachigen Schülerinnen und Schüler minimale Vorteile zu haben scheinen (vgl. Abbildung 28). Beim Leseverstehen ergeben sich keine Effekte für das Geschlecht (p-=-.680, η p ² = .002) und den sprachlichen Hintergrund (p-=-.847, η p ² = .000), wohingegen ein schwacher, nicht signifikanter Interaktionseffekt zwischen beiden Variablen (p = .262, η p ² = .015) zu beobachten ist (vgl. Tabelle 71). Dieser wird darin ersichtlich, dass die einsprachigen Jungen (M (m ml ) = 55.20) tendenziell etwas höhere Punktzahlen erzielen als die einsprachigen Mädchen (M (w ml ) = 52.40), während die mehrsprachigen Jungen (M-(m pl ) = 52.80) tendenziell etwas niedri‐ gere Punktzahlen im Leseverstehen erzielen als die mehrsprachigen Mädchen (M-(w pl ) - =-54.10; vgl. Abbildung 29). Beim Schreiben zeigt sich genau dasselbe Phänomen: Es gibt keine Effekte des Geschlechts (p = .563, η p ² = .004) oder des sprachlichen Hintergrunds (p = .746, η p ² = .001), aber einen schwachen, nicht signifikanten Interaktionseffekt zwischen beiden Variablen (p-=-.198, η p ² = .019; vgl. Tabelle 71). Auch in dieser Fertigkeit erreichen die einsprachigen Jungen (M (m ml ) = 47.23) tendenziell etwas höhere Punktzahlen als die einsprachigen Mädchen (M-(w ml ) - =-45.64), während die mehrsprachigen Jungen (M (m pl ) = 45.08) etwas niedrigere Punktzahlen erlangen als die mehrsprachigen Mädchen (M-(w pl ) - =-49.23; vgl. Abbildung 30). Bei der Analyse des Gesamtergebnisses treten jedoch keine statistisch rele‐ vante Effekte des Geschlechts (p = .374, η p ² = .009), des sprachlichen Hinter‐ grunds (p = .957, η p ² = .000) oder der Interaktion der beiden Variablen auf (p = .500, η p ² = .005; vgl. Tabelle 71). Folglich erzielen einsprachige und mehrspra‐ chige Jungen und Mädchen vergleichbare Gesamtleistungen (M (m ml ) = 48.92, M-(w ml ) - =-46.23, M-(m pl )-=-47.67, M-(w pl ) - =-47.30; vgl. Abbildung 31). 11.6 Analyse möglicher Interaktionseffekte 421 Test Geschlecht Sprachli‐ cher Hinter‐ grund Interaktion Geschlecht * sprachlicher Hintergrund R² (korrigiertes R²) Hörverste‐ henstest Spa‐ nisch F (1, 90) = 2.121 p = .149 η p ² = .023 F (1, 90) = .110 p = .741 η p ² = .001 F-(1, 90) = .004 p = .952 η p ² = .000 .025 (-.008) Leseverste‐ henstest Spa‐ nisch F-(1, 86) = .172 p = .680 η p ² = .002 F (1, 86) = .037 p = .847 η p ² = .000 F (1, 86) = 1.273 p = .262 η p ² = .015 .020 (-.014) Schreibtest Spanisch F-(1, 80) = .337 p = .563 η p ² = .004 F-(1, 80) = .106, p = .746 η p ² = .001 F (1, 80) = 1.686 p = .198 η p ² = .019 .036 (.003) Gesamter‐ gebnis Spa‐ nischtests F (1, 90) = .797 p = .374 η p ² = .009 F (1, 90) = .003, p = .957 η p ² = .000 F-(1, 90) = .459 p = .500 η p ² = .005 .017 (-.016) Anmerkungen. n (w ml ) = 41-42, n (w pl ) = 28-31, n (m ml ) = 11, n (m pl ) =-10. Tabelle 71: Zweifaktorielle Varianzanalysen bezüglich der Interaktion von Geschlecht und sprachlichem Hintergrund in den einzelnen Spanischtests und im Gesamtergebnis in Spanisch 422 11 Auswertung der Ergebnisse Abb. 28: Geschätzte Randmittel des Hörverstehenstests in Spanisch (sprachlicher Hin‐ tergrund, Geschlecht) Abb. 29: Geschätzte Randmittel des Leseverstehenstests in Spanisch (sprachlicher Hin‐ tergrund, Geschlecht) 11.6 Analyse möglicher Interaktionseffekte 423 Abb. 30: Geschätzte Randmittel des Schreibtests in Spanisch (sprachlicher Hintergrund, Geschlecht) Abb. 31: Geschätzte Randmittel der Gesamtergebnisse der Spanischtests (sprachlicher Hintergrund, Geschlecht) 424 11 Auswertung der Ergebnisse 11.6.4 Zwischenfazit: Antwort auf Forschungsfrage 2 für Spanisch Bezüglich Forschungsfrage 2 kann also festgehalten werden, dass keine signi‐ fikanten Interaktionseffekte zwischen Geschlecht und sozioökonomischem Hintergrund oder zwischen Geschlecht und sprachlichem Hintergrund auf die fremdsprachlichen Leistungen im Spanischen gemessen werden können. Jedoch liegen beim Leseverstehen ein schwacher, nicht signifikanter Interaktionseffekt (p-=-.460, η p ² = .019), beim Schreiben ein mittlerer, nicht signifikanter Interakti‐ onseffekt (p = .080, η p ² = .059) und beim Gesamtergebnis ein schwacher, nicht signifikanter Interaktionseffekt (p = .335, η p ² = .025) mit dem sozioökonomischen Status vor (vgl. Tabelle 70). Dies führt beim Leseverstehen dazu, dass die Jungen mit niedrigem sozio‐ ökonomischem Status etwas besser abschneiden als die Mädchen mit niedrigem sozioökonomischem Status, dass aber Mädchen und Jungen mit mittlerem und hohem sozioökonomischem Status jeweils vergleichbare durchschnittliche Leistungen erzielen (vgl. Abbildung 25). Beim Schreiben erzielen die Jungen mit niedrigem sozioökonomischem Status ebenfalls tendenziell höhere Punktzahlen als Mädchen dieser Kategorie, wohingegen bei mittlerem und hohem sozioöko‐ nomischem Status die Mädchen tendenziell höhere Ergebnisse im Schreibtest erzielen (vgl. Abbildung 26). Beim Gesamtergebnis in Spanisch kristallisiert sich heraus, dass Mädchen und Jungen mit mittlerem und hohem sozioökonomischem Status jeweils vergleichbare Ergebnisse erlangen, während bei niedrigem sozioökonomischem Status tendenziell die Jungen besser abschneiden (vgl. Abbildung 27). Folglich zeigt sich insgesamt ein leichter Vorteil der Jungen mit niedrigem sozioökono‐ mischem Status. Betrachtet man die Interdependenz zwischen Geschlecht und sprachlichem Hintergrund, treten lediglich beim Leseverstehen (p-= .262, η p ² = .015) und beim Schreiben (p-=-.198, η p ² = .019; vgl. Tabelle 71) schwache, nicht signifikante In‐ teraktionseffekte auf. In beiden Fertigkeiten schneiden tendenziell einsprachige Jungen etwas besser ab als einsprachige Mädchen und mehrsprachige Mädchen erzielen wiederum tendenziell höhere Ergebnisse als mehrsprachige Jungen. Im Gesamtergebnis in Spanisch tritt dieser schwache, nicht signifikante Interakti‐ onseffekt zwischen Geschlecht und sprachlichem Hintergrund allerdings nicht mehr auf. 11.6 Analyse möglicher Interaktionseffekte 425 11.7 Ergebnisse bezüglich der endogenen und wahrgenommenen exogenen Faktoren Die Ergebnisse zu den affektiven Faktoren in den beiden Geschlechtergruppen werden, genauso wie die Sprachtests, separat für die Französisch- und die Spanischstichprobe dargelegt. Zuerst werden die Ergebnisse zu den endogenen Faktoren zusammengefasst, bevor auf das Ought-to L2 Self und somit auf die wahrgenommenen Erwartungs- und Unterstützungshaltungen durch die Sozialisationsinstanzen Bezug genommen wird. Für jede Skala wird zunächst eine Prüfung auf Normalverteilung vorgenommen, indem erfasst wird, inwie‐ fern Schiefe und Kurtosis signifikant von Null abweichen, wobei dies stets über die Berechnung der Quotienten aus Schiefe und deren Standardfehler sowie aus Kurtosis und deren Standardfehler erfolgt (vgl. Anhang 4.9; vgl. Lienert/ Raatz 1998: 147 ff.). Auf Grundlage dessen wird die statistische Prü‐ fung des Unterschieds bei nicht annähernd normalverteilten Daten mittels Mann-Whitney-U-Tests und bei annähernd normalverteilten mittels des t-Tests vorgenommen. 11.7.1 Ergebnisse bezüglich der endogenen affektiven Faktoren in Französisch Mit Ausnahme der genderstereotyp weiblichen Wahrnehmung der französi‐ schen Sprache liegen in der Französischstichprobe die Mittelwerte der weibli‐ chen Lernenden bei allen gemessenen affektiven Faktoren tendenziell höher als diejenigen der Jungen, wobei nur teilweise signifikante Unterschiede oder schwache bis mittlere Effekte gemessen werden: Die Ergebnisse des t-Tests zur gemeinsamen Skala von integrativer Orientierung und Ideal L3 Self zeigen einen schwachen, nicht signifikanten Effekt zugunsten der Mädchen (p = .099, d = .362; vgl. Tabelle 72). Auch bei der instrumentellen Orientierung wird ein höherer Wert bei den Mädchen gemessen, wobei der Unterschied nicht signifikant ist, je‐ doch ein schwacher Effekt zugunsten der Mädchen gemessen wird (p = .303, d = .225, vgl. Tabelle 72). Die im Bereich der instrumentellen Orientierung erzielten Mittelwerte durch die beiden Geschlechtergruppen bezüglich des Französischen sind außerdem insgesamt eher niedrig (M (w) = 2.093, M (m) = 1.964), was bedeutet, dass der Nützlichkeitsaspekt des Französischen durchschnittlich als eher gering eingeschätzt wird. Dementsprechend erzielen die Mädchen auch bei der L3 WTC einen etwas höheren Mittelwert als die Jungen, was sich mittels eines t-Tests als schwacher, nicht signifikanter Effekt entpuppt (p = .299, d = .227; vgl. Tabelle 72). 426 11 Auswertung der Ergebnisse 218 Ein für das Item „Schreiben von Briefen und E-Mails an Freundinnen und Freunde auf Französisch“ durchgeführter Mann-Whitney-U-Test, zeigt, dass hierbei die Geschlech‐ terunterschiede signifikant sind (M Rang (w) = 49.11, M Rang (m) = 37.09, U = 669.500, Z = -2.594, p = .009). 219 Für diese Analyse wurden die Subinteressensgebiete bezüglich der Sportarten, der Lebensbereiche von Jugendlichen und der einzelnen frankophonen Gebiete erst einmal unberücksichtigt gelassen (vgl. Schülerfragebögen im Anhang 3.2). Überdies erreichen die Mädchen in der L3 WTC etwas höhere Mittelwerte als die Jungen, wobei der Geschlechterunterschied laut t-Test nicht signifikant ist, sich aber in einem schwachen Effekt ausdrückt (M-(w) = 2.254, M-(m) = 2.114; p = .299, d = .227; vgl. Tabelle 72). Die Tendenz der leicht höheren Werte der Mädchen findet sich erneut im Ergebnis des Index zur Häufigkeit der Freizeitaktivitäten auf Französisch: Die Mädchen führten in den sechs Monaten vor dem Erhebungszeitpunkt nach dem Mann-Whitney-U-Test signifikant häufiger Aktivitäten auf Französisch in ihrer Freizeit durch als die Jungen (p-=-.001, d = .748; vgl. Tabelle 72). Die Freizeitak‐ tivitäten wurden von 1 = „niemals“ bis 5 = „mehr als fünfmal“ kodiert und die höchsten Mittelwerte erreichen die Mädchen beim Item „Anhören von Liedern inklusive intensiver Lektüre der Songtexte auf Französisch“ (M (w) = 3.04), beim „Teilnehmen an einer mündlichen Unterhaltung auf Französisch“ (M (w) = 2.78) und beim „Schreiben von Briefen und E-Mails an Freundinnen und Freunde auf Französisch“ (M (w) = 2.06). Die Jungen erreichen die höchsten Mittelwerte beim „Anhören von Liedern inklusive intensiver Lektüre der Songtexte auf Franzö‐ sisch“ (M-(m)-= 2.08), beim „Teilnehmen an einer mündlichen Unterhaltung auf Französisch“ (M (m) = 2.03) und beim „Anschauen französischer Internetseiten“ (M-(m)-= 1.57; vgl. Anhang 6.4). 218 Bezüglich des Interesses am Fach Französisch kann über einen t-Test festge‐ stellt werden, dass die Mädchen signifikant höhere Mittelwerte erzielen als die Jungen, wobei ein schwacher Effekt gemessen wird (p = .045, d = .441; vgl. Tabelle 72). Komplementär zur Messung der Ausprägung des Interesses am Fach Franzö‐ sisch wurden die Schülerinnen und Schüler durch den Fragebogen gebeten, ihre Interessensgebiete innerhalb des Fachs Französisch anzugeben, wobei sich diese an den vorgegebenen Themengebieten der Bildungspläne Baden-Württembergs (vgl. Landesinstitut für Schulentwicklung 2016a) orientierten. Abbildung 32 zeigt, mit welchen prozentualen Häufigkeiten die männlichen und die weibli‐ chen Französischlerndenen jeweils die einzelnen Interessensgebiete angaben. Ein Chi-Quadrat-Test zum Mehrfachantwortenset der Interessensgebiete 219 fällt signifikant aus (p = .002), was bedeutet, dass die Merkmale Interessensgebiet 11.7 Ergebnisse bezüglich der endogenen und wahrgenommenen exogenen Faktoren 427 und Geschlecht nicht unabhängig voneinander sind, sondern mit einer gewissen Regelmäßigkeit gebündelt auftreten (vgl. Bortz/ Schuster 2010: 137 ff.): 43% der Jungen gaben beispielsweise die Geschichte Frankreichs als Interessensgebiet an und lediglich 32% der Mädchen. Ähnliche Tendenzen zugunsten der Jungen sind für die Themen Arbeitswelt (16% der Jungen vs. 12% der Mädchen), Wirtschaft (24% der Jungen vs. 4% der Mädchen), Natur und Umwelt (38% der Jungen vs. 28% der Mädchen) sowie Sport (54% der Jungen vs. 32% der Mädchen) zu finden. Im Gegensatz dazu ist eine höhere prozentuale Häufigkeit bei den Mädchen in den Interessensgebieten Schüleraustausch (60% der Mädchen vs. 24% der Jungen), Essensgewohnheiten und landestypische Gerichte (72% der Mädchen vs. 49% der Jungen), (Alltags-)Leben der Jugendlichen in Frankreich (76% der Mädchen vs. 57% der Jungen), französische Musik (64% der Mädchen und 49% der Jungen) und französisches Kino (20% der Mädchen und 16% der Jungen) zu verzeichnen. Immigration und Integration wurde von 22% der Jungen und auch von 22% der Mädchen als Interessensgebiet angegeben. Vergleichbare Anteile in beiden Geschlechtergruppen finden sich außerdem bei den Themen Politik (20% der Mädchen vs. 19% der Jungen), Regionen und Städte Frankreichs (54% der Jungen vs. 50% der Mädchen), deutsch-französische Beziehungen (40% der Mädchen vs. 38% der Jungen) und Gebiete der Frankophonie jenseits Frankreichs (50% der Mädchen vs. 49% der Jungen). Schließlich kommen französische Literatur und Lektüren auf lediglich 6% bei den weiblichen und 3% bei den männlichen Französischlernenden. 428 11 Auswertung der Ergebnisse Abb. 32: Prozentuale Häufigkeiten der einzelnen Interessensgebiete der Französischs‐ tichprobe, aufgeteilt nach Geschlecht Betrachtet man die weiteren endogenen affektiven Faktoren, so ergibt ein t-Test bei den Einstellungen zur französischen Zielkultur einen schwachen, nicht signifikanten Effekt zugunsten der Mädchen (M (w) = 2.578, M (m) = 2.356; p-= .085, d-= .378, vgl. Tabelle 72). Dies bedeutet, dass die Mädchen tendenziell etwas positivere Einstellungen gegenüber den Französinnen und Franzosen, Frankreich sowie der französischen Kultur besitzen als die Jungen. Das Ergebnis des t-Tests bezüglich der genderstereotyp weiblichen Wahrneh‐ mung des Französischen zeigt keinerlei statistisch relevante Geschlechterunter‐ schiede (M (w) = 2.143; M (w) = 2.187; p = .769, d = -.060). Jedoch liegen die Mittelwerte beider Geschlechtergruppen über dem Wert 2. Wenn man bedenkt, dass in den einzelnen Items der Wert 2 für „trifft eher nicht zu“ und 3 für „trifft eher zu“ kodiert wurde, bedeutet ein Mittelwert über 2 eine durchschnittlich leichte Zustimmung beider Geschlechtergruppen zu den Aussagen, dass das Französische beispielsweise weiblich klinge oder dass Mädchen für Französisch begabter seien als Jungen. Die Mittelwerte liegen bei diesem Konstrukt sogar leicht über denjenigen der integrativen Orientierung gepaart mit dem Ideal L3 Self oder der instrumentellen Orientierung. Bei den Jungen werden sogar bei der genderstereotyp weiblichen Wahrnehmung des Französischen tendenziell 11.7 Ergebnisse bezüglich der endogenen und wahrgenommenen exogenen Faktoren 429 höhere Mittelwerte erzielt als beim Interesse am Fach Französisch oder der L3 WTC (vgl. Tabelle 72). Schließlich zeigen die statistischen Analysen einerseits beim FFS Selbstkon‐ zept einen schwachen, nicht signifikanten Effekt zugunsten der Mädchen (p = .236, d = .259; vgl. Tabelle 72). Jedoch manifestiert sich andererseits auch, dass die Mädchen mit einem schwachen, nicht signifikanten Effekt eine höhere L3-Angst im Französischen verspüren als die Jungen (p = .168, d = .298). Inwiefern die L3-Angst bei den Mädchen und Jungen jeweils eher förderlich für die fremdsprachliche Leistung ist oder diese aber hindert, wird in Kapitel 11.10 näher erläutert. Französischstichprobe Skala - n Mdn M Rang M- SD - Ergebnis des t-Tests/ Mann-Whitney- U-Tests Integrative Ori‐ entierung ge‐ paart mit Ideal L3 Self w 50 2.111 47.41 2.104 .434- t (85) = 1.669 p = .099 d = .362 KI 95% für d [-.073, .797] m 37 1.889 39.39 1.937 .499 ges 87 2.111 - 2.033 .467 - Instrumentelle Orientierung w 50 2.000 45.50 2.093 .579 t (85) = 1.036 p = .303 d = .225 KI 95% für d [-.208, .657] m 37 2.000 41.97 1.964 .571 ges 87 2.500 - 2.038 .575 - L3 WTC w 50 2.200 46.27 2.254 .599- t (85) = 1.045 p = .299 d = .227 KI 95% für d [-.206, .659] m 37 2.200 40.93 2.114 .647 ges 87 2.200 - 2.194 .620 - Häufigkeit der Freizeitaktivi‐ täten auf Fran‐ zösisch (Index) w 47 1.692 50.09 1.689 .458- U = 513.000 Z = -3.222 p = .001 d = .748 m 37 1.308 32.86 1.412 .505 ges 84 1.423 - 1.567 .496 - 430 11 Auswertung der Ergebnisse Französischstichprobe Skala - n Mdn M Rang M- SD - Ergebnis des t-Tests/ Mann-Whitney- U-Tests Interesse am Fach Franzö‐ sisch w 50 2.500 48.55 2.448 .693- t (85) = 2.032 p = .045 d = .441 KI 95% für d [.004, .877] m 37 2.250 37.85 2.156 .623 ges 87 2.375 - 2.324 .676 - Einstellungen zur französi‐ schen Ziel‐ kultur w 50 2.500 47.33 2.578 .542- t (85) = 1.745 p = .085 d = .378 KI 95% für d [-.057, .813] m 37 2.500 39.50 2.356 .639 ges 87 2.250 - 2.483 .592 - Genderste‐ reotyp weib‐ liche Wahrnehmung des Fran‐ zösischen w 50 2.125 43.11 2.143 .632- t (84) = -.278 p = .769 d = -.060 KI 95% für d [-.492, .371] m 36 2.250 44.04 2.187 .757 ges 86 2.500 - 2.162 .683 - FFS Selbstkon‐ zept w 50 2.813 47.06 2.714 .719- t (85) = 1.193 p = .236 d = .259 KI 95% für d [-.174, .692] m 37 2.500 39.86 2.539 .660 ges 87 2.750 - 2.637 .697 - L3-Angst w 50 2.083 47.20 2.140 .719- U = 765.000 Z = -1.379 p = .168 d = .298 m 37 1.833 39.68 1.926 .660 ges 87 2.000 - 2.049 .759 - Anmerkungen. Während die Freizeitaktivitäten von „niemals“ (1) bis „mehr als fünfmal“ (5) kodiert sind, wurden alle anderen Skalen von „trifft überhaupt nicht zu“ (1) bis „trifft voll zu“ (4) kodiert. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 72: Medianwerte (Mdn), mittlere Ränge (M Rang ), Mittelwerte (M), Standardabwei‐ chungen (SD) und Ergebnisse der t-Tests bzw. Mann-Whitney-U-Tests zu endogenen Faktoren in der Französischstichprobe, aufgeteilt nach Geschlecht 11.7 Ergebnisse bezüglich der endogenen und wahrgenommenen exogenen Faktoren 431 11.7.2 Zwischenfazit: Antwort auf Forschungsfrage 3 für Französisch Forschungsfrage 3 lautete innerhalb welcher endogener affektiver Faktoren bezüglich des Erlernens des Französischen Geschlechterunterschiede und -ge‐ meinsamkeiten auftreten. Nach der statistischen Analyse wird deutlich, dass die Mädchen - mit Ausnahme der genderstereotyp weiblichen Wahrnehmung des Französischen - bei den endogenen affektiven Faktoren tendenziell höhere Ergebnisse erzielen als die Jungen, wobei lediglich bei der Häufigkeit der Freizeitaktivitäten auf Französisch (p = .001, d = .748) und beim Interesse am Fach Französisch (p = .045, d = .441; vgl. Tabelle 72) statistisch signifikante Unterschiede zugunsten der Mädchen gemessen werden. Bei der integrativen Orientierung gepaart mit dem Ideal L3 Self (p = .099, d = .362), der instrumen‐ tellen Orientierung (p = .303, d = .225), der L3 WTC (p = .299, d = .227), den Einstellungen zur französischen Zielkultur (p = .085, d = .378) und beim FFS Selbstkonzept (p-=-.236, d-=-.259; vgl. Tabelle 72) treten jeweils schwache, nicht signifikante Effekte zugunsten der Mädchen auf. Genderstereotyp weibliche Wahrnehmungen des Französischen, d. h. Vorstellungen wie diejenige, dass Mädchen für Französisch begabter seien als Jungen oder dass Französisch weib‐ lich klingen würde, sind bei beiden Geschlechtergruppen ähnlich ausgeprägt, in dem Sinne, dass im Durchschnitt bei beiden Merkmalsgruppen (p = .168, d = .298; vgl. Tabelle 72) eine leichte Zustimmung zu diesen Behauptungen gemessen werden kann. Schließlich lassen sich signifikant unterschiedliche Neigungen bei den Inte‐ ressensgebieten feststellen, die durch einen Chi-Quadrat-Test (p-=-.002) erfasst wurden: Während die Mädchen sich verstärkt für Themen wie das Leben der Jugendlichen in Frankreich, Essensgewohnheiten und typische Gerichte Frank‐ reichs sowie Schüleraustausch interessieren, welche bei den Jungen insgesamt weniger stark im Fokus stehen, stoßen bei den männlichen Französischlern‐ enden Themen wie die Geschichte Frankreichs, Wirtschaft und Industrie, Natur und Umwelt sowie insbesondere Sport auf mehr Interesse als bei den Mädchen. 11.7.3 Ergebnisse bezüglich der wahrgenommenen exogenen Faktoren in Französisch Betrachtet man die Ergebnisse bezüglich der Wahrnehmungen der exogenen Faktoren, ergibt sich ein eher uneinheitliches Bild: Bei keinem der untersuchten Konstrukte ergeben sich signifikante Geschlechterunterschiede, jedoch können teilweise statistisch relevante Effekte gemessen werden, die je nach Konstrukt 432 11 Auswertung der Ergebnisse entweder zugunsten der Mädchen oder aber zugunsten der Jungen ausfallen (vgl. Tabelle 73). Bei der wahrgenommenen Unterstützung durch die Französischlehrkraft werden vernachlässigbare Effekte gemessen, sodass hier kein statistisch rele‐ vanter Geschlechterunterschied auftritt (p-=-.411, d-=-.176; vgl. Tabelle 73), was bedeutet, dass sich beide Geschlechtergruppen in gleichem Maße von ihren Französischlehrkräften unterstützt fühlen. Ein schwacher Effekt zugunsten der weiblichen Lernerinnen findet sich hingegen bei den wahrgenommenen Erwar‐ tungen der Französischlehrkraft, was bedeutet, dass die Mädchen tendenziell höhere Erwartungen der Französischlehrkräfte verspüren als die Jungen (p = .081, d = .383; vgl. Tabelle 73). Passend dazu ergibt die statistische Analyse, dass sich Jungen und Mädchen einig darüber sind, dass die Aufmerksamkeit der Lehrkräfte und der im Unterricht behandelten Themen deutlich stärker bei den Mädchen als bei den Jungen liegt, da beim Konstrukt der wahrgenommenen Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen durch beide Geschlechtergruppen relativ hohe Mittelwerte erzielt werden (M (w)-= 3.327, M-(m)-=-3.287). Die wahrgenommenen Erwartungen der Peers fallen hingegen sowohl bei den Jungen als auch bei den Mädchen vergleichsweise gering aus (M w) = 1.762; M (m) = 1.718) und es sind keinerlei statistisch relevante Unterschiede zwischen den beiden Geschlechtergruppen messbar (p-=-.679, d-=-.091; vgl. Tabelle 73). Schließlich wurden die wahrgenommenen Erwartungen der Eltern unter‐ sucht. Im Gegensatz zu den bisher gemessenen Tendenzen wird bei diesem Konstrukt ein schwacher, nicht signifikanter Effekt zugunsten der Jungen gemessen (p = .106, d = .348), was bedeutet, dass die Jungen tendenziell höhere Leistungserwartungen bezüglich des Französischen seitens ihrer Eltern verspüren als die Mädchen. 11.7 Ergebnisse bezüglich der endogenen und wahrgenommenen exogenen Faktoren 433 Französischstichprobe Skala - n Mdn M Rang M- SD - Ergebnis des t-Tests/ Mann-Whitney- U-Tests Wahrgenom‐ mene Unter‐ stützung durch die Französi‐ schlehrkraft w 50 3.250 45.90 3.125 .729- U = 830.000 Z = -.822 p = .411 d = .176 m 37 3.000 41.43 3.041 .561 ges 87 3.250 - 3.089 .660 - Wahrgenom‐ mene Erwar‐ tungen der Französi‐ schlehrkraft w 50 3.125 47.92 3.208 .407- t (85) = 1.765 p = .081 d = .225 KI 95% für d [-.208, .657] m 37 3.000 38.70 3.041 .473 ges 87 3.000 - 3.137 .442 - Wahrg. Auf‐ merksamkeits‐ verteilung der Französi‐ schlehrkraft zugunsten der Mädchen w 50 3.333 43.93 3.327 .565- t (84) = .314 p = .754 d = .069 KI 95% für d [-.366, .503] m 36 3.333 42.90 3.287 .592 ges 86 3.333 - 3.310 .573 - Wahrgenom‐ mene Erwar‐ tungen von Peers w 50 1.750 44.15 1.762 .477- t (84) = .415 p = .679 d = .091 KI 95% für d [-.344, .526] m 36 1.750 42.60 1.718 .499 ges 86 1.750 - 1.743 .484 - Wahrgenom‐ mene Erwar‐ tungen der El‐ tern w 50 1.750 40.29 1.845 .529- U = 739.500 Z = -1.616 p = .106 d = .348 m 37 2.000 49.01 2.034 .604 ges 87 1.750 - 1.925 .566 - Anmerkungen. Da bei der Skala „wahrgenommene Unterstützung durch die Französischlehrkraft“ der Levene-Test der Varianzgleichheit signifikant ist, wird von ungleichen Varianzen ausge‐ gangen, weshalb die Freiheitsgrade hier etwas geringer sind als bei den anderen Skalen, bei denen die Varianzen gleich sind. Werte von p < .05 werden als signifikant definiert. Tabelle 73: Medianwerte (Mdn), mittlere Ränge (M Rang ) , Mittelwerte (M), Standardabwei‐ chungen (SD) und Ergebnisse der t-Tests bzw. Mann-Whitney-U-Tests zu den wahrge‐ nommenen exogenen Faktoren in der Französischstichprobe, aufgeteilt nach Geschlecht 434 11 Auswertung der Ergebnisse 11.7.4 Zwischenfazit: Antwort auf Forschungsfrage 4 für Französisch Forschungsfrage 4 lautete, welche Geschlechterunterschiede und -gemeinsam‐ keiten bei den wahrgenommenen exogenen Faktoren festgestellt werden können. In der Französischstichprobe offenbart sich diesbezüglich, dass die Mädchen und die Jungen jeweils ein vergleichbares Maß an Unterstützung durch die Französischlehrkraft erfahren (p =-.411, d = .176), dass aber ein nicht signifikanter, schwacher Effekt zugunsten der Mädchen bei den wahrgenom‐ menen Erwartungen durch die Französischlehrkraft auftritt (p-= .081, d-=-.225; vgl. Tabelle 73). Dies wird auch durch die Ergebnisse bezüglich des Konstrukts der wahrgenommenen Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen bestätigt, da sowohl die Jungen als auch die Mädchen die Aufmerksamkeit der Lehrkräfte und der behandelten Themengebiete im Französischunterricht als verstärkt auf die Mädchen gerichtet wahrnehmen (M (w) = 3.327; M (m) = 3.287), wobei hier kein Geschlechterunterschied vorliegt, sondern sich beide Gruppen darüber einig sind (p = .754, d = .069). Während die Französischlernenden wahrnehmen, dass die Peers gegenüber beiden Geschlechtergruppen ähnlich niedrige Erwartungshaltungen bezüglich des Französischlernens haben (M (w) = 1.762, M (m) = .718, p = .679, d = .091, vgl. Tabelle 73), wird bei den wahrgenommenen Erwartungen der Eltern ein schwacher, nicht signifikanter Effekt zugunsten der Jungen gemessen (p = .106, d = .348), was aussagt, dass die Jungen von ihren Eltern tendenziell etwas höheren Erwartungsdruck bezüglich des Erreichens guter Leistungen im Französischen wahrnehmen als die Mädchen. 11.7.5 Ergebnisse bezüglich der endogenen affektiven Faktoren in Spanisch In der Spanischstichprobe schwanken die Ergebnisse je nach affektivem Faktor stark, wobei manchmal die Jungen tendenziell höhere Mittelwerte erzielen, manchmal die Mädchen und manchmal kein Geschlechterunterschied vorliegt. Es ist daher, anders als bei der Französischstichprobe, keine allgemeine Tendenz zugunsten einer Geschlechtergruppe zu erkennen. Bei der gemeinsamen Skala zur integrativen Orientierung gepaart mit dem Ideal L4 Self können keinerlei Geschlechterunterschiede festgestellt werden. Die Mittelwerte der Mädchen und der Jungen liegen jeweils relativ hoch (M (w) = 2.605, M (m) = 2.619; p = .908, d = -.029; vgl. Tabelle 74), wonach beide Geschlechtergruppen deutlich integrativ orientiert sind und ihr zukünftiges Selbst tendenziell als ein im Spanischen kompetent agierendes Wesen sehen. 11.7 Ergebnisse bezüglich der endogenen und wahrgenommenen exogenen Faktoren 435 Die Mittelwerte der Ergebnisse zur instrumentellen Orientierung liegen insgesamt sogar noch etwas über denjenigen der integrativen Orientierung gepaart mit dem Ideal L4 Self, wobei kein signifikanter Unterschied, aber ein schwacher Effekt zugunsten der Mädchen gemessen wird (M (w) = 2.909, M (m) = 2.750; p = .206, d = .316, vgl. Tabelle 74). Folglich ist bei beiden Geschlechtergruppen die instrumentelle Orientierung etwas stärker ausgeprägt als die integrative Orientierung gepaart mit dem Ideal L4 Self. In der L4 WTC wird wiederum ein schwacher, nicht signifikanter Effekt zu‐ gunsten der Jungen gemessen (p = .076, d-= -.445; vgl. Tabelle 74), was bedeutet, dass die Jungen tendenziell mehr Gesprächsbereitschaft im Spanischunterricht und darüber hinaus zeigen als die Mädchen. Hingegen sind bei der Häufigkeit der Freizeitaktivitäten auf Spanisch mittels eines Mann-Whitney-U-Tests kei‐ nerlei Geschlechterunterschiede messbar (p = .596, d = .112; vgl. Tabelle 74); beide Geschlechtergruppen führen jedoch insgesamt eher selten Freizeitakti‐ vitäten auf Spanisch durch (M (w) = 1.692, M (m) = 1.659; vgl. Tabelle 74). Die höchsten Mittelwerte erreichen die Mädchen bei den Items „Anhören von Liedern inklusive intensiver Lektüre der Songtexte auf Spanisch“ (M (w) = 3.79), beim „Anschauen spanischer Internetseiten“ (M (w) = 1.93) und beim „Schreiben von Geschichten auf Spanisch“ (M (w) = 1.93). Die Jungen erreichen die höchsten Mittelwerte bei den Items „Anhören von Liedern inklusive intensiver Lektüre der Songtexte auf Spanisch“ (M-(m) = 3.38), beim „Teilnehmen an einer mündlichen Unterhaltung auf Spanisch“ (M (m) = 2.24) und beim „Chatten auf Spanisch im Internet“ (M-(m)-= 2.00; vgl. Anhang 6.4). Beim Interesse am Fach Spanisch werden ebenfalls keine signifikanten Geschlechterunterschiede gemessen, jedoch ein schwacher Effekt zugunsten der Jungen (p-= .102, d-= -.409; vgl. Tabelle 74). Bei einer präzisen Betrachtung der einzelnen Interessensgebiete werden aber einige geschlechtsspezifische Tendenzen ersichtlich, die sich in einem signifikanten Ergebnis des Chi-Qua‐ drat-Tests zum Mehrfachantwortenset des Schülerfragebogens (vgl. Frage 11, Anhang 3.3) niederschlagen (p = .000): Ein tendenziell höheres Interesse der Mädchen zeigt sich bei den Themengebieten Arbeitswelt (29% der Mädchen vs. 19% der Jungen), Natur und Umwelt (54% der Mädchen vs. 19% der Jungen), Regionen und Städte Spaniens (86% der Mädchen vs. 57% der Jungen), Immigra‐ tion und Integration (22% der Mädchen und 5% der Jungen), Schüleraustausch (61% der Mädchen vs. 33% der Jungen), Essensgewohnheiten und typische Gerichte (89% der Mädchen vs. 67% der Jungen), Leben der Jugendlichen in Spanien (76% der Mädchen vs. 57% der Jungen), spanische Musik (79% der Mädchen und 67% der Jungen), spanisches Kino (49% der Mädchen vs. 10% der Jungen), spanische Lektüren und Literatur (32% der Mädchen vs. 5% der Jungen) 436 11 Auswertung der Ergebnisse und andere spanischsprachige Gebiete (74% der Mädchen vs. 62% der Jungen). Jungen zeigen ein tendenziell höheres Interesse an der Geschichte Spaniens (44% der Mädchen vs. 57% der Jungen), der Politik (13% der Mädchen vs. 24% der Jungen) und am Themenbereich Sport (53% der Mädchen vs. 57% der Jungen). Eine gleiche Interessenlage der beiden Geschlechtergruppen findet sich beim Thema Wirtschaft und Industrie, wofür sich jeweils 10% der beiden Geschlechtergruppen interessieren (vgl. Abbildung 32). Abb. 33: Prozentuale Häufigkeiten der einzelnen Interessensgebiete der Spanischstich‐ probe, aufgeteilt nach Geschlecht Bei den Einstellungen zur Zielkultur, welche die Einstellung zu den Spanie‐ rinnen und Spaniern, zu Spanien und der spanischen Kultur umfassen, erreichen die Mädchen signifikant höhere Werte als die Jungen (p = .029, d = .548; vgl. Tabelle 74). Hingegen sind sich beide Geschlechtergruppen darüber einig, dass sie die spanische Sprache kaum als genderstereotyp weiblich wahrnehmen, was ein Mann-Whitney-U-Test belegt (Mdn (w) = 1.500, Mdn (m) = 1.500; p = .920, d = .022; vgl. Tabelle 74). Auch beim SFS Selbstkonzept liegt nach einem Mann-Whitney-U-Test kein statistisch relevanter Geschlechterunterschied (p = .617, d = .104) vor, was be‐ deutet, dass die Jungen und Mädchen sich als ähnlich kompetent im Spanischen 11.7 Ergebnisse bezüglich der endogenen und wahrgenommenen exogenen Faktoren 437 einschätzen. Jedoch zeigt sich, dass die Mädchen signifikant ängstlicher sind, in und außerhalb des Klassenzimmers auf Spanisch zu sprechen, was mithilfe der Skala zur L4-Angst gemessen wurde (p = .041, d = .430; vgl. Tabelle 74). Spanischstichprobe Skala - n Mdn M Rang M- SD - Ergebnis des t-Tests/ Mann-Whitney- U-Tests Integrative Ori‐ entierung ge‐ paart mit Ideal L4 Self w 72 2.714 47.12 2.605 .501- t (91) = -.116 p = .908 d = -.029 KI 95% für d [-.521, .464] m 21 2.571 46.60 2.619 .489 ges 93 2.571 - 2.608 .499 - Instrumentelle Orientierung w 73 3.000 49.54 2.909 .497- t (92) = 1.275 p = .206 d = .316 KI 95% für d [-.178, .810] m 21 2.750 40.40 2.750 .524 ges 94 3.000 - 2.873 .504 - L4 WTC w 73 2.500 44.99 2.499 .599- t (92) = -1.796 p = .076 d = -.445 KI 95% für d [-.941, .051] m 21 2.750 56.21 2.754 .470 ges 94 2.750 - 2.556 .580 - Häufigkeit der Freizeitaktivi‐ täten auf Spa‐ nisch (Index) w 69 1.692 46.30 1.692 .418- U = 669.000 Z = -.531 p = .596 d = .112 m 21 1.539 42.86 1.659 .481 ges 90 1.692 - 1.684 .431 - Interesse am Fach Spanisch w 73 2.875 44.79 2.807 .650- t (92) = -1.652 p = .102 d = -.409 KI 95% für d [-.904, .086] m 21 3.250 56.93 3.071 .633 ges 94 2.938 - 2.866 .653 - 438 11 Auswertung der Ergebnisse Spanischstichprobe Skala - n Mdn M Rang M- SD - Ergebnis des t-Tests/ Mann-Whitney- U-Tests Einstellungen zur spanischen Zielkultur w 73 3.143 50.81 3.076 .531- t (92) = 2.212 p = .029 d = .548 KI 95% für d [-.050, 1.046] m 21 2.857 36.00 2.789 .500 ges 94 3.143 - 3.012 .535 - Genderste‐ reotyp weib‐ liche Wahrneh‐ mung des Spanischen w 73 1.500 47.65 1.640 .610- U = 755.000 Z = -.101 p = .920 d = .022 m 21 1.500 46.98 1.625 .593 ges 94 1.500 - 1.637 .603 - SFS Selbstkon‐ zept w 73 2.875 46.75 2.883 .639 U = 711.000 Z = -.500 p = .617 d = .104 m 21 3.000 50.12 2.953 .639 ges 94 2.938 - 2.899 .636 - L4-Angst w 73 2.000 50.57 2.053 .735 U = 542.500 Z = -2.039 p = .041 d = .430 m 21 1.500 36.83 1.683 .491 ges 94 1.833 - 1.970 .703 - Anmerkungen. Während die Freizeitaktivitäten von „niemals“ (1) bis „mehr als fünfmal“ (5) kodiert sind, wurden alle anderen Skalen von „trifft überhaupt nicht zu“ (1) bis „trifft voll zu“ (4) kodiert. Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Tabelle 74: Medianwerte (Mdn), mittlere Ränge (M Rang ), Mittelwerte (M), Standardabwei‐ chungen (SD) und Ergebnisse der t-Tests bzw. Mann-Whitney-U-Tests zu den endogenen Faktoren in der Spanischstichprobe, aufgeteilt nach Geschlecht Insgesamt wird deutlich, dass die affektiven Faktoren innerhalb der Spanischs‐ tichprobe meist stärker ausgeprägt sind als in der Französischstichprobe. Die größten Unterschiede lassen sich bei der instrumentellen Orientierung finden, bei der die Französischstichprobe auf einen Mittelwert von 2.038 kommt, während die Spanischstichprobe einen Mittelwert von 2.873 erreicht. Somit wird die Nützlichkeit des Spanischen deutlich höher eingeschätzt als die Nützlichkeit 11.7 Ergebnisse bezüglich der endogenen und wahrgenommenen exogenen Faktoren 439 des Französischen. Aber auch die integrative Orientierung gepaart mit Ideal L4 Self ist innerhalb der Spanischstichprobe (M-= 2.608) stärker ausgeprägt als innerhalb der Französischstichprobe (M = 2.033). Ähnlich verhält es sich mit der L4 WTC für Spanisch (M-= 2.556) im Verhältnis zur L3 WTC für Französisch (M = 2.194), mit dem Interesse am Fach Spanisch (M = 2.866) im Verhältnis zum Interesse am Fach Französisch (M = 2.324) sowie mit den Einstellungen zur spanischen Zielkultur (M = 3.012) im Verhältnis zur französischen Zielkultur (M =-2.483). Lediglich das SFS Selbstkonzept (M-=-2.899) und das FFS Selbstkonzept (M = 2.637) sowie die L4-Angst bezüglich des spanischen (M = 1.970) und die L3-Angst bezüglich des Französischen (M = 2.049) sind ähnlich stark ausgeprägt, wobei auch hier die Tendenzen erkennbar sind, dass das SFS Selbstkonzept bezüglich des Spanischen etwas höher ausfällt als das FFS Selbstkonzept bezüglich des Französischen und dass die L3-Angst bezüglich des Französischen tendenziell leicht höher ist als die L4-Angst bezüglich des Spanischen (vgl. Tabellen 72 bis 74). 11.7.6 Zwischenfazit: Antwort auf Forschungsfrage 3 für Spanisch Genauso wie bei den fremdsprachlichen Leistungen in Spanisch werden auch bei den affektiven Faktoren sehr ausgeglichene Ergebnisse zwischen Jungen und Mädchen erzielt: Signifikante Unterschiede zugunsten der Mädchen werden bei den Einstellungen zur spanischen Zielkultur (p-=-.029, d-=-.548) festgestellt. Gleichzeitig weisen die Mädchen aber auch eine signifikant höhere L4-Angst auf als die Jungen (p = .041, d = .430). Bei der instrumentellen Orientierung wird ein schwacher, nicht signifikanter Effekt zugunsten der Mädchen gemessen (p = .206, d = .316). Hingegen finden sich bei der L4 WTC und beim Interesse am Fach Spanisch (p = .102, d = -.409) schwache, nicht signifikante Effekte zugunsten der Jungen. Keine statistisch relevanten Geschlechterunterschiede finden sich bei der integrativen Orientierung gepaart mit Ideal L4 Self (p-=-.908, d = -.029), der Häufigkeit der Freizeitaktivitäten auf Spanisch (p = .596, d = .112), der genderstereotyp weiblichen Wahrnehmung des Spanischen (p = .920, d = .022), welche bei beiden Geschlechtergruppen eher niedrig ausgeprägt ist, und dem SFS Selbstkonzept (p = .617, d = .104; vgl. Tabelle 74). Schließlich finden sich signifikante Unterschiede bei der Verteilung der Interessensgebiete von Jungen und Mädchen innerhalb des Spanischunterrichts: Während sich die Jungen tendenziell mehr für die Geschichte Spaniens, Sport und Politik interessieren, finden sich bei den Mädchen höhere prozentuale Häufigkeiten bei den Interessensgebieten Arbeitswelt, Natur und Umwelt, Regionen und Städte 440 11 Auswertung der Ergebnisse Spaniens, Immigration und Integration, Schüleraustausch, Essensgewohnheiten und typische Gerichte, Leben der Jugendlichen, spanische Musik, spanisches Kino, spanische Lektüren/ Literatur und andere spanischsprachige Gebiete (vgl. Abbildung 33). 11.7.7 Ergebnisse bezüglich der wahrgenommenen exogenen Faktoren in Spanisch Bei den wahrgenommenen exogenen Faktoren lassen sich in der Spanischs‐ tichprobe keinerlei signifikante Geschlechterunterschiede messen, jedoch einzelne schwache Effekte. Bei der Prüfung auf statistische Unterschiede bei den wahrgenommenen Erwartungen und Unterstützungsmaßnahmen der Spanischlehrkräfte wird bei der wahrgenommenen Unterstützung beim Mann-Whitney-U-Test ein schwacher Effekt zugunsten der Jungen gemessen (p = .121, d = .321; vgl. Tabelle 75). Jedoch findet sich bei der wahrgenommenen Erwartung durch die Spanischlehrkraft mittels eines t-Tests kein statistisch relevanter Geschlechterunterschied (p = .463, d = -.182; vgl. Tabelle 75), was bedeutet, dass die Jungen und Mädchen ein vergleichbar hohes Maß an Un‐ terstützung durch ihre jeweiligen Spanischlehrkräfte wahrnehmen. Trotzdem sind sich Jungen und Mädchen darüber einig, dass die Aufmerksamkeitsver‐ teilung der Spanischlehrkräfte eher zugunsten der Mädchen ausfällt, da die Mediane bei diesem Konstrukt bei beiden Geschlechtergruppen sehr hoch ausfallen, jedoch kein statistisch relevanter Geschlechterunterschied mittels eines Mann-Whitney-U-Tests messbar ist (Mdn (w) = 3.667, M (m) = 3.333; p-=-.783, d-= .055; vgl. Tabelle 75). Im Gegensatz zu den Ergebnissen bezüglich der Erwartungs- und Unterstüt‐ zungshaltungen der Spanischlehrkräfte, welche wie gesagt tendenziell Vorteile zugunsten der Jungen zeigen, ist der größte Effekt innerhalb des Ought-to L4 Self bei der wahrgenommenen Erwartung durch die Peers auszumachen: Die weib‐ lichen Spanischlernerinnen nehmen mit einem schwachen, nicht signifikanten Effekt höhere Erwartungen durch ihre Peers wahr als die Jungen (p = .066, d-=-.461; vgl. Tabelle 75). Abschließend zeigt sich, dass bei den wahrgenommenen Erwartungen der Eltern keinerlei statistisch relevante Unterschiede zwischen den beiden Merk‐ malsgruppen vorliegen (p-=-.532, d-=-.129; vgl. Tabelle 75). 11.7 Ergebnisse bezüglich der endogenen und wahrgenommenen exogenen Faktoren 441 Spanischstichprobe Skala - n Mdn M Rang M- SD - Ergebnis des t-Tests/ Mann-Whitney- U-Tests Wahrgenom‐ mene Unter‐ stützung durch die Spani‐ schlehrkraft w 73 3.250 45.18 3.074 .688- U = 597.000 Z = -1.551 p = .121 d = .321 m 21 3.750 55.57 3.286 .717 ges 94 3.250 - 3.122 .697 - Wahrgenom‐ mene Erwar‐ tungen der Spa‐ nischlehrkraft w 73 3.000 45.84 3.169 .438- t (92) = -.736 p = .463 d = -.182 KI 95% für d [-.675, .310] m 21 3.333 53.29 3.254 .557 ges 94 3.000 - 3.288 .465 - Wahrg. Auf‐ merksamkeits‐ verteilung der Spanischlehr‐ kraft zu‐ gunsten der Mädchen w 73 3.667 47.90 3.457 .531- U = 737.000 Z = -.275 p = .783 d = .055 m 21 3.333 46.10 3.460 .428 ges 94 3.667 - 3.457 .508 - Wahrgenom‐ mene Erwar‐ tungen der Peers w 73 2.667 50.15 2.671 .602 t (92) = 1.860 p = .066 d = .461 KI 95% für d [-.036, .957] m 21 2.333 38.29 2.373 .789 ges 94 2.667 - 2.605 .656 - Wahrgenom‐ mene Erwar‐ tungen der El‐ tern w 73 2.000 46.56 2.030 .530 U = 698.000 Z = -.625 p = .532 d = .129 m 21 2.200 50.76 2.155 .684 ges 94 2.000 - 2.057 .566 - Anmerkungen. Werte von p < .05 werden als signifikant definiert. Tabelle 75: Medianwerte (Mdn), mittlere Ränge (M Rang ), Mittelwerte (M), Standardabwei‐ chungen (SD) und Ergebnisse der t-Tests bzw. Mann-Whitney-U-Tests zu den wahrge‐ nommenen exogenen Faktoren in der Spanischstichprobe, aufgeteilt nach Geschlecht Insgesamt fallen die Werte zu den wahrgenommenen exogenen Faktoren in der Spanischstichprobe weitestgehend ähnlich aus wie in der Französischstich‐ 442 11 Auswertung der Ergebnisse probe. Der einzige deutliche Unterschied besteht in den wahrgenommenen Erwartungen der Peers, die in der Spanischstichprobe (M = 2.605; vgl. Tabelle 75) insgesamt um einiges höher ausfallen als in der Französischstichprobe (M = 1.743; vgl. Tabelle 73), was darauf hindeutet, dass die Peers der Spa‐ nischstichprobe Spanischkenntnisse als wichtiger erachten als die Peers der Französischstichprobe das Französische. 11.7.8 Zwischenfazit: Antwort auf Forschungsfrage 4 für Spanisch Bezüglich der Wahrnehmung der Wirkung der Spanischlehrkräfte ergeben sich uneinheitliche Ergebnisse: Bei den wahrgenommenen Erwartungen der Spani‐ schlehrkraft (p = .463, d = -.182) werden vernachlässigbare Effekte gemessen, bei der wahrgenommenen Aufmerksamkeitsverteilung zugunsten der Mädchen ist ebenfalls kein Unterschied bei männlichen und weiblichen Spanischlernenden feststellbar (p = .783, d = .055), jedoch sind sich beide Geschlechtergruppen darüber einig, dass die Aufmerksamkeitsverteilung der Spanischlehrkräfte eher bei den Mädchen liegt, in Form einer verstärkt an Mädchen orientierten Themenauswahl und Aufmerksamkeitsfokussierung der Spanischlehrkräfte. Bei der wahrgenommenen Unterstützung durch die Spanischlehrkraft ist hingegen ein schwacher, nicht signifikanter Effekt zugunsten der männlichen Spanischlernenden messbar (p-=-.121, d-=-.321). Bezüglich der Erwartungen der Peers ist festzustellen, dass diese bei den Mädchen tendenziell höher ausfallen als bei den Jungen, auch wenn der Unter‐ schied nicht signifikant ist (p = .066, d = .461) und schließlich können bei den wahrgenommenen Erwartungen der Eltern bezüglich der Spanischleistungen keinerlei Geschlechterunterschiede gefunden werden (p = .532, d = .129; vgl. Tabelle 75). 11.8 Korrelationsanalysen Um alle Ergebnisse der Studie in Beziehung zu setzen, soll zunächst eine Prüfung des Zusammenhangs zwischen den einzelnen Variablen erfolgen. Diese wird für die Französischstichprobe und für die Spanischstichprobe erneut getrennt vorgenommen. Laut Schendera (2014: 7) müssen für die Beschreibung eines bivariaten Zusammenhangs mittels eines Pearson-Korrelationskoeffizienten die Variablen normalverteilt sein, um Signifikanztests durchführen zu können. Eine weitere Voraussetzung ist, dass die Variablen mindestens intervallskaliert oder aber 11.8 Korrelationsanalysen 443 220 Bei der Interpretation der Korrelationswerte muss bedacht werden, dass diese keine ein‐ seitige Kausalrichtung beschreiben, sondern immer zwei potentielle Wirkrichtungen beinhalten. Außerdem wird der Signifikanztest zum Korrelationskoeffizienten von der Größe der zugrundeliegenden Stichprobe beeinflusst, weshalb die Größe des Koeffizienten relevanter ist als der Signifikanzwert (vgl. Schendera 2014: 15). 221 Der Gesamtindex wurde gebildet, indem die Ergebnisse aus dem d2-R Test (Arbeits‐ tempo, Konzentrationsleistung und Sorgfalt des Arbeitens) sowie die Ergebnisse aus dem SPM Test (schlussfolgerndes Denken) z-standardisiert, addiert und durch vier geteilt wurden. dichotom sind. Da die erhobenen Variablen nicht alle annähernd normalverteilt sind und auch teilweise ordinalskalierte Daten vorliegen, wie z. B. bei der Häufigkeit der Freizeitaktivitäten oder bei der Länge des Auslandsaufenthalts, wird Spearmans Rho berechnet. 220 Insgesamt gilt zu berücksichtigen, dass bivariate Korrelationen keinesfalls alleinige verursachende Faktoren darstellen und daher keinerlei Monokau‐ salität angenommen werden kann, sondern von komplex-dynamischen Fak‐ torgeflechten auszugehen ist (vgl. Schendera 2014: 3-4). Erst Regressionsmo‐ delle geben Aufschluss über systematische Kausalbeziehungen, weshalb diese nach den Korrelationsanalysen und vor den Diskriminanzanalysen berechnet werden. Das „Netzwerkmodell der interaktiven Faktoren des genderbezogenen Fremdsprachenlernerfolgs“ (vgl. Kapitel 6), das aus dem Stand der Forschung abgeleitet wurde, soll als Grundlage für die Annahme eines Zusammenhangs zwischen den erhobenen Faktoren und der fremdsprachlichen Leistung dienen. Bei allen Korrelationsergebnissen wird daher inhaltlich stets überprüft, ob diese plausibel sind und theoriegeleitet begründet werden können oder ob es sich eventuell um Nonsenskorrelationen handelt. Für beide Stichproben werden die Korrelationen zwischen folgenden Varia‐ blen bestimmt: fremdsprachliche Gesamtleistung, Hörverstehen, Leseverstehen, Schreiben, Geschlecht, sprachlicher Hintergrund, sozioökonomischer Status (HISEI), Arbeitstempo (BZO), Konzentrationsleistung (KL), Sorgfalt der Arbeits‐ weise (F%), schlussfolgerndes Denken, kognitive Grundfertigkeiten (Gesamt‐ index) 221 , integrative Orientierung gepaart mit Ideal L3/ L4 Self, instrumentelle Orientierung, L3/ L4 WTC, Häufigkeit der Freizeitaktivitäten auf Französisch bzw. Spanisch, Interesse am Fach Französisch bzw. Spanisch, Einstellungen zur Zielkultur, genderstereotyp weiblichen Wahrnehmung des Französischen bzw. Spanischen, FFS bzw. SFS Selbstkonzept, L3bzw. L4-Angst, wahrgenommene Unterstützung durch die Lehrkraft, wahrgenommene Erwartungen der Lehr‐ kraft, wahrgenommene Aufmerksamkeitsverteilung zugunsten der Mädchen, wahrgenommene Erwartungen durch die Peers, wahrgenommene Erwartungen 444 11 Auswertung der Ergebnisse durch die Eltern und Länge des Aufenthalts in einem französischbzw. spanisch‐ sprachigen Land. 11.8.1 Korrelationsanalysen innerhalb der Französischstichprobe Im Anschluss sollen insbesondere diejenigen Korrelationen dargelegt werden, die im Zusammenhang mit dem Geschlecht, den fremdsprachlichen Leistungen in Französisch und dem Doing Gender stehen, welches zum einen die Unter‐ stützungs- und Erwartungshaltungen sowie die genderspezifische Aufmerk‐ samkeitsverteilung einzelner Sozialisationsinstanzen, aber auch die genderste‐ reotyp weibliche Wahrnehmung der französischen Sprache betrifft. Zuerst wird auf die Korrelationen der Gesamtleistung in den Französischtests eingegangen, bevor Hörverstehen, Leseverstehen und Schreiben separat auf Korrelationen analysiert werden. Die Gesamtleistung in den drei Französischtests korreliert signifikant mit dem Geschlecht (r s = -.22*), dem schlussfolgernden Denken (r s = .33**) und dem Gesamtindex der kognitiven Grundfertigkeiten (r s = .26*). Schwache, nicht signifikante positive Korrelationen werden zwischen der Gesamtleistung im Französischen und dem Arbeitstempo (BZO; r s = .19) sowie der Konzent‐ rationsleistung (KL; r s = .18) gemessen. Hingegen tritt keine signifikante Kor‐ relation zwischen der Sorgfalt der Arbeitsweise (F%) und der sprachlichen Gesamtleistung (r s = .05) auf. Daher kann die Sorgfalt der Arbeitsweise (F%), bei der zuvor ein signifikanter Geschlechterunterschied zugunsten der Jungen gemessen wurde (vgl. Kapitel 11.3.1), als signifikanter Prädiktor für die Franzö‐ sischleistung ausgeschlossen werden. Unter den affektiven Faktoren korrelieren integrative Orientierung gepaart mit Ideal L3 Self (r s -=-.20*), L3 WTC (r s =-.25*), Häufigkeit der Freizeitaktivitäten auf Französisch (r s = .29**), Interesse am Fach Französisch (r s = .22*) und FFS Selbstkonzept (r s = .44**) signifikant mit der sprachlichen Gesamtleistung in Französisch und schließlich weist auch die Länge des Auslandaufenthalts (r s = .24*) einen signifikanten Zusammenhang mit der Gesamtleistung im Französischen auf. Hingegen lassen sich nicht signi‐ fikante, aber schwache positive Korrelationen (vgl. Cohen et al. 2003) zwischen fremdsprachlicher Gesamtleistung und HISEI (r s = .15), instrumenteller Orien‐ tierung (r s = .10), Einstellungen zur Zielkultur (r s = .19) und wahrgenommener Unterstützung durch die Französischlehrkraft (r s = .13) feststellen. Außerdem korreliert die genderstereotyp weibliche Wahrnehmung des Französischen schwach, aber nicht signifikant (r s = -.13) mit der fremdsprachlichen Gesamt‐ leistung. Schließlich sind jeweils keine statistisch relevanten Korrelationen des sprachlichen Hintergrunds (r s = -.06), der L3-Angst (r s = -.06) und der anderen 11.8 Korrelationsanalysen 445 222 Zur Interpretation der Stärke des Korrelationskoeffizienten nach Spearman vgl. Cohen (1988: 79-81). 223 In der Dummykodierung wurden Mädchen mit 0 und Jungen mit 1 kodiert. Skalen des Ought-to L3 Self mit der sprachlichen Gesamtleistung in Französisch messbar, da zwischen diesen Variablen überall Korrelationswerte unter r s -< .10 vorliegen. 222 Betrachtet man die drei sprachlichen Fertigkeiten Hören, Lesen und Schreiben separat, so werden einzelne Unterschiede in den statistischen Zusam‐ menhängen ersichtlich: Die Hörverstehensleistung in Französisch korreliert nicht signifikant mit dem Geschlecht, was den gemessenen vergleichbaren Leistungen von Jungen und Mädchen bei dieser Teilfertigkeit entspricht (vgl. Kapitel 11.4.1.1). Die erreichte Leistung im Hörverstehen korreliert hingegen signifikant mit dem schlussfolgernden Denken (r s = .40**), dem Gesamtindex der kognitiven Grundfertigkeiten (r s = .22*), dem FFS Selbstkonzept (r s = .35*) und der Länge des Auslandsaufenthalts in französischsprachigen Ländern (r s = .27*). Die gemessene Leistung im Leseverstehen korreliert im Gegensatz zur Hörverstehensleistung signifikant mit dem Geschlecht (r s = -.21*), wobei der negative Zusammenhang bedeutet, dass die Korrelation zugunsten der Mädchen ausfällt. 223 Darüber hinaus gibt es einen signifikanten Zusammenhang der Le‐ seleistung in Französisch mit dem sozioökonomischen Status (HISEI) (r s -=-.23*) und dem FFS Selbstkonzept (r s = .35**). Folglich liegen für das Hörverstehen und für das Leseverstehen teilweise unterschiedliche mögliche Prädiktoren für die Leistung vor. Insbesondere der sozioökonomische Status zeigt nämlich keinerlei Korrelation mit dem Hörverstehen (r s -=--.01). Letztendlich korreliert die Schreibleistung in Französisch signifikant mit der Variable Geschlecht (r s = -.22*) und darüber hinaus mit dem schlussfol‐ gernden Denken (r s = .33**), dem Gesamtindex der kognitiven Grundfertigkeiten (r s = .29*), der integrativen Orientierung gepaart mit dem Ideal L3 Self (r s = .26*), der L3 WTC (r s = .32**), dem Interesse am Fach Französisch (r s = .28**), den Einstellungen zur französischen Zielkultur (r s = .24*), dem FFS Selbstkonzept (r s = .46**) und der Länge des Auslandsaufenthalts in französischsprachigen Ländern (r s = .29**). Bei der Schreibleistung zeigt sich im Gegensatz zur Leseleistung lediglich eine schwache, nicht signifikante Korrelation mit dem sozioökonomischen Status (r s -=-.14). Betrachtet man die Faktoren, die mit dem Geschlecht korrelieren, so findet man zugunsten der Mädchen neben den Leistungen im Leseverstehen, im Schreiben und im gesamten Französischtest sowohl die Häufigkeit der Freizeit‐ 446 11 Auswertung der Ergebnisse aktivitäten auf Französisch (r s = -.35*) als auch das Interesse am Fach Französisch (r s -=--.21*) als signifikante Korrelationen vor. Nachdem die Korrelationen mit den sprachlichen Leistungen präzise do‐ kumentiert wurden, erfolgt nun eine Dokumentation der Korrelationen der Variable Geschlecht, welche über die bereits festgestellten Korrelationen mit der Gesamtleistung, der Leseverstehensleistung und dem Schreiben hinausgeht: Ein signifikanter Zusammenhang liegt zwischen dem Geschlecht und der Sorgfalt der Arbeitsweise (F%; r s = .27*) vor, wobei dieser zugunsten der Jungen ausfällt. Zugunsten der Mädchen liegen signifikante Korrelationen mit der Häufigkeit der Freizeitaktivitäten auf Französisch (r s = -.35*) und mit dem Interesse am Fach Französisch (r s = -.21*) vor. Dies entspricht den signifikanten Unterschieden zwischen den beiden Geschlechtergruppen, die in den Kapiteln 11.3.1 und 11.7.1 gemessen wurden. Alle anderen Korrelationen mit der Variable Geschlecht sind nicht signifikant, jedoch weisen integrative Orientierung gepaart mit Ideal L3 Self (r s = -.16), L3 WTC (r s = -.11), Einstellungen zur Zielkultur (r s = -.15) und L3-Angst (r s = -.15) schwache, nicht signifikante Korrelationen mit dem Geschlecht zugunsten der Mädchen auf. Die wahrgenommenen Erwartungen der Eltern (r s = .18) korrelieren schwach, aber nicht signifikant positiv mit dem Geschlecht zugunsten der männlichen Französischlernenden. Weitere für das Forschungsziel der Arbeit relevante Zusammenhänge werden im Rahmen der gezielten Analyse von Unterschieden und Gemeinsamkeiten der Korrelati‐ onsmatrizen der beiden Geschlechtergruppen im Anschluss dokumentiert und analysiert (vgl. Kapitel 11.10). 11.8.2 Korrelationsanalysen innerhalb der Spanischstichprobe In Spanisch korreliert die Gesamtleistung in den Sprachtests signifikant mit der L4 WTC (r s = .36**), dem Interesse am Fach Spanisch (r s = .36**), dem SFL Selbstkonzept (r s -=-.50**) und der L4-Angst (r s -=--.23*). Die Leistung im Hörverstehenstest weist ebenfalls signifikante Zusammen‐ hänge mit der L4 WTC (r s = .22**), dem Interesse am Fach Spanisch (r s -=-.24**), dem SFL Selbstkonzept (r s = .29**) und der L4-Angst (r s = -.22*) auf. Außerdem besteht ein signifikanter Zusammenhang zum schlussfolgernden Denken (r s -=-.31**). Die Leseverstehensleistung weist signifikante Korrelationen mit dem Inter‐ esse am Fach Spanisch (r s = .26*) und dem SFS Selbstkonzept (r s = .32**) auf. Außerdem besteht ein signifikanter negativer Zusammenhang mit der genderstereotyp weiblichen Wahrnehmung des Spanischen (r s = -.28*) und ein signifikanter positiver Zusammenhang mit der wahrgenommenen Aufmerk‐ 11.8 Korrelationsanalysen 447 samkeitsverteilung zugunsten der Mädchen (r s = .26*). Insbesondere bei den letzten beiden Korrelationen könnte es sich um Nonsenskorrelationen handeln, weshalb die geschlechtsspezifischen Korrelationen hierzu im Anschluss inner‐ halb der Regressionsanalysen genauer bezüglich deren Prädiktorstärke für die Leseleistung analysiert werden (vgl. Kapitel 11.9.3.3). Die Schreibleistung in Spanisch korreliert schließlich signifikant positiv mit der L4 WTC (r s = .35**), dem Interesse am Fach Spanisch (r s = .36*) und dem SFS Selbstkonzept (r s = .55**). Außerdem wird ein signifikanter negativer Zusammenhang der Schreibleistung zur L4-Angst (r s -=--.27*) gemessen. Bezüglich des Geschlechts korreliert die Leistung im Hörverstehen lediglich schwach, aber nicht signifikant positiv mit Geschlecht (r s = .15), was bedeutet, dass die Jungen hier tendenziell etwas bessere Ergebnisse erzielen. In den beiden Teilkompetenzen Befolgung des Arbeitsauftrags und Inhalt 1 des zweiten Ratings des Schreibtests ist außerdem eine signifikante negative Korrelation des Geschlechts messbar, da in beiden Teildisziplinen die Mädchen signifikant höhere Ergebnisse erzielten (vgl. Kapitel 11.4.3.2). Das Geschlecht korreliert außerdem signifikant negativ mit den Einstel‐ lungen zur Zielkultur (r = -.23*) und der L4-Angst (r = -.22*), was bedeutet, dass die Mädchen tendenziell positivere Einstellungen gegenüber der spanischen Zielkultur besitzen und gleichzeitig tendenziell mehr L4-Angst verspüren. Auch bei diesen beiden affektiven Faktoren wurden in Kapitel 11.7.5 signifikante Unterschiede zugunsten der Mädchen gefunden. Auffällig ist also, dass, im Gegensatz zum Französischen, keine signifikanten Korrelationen der einzelnen Teilleistungen oder der sprachlichen Gesamtleis‐ tung mit dem HISEI vorliegen. Außerdem gibt es lediglich eine signifikante Korrelation des schlussfolgernden Denkens mit der Hörverstehensleistung. An‐ sonsten treten keine signifikanten Zusammenhänge zwischen den sprachlichen Leistungen und den kognitiven Grundfertigkeiten auf. Insgesamt zeigt sich also, dass die signifikanten Korrelationen der Spanischleistungen sich vor allem im Bereich der affektiven Faktoren ansiedeln und nur vereinzelt im Bereich des Ought-to L4 Self oder in den kognitiven Grundfertigkeiten. Weitere für das Forschungsziel der Arbeit relevante Zusammenhänge werden im Rahmen der gezielten Analyse von Gemeinsamkeiten und Unterschieden der Korrelationsmatrizen der beiden Geschlechtergruppen dokumentiert und analysiert (vgl. Kapitel 11.10.3). 448 11 Auswertung der Ergebnisse 224 Als Prädiktoren bezeichnet man Variablen, die zur Vorhersage einer Kriteriumsvariable dienen können (vgl. Bortz/ Schuster 2010: 179) und ein Regressionsmodell erklärt sowohl die Stärke als auch die Richtung des Einflusses der jeweiligen Prädiktoren auf die Kriterien (vgl. Fromm 2012: 83). 225 Während einfache lineare Regressionen den Zusammenhang von einer unabhängigen Variablen (Prädiktor) und einer abhängigen Variable (Kriterium) untersuchen werden, werden multiple lineare Regressionen dafür eingesetzt, den Zusammenhang zwischen zwei und mehr unabhängigen Variablen und einer abhängigen Variable zu untersuchen. Voraussetzung für eine multiple lineare Regression sind eine abhängige Variable (Kri‐ terium), welche mindestens intervallskaliert ist, und mehrere unabhängige Variablen (Prädiktoren), die entweder dichotome Variablen darstellen oder intervallskaliert sind (vgl. Schendera 2014: 132). 11.9 Regressionsanalysen Die Frage stellt sich nun, welche Faktoren jeweils für Französisch und Spanisch die größte Prädiktorstärke 224 aufweisen und ob in diesem Zusammenhang auch das Geschlecht einen gewissen Teil der Varianz in der fremdsprachlichen Leis‐ tung in den beiden romanischen Fremdsprachen erklärt (vgl. Forschungsfrage 5). Daher werden im Anschluss einige lineare Regressionsanalysen durchge‐ führt. 225 Ziel ist es dabei, Regressionsmodelle zu finden, die eine möglichst hohe Varianzaufklärung bezüglich der jeweiligen fremdsprachlichen Leistungen geben. Bevor die Einhaltung der Voraussetzungen für lineare Regressionsanalysen überprüft wird, werden die Daten folgendermaßen aufbereitet: Die dichotome Variable Geschlecht behält ihre Dummykodierungen bei (Geschlecht: 0 = weiblich, 1 = männlich). Fälle, bei denen fehlende Werte auftreten, werden nicht durch Imputation vervollständigt, sondern listenweise ausgeschlossen. Eine Ausnahme hiervon bildet der sozioökonomische Status (HISEI), bei dem eine Imputation vorgenommen wird, indem die fehlenden Werte durch die in der jeweiligen Stichprobe erzielten Mittelwerte des HISEI ersetzt werden (Döring/ Bortz 2016: 584 ff.). Insgesamt machten, bezogen auf beide Stichproben, 11 Probandinnen und Probanden keinerlei Angaben zu den Berufen und Tä‐ tigkeiten ihrer Eltern, deren fehlende Angaben durch Imputationen ergänzt werden (vgl. Oesch 2017: 162). Um eine multiple lineare Regression durchführen zu können, müssen zunächst einige grundlegende Voraussetzungen erfüllt werden (vgl. Bühner/ Ziegler 2009: 665 ff.; Schendera 2014: 103 ff): Die Stichprobe muss ausreichend groß sein und die Anzahl der untersuchten Fälle darf keinesfalls kleiner sein als die Anzahl der Prädiktoren. Green (1991) entwickelte die Schätzgleichung, die anfangs in der Poweranalyse berücksichtigt wurde: n ≥ (8/ f ²) + (m-1). 11.9 Regressionsanalysen 449 Die Poweranalyse vor der Erhebung ergab, dass für eine mittlere Effektstärke f 2 = .15 und eine Stichprobengröße von n = 74 zehn Prädiktoren in ein multiples lineares Regressionsmodell aufgenommen werden können (vgl. Kapitel 8.2). Eine erneute Poweranalyse bekräftigt, dass man bei der Stichprobengröße der Französischlernenden von n = 87 (MV = 5), einer statistischen Power von .9 und einem Signifikanzniveau von p < .05 bei zehn Prädiktoren einen Determi‐ nationskoeffizienten von R² = .119 für ein signifikantes und daher verwendbares Ergebnis bräuchte. Bei der Stichprobengröße der Spanischlernenden von n = 94 und einer statistischen Power von .9 sowie einem Signifikanzniveau von p < .05 bräuchte man bei 10 Prädiktoren einen Determinationskoeffizienten von R² = .196 für ein signifikantes Gesamtmodell (vgl. Hemmerich 2019). Sowohl beim R²-Wert der Spanischstichprobe als auch beim R²-Wert der Französischs‐ tichprobe würde es sich dann entsprechend um einen mittleren Effekt nach Cohen (1992) handeln. Eine weitere Voraussetzung für multiple lineare Regression ist, dass eine Zufallsstichprobe vorliegt. Bei der vorliegenden Studie handelt es sich allerdings um Daten aus Schulklassen und somit, wie bereits in Kapitel 11.2 erläutert, um Klumpenstichproben, bei denen die Zugehörigkeit zur Klasse durch Fak‐ toren wie den Schulsprengel, die Unterrichtsmethodik und Erwartungshaltung der Lehrperson oder auch die Klassengröße Einfluss nehmen. Daher muss zunächst geklärt werden, ob die Daten hierarchisch interpretiert werden müssen oder nicht (vgl. Rost 2013: 112 ff.). Diese Klärung wird vorgenommen indem die beiden Stichproben jeweils auf Intraklassenkorrelation übersucht werden, welche die Bedeutsamkeit der Gruppenzugehörigkeit bestimmen und als „Verhältnis der Varianz zwischen den Clustern […] zur Gesamtvarianz“ definiert wird (vgl. Geiser 2011: 204). Der Intraclass Correlation Coefficient (ICC, angegeben als ρ IC ) wird berechnet, indem der Varianzwert zwischen den Clustern (Level-2-Varianz σ 2B , wobei „B“ für between clusters steht), durch die Gesamtvarianz (σ 2W + σ 2B ) geteilt wird, wobei „W“ für within clusters steht (vgl. Geiser 2011: 204). Sowohl die Varianz zwischen den Clustern als auch die Ge‐ samtvarianz werden in IBM SPSS 26 mittels zweifaktorieller Analyse in linearen gemischten Modellen berechnet (vgl. Bühl 2019: 556). Der ICC wird anschließend händisch ausgerechnet und über IBM SPSS 26 wird der Signifikanzwert der Wald-Z-Statistik abgerufen, der angibt, ob die Varianz signifikant ist oder nicht. Für die fremdsprachliche Gesamtleistung in Französisch (Hörverstehen, Leseverstehen, Schreiben) ergibt sich daher die Berechnung ρ IC = .048 / (1.026 + .048) = .045, was bedeutet, dass 4.5% der Varianz durch die Aufteilung in Schulklassen erklärt werden. Da der Wald-Z-Wert von .654 nicht signifikant ist 450 11 Auswertung der Ergebnisse 226 Linearität ist dann gegeben, wenn eine lineare Anordnung der Messwertpaare vorliegt, die Streuung um die Korrelationsgerade möglichst gering ist und keine Ausreißer vorhanden sind, die die Korrelation verzerren (vgl. Schendera 2014: 7). Ein signifikantes Ergebnis der Korrelationsanalyse ist kein Beweis für Linearität, vielmehr ist die Linearität eine Voraussetzung für die Berechnung der Korrelation nach Pearson (vgl. Schendera 2014: 21-22). Die Linearität wird stets mithilfe von IBM SPSS 26 mittels eines Streudiagramms überprüft. 227 Die Cook-Distanz wird definiert als die „durchschnittliche quadratische Abweichung zwischen den Schätzwerten des vollen und des um die eine Beobachtung reduzierten Datensatzes im Verhältnis zum mittleren quadratischen Fehler im geschätzten Modell“ (Schendera 2014: 112). (p = .513), kann die Nullhypothese, dass keine signifikanten Niveauunterschiede der Französischleistung zwischen den Klassen bestehen, beibehalten werden. Für die fremdsprachliche Gesamtleistung in Spanisch (Hörverstehen, Lese‐ verstehen, Schreiben) wird dieselbe Berechnung vorgenommen: ρ IC = .051 / (.865 + .051) = .056. Das Ergebnis bedeutet, dass 5.6% der Varianz der fremdsprach‐ lichen Gesamtleistung im Spanischen durch die Aufteilung in Schulklassen erklärt werden. Da der Wald-Z-Wert von .742 nicht signifikant ist (p = .458), kann die Nullhypothese, dass keine signifikanten Niveauunterschiede zwischen den einzelnen Schulklassen bestehen, auch im Falle der Spanischleistungen beibe‐ halten werden. Somit müssen in beiden Fällen keine Mehrebenenanalysen, die die Varianz zwischen den Schulklassen berücksichtigen, angewendet werden. Eine weitere Voraussetzung für die multiple lineare Regression besteht darin, dass eine lineare Beziehung zwischen den Prädiktoren und dem Kri‐ terium vorliegen muss und nicht etwa eine u-förmige oder j-förmige (vgl. Tachtsoglou/ König 2017: 215). 226 Zudem sollte darauf geachtet werden, dass keine Ausreißer in das Modell mit aufgenommen werden. Somit werden die studentisierten ausgeschlossenen Residuen (SDR) auf potenzielle Ausreißer untersucht, wobei Werte ± 3 potentielle Ausreißer darstellen (vgl. Schendera 2014: 65). In Französisch stellt Fall 081 einen solchen Ausreißer dar, da dessen studentisierte ausgeschlossene Residuen bei den meisten der durchgeführten Regressionsanalysen meist über 3 liegen. Daher wird dieser Fall aus den Regressionsanalysen in Französisch ausgeschlossen. In der Spanischstichprobe werden keine Ausreißer bei den studentisierten ausgeschlossenen Residuen festgestellt. Auch die Cook-Distanz 227 ist ein Maß, das den Einfluss eines einzelnen Falls auf das gesamte Modell angibt, da sie misst, wie stark sich die Regressionsgerade verändern würde, wenn der jeweilige Fall ausgeschlossen würde. Hier gelten Werte größer als 1 als Ausreißer (vgl. Cohen et al. 2003: 404; Schendera 2014: 112). Der höchste Wert in der Französischstichprobe beträgt in den verschiedenen Regressionsmodellen, die im Anschluss inhaltlich analysiert 11.9 Regressionsanalysen 451 228 Schließlich sind besonders hohe Hebelwerte, welche den Einfluss eines Punktes in der x-Dimension auf die Anpassung der Regression messen, ein Anzeichen für Ausreißer. Hebelwerte können zwischen 0 und (n-1)/ n liegen. Je höher der Wert, desto höher die Hebelwirkung. Fälle mit hohen Hebelwerten müssen ebenfalls eventuell entfernt werden (vgl. Cohen et al. 2003: 395 ff.; Schendera 2014: 64). Für Französisch können die Hebelwerte für Modell 4 zwischen 0 und (n-1)/ n, also (80-1)/ 80 = 0.98 liegen (vgl. Cohen et al. 2003: 395 ff.; Schendera 2014: 64). Das Minimum der Hebelwerte liegt in der Französischstichprobe bei Regressionsmodell 4 bezüglich der Gesamtleistung bei .008 und das Maximum bei .166. Daher müssen auch aufgrund der Hebelwerte keine weiteren Fälle aus der Französischstichprobe entfernt werden. 229 Multikollinearität ist dann gegeben, wenn zwei (oder mehr) Prädiktoren hoch und linear miteinander korrelieren, wodurch der eine Prädiktor den anderen mitbestimmt und im Extremfall sogar ersetzen könnte. Multikollineare Modellgleichungen lassen sich nicht mehr interpretieren, da sie stark verzerrt sind und die Regressionskoeffizienten werden eventuell sogar mit erwartungswidrig umgekehrten Vorzeichen ausgegeben (vgl. Schendera 2014: 104). werden, .114 (Fall 081) und der höchste Wert der Spanischstichprobe .090 (Fall 1039). Somit werden basierend auf den Cook-Distanzen keine Ausreißer gefunden und entsprechend keine weiteren Fälle ausgeschlossen. 228 Außerdem ist darauf zu achten, dass eine statistische Unabhängigkeit der unabhängigen Variablen untereinander gegeben ist und keine Multikollinearität vorliegt (vgl. Schendera 2014: 104). 229 Da die erhobenen affektiven Faktoren naturgemäß untereinander mehr oder weniger stark korrelieren, wird diese Voraussetzung in den folgenden Regressionsanalysen besonders im Blick be‐ halten. Da die Stichproben relativ klein sind, können daher meist nur ein bis zwei endogene affektive Faktoren in die Modelle als Prädiktoren aufgenommen werden, wobei bei Korrelation mit der unabhängigen Variable mit mehreren endogenen affektiven Faktoren immer die stärksten Prädiktoren herausgefiltert werden. In Französisch liegt beispielsweise bei Modell 5 (vgl. Tabelle 76) bezüg‐ lich der Gesamtleistung, bei welchem es sich um das größte Modell handelt, keinerlei Multikollinearität vor, da lediglich ein affektiver Faktor, nämlich das FFS Selbstkonzept berücksichtigt wird (vgl. Schendera 2014: 104). Daher kann dieses Modell ohne Gefahr von Verzerrungen durch Interkorrelationen beschrieben und interpretiert werden. Die weiteren Voraussetzungen in Form von Homogenität der Varianzen (Homoskedastizität) und Normalverteilung der Residuen werden mithilfe von Streudiagrammen und P-P-Plots überprüft (vgl. Schendera 2014: 134). Die Streu‐ diagramme zeigen eine relativ gleichmäßige Verteilung über die horizontale Achse sowie eine relativ homogene Dichte der Punkte, was auf eine ausgeprägte Varianzgleichheit hindeutet, und die P-P-Plots visualisieren eine weitgehende Normalverteilung der Residuen (vgl. Anhang 8.1 für die graphischen Darstel‐ 452 11 Auswertung der Ergebnisse 230 Der Index wurde gebildet, indem zunächst die standardisierten Werte von BZO, KL, F% des d2-R-Test und diejenigen der allgemeinen Intelligenz des SPM-Test z-standardisiert werden. Anschließend wird ein Index gebildet, indem alle vier z-standardisierten Werte addiert und durch vier geteilt werden (vgl. zur Indexbildung Kuckartz et al. 2013: 242). lungen zu Modellen 4 und 5 für die Gesamtleistung in Französisch, vgl. Tabelle 76; Anhang 8.3 für Modell 2 für die Gesamtleistung in Spanisch, vgl. Tabelle 81). Bei der Untersuchung auf Homoskedastizität der Residuen wird zudem mittels einer graphischen Analyse untersucht, ob das Regressionsmodell gleich gute Vorhersagen über alle Werte hinweg macht. Dies wird stets mithilfe von Streu‐ diagrammen zwischen den studentisierten Residuen und den unstandardisierten vorhergesagten Werten graphisch analysiert. 11.9.1 Regressionsanalysen zu den Leistungen in Französisch Um die Forschungsfrage 5 beantworten zu können, wie groß die Prädiktorstärke des Geschlechts in Relation zu anderen Prädiktoren bezüglich der Gesamtleis‐ tung im Französischen sowie bezüglich der Teilfertigkeiten Leseverstehen, Hörverstehen und Schreiben ist, werden nun unter Berücksichtigung der oben genannten Voraussetzungen entsprechende einfache und multiple lineare Re‐ gressionsanalysen durchgeführt. Dabei stehen vor allem Geschlecht, HISEI, kognitive Grundfertigkeiten 230 und FFS Selbstkonzept als mögliche Prädiktoren im Fokus der Analysen, da diese oft in statistisch relevanten Zusammenhängen zu den fremdsprachlichen Leistungen stehen, was in den Korrelationsanalysen ersichtlich wurde (vgl. Kapitel 11.8.1). Beispielsweise zeigte der sprachliche Hintergrund im Rahmen der Korrelationsanalysen weder zur Gesamtleistung in Französisch noch zu den einzelnen gemessenen Teilfertigkeiten statistisch relevante Zusammenhänge, weshalb dieser nicht als möglicher Prädiktor für die jeweiligen Leistungsbereiche infrage kommt (vgl. Anhang 7.1). - 11.9.1.1 Regressionsanalysen zum Gesamtergebnis in Französisch Als mögliche Prädiktoren ergeben sich aus den Korrelationsanalysen (vgl. Kapitel 11.8.1) für die Gesamtleistung in Französisch sowohl das Geschlecht als auch das schlussfolgernde Denken, der Gesamtindex der kognitiven Grundfer‐ tigkeiten, die integrative Orientierung gepaart mit dem Ideal L3 Self, L3 WTC, die Häufigkeit der Freizeitaktivitäten auf Französisch, das Interesse am Fach Französisch, das FFS Selbstkonzept und die Länge des Auslandsaufenthalts. Außerdem wird der HISEI aufgenommen, welcher, nachdem Fall 081 entfernt wurde, nach Pearson signifikant mit der sprachlichen Gesamtleistung korreliert (r = .21*) und nach Spearman knapp nicht signifikant ist (r s = .18, p = .086). 11.9 Regressionsanalysen 453 Da bezüglich der Gesamtleistung keine signifikanten Interaktionen zwischen sozioökonomischem Status und Geschlecht oder zwischen sprachlichem Hinter‐ grund und Geschlecht festgestellt wurden, werden diese Moderatorenvariablen auch nicht als unabhängige Variablen in die Regressionsmodelle aufgenommen (vgl. Kapitel 11.6.1). Dabei entstehen folgende Modelle (vgl. Tabelle 76): Abhängige Variable: Gesamt‐ ergebnis in den Französisch‐ tests - - B SE (B) β p Korrigiertes R² Modell 1 (n = 91) Konstante 46.793 .985 - .000 .053 (p = .016) Geschlecht -3.622 1.485 -.25 .016 Modell 2 (n = 91) - Konstante 41.959 2.57 - .000 .085 (p = .007) Geschlecht HISEI -3.622 .077 1.46 .04 -.25 .21 .015 .045 Modell 3 (n = 80) Konstante 41.748 2.580 - .000 .182 (p = .000) Geschlecht HISEI Ind. kog. Gr.f. -3.439 .095 3.888 1.510 .038 1.145 -.23 .25 .35 .026 .016 .001 Modell 4 (n = 80) Konstante 32.540 3.438 - .000 .301 (p = .000) Geschlecht HISEI Ind. kog. Gr.f. FFS Selbstk. -3.011 .076 3.130 3.761 1.401 .036 1.078 1.011 -.20 .20 .28 .36 .035 .036 .005 .000 Modell 5 (n = 77) - Konstante 28.876 4.132 - .000 .313 (p = .000) Geschlecht HISEI Ind. kog. Gr.f. FFS Selbstk. Häufig. d. Freiz. -2.488 .081 2.871 3.890 1.832 1.511 .038 1.119 1.066 1.602 -.18 .20 .25 .36 .12 .104 .036 .012 .000 .257 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²); Kodierungen der dichotomen Variablen: Geschlecht: 0 (weiblich), 1 (männlich). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstel‐ lungsweise gemäß DGPs (2019: 86). Tabelle 76: Regressionsmodelle 1 bis 5 zum Gesamtergebnis in Französisch 454 11 Auswertung der Ergebnisse 231 Nach Cohen (1988, 1992: 155-159) besitzt ein R² = .02 eine geringe Varianzaufklärung, R² = .13 eine mittlere Varianzaufklärung und R² = .26 eine hohe Varianzaufklärung. Modell 1 (vgl. Tabelle 76) zeigt, dass das Geschlecht (β = -.25*) einen signifikanten Prädiktor für die sprachliche Gesamtleistung im Französischen darstellt, der allerdings in isolierter Form lediglich eine geringe Varianzaufklärung der sprachlichen Gesamtleistung in Französisch leistet (vgl. Cohen 1988, 1992) 231 : Das korrigierte R² liegt bei .053. Somit erklärt das Geschlecht in isolierter Betrachtung lediglich 5.3% der Varianz der Gesamtleistung in den Französisch‐ tests. Der negative Regressionskoeffizient (B = -3.622) bedeutet aufgrund der Dummykodifizierung des Geschlechts, bei der Mädchen den Wert 0 und Jungen den Wert 1 annehmen, dass die Mädchen im Durchschnitt 3.622 Punkte mehr in der Gesamtwertung erzielen als die Jungen. In Modell 2 (vgl. Tabelle 76) liegt neben dem signifikanten dichotomen Prädiktor Geschlecht der signifikante kontinuierliche Prädiktor sozioökonomi‐ scher Status (HISEI) vor. Der Regressionskoeffizient für das Geschlecht (B = -3.622) bleibt konstant im Vergleich zu Modell 1. Außerdem steigt die gesamte fremdsprachliche Leistung in Französisch pro Erhöhung um eine HISEI-Einheit, welche Werte zwischen 10 und 90 annehmen kann (vgl. Ganzeboom/ Treiman 2019), um .077 Punkte. Betrachtet man die standardisierten Koeffizienten β des zweiten Modells, wird deutlich, dass das Geschlecht (β = -.25*) einen etwas größeren Einfluss auf die Gesamtleistung im Französischen hat als der sozioökonomische Status (HISEI, β = .21*). Der korrigierte multiple Determi‐ nationskoeffizient R² von .085 zeigt jedoch, dass die Varianzaufklärung nach Cohen (1988, 1992) durch Modell 2 immer noch schwach ist: Lediglich 8.5% der Varianz der Gesamtleistung in Französisch werden durch die beiden Faktoren Geschlecht und sozioökonomischer Status erklärt. Modell 3 (vgl. Tabelle 76), das neben dem Geschlecht und dem sozioöko‐ nomischen Status (HISEI) den Index der kognitiven Grundfertigkeiten als signifikanten Prädiktor einschließt, veranschaulicht, dass, aufgrund des Hinzu‐ fügens dieses Prädiktors der Einfluss des Geschlechts im Vergleich zu Modell 2 leicht abnimmt und durchschnittlich noch 3.439 Punkte mehr aufgrund des weiblichen Geschlechts erzielt werden. Sowohl der HISEI (β = .25*) als auch die kognitiven Grundfertigkeiten (β = .35**) haben bei diesem Modell einen größeren Einfluss auf die sprachliche Gesamtleistung im Französischen als das Geschlecht (β-= -.23*). Insgesamt werden 18.2% der Varianz der fremdsprachli‐ chen Gesamtleistung in Französisch durch Geschlecht, HISEI und die kognitiven 11.9 Regressionsanalysen 455 232 Verwendet man anstelle des Gesamtindex der kognitiven Leistungen ausschließlich das schlussfolgernde Denken (vgl. Anhang 8.2, Modell 3a), erhöht sich der Anteil der Varianzaufklärung des Geschlechts (β = -.26*) leicht, während der Anteil des HISEI (β = .17) sinkt und dadurch nicht mehr signifikant ist und das schlussfolgernde Denken (β-= .29**) nimmt den größten Anteil ein. Jedoch liegt das korrigierte R² dieses Modells lediglich bei .145 und somit niedriger als in Modell 3. 233 In Modell 4a (vgl. Anhang 8.2) wurde anstelle des Gesamtindex der kognitiven Grund‐ fertigkeiten das schlussfolgernde Denken (SPM) als Prädiktor aufgenommen. Dabei zeigt sich, dass sowohl der Prädiktor Geschlecht (β = -.15) als auch der HISEI (β = .13) in ihren Anteilen der Erklärung der Gesamtvarianz verringert werden und keine signifi‐ kanten Prädiktorvariablen mehr darstellen und sowohl das schlussfolgernde Denken (β-=-.25*) als auch das FFS Selbstkonzept (β-=-.37**) als signifikante Prädiktorvariablen fungieren. Allerdings ist bei Modell 4a die Varianzaufklärung mit einem korrigierten R² von .278 geringer als in Modell 4. Grundfertigkeiten erklärt, wodurch es sich nach Cohen (1988, 1992) um eine mittlere Varianzaufklärung handelt. 232 Modell 4 (vgl. Tabelle 76) belegt, dass das FFS Selbstkonzept zusätzlich zu Geschlecht, sozioökonomischem Status und den kognitiven Grundfertigkeiten als signifikanter Prädiktor für die fremdsprachliche Gesamtleistung im Fran‐ zösischen wirkt. In diesem Modell, das genauso wie Modell 3 aufgrund des listenweisen Fallausschlusses mit 80 Probandinnen und Probanden gerechnet wurde, wird deutlich, dass nur noch durchschnittlich 3.011 Punkte mehr durch das weibliche Geschlecht bedingt werden und dass bei jeder Erhöhung um eine HISEI-Einheit durchschnittlich .076 Punkte mehr erzielt werden. Der Index der kognitiven Grundfertigkeiten reicht durch die z-Standardisierung von -1 bis +1. Steigt er um eine ganze Einheit, also z. B. von -1 auf 0, so erzielen die Schüle‐ rinnen und Schüler im Durchschnitt 3.130 Punkte mehr. Schließlich fungiert das FFS Selbstkonzept als signifikanter Prädiktor: Diese Variable nimmt aufgrund der im Fragebogen angelegten vierstufigen Likert-Skala Werte zwischen 1.00 und 4.00 an. Steigt das FFS Selbstkonzept um eine Einheit, also z. B. von 1 auf 2, so erlangen die Schülerinnen und Schüler im Durchschnitt 3.761 Punkte mehr in der sprachlichen Gesamtleistung in Französisch. Ein Blick auf die standardisierten Koeffizienten β zeigt, dass das FFS Selbstkonzept (β = .36**) den größten Einfluss auf die sprachliche Gesamtleistung in Französisch hat, gefolgt von den kognitiven Grundfertigkeiten (β = .28**) und schließlich von Geschlecht (β = -.20*) und HISEI (β = .20*) in gleichen Anteilen. Die Varianzaufklärung dieses Modells ist nach Cohen (1988, 1992) mit .301 hoch: Es erklärt 30.1% der Varianz der Gesamtleistung in der Gesamtleistung in den drei Französischtests zum Hörverstehen, Leseverstehen und Schreiben. 233 Aufgrund der leichten Multikollinearität zwischen FFS Selbstkonzept, Inter‐ esse am Fach Französisch, integrative Orientierung und Ideal L3 Self und L3 456 11 Auswertung der Ergebnisse WTC bei gleichzeitig relativ kleiner Stichprobengröße kann kein gemeinsames multiples lineares Regressionsmodell mit mehreren signifikant korrelierenden affektiven Faktoren angefertigt werden. Eine gute Alternative stellt jedoch die Berechnung mehrerer separater Regressionsmodelle mit jeweils einem dieser Faktoren dar (vgl. Schendera 2014). Die Berechnung weiterer Modelle zeigt jedoch, dass das FFS Selbstkonzept und somit Modell 4 am besten zur Varianzaufklärung beiträgt und das stärkste Modell bildet. Sowohl Interesse am Fach Französisch, integrative Orientierung gepaart mit dem Ideal L3 Self und auch L3 WTC tragen jeweils in Kombination mit dem Geschlecht, dem HISEI und den kognitiven Grundfertigkeiten nicht signifikant zur Varianzaufklärung bei (vgl. Anhang 8.2), wobei dies bei der Erhöhung der Stichprobengröße durchaus möglich wäre, da die p-Werte jeweils relativ niedrig sind. Modell 5 (vgl. Tabelle 76) zeigt schließlich, dass, wenn die Häufigkeit der Freizeitaktivitäten auf Französisch als Prädiktor hinzugefügt wird, die Varian‐ zaufklärung in Relation zu den vorhergehenden Modellen weiterhin steigt und nun bei einem korrigierten multiplen Determinationskoeffizient R² von .313 liegt, d. h. 31.3% beträgt. Gleichzeitig wird deutlich, dass die Prädiktorstärke des Geschlechts (β-= -.18) im Vergleich zu den vorherigen Regressionsmodellen weiter abnimmt und nun nicht mehr signifikant ist. HISEI (β-=-.20*), kognitive Grundfertigkeiten (β = .25*) und FFS Selbstkonzept (β = .36**) bleiben jedoch in ihrer Prädiktorstärke im Vergleich zu Modell 4 relativ konstant und die Häufigkeit der Freizeitaktivitäten auf Französisch (β = .12) nimmt eine kleine, nicht signifikante Prädiktorstärke an. Zusammenfassend kann also festgehalten werden, dass die Prädiktorstärke des Geschlechts konstant abnimmt, umso mehr zusätzliche Prädiktoren ins Regressionsmodell aufgenommen werden. Außerdem zeigt sich, dass HISEI, kognitive Grundfertigkeiten und FFS Selbstkonzept jeweils größere Prädiktor‐ stärken für die fremdsprachliche Gesamtleistung aufweisen als das Geschlecht. - 11.9.1.2 Regressionsanalysen zu den Hörverstehensleistungen in Französisch Da weder signifikante Korrelationen der Hörverstehensleistung im Französi‐ schen mit dem Geschlecht (r s = -.08) noch mit dem HISEI (r s = -.02) vorliegen (vgl. Kapitel 11.8.1; Anhang 7.1), dienen diese beiden Variablen auch nicht als Prädiktoren für die Hörverstehensleistung, was in den Modellen 1 und 2 in Tabelle 77 nochmals veranschaulicht wird: 11.9 Regressionsanalysen 457 Abhängige Variable: Ergebnis des Hörverstehenstests in Französisch - - B SE (B) β p Korrigiertes R² Modell 1 (n = 80) Konstante 38.460 2.790 - .000 .071 (p = .035) Geschlecht HISEI Ind. kog. Gr.f. -1.780 .029 3.509 1.632 .042 1.238 -.12 .08 .31 .279 .495 .006 Modell 2 (n = 80) Konstante 30.363 3.831 - .000 .156 (p = .002) Geschlecht HISEI Ind. kog. Gr.f. FFS Selbstk. -1.403 .012 2.842 3.307 1.582 .040 1.202 1.126 -.09 .03 .25 .31 .372 .761 .021 .004 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fettgedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 77: Regressionsmodelle 1 und 2 zum Ergebnis des Hörverstehenstests in Franzö‐ sisch Hingegen korrelieren das schlussfolgernde Denken (r s = .40**), der Index der kognitiven Grundfertigkeiten (r s = .22*), das FFS Selbstkonzept (r s = .35**) und die Länge des Auslandsaufenthalts in einem französischsprachigen Land (r s -=-.27*) signifikant mit der Hörverstehensleistung und kommen daher als Prädiktoren infrage. Außerdem wird die Moderatorenvariable aus Geschlecht und HISEI, welche sich in der zweifaktoriellen Varianzanalyse als signifikante Interaktion ergab (vgl. Kapitel 11.6.1), als möglicher Prädiktor geprüft (vgl. Tabelle 78): 458 11 Auswertung der Ergebnisse Abhängige Variable: Ergebnis des Hörverstehenstests in Französisch - B SE (B) β p Korrigiertes R² Modell 3 (n = 81) Konstante 15.131 5.564 - .008 .200 (p = .000) SPM FFS Selbstk. .308 3.308 .110 1.070 .29 .32 .007 .003 Modell 4 (n = 80) - Konstante 15.073 5.457 - .007 .213 (p = .000) SPM FFS Selbstk. L. d. Ausl.auf. .315 2.435 1.195 .107 1.093 .599 .30 .23 .21 .004 .029 .050 Modell 5 (n = 80) Konstante 16.219 5.553 - .005 .215 (p = .000) SPM FFS Selbstk. L. d. Ausl.auf. Geschl. * HISEI .330 2.351 1.193 -.019 .108 1.095 .598 .017 .32 .23 .21 -.11 .003 .035 .050 .282 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 78: Regressionsmodelle 3 bis 5 zum Ergebnis des Hörverstehenstests in Franzö‐ sisch Modell 3 (vgl. Tabelle 78) zeigt, dass das FFS Selbstkonzept (β-=-.32**) eine ver‐ gleichbare Prädiktorstärke besitzt wie das schlussfolgernde Denken (β-=-.29**). Dieses Regressionsmodell erreicht genau 20% Varianzaufklärung, da das korri‐ gierte R² bei .200 liegt. Bei Hinzunahme der Länge des Auslandsaufenthalts als Prädiktor in Modell 4 (vgl. Tabelle 78) steigt die Varianzaufklärung auf 21.3% und der höchste Anteil an der Varianzaufklärung bezüglich der Leistung des Hörverstehens verlagert sich auf das schlussfolgernde Denken (β = .30**), während das FFS Selbstkonzept in der Prädiktorstärke etwas abnimmt (β = .23*) und die Länge des Auslandsaufenthalts in einem französischsprachigen Land (β = .21*) eine ähnlich große, ebenfalls signifikante Prädiktorstärke annimmt. In Modell 5 (vgl. Tabelle 78) wird schließlich die Moderatorvariable Ge‐ schlecht*HISEI als Prädiktor mit aufgenommen. Während sich die Prädiktor‐ stärken der anderen unabhängigen Variablen kaum verändern, zeigt die Mo‐ deratorvariable Geschlecht * HISEI (β = -.11) lediglich eine geringe, nicht 11.9 Regressionsanalysen 459 signifikante Prädiktorstärke. Dennoch erhöht die Hinzugabe dieser Modera‐ torvariable die Varianzaufklärung ganz leicht auf 21.5%. Es konnte demnach ermittelt werden, dass, während die Variable Geschlecht keinen Prädiktor für die Hörverstehensleistung im Französischen darstellt, die Moderatorvariable Geschlecht*HISEI einen minimalen Beitrag zur Varianzaufklärung der Hör‐ verstehensleistung leistet. Deutlich stärkere Prädiktoren für diese sprachliche Fertigkeit sind hingegen das schlussfolgernde Denken, das FFS Selbstkonzept und die Länge des Aufenthalts im französischsprachigen Ausland. - 11.9.1.3 Regressionsanalysen zu den Leseverstehensleistungen in Französisch Mit der Leseverstehensleistung im Französischen korrelieren sowohl die Va‐ riable Geschlecht (r s = -.21*) als auch der HISEI (r s = -.23*) und das FFS Selbstkonzept (r s = .35**) signifikant; der Index der kognitiven Grundfertigkeiten (r s = .18, p = .111) weist eine schwache, nicht signifikante Korrelation mit der Leseverstehensleistung auf (vgl. Kapitel 11.8.1; Anhang 7.1). Aus diesem Grund werden diese Variablen in den folgenden Regressionsmodellen auf deren Prädiktorstärke überprüft (vgl. Tabelle 79): Abhängige Variable: Ergebnis des Leseverstehenstest in Französisch - - B SE (B) β p Korrigiertes R² Modell 1 (n = 81) Konstante 48.018 3.028 - .000 .082 (p = .010) Geschlecht HISEI -3.570 .108 1.703 .045 -.22 .25 .039 .019 Modell 2 (n = 80) - Konstante 47.337 3.034 - .000 .117 (p = .006) Geschlecht HISEI Ind. kog. Gr.f. -2.920 .126 2.773 1.793 .045 1.346 -.17 .30 .22 .108 .007 .043 460 11 Auswertung der Ergebnisse Abhängige Variable: Ergebnis des Leseverstehenstest in Französisch - - B SE (B) β p Korrigiertes R² Modell 3 (n = 79) - Konstante 40.756 4.287 - .000 .157 (p = .002) Geschlecht HISEI Ind. kog. Gr.f. FFS Selbstk. -2.670 .112 2.231 2.683 1.756 .045 1.340 1.262 -.16 .27 .18 .23 .133 .014 .100 .037 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²); Kodierungen der dichotomen Variablen: Geschlecht: 0 (weiblich), 1 (männlich). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstel‐ lungsweise gemäß DGPs (2019: 86). Tabelle 79: Regressionsmodelle 1 bis 3 zum Ergebnis des Leseverstehenstests in Franzö‐ sisch Ein einfaches lineares Regressionsmodell, das ausschließlich den Einfluss der Variable Geschlecht auf die Leseverstehensleistung im Französischen unter‐ sucht, ist nicht signifikant, und wird daher nicht in Tabelle 79 dargestellt. Modell 1 (vgl. Tabelle 79) umfasst die unabhängigen Variablen Geschlecht und HISEI, wobei ersichtlich wird, dass das Geschlecht (β-= -.22*) einen etwas geringeren Einfluss auf die Leseverstehensleistung hat als der HISEI (β = .25*). Insgesamt liegt die Varianzaufklärung von Modell 1 jedoch lediglich bei 8.2% (korrigiertes R² = .082). In Modell 2 (vgl. Tabelle 79) wird zusätzlich der Index der kognitiven Grund‐ fertigkeiten (β-=-.22*) als Prädiktor aufgenommen. Der HISEI (β-=-.30**) nimmt nun die höchste Prädiktorstärke ein und das Geschlecht (β = -.17) verringert im Vergleich zu Modell 1 seine Prädiktorstärke deutlich und verliert seinen signifikanten Einfluss auf das Leseverstehen in Französisch. Insgesamt liegt die Varianzaufklärung von Modell 2 bei 11.7% und daher immer noch relativ gering. Schließlich zeigt Modell 3 (vgl. Tabelle 79), welches eine Varianzaufklärung von 15.7% leistet, dass neben dem HISEI (β = .27*), der den größten Einfluss auf das Leseverstehen aufweist, auch das FFS Selbstkonzept (β = .23*) einen signifikanten Prädiktor darstellt. Die kognitiven Grundfertigkeiten (β = .18) verlieren hingegen - im Vergleich zu Modell 2 - ihren signifikanten Einfluss auf die Leseverstehensleistung und auch das Geschlecht (β-=--.16) erweist sich, wie bereits schon in Modell 2, als nicht mehr signifikanter Einfluss. 11.9 Regressionsanalysen 461 In den Regressionsanalysen zum Leseverstehen wird dementsprechend er‐ sichtlich, dass der HISEI, das FFS Selbstkonzept und die kognitiven Grundfertig‐ keiten jeweils eine höhere Prädiktorstärke aufweisen als das Geschlecht. Insbe‐ sondere der sozioökonomische Status (HISEI) zeigt einen besonders starken, fast doppelt so großen Einfluss auf die Leseverstehensleistung wie das Geschlecht. Dennoch bleibt ein schwacher Vorteil der weiblichen Französischlernenden auch bei der Hinzunahme weiterer Prädiktoren weiterhin ersichtlich. - 11.9.1.4 Regressionsanalysen zu den Schreibleistungen in Französisch Nach der Messung eines signifikanten Geschlechterunterschieds innerhalb des zweiten Ratings des Schreibtests in Französisch (vgl. Kapitel 11.4.3.1) wird nun untersucht, ob das Geschlecht auch als Prädiktor für die Schreibleistung gilt und inwiefern andere Variablen als weitere Prädiktoren in die Varianzaufklärung einbezogen werden können. In Kapitel 11.8.1 wurde deutlich, dass die Schreib‐ leistung mit vielfältigen Variablen signifikant korreliert, wobei die stärksten Korrelationen mit dem schlussfolgernden Denken (r s = .33**), dem Index der kognitiven Grundfertigkeiten (r s -= .29*), der L3 WTC (r s -= .32**), dem Interesse am Fach (r s = .28**), dem FFS Selbstkonzept (r s = .46**) und der Länge des Auslandsaufenthalts (r s = .29**) gemessen wurden. Schließlich wurde mit dem sozioökonomischen Hintergrund (HISEI; r s -= .14) eine schwache, nicht signifi‐ kante Korrelation gemessen, weshalb auch dieser in die Regressionsanalyse miteinbezogen wird (vgl. Tabelle 80). Abhängige Variable: Ergebnis des Schreibtests in Franzö‐ sisch (Rating 2) - - B SE (B) β p Korrigiertes R² Modell 1 (n = 88) Konstante 46.098 1.456 - .000 .039 (p = .036) Geschlecht -4.774 2.245 -.22 .036 Modell 2 (n = 80) - Konstante 39.613 3.953 - .000 .062 (p = .025) Geschlecht HISEI -4.908 .104 2.219 .059 -.23 .18 .030 .082 Modell 3 (n = 80) - Konstante 39.621 3.801 - .000 .160 (p = .001) Geschlecht HISEI Ind. kog. Gr.f. -4.747 .128 5.394 2.224 .057 1.686 -.22 .23 .33 .036 .026 .002 462 11 Auswertung der Ergebnisse Abhängige Variable: Ergebnis des Schreibtests in Franzö‐ sisch (Rating 2) - - B SE (B) β p Korrigiertes R² Modell 4 (n = 80) - Konstante 27.727 5.170 - .000 .250 (p = .000) Geschlecht HISEI Ind. kog. Gr.f. FFS Selbstk. -4.194 .104 4.415 4.858 2.107 .054 1.621 1.520 -.20 .19 .27 .32 .050 .057 .008 .002 Modell 5 (n = 79) - Konstante 26.617 5.180 - .000 .281 (p = .000) Geschlecht HISEI Ind. kog. Gr.f. FFS Selbstk. L. d. Ausl.auf. -3.727 .088 4.791 4.467 1.639 2.091 .054 1.618 1.560 .859 -.17 .16 .29 .29 .19 .079 .107 .004 .005 .060 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²); Kodierungen der dichotomen Variablen: Geschlecht: 0 (weiblich), 1 (männlich). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstel‐ lungsweise gemäß DGPs (2019: 86). Tabelle 80: Regressionsmodelle 1 bis 5 zum Ergebnis des Schreibtests in Französisch (Rating 2) In Modell 1 (vgl. Tabelle 80) wird gezeigt, dass das Geschlecht (β = -.22*), wenn man es in isolierter Form auf seinen Einfluss auf die Schreibleistung im Französischen untersucht, einen signifikanten Prädiktor darstellt und dass 4.774 der maximal zu erreichenden 66 Punkte im Schreibtest (Rating 2) auf das weibliche Geschlecht zurückzuführen sind, in dem Sinne, dass die Zugehörigkeit zum weiblichen Geschlecht durchschnittlich 4.774 Punkte mehr im Schreibtest bewirkt als die Zugehörigkeit zum männlichen. Allerdings erklärt dieses ein‐ fache lineare Regressionsmodell lediglich 3.9% der Gesamtvarianz. Im zweiten Regressionsmodell (vgl. Tabelle 80) fungiert zusätzlich zum Geschlecht (β = -.23*) der HISEI (β = .18) als schwacher, nicht signifikanter Prädiktor. Insgesamt leistet dieses Modell eine Varianzaufklärung von 6.2%, welche durch Cohen (1988, 1992: 155-159) als schwach klassifiziert wird. Eine mittlere Varianzaufklärung erreicht im nächsten Regressionsschritt mit 16% Modell 3 (vgl. Tabelle 80): Geschlecht (β = -.22*) und HISEI (β = .23*) leisten darin einen vergleichbaren und jeweils signifikanten Anteil an der Varianzauf‐ 11.9 Regressionsanalysen 463 klärung, während der neu hinzugefügte Index der kognitiven Grundfertigkeiten (β-=-.33**) den Faktor mit der höchsten Prädiktorstärke darstellt. In Modell 4 (vgl. Tabelle 80) wird deutlich, dass das FFS Selbstkonzept (β = .32**) ebenfalls als signifikanter Prädiktor wirkt und einen etwas hö‐ heren Einfluss auf die Schreibleistung hat als die kognitiven Grundfertigkeiten (β = .27**), das Geschlecht (β = -.20*) und als der HISEI (β = .19). Zusammen leisten diese vier Prädiktoren eine Varianzaufklärung von 25%, die nach Cohen (1988, 1992: 155-159) als hoch angesehen werden kann. Nimmt man in Modell 5 (vgl. Tabelle 80) schließlich noch die Länge des Auslandsaufenthalts als Prädiktor hinzu, verbessert sich die Varianzaufklärung noch ein wenig auf 28.1%. Kognitive Grundfertigkeiten (β = .29**), FFS Selbst‐ konzept (β-= .29**) und Länge des Auslandsaufenthalts (β-= .19) tragen jeweils stärker zur Varianzaufklärung bei als das Geschlecht (β = -.17) und der HISEI (β-=-.16), welcher den schwächsten Prädiktor darstellt. Bezüglich der Schreibleistungen im Französischen kann also zusammenfas‐ send festgehalten werden, dass die Variable Geschlecht, sobald andere Faktoren als Prädiktoren hinzugezogen werden, stetig an Prädiktorstärke abnimmt. Außerdem wird ersichtlich, dass insbesondere die kognitiven Grundfertigkeiten und das FFS Selbstkonzept einen höheren Anteil der Varianz erklären als das Geschlecht. Nichtsdestotrotz bleibt auch in Modell 5 eine schwache, nicht signifikante Prädiktorstärke des Geschlechts bezüglich der Schreibleistung erhalten, wobei der Vorteil nach wie vor bei der Zugehörigkeit zum weiblichen Geschlecht liegt. 11.9.2 Zwischenfazit: Antwort auf Forschungsfrage 5 für Französisch Forschungsfrage 5 fragt danach, welche Faktoren (Geschlecht, sozioökonomi‐ scher Hintergrund, sprachlicher Hintergrund, kognitive Grundfertigkeiten, affektive Faktoren, Faktoren auf der Makroebene) die größte Prädiktorstärke für die fremdsprachliche Leistung aufweisen. Die Regressionsanalysen belegen, dass die Variable Geschlecht als statistisch relevanter Prädiktor für die Franzö‐ sischleistungen im Leseverstehen, im Schreiben und für das Gesamtergebnis in den Französischtests wirkt, in dem Sinne, dass in diesen drei Kategorien die Zugehörigkeit zum weiblichen Geschlecht einen positiven Prädiktor für die Leistung und entsprechend die Zugehörigkeit zum männlichen Geschlecht einen negativen Prädiktor darstellt. Einzig für das Hörverstehen nimmt die Ge‐ schlechtervariable in keinem der Regressionsmodelle eine statistisch relevante oder gar signifikante Prädiktorfunktion ein. Auch die Moderatorenvariable 464 11 Auswertung der Ergebnisse Geschlecht*HISEI, welche innerhalb der zweifaktoriellen Varianzanalysen einen signifikanten Interaktionseffekt bezüglich des Hörverstehens angezeigt hatte (vgl. Kapitel 11.6.1), trägt nicht statistisch relevant zur Aufklärung der Varianz in der Hörverstehensleistung bei. Bezüglich des Gesamtergebnisses in Franzö‐ sisch zeigt eine einfache lineare Regression, dass das Geschlecht in seiner separaten Betrachtung als signifikanter Prädiktor wirkt und 5.3% der Varianz der Gesamtleistung erklärt (vgl. Modell 1, Tabelle 76). Modell 5 (vgl. Tabelle 76) zeigt jedoch, dass die Gesamtleistung im Französischen vor allem signifikant durch das FFS Selbstkonzept (β = .36**) und die kognitiven Grundfertigkeiten (β = .25*) bestimmt wird. HISEI (β = .20*) und Geschlecht (β = -.18) nehmen beide einen geringeren Anteil der erklärten Varianz der Gesamtleistung ein, wobei das Geschlecht in Modell 5 sogar nur noch so wenig Prädiktorstärke besitzt, dass diese nicht mehr signifikant ist. Dieses Modell 5 besitzt nach Cohen (1988, 1992: 155-159) mit dem korrigierten R² von .313 eine als hoch zu klassifizierende Varianzaufklärung von 31.3%. Betrachtet man die Prädiktorstärke des Geschlechts für Hörverstehen, Le‐ severstehen, Schreiben und die Gesamtergebnisse im Vergleich zu den Prädik‐ torstärken von HISEI, kognitiven Grundfertigkeiten und FFS Selbstkonzept, ergeben sich folgende Ergebnisse: Beim Hörverstehen (vgl. Modell 2, Tabelle 77) agieren vor allem das FFS Selbstkonzept (β = .31**) und die kognitiven Grundfertigkeiten (β = .25*) als signifikante Prädiktoren, während HISEI (β = .03) und Geschlecht (β = -.09) keinerlei statistisch relevanten Einfluss auf die Hörverstehensleistung haben. Beim Leseverstehen in Französisch kommen die Regressionsanalysen (vgl. Modell 3, Tabelle 79) zu dem Ergebnis, dass der HISEI (β = .27*), als stärkster Prädiktor wirkt, gefolgt vom FFS Selbstkonzept (β = .23*), den kognitiven Grundfertigkeiten (β = .18) und der Variable Geschlecht (β = -.16), wobei die letzten beiden statistisch nicht signifikant sind. Schließlich zeigt sich - im Vergleich zum Hörverstehen und zum Lesever‐ stehen - beim Schreiben (vgl. Modell 4, Tabelle 80) die höchste Prädiktorstärke des Geschlechts (β = -.20*). Der HISEI (β = .19) nimmt eine ähnliche Prädik‐ torstärke an und die kognitiven Grundfertigkeiten (β = .27**) sowie das FFS Selbstkonzept (β-= .32**) zeigen erneut eine deutlich höhere Prädiktorstärke als das Geschlecht. Bezüglich des Gesamtergebnisses haben erneut Geschlecht (β = -.20*) und HISEI (β = .20*) gleich große Prädiktorstärken und die kognitiven Grundfer‐ tigkeiten (β = .28**) sowie das FFS Selbstkonzept (β = .36**) weisen jeweils größere Prädiktorstärken auf (vgl. Modell 4, Tabelle 76). Abschließend bleibt anzumerken, dass anstelle des FFS Selbstkonzepts auch zahlreiche andere endo‐ gene affektive Faktoren als Prädiktoren wirken, meist aber in geringerem Maße 11.9 Regressionsanalysen 465 und nicht signifikant (vgl. Anhang 8.2). Außerdem fungiert der sprachliche Hin‐ tergrund bezüglich der fremdsprachlichen Leistungen im Französischen nicht als Prädiktor, was bereits durch die Korrelationsanalysen belegt werden konnte (vgl. Kapitel 11.8.1). Auch die Variablen des Ought-to L3 Self, insbesondere die wahrgenommene Unterstützung durch die Lehrkraft, die wahrgenommene Erwartung durch die Lehrkraft, die wahrgenommenen Erwartungen der Peers und die wahrgenommenen Erwartungen der Eltern fungieren nicht als direkte, statistisch messbare Prädiktoren für die fremdsprachlichen Leistungen. Der ein‐ zige weitere signifikante Prädiktor, der bei den Regressionsanalysen gemessen wurde, stellt die Länge des Auslandsaufenthalts im französischsprachigen Ausland bezüglich der Hörverstehensleistung dar (vgl. Modell 3, Tabelle 78). 11.9.3 Regressionsanalysen zu den Leistungen in Spanisch Um Forschungsfrage 5 beantworten zu können, werden nun unter Berück‐ sichtigung der oben genannten Voraussetzungen entsprechende einfache und multiple lineare Regressionsanalysen durchgeführt. Dabei stehen vor allem die affektiven Faktoren SFS Selbstkonzept, L4 WTC, Interesse am Fach Spanisch und L4-Angst im Vordergrund, da diese oft statistisch relevante Zusammenhänge mit den Leistungen im Spanischen gezeigt haben (vgl. Kapitel 11.8.2). Dennoch werden jeweils auch Regressionsanalysen mit dem Geschlecht, dem sozioöko‐ nomischen Status (HISEI), dem Index der kognitiven Grundfertigkeiten und dem SFS Selbstkonzept vorgenommen, um einen Vergleich zu den Regressionsmo‐ dellen bezüglich des Französischen herstellen zu können (vgl. Kapitel 11.9.1). Genau wie bei Französisch zeigte der sprachliche Hintergrund im Rahmen der Korrelationsanalysen weder zur Gesamtleistung noch zu den einzelnen gemessenen Teilfertigkeiten statistisch relevante Zusammenhänge, weshalb dieser nicht als möglicher Prädiktor für die jeweiligen Leistungsbereiche infrage kommt (vgl. Anhang 7.3). - 11.9.3.1 Regressionsanalysen zum Gesamtergebnis in Spanisch Bezüglich der fremdsprachlichen Gesamtleistung in Spanisch kommen gemäß den Korrelationsanalysen die L4 WTC (r s = .36**), das Interesse am Fach Spanisch (r s = .36**), das SFS Selbstkonzept (r s = .50**) und die L4-Angst (r s = -.23*) als mögliche Prädiktoren infrage (vgl. Kapitel 11.8.2), wobei das SFS Selbstkonzept am stärksten mit der Gesamtleistung korreliert. Da es sich bei allen vier mögli‐ chen Prädiktoren um affektive Faktoren handelt, die untereinander signifikant mit einem Wert von r s > .5 korrelieren (vgl. Anhang 7.3), können diese aufgrund des Phänomens der Multikollinearität nicht zusammen in ein Regressionsmodell 466 11 Auswertung der Ergebnisse aufgenommen, sondern lediglich getrennt voneinander untersucht werden (vgl. Schendera 2014: 104). Regressionsanalysen bezüglich der Gesamtleistung in Spanisch ergeben dem‐ entsprechend, dass das SFS Selbstkonzept (β = .48**) als alleiniger Prädiktor 22.3% der Varianzaufklärung liefert (vgl. Tabelle 81, Modell 1) und deshalb einen stärkeren Prädiktor darstellt als die L4 WTC, die als alleiniger Prädiktor 10.5% Varianzaufklärung liefert oder des Interesses am Fach Spanisch, das als allei‐ niger Prädiktor 9% Varianzaufklärung leistet. Die L4-Angst leistet hingegen als alleiniger Prädiktor lediglich 4.9% Varianzaufklärung. Alle Regressionsmodelle zu L4 WTC, Interesse am Fach Spanisch und L4-Angst befinden sich im Anhang (vgl. Modelle 1a, 1b und 1c in Tabelle 152, Anhang 7.4). Abhängige Variable: Gesamt‐ ergebnis der Spanischtests - - B SE (B) β p Korrigiertes R² Modell 1 (n = 93) Konstante -1.946 .406 - .000 .223 (p = .000) SFS Selbstk. .720 .137 .48 .000 Modell 2 (n = 93) - Konstante -2.220 .474 - .000 .217 (p = .000) Geschlecht HISEI SFS Selbstk. .226 .005 .691 .211 .004 .139 .10 .11 .46 .288 .249 .000 Modell 3 (n = 87) - Konstante -1.886 .448 - .000 .201 (p = .000) Geschlecht HISEI Ind. kogn. Gr.f. SFS Selbstk. .129 .004 .045 .631 .198 .004 .129 .131 .06 .09 .03 .46 .517 .352 .732 .000 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²); Kodierungen der dichotomen Variable Geschlecht: 0 (weiblich), 1 (männlich). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstel‐ lungsweise gemäß DGPs (2019: 86). Tabelle 81: Regressionsmodelle 1 bis 3 zum Gesamtergebnis in Spanisch Zum Ziel des Vergleichs mit den Regressionsmodellen bezüglich der Gesamt‐ leistungen in Französisch, werden auch die Prädiktorstärken von Geschlecht und sozioökonomischem Status (HISEI) und des Index der kognitiven Grund‐ fertigkeiten überprüft. Dabei wird ersichtlich, dass sich bei Regressionsmodell 2 (vgl. Tabelle 81) mit den Prädiktoren Geschlecht (β-=-.10), sozioökonomischer 11.9 Regressionsanalysen 467 Status (β = .11) und SFS Selbstkonzept (β = .46**) die Varianzaufklärung im Vergleich zu Modell 1 leicht reduziert und nur noch 21.7% beträgt, da Geschlecht und sozioökonomischer Status keine signifikanten Prädiktoren darstellen. Auch das Hinzufügen des Index der kognitiven Grundfertigkeiten (β = .03) als Prädiktor in Modell 3 (vgl. Tabelle 81) führt zu einer weiteren Verschlechterung der Varianzaufklärung auf 20.1%, was aufgrund der fehlenden signifikanten Korrelationen zwischen der Gesamtleistung und diesen Faktoren zu erwarten war. Im Gegensatz zur Gesamtleistung im Französischen, für die das Geschlecht, der sozioökonomische Status, die kognitiven Grundfertigkeiten und das FFS Selbstkonzept als signifikante Prädiktoren wirken (vgl. Modell 4, Tabelle 76), kristallisiert sich für die Gesamtleistung im Spanischen folglich das SFS Selbstkonzept als stärkster alleiniger Prädiktor heraus (vgl. Modell 1, Tabelle 85). Während also das Geschlecht einen wesentlichen Anteil an der Gesamtleistung im Französischen hat, stellt diese Variable für die Gesamtleistung im Spanischen keinen Einflussfaktor dar. - 11.9.3.2 Regressionsanalysen zu den Hörverstehensleistungen in Spanisch Für die Hörverstehensleistung in Spanisch kommen laut Korrelationsanalysen das schlussfolgernde Denken (r s = .31**), die L4 WTC (r s = .22*), das Interesse am Fach Spanisch (r s = .24*), das SFS Selbstkonzept (r s = .29**) und die L4-Angst (r s = -.22*) als Prädiktoren infrage (vgl. Kapitel 11.8.2). Aufgrund der Multikolli‐ nearität der affektiven Faktoren wird die Hauptregressionsanalyse, ähnlich wie bei der Gesamtleistung in Spanisch im vorherigen Kapitel, mit dem FFS Selbst‐ konzept gerechnet, da es am stärksten mit der Hörverstehensleistung korreliert (vgl. Modell 1, Tabelle 82). Auch die Länge des Auslandsaufenthalts (r s = .20) wird aufgrund der beinahe signifikanten Korrelation mit der Hörverstehensleistung auf Prädiktorstärke geprüft (vgl. Modell 2, Tabelle 82). Modell 1 (vgl. Tabelle 82) illustriert, dass das SFS Selbstkonzept als alleiniger Prädiktor eine viel niedrigere Varianzaufklärung darstellt als bezüglich der Gesamtleistung, nämlich lediglich 6.8%. Modell 2 (vgl. Tabelle 82) zeigt, dass das SFS Selbstkonzept (β = .27*) eine vergleichbar hohe Prädiktorstärke besitzt wie das schlussfolgernde Denken (β-= .29**), wobei beide Faktoren zusammen 14% der Varianzaufklärung erreichen. Bei Hinzunahme der Länge des Auslandsauf‐ enthalts in Modell 3 (vgl. Tabelle 82) erhöht sich die Varianzaufklärung auf 22.3%. Der höchste Anteil der Varianzaufklärung liegt beim schlussfolgernden Denken (β = .35**), gefolgt vom SFS Selbstkonzept (β = .35**) und der Länge des Auslandsaufenthalts (β = .29**), welche sich ebenfalls als signifikanter Prädiktor für die Hörverstehensleistung entpuppt. 468 11 Auswertung der Ergebnisse Abhängige Variable: Gesamt‐ ergebnis der Spanischtests - - B SE (B) β p Korrigiertes R² Modell 1 (n = 94) Konstante 31.949 3.837 - .000 .068 (p = .007) SFS Selbstk. 3.596 1.293 .28 .007 Modell 2 (n = 91) Konstante 12.320 7.853 - .120 .140 (p = .000) SPM SFS Selbstk. .428 3.209 .142 1.173 .29 .27 .003 .008 Modell 3 (n = 90) - Konstante 4.893 7.758 - .530 .223 (p = .000) SPM SFS Selbstk. L. d. Ausl.auf. .513 3.548 1.673 .138 1.137 .558 .35 .30 .29 .000 .002 .004 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 82: Regressionsmodelle 1 bis 3 zum Ergebnis des Hörverstehenstests in Spanisch Auch für die Hörverstehensleistung in Französisch kristallisierten sich das schlussfolgernde Denken (β = .30**), das FFS Selbstkonzept (β = .23*) und die Länge des Auslandsaufenthalts (β = .21*) als signifikante Prädiktoren heraus, wobei diese eine Varianzaufklärung von 21.3% erreichten (vgl. Modell 4, Tabelle 78), womit im Fall des Hörverstehens ein vergleichbares Ergebnis in beiden Fächern vorliegt. Ähnlich wie bezüglich der Gesamtleistung im Spanischen wurden auch bezüglich der Hörverstehensleistung im Spanischen L4 WTC, Interesse am Fach Spanisch und L4-Angst auf deren Prädiktorstärken überprüft. Dabei zeigt sich ein signifikanter Einfluss der L4 WTC (β = .24*), die als alleiniger Prädiktor 4.9% der Varianz der Hörverstehensleistung erklärt (vgl. Modell 1a, Tabelle 153, Anhang 8.4) und ein signifikanter negativer Einfluss der L4-Angst (β = -.22*), die als alleiniger Prädiktor 3.7% der Varianz der Leistung erklärt (vgl. Modell 1c, Tabelle 153, Anhang 8.4). Das Interesse am Fach Spanisch (β = .20) zeigt jedoch keinen signifikanten Einfluss auf die Hörverstehensleistung, wenn es als alleiniger Prädiktor eingesetzt wird (vgl. Modell 1b, Tabelle 153, Anhang 8.4). Da keine signifikanten Korrelationen der Hörverstehensleistung in Spanisch mit dem Geschlecht (r s = .15), dem HISEI (r s = .07) oder dem Index der kognitiven Grundfertigkeiten (r s = .04) vorliegen (vgl. Kapitel 11.8.2; Anhang 7.3), ist ein 11.9 Regressionsanalysen 469 Regressionsmodell mit diesen Prädiktoren und dem SFS Selbstkonzept ebenfalls nicht signifikant und kann daher nicht verwendet werden (vgl. Tabelle 154, Anhang 8.4). Dadurch wird erneut deutlich, dass das Geschlecht keine Rolle für die Leistung im Hörverstehen in Spanisch spielt, ähnlich wie dies auch schon für Französisch zu beobachten war (vgl. Tabelle 77). - 11.9.3.3 Regressionsanalysen zu den Leseverstehensleistungen in Spanisch Die Leseverstehensleistung weist signifikante Zusammenhänge mit dem Inter‐ esse am Fach Spanisch (r s = .26*), dem SFS Selbstkonzept (r s = .32**), der genderstereotyp weiblichen Wahrnehmung des Spanischen (r s = -.28*) und der wahrgenommenen Aufmerksamkeitsverteilung der Spanischlehrkräfte zu‐ gunsten der Mädchen (r s = .26*) auf, weshalb diese Variablen als mögliche Prädiktoren für die Leseverstehensleistung infrage kommen. Modell 1 (vgl. Tabelle 83) bestätigt, dass das SFS Selbstkonzept (β = .25*) einen signifikanten Prädiktor für die Leseverstehensleistung in Spanisch darstellt und 4.9% Varianzaufklärung leistet. Alternativ dazu könnte auch das Interesse am Fach Spanisch (β = .21*) als alleiniger Prädiktor verwendet werden, welcher als solcher 4.7% Varianzaufklärung leistet (vgl. Tabelle 156, Anhang 8.4). Da das SFS Selbstkonzept jedoch einen etwas stärkeren Einfluss zeigt und nicht beide Faktoren ins Regressionsmodell aufgenommen werden können, wird das SFS Selbstkonzept beibehalten. Modell 2 (vgl. Tabelle 83) zeigt jedoch, dass die wahrgenommene Aufmerk‐ samkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen (β = .22*) ein etwas größere Prädiktorstärke hat als das SFS Selbstkonzept (β = .18), wobei beide Variablen 8.4% der Varianz erklären. Die genderstereotyp weibliche Wahrnehmung des Spanischen trägt hingegen nicht signifikant zur Erhöhung der Varianzaufklärung bei, was in Modell 3 (vgl. Tabelle 83) ersichtlich wird. 470 11 Auswertung der Ergebnisse Abhängige Variable: Ergebnis des Leseverstehenstest in Spanisch - B SE (B) β p Korrigiertes R² Modell 1 (n = 89) Konstante 46.132 3.247 - .000 .049 (p = .021) SFS Selbstk. 2.559 1.085 .25 .021 Modell 2 (n = 89) - Konstante 38.099 .474 - .000 .084 (p = .008) SFS Selbstk. W. Auf. z. d. M. 1.920 2.874 1.109 1.383 .18 .22 .087 .041 Modell 3 (n = 89) - Konstante 42.671 6.750 - .000 .084 (p = .015) SFS Selbstk. Gend. w. Wahrn. W. Auf. z. d. M. 1.696 -1.277 2.346 1.131 1.263 1.478 .16 -.12 .18 .137 .315 .116 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 83: Regressionsmodelle 1 bis 3 zum Ergebnis des Leseverstehenstests in Spanisch Bezüglich der Leseverstehensleistung in Französisch stellten sich insbesondere Geschlecht, sozioökonomischer Status, kognitive Grundfertigkeiten und FFS Selbstkonzept als Prädiktoren heraus, die insgesamt 15.7% Varianzaufklärung leisteten (vgl. Modell 3, Tabelle 79). Bei einer Regressionsanalyse mit denselben Prädiktoren bezüglich der Lese‐ verstehensleistung in Spanisch wird ersichtlich, dass das Modell nicht signifi‐ kant und daher nicht verwendbar ist. Lediglich das SFS Selbstkonzept stellt nach wie vor einen signifikanten Prädiktor dar, während die anderen drei Faktoren, inklusive der Variable Geschlecht, keinerlei Beitrag zur Varianzaufklärung leisten (vgl. Modell 5, Tabelle 155, Anhang 8.4). - 11.9.3.4 Regressionsanalysen zu den Schreibleistungen in Spanisch Die Schreibleistung in Spanisch korreliert signifikant mit der L4 WTC (r s = .35**), dem Interesse am Fach Spanisch (r s = .36*), dem SFS Selbstkonzept (r s = .55**) und der L4-Angst (r s = -.27*), weshalb diese Variablen potenzielle Prädiktoren für die Schreibleistung darstellen. Außerdem wurde bei der Analyse bezüglich möglicher Interaktionen der Intersektionalitätsaxiome ein mittlerer Effekt der Interaktion zwischen Geschlecht und sozioökonomischem Status festgestellt 11.9 Regressionsanalysen 471 (p = .080, η p ² = .059; vgl. Tabelle 70, Kapitel 11.6.3), weshalb auch die Modera‐ torvariable Geschlecht * sozioökonomischer Status auf deren Prädiktorstärke überprüft wird. Bei Regressionsanalysen bezüglich der Schreibleistung in Spanisch tritt ein ähnliches Phänomen auf wie bezüglich der Gesamtleistung in Spanisch: In Modell 1 (vgl. Tabelle 84) erreicht das SFS Selbstkonzept (β = .55**) als alleiniger Prädiktor mit 29.7% die höchste Varianzaufklärung aller möglichen Regressionsmodelle. Die Moderatorvariable Geschlecht * sozioökonomischer Status trägt hin‐ gegen nicht signifikant zur Varianzaufklärung bei (vgl. Modell 2, Tabelle 84), sodass bezüglich der Schreibleistung nicht von einem Einfluss der Interaktion zwischen Geschlecht und sozioökonomischem Status gesprochen werden kann. Abhängige Variable: Ergebnis des Schreibtests in Spanisch (Rating 2) - - B SE (B) β p Korrigiertes R² Modell 1 (n = 89) Konstante 24.733 3.648 - .000 .297 (p = .000) SFS Selbstk. 7.607 1.224 .55 .000 Modell 2 (n = 89) - Konstante 25.809 3.975 - .000 .293 (p = .000) SFS Selbstk. Geschl. * HISEI 7.649 -.017 1.229 .024 .56 -.06 .000 .491 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 84: Regressionsmodelle 1 und 2 zum Ergebnis des Schreibtests in Spanisch (Rating 2) Interesse am Fach Spanisch (10.4%), L4-Angst (8%) und L4 WTC (11.3%) tragen jeweils signifikant zur Schreibleistung bei (vgl. Modelle 1a bis 1c, Tabelle 157, Anhang 8.4), wobei deren Varianzaufklärung als alleinige Prädiktoren jeweils weniger stark ist als diejenige des SFS Selbstkonzepts (vgl. Modell 1, Tabelle 84). Wie bereits erläutert, können diese Variablen aufgrund der Multikollinearität zwischen ihnen nicht in ein gemeinsames Regressionsmodell aufgenommen werden. Um einen Vergleich mit den Prädiktoren für die Schreibleistung in Franzö‐ sisch herzustellen, wird außerdem auch bezüglich der Schreibleistungen in 472 11 Auswertung der Ergebnisse Spanisch eine Regressionsrechnung durchgeführt, die das Geschlecht (β = -.05), den sozioökonomischen Status (β = .02), die kognitiven Grundfertigkeiten (β = .06) und das SFS Selbstkonzept (β = .54**) enthält. Dieses Modell ist im Gegensatz zum gleich aufgebauten Modell bezüglich der Leseverstehensleistung in Spanisch signifikant und kann daher zur Varianzaufklärung verwendet werden, wobei diese mit 27% relativ hoch ausfällt, aber dennoch niedriger liegt als bei der Verwendung des SFS Selbstkonzepts als alleinigem Prädiktor (vgl. Modell 1, Tabelle 84). Es wird klar ersichtlich, dass weder Geschlecht noch sozioökonomischer Status oder kognitive Grundfertigkeiten Prädiktoren für die Schreibleistung in Spanisch darstellen, sondern lediglich das SFS Selbstkonzept einen starken Einfluss nimmt, was bereits im ersten Regressionsmodell ersicht‐ lich wurde (vgl. Tabelle 158, Anhang 8.4). 11.9.4 Zwischenfazit: Antwort auf Forschungsfrage 5 für Spanisch Die Frage nach der Prädiktorstärke der einzelnen erhobenen Faktoren für die Spanischleistungen kann nach der Durchführung der entsprechenden Regressi‐ onsanalysen nun beantwortet werden: Im Gegensatz zu den fremdsprachlichen Leistungen im Französischen, bei denen das Geschlecht mit Ausnahme der Hörverstehensleistung stets einen signifikanten Prädiktor darstellte, kann im Spanischen für keine der gemessenen fremdsprachlichen Fertigkeiten ein si‐ gnifikanter Einfluss des Geschlechts errechnet werden. Auch die Interaktion zwischen Geschlecht und sozioökonomischem Status, welche bezüglich des Schreibens im Rahmen der Durchführung zweifaktorieller Varianzanalysen einen mittleren, nicht signifikanten Effekt ergeben hatte (vgl. Kapitel 11.6.3), erweist sich nicht als signifikanter Einflussfaktor auf die Schreibleistung. Im Gegensatz zum Französischen zeigen auch der sozioökonomische Status (HISEI) und der Index der kognitiven Grundfertigkeiten bei keiner der drei kommunikativen Fertigkeiten signifikante Einflüsse auf die Spanischleistungen. Hingegen erweist sich sowohl bezüglich der Gesamtleistung als auch bezüglich der Schreibleistung in Spanisch das SFS Selbstkonzept als stärkster alleiniger Prädiktor. Das SFS Selbstkonzept erreicht bezüglich der Gesamtleistung in Spanisch eine mittlere Varianzaufklärung von 22.3% und bezüglich der Schreib‐ leistung eine hohe Varianzaufklärung von 29.7% (vgl. Cohen 1988, 1992: 155-159; vgl. Tabellen 81 bis 84). Bezüglich der Hörverstehensleistungen erweisen sich sowohl das SFS Selbst‐ konzept als auch das schlussfolgernde Denken (SPM) und die Länge des Auslandsaufenthalts als signifikante Prädiktoren, welche insgesamt 22.3% der Varianz der Hörverstehensleistung in Spanisch erklären. Was die Leseverste‐ 11.9 Regressionsanalysen 473 hensleistung in Spanisch betrifft, so ergibt die Kombination aus SFS Selbstkon‐ zept und der wahrgenommenen Aufmerksamkeitsverteilung der Spanischlehr‐ kräfte zugunsten der Mädchen die höchste Varianzaufklärung, wobei diese mit 8.4% eher gering ausfällt (vgl. Cohen 1988, 1992: 155-159). Weshalb ge‐ rade die wahrgenommene Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen einen signifikanten Einfluss auf die Leseleistung innerhalb der Spanischstichprobe zeigt, wird im Rahmen der Interpretation der Ergebnisse erneut diskutiert (vgl. Kapitel 12.2). Darüber hinaus zeigen sich bei einfachen linearen Regressionen die L4 WTC als signifikanter Prädiktor für die Gesamtleistung, für die Hörverstehensleis‐ tung und für die Schreibleistung. Das Interesse am Fach stellt für die Gesamt‐ leistung, Leseverstehensleistung und die Schreibleistung einen signifikanten Prädiktor dar und die L4-Angst für die Gesamtleistung, für die Schreibleistung und für die Hörverstehensleistung (vgl. Anhang 8.4). Abschließend bleibt festzustellen, dass die Variablen des Ought-to L4 Self, mit Ausnahme der wahrgenommenen Aufmerksamkeitsverteilung der Spani‐ schlehrkräfte zugunsten der Mädchen bezüglich der Leseverstehensleistung, keinerlei signifikante Einflüsse auf die Spanischleistungen zeigen. 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen Im Anschluss werden Korrelationsanalysen separat nach Geschlecht vorge‐ nommen, wobei erneut Spearmans Rho berechnet wird. Dies hat den Vorteil, dass die Korrelationen auch für kleinere Stichproben mit Ausreißern berechnet werden können (vgl. Bühner/ Ziegler 2009: 618 ff.). Es wird zunächst unter‐ sucht, inwiefern die einzelnen Variablen innerhalb der jeweiligen Geschlechter‐ gruppen mit den fremdsprachlichen Leistungen korrelieren. Hierbei wird analysiert, ob einzelne Variablen nur bei einer Geschlechter‐ gruppe signifikant korrelieren und bei der anderen nicht. Außerdem wird überprüft, ob sich bezüglich der Stärke des Zusammenhangs zwischen den jeweiligen Variablen Unterschiede ergeben. Beispielsweise können einzelne Variablen in der einen Geschlechtergruppe einen negativen Zusammenhang zur fremdsprachlichen Leistung aufweisen und in der anderen einen positiven. Gemeinsamkeiten und Unterschiede innerhalb der Korrelationsmatrizen der beiden Geschlechtergruppen bezüglich des Hörverstehens, des Leseverstehens, des Schreibens und der Gesamtleistung im Französischen stehen dabei als erster Ausgangspunkt im Vordergrund. Außerdem wird ein besonderer Schwerpunkt 474 11 Auswertung der Ergebnisse auf diejenigen Teilbereiche der einzelnen Sprachtests gelegt, bei denen verstärkt Geschlechterunterschiede auftreten, also im Falle des Französischen Teilaufgabe 2 (LV-33 Kurze Geschichte) des Leseverstehenstest sowie die gesamte Lese‐ leistung, der Bereich Sprachhandlungskompetenz im Rahmen des Schreibtests (Rating 1), die Wortanzahl im Rahmen des Schreibtests, Inhalt 1, Inhalt 2, Morpho‐ syntax und grammatische Orthographie (Rating 2) sowie Grammatik (Rating 3), das Gesamtergebnis in den Schreibtests und das Gesamtergebnis in allen Sprach‐ tests. Ausgehend von der Stärke der Korrelation werden jeweils separate lineare Regressionsanalysen für die beiden Geschlechtergruppen vorgenommen, um zu überprüfen, ob die korrelierenden Variablen auch tatsächlich Prädiktoren für die jeweiligen fremdsprachlichen Leistungen darstellen. Hierbei muss bedacht werden, dass die statistische Power der Regressionsmodelle aufgrund der reduzierten Stichprobengrößen (Französisch: n (w) = 52, n (m) = 40; Spanisch: n (w) = 73, n (m) = 21) nicht mehr so hoch ist wie bei den Regressionsanalysen in Kapitel 11.9.1. Beispielsweise hat ein lineares multiples Regressionsmodell laut einer Poweranalyse mittels der Software G*Power bei einer Effektstärke von f ² = .4, einem Signifikanzniveau von p = .05, einer Prädiktoranzahl von 5 und einer Samplegröße von n = 29 eine Power von .951, wobei Werte zwischen .8 und .9 als empfehlenswert gelten. Um signifikant zu sein müsste das Modell ein R² von mindestens .419 erreichen. Die so gewonnenen Einblicke in die Datenstruktur und deren Zusam‐ menhänge bieten eine Möglichkeit, erste Ursachen für Geschlechterunter‐ schiede auszumachen, insbesondere, wenn signifikante negative Prädiktoren ausschließlich in einer der beiden Merkmalsgruppen gefunden werden können, d. h. Prädiktoren, die sich ausschließlich bei einer Geschlechtergruppe negativ auf die jeweilige Leistung auswirken. 11.10.1 Analysen geschlechtsspezifischer Prädiktoren der Leistungen in Französisch Bei einer ersten Betrachtung der geschlechtsspezifischen Korrelationen der sprachlichen Leistungen in Französisch fällt zunächst auf, dass die Variablen, die bei den Mädchen signifikante Zusammenhänge mit den sprachlichen Leis‐ tungen im Französischen aufweisen, vielfältiger und zahlreicher sind als bei den Jungen (vgl. Anhang 7.2). Da die Signifikanz aber von der Stichprobengröße abhängt, welche bei den Mädchen (n (w) = 47-52) ein wenig größer ausfällt 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 475 234 Die Stichprobengrößen der Korrelationsanalysen variieren leicht aufgrund einzelner fehlender Werte. 235 Ab r s > .10 handelt es sich um eine schwache Korrelation, ab r s > .30 um eine mittelstarke und ab r s > .50 um eine starke Korrelation (vgl. Cohen 1988: 79-81). als bei den Jungen (n (m) = 31-40) 234 , müssen auch die nicht signifikanten Kor‐ relationen und insbesondere die Höhe der einzelnen Korrelationskoeffizienten genauer betrachtet werden, wobei die Klassifizierung nach Cohen (1988: 79-81) berücksichtigt wird. 235 - 11.10.1.1 Geschlechtsspezifische Prädiktoren für die Gesamtleistung in Französisch Die fremdsprachliche Gesamtleistung der Mädchen weist jeweils einen signifi‐ kanten positiven Zusammenhang mit dem schlussfolgernden Denken (r s = .41**), der integrativen Orientierung gepaart mit dem Ideal L3 Self (r s = .29*), der L3 WTC (r s = .35*), dem FFL Selbstkonzept (r s = .47**), der wahrgenommenen Un‐ terstützung durch die Französischlehrkraft (r s = .28*) und der wahrgenommenen Aufmerksamkeitsverteilung der Lehrkraft zugunsten der Mädchen (r s = .34*) auf (vgl. Anhang 7.2). Des Weiteren zeigen instrumentelle Orientierung (r s = .22), Häufigkeit der Freizeitaktivitäten auf Französisch (r s = .27), Interesse am Fach Französisch (r s = .25) und die Länge des Auslandsaufenthalts (r s = .25) nicht si‐ gnifikante, aber schwache positive Korrelationen mit der sprachlichen Gesamt‐ leistung der Mädchen (vgl. Anhang 7.2). Entsprechende Regressionsanalysen kommen bei den Mädchen zu folgenden Ergebnissen (vgl. Tabelle 85): 476 11 Auswertung der Ergebnisse Abhängige Variable: Gesamt‐ ergebnis der Französischtests Mädchen - B SE (B) β p Korrigiertes R² Modell 1a (n = 50) Konstante 18.458 7.641 - .020 .257 (p = .001) SPM FFS Selbstk. W. Auf. z. d. M. .179 3.397 3.068 .118 1.381 1.674 .20 .34 .24 .137 .018 .073 Modell 1b (n = 50) Konstante 22.365 6.923 - .002 .236 (p = .001) SPM FFS Selbstk. W. Unt. d. FLK .192 3.068 2.091 .122 1.562 1.470 .21 .31 .21 .123 .056 .162 Modell 1c (n = 50) Konstante 30.463 6.247 - .000 .229 (p = .002) SPM FFS Selbstk. W. Erw. d. Peers .155 4.795 -2.531 .119 1.385 2.005 .17 .48 -.17 .199 .001 .213 Modell 1d (n = 50) Konstante 30.589 8.036 - .000 .208 (p = .003) SPM FFS Selbstk. W. Erw. d. Elt. .131 4.198 -.981 .126 1.346 1.835 .15 .42 -.07 .302 .003 .596 Modell 1e (n = 50) Konstante 14.353 7.862 - .074 .250 (p = .001) SPM L3 WTC W. Auf. z. d. M. .260 3.653 3.419 .112 1.552 1.643 .29 .30 .27 .025 .023 .043 Modell 1f (n = 50) Konstante 14.870 8.337 - .081 .194 (p = .001) SPM Int. Or./ Id. L3 S. W. Auf. z. d. M. .230 3.112 4.207 .121 2.227 1.650 .25 .18 .33 .063 .169 .014 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 85: Regressionsmodelle 1a bis 1 f zum Gesamtergebnis der Mädchen in den Französischtests Bei der Berechnung des Regressionsmodells 1a (vgl. Tabelle 85), das die jeweils am stärksten korrelierenden Faktoren aus den Bereichen der kognitiven Grund‐ fertigkeiten, der endogenen affektiven Faktoren und dem Ought-to L3 Self auf 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 477 ihre Prädiktorstärke für die fremdsprachliche Gesamtleistung der Mädchen im Französischen prüft, wird deutlich, dass das FFS Selbstkonzept (β = .34*) als stärkster signifikanter Prädiktor agiert und sowohl das schlussfolgernde Denken (β = .20) als auch die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen (β-= .24) als schwache, nicht signifikante Prädiktoren für die Gesamtleistung der Mädchen im Französischen wirken. Bei den Prüfungen der weiteren Faktoren des Ought-to L3 Self auf ihre Funktion als mögliche Prädiktoren für die Gesamtleistung der Mädchen im Französischen, welche durchgeführt werden, um im Anschluss eine bessere Ver‐ gleichbarkeit mit der Gruppe der männlichen Französischlernenden herstellen zu können, wird in Modell 1b (vgl. Tabelle 85) sichtbar, dass die wahrgenommene Unterstützung durch die Französischlehrkraft (β-=-.21) ebenfalls als schwacher, nicht signifikanter Prädiktor für die Gesamtleistung im Französischen wirkt, während die Modelle 1c und 1d (vgl. Tabelle 85) zeigen, dass die wahrgenom‐ mene Erwartung durch die Peers einen schwachen nicht signifikanten negativen Prädiktor darstellt und die wahrgenommene Erwartung der Eltern keine rele‐ vante Prädiktorstärke aufweist. Modell 1a, das das schlussfolgernde Denken, das FFS Selbstkonzept und die wahrgenommene Aufmerksamkeitsverteilung zugunsten der Mädchen als Prädiktoren einschließt, besitzt mit 25.7% (korri‐ giertes R² = .257) die höchste Varianzaufklärung für die Gesamtleistung. Modell 1e und 1 f (vgl. Tabelle 85) zeigen jedoch, dass insbesondere die L3 WTC einen signifikanten Prädiktor darstellt und auch die integrative Orientierung gepaart mit dem Ideal L3 Self einen schwachen, nicht signifikanten Prädiktor bildet, jedoch sind diese jeweils nicht so stark ausgeprägt wie die Prädiktorstärke des FFS Selbstkonzepts (vgl. Modell 1a, Tabelle 85). Betrachtet man die Korrelationsmatrix der Jungen, wird lediglich ein signi‐ fikanter positiver Zusammenhang der fremdsprachlichen Gesamtleistung mit dem Arbeitstempo (BZO) (r s = .49**), der Konzentrationsleistung (r s = .35*) und dem FFS Selbstkonzept (r s = .34*) gemessen (vgl. Anhang 7.2). Schwach positiv, aber nicht signifikant korreliert die fremdsprachliche Gesamtleistung der Jungen außerdem mit der Länge des Auslandsaufenthalts (r s = .29). Bei der wahrgenommenen Unterstützung durch die Französischlehrkraft (r s = -.23), der wahrgenommenen Aufmerksamkeitsverteilung der Französischlehrkraft zugunsten der Mädchen (r s = -.25) und den wahrgenommenen Erwartungen der Peers (r s = -.15) werden bei den Jungen hingegen nicht signifikante schwache negative Korrelationen mit der fremdsprachlichen Gesamtleistung festgestellt (vgl. Anhang 7.2). Regressionsanalysen bezüglich möglicher Prädiktoren der Gesamtleistung der Jungen zeigen folgende Ergebnisse (vgl. Tabelle 86): 478 11 Auswertung der Ergebnisse Abhängige Variable: Gesamt‐ ergebnis der Französischtests Jungen - B SE (B) β p Korri‐ giertes R² Modell 1a (n = 32) Konstante 11.117 18.239 - .547 .290 (p = .005) BZO FFS Selbstk. W. Auf. z. d. M. .297 5.202 -3.021 .144 1.796 2.062 .33 .44 -.23 .049 .007 .154 Modell 1b (n = 33) Konstante 25.499 11.815 - .039 .308 (p = .003) BZO FFS Selbstk. W. Unt. d. FLK .113 4.758 -3.804 .043 1.767 2.232 .39 .40 -.25 .015 .012 .099 Modell 1c (n = 33) Konstante 18.433 11.127 - .109 .242 (p = .013) BZO FFS Selbstk. W. Erw. d. Peers .103 5.038 -2.162 .048 1.851 2.547 .35 .43 -.14 .042 .011 .403 Modell 1d (n = 33) Konstante -8.578 14.550 - .560 .275 (p = .006) BZO FFS Selbstk. W. Erw. d. Elt. .374 4.530 1.780 .134 1.845 1.912 .43 .38 .14 .009 .020 .359 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 86: Regressionsmodelle 1a bis 1d zum Gesamtergebnis der Jungen in den Fran‐ zösischtests Es wird ersichtlich, dass in Modell 1b (vgl. Tabelle 86), welches die höchste Varianzaufklärung besitzt und 30.8% der Leistungen der Jungen erklärt (vgl. Tabelle 86), das Arbeitstempo (BZO) (β = .39*) und das FFS Selbstkonzept (β = .40*) signifikante positive Prädiktoren für die Gesamtleistung der Jungen im Französischen darstellen und die wahrgenommene Unterstützung durch die Lehrkraft (β = -.25) als nicht signifikanter negativer Prädiktor fungiert. Je höher also die Unterstützung der Lehrkraft ist, desto niedriger fällt tendenziell die Gesamtleistung der Jungen aus - ein Phänomen, das im Zuge der Interpretation der Ergebnisse auf mögliche Ursachen untersucht werden wird (vgl. Kapitel 12.1). 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 479 In Modell 1a zeigt sich, dass die wahrgenommene Aufmerksamkeitsvertei‐ lung der Lehrkräfte zugunsten der Mädchen (β = -.23) einen negativen, nicht signifikanten Einfluss auf die Gesamtleistung der Jungen im Französischen hat. Modell 1c (vgl. Tabelle 86) veranschaulicht darüber hinaus, dass die wahr‐ genommenen Erwartungen der Peers (β = -.14) einen sehr geringen negativen Einfluss haben. Je höher also die Erwartungen der Peers sind, desto niedriger fällt tendenziell die Gesamtleistung der Jungen aus. Mögliche Ursachen für dieses Phänomen werden in Kapitel 12.1 analysiert. In Modell 1d (vgl. Tabelle 86) wird wiederum ersichtlich, dass die wahrgenom‐ menen Erwartungen der Eltern (β = .14) einen sehr geringen, nicht signifikanten positiven Einfluss auf die sprachliche Gesamtleistung der Jungen ausüben, weshalb die wahrgenommenen Erwartungen der Eltern die einzige Variable der untersuchten Konstrukte des Ought-to L3 Self darstellt, die sich leicht positiv auf die fremdsprachliche Gesamtleistung der Jungen im Französischen auswirkt. Die negativen Einflüsse auf die Gesamtleistung der Jungen, die vor allem bei der durch die Jungen wahrgenommenen Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen und bei der wahrgenommenen Unterstützung der Französischlehrkraft (vgl. Modell 1b, Tabelle 86) gemessen wurden, könnten folglich einen der Gründe für den Geschlechterunterschied zugunsten der Mädchen in der Gesamtleistung im Französischen darstellen. Eine detaillierte statistische Untersuchung bezüglich der Frage, inwiefern sich diese Tendenz auch in den einzelnen Teilleistungen bestätigt oder aber jeweils andere bzw. anders gewichtete Einflüsse zu verzeichnen sind, wird daher in den folgenden Teilkapiteln durchgeführt. - 11.10.1.2 Geschlechtsspezifische Prädiktoren für die Hörverstehensleistung in Französisch Zunächst wird die Hörverstehensleistung analysiert, bei der keinerlei statistisch relevante Geschlechterunterschiede (p = .424, d = .178; vgl. Kapitel 11.4.1.1) zu verzeichnen sind. Die Leistung der Mädchen im Hörverstehen korreliert signifikant positiv mit dem schlussfolgernden Denken (r s = .50**) und mit der instrumentellen Orientierung (r s = .32*), welche bei den Mädchen zu allen anderen untersuchten Teilfertigkeiten keine signifikante Korrelation aufweist. Außerdem finden sich signifikante Zusammenhänge der Hörverstehensleistung der Mädchen mit der L3 WTC (r s = .30*), der Häufigkeit der Freizeitaktivitäten auf Französisch (r s = .31*), dem FFS Selbstkonzept (r s = .34*), der wahrgenom‐ menen Unterstützung durch die Französischlehrkraft (r s = .30*) und mit der wahrgenommenen Aufmerksamkeitsverteilung der Lehrkräfte zugunsten der Mädchen (r s -=-.33*; vgl. Anhang 7.2). 480 11 Auswertung der Ergebnisse Bei der Durchführung von Regressionsanalysen bezüglich der Hörverste‐ hensleistung der Mädchen zeigt sich erneut, dass sowohl das schlussfolgernde Denken (β = .42**) als auch die Unterstützung durch die Lehrkraft (β = .30*) signifikante Prädiktoren für ihre Hörverstehensleistung darstellen und die wahrgenommene Aufmerksamkeitsverteilung zugunsten der Mädchen sich ebenfalls leicht positiv (β = .22) auf die Hörverstehensleistung auswirkt (vgl. Modell 1, Tabelle 87). Modell 2a (vgl. Tabelle 87) zeigt, dass die instrumentelle Orientierung kaum Einfluss auf die Hörverstehensleistung der Mädchen hat (β = .13) und Modell 2b (vgl. Tabelle 87) veranschaulicht, dass das FFS Selbst‐ konzept keinerlei Einfluss auf die Hörverstehensleistung der Mädchen zeigt (β-=-.04). Abhängige Variable: Gesamt‐ ergebnis der Französischtests Jungen - B SE (B) β p Korri‐ giertes R² Modell 1 (n = 50) Konstante 1.084 7.987 - .893 .302 (p = .000) SPM W. Unt. d. FLK W. Auf. z. d. M. .389 3.074 2.928 .112 1.303 1.679 .42 .30 .22 .001 .023 .088 Modell 2a (n = 50) Konstante -.771 8.195 - -.094 .302 (p = .000) SPM Instr. Orient. W. Unt. d. FLK W. Auf. z. d. M. .360 1.655 2.693 3.218 .115 1.643 1.357 1.703 .39 .13 .26 .25 .003 .319 .053 .065 Modell 2b (n = 50) Konstante 1.435 8.180 - .861 .287 (p = .001) SPM FFS Selbstk. W. Unt. d. FLK W. Auf. z. d. M. .376 .416 2.887 2.840 .122 1.586 1.498 1.729 .40 .04 .28 .22 .004 .795 .060 .108 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 87: Regressionsmodelle 1 bis 3 zum Ergebnis der Mädchen im Hörverstehenstest in Französisch Bei den Jungen besteht hingegen, ähnlich wie bei der Gesamtleistung, lediglich ein signifikanter Zusammenhang der Hörverstehensleistung mit dem FFS Selbst‐ 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 481 konzepts (r s -=-.37*) und es finden sich einige schwache, nicht signifikante Zusam‐ menhänge zum Arbeitstempo (BZO, r s = .21), zum schlussfolgernden Denken (r s = .23) und zur Länge des Auslandsaufenthalts (r s = .29). Des Weiteren werden schwache, nicht signifikante negative Korrelationen der Hörverstehensleistung mit der Unterstützung durch die Lehrkraft (r s = -.23) und die wahrgenommenen Erwartungen der Peers (r s -=--.15) gemessen (vgl. Anhang 7.2). Regressionsanalysen zeigen, dass, wie aus Modell 1a (vgl. Tabelle 88) ersicht‐ lich wird, das FFS Selbstkonzept (β = .43*) einen deutlich stärkeren Prädiktor für die Hörverstehensleistung der Jungen darstellt als das schlussfolgernde Denken (β = .20). Modell 1a zeigt außerdem, dass die wahrgenommenen Erwartungen durch die Peers (β-= -.29) einen nicht signifikanten negativen Prädiktor für die Hörverstehensleistung der Jungen darstellt. Modell 1b (vgl. Tabelle 88) belegt außerdem, dass ein nicht signifikanter nega‐ tiver Einfluss der wahrgenommenen Unterstützung durch die Französischlehrkraft (β = -.32) vorhanden ist. Beide Ergebnisse entsprechen den Regressionsanalysen bezüglich der Gesamtleistung der Jungen im Französischen. Die Länge des Aus‐ landsaufenthalts erweist sich hingegen als statistisch nicht relevanter Prädiktor, weshalb diese Variable nicht in die Modelle aufgenommen wird. Abhängige Variable: Er‐ gebnis des Hörverstehens‐ tests in Französisch Jungen - B SE (B) β p Korri‐ giertes R² Modell 1a (n = 31) Konstante 17.010 15.684 - .288 .211 (p = .024) SPM FFS Selbstk. W. Erw. d. Peers .333 4.803 -4.393 .278 1.831 2.508 .20 .43 -.29 .241 .014 .091 Modell 1b (n = 31) Konstante 19.250 15.689 - .230 .189 (p = .031) SPM FFS Selbstk. W. Unt. d. FLK .389 4.619 -4.133 .279 1.867 2.138 .23 .41 -.32 .175 .020 .063 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 88: Regressionsmodell zum Ergebnis der Jungen im Hörverstehenstest in Fran‐ zösisch 482 11 Auswertung der Ergebnisse 236 Aufgrund der hohen Interkorrelation zwischen FFS Selbstkonzept und integrativer Orientierung gepaart mit Ideal L3 Self (r s = .58**; vgl. Anhang 7.2) kann kein Modell berechnet werden, in das beide Variablen als Prädiktoren aufgenommen werden und ein Regressionsmodell, das HISEI und integrative Orientierung gepaart mit Ideal L3 Self aufnimmt, ist nicht signifikant, weshalb dieses hier nicht dargestellt wird. Ein Vergleich der jeweiligen Einflussfaktoren auf die Hörverstehensleistung der Jungen und der Mädchen offenbart, in Analogie zu den Analysen der Einflussfaktoren auf die Gesamtleistung, dass die wahrgenommene Unterstüt‐ zung durch die Französischlehrkraft gegenläufige Einflüsse entfaltet: bei den Mädchen übt die wahrgenommene Unterstützung durch die Französischlehr‐ kraft einen signifikant positiven und bei den Jungen einen fast gleich großen, allerdings negativen Einfluss auf die Hörverstehensleistung aus. Außerdem korreliert bei den Mädchen die Hörverstehensleistung nicht mit den wahrge‐ nommenen Erwartungen der Peers, während bei den Jungen sogar ein schwa‐ cher, nicht signifikanter negativer Einfluss der wahrgenommenen Erwartungen der Peers gemessen wird. - 11.10.1.3 Geschlechtsspezifische Prädiktoren für die Leseverstehensleistung in Französisch Die in Bezug auf das Hörverstehen gefundenen Tendenzen setzen sich auch bei den anderen untersuchten sprachlichen Fertigkeiten fort: Die Leistung im Le‐ severstehen korreliert bei den Mädchen signifikant mit dem FFS Selbstkonzept (r s = .49**). Zum HISEI (r s = .27) und zur integrativen Orientierung gepaart mit dem Ideal L3 Self (r s = .20) bestehen darüber hinaus schwache, nicht signifikante positive Korrelationen (vgl. Anhang 7.2). Führt man eine Regressionsanalyse mit dem HISEI und dem FFS Selbstkon‐ zept als unabhängige Variablen durch, entpuppt sich das FFS Selbstkonzept (β = .42*) als signifikanter Prädiktor und auch der sozioökonomische Status, der mittels des HISEI erfasst wurde, stellt einen schwachen, nicht signifikanten Prädiktor (β = .19) für die Leseverstehensleistung der Mädchen im Französischen dar (vgl. Tabelle 89). 236 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 483 Abhängige Variable: Er‐ gebnis des Leseverstehens‐ tests in Französisch Mädchen - B SE (B) β p Korri‐ giertes R² Modell (n = 49) Konstante 38.339 4.462 - .000 .206 (p = .002) HISEI FFS Selbstk. .069 4.398 .049 1.380 .19 .42 .161 .003 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 89: Regressionsmodell zum Ergebnis der Mädchen im Leseverstehenstest in Französisch Die Leseverstehensleistung der Jungen zeigt hingegen einen signifikanten positiven Zusammenhang mit dem Arbeitstempo (BZO; r s = .36*) und nicht signifikante positive Zusammenhänge mit der Konzentrationsleistung (KL; r s = .31) und dem HISEI (r s = .24). Außerdem korreliert die Leseverstehensleistung der Jungen signifikant negativ mit der wahrgenommenen Aufmerksamkeits‐ verteilung der Französischlehrkräfte zugunsten der Mädchen (r s = -.38*; vgl. Anhang 7.2). Führt man eine Regressionsanalyse durch, so wird ersichtlich, dass der HISEI (β-=-.38*) einen signifikanten positiven Einfluss auf die Leseverstehensleistung der Jungen und die wahrgenommene Aufmerksamkeitsverteilung der Franzö‐ sischlehrkräfte zugunsten der Mädchen (β = -.38*) einen signifikanten negativen Einfluss auf die Leseleistung der Jungen hat (vgl. Tabelle 90). Dies bedeutet, dass je stärker die Jungen den Eindruck haben, dass die Aufmerksamkeit der Franzö‐ sischlehrkräfte eher den Mädchen gewidmet ist als ihnen, desto schlechter fallen ihre Leseverstehensleistung im Französischen aus. Hier wird also der negative Einfluss einer verstärkten Aufmerksamkeitsfokussierung auf die Mädchen bei gleichzeitiger Vernachlässigung der Jungen durch die Französischlehrkräfte auf die Leseleistung der Jungen statistisch sichtbar, wobei dies unter anderem die tendenziell höheren Leseverstehensleistungen der Mädchen erklären könnte. 484 11 Auswertung der Ergebnisse 237 Einige andere Korrelationen mit der Leistung in Teilaufgabe 2 des Leseverstehenstests, beispielsweise diejenige der Sorgfalt der Arbeitsweise (r s = -.23) oder der L3 WTC (r s = -.27) fallen bei den Mädchen ebenfalls schwach negativ aus. Diese werden allerdings aufgrund des inhaltlich nicht plausiblen Ergebnisses nicht in die Regressionsanalyse mit aufgenommen. Abhängige Variable: Er‐ gebnis des Leseverstehens‐ tests in Französisch Jungen - B SE (B) β p Korri‐ giertes R² Modell (n = 33) Konstante 32.546 22.239 - .155 .278 (p = .009) HISEI BZO W. Auf. z. d. M. .199 .258 -5.600 .083 .178 2.492 .38 .24 -.38 .024 .159 .031 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 90: Regressionsmodell zum Ergebnis der Jungen im Leseverstehenstest in Fran‐ zösisch Bei einer Analyse der geschlechtsspezifischen Korrelationen der einzelnen Va‐ riablen mit den Ergebnissen der zweiten Teilaufgabe (LV-33 Kurze Geschichte) des Leseverstehenstests, bei der ein signifikanter Geschlechterunterschied mit großem Effekt zugunsten der Mädchen gemessen wurde (p = .000, d = .765, vgl. Kapitel 11.4.2.1), ergeben sich bei den Mädchen keine signifikanten Korre‐ lationen mit den untersuchten Faktoren. Dennoch zeigen sich eine schwache, nicht signifikante positive Korrelation der Leistung im sorgfältig-genauen Lesen des narrativen Textes der zweiten Teilaufgabe mit dem HISEI (r s = .15) und eine schwache nicht signifikante negative Korrelation mit der geschlechterstereotyp weiblichen Wahrnehmung des Französischen (r s = -.20; vgl. Anhang 7.2). 237 Ein Regressionsmodell zeigt, dass der HISEI (β = .29*) einen signifikanten positiven Prädiktor für die Leistung in der zweiten Teilaufgabe des Lesevers‐ tehenstests darstellt und die genderstereotyp weibliche Wahrnehmung des Französischen (β = -.35*) einen signifikant negativen (vgl. Tabelle 91). Umso weniger die Mädchen also das Französische als genderstereotyp weibliche Sprache wahrnehmen, desto besser fällt ihre Leistung in der zweiten Teilaufgabe des Leseverstehenstests aus. 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 485 Abhängige Variable: Ergebnis in Teilaufgabe 2 (LV-33 Kurze Geschichte) des Leseverste‐ henstests in Französisch Mädchen - B SE (B) β p Korri‐ giertes R² Modell (n = 49) Konstante 4.803 .406 - .000 .131 (p = .015) HISEI Gend. w. Wahrn. .010 -.389 .005 .153 .29 -.35 .041 .014 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 91: Regressionsmodell zum Ergebnis der Mädchen in Teilaufgabe 2 (LV-33, Kurze Geschichte) des Leseverstehenstests in Französisch Auch bei den Jungen sind keinerlei signifikante Korrelationen der Ergebnisse der zweiten Teilaufgabe des Leseverstehenstests mit den anderen Variablen messbar; schwache, nicht signifikante positive Korrelationen treten mit dem HISEI (r s = .16), dem Arbeitstempo (r s = .16), der integrativen Orientierung gepaart mit dem Ideal L3 Self (r s = .25), dem Interesse am Fach Französisch (r s = .31), der genderstereotyp weiblichen Wahrnehmung des Französischen (r s = .25) und den wahrgenommenen Erwartungen der Peers (r s = .23) auf. Ein negativer Zusammenhang findet sich hingegen erneut mit der wahrgenom‐ menen Aufmerksamkeitsverteilung zugunsten der Mädchen (r s = -.30). Bei der Durchführung einer Regressionsanalyse mit den jeweils am stärksten korrelie‐ renden Faktoren der einzelnen Teilbereiche wird ersichtlich, dass der HISEI (β-= .36*) und das Interesse am Fach (β-=-.34*) signifikante positive Prädiktoren für die Leseverstehensleistung in Teilaufgabe 2 (LV-33 Kurze Geschichte) dar‐ stellen, während die wahrgenommene Aufmerksamkeit zugunsten der Mädchen (β = -.34*) - wie bereits in der Gesamtleistung des Leseverstehens - einen signifikanten negativen Prädiktor darstellt (vgl. Tabelle 92), was wiederum die signifikant niedrigeren Ergebnisse der Jungen bei dieser Teilaufgabe teilweise erklären könnte. 486 11 Auswertung der Ergebnisse Abhängige Variable: Ergebnis von Teilaufgabe 2 (LV-33 Kurze Geschichte) des Leseverste‐ henstests in Französisch Jungen - B SE (B) β p Korri‐ giertes R² Modell (n = 33) Konstante 3.270 1.164 - .009 .259 (p = .008) HISEI Int. a. Fach Frz. W. Auf. z. d. M. .023 .569 -.633 .010 .258 .285 .36 .34 -.34 .029 .036 .034 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 92: Regressionsmodell zum Ergebnis der Jungen in Teilaufgabe 2 (LV-33 Kurze Geschichte) des Leseverstehenstests in Französisch Es kann also festgehalten werden, dass sich bei beiden Geschlechtergruppen der sozioökonomische Status (HISEI) als Prädiktor für die Leseleistung herauskris‐ tallisiert, wobei dessen Einfluss bei den Jungen stärker ist als bei den Mädchen. Bei den Mädchen wirkt sich das FFS Selbstkonzept von allen untersuchten Va‐ riablen am stärksten auf die Leseleistung aus und bei der zweiten Teilaufgabe übt die genderstereotyp weibliche Wahrnehmung der französischen Sprache einen signifikant negativen Einfluss auf die Leistung der Mädchen aus, was eventuell auf das Thema des Textes, der von einer Antarktisexpedition und somit nicht von einem genderstereotyp weiblichen Thema handelt, zurückzuführen sein könnte. Bei den Jungen wird neben dem HISEI bezüglich der zweiten Teilaufgabe auch das Interesse am Fach Französisch als signifikant positive Einflussvariable berechnet. Sowohl für die gesamte Leseverstehensleistung der Jungen als auch für ihre Ergebnisse aus der zweiten Teilaufgabe stellt die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen einen signifikanten negativen Prädiktor dar, was einen Erklärungsansatz für die gemessenen Geschlechterunterschiede zugunsten der Mädchen beim Lese‐ verstehen liefern kann. - 11.10.1.4 Geschlechtsspezifische Prädiktoren für die Schreibleistung in Französisch Bei einer Analyse möglicher geschlechtsspezifischer Einflussfaktoren auf die gesamte Schreibleistung (Rating 2) wird bei den Mädchen ein signifikanter 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 487 Zusammenhang mit dem schlussfolgernden Denken (r s = .37**), der integrativen Orientierung gepaart mit dem Ideal L3 Self (r s = .35*), der L3 WTC (r s = .41**), dem Interesse am Fach Französisch (r s = .37**), mit den Einstellungen zur französischen Zielkultur (r s = .28*), dem FFS Selbstkonzept (r s = .44**), der wahr‐ genommenen Aufmerksamkeitsverteilung zugunsten der Mädchen (r s = .37**) und mit der Länge des Aufenthalts im französischsprachigen Ausland (r s = .36*) gemessenen. Darüber hinaus tritt bei der Schreibleistung der Mädchen, ähnlich wie bei ihrer Gesamtleistung und ihrer Hörverstehensleistung, eine schwache, nicht signifikante Korrelation mit der wahrgenommenen Unterstützung durch die Französischlehrkraft (r s = .27) und eine schwache negative Korrelation mit den wahrgenommenen Erwartungen der Eltern (r s = -.22) auf (vgl. Anhang 7.2). Bei einer Regressionsanalyse zeigt sich, dass sowohl das schlussfolgernde Denken (β = .22) als auch die L3 WTC (β = .31*) und die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen (β = .26) positive Prädiktoren für die Schreibleistung der Mädchen darstellen und die Variable der wahrgenommenen Erwartungen der Eltern lediglich einen ganz schwachen negativen, nicht signifikanten Prädiktor bildet (β = -.14; vgl. Tabelle 93). Abhängige Variable: Er‐ gebnis des Schreibtests in Französisch (Rating 2) Mädchen - B SE (B) β p Korri‐ giertes R² Modell (n = 33) Konstante 10.169 13.988 - .471 .247 (p = .002) SPM L3 WTC W. Auf. z. d. M. W. Erw. d. Elt. .285 5.216 4.661 -2.685 .168 2.208 2.359 2.554 .22 .31 .26 -.14 .097 .023 .054 .299 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 93: Regressionsmodell zum Ergebnis der Mädchen im Schreibtest in Französisch (Rating 2) Bei den Jungen korreliert die Schreibleistung im Französischen, wie dies auch schon beim Leseverstehen und der Gesamtleistung zu beobachten war, signifi‐ kant mit dem Arbeitstempo (BZO; r s = .47**), der Konzentrationsleistung (KL; r s = .36*), dem schlussfolgernden Denken (r s = .36*), dem Index der kognitiven 488 11 Auswertung der Ergebnisse 238 Die genderstereotyp weibliche Wahrnehmung des Französischen wurde ebenfalls auf Prädiktorstärke für die Schreibleistung der Jungen untersucht, zeigte sich aber als statistisch nicht relevant. Grundfertigkeiten (r s = .38*) und dem FFS Selbstkonzept (r s = .43*). Ein nicht signifikanter, schwacher Zusammenhang liegt zwischen der Schreibleistung der Jungen und den wahrgenommenen Erwartungen der Eltern (r s = .30) vor. Die wahrgenommene Aufmerksamkeitsverteilung zugunsten der Mädchen zeigt dieses Mal keinen statistisch relevanten Zusammenhang zur Schreibleistung (r s = -.04), jedoch tritt eine schwache negative, nicht signifikante Korrelation mit der genderstereotyp weiblichen Wahrnehmung des Französischen (r s = -.20) auf. Abgesehen vom FFS Selbstkonzept finden sich unter den endogenen affektiven Faktoren erneut nur sehr schwache Korrelationen mit der Schreibleistung z.-B. von der L3 WTC (r s = .15) oder den Einstellungen zur Zielkultur (r s = .17), was einen deutlichen Unterschied zu den Mädchen darstellt, bei denen die en‐ dogenen affektiven Faktoren stärker und oft signifikant mit der Schreibleistung korrelieren (vgl. Anhang 7.2). Führt man hinsichtlich der Schreibleistung der Jungen im Französischen eine Regressionsanalyse durch, so erweisen sich das Arbeitstempo (β-= .44*) und das FFS Selbstkonzept (β-= .42*) als signifikante po‐ sitive Prädiktoren für die Schreibleistung der Jungen und die wahrgenommenen Erwartungen der Eltern (β = .18) bilden einen nicht signifikanten schwach positiven Prädiktor (vgl. Tabelle 94). 238 Abhängige Variable: Er‐ gebnis des Schreibtests in Französisch (Rating 2) Jungen - B SE (B) β p Korri‐ giertes R² Modell (n = 31) Konstante -36.109 20.396 - .088 .339 (p = .003) BZO FFS Selbstk. W. Erw. d. Elt. .542 7.034 3.139 .188 2.555 2.664 .44 .42 .18 .008 .010 .249 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 94: Regressionsmodell zum Ergebnis der Jungen im Schreibtest in Französisch (Rating 2) 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 489 Nun werden diejenigen Teilbereiche des Schreibens im Französischen auf Korre‐ lationen und Prädiktoren untersucht, bei denen die Mädchen signifikant höhere Leistungen erzielten als die Jungen. An erster Stelle steht die im ersten Rating gemessene Sprachhandlungskompetenz, bei der ein signifikanter Unterschied zugunsten der Mädchen festgestellt wurde (p = .031, d = .452; vgl. Kapitel 11.4.3.1). Bei den weiblichen Französischlerinnen können erneut zahlreiche signifikante positive Korrelationen zwischen der Sprachhandlungskompetenz und den endogenen affektiven Faktoren nachgewiesen werden, wobei die höchsten mit der integrativen Orientierung gepaart mit dem Ideal L3 Self (r s = .39**), dem FFS Selbstkonzept (r s = .40**) und der L3 WTC (r s = .45**) auf‐ treten. Außerdem wird bei den Mädchen eine signifikante negative Korrelation zwischen Sprachhandlungskompetenz und L3-Angst (r s = -.35*) gemessen und es ist erneut eine signifikante positive Korrelation mit der wahrgenommenen Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen (r s = .39**) feststellbar. Auch zwischen der Sprachhandlungskompetenz und der Länge des Auslandsaufenthalts tritt bei den Mädchen eine signifikante positive Korrelation auf (r s = .45**; vgl. Anhang 7.2). Regressionsrechnungen ergeben, dass insbesondere die integrative Orientierung gepaart mit dem Ideal L3 Self (β = .28*), die Länge des Auslandsaufenthalts (β = .26) sowie in etwas schwä‐ cherem Maße die wahrgenommene Aufmerksamkeitsverteilung zugunsten der Mädchen (β-= .18) Prädiktoren für die Sprachhandlungskompetenz der Mädchen im Französischen darstellen. Die L3-Angst (β = -.15) zeigt hingegen einen schwa‐ chen, nicht signifikanten negativen Einfluss auf die Sprachhandlungskompetenz der Mädchen (vgl. Tabelle 95). 490 11 Auswertung der Ergebnisse Abhängige Variable: Er‐ gebnis im Bereich Sprach‐ handlungskompetenz im Schreibtest in Französisch (Rating 1) Mädchen - B SE (B) β p Korri‐ giertes R² Modell (n = 50) Konstante 1.494 1.134 - .194 .249 (p = .002) Int. Or./ Id. L3 S. W. Auf. z. d. M. L3-Angst L. d. Ausl.auf. .645 .293 -.176 .195 .293 .235 .161 .106 .28 .18 -.15 .26 .033 .219 .281 .071 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 95: Regressionsmodell zur Sprachhandlungskompetenz der Mädchen im Schreib‐ test in Französisch (Rating 1) Bei den Jungen treten erneut signifikante positive Korrelation der Sprachhand‐ lungskompetenz mit dem Arbeitstempo (r s = .49**), der Konzentrationsleistung (r s = .39*), dem FFS Selbstkonzept (r s = .45**) und mit den wahrgenommenen Erwartungen der Eltern (r s = .40*) zutage. Außerdem gibt es einen schwachen Zusammenhang zwischen der Sprachhandlungskompetenz der Jungen und dem sozioökonomischen Status (HISEI; r s = .20; vgl. Anhang 7.2). Die signifikant korrelierenden Variablen entpuppen sich in der Regressionsanalyse auch als signifikante Prädiktoren für die Leistung der Jungen im Bereich der Sprachhand‐ lungskompetenz, wobei das Arbeitstempo (β = .39*) den stärksten Prädiktor bildet, gefolgt von der wahrgenommenen Erwartung durch die Eltern (β = .36*), dem FFS Selbstkonzept (β = .32*) und dem sozioökonomischen Status (β = .22; vgl. Tabelle 96). 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 491 Abhängige Variable: Er‐ gebnis im Bereich Sprach‐ handlungskompetenz im Schreibtest in Französisch (Rating 1) Jungen - B SE (B) β p Korri‐ giertes R² Modell (n = 31) Konstante -4.300 1.910 - .033 .386 (p = .002) BZO HISEI FFS Selbstk. W. Erw. d. Elt. .045 .013 .506 .578 .017 .008 .229 .240 .39 .22 .32 .36 .013 .125 .036 .023 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 96: Regressionsmodell zur Sprachhandlungskompetenz der Jungen im Schreibtest in Französisch Aus den statistischen Analysen ergibt sich demnach, dass kein negativer Prä‐ diktor für die Sprachhandlungskompetenz der Jungen gefunden wird. Vielmehr wird erneut ersichtlich, dass tendenziell sehr schwache und oft statistisch nicht relevante Korrelationen zwischen den endogenen affektiven Faktoren und der Sprachhandlungskompetenz der Jungen gemessen werden, was einen deutlichen Unterschied zu den Mädchen darstellt und ein Erklärungsansatz für die schwächere Leistung der Jungen bieten könnte. Insbesondere bei der wahr‐ genommenen Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen ist festzustellen, der diese sich eindeutig vorteilhafter auf die Sprachhandlungskompetenz der Mädchen auswirkt und keinerlei Korrelation mit der Leistung der Jungen zeigt. Auch bei der produzierten Wortanzahl im Schreibtest in Französisch wurde im zweiten Rating ein signifikanter Unterschied zugunsten der Mädchen ge‐ messen (p = .017, d = .525, vgl. Kapitel 11.4.3.1). Bei den weiblichen Lernenden korreliert die produzierte Wortanzahl signifikant mit dem schlussfolgernden Denken (r s = .37**), der L3 WTC (r s = .33*), der Häufigkeit der durchgeführten Freizeitaktivitäten auf Französisch (r s = .33*) und der wahrgenommenen Auf‐ merksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen (r s = .44**; vgl. Anhang 7.2). In Tabelle 97 wird ersichtlich, dass die wahrgenom‐ mene Aufmerksamkeitsverteilung zugunsten der Mädchen (β = .33*) auch als stärkster Prädiktor für die produzierte Wortanzahl der Mädchen im Schreibtest 492 11 Auswertung der Ergebnisse gilt, die anderen drei genannten Faktoren aber ebenfalls als positive Prädiktoren wirken. Abhängige Variable: Er‐ gebnis in Wortanzahl (klas‐ sifiziert) des Schreibtests in Französisch (Rating 2) Mädchen - B SE (B) β p Korri‐ giertes R² Modell (n = 50) Konstante -.093 1.030 - .928 .283 (p = .001) SPM L3 WTC W. Auf. z. d. M. Häuf. d. Fr.akt. .032 .304 .533 .417 .014 .229 .212 .267 .28 .18 .33 .21 .031 .191 .016 .126 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p < .05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 97: Regressionsmodell zum Ergebnis in Wortanzahl (klassifiziert) der Mädchen im Schreibtest in Französisch (Rating 2) Bei den Jungen finden sich hingegen bei der produzierten Wortanzahl keine signifikanten Korrelationen mit den anderen untersuchten Variablen. Nicht signifikante Korrelationen bestehen mit dem FFS Selbstkonzept (r s = .33), der wahrgenommenen Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen (r s = -.30), der wahrgenommenen Erwartungen der Eltern (r s = .32) und zum ersten Mal in etwas stärker ausgeprägter Form auch mit dem sprachlichen Hintergrund (r s = -.20; vgl. Anhang 7.2). Diese vier Variablen wirken auch als Prädiktoren für die produzierte Wortanzahl durch die Jungen, wobei das FFS Selbstkonzept (β-= .33) die höchste Prädiktorstärke aufweist. Der sprachliche Hintergrund (β = -.32*) zeigt als einzige Variable einen signifikanten Einfluss, in dem Sinne, dass einsprachige Jungen mehr Wörter produzieren als mehrsprachige. Zudem wirkt die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen (β = -.32) als negativer Prädiktor. 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 493 Abhängige Variable: Er‐ gebnis in Wortanzahl (klas‐ sifiziert) des Schreibtests in Französisch (Rating 2) Jungen - B SE (B) β p Korri‐ giertes R² Modell (n = 33) Konstante 4.255 1.365 - .004 .278 (p = .010) Spr. Hintergr. FFS Selbstk. W. Auf. z. d. M. W. Erw. d. Elt. -.656 .496 -.555 .319 .316 .244 .312 .309 -.32 .33 -.32 .19 .047 .052 .086 .311 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressi‐ onsparameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkre‐ ment (R²). Kodierung der dichotomen Variable sprachicher Hintergrund: 1 (monolingual aufge‐ wachsen), 2 (mehrsprachig aufgewachsen). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 98: Regressionsmodell zum Ergebnis in Wortanzahl (klassifiziert) der Jungen im Schreibtest in Französisch (Rating 2) Auch in den inhaltlichen Kategorien des Schreibtests Inhalt 1 (p = .038, d = .426) und Inhalt 2 (p = .046, d = .435) wurden jeweils signifikante Unterschiede zugunsten der Mädchen gefunden (vgl. Kapitel 11.4.3.1), weshalb diese auf mögliche Unterschiede bei den geschlechtsspezifischen Prädiktoren untersucht werden. Bei den Mädchen korreliert die Leistung in Inhalt 1 signifikant mit der L3 WTC (r s = .30*) und dem FFS Selbstkonzept (r s = .32*). Auch zur wahrgenommenen Aufmerksamkeitsverteilung zugunsten der Mädchen (r s = .26) und zur L3-Angst (r s = -.26) liegen schwache, nicht signifikante statistische Zusammenhänge vor (vgl. Anhang 7.2). Da das FFS Selbstkonzept und die L3 WTC untereinander stark korrelieren und letztere einen stärkeren Prädiktor als ersteres darstellt, wird ausschließlich die L3 WTC in das Regressionsmodell aufgenommen. Darüber hinaus korreliert die Leistung in Inhalt 1 auch signifikant mit dem Wortschatz‐ spektrum (r s = .55**), weshalb auf diese Kategorie auf Prädiktorstärke untersucht wird. Die Regressionsrechnungen belegen, dass die L3 WTC (β-=-.25) einen relativ starken Prädiktor für die Leistung in Inhalt 1 der Mädchen darstellt, während die L3-Angst (β = -.21) einen negativen, nicht signifikanten Prädiktor bildet. Die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen (β = .12) hat hingegen eine eher geringe Prädiktorstärke (vgl. Modell 1a, Tabelle 99). 494 11 Auswertung der Ergebnisse Die höchste Varianzaufklärung mit 37.4% erreicht das Regressionsmodell 1b (vgl. Tabelle 99), das zeigt, dass das Wortschatzspektrum einen signifikanten Einflussfaktor (β = .52**) darstellt, wobei die L3-Angst (β = -.17) einen ähnlich großen Prädiktor wie in Modell 1a bildet, die L3 WTC jedoch stark an Prädik‐ torstärke verliert (β-=-.09). Abhängige Variable: Er‐ gebnis in Inhalt 1 des Schreibtests in Französisch (Rating 2) Mädchen - B SE (B) β p Korri‐ giertes R² Modell 1a (n = 50) Konstante 4.094 1.097 - .001 .140 (p = .019) L3 WTC L3-Angst W. Auf. z. d. M. .398 -.257 .198 .231 .180 .239 .25 -.21 .12 .092 .160 .412 Modell 1b (n = 31) Konstante 3.664 .690 - .000 .374 (p = .000) L3 WTC L3-Angst Wortschatzspek. .147 -.209 .386 .205 .150 .091 .09 -.17 .52 .477 .172 .000 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 99: Regressionsmodelle 1a und 1b zum Ergebnis in Inhalt 1 der Mädchen im Schreibtest in Französisch (Rating 2) Bei den Jungen korreliert indessen die genderstereotyp weibliche Wahrneh‐ mung des Französischen (r s = -.44**) signifikant negativ mit ihrer Leistung in Inhalt 1 und die wahrgenommenen Erwartungen der Eltern (r s = .38*) wiederum signifikant positiv (vgl. Anhang 7.2). Eine zusätzlich vorgenommene Korrelationsanalyse ergibt, dass Inhalt 1 auch bei den Jungen signifikant mit dem Wortschatzspektrum (r s = .59*), das im Rahmen des zweiten Ratings des Schreibtests erhoben wurde, korreliert. Modell 1 in Tabelle 100 zeigt, dass sowohl die genderstereotyp weibliche Wahrnehmung des Französischen als auch die wahrgenommenen Erwartungen der Eltern Prädiktoren für die Leistung der Jungen in Inhalt 1 darstellen, wobei die genderstereotyp weibliche Wahrnehmung (β = -.31) den stärksten und zudem einen negativen Einfluss nimmt. Je stärker also eine genderstereotyp weibliche Wahrnehmung des Französischen bei den Jungen vorherrscht, desto schwächer 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 495 fällt ihre Leistung in der Kategorie Inhalt 1 aus. Dies könnte daher eine Erklärung für die bei Inhalt 1 gefundenen Geschlechterunterschiede zugunsten der Mädchen darstellen. Modell 2 (vgl. Tabelle 100) offenbart, dass aber vor allem die Leistung im Bereich Wortschatzspektrum (β = .63**) ausschlaggebend für die erreichte Punktzahl der Jungen in Inhalt 1 ist und bei Hinzunahme dieses Prädiktors die wahrgenommenen Erwartungen der Eltern (β = .04) ihre Prädiktorstärke fast völlig verlieren. Da die Mädchen im Bereich Wortschatzspektrum tendenziell besser abschnitten als die Jungen (p = .093, d = .365, vgl. Tabelle 52), stellt dies neben der leicht negativen Wirkung der genderstereotyp weiblichen Wahr‐ nehmung des Französischen, die ausschließlich bei den Jungen auftritt, einen weiteren Erklärungsansatz für die signifikant schwächere Leistung der Jungen in Inhalt 1 dar. Abhängige Variable: Ergebnis in Inhalt 1 des Schreibtests in Französisch (Rating 2) Jungen - B SE (B) β p Korri‐ giertes R² Modell 1(n = 33) Konstante 4.409 1.079 - .000 .142 (p = .038) Gend. w. Wahrn. W. Erw. d. Elt. -.564 .627 .297 .377 -.31 .28 .068 .106 Modell 2(n = 33) Konstante 2.557 .948 - .011 .467 (p = .000) Gend. w. Wahrn. W. Erw. d. Elt. Wortschatzspek. -.388 .098 .694 .238 .321 .158 -.22 .04 .63 .113 .763 .000 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 100: Regressionsmodelle 1 und 2 zum Ergebnis in Inhalt 1 der Jungen im Schreibtest in Französisch (Rating 2) Ein ähnliches Bild zeichnet sich auch bei der Kategorie Inhalt 2 des Schreibtests ab. Bei den weiblichen Französischlernerinnen korreliert die erreichte Punkt‐ zahl signifikant mit der integrativen Orientierung gepaart mit dem Ideal L3 Self (r s = .30*), der L3 WTC (r s = .40**), dem Interesse am Fach (r s = .44**), dem FFS Selbstkonzept (r s -=-.37**), der Unterstützung durch die Lehrkraft (r s -=-.30*), der wahrgenommenen Aufmerksamkeitsverteilung zugunsten der Mädchen 496 11 Auswertung der Ergebnisse (r s = .30*) und der Länge des Auslandsaufenthalts in französischsprachigen Ländern (r s = .31*; vgl. Anhang 7.2). Darüber hinaus wird eine signifikante Korrelation mit dem Wortschatzspektrum (r s -=-.60*) gemessen. Eine erste Regressionsanalyse (vgl. Modell 1, Tabelle 101) zeigt, dass insbe‐ sondere das Interesse am Fach Französisch (β-=-.37*) und die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen (β = .29*) als signifikante Prädiktoren für die Leistung der Mädchen in der Kategorie Inhalt 2 wirken. Modell 2 dokumentiert, dass, wie bereits bei Inhalt 1, das Wortschatzspektrum (β = .55**) den mit Abstand stärksten Prädiktor bildet, während die wahrgenommene Aufmerksamkeitsverteilung der Franzö‐ sischlehrkräfte zugunsten der Mädchen (β = .12) und auch das Interesse am Fach Französisch (β = .23*) im Vergleich zu Modell 1 an Prädiktorstärke verlieren. Mit 47.0% besitzt Modell 2 eine sehr hohe Varianzaufklärung. Abhängige Variable: Ergebnis in Inhalt 2 des Schreibtests in Französisch (Rating 2) Mädchen - B SE (B) β p Korri‐ giertes R² Modell 1(n = 50) Konstante -.121 1.138 - .916 .223 (p = .001) Int. a. Fach Frz. W. Auf. z. d. M. .742 .704 .259 .317 .37 .29 .006 .031 Modell 2(n = 50) Konstante -.473 .943 - .617 .470 (p = .000) Int. a. Fach Frz. W. Auf. z. d. M. Wortschatzspek. .464 .303 .590 .222 .275 .123 .23 .12 .55 .042 .276 .000 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 101: Regressionsmodelle 1 und 2 zum Ergebnis in Inhalt 2 der Mädchen im Schreibtest in Französisch (Rating 2) Bei den männlichen Französischlernenden korreliert die Leistung in Inhalt 2 mit dem Arbeitstempo (BZO; r s = .38*), der Konzentrationsleistung (KL; r s = .38*), der Sorgfalt der Arbeitsweise (F%; r s = .46**) sowie mit dem Gesamt‐ index der kognitiven Grundfertigkeiten (r s = .42*). Weitere nicht signifikante Korrelationen finden sich zur genderstereotyp weiblichen Wahrnehmung des 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 497 Französischen (r s = -.34) und zur wahrgenommenen Unterstützung durch die Französischlehrkraft (r s -=-.32; vgl. Anhang 7.2). Darüber hinaus steht auch das Wortschatzspektrum (r s = .59**) in einem signifikanten Zusammenhang mit den Ergebnissen der Jungen in Inhalt 2. Regressionsmodell 1 (vgl. Tabelle 102) zeigt, dass der Gesamtindex der kognitiven Grundfertigkeiten einen sehr starken positiven Prädiktor darstellt (β = .41*), aber die genderstereotyp weibliche Wahrnehmung des Französischen (β = -.44*) einen noch stärkeren negativen Einfluss auf die Leistung in Inhalt 2 der Jungen hat: Je stärker die Jungen das Französische als genderstereotyp weiblich wahrnehmen, desto schwächer fallen ihre Leistungen in Inhalt 2 aus. Die wahrgenommene Unterstützung durch die Französischlehrkraft (β = .29) weist außerdem einen schwachen, nicht signifikanten Einfluss auf die erreichte Punktzahl der Jungen in Inhalt 2 auf. In Regressionsmodell 2 (vgl. Tabelle 102) wird zusätzlich zu den in Modell 1 verwendeten Prädiktoren das Wortschatzspektrum aufgenommen, welches nun die höchste Einflusskraft zeigt (β = .47**). Die genderstereotyp weibliche Wahrnehmung des Französischen (β = -.35*) behält ihre signifikante negative Prädiktorstärke, während der Index der kognitiven Grundfertigkeiten (β-=-.22) nun keine signifikante Einflussvariable mehr darstellt. Die wahrgenommene Unterstützung durch die Französischlehrkraft gewinnt allerdings an Prädiktor‐ stärke (β-= .30*) und ist nun signifikant. Ähnlich wie bei Inhalt 1 wird also auch für Inhalt 2 deutlich, dass zum einen die genderstereotyp weibliche Wahrneh‐ mung des Französischen der Jungen und ihre etwas niedrigere Kompetenz im Bereich Wortschatzspektrum wesentliche Einflussfaktoren darstellen und ihre signifikant niedrigere Leistung zum Teil erklären können. 498 11 Auswertung der Ergebnisse Abhängige Variable: Ergebnis in Inhalt 2 des Schreibtests in Französisch (Rating 2) Jungen - B SE (B) β p Korri‐ giertes R² Modell 1(n = 30) Konstante 3.133 1.083 - .008 .402 (p = .001) Ind. kog. Gr.f. Gend. w. Wahrn. W. Unt. d. FLK .644 -.565 .600 .232 .189 .302 .41 -.44 .29 .010 .006 .057 Modell 2(n = 30) Konstante 1.427 1.025 - .176 .585 (p = .001) Ind. kog. Gr.f. Gend. w. Wahrn. W. Unt. d. FLK Wortschatzspek. .339 -.446 .611 .375 .212 .161 .251 .107 .22 -.35 .30 .47 .122 .010 .023 .002 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 102: Regressionsmodelle 1 und 2 zum Ergebnis in Inhalt 2 der Jungen im Schreibtest in Französisch (Rating 2) Bezüglich der beiden inhaltlichen Kategorien des Schreibtests kann demnach abschließend festgehalten werden, dass die genderstereotyp weibliche Wahr‐ nehmung des Französischen einen statistisch relevanten negativen Einfluss auf die Leistung der Jungen hat. Dies könnte den signifikanten Geschlechter‐ unterschied in der Leistung teilweise erklären und wird in Kapitel 12.1 näher interpretiert. Auch in Morphosyntax und grammatischer Orthographie zeigten sich im Zuge der statistischen Analyse der Ergebnisse des zweiten Ratings des Schreibtests im Französischen signifikante Geschlechterunterschiede zugunsten der Mädchen (p = .011, d = .562; vgl. Kapitel 11.4.3.1). Bei der Analyse geschlechtsspezifischer Zusammenhänge wird bei den Mädchen eine jeweils signifikante positive Kor‐ relation zwischen Morphosyntax und grammatischer Orthographie und Sorgfalt der Arbeitsweise (F%; r s = .29*), schlussfolgerndem Denken (SPM; r s = .36**), integrativer Orientierung gepaart mit Ideal L3 Self (r s = .45**), L3 WTC (r s = .37**), Häufigkeit der Freizeitaktivitäten auf Französisch (r s = .30*), Interesse am Fach Französisch (r s = .29*), Einstellungen zur französischen Zielkultur (r s = .33*) und Länge des Aufenthalts im französischsprachigen Ausland (r s = .38**) festgestellt. Darüber hinaus korrelieren der HISEI (r s = .26) schwach positiv und die L3-Angst 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 499 (r s = -.14) schwach negativ mit der Leistung in Morphosyntax und grammatischer Orthographie der Mädchen, wobei in beiden Fällen keine Signifikanz vorliegt (vgl. Anhang 7.2). Regressionsmodell 1 zeigt, dass die integrative Orientierung gepaart mit dem Ideal L3 Self (β-= .28*) den stärksten Prädiktor für die Leistung der Mädchen in Morphosyntax und grammatischer Orthographie bildet, dicht gefolgt von der Länge des Auslandsaufenthalts (β = .25), dem schlussfolgernden Denken (β = .24) und dem HISEI (β = .21; vgl. Tabelle 103). In Modell 2 wird ersichtlich, dass die L3-Angst (β = .05) keinen statistisch relevanten Einfluss auf die Leistung der Mädchen in Morphosyntax und grammatischer Orthographie hat (vgl. Tabelle 103). Abhängige Variable: Ergebnis in Morphosyntax und gram‐ matischer Orthographie des Schreibtests in Französisch (Rating 2) Mädchen - B SE (B) β p Korri‐ giertes R² Modell 1(n = 49) Konstante -.658 1.084 - .547 .288 (p = .001) SPM HISEI Int. Or./ Id. L3 S. L. d. Ausl.auf. .034 .012 .802 .234 .018 .007 .361 .124 .24 .21 .28 .25 .068 .109 .031 .065 Modell 2(n = 49) Konstante -.912 1.314 - .491 .274 (p = .002) SPM HISEI Int. Or./ Id. L3 S. L3-Angst L. d. Ausl.auf. .035 .012 .823 .067 .240 .019 .007 .369 .192 .126 .24 .22 .29 .05 .25 .067 .107 .031 .729 .064 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 103: Regressionsmodell zum Ergebnis in Morphosyntax und grammatischer Or‐ thographie der Mädchen im Schreibtest in Französisch (Rating 2) Bei den Jungen korrelieren abermals Arbeitsgeschwindigkeit (BZO; r s = .51**), Konzentrationsleistung (KL; r s = .43*), schlussfolgerndes Denken (SPM; r s = .36*), der Gesamtindex der kognitiven Grundfertigkeiten (r s = .45*) und schließlich das FFS Selbstkonzept (r s = .52**) jeweils signifikant positiv mit der Leistung in Morphosyntax und grammatischer Orthographie. Die L3-Angst (r s = -.22) zeigt bei 500 11 Auswertung der Ergebnisse den Jungen eine etwas höhere Korrelation zu Morphosyntax und grammatischer Orthographie als bei den Mädchen (vgl. Anhang 7.2). Regressionsmodell 1a zeigt, dass Arbeitsgeschwindigkeit (β-= .36*), schluss‐ folgerndes Denken (β = .28*), HISEI (β = .27*) und insbesondere das FFS Selbstkonzept (β = .51**) signifikante positive Prädiktoren für die Leistung in Morphosyntax und grammatischen Orthographie der Jungen darstellen und insgesamt 54.2% der Varianz dieser Leistung erklären (vgl. Tabelle 104). Regressionsmodell 1b, das Arbeitsgeschwindigkeit, schlussfolgerndes Denken, HISEI und L3-Angst als unabhängige Variablen beinhaltet, zeigt, dass die L3-Angst (β = .-39*) einen signifikanten negativen Prädiktor für die Leistung in Morphosyntax und grammatischer Orthographie der Jungen darstellt (vgl. Tabelle 104), dieser aber nicht so stark ausgeprägt ist wie das FFS Selbstkonzept in Modell 1a (vgl. Tabelle 104). Folglich trägt insbesondere die L3-Angst der Jungen zur Verringerung ihrer Leistung in Morphosyntax und grammatischer Orthographie bei. Abhängige Variable: Er‐ gebnis in Morphosyntax und grammatischer Ortho‐ graphie des Schreibtests in Französisch (Rating 2) Jungen - B SE (B) β p Korri‐ giertes R² Modell 1a (n = 31) Konstante -10.904 2.514 - .000 .542 (p = .000) BZO SPM HISEI FFS Selbstk. .057 .087 .021 1.089 .021 .042 .010 .264 .36 .28 .27 .51 .012 .049 .049 .000 Modell 1b (n = 31) Konstante -7.272 2.672 - .011 .403 (p = .001) BZO SPM HISEI L3-Angst .064 .081 .027 -.707 .025 .048 .012 .267 .40 .26 .34 -.39 .016 .107 .035 .013 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 104: Regressionsmodell zum Ergebnis in Morphosyntax und grammatischer Or‐ thographie der Jungen im Schreibtest in Französisch (Rating 2) 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 501 Schließlich wurde im dritten Rating des Schreibtests in Französisch im Bereich Grammatik, der sich aus Morphosyntax und grammatischer Orthographie, Syntax sowie Verwendung der Tempi und Modi zusammensetzt, ein signifikanter Un‐ terschied zugunsten der Mädchen gemessen (p = .037, d = .456; vgl. Kapitel 11.4.3.1). Bezüglich dieser Teilkompetenz gestalten sich die geschlechtsspezifi‐ schen Korrelationsmatrizen ähnlich wie bei Morphosyntax und grammatischer Orthographie: Bei den Mädchen korreliert die Leistung in Grammatik mit der Sorgfalt der Arbeitsweise (F%; r s = .36*), dem schlussfolgernden Denken (SPM; r s = .44**) und dem Gesamtindex der kognitiven Grundfertigkeiten (r s = .30*), wobei die Korrelationen jeweils stärker ausfallen als dies bei Morphosyntax und grammatischer Orthographie der Fall ist. Des Weiteren finden sich bei den Mädchen signifikante statistische Zusammenhänge zwischen der Leistung in Grammatik und der integrativen Orientierung gepaart mit Ideal L3 Self (r s = .39**), der L3 WTC (r s = .32*), der Häufigkeit der Freizeitaktivitäten auf Französisch (r s = .35*), dem Interesse am Fach Französisch (r s = .33*), dem FFS Selbstkonzept (r s = .39**) und der Länge des Auslandsaufenthalts (r s -=-.29*; vgl. Anhang 7.2). Die Regressionsanalyse (vgl. Tabelle 105) zeigt, dass insbesondere das FFS Selbstkonzept (β = .31*) als starker, signifikanter Prädiktor für die Grammatikleistung der Mädchen wirkt und das schlussfolgernde Denken (SPM, β-= .17), die Häufigkeit der Freizeitaktivitäten auf Französisch (β-=-.21) und die Länge des Auslandsaufenthalts (β = .16) jeweils schwache, nicht signifikante Prädiktoren darstellen. Abhängige Variable: Er‐ gebnis in Grammatik des Schreibtests in Französisch (Rating 3) Mädchen - B SE (B) β p Korri‐ giertes R² Modell 1(n = 46) Konstante -.110 1.061 - .918 .241 (p = .004) SPM FFS Selbstk. Häuf. d. Fr.akt. L. d. Ausl.auf. .025 .530 .529 .156 .020 .241 .345 .135 .17 .31 .21 .16 .218 .034 .133 .253 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 105: Regressionsmodell zum Ergebnis in Grammatik der Mädchen im Schreibtest in Französisch (Rating 3) 502 11 Auswertung der Ergebnisse Bei den männlichen Französischlernenden sind die Korrelationen zwischen der Leistung im Bereich Grammatik und den kognitiven Grundfertigkeiten etwas schwächer als bei der Morphosyntax und grammatischen Orthographie, aber immer noch stärker als bei den Mädchen: Grammatik korreliert bei den Jungen signifikant mit dem Arbeitstempo (BZO; r s -=-.48**), der Konzentrationsleistung (KL; r s = .37*) und dem Gesamtindex der kognitiven Grundfertigkeiten (r s = .40*); auch mit dem FFS Selbstkonzept (r s = .54**) und dem HISEI (r s = .20) liegen Korrelationen vor (vgl. Anhang 7.2). Regressionsanalysen offenbaren, dass der Gesamtindex der kognitiven Grundfertigkeiten (β = .50**) und das FFS Selbstkonzept (β = .50**) jeweils signifikante positive Einflüsse haben und der HISEI (β = .27) einen knapp nicht signifkanten Prädiktor darstellt. Diese drei Faktoren besitzen zusammen eine Varianzaufklärung von 46.8% (vgl. Tabelle 106). Abhängige Variable: Er‐ gebnis in Grammatik des Schreibtests in Französisch (Rating 3) Jungen - B SE (B) β p Korri‐ giertes R² Modell (n = 31) Konstante -.708 .999 - .485 .468 (p = .000) Ind. kog. Gr.f. HISEI FFS Selbstk. 1.031 .021 1.033 .281 .010 .277 .50 .27 .50 .001 .053 .001 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 106: Regressionsmodell zum Ergebnis in Grammatik der Jungen im Schreibtest in Französisch (Rating 3) Es wird also sichtbar, dass die Grammatikleistungen der Jungen erneut durch die kognitiven Grundfertigkeiten, das FFS Selbstkonzept und den sozioökonomi‐ schen Status (HISEI) bestimmt werden, während die Prädiktoren der Leistungen der Mädchen aufgrund der Einflusskraft der Häufigkeit der Freizeitaktivitäten auf Französisch und der Länge des Auslandsaufenthalts vielfältiger sind. 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 503 239 Dieses Vorgehen wurde gewählt um das Problem der Multikollinearität zu umgehen (vgl. Schendera 2011). 11.10.2 Zwischenfazit: Antwort auf Forschungsfrage 6 für Französisch Die sechste Forschungsfrage, im Rahmen derer ermittelt wurde, inwiefern unterschiedliche bzw. unterschiedlich stark ausgeprägte Prädiktoren bei den beiden Geschlechtergruppen vorliegen, auf die sich Geschlechterunterschiede in der fremdsprachlichen Leistung zurückführen lassen, kann nun für Fran‐ zösisch beantwortet werden: Bei den Mädchen erweist sich hinsichtlich der Gesamtleistung die Kombination aus den drei Prädiktoren schlussfolgerndes Denken (SPM), FFS Selbstkonzept und wahrgenommene Aufmerksamkeitsver‐ teilung der Französischlehrkräfte zugunsten der Mädchen als diejenigen mit der größten Varianzaufklärung (korrigiertes R² = .257; vgl. Modell 1a, Tabelle 85). Aber auch wenn das FFS Selbstkonzept durch die L3 WTC ersetzt wird 239 , hat letztere einen signifikanten Einfluss auf die Gesamtleistung der Mädchen (vgl. Modell 1e, Tabelle 85). Schließlich zeigt auch die integrative Orientierung gepaart mit Ideal L3 Self einen schwachen, nicht signifikanten Einfluss auf die Gesamtleistung der Mädchen (Modell 1 f, Tabelle 85). Untersucht man die einzelnen sprachlichen Teilfertigkeiten und insbesondere diejenigen, bei denen Geschlechterunterschiede zugunsten der Mädchen auf‐ treten, manifestieren sich bei den Mädchen immer wieder das schlussfolgernde Denken (SPM; vgl. Hörverstehen, Schreiben, Wortanzahl, Morphosyntax und grammatische Orthographie, Grammatik) sowie zahlreiche endogene affektive Faktoren, insbesondere das FFS Selbstkonzept (vgl. Hörverstehen, Lesever‐ stehen, Grammatik), die integrative Orientierung gepaart mit dem Ideal L3 Self (vgl. Sprachhandlungskompetenz, Morphosyntax und grammatische Ortho‐ graphie), die L3 WTC (vgl. Schreiben, Wortanzahl, Inhalt 1, Inhalt 2), das Interesse am Fach Französisch (vgl. Inhalt 2), aber auch die Häufigkeit der Freizeitaktivitäten auf Französisch (vgl. Wortanzahl, Grammatik) und der HISEI (vgl. Leseverstehen, LV-33, Kurze Geschichte, Morphosyntax und grammatische Orthographie) als positive Prädiktoren. Auch die Länge des Aufenthalts in französischsprachigen Ländern (vgl. Sprachhandlungskompetenz, Morphosyntax und grammatische Orthographie, Grammatik) erweist sich als positiver Einflussfaktor der Leistungen der Mäd‐ chen. Im Falle von Inhalt 1 und Inhalt 2 konnte außerdem gezeigt werden, dass die Leistung in beiden Kategorien primär vom Wortschatzspektrum abhängt, welches bei den Mädchen etwas stärker ausgeprägt ist als bei den Jungen (vgl. Kapitel 11.4.3.1). 504 11 Auswertung der Ergebnisse Innerhalb des Ought-to L3 Self haben vor allem die wahrgenommene Un‐ terstützung durch die Französischlehrkraft (vgl. Hörverstehen) und die wahr‐ genommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen (vgl. Schreiben, Sprachhandlungskompetenz, Wortanzahl, Inhalt 1, Inhalt 2) positive Einflüsse auf die Leistungen der Mädchen. Die L3-Angst, die bei den Mädchen tendenziell stärker ausgeprägt ist als bei den Jungen (p = .168, d = .298, vgl. Kapitel 11.7.1), zeigt sich bei Regressionsanal‐ ysen als schwacher, nicht signifikanter negativer Prädiktor für die Sprachhand‐ lungskompetenz und die Leistung in Inhalt 1. Des Weiteren übt in Teilaufgabe 2 des Leseverstehenstests die geschlechterstereotyp weibliche Wahrnehmung einen signifikanten negativen Einfluss auf die Leseleistung der Mädchen aus und die wahrgenommenen Erwartungen der Eltern haben tendenziell einen leicht negativen Einfluss auf die Leistungen der Mädchen, was sich insbesondere beim Gesamtergebnis des Schreibtests (2. Rating) manifestiert. Somit können bei den Mädchen insbesondere das schlussfolgernde Denken, das FFS Selbstkonzept, die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen, die wahrgenommene Unterstüt‐ zung durch die Französischlehrkraft, zahlreiche weitere endogene affektive Faktoren (insbesondere L3 WTC und integrative Orientierung gepaart mit Ideal L3 Self, aber auch vereinzelt die Instrumentelle Orientierung) sowie die Häufig‐ keit der Freizeitaktivitäten auf Französisch und die Länge des Auslandsaufent‐ halts als positive Prädiktoren erfasst werden. Lediglich die L3-Angst im Falle der Sprachhandlungskompetenz, die genderstereotyp weibliche Wahrnehmung der französischen Sprache im Falle von Inhalt 2 und die wahrgenommenen Erwartungen der Eltern im Falle des Ergebnisses des Schreibtests werden als schwache negative Prädiktoren gemessen. Nachfolgende Darstellung (vgl. Abbildung 34) zeigt die beschriebenen Ergeb‐ nisse bezüglich der Prädiktoren für den Französischlernerfolg der Mädchen noch einmal in graphischer Zusammenfassung. Hierbei wird deutlich, dass bei der Teilstichprobe der weiblichen Französischlernenden fast alle der im „Netz‐ werkmodell der interaktiven Faktoren des genderbezogenen Sprachlernerfolgs“ (vgl. Kapitel 6) aufgeführten Faktoren auch tatsächlich als Prädiktoren für die untersuchte fremdsprachliche Leistung wirken. Lediglich der sprachliche Hintergrund und die Einstellungen zur französischen Kultur fungieren in keiner der untersuchten Teilkompetenzen als Prädiktoren für die fremdsprachliche Leistung. In der Darstellung werden die jeweilige Prädiktorstärke und Häufig‐ 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 505 240 Signifikante Prädiktoren für das Gesamtergebnis wurden mit zwei Punkten der Schrift‐ größe gewertet, nicht signifikante mit einem. Anschließend wurde das Endergebnis mal sechs genommen. Bei den Teilergebnissen zu den sprachlichen Fertigkeiten (Hören, Lesen, Schreiben) wurden ebenfalls signifikante Prädiktoren mit zwei Punkten und nicht signifikante Prädiktoren mit einem Punkt bewertet. Diese Ergebnisse wurden anschließend mit drei multipliziert. Teilkompetenzen der Fertigkeiten wurden gleich bepunktet, aber einfach gezählt. keit, mit der die Prädiktoren auftreten, durch die Schriftgröße dargestellt. 240 Negativ wirkende Faktoren sind durch einen orangefarbenen Hintergrund gekennzeichnet. Einzig und allein die Beziehung der Faktoren untereinander konnte nicht statistisch nachgewiesen werden und wurde daher von López Rúa (2006) übernommen. Die graphische Darstellung zeigt sehr deutlich, dass bei den weiblichen französischlernenden sowohl die kognitiven Grundfertigkeiten als auch die wahrgenommene Aufmerksamkeitsverteilung der Französischlehr‐ kräfte zugunsten der Mädchen, dicht gefolgt vom FFS Selbstkonzept und der L3 WTC die wichtigsten Prädiktoren für die gemessenen Französischleistungen darstellen. 506 11 Auswertung der Ergebnisse Abb. 34: Netzwerkmodell der interaktiven Faktoren des genderbezogenen Sprachlerner‐ folgs (Adaptation und Erweiterung des Modells von López Rúa 2006: 112): Darstellung der Prädiktoren für die fremdsprachliche Leistung der weiblichen Französischlernerinnen 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 507 241 Anstelle des Arbeitstempos kann auch die Konzentrationsleistung als Prädiktor der Leistung in die jeweiligen Regressionsmodelle eingesetzt werden, wobei dann die Varianzaufklärung etwas absinkt. Bei den Jungen bilden das Arbeitstempo (BZO) 241 und das FFS Selbstkonzept signifikante positive Prädiktoren für die fremdsprachliche Gesamtleistung im Französischen (vgl. Tabelle 88). Zu den meisten anderen endogenen affek‐ tiven Faktoren werden sehr schwache oder vernachlässigbare Korrelationen gemessen (vgl. Anhang 7.2), weshalb weder die integrative Orientierung ge‐ paart mit dem Ideal L3 Self, noch die instrumentelle Orientierung, die L3 WTC, die Häufigkeit der Freizeitaktivitäten auf Französisch, das Interesse am Fach Französisch oder die L3-Angst Prädiktoren für die Gesamtleistung der Jungen darstellen. Die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen und die wahrgenommene Unter‐ stützung der Französischlehrkräfte haben bei den Jungen außerdem einen leicht negativen Einfluss auf die Gesamtleistung (vgl. Modell 1a und 1b, Tabelle 88). Lediglich die Variable der wahrgenommenen Erwartungen der Eltern offenbart sich bei den Jungen als die einzige Kategorie des Ought-to L3 Self, die als äußerst schwacher, nicht signifikanter positiver Einflussfaktor auf die Gesamtleistung wirkt (vgl. Modell 1d, Tabelle 88). Die stärksten und häufigsten Prädiktoren für die Leistungen der Jungen in den einzelnen fremdsprachlichen Teilfertigkeiten, in denen Geschlechter‐ unterschiede zugunsten der Mädchen gemessen wurden, stellen erneut das Arbeitstempo (BZO; vgl. Leseverstehen, Schreiben, Sprachhandlungskompetenz, Morphosyntax und grammatische Orthographie) und das FFS Selbstkonzept (vgl. Hörverstehen, Schreiben, Sprachhandlungskompetenz, Wortanzahl, Mor‐ phosyntax und grammatische Orthographie, Grammatik) dar. Aber auch das schlussfolgernde Denken (SPM; vgl. Hörverstehen, Morphosyntax und gramma‐ tische Orthographie), der Gesamtindex der kognitiven Fähigkeiten (vgl. Inhalt 2, Grammatik), der sozioökonomische Status (HISEI; vgl. Leseverstehen, LV-33 Kurze Geschichte, Sprachhandlungskompetenz, Morphosyntax und grammati‐ sche Orthographie, Grammatik) und das Interesse am Fach Französisch (vgl. LV-33 Kurze Geschichte) agieren als positive Prädiktoren. Der sprachliche Hintergrund stellt sich für die produzierte Wortanzahl im Schreibtest als ein signifikanter Prädiktor heraus, in dem Sinne, dass einsprachige Jungen tendenziell mehr Wörter produzieren als mehrsprachige (vgl. Tabelle 98). Das Wortschatzspektrum ist zudem eine wichtige Voraussetzung für die Leistung der Jungen in Inhalt 1 und Inhalt 2. Schließlich finden sich zahlreiche negative Prädiktoren für die Französi‐ schleistungen der Jungen: Die L3-Angst (vgl. Morphosyntax und grammatische 508 11 Auswertung der Ergebnisse Orthographie), die genderstereotyp weibliche Wahrnehmung des Französischen (vgl. Inhalt 1, Inhalt 2), die wahrgenommene Aufmerksamkeitsverteilung der Lehrkräfte zugunsten der Mädchen (vgl. Leseverstehen, LV-33 Kurze Ge‐ schichte, Wortanzahl) und die wahrgenommenen Erwartungen der Peers (vgl. Hörverstehen) bilden negative Einflussfaktoren. Außerdem wird die wahrge‐ nommene Unterstützung durch die Französischlehrkraft bei der Hörverstehens‐ leistung der Jungen ebenfalls als negativer Einflussfaktor gemessen; je höher also die wahrgenommene Unterstützung der Lehrkraft ist, desto niedriger fällt die Hörverstehensleistung der Jungen aus. Bei Inhalt 2 stellt die Unterstützung durch die Lehrkraft im Gegensatz dazu einen positiven Prädiktor dar, sodass sich bezüglich dieser Variable und ihres Einflusses auf die Leistungen der Jungen uneinheitliche Ergebnisse offenbaren. Die einzige Variable des Ought-to L3 Self, bei der häufig ein positiver Zusammenhang mit den fremdsprachlichen Leistungen der Jungen in einzelnen Teilbereichen (vgl. Schreibtest, 2. Rating), Sprachhandlungskompetenz, Wortanzahl, Inhalt 1) gefunden wird, ist diejenige der wahrgenommenen Erwartungen der Eltern. Als Zusammenfassung bleibt festzuhalten, dass bei den Jungen insbesondere das Arbeitstempo (BZO) und die anderen kognitiven Grundfertigkeiten, das FFS Selbstkonzept sowie die wahrgenommenen Erwartungen der Eltern positive Prädiktoren für ihre Französischleistungen darstellen. Der HISEI tritt bei den Jungen außerdem häufiger und stärker als Prädiktor auf als bei den Mädchen und auch die wahrgenommenen Erwartungen der Eltern offenbaren sich bei den Jungen als leicht positiver Prädiktor während diese bei den Mädchen meist einen leicht negativen Einfluss zeigen. Als stärkster negativer Einflussfaktor auf die Leistung der Jungen kristallisiert sich immer wieder die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen heraus. Negative Einflüsse durch eine genderstereotyp weibliche Wahrneh‐ mung der französischen Sprache der Jungen finden sich hingegen lediglich bei den inhaltlichen Kategorien des Schreibtests und auch die L3-Angst und die wahrgenommene Unterstützung durch die Lehrkräfte finden sich nur vereinzelt als negative Prädiktoren. Beim Ought-to L3 Self sind folglich insbesondere bei der Wirkung der Aufmerksamkeitsverteilung zugunsten der Mädchen und der wahrgenommenen Erwartungen der Eltern große Geschlechterunterschiede in den Prädiktoren auszumachen. Nachfolgende Darstellung (vgl. Abbildung 35) zeigt die beschriebenen Ergeb‐ nisse noch einmal in graphischer Zusammenfassung. Hierbei wird deutlich, dass bei der Teilstichprobe der männlichen Französischlernenden ein Großteil der im „Netzwerkmodell der interaktiven Faktoren des genderbezogenen Sprachler‐ nerfolgs“ (vgl. Kapitel 6) aufgeführten Faktoren auch tatsächlich als Prädiktoren 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 509 242 Signifikante Prädiktoren für das Gesamtergebnis wurden mit zwei Punkten der Schrift‐ größe gewertet, nicht signifikante mit einem. Anschließend wurde das Endergebnis mal sechs genommen. Bei den Teilergebnissen zu den sprachlichen Fertigkeiten (Hören, Lesen, Schreiben) wurden ebenfalls signifikante Prädiktoren mit zwei Punkten und nicht signifikante Prädiktoren mit einem Punkt bewertet. Diese Ergebnisse wurden anschließend mit drei multipliziert. Teilkompetenzen der Fertigkeiten wurden gleich bepunktet, aber einfach gezählt. für die untersuchte fremdsprachliche Leistung wirkt. Die jeweilige Prädiktor‐ stärke wird erneut durch die Schriftgröße dargestellt. 242 Negativ wirkende Faktoren sind erneut durch einen orangefarbenen Hintergrund gekennzeichnet. Einzig und allein die Beziehung der Faktoren untereinander konnte nicht statistisch nachgewiesen werden und wurde daher von López Rúa (2006) über‐ nommen. Die Darstellung veranschaulicht noch einmal, dass der mit Abstand wichtigste Prädiktor der Leistungen der Jungen deren kognitive Grundfertig‐ keiten sind, dicht gefolgt vom FFS Selbstkonzept. Die genderstereotyp weibliche Wahrnehmung des Faches stellt hingegen einen weitaus weniger wichtigen, allerdings negativen Prädiktor dar. 510 11 Auswertung der Ergebnisse Abb. 35: Netzwerkmodell der interaktiven Faktoren des genderbezogenen Sprachlerner‐ folgs (Adaptation und Erweiterung des Modells von López Rúa 2006: 112): Darstellung der Prädiktoren für die fremdsprachliche Leistung der männlichen Französischlerner 11.10.3 Analyse geschlechtsspezifischer Prädiktoren der Leistungen in Spanisch Im Folgenden werden geschlechtsspezifische Prädiktoren für das Gesamter‐ gebnis in Spanisch sowie für die Hörverstehensleistung, die Leseverstehensleis‐ tung und die Schreibleistung analysiert. Des Weiteren werden die Kategorien 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 511 Befolgung des Arbeitsauftrags und Inhalt 1, bei denen im zweiten Rating des Schreibtests signifikante Unterschiede zugunsten der Mädchen auftraten, auf geschlechtsspezifische Prädiktoren analysiert. Wie bereits in den Korrelations‐ analysen bezüglich der gesamten Spanischstichprobe festgestellt wurde, korre‐ liert die Mehrzahl der fremdsprachlichen Teilleistungen hauptsächlich mit den affektiven Faktoren (vgl. Kapitel 11.8.2). Da diese untereinander meist eine hohe Interkorrelation aufweisen, werden diese separat voneinander und meist in einfachen linearen Regressionsmodellen auf deren Prädiktorstärke überprüft. - 11.10.3.1 Geschlechtsspezifische Prädiktoren für die Gesamtleistung in Spanisch Bei den Mädchen findet sich jeweils ein signifikanter Zusammenhang zwischen der Gesamtleistung in Spanisch und dem sozioökonomischen Status (HISEI; r s = .23*), dem schlussfolgernden Denken (SPM, r s = 24*), der L4 WTC (r s = .35**), dem Interesse am Fach Spanisch (r s = .30*) und dem SFS Selbstkonzept (r s = .49**; vgl. Anhang 7.4). Eine Regressionsanalyse belegt, dass das schlussfolgernde Denken (β = .16), der sozioökonomische Status (β = .21) und das FFS Selbst‐ konzept (β = .41**) insgesamt 22.9% der Gesamtleistung der Mädchen im Spanischen erklären (vgl. Modell 1a, Tabelle 107). Auch L4 WTC und Interesse am Fach Spanisch weisen in Kombination mit sozioökonomischem Status und schlussfolgerndem Denken jeweils signifikante Einflüsse auf (vgl. Modelle 1b und 1c, Tabelle 107). Signifikante negative Einflüsse oder Einflüsse aus dem Bereich des Ought-to L4 Self sind hingegen nicht festzustellen. Abhängige Variable: Gesamt‐ ergebnis der Spanischtests Mädchen - B SE (B) β p Korri‐ giertes R² Modell 1a (n = 70) Konstante 22.182 6.923 - .002 .229 (p = .000) SPM HISEI SFS Selbstk. .182 .068 4.084 .123 .034 1.075 .16 .21 .41 .143 .052 .000 Modell 1b (n = 70) Konstante 26.044 7.206 - .001 .140 (p = .005) SPM HISEI L4 WTC .202 .056 3.051 .130 .038 1.234 .17 .18 .29 .124 .141 .016 512 11 Auswertung der Ergebnisse Abhängige Variable: Gesamt‐ ergebnis der Spanischtests Mädchen - B SE (B) β p Korri‐ giertes R² Modell 1c (n = 70) Konstante 26.362 7.377 - .001 .120 (p = .010) SPM HISEI Int. a. Fach Span. .184 .084 2.326 .131 .036 1.099 .16 .26 .24 .166 .023 .038 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 107: Regressionsmodelle 1a bis 1c zum Gesamtergebnis der Mädchen in Spanisch‐ tests Bei den Jungen korreliert die sprachliche Gesamtleistung in Spanisch aus‐ schließlich signifikant positiv mit dem Interesse am Fach Spanisch (r s = .50*). Außerdem erweist sich der Zusammenhang zwischen den wahrgenommenen Erwartungen der Peers (r s = -.36) und der Gesamtleistung der Jungen als nicht signifikant, aber mittelstark (vgl. Anhang 7.4). Eine Regressionsanalyse offenbart, dass das Interesse am Fach Spanisch (β = .59*) einen signifikanten positiven Prädiktor für die Gesamtleistung der Jungen darstellt und dass die wahrgenommenen Erwartungen der Peers (β = -.42) einen beinahe signifikanten negativen Prädiktor bilden. Insgesamt werden durch diese beiden Prädiktoren 28.7% der Gesamtleistung der Jungen erklärt (vgl. Tabelle 108). 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 513 Abhängige Variable: Gesamt‐ ergebnis der Spanischtests Jungen - B SE (B) β p Korri‐ giertes R² Modell (n = 21) Konstante 37.745 6.359 - .000 .287 (p = .018) Int. a. Fach Span. W. Erw. d. Peers 6.113 -.3.455 2.069 1.661 .59 -.42 .008 .052 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 108: Regressionsmodell zum Gesamtergebnis der Jungen in den Spanischtests Obwohl die Jungen im Gesamtergebnis mit einem schwachen, nicht signifi‐ kanten Effekt besser abschneiden als die Mädchen (p = .336, d = -.240, vgl. Tabelle 67), wird bei ihnen also eine beinahe signifikante negative Einflussvariable in Form der wahrgenommenen Erwartungen der Peers gefunden. Welche Ursachen dies haben könnte, wird in Kapitel 12.2.4 ausführlich diskutiert. - 11.10.3.2 Geschlechtsspezifische Prädiktoren für die Hörverstehensleistung in Spanisch Im Hörverstehen in Spanisch schnitten die Jungen mit einem schwachen, nicht signifikanten Effekt besser ab als die Mädchen (p = .154, d = .298; vgl. Tabelle 67). Betrachtet man ausschließlich die Hörverstehensleistung der Mädchen, so korreliert diese signifikant positiv mit dem schlussfolgernden Denken (SPM; r s = .29*), der L4 WTC (r s = .25*) und dem SFS Selbstkonzept (r s = .30**). Außerdem zeigt sie einen signifikant negativen Zusammenhang zu den wahrgenommenen Erwartungen der Eltern (r s = -.27*; vgl. Anhang 7.4). Eine Regressionsanalyse belegt, dass sowohl das FFS Selbstkonzept (β = .25*) als auch die wahrgenom‐ menen Erwartungen der Eltern (β-=--.28*) signifikante Einflussfaktoren auf die Hörverstehensleistungen der Mädchen darstellen. Das schlussfolgernde Denken (β-=-.20) stellt hingegen keinen signifikanten Prädiktor dar. Insgesamt erklären diese drei Variablen 17.3% der Varianz der Hörverstehensleistung der Mädchen (vgl. Tabelle 109). Weshalb die wahrgenommenen Erwartungen der Eltern einen negativen Einfluss auf die Hörleistung zeigen, wird im Zuge der Interpretation der Ergebnisse diskutiert (vgl. Kapitel 12.2). 514 11 Auswertung der Ergebnisse Abhängige Variable: Er‐ gebnis des Hörverstehens‐ tests in Spanisch Mädchen - B SE (B) β p Korri‐ giertes R² Modell (n = 71) Konstante 26.215 10.419 - .014 .173 (p = .001) SPM SFS Selbstk. W. Erw. d. Elt. .311 3.247 -4.385 .168 1.429 1.755 .20 .25 -.28 .069 .026 .015 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 109: Regressionsmodell zum Ergebnis der Mädchen im Hörverstehenstest in Spanisch Die Hörverstehensleistung der Jungen korreliert signifikant negativ mit den wahrgenommenen Erwartungen der Peers (r s = -.57**). Mittelstarke, nicht signifikante Korrelationen finden sich außerdem mit dem schlussfolgernden Denken (r s = .27), dem Interesse am Fach Spanisch (r s = .32), den Einstellungen zur spanischen Zielkultur (r s = .30) und der Länge des Aufenthalts im spanisch‐ sprachigen Ausland (r s = .31; vgl. Anhang 7.4). Regressionsanalysen belegen, dass das Modell mit der höchsten Varianzaufklärung von 58.2% jeweils einen signifikanten Einfluss des schlussfolgernden Denkens (β-= .36*), des Interesses am Fach Spanisch (β-= .50*) und der wahrgenommenen Erwartungen der Peers (β-= -.54*) misst, wobei letztere einen negativen Prädiktor darstellen. Die Länge des Aufenthalts im spanischsprachigen Ausland (β-= .16) stellt hingegen keinen signifikanten Einflussfaktor für die Hörverstehensleistung der Jungen dar (vgl. Tabelle 110). 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 515 Abhängige Variable: Ergebnis des Hörverstehenstests in Spanisch Jungen - B SE (B) β p Korri‐ giertes R² Modell (n = 20) Konstante 1.056 18.652 - .956 .582 (p = .001) SPM Int. a. Fach Span. W. Erw. d. Peers L. d. Ausl.auf. .721 5.339 -4.561 .788 .323 1.763 1.590 .816 .36 .50 -.54 .16 .041 .008 .012 .349 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 110: Regressionsmodell zum Ergebnis der Jungen im Hörverstehenstest in Spa‐ nisch Es fällt also zum einen auf, dass die Hörverstehensleistung der Jungen etwas stärker durch das schlussfolgernde Denken beeinflusst wird, als dies bei den Mädchen der Fall ist. Zum anderen erweisen sich bei den Mädchen die wahrge‐ nommenen Erwartungen der Eltern und bei den Jungen die wahrgenommenen Erwartungen der Peers als jeweils signifikante negative Einflussfaktoren auf die Hörverstehensleistung. - 11.10.3.3 Geschlechtsspezifische Prädiktoren für die Leseverstehensleistung in Spanisch Im Leseverstehen wurde kein statistisch relevanter Unterschied zwischen den weiblichen und den männlichen Spanischlernenden gemessen (p = .428, d = .165, vgl. Tabelle 67). Dennoch wird überprüft, ob möglicherweise geschlechtsspezi‐ fische Prädiktoren für die Leseverstehensleistung vorliegen. Betrachtet man die Leseleistung der Mädchen, so korreliert diese signifikant positiv mit dem SFS Selbstkonzept (r s = .27*) und der wahrgenommenen Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen (r s = .31*). Zudem wird eine signifikante negative Korrelation mit der genders‐ tereotyp weiblichen Wahrnehmung des Spanischen (r s = -.28*) gemessen (vgl. Anhang 7.4). Ob es sich hierbei um eine Nonsenskorrelation oder um eine Korrelation, die durch eine Drittvariable bestimmt ist, handelt, kann im Rahmen von Regressionsanalysen teilweise geklärt werden: Modell 1 (vgl. Tabelle 111) belegt, dass lediglich die wahrgenommene Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen (β = .28*) einen signifikanten Ein‐ 516 11 Auswertung der Ergebnisse fluss auf die Leseverstehensleistung der Mädchen hat, und dass im Gegensatz dazu das SFS Selbstkonzept keinen signifikanten Prädiktor darstellt (β = .12). Jedoch erklären diese beiden Prädiktoren zusammen lediglich 8.8% der Leis‐ tungsvarianz im Leseverstehen der Mädchen. Die genderstereotyp weibliche Wahrnehmung des Spanischen hat außerdem keinen statistisch relevanten Einfluss (vgl. Modell 2, Tabelle 111). Abhängige Variable: Ergebnis des Leseverstehenstests in Spanisch Mädchen - B SE (B) β p Korri‐ giertes R² Modell 1 (n = 69) Konstante 37.089 5.536 - .000 .088 (p = .018) SFS Selbstk. W. Auf. z. d. M. 1.310 3.552 1.309 1.587 .12 .28 .321 .029 Modell 2 (n = 68) Konstante 41.560 7.328 - .000 .086 (p = .032) SFS Selbstk. Gend. w. Wahrn. W. Auf. z. d. M. 1.106 -1.321 3.063 1.329 1.416 1.672 .10 -.12 .24 .408 .355 .072 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 111: Regressionsmodelle 1 und 2 zum Ergebnis der Mädchen im Leseverstehens‐ test in Spanisch Im Gegensatz zu den Ergebnissen bezüglich der Leseverstehensleistungen der Mädchen findet sich bei den Jungen ein signifikanter negativer Zusammenhang mit dem HISEI (r s -=--.44*). Des Weiteren bestehen signifikante positive Zusam‐ menhänge der Leseverstehensleistung der Jungen mit dem Interesse am Fach Spanisch (r s = .58**) und dem SFS Selbstkonzept (r s = .44*; vgl. Anhang 7.4). Regressionsanalysen offenbaren jedoch, dass der einzig signifikante Prädiktor für die Leseverstehensleistung der Jungen das Interesse am Fach Spanisch (β = .46*) darstellt und 16.6% der Varianz erklärt (vgl. Modell 1a, Tabelle 112). Das Interesse am Fach Spanisch erweist sich demnach, wie bereits bei der Ge‐ samtleistung und bei der Hörverstehensleistung, als sehr starker Einflussfaktor auf die fremdsprachliche Leistung der Jungen in Spanisch. Jedoch stellt das SFS Selbstkonzept, das in einer zweiten einfachen linearen Regression auf dessen Prädiktorstärke geprüft wurde, einen noch stärkeren Einflussfaktor bezüglich 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 517 243 Durch Hinzufügen des HISEI zum Regressionsmodell ist das Modell nicht mehr signifikant und daher nicht gültig (R 2 = .183, p = .063), weshalb es nicht in Tabelle 112 dargestellt wird. der Leseverstehensleistung dar und erklärt 20.8% der Leistungsvarianz (vgl. Modell 1b, Tabelle 112). Der sozioökonomische Status (HISEI) besitzt hingegen keine signifikante Prädiktorstärke und hat deshalb keinerlei Aussagekraft. 243 Abhängige Variable: Ergebnis des Leseverstehenstests in Spanisch Jungen - B SE (B) β p Korri‐ giertes R² Modell 1a (n = 21) Konstante 35.659 8.399 - .000 .166 (p = .038) Int. a. Fach Span. 5.990 2.681 .46 .038 Modell 1b (n = 21) Konstante 34.948 7.820 - .000 .208 (p = .022) SFS Selbstk. 6.471 2.591 .50 .022 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 112: Regressionsmodelle 1a und 1b zum Ergebnis der Jungen im Leseverstehens‐ test in Spanisch - 11.10.3.4 Geschlechtsspezifische Prädiktoren für die Schreibleistung in Spanisch Bei der Schreibleistung traten in Spanisch keine statistisch relevanten Unter‐ schiede zwischen den Geschlechtergruppen auf (p = .686, d = .101; vgl. Tabelle 67). Dennoch wird überprüft, inwiefern eventuell geschlechtsspezifische Prä‐ diktoren für diese Teilfertigkeit vorliegen. Die Analyse der Schreibleistung der Mädchen zeigt, dass ein signifikanter Zu‐ sammenhang zum schlussfolgernden Denken (r s = .24*), zur L4 WTC (r s = .36**), zum Interesse am Fach Spanisch (r s = .36**) und zum SFS Selbstkonzept (r s = .58**) besteht. Außerdem korreliert sie signifikant negativ mit der L4-Angst (r s = -.32**; vgl. Anhang 7.4). Regressionsanalysen machen deutlich, dass das SFS Selbstkonzept (β-=-.58**) als alleiniger Prädiktor eine Varianzaufklärung von 33.1% der Schreibleistung 518 11 Auswertung der Ergebnisse der Mädchen liefert (vgl. Modell 1a, Tabelle 113). Die L4-Angst (β = -.33*), die aufgrund des Phänomens der Multikollinearität in einem separaten Regressions‐ modell auf Prädiktorstärke überprüft wurde, hat hingegen einen signifikanten negativen Einfluss auf die Schreibleistung der Mädchen (vgl. Modell 1b, Tabelle 113): Je größere L4-Angst die Mädchen also verspüren, desto schwächer fallen entsprechend ihre Schreibleistungen aus. Schließlich zeigt das schlussfolgernde Denken keinen signifikanten Einfluss auf die Schreibleistung der Mädchen (vgl. Modell 2, Tabelle 113), sodass festgehalten werden kann, dass sich insbesondere affektive Faktoren als zentrale Prädiktoren erweisen. Abhängige Variable: Ergebnis des Schreibtests in Spanisch (Rating 2) Mädchen - B SE (B) β p Korri‐ giertes R² Modell 1a (n = 69) Konstante 24.234 3.983 - .000 .331 (p = .000) SFS Selbstk. 7.885 1.341 .58 .000 Modell 1b (n = 69) Konstante 55.143 2.999 - .000 .095 (p = .006) L4-Angst -3.936 1.383 -.33 .006 Modell 2 (n = 69) Konstante 17.761 8.561 - .042 .328 (p = .000) SPM SFS Selbstk. .134 7.836 .157 1.345 .09 .58 .396 .000 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 113: Regressionsmodelle 1a, 1b und 2 zum Ergebnis der Mädchen im Schreibtest in Spanisch (Rating 2) Die Schreibleistung der Jungen steht schließlich in einer signifikanten positiven Wechselbeziehung zur L4 WTC (r s = .48*), zum Interesse am Fach Spanisch (r s = .50*) und zum SFS Selbstkonzept (r s = .54*; vgl. Anhang 7.4). Regressions‐ analysen zeigen, dass einzig und allein das SFS Selbstkonzept (β = .46*) als signifikanter Prädiktor wirkt und 17.4% der Varianz der Schreibleistung der Jungen erklärt (vgl. Tabelle 114). 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 519 Abhängige Variable: Ergebnis des Schreibtests in Spanisch (Rating 2) Jungen - B SE (B) β p Korrigiertes R² Modell (n = 21) Konstante 26.190 8.953 - .009 .174 (p = .034) SFS Selbstk. 6.777 2.970 .46 .034 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 114: Regressionsmodell zum Ergebnis der Jungen im Schreibtest in Spanisch (Rating 2) Bezüglich der Schreibleistung zeigen sich folglich bei beiden Geschlechter‐ gruppen das SFS Selbstkonzept als starker Einflussfaktor. Allerdings nimmt bei den Mädchen zusätzlich die L4-Angst einen negativen Einfluss auf die Schreibleistung, was bei den Jungen nicht zu beobachten ist. Innerhalb des Schreibtests konnten signifikante Unterschiede zugunsten der Mädchen im Rahmen des zweiten Ratings bei den Kategorien Befolgung des Arbeitsauftrags (p = .047, d = .266) und Inhalt 1 (p = .028, d = .453) gemessen werden (vgl. Tabelle 60). Daher wird mittels Regressionsanalysen überprüft, inwiefern bei diesen beiden Kategorien Prädiktoren sichtbar werden, die den Unterschied zwischen den Geschlechtergruppen eventuell erklären könnten. Bei den Mädchen korreliert allerdings die Befolgung des Arbeitsauftrags mit keiner der erhobenen Variablen signifikant (vgl. Anhang 7.4). Die höchsten nicht signifikanten Korrelationen werden mit dem sozioökonomischen Status (HISEI; r s = -.20), der integrativen Orientierung gepaart mit dem Ideal L4 Self (r s = .18) und der wahrgenommenen Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen (r s = -.21) gemessen. Jedoch ergibt sich daraus kein signifikantes und daher auch kein verwendbares Regressionsmodell. Bei den Jungen zeigen sich im Gegensatz zu den Mädchen aufschlussreiche Korrelationen der Befolgung des Arbeitsauftrags: Sie steht in signifikantem Zusammenhang mit dem sprachlichen Hintergrund (r s = -.65**), weshalb die einsprachigen Jungen tendenziell höhere Punktzahlen erzielen als die mehr‐ sprachigen. Außerdem ist ein signifikanter Zusammenhang mit dem sozioöko‐ nomischen Status (r s = .47*) zu beobachten. Arbeitstempo (BZO, r s = -.45*) und Konzentrationsleistung (KL, r s = -.49*) korrelieren hingegen signifikant negativ mit der Befolgung des Arbeitsauftrags der Jungen und schließlich liegt auch 520 11 Auswertung der Ergebnisse ein signifikanter negativer Zusammenhang mit der genderstereotyp weiblichen Wahrnehmung des Spanischen (r s = -.54*) vor. Regressionsanalysen belegen, dass der sprachliche Hintergrund (β-= -.30) und die genderstereotyp weibliche Wahrnehmung des Spanischen (β = -.36) jeweils einen nicht signifikanten negativen Einfluss auf die Leistung der Jungen in der Kategorie Befolgung des Arbeitsauftrags haben und gemeinsam 29.7% der Varianz erklären (vgl. Tabelle 115). Somit ergeben sich insbesondere bei mehrsprachigen Jungen und bei Jungen, die etwas ausgeprägtere Genderstereotype aufweisen und beispielsweise das Spanische als weibliche Sprache wahrnehmen, den Klang der spanischen Sprache als weiblich empfinden oder das Spanische als von Mädchen bevorzugt erlernte Sprache wahrnehmen, vermehrt schwächere Leistungen in der Kategorie Befolgung des Arbeitsauftrags. Abhängige Variable: Ergebnis in der Befolgung des Arbeits‐ auftrags des Schreibtests in Spanisch (Rating 2) Jungen - B SE (B) β p Korrigiertes R² Modell (n = 21) Konstante 6.845 .675 - .000 .297 (p = .016) Spr. Hintergr. Gend. w. Wahrn. -.653 -.680 .571 .493 -.30 -.36 .268 .185 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 115: Regressionsmodell zum Ergebnis in Befolgung des Arbeitsauftrags der Jungen im Schreibtest in Spanisch (Rating 2) Inhalt 1 korreliert schließlich bei den Mädchen signifikant mit dem SFS Selbst‐ konzept (r s = .31**; vgl. Anhang 7.4). Außerdem zeigt Inhalt 1 einen signifikanten Zusammenhang mit dem Wortschatzspektrum (r s = .37**). SFS Selbstkonzept und Wortschatzspektrum kristallisieren sich im Rahmen von Regressionsrechnungen auch als jeweils signifikante Prädiktoren für die Leistung der Mädchen in Inhalt 1 heraus, wobei das SFS Selbstkonzept lediglich 5.3% (vgl. Modell 1a, Tabelle 116) der Varianz der Leistung der Mädchen erklärt, während das Wortschatzspektrum 13.4% (vgl. Modell 1b, Tabelle 116) der Leistung erklärt und somit zu einer höheren Varianzaufklärung beiträgt, als wenn sowohl SFS Selbstkonzept als auch Wortschatzspektrum als Prädiktoren verwendet werden (vgl. Modell 2, Tabelle 116). 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 521 Abhängige Variable: Ergebnis in Inhalt 1 des Schreibtests in Spa‐ nisch (Rating 2) Mädchen - B SE (B) β p Korri‐ giertes R² Modell 1a (n = 69) Konstante 3.629 .649 - .000 .053 (p = .032) SFS Selbstk. .477 .218 .26 .032 Modell 1b (n = 69) Konstante 3.104 .550 - .000 .134 (p = .001) Wortschatzspek. .431 .127 .38 .001 Modell 2 (n = 69) Konstante 2.760 .686 - .000 .130 (p = .004) SFS Selbstk. Wortschatzspek. .197 .376 .235 .143 .11 .34 .404 .010 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 116: Regressionsmodell zum Ergebnis in Inhalt 1 der Mädchen im Schreibtest in Spanisch (Rating 2) Bei den Jungen korreliert Inhalt 1 signifikant mit der Sorgfalt der Arbeitsweise (F%, r s = .50*) und mit dem Wortschatzspektrum (r s = .55**; vgl. Anhang 7.4). Allerdings stellt die Sorgfalt der Arbeitsweise (F%) keinen signifikanten Prä‐ diktor dar, während das Wortschatzspektrum einen sehr starken Einfluss auf die Leistung in Inhalt 1 nimmt und 38.2% der Varianz der Leistung der Jungen in dieser Kategorie erklärt. 522 11 Auswertung der Ergebnisse Abhängige Variable: Ergebnis in Inhalt 1 des Schreibtests in Spanisch (Rating 2) Jungen - B SE (B) β p Korrigiertes R² Modell (n = 21) Konstante .864 .965 - .382 .382 (p = .002) Wortschatzspek. .845 .231 .64 .002 Anmerkungen. Geschätzte Regressionsparameter (B), Standardfehler der geschätzten Regressions‐ parameter (SE[B]), standardisierte geschätzte Regressionsparameter (β), geschätztes Inkrement (R²). Signifikante Ergebnisse sind fett gedruckt, wobei Werte von p-<-.05 als signifikant definiert werden. Darstellungsweise gemäß DGPs (2019: 86). Tabelle 117: Regressionsmodell zum Ergebnis in Inhalt 1 der Jungen im Schreibtest in Spanisch (Rating 2) 11.10.4 Zwischenfazit: Antwort auf Forschungsfrage 6 für Spanisch Die sechste Forschungsfrage betrifft die Ermittlung unterschiedlicher Prädik‐ toren der jeweiligen Geschlechtergruppen, auf deren Basis eventuell Unter‐ schiede und Gemeinsamkeiten innerhalb der gemessenen Spanischleistungen erklärt werden können. In der Gesamtleistung in Spanisch schnitten die Jungen mit einem schwachen, nicht signifikanten Effekt besser ab als die Mädchen (p = .336, d = -.240; vgl. Ta‐ belle 67). Durch Regressionsrechnungen, die getrennt nach Geschlechtergruppe durchgeführt wurden, konnte bezüglich der Gesamtleistung der Mädchen in Spanisch herausgefunden werden, dass insbesondere das SFS Selbstkonzept und der sozioökonomische Status signifikante Prädiktoren darstellen, aber auch das schlussfolgernde Denken (SPM, Raven 2009) einen schwachen, nicht signifikanten Einfluss auf die Gesamtleistung ausübt, wobei durch diese drei Faktoren 22.9% der Varianz der Gesamtleistung der Mädchen in Spanisch erklärt werden (vgl. Modell 1a, Tabelle 107). Wenn das SFS Selbstkonzept durch die L4 WTC oder das Interesse am Fach Spanisch ersetzt wird, zeigen auch diese beiden Konstrukte signifikante Einflüsse auf die Gesamtleistung der Mädchen in den Spanischtests, wobei allerdings die Varianzaufklärung der Modelle abnimmt (vgl. Modell 1b und 1c, Tabelle 107). Bezüglich der Gesamtleistung der Jungen zeigt sich hingegen eine besonders ausgeprägte Prädiktorstärke des Interesses am Fach Spanisch und ein beinahe signifikanter negativer Einfluss der wahrgenommenen Erwartungen der Peers (vgl. Tabelle 108). 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 523 Im Hörverstehenstest erreichten die Jungen mit einem schwachen, nicht signifikanten Effekt höhere Ergebnisse als die Mädchen (p = .154, d = .298; vgl. Tabelle 67). Regressionsanalysen geben Aufschluss darüber, dass die Hör‐ verstehensleistung der Mädchen insbesondere durch ihr SFS Selbstkonzept positiv beeinflusst wird. Auch das schlussfolgernde Denken erweist sich in diesem Zusammenhang als schwacher, nicht signifikanter Prädiktor. Allerdings zeigen die wahrgenommenen Erwartungen der Eltern signifikante negative Auswirkungen auf die Hörverstehensleistung der Mädchen. Im Vergleich dazu fungiert das schlussfolgernde Denken bei den Jungen als signifikanter Prädiktor für die Hörverstehensleistung und damit als stärkerer Einflussfaktor als bei den Mädchen. Auch das Interesse am Fach Spanisch nimmt einen signifikanten positiven Einfluss. Im Gegensatz dazu erweist sich das Konstrukt der wahrgenommenen Erwartungen der Peers, ähnlich wie bezüglich des Gesamtergebnisses, als signifikanter negativer Prädiktor. Zusammen mit der Länge des Aufenthalts im spanischsprachigen Ausland werden durch diese Prädiktoren 58.2% der Varianz der Hörverstehensleistung der Jungen erklärt. Bezüglich der Leseverstehensleistung, bei der kein statistisch relevanter Geschlechterunterschied gemessen wurde (p = .428, d = .165; vgl. Tabelle 67), kristallisiert sich bei den Mädchen die wahrgenommene Aufmerksamkeits‐ verteilung der Spanischlehrkräfte zugunsten der Mädchen als signifikanter Prädiktor heraus, der zusammen mit dem SFS Selbstkonzept 8.8% der Varian‐ zaufklärung leistet. Hinsichtlich der Leseverstehensleistung der Jungen trägt insbesondere der Prädiktor Interesse am Fach Spanisch signifikant zur Varianzaufklärung bei und der sozioökonomische Status, der allerdings keinen signifikanten Prädiktor darstellt, erhöht die Varianzaufklärung auf 18.3% (vgl. Modell 2, Tabelle 112). Folglich wurden im Bereich des Leseverstehens durchaus unterschiedliche Prädiktoren für die Leistungen der Geschlechtergruppen gefunden. Bezüglich der Schreibleistung, bei der kein statistisch relevanter Geschlech‐ terunterschied gemessen wurde (p = .686, d = .101; vgl. Tabelle 67), stellen im Falle der Mädchen sowohl das SFS Selbstkonzept (vgl. Modell 1a, 2, Tabelle 113) als auch die L4-Angst (vgl. Modell 1b, Tabelle 113) signifikante Prädiktoren dar. Das schlussfolgernde Denken trägt indes nicht signifikant zur Varianzauf‐ klärung bei. Die höchste Varianzaufklärung für die Schreibleistung der Mädchen erreicht das SFS Selbstkonzept als alleiniger Prädiktor mit 33.1% (vgl. Modell 1a, Tabelle 113). Auch bei den Jungen liefert das SFS Selbstkonzept als alleiniger Prädiktor mit 17.4% die höchste Varianzaufklärung (vgl. Tabelle 114), wohin‐ gegen bei ihnen keinerlei Wirkung der L4-Angst messbar ist und somit auch 524 11 Auswertung der Ergebnisse 244 Signifikante Prädiktoren für das Gesamtergebnis wurden mit zwei Punkten der Schrift‐ größe gewertet, nicht signifikante mit einem. Anschließend wurde das Endergebnis mal sechs genommen. Bei den Teilergebnissen zu den sprachlichen Fertigkeiten (Hören, Lesen, Schreiben) wurden ebenfalls signifikante Prädiktoren mit zwei Punkten und nicht signifikante Prädiktoren mit einem Punkt bewertet. Diese Ergebnisse wurden anschließend mit drei multipliziert. Teilkompetenzen der Fertigkeiten wurden gleich bepunktet, aber einfach gezählt. bei der Schreibleistung geschlechtsspezifisch unterschiedliche Einflussfaktoren erfasst wurden. Bei der Befolgung des Arbeitsauftrags (p = .047, d = .266) und Inhalt 1 (p-=-.028, d-=-.453; vgl. Tabelle 60) wurden im Rahmen des zweiten Ratings der Schreibleistungen signifikante Unterschiede zugunsten der Mädchen gemessen, weshalb bezüglich dieser beiden Kategorien ebenfalls mögliche Geschlechter‐ unterschiede innerhalb der Prädiktoren der Leistungen erforscht wurden. Wäh‐ rend bei den Mädchen kein verwendbares Regressionsmodell für die Befolgung des Arbeitsauftrags mithilfe der untersuchten Variablen generiert werden kann, ergeben sich bei den Jungen sowohl der mehrsprachige Hintergrund als auch die genderstereotyp weibliche Wahrnehmung des Spanischen als nicht signifikante negative Prädiktoren, die 29.7% der Varianz der Leistung der Jungen erklären (vgl. Tabelle 115) und die folglich teilweise Aufschluss darüber geben können, weshalb die Jungen hier insgesamt signifikant schwächer abschneiden als die Mädchen. Bezüglich Inhalt 1 erklärt bei den Mädchen (13.4%; vgl. Tabelle 116) und bei den Jungen (38.2%; vgl. Tabelle 117) vor allem jeweils das Wortschatzspektrum die Leistungsvarianz, wobei die Jungen bei dieser lexikalischen Kategorie tendenziell, wenn auch nicht statistisch relevant, schwächer abschnitten als die Mädchen (p = .557, d = .147; vgl. Tabelle 61) und dies ein erster Erklärungsansatz für den signifikanten Unterschied zugunsten der Mädchen in Inhalt 1 darstellt. Bezieht man die hier erzielten Ergebnisse auf das „Netzwerkmodell der interaktiven Faktoren des genderbezogenen Fremdsprachlernerfolgs“ (vgl. Ka‐ pitel 6), wird deutlich, dass im Vergleich zum Französischlernerfolg bei beiden Geschlechtergruppen im Spanischen weniger Faktoren als Prädiktoren für die Spanischleistung wirken (vgl. Abbildung 36). Die Schriftgröße repräsentiert erneut die Prädiktorstärke der jeweiligen Faktoren. 244 Negativ wirkende Fak‐ toren sind durch einen orangefarbenen Hintergrund gekennzeichnet. Einzig und allein die Beziehungen der Faktoren untereinander konnten nicht statistisch nachgewiesen werden und wurden daher von López Rúa (2006) übernommen. Es wird graphisch ersichtlich, dass das SFS Selbstkonzept sich als sehr wichtiger Prädiktor für die Spanischleitung der Mädchen offenbart und die kognitiven 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 525 Grundfähigkeiten einen deutlich weniger wichtigen Prädiktor darstellen als in Französisch. Bei den männlichen Spanischlernenden (vgl. Abbildung 37) wird hingegen deutlich, dass das Interesse am Fach Spanisch den mit Abstand wichtigsten Prädiktor darstellt. Im Gegensatz zu Französisch wird in beiden Darstellungen noch einmal veranschaulicht, dass die wahrgenommene Aufmerksamkeitsver‐ teilung der Spanischlehrkräfte zugunsten der Mädchen als Prädiktor für die Spanischleistung bei beiden Geschlechtergruppen kaum Relevanz besitzt. 526 11 Auswertung der Ergebnisse Abb. 36: Netzwerkmodell der interaktiven Faktoren des genderbezogenen Sprachlerner‐ folgs (Adaptation und Erweiterung des Modells von López Rúa 2006: 112): Darstellung der Prädiktoren für die fremdsprachliche Leistung der weiblichen Spanischlernerinnen 11.10 Analysen von Leistungsprädiktoren innerhalb der Geschlechtergruppen 527 Abb. 37: Netzwerkmodell der interaktiven Faktoren des genderbezogenen Sprachlerner‐ folgs (Adaptation und Erweiterung des Modells von López Rúa 2006: 112): Darstellung der Prädiktoren für die fremdsprachliche Leistung der männlichen Spanischlerner 11.11 Diskriminanzanalysen Um die relative Wichtigkeit jeder einzelnen Variable für die Untersuchung von Geschlechterunterschieden zu bestimmen (vgl. Forschungsfrage 7), werden 528 11 Auswertung der Ergebnisse jeweils eine Diskriminanzanalyse mit den Daten aus der Französisch- und Spanischstichprobe durchgeführt (vgl. Backhaus et al. 2018: 203-266; Bühl 2019: 563-582; Schendera 2011). Dieses statistische Verfahren wurde von Kissau (2006a) etabliert, der in seiner Studie mittels einer Diskriminanzanalyse Moti‐ vationsprofile von männlichen und weiblichen Französischlernenden in Kanada in Grade 9 gezielt erforschte (vgl. Kapitel 5.1.3.1.13). Die Diskriminanzanalyse gibt eine Antwort auf die Frage, welche Kombi‐ nation von Einflussvariablen eine maximal trennende Aufteilung der Fälle nach Geschlechtergruppen erlaubt (vgl. Schendera 2011: 300). Es werden also diejenigen Faktoren ausgerechnet, die die stärkste Trennkraft zwischen den Geschlechtergruppen haben. Für die Güte der Trennung zwischen den beiden Gruppen werden bei der linearen bzw. kanonischen Diskriminanzanalyse drei Kriterien angesetzt: die Mittelwertunterschiede zwischen den beiden Gruppen, das Ausmaß der Überschneidung der Gruppen und das Trennvermögen in Form der vorhergesagten und der tatsächlichen Gruppenzugehörigkeit (vgl. Schendera 2011: 303). Die Diskriminanzanalyse hat den Vorteil, dass sie wech‐ selseitige Korrelationen zwischen den abhängigen Variablen berücksichtigt (vgl. Schendera 2011: 306). Es geht in erster Linie darum, ein differenziertes Profil der Gruppe der weiblichen und der männlichen Französischlernenden zu erstellen, wobei insbesondere endogene affektive als auch wahrgenommene exogene Faktoren in die Modelle aufgenommen werden genauso wie die sprachliche Gesamtleistung. Weder die kognitiven Grundfertigkeiten noch der sozioökono‐ mische Status (HISEI) oder der sprachliche Hintergrund eignen sich dazu, das Geschlecht vorherzusagen, weshalb diese Faktoren von Anfang an aus dem Modell entfernt werden. Sowohl in der Französischals auch in der Spanischs‐ tichprobe werden außerdem diejenigen Faktoren entfernt, die sich als nicht oder nur minimal geeignet dafür herausstellen, Gruppenunterschiede zu erfassen, weil beispielsweise sehr nah beieinanderliegende Mittelwerte erzielt wurden und insgesamt ein hohes Maß an Überschneidung vorliegt. Für die beiden entstandenen Modelle werden außerdem noch einmal die Voraussetzungen für die Modelgüte nach Schendera (2011: 354-360) geprüft. 11.11.1 Diskriminanzanalyse und Antwort auf Forschungsfrage 7 für Französisch In der Französischstichprobe wird eine Diskriminanzanalyse mit denjenigen Faktoren durchgeführt, die das höchste Trennvermögen aufweisen. Es werden n = 83 (n (w) = 46, n (m) = 37) Fälle verarbeitet und bei 9 Fällen fehlt 11.11 Diskriminanzanalysen 529 245 Wilks Lambda (Λ) gibt das Verhältnis der Innerhalb-Quadratsummen zu der Gesamt‐ summe der Quadrate an und kann Werte zwischen 0 und 1 annehmen. Je näher die Werte bei 0 sind, umso stärker unterscheiden sich die Gruppenmittelwerte. Je größer Wilks Lambda ist, desto geringer sind die Gruppenunterschiede. Somit würde ein Lambda-Wert von 1 bedeuten, dass keine Unterschiede zwischen den Gruppen vorliegen. (vgl. Schendera 2011: 321) jeweils mindestens eine Diskriminanzvariable, weshalb diese listenweise aus der Analyse ausgeschlossen werden. Vor der Darlegung der einzelnen Ergebnisse werden die Erfüllung der Voraus‐ setzungen für Diskriminanzanalysen erläutert und allgemeine Charakteristika des errechneten Modells dargelegt (vgl. Schendera 2011): Der Box-M-Test, der die Null-Hypothese der Gleichheit der Kovarianzmatrizen der Gruppen prüft, kommt zu einem nicht-signifikanten Ergebnis (p = .594), was bedeutet, dass keine hinreichenden Anhaltspunkte für unterschiedliche Kovarianzmatrizen der beiden Geschlechtergruppen vorliegen. Somit ist die Voraussetzung der Gleichheit der Kovarianzmatrizen der Gruppen erfüllt (vgl. Schendera 2011: 323). Der Eigenwert der kanonischen Diskriminanzfunktion, der die erklärte Varianz des gesamten Modells (vgl. Tabelle 118) angibt, liegt bei .404. Dies bedeutet, dass die Streuung zwischen den Gruppen das .404-fache der Streuung innerhalb der Gruppen beträgt (vgl. Schendera 2011: 327). Außerdem liegt die kanonische Korrelation des gesamten Modells bei .537, wodurch eine mittelstarke Trennung zwischen den Gruppenzugehörigkeiten gegeben ist. Der Test der Funktion, der die Nullhypothese testet, dass der Mittelwert der Diskri‐ minanzwerte in der Funktion über die beiden Gruppen hinweg gleich ist, kommt zu einem signifikanten Ergebnis (p = .021, Λ = .712). 245 Dies bedeutet, dass in der Diskriminanzanalyse einige Unterschiede zwischen den Geschlechtergruppen ermittelt werden konnten und das Modell daher insgesamt aussagekräftig ist. Des Weiteren liegen die Gruppen-Zentroide bei den weiblichen Französischler‐ nerinnen bei .563 und bei den männlichen Französischlernenden bei -.700. Demzufolge beträgt der Abstand der Gruppen-Zentroide 1.263, was erneut eine relativ hohe Trennschärfe des Modells anzeigt (vgl. Schendera 2011: 330). Insgesamt werden durch das vorliegende Modell 67.4% der weiblichen und 78.4% der männlichen Fälle korrekt klassifiziert, was einer korrekten Klassifikation von 72.3% der gesamten Französischstichprobe entspricht. Das berechnete Modell der Diskriminanzanalyse wird in Tabelle 118 dargestellt und nachfolgend detailliert erläutert. 530 11 Auswertung der Ergebnisse 246 Die gepoolten Korrelationskoeffizienten in der Strukturmatrix geben die Durch‐ schnittswerte der gruppenspezifischen (weiblich/ männlich) Korrelationen der Varia‐ blenmit den Diskriminanzwerten an. 247 Da es sich aber um gepoolte Koeffizienten handelt, welche auch Interkorrelationen der Einflussvariablen einschließen, kann nicht auf einen eindimensionalen direkten Zusammenhang zwischen Freizeitaktivitäten auf Französisch und dem weiblichen Geschlecht geschlossen werden (vgl. Schendera 2011: 329). Die eindimensionalen Korrelationen befinden sich in Anhang 7.1. 248 Der relative Beitrag der einzelnen Einflussvariablen lässt sich aus den standardisierten Diskriminanzkoeffizienten ablesen (vgl. Tabelle 118). Diese können maximal den Wert 1 annehmen, wobei aus ihnen keine Zusammenhänge zwischen den unabhängigen und abhängigen Variablen oder zwischen den Prädiktoren untereinander sichtbar werden (vgl. Schendera 2011: 328). Variable Standardisierte kanoni‐ sche Diskriminanzfunkti‐ onskoeffizienten (aj*) Strukturmatrix: kanoni‐ sche Korrelationskoeffi‐ zienten (r c ) - Diskriminanzfunktion Diskriminanzfunktion W. Erw. d. Elt. L3-Angst W. Erw. d. FLK W. Unt. d. FLK Int. a. Fach Frz. Instr. Orient. Int. Or./ Id. L3 S. Häuf. d. Fr.akt. Fr.spr. Ges.leist. in Frz. Einst. z. frz. Zielkult. FFS Selbstk. L. d. Ausl.auf. L3 WTC -.667 .595 .501 -.451 .451 .445 -.433 .432 .340 .247 .239 -.202 -.022 -.245 .278 .330 .116 .337 .209 .285 .468 .358 .316 .195 .043 .149 Tabelle 118: Standardisierte kanonische Diskriminanzfunktionskoeffizienten und Struk‐ turmatrix der Prädiktoren des Geschlechts in der Französischstichprobe In der Strukturmatrix (vgl. Tabelle 118) befinden sich die gruppenspezifisch er‐ rechneten Korrelationswerte zwischen der jeweiligen Einflussvariable und der ermittelten Diskriminanzfunktion. 246 Nach dem Absolutbetrag der jeweiligen Korrelationskoeffizienten in der Strukturmatrix liegt der stärkste Zusammen‐ hang zwischen der Häufigkeit der Freizeitaktivitäten auf Französisch (r c -=-.468) und der ermittelten Diskriminanzfunktion vor. 247 Den höchsten relativen Anteil an der Gesamtdiskriminanz, der durch den höchsten standardisierten kanoni‐ schen Diskriminanzfunktionskoeffizienten ausgedrückt wird 248 , nehmen in der Französischstichprobe jedoch die wahrgenommenen Erwartungen der Eltern 11.11 Diskriminanzanalysen 531 249 Backhaus et al. (2016: 245) geben einen wichtigen Hinweis für die Interpretation der standardisierten Diskiminanzkoeffizienten: „Für die Beurteilung der diskriminato‐ rischen Bedeutung spielt das Vorzeichen der [standardisierten Diskriminanz]koeffizi‐ enten keine Rolle.“ (a 1 * = -.667; vgl. Tabelle 118) ein. 249 Sie zeigen in der Strukturmatrix eine gruppenspezifische Korrelation der männlichen Lernenden mit der Diskrimi‐ nanzfunktion (r c = -.245), während alle anderen gepoolten Korrelationskoef‐ fizienten der Strukturmatrix eine gruppenspezifische Korrelation der weibli‐ chen Lernenden mit der Diskriminanzfunktion aufweisen und in folgender Reihenfolge zur Unterscheidung zwischen den Geschlechtergruppen beitragen: L3-Angst (a 2 * = .595), wahrgenommene Erwartungen der Lehrkraft (a 3 * = .501), wahrgenommene Unterstützung durch die Lehrkraft (a 4 * = -.451), Interesse am Fach Französisch (a 5 * =.451), instrumentelle Orientierung (a 6 * = .445), integrative Orientierung gepaart mit Ideal L3 Self (a 7 * = -.433), Häufigkeit der Freizeitaktivitäten auf Französisch (a 8 * = .432), fremdsprachliche Gesamtleis‐ tung in Französisch (a 9 * = .340), Einstellungen zur französischen Zielkultur (a 10 * =. 247), FFS Selbstkonzept (a 11 * = .239), Länge des Aufenthalts in einem französischsprachigen Land (a 12 * = -.202) und L3 WTC (a 13 * = -.022). Die genders‐ tereotyp weibliche Wahrnehmung des Französischen, die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen und die wahrgenommenen Erwartungen der Peers weisen schließlich so ein geringes Diskriminanzvermögen auf, dass sie aus dem Modell entfernt werden mussten, da dieses sonst nicht mehr die Voraussetzungen für die Diskriminanz‐ analyse erfüllt hätte (vgl. Schendera 2011). Demzufolge sind diese drei Faktoren sowohl bezüglich der jeweiligen durch die Geschlechtergruppen erzielten Mit‐ telwerte als auch aufgrund der Überschneidungen der Streudiagrammswolken nicht geschlechtsspezifisch unterschiedlich. Die Interpretation dieses Modells, welche Bezüge zu den bisherigen Ergebnissen dieser Studie und zum Stand der Forschung einschließt, wird in Kapitel 12.1 vorgenommen. 11.11.2 Diskriminanzanalyse und Antwort auf Forschungsfrage 7 für Spanisch Mit den erhobenen Daten der Spanischstichprobe wird eine Diskriminanzana‐ lyse mit denjenigen Faktoren durchgeführt, die das höchste Trennvermögen aufweisen. Es werden 89 Fälle verarbeitet, darunter 69 Mädchen und 20 Jungen. Bei 5 Fällen fehlt jeweils mindestens eine Diskriminanzvariable, weshalb diese listenweise aus der Analyse ausgeschlossen und daher als fehlende Werte behandelt werden. 532 11 Auswertung der Ergebnisse Wie bei Französisch werden auch bezüglich des Fachs Spanisch vor der Darlegung der einzelnen Ergebnisse die Erfüllung der Voraussetzungen für Dis‐ kriminanzanalysen überprüft und allgemeine Charakteristika des errechneten Modells dargelegt (vgl. Tabelle 119; Schendera 2011): Der Box-M-Test kommt zu einem nicht-signifikanten Ergebnis (p-=-.285), was bedeutet, dass keine hin‐ reichenden Anhaltspunkte für unterschiedliche Kovarianzmatrizen der beiden Merkmalsgruppen gegeben sind. Aus diesem Grund kann die Voraussetzung der Gleichheit der Kovarianzmatrizen der Geschlechtergruppen als erfüllt betrachtet werden (vgl. Schendera 2011: 323). Der Eigenwert der kanonischen Diskriminanzfunktion liegt bei .443, was bedeutet, dass die Streuung zwischen der Gruppe der Jungen und der Gruppe der Mädchen das .443-fache der Streuung innerhalb der beiden Gruppen beträgt. Dieser relativ hohe Eigenwert der kano‐ nischen Diskriminanzfunktion bestätigt folglich eine adäquate erklärte Varianz des errechneten Modells (vgl. Tabelle 119; Schendera 2011: 327). Außerdem liegt die kanonische Korrelation des errechneten Modells bei .554, wodurch eine mittelstarke Trennung zwischen den Gruppenzugehörigkeiten festgestellt werden kann. Der Test der Funktion kommt zu einem signifikanten Ergebnis (p = .009, Λ = .693), was bedeutet, dass in der Diskriminanzanalyse bezüglich des Spanischen einige Unterschiede zwischen den Geschlechtergruppen ermittelt werden konnten und das Modell daher insgesamt aussagekräftig ist. Des Wei‐ teren liegen die Gruppen-Zentroide bei den weiblichen Spanischlernerinnen bei .354 und bei den männlichen Spanischlernenden bei -1.223. Demnach handelt es sich um einen Abstand der Gruppen-Zentroide von 1.577, was ein weiteres Indiz für eine relativ hohe Trennschärfe des Modells darstellt (vgl. Schendera 2011: 330). Insgesamt werden durch das vorliegenden Modell 75.4% der weiblichen Fälle und 75% der männlichen Fälle korrekt klassifiziert, was einer korrekten Klassifikation von 75.3% der Gesamtstichprobe entspricht. In Tabelle 119 wird das besagte Modell der Diskriminanzanalyse präzise dargestellt: 11.11 Diskriminanzanalysen 533 Variable Standardisierte kanoni‐ sche Diskriminanzfunk‐ tionskoeffizienten (aj*) Strukturmatrix: kanoni‐ sche Korrelationskoeffi‐ zienten (r c ) - Diskriminanzfunktion Diskriminanzfunktion SFS Selbstk. Int. a. Fach Span. L4-Angst W. Erw. d. Peers Einst. z. span. Zielkult. W. Erw. d. SLK W. Erw. d. Elt. L4 WTC L. d. Ausl.auf. Instr. Orient. Häuf. d. Fr.akt. W. Unt. d. SLK W. Auf. z. d. M. Fr.spr. Ges.leist. in Span. .900 -.815 .670 .580 .567 -.339 -.336 -.298 .142 .106 .103 -.093 -.092 -.075 -.046 -.226 .373 .318 .370 -.054 -.133 -.288 .026 .213 .079 -.193 -.052 -.090 Tabelle 119: Standardisierte kanonische Diskriminanzfunktionskoeffizienten und Struk‐ turmatrix der Prädiktoren des Geschlechts in der Spanischstichprobe In der Strukturmatrix (vgl. Tabelle 119) befinden sich die gruppenspezifisch errechneten Korrelationswerte zwischen der jeweiligen Einflussvariable und der ermittelten Diskriminanzfunktion, wobei ein negatives Vorzeichen vor den kanonischen Korrelationskoeffizienten eine gruppenspezifische Korrelation der männlichen Probanden mit der Diskriminanzfunktion angibt und entsprechend ein positives Vorzeichen eine gruppenspezifische Korrelation der weiblichen Probandinnen. Den höchsten relativen Anteil an der Gesamtdiskriminanz, der durch den höchsten standardisierten kanonischen Diskriminanzfunktionskoeffizienten ausgedrückt wird, nimmt in der Spanischstichprobe das SFS Selbstkonzept (a 1 * = .900; vgl. Tabelle 119) ein. Der negative Wert beim SFS Selbstkonzept in der Strukturmatrix gibt eine gruppenspezifische Korrelation der männlichen Lernenden mit der Diskriminanzfunktion (r c = -.046) an. Der zweithöchste Anteil an der Gesamtdiskriminanz liegt beim Interesse am Fach Spanisch (a 2 * = -.815), wobei es sich ebenfalls um eine gruppenspezifische Korrelation der männlichen Lernenden mit der Diskriminanzfunktion (r c = -.226) handelt. Nach dem Absolutbetrag der jeweiligen Korrelationskoeffizienten in der Struk‐ turmatrix liegt der stärkste gruppenspezifische Zusammenhang, der zugunsten der Mädchen ausfällt, zwischen der L4-Angst (r c = .373) und der ermittelten Diskriminanzfunktion vor. Die L4-Angst (a 3 * = .670) nimmt jedoch lediglich den drittstärksten Anteil an der Gesamtdiskriminanz ein. Dies bedeutet, dass die 534 11 Auswertung der Ergebnisse Mädchen sich durch ihre L4-Angst stark von den Jungen unterscheiden, das SFS Selbstkonzept, und das Interesse am Fach Spanisch jedoch noch besser zur Unterscheidung der Geschlechtergruppen beitragen, da sich die Jungen durch die relativ starke Ausprägung dieser beiden Faktoren stärker von den Mädchen unterscheiden. Im Gegensatz zum Französischen, bei dem die wahrgenommenen Erwar‐ tungen der Peers nicht zur Unterscheidung zwischen den beiden Geschlech‐ tergruppen beitrugen, nimmt dieses Konstrukt bezüglich des Spanischen (a 4 * = .580) den viertstärksten Anteil der Gesamtdiskriminanz ein. Der grup‐ penspezifische Zusammenhang fällt hier ebenfalls zugunsten der Mädchen aus (r c -=-.318), sodass hohe wahrgenommene Erwartungen der Peers vor allem ein Attribut der Mädchen darstellen. Den fünftgrößten Anteil an der Gesamtvarianz nehmen die Einstellungen zur spanischen Zielkultur ein (a 5 * =.451), wobei eine hohe Ausprägung dieses Faktors eher bei den Mädchen auftritt (r c = .370). An sechster, siebter und achter Stelle hinsichtlich der relativen Wichtigkeit für die Untersuchung von Geschlechterunterschieden stehen die wahrgenommenen Erwartungen der Spanischlehrkraft (a 6 *-=---.339), die wahrgenommenen Erwartungen der Eltern (a 7 * = -.336) und die L4 WTC (a 8 * = -.298), wobei eine hohe Ausprägung dieser Faktoren tendenziell öfter bei den Jungen vorkommt. Hingegen weisen die Länge des Aufenthalts in einem spanischsprachigen Land (a 9 * = .142), die in‐ strumentelle Orientierung (a 10 * = .103) und die Häufigkeit der Freizeitaktivitäten auf Spanisch (a 11 * = .103) geringe Trennstärken zugunsten der Mädchen auf. Einen vernachlässigbaren Beitrag in Bezug auf die Unterscheidung zwischen den Geschlechtergruppen leisten die wahrgenommene Unterstützung der Spa‐ nischlehrkraft (a 12 * = -.093), die wahrgenommene Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen (a 13 * = -.092) und schließlich die fremdsprachliche Gesamtleistung in Spanisch (a 13 * = -.075), wobei diese drei letzten Faktoren erneut leicht zugunsten der Jungen ausschlagen. Bezeichnend für Spanisch ist demnach, dass, im Gegensatz zu Französisch, die fremdsprach‐ liche Gesamtleistung kaum Trennstärke für die Unterscheidung der Geschlech‐ tergruppen besitzt. Aufgrund vollständig fehlender Trennschärfe konnten die Variablen inte‐ grative Orientierung gepaart mit Ideal L4 Self und die genderstereotyp weib‐ liche Wahrnehmung des Spanischen nicht mit in die Diskriminanzanalyse aufgenommen werden (vgl. Schendera 2011). Bei beiden wurde in Kapitel 11.7.5 kein statistisch relevanter Unterschied zwischen den weiblichen und den männlichen Spanischlernenden festgestellt. Demzufolge sind diese beiden Faktoren nicht nur bezüglich der jeweiligen durch die Geschlechtergruppen 11.11 Diskriminanzanalysen 535 erzielten Mittelwerte, sondern auch aufgrund der starken Überschneidungen der Streudiagrammswolken nicht geschlechtsspezifisch unterschiedlich. Die Interpretation dieses Modells, welche Bezüge zu den bisherigen Ergebnissen dieser Studie und zum Stand der Forschung einschließt, wird in Kapitel 12.2 vorgenommen. 536 11 Auswertung der Ergebnisse 12 Interpretation der Ergebnisse Im Folgenden werden anhand aller vorliegenden Ergebnisse aus den Sprach‐ tests, den kognitiven Tests und der Fragebogenstudie sowie vor dem Hinter‐ grund der durchgeführten statistischen Analysen und des Stands der Forschung Interpretationen der Ergebnisse vorgenommen. Dabei werden die Ergebnisse des Hörverstehens, Leseverstehens, Schreibens und die Gesamtergebnisse der Sprachtests interpretiert, bevor diese zu den Ergebnissen der Diskriminanzana‐ lyse in Bezug gesetzt werden. Im Fokus stehen dabei mögliche Ursachen für vergleichbare und unterschiedliche Ergebnisse der Geschlechtergruppen in den einzelnen fremdsprachlichen Leistungen. 12.1 Interpretation der zentralen Ergebnisse in Französisch Im Laufe der statistischen Auswertung und Analyse der Ergebnisse der vor‐ liegenden Studie wurde deutlich, dass innerhalb der verschiedenen Französi‐ schleistungen sowohl Geschlechterunterschiede als auch -gemeinsamkeiten auftreten, wobei die signifikanten Geschlechterunterschiede in den Französi‐ schleistungen stets zugunsten der Mädchen ausfallen, aber auch Kompetenzbe‐ reiche erfasst wurden, in denen keinerlei Unterschiede messbar sind. Gleich‐ wohl gibt es auch einzelne Kompetenzbereiche, bei denen die Jungen minimal besser abschneiden, wenn auch keinerlei statistische Relevanz dieser Ergebnisse messbar ist. 12.1.1 Interpretation der zentralen Ergebnisse bezüglich des Hörverstehenstests in Französisch Bezüglich des Gesamtergebnisses im Hörverstehenstest liegt kein statistisch relevanter Geschlechterunterschied vor (vgl. Tabelle 27, Kapitel 11.4.1.1). Der gemessene Effekt (d = .178), der zugunsten der Mädchen gemessen wurde, ist allerdings etwas größer als derjenige, der bei der Ländervergleichsstudie von 2009 zwischen männlichen und weiblichen Lernenden der 9. Jahrgangsstufe aus Baden-Württemberg beim Hörverstehen in Französisch gefunden wurde (d = .13; vgl. Winkelmann/ Groeneveld 2010: 183). Gleichzeitig ist der hier gemes‐ sene Effekt etwas kleiner als der damals im Ländervergleich auf Bundesebene gemessene Wert (d = .24; vgl. Winkelmann/ Groeneveld 2010: 183). Folglich ist 250 Vgl. auch Grosjean (2012) zum monolingualen und bilingualen language mode beim frühen Erwerb von zwei Erstsprachen, welcher allerdings laut de Bot und Roche (2018: 21) nicht in allen psycholinguistischen Bereichen nachgewiesen werden kann. das Ergebnis bezüglich der Größe des Geschlechterunterschieds durchaus kon‐ form mit den Ergebnissen der bisherigen Bildungsmonitorings in Französisch. Bezüglich der Fertigkeit Hörverstehen erweist sich das in der vorliegenden Studie erzielte Ergebnis auch als komplementär zu demjenigen von Fuchs (2014: 193), die bezüglich des Englischen ein höheres Interesse von Jungen für die Fertigkeit Hörverstehen findet. Ein ähnlich hohes Interesse der Jungen bezüg‐ lich des Hörverstehens im Französischen könnte nämlich dazu beigetragen haben, dass in der vorliegenden Studie keinerlei Unterschiede zwischen den Geschlechtergruppen in dieser sprachlichen Teilfertigkeit gemessen wurde und die Jungen in der ersten und zweiten Teilaufgabe sogar tendenziell leicht höhere durchschnittliche Punktzahlen erzielen als die Mädchen. Die Streuung der Hörverstehensleistung der Jungen ist außerdem minimal größer als diejenige der Mädchen (vgl. Tabelle 27, Kapitel 11.4.1.1), wenngleich die Leistungsspitzen bei den Mädchen zu finden sind, wodurch die Tendenz der höheren Varianz der Leistungen der Jungen, von der Lange et al. (2016) ausgehen, teilweise bestätigt wird. Wie bereits berichtet, wurde im Hörverstehen in Französisch von beiden Ge‐ schlechtergruppen ein Niveau unter A2.1 erzielt, was ein deutlich zu niedrigeres Ergebnis darstellt (vgl. Kapitel 11.4.1.1): Durch die Vorgaben der Bildungsstan‐ dards, nach denen am Ende von Jahrgangsstufe 10 das Niveau B1.2 erreicht werden soll, wäre mindestens das durchschnittliche Niveau A2.2 oder B1.1 zu erwarten gewesen (vgl. KMK 2004, Landesinstitut für Schulentwicklung/ Statis‐ tisches Landesamt Baden-Württemberg 2018: 262). Das etwas schwächere Ge‐ samtergebnis im Hörverstehenstest in Französisch liegt möglicherweise an der Schwierigkeit, die beide Geschlechtergruppen damit hatten, mit unbekannten Aufgabenformaten umzugehen, oder an der eventuell ungewohnten Testsitua‐ tion, einige Hörbeiträge nur ein einziges Mal anhören zu können. Außerdem war die Aufgabenstellung auf Deutsch verfasst und somit wurde zwar nicht gleichzeitig das Leseverstehen im Französischen abgeprüft, was die Validität des Tests erhöht, jedoch mussten während des Absolvierens des Hörverstehens gewisse Sprachmittlungkompetenzen und Code-Switching-Strategien eingesetzt werden, die eine gewisse kognitive Herausforderung darstellten (vgl. Nieweler 2017c). 250 Außerdem muss erwähnt werden, dass die französische Prosodie insgesamt zahlreiche Besonderheiten aufweist, da die Phonem-Graphem-Be‐ ziehungen sehr komplex sind und das Fehlen lautlicher Markierungen der Wortgrenzen innerhalb des mot phonétique sogar zu Homophonien auf syntak‐ 538 12 Interpretation der Ergebnisse 251 Beispielsweise kann das frz. / ilɛtuvɛrt/ verstanden werden als il est ouvert ‘es ist offen‘ oder il est tout vert ‘es ist ganz grün‘ (Schmitt et al. 2011: 272). tischer Ebene und somit zu Mehrdeutigkeiten führen kann (vgl. Schmitt et al. 2011: 272). 251 Zudem trat in den Hörtexten teilweise die Westschweizer Va‐ rietät des Französischen auf, insbesondere im Hinblick auf Intonation, einzelne Toponyme und Zahlwörter, was sicherlich zu einer leichten Erhöhung des Schwierigkeitsgrads für die Probandinnen und Probanden führte (vgl. Kapitel 9.2.1.1). Eine weitere Erklärungsmöglichkeit für das insgesamt etwas schwä‐ chere Niveau im Hörverstehen in Französisch könnte möglicherweise sein, dass die Hörtexte nur in geringem Maße didaktisiert wurden und teilweise einen relativ authentischen, umgangssprachlichen Sprachgebrauch widerspiegelten, was womöglich bei einer Hörerfahrung von hauptsächlich didaktisierten Texten eventuell Schwierigkeiten bereiten mochte. Schließlich könnte auch ein ge‐ ringes kulturelles und inhaltliches Vorwissen der Probandinnen und Probanden, beispielsweise bezüglich des Themas Autorennen, welches in der ersten Teilauf‐ gabe dargeboten wurde, oder bezüglich unbekannter geographischer Angaben das Ergebnis beeinflusst haben (vgl. Grotjahn/ Tesch 2010). Allerdings bleibt festzuhalten, dass Jungen und Mädchen mit diesen Schwierigkeiten insgesamt vergleichbar erfolgreich umgehen konnten, auch wenn beide Merkmalsgruppen etwas unter dem erwarteten Kompetenzniveau bleiben. Bei den Ergebnissen der Jungen und der Mädchen in den einzelnen Teilauf‐ gaben ist jedoch eine gewisse Variation der Leistungen der beiden Geschlech‐ tergruppen messbar: In der ersten Teilaufgabe (Autorennsport, HV-38) erzielten Jungen und Mädchen vergleichbare Ergebnisse, wobei die Jungen einen mi‐ nimal höheren Mittelwert erreichten als die Mädchen, jedoch ohne dass der Unterschied statistisch relevant wäre. In der zweiten Teilaufgabe (Nachrichten, HV-29) erzielten Jungen und Mädchen ebenfalls vergleichbare Ergebnisse, mit einer ganz leichten, statistisch nicht relevanten Tendenz zugunsten der Jungen. Auch in der dritten Teilaufgabe (Liebesgeschichten, HV-39) wurde kein statistisch relevanter Geschlechterunterschied gemessen, wobei die Mädchen hier tendenziell leicht höhere Ergebnisse erzielten. Einzig in der vierten (Handy, HV-17) und in der fünften Teilaufgabe (Werbung, HV-27) konnten jeweils statistisch relevante schwache, allerdings nicht signifikante Effekte zugunsten der Mädchen gemessen werden (vgl. Tabelle 27, Kapitel 11.4.1.1). Bei den Teilergebnissen des Hörverstehenstests in Französisch fällt also auf, dass sich auch bei traditionellen „Mädchenthemen“ wie beispielsweise Liebesgeschichten in der dritten Teilaufgabe keine signifikant höheren durch‐ schnittlichen Punktzahlen der Mädchen feststellen lassen. Auch bei traditio‐ 12.1 Interpretation der zentralen Ergebnisse in Französisch 539 nellen „Jungenthemen“ wie beispielsweise Autorennsport werden keine signi‐ fikant höheren Punktzahlen bei den Jungen gemessen. Folglich lässt sich die Hypothese von Bügel und Buunk (1996: 17), das geschlechtsspezifische Interessensgebiete einen Einfluss auf die fremdsprachliche Leistung hätten, anhand der Ergebnisse des Hörverstehenstests nicht bestätigen, selbst wenn minimale Tendenzen dahingehend erkennbar sind, dass die Jungen bei Aufgaben aus genderstereotyp männlichen Themengebieten tendenziell leicht höhere Ergebnisse erzielen und Mädchen bei genderstereotyp weiblichen Themenge‐ bieten. Die statistischen Tendenzen sind allerdings so klein, dass hierzu bezüg‐ lich des Hörverstehens keinerlei abschließende Aussagen getroffen werden können. Gewisse Übereinstimmungen der Stichprobe mit den in der Literatur angegebenen geschlechtsspezifischen Interessensgebieten (vgl. Dresel et al. 2005: 3; Jansen et al. 2013; Sparfeldt et al. 2004) bestätigen sich jedoch auch im Rahmen der Fragebogenstudie: Bei der Abfrage des Interesses am Thema „Liebe und Partnerschaft“ als Teil des Themenbereichs „Leben der Jugendlichen“ kommen die Mädchen auf 28.0% und die Jungen auf 13.5%. Ein Chi-Quadrat-Test ergibt, dass sich Jungen und Mädchen bezüglich dieses Themengebiets nicht signifikant voneinander unterscheiden. Betrachtet man das Interessensgebiet „Sport“ als Oberbegriff für das in der ersten Teilaufgabe dargebotene Thema „Autorennsport“, so interessieren sich 32.0% der Mädchen und 54.1% der Jungen dafür, was, laut Chi-Quadrat-Test einen signifikanten Unterschied in diesem Interessensgebiet ergibt. Bezüglich des Gesamtergebnisses des Hörverstehenstests wurden weitere statistische Analysen vorgenommen: Die Durchführung zweifaktorieller Va‐ rianzanalysen mit den Variablen Geschlecht und sozioökonomischer Status zeigte für das Gesamtergebnis im Hörverstehenstest einen signifikanten Inter‐ aktionseffekt zwischen diesen beiden Variablen. Dabei wurde deutlich, dass die Jungen mit niedrigem sozioökonomischem Status einen nicht signifikant höheren Mittelwert im Hörverstehen erzielten als Mädchen mit niedrigem sozioökonomischem Status, während in den Kategorien mittlerer und hoher sozioökonomischer Status die Mädchen tendenziell höhere, nicht signifikante Ergebnisse erzielten als die Jungen. Im Gegensatz zu möglichen Annahmen schneiden also insbesondere die Jungen mit niedrigem sozioökonomischem Status im Hörverstehen überraschend gut ab, wobei, wie nachher gezeigt wird, ähnliche Tendenzen auch für das Leseverstehen und das Schreiben zu beob‐ achten sind. Die Ursache könnte beispielsweise darin liegen, dass insbesondere Jungen, die in einem Umfeld von Schülerinnen und Schülern mit höherem sozioökonomischem Status sozialisiert werden, teilweise besonders von diesem Umfeld profitieren, auch weil sie sehr sensibel auf ihre Peers innerhalb des 540 12 Interpretation der Ergebnisse Klassenzimmers reagieren; ähnliche Tendenzen konnten von Legewie und DiPrete (2012) für die erstsprachliche Lesekompetenz in der Grundschule belegt werden. Insgesamt liegt der durchschnittliche sozioökonomische Status der gesamten Französischstichprobe mit einem HISEI von 62.77 deutlich über dem bundesweiten Durchschnitt; Prenzel et al. (2013) ermittelten beispielsweise einen durchschnittlichen HISEI-Wert von 56.6 für Gymnasiasten in Deutsch‐ land. Im Gegensatz zu den differierenden Ergebnissen bezüglich des sozioökono‐ mischen Status erzielten einsprachige und mehrsprachige Jungen sowie ein‐ sprachige und mehrsprachige Mädchen vergleichbare Ergebnisse im Hörvers‐ tehenstest (vgl. Tabelle 68, Kapitel 11.6.1), weshalb bezüglich dieser Fertigkeit nicht von einer Benachteiligung der Jungen mit Migrationshintergrund (vgl. Feliciano/ Rumbaut 2005; Støren/ Helland 2010) gesprochen werden kann und hier keinerlei Hinweise auf eine mögliche „Risikogruppe“ auszumachen sind. Im Rahmen von Regressionsanalysen konnte zudem herausgefunden werden, dass das Geschlecht keinen signifikanten Prädiktor für die Hörverstehensleis‐ tung in Französisch darstellt, sondern vielmehr die Leistung im schlussfol‐ gernden Denken (SPM, Raven 2009), das FFS Selbstkonzept und die Länge des Aufenthalts im französischsprachigen Ausland entscheidende Einflussfaktoren darstellen. Die Moderatorenvariable Geschlecht * sozioökonomischer Status, welche sich als signifikante Interaktionsvariable im Rahmen der zweifaktori‐ ellen Varianzanalysen ergeben hatte, kristallisierte sich außerdem aufgrund der überdurchschnittlich hohen Ergebnisse der Jungen mit niedrigem sozio‐ ökonomischem Status als schwacher, nicht signifikanter Prädiktor für die Gesamtleistung im Hörverstehen in Französisch heraus (vgl. Tabelle 78, Modell 5). Somit haben zwar das Geschlecht und der sozioökonomische Status für sich allein genommen keinerlei Wirkung auf die Hörverstehensleistung, aber eine Kombination aus beiden übt durchaus einen gewissen Einfluss auf die Hörverstehensleistung aus. Dieses Ergebnis stützt den Ansatz der Intersektio‐ nalitätsforschung von Gottburgsen und Gross (2012) und verdeutlicht, dass das Geschlecht nicht als eindimensionale Variable betrachtet werden kann. Trotz der vergleichbaren Ergebnisse im Hörverstehenstest der Jungen und Mädchen zeigten Regressionsanalysen, die getrennt nach Geschlechtergruppe durchgeführt wurden, jeweils unterschiedliche Prädiktoren: Bei den weiblichen Lernerinnen beeinflussen vor allem das schlussfolgernde Denken und die wahrgenommene Unterstützung durch die Französischlehrkraft die Hörvers‐ tehensleistung signifikant positiv (vgl. Modell 1, Tabelle 87). Im Gegensatz dazu wirkt bei den Jungen das FFS Selbstkonzept als einziger signifikanter positiver Prädiktor für die Hörverstehensleistung. Das schlussfolgernde Denken 12.1 Interpretation der zentralen Ergebnisse in Französisch 541 nimmt außerdem einen schwachen, nicht signifikanten, positiven Einfluss und die wahrgenommenen Erwartungen der Peers weisen einen schwachen, nicht signifikanten negativen Einfluss auf die Hörverstehensleistung der Jungen auf (vgl. Modell 1a, Tabelle 88,). Die wahrgenommene Unterstützung durch die Französischlehrkraft erwies sich außerdem in einer zweiten Regressionsanalyse als ein schwacher, nicht signifikanter negativer Prädiktor für die Hörverste‐ hensleistung der Jungen (vgl. Modell 1b, Tabelle 88,). Obwohl also keinerlei signifikante Geschlechterunterschiede im Gesamtergebnis der Hörverstehens‐ leistung festgestellt wurden, konnten bei den Jungen, im Gegensatz zu den Mädchen, zwei schwache, nicht signifikant negative Einflüsse aus dem Bereich des Ought-to L3 Self auf die Hörverstehensleistung ausgemacht werden: Je höher die wahrgenommenen Erwartungen der Peers der Jungen und die wahrgenom‐ mene Unterstützung der Französischlehrkräfte der Jungen sind, umso niedriger fällt ihre Hörverstehensleistung aus. In Bezug auf die Französischlehrkräfte könnte dieser Effekt eventuell daher stammen, dass die Jungen während der Adoleszenz versuchen, im Sinne des Doing Gender ein genderstereotyp männliches Image aufzubauen (vgl. Budde 2005; van Houtte 2004), wobei eine hohe Unterstützung der weiblichen Lehrkräfte diese Tendenz eventuell eher verstärken als abschwächen könnte (vgl. Carroll/ Husén 1975; Martino 1995). Dies ist jedoch nur eine Hypothese, da offenbleibt, inwiefern tatsächlich das Geschlecht der Lehrkraft oder aber andere Faktoren wie beispielsweise die Art der Unterstützung der Lehrkraft ausschlaggebend für dieses Ergebnis sind. Ein positiver Befund, der bei diesen Überlegungen nicht außer Acht gelassen werden darf, ist dennoch, dass die Unterstützung durch die Französischlehrkraft insge‐ samt von beiden Geschlechtergruppen als vergleichbar hoch wahrgenommen wird (vgl. Tabelle 73, Kapitel 11.7.1). Dies schließt zumindest aus, dass die Jungen von den weiblichen Französischlehrkräften weniger Unterstützung erfahren als die Mädchen, wodurch die Ergebnisse von Worrall und Tsarna (1987) sowie MacIntyre et al. (2002) widerlegt und die Studienergebnisse von Bacher et al. (2008), Helbig (2010a), Holmlund und Sind (2008), Jones und Jones (2001) bestätigt werden. Letztere konnten ebenfalls keine geschlechtsspezifischen Unterschiede in der Unterstützungshaltung von Lehrkräften gegenüber Jungen und Mädchen feststellen. Allerdings zeigen diese Ergebnisse auch, dass eine hohe Unterstützung der Lehrkraft allein noch nicht auszureichen scheint, da diese bei beiden Geschlechtergruppen jeweils anders wirkt und im Falle der Jungen sogar einen negativen Einfluss hat. An dieser Stelle bildet sich somit eine weitere Forschungslücke, die in Anschlussuntersuchungen zentral werden könnte und innerhalb derer analysiert werden müsste, welche Faktoren die 542 12 Interpretation der Ergebnisse 252 In der HarmoS-Studie wurden bei der Dokumentation der Prüfung der Nullhypothese stets die t-Werte und keine Maße der Effektstärke angegeben (vgl. Konsortium HarmoS Fremdsprachen 2009). jeweils unterschiedliche Wirkung einer ähnlich hohen Unterstützung durch die Lehrkräfte bedingen. Insgesamt bleibt festzuhalten, dass im Gesamtergebnis im Hörverstehen keinerlei geschlechtsspezifische Unterschiede feststellbar waren, sich jedoch ein signifikanter Interaktionseffekt von Geschlecht und sozioökonomischem Status zugunsten der Jungen mit niedrigem sozioökonomischem Status ergab und trotzdem gleichzeitig eine tendenziell negative Wirkung der vergleichs‐ weise hohen Unterstützungsmaßnahmen der Lehrkräfte auf die Hörverstehens‐ leistung der Jungen gefunden wurde. Außerdem schienen die Jungen und die Mädchen gleichermaßen mit den Schwierigkeiten des Tests zu kämpfen, weshalb beide Gruppen leicht unter dem erwartbaren Niveau blieben und schließlich waren Hörverstehensleistungen kaum auf geschlechtsspezifische Interessensgebiete zurückzuführen. 12.1.2 Interpretation der zentralen Ergebnisse bezüglich des Leseverstehenstests in Französisch Bei einer Analyse der Ergebnisse des Leseverstehenstests in Französisch zeigt sich, dass ein knapp nicht signifikanter mittlerer Effekt zugunsten der Mädchen gefunden wurde (d = .427, t (86) = 1.978; vgl. Tabelle 31, Kapitel 11.4.1.1), der deutlich größer ausfiel als in der Ländervergleichsstudie von 2009 für Französisch (d = .19 in Baden-Württemberg und d = .23 auf Bundesebene, vgl. Winkelmann/ Groeneveld 2010: 182), als in der HarmoS-Studie für Französisch (t = 1.675; vgl. Konsortium HarmoS Fremdsprachen 2009: 39) 252 und als in der DESI-Studie für Englisch (d = .25; vgl. Hartig/ Jude 2008: 204). Darüber hinaus bestätigt sich die bereits im Ländervergleich von 2009 und in der DESI-Studie beobachtete Tendenz, dass die Vorteile der Mädchen im Leseverstehen ausge‐ prägter zu sein scheinen als diejenigen im Hörverstehen (vgl. Hartig/ Jude 2008: 204; Winkelmann/ Groeneveld 2010). In der vorliegenden Studie ist zudem die Streuung bei der Leistung im Leseverstehen bei den Jungen erneut größer als bei den Mädchen, wobei die Leistungsspitzen bei den Mädchen zu finden sind, was, wie bereits beim Hörverstehen, die Hypothese von Lange et al. (2016) bezüglich der größeren Varianz der Leistungen der Jungen teilweise bestätigt. Schließlich gestalten sich die Ergebnisse der vorliegenden Studie erneut komplementär zu den Ergebnissen von Fuchs (2014: 193), die herausgefunden hatte, dass sich Mädchen eher für den Lernbereich Lesen interessieren als Jungen. 12.1 Interpretation der zentralen Ergebnisse in Französisch 543 253 Ein zusätzlich durchgeführter Mann-Whitney-U Test ergab hierbei keinerlei Geschlech‐ terunterschiede (U-=-918.000, Z-= -.076, p-=-.940, d-=-.013). Beide Geschlechtergruppen erreichten im Leseverstehenstest in Französisch - im Gegensatz zu den eher schwachen Hörverstehensleistungen - insgesamt das Niveau B1.1, was eine bildungsstandardkonforme Entwicklung der Jungen und Mädchen bestätigt (vgl. KMK 2004) und, aufgrund der Zuordnung der beiden Gruppen zum selben Kompetenzniveau, auch die statistisch messbaren Geschlechterunterschiede etwas relativiert. In der ersten Teilaufgabe des Leseverstehenstests (Umfrage, LV-32) lagen keinerlei geschlechtsspezifische Unterschiede vor. Der vergleichsweise große Geschlechterunterschied zugunsten der Mädchen, der in der vorliegenden Studie bezüglich des Gesamtergebnisses im Leseverstehenstest in Französisch gefunden wurde, geht vor allem auf die Ergebnisse der zweiten Teilaufgabe (Kurze Geschichte, LV-33) zurück, da bei dieser sehr große Leistungsvorteile der Mädchen festgestellt wurden, während in der dritten Teilaufgabe lediglich ein schwacher, nicht signifikanter Effekt zugunsten der Mädchen gemessen wurde (vgl. Tabelle 31, Kapitel 11.4.2.1). Der eklatante Geschlechterunterschied in der zweiten Teilaufgabe könnte laut Braun und Schwemer (2013) sowie Bügel und Buunk (1996) eventuell teilweise auf die Textsorte des narrativen Textes zurück‐ geführt werden, da diese Textsorte lediglich in der zweiten Teilaufgabe anzu‐ treffen ist und eventuell eher den Interessen der Mädchen entspricht. Hingegen scheint die geforderte Leseintention des sorgfältig-genauen Lesens weniger Einfluss auf den Unterschied ausgeübt zu haben, da diese auch in der ersten Teil‐ aufgabe verlangt war, in der keine Geschlechterunterschiede gefunden wurden. Was jedoch gegen die Hypothese von Braun und Schwemer (2013) sowie Bügel und Buunk (1996) spricht, ist, dass im Schülerfragebogen auch das Interesse für französische Literatur abgefragt wurde (vgl. Frage 11 in Anhang 3.3) und hierbei lediglich 6% der Mädchen und 3% der Jungen angaben, sich für „französische Lektüren/ Literatur“ zu interessieren (vgl. Kapitel 11.7.1). Außerdem wurde innerhalb der Erfassung des Konstrukts der Häufigkeit der Freizeitaktivitäten auf Französisch gefragt, wie häufig die Französischschülerinnen und -schüler in ihrer Freizeit im letzten halben Jahr „Bücher, Zeitungen oder Zeitschriften“ auf Französisch gelesen hatten, wobei in beiden Geschlechtergruppen vergleichbar niedrige Durchschnittswerte erzielt wurden. 253 Schließlich wird die Hypothese der Ursache der Textsorte für Geschlechterunterschiede auch durch die Ergeb‐ nisse in Spanisch der vorliegenden Studie widerlegt, bei denen in der zweiten Teilaufgabe keinerlei Geschlechterunterschiede auftraten (vgl. Kapitel 11.4.2.2). Somit überwiegen eher die Gegenargumente gegen die Hypothese, dass die 544 12 Interpretation der Ergebnisse Mädchen in der zweiten Teilaufgabe aufgrund der Textsorte eine bessere Leis‐ tung erzielten als die Jungen. Eventuell könnte nach Burstall et al. (1974: 30) aber angenommen werden, dass eine gewisse kulturell bedingte kollektive stereotype Wahrnehmung des Lesens als spezifisch weibliche Fertigkeit vorliegen könnte, die sich im gesamten Leseverstehenstest bemerkbar macht. Allerdings könnte auch dies durch die Ergebnisse im Leseverstehenstest in Spanisch nicht bestätigt werden, wobei im Falle der Spanischstichprobe bedacht werden muss, dass innerhalb der gesamten Grundgesamtheit in Spanisch durch den Prozess der Fächerwahl der dritten Fremdsprache starke Präselektionsprozesse wirken und daher andere Voraussetzungen herrschen als beim Französischtest (vgl. Kapitel 11.4.2.2). Neben diesen Erklärungsansätzen von eher hypothetischem Charakter lassen sich durch die Regressionsanalysen getrennt nach Geschlecht, die spezifisch für die Ergebnisse der zweiten Teilaufgabe vorgenommen wurden, genauere Aus‐ sagen zu möglichen Erklärungsansätzen für den großen Leistungsunterschied zugunsten der Mädchen treffen: Sie belegen bezüglich der Gruppe der Mädchen, dass der sozioökonomische Status einen signifikanten positiven Prädiktor dar‐ stellt und die geschlechterstereotyp weibliche Wahrnehmung des Französischen sogar als signifikanter negativer Prädiktor auf die Leseverstehensleistung in der zweiten Teilaufgabe wirkt (vgl. Tabelle 89, Kapitel 11.10.1.3): Je weniger die Mädchen also das Französische als genderstereotyp weiblich geprägte Sprache wahrnehmen, desto besser fällt ihre Leistung in der zweiten Teilaufgabe des Leseverstehenstests aus, was eventuell durch den Inhalt des Textes der zweiten Teilaufgabe, der von einer Expedition in die Antarktis handelte, was wiederum kein genderstereotyp weibliches Thema darstellt, begründet sein könnte und somit die Hypothese des Einflusses der Textsorte auf Geschlechterunterschiede von Burstall et al. (1974) abermals widerlegen würde. Bei den Jungen zeigt sich bezüglich ihrer Leseleistung in der zweiten Teilauf‐ gabe, dass der sozioökonomische Status und das Interesse am Fach Französisch signifikante positive Prädiktoren darstellen, während die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen als signifikanter negativer Prädiktor wirkt (vgl. Tabelle 91, Kapitel 11.10.1.3). Dieser negative Einfluss der auf die Mädchen fokussierten Aufmerksamkeits‐ verteilung der Lehrkräfte stellt daher eine plausiblere Erklärung dar als bisher postulierte negative Einflüsse von Textsorten und Themen und kann daher die signifikant niedrigeren Ergebnisse der Jungen bei dieser Teilaufgabe konkreter erklären. Da außerdem auch in der dritten Teilaufgabe, welche sechs kurze argumentative Texte beinhaltete, ein schwacher Effekt zugunsten der Mädchen gefunden wurde, kann auch die Behauptung von Bügel und Buuk (1996: 26), 12.1 Interpretation der zentralen Ergebnisse in Französisch 545 Jungen wären aufgrund ihrer erhöhten Erfahrung mit komplexen informativen Texten besser im Leseverstehen als Mädchen, für die vorliegende Studie und die Zielsprache Französisch nicht aufrechterhalten werden. Insgesamt kann somit die Kritik von Schmenk (2002: 101), die im Zusammenhang mit der Begründung der Überlegenheit der einen oder anderen Geschlechtergruppe den Erklärungs‐ ansatz der Textsorte als Verknüpfung mit stereotypen Alltagsvorstellungen kritisiert, bestätigt werden. Bezüglich des Gesamtergebnisses im Leseverstehenstest wurden weitere sta‐ tistische Untersuchungen durchgeführt: Die intersektionale Analyse möglicher Wechselwirkungen des Geschlechts mit dem sozioökonomischen Status ergab, dass, im Gegensatz zum Hörverstehen, im Leseverstehen, keine signifikante Interaktion der beiden Variablen vorliegt; vielmehr weisen das Geschlecht und der sozioökonomische Status jeweils separate, kleine, nicht signifikante Effekte auf (vgl. Tabelle 68, Kapitel 11.6.1). Dies bedeutet, dass die Mädchen sowohl bei niedrigem, mittlerem und hohem sozioökonomischen Status den Jungen jeweils tendenziell, wenn auch nicht signifikant, überlegen sind. Dieses Ergebnis widerspricht daher den Studienergebnissen von Entwisle et al. (2007), Mensah und Kiernan (2010) sowie Gottburgsen und Gross (2012), die jeweils in der erstsprachlichen Lesekompetenz signifikante Interaktionseffekte zwischen Geschlecht und sozialer Herkunft gefunden hatten. Gottburgsen und Gross (2012) fanden in ihrer Metaanalyse der Daten von PISA 2006 sogar einen so starken Interaktionseffekt bei fünfzehnjährigen Lernenden, dass Jungen mit hohem sozioökonomischen Status schwächer abschnitten als Mädchen mit niedrigem sozioökonomischen Status. In der vorliegenden Studie schneiden Jungen mit hohem sozioökonomischem Status lediglich gering besser ab als Mädchen mit niedrigem sozioökonomischem Status, sodass zumindest eine ähnliche Tendenz wie diejenige, die von Gottburgsen und Gross (2012) gefunden wurde, zu erkennen ist. Legewie und DiPrete (2012) fanden, wie bereits erwähnt, für die Grundschule heraus, dass ein Umfeld mit höherem sozioökonomischen Status sich stärker positiv auf die Lesekompetenz von Jungen auswirkt als auf diejenige von Mäd‐ chen. Die Annahme, dass ein Umfeld mit höherem sozioökonomischem Status sich stärker positiv auf die Lesekompetenz der Jungen auswirkt, kann allerdings in Bezug auf die vorliegende Französischstichprobe der 9. Jahrgangsstufe nicht bestätigt werden, da die wenigen Jungen mit niedrigem sozioökonomischem Status auch das schwächste Ergebnis im Leseverstehenstest erzielen. Jedoch könnte das überdurchschnittlich hohe sozioökonomische Umfeld eventuell ein Grund dafür sein, weshalb in der vorliegenden Studie kein signifikanter Inter‐ 546 12 Interpretation der Ergebnisse aktionseffekt zwischen Geschlecht und sozioökonomischem Status gefunden wurde, so wie dies bei Gottburgsen und Gross (2012) der Fall war. Betrachtet man die Intersektionalität zwischen Geschlecht und sprachlichem Hintergrund mittels zweifaktorieller Varianzanalysen, liegen ein schwacher, nicht signifikanter Effekt des Geschlechts, kein Effekt des sprachlichen Hin‐ tergrunds und ein schwacher, nicht signifikanter Interaktionseffekt zwischen Geschlecht und sprachlichem Hintergrund vor (vgl. Tabelle 68, Kapitel 11.6.1). Dabei lässt sich die Tendenz erkennen, dass einsprachige Jungen und Mädchen vergleichbare durchschnittliche Punktzahlen im Gesamtergebnis des Lesevers‐ tehenstests erzielen, während mehrsprachige Jungen tendenziell schwächer ab‐ schneiden als mehrsprachige Mädchen. Dieses Ergebnis entspricht folglich der Tendenz, dass Mädchen mit Migrationshintergrund höhere Bildungsabschlüsse und Kompetenzwerte erreichen als Jungen mit Migrationshintergrund (vgl. Feliciano/ Rumbaut 2005; Støren/ Helland 2010) und entfacht, anders als dies bei den Ergebnissen zum Hörverstehen der Fall war, erneut die Diskussion um mehrsprachige Jungen als mögliche „Risikogruppe“. Betrachtet man die Korrelationsmatrix der Jungen, wird ersichtlich, dass lediglich eine signifikante Korrelation des sprachlichen Hintergrunds der Jungen mit der Länge des Aus‐ landsaufenthalts im französischsprachigen Ausland gemessen wurde: Einspra‐ chige Jungen waren also signifikant länger im französischsprachigen Ausland als mehrsprachige Jungen (vgl. Anhang 7.2). Daher müssten wohl vor allem die Möglichkeiten geprüft werden, wie mehrsprachige Jungen die Chance erhalten könnten, häufiger ins französischsprachige Ausland zu reisen, um hier eine bessere Chancengleichheit herstellen zu können. Regressionsanalysen bezüglich des Gesamtergebnisses im Leseverstehen zeigen, dass das Geschlecht insgesamt einen eher schwachen Prädiktor für die Leseverstehensleistung darstellt: Der sozioökonomische Status bildet den stärksten Prädiktor für die Gesamtleistung im Leseverstehen, dicht gefolgt vom FFS Selbstkonzept und dem Index kognitiver Grundfertigkeiten. Erst hinter diesen Variablen tritt das Geschlecht als relativ schwacher Prädiktor auf (vgl. Modell 3, Tabelle 79, Kapitel 11.9.1.3). Regressionsanalysen getrennt nach Geschlecht bezüglich des Gesamtergeb‐ nisses im Leseverstehen zeigen, dass bei den Mädchen das FFS Selbstkonzept den stärksten Prädiktor für die Leseverstehensleistung darstellt und auch der sozio‐ ökonomische Status einen schwachen, allerdings nicht signifikanten Prädiktor bildet. Die geschlechterstereotyp weibliche Wahrnehmung des Französischen tritt also, anders als in der zweiten Teilaufgabe, bezüglich des Gesamtergebnisses nicht als negativer Prädiktor für die Leseverstehensleistung der Mädchen auf. 12.1 Interpretation der zentralen Ergebnisse in Französisch 547 Bei den Jungen konnte der sozioökonomische Status als ein stärkerer Prä‐ diktor für die Gesamtleseleistung ausgemacht werden als bei den Mädchen. Außerdem kristallisierte sich das Arbeitstempo (BZO) bei den männlichen Französischlernenden als schwacher, nicht signifikanter Prädiktor für ihre Ge‐ samtleseleistung heraus und die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen zeigte schließlich, wie bereits bezüglich der zweiten Teilaufgabe, einen signifikanten negativen Einfluss auf die Leseleistung der Jungen. Für die gesamte Leseleistung konnte also, genauso wie auch bezüglich des Hörverstehens, gezeigt werden, dass eine zu starke Aufmerksamkeitsfokussierung der Lehrkräfte auf die Mädchen sich direkt negativ auf die Leistung der Jungen auswirkt. Bezüglich des Leseverstehens kann also festgehalten werden, dass, anders als beim Hörverstehen, klare Vorteile der Mädchen auftreten, wobei mehrsprachige Jungen, auch aufgrund ihrer geringen Auslandserfahrung im französischspra‐ chigen Raum, tendenziell besonders schwach abschneiden und ein negativer Einfluss auf die Leseleistung der Jungen in der verstärkten Aufmerksamkeits‐ fokussierung der Lehrkräfte auf die Mädchen gefunden werden konnte, was man in Zukunft über entsprechende didaktische Maßnahmen möglichst auszu‐ gleichen versuchen sollte (vgl. Kapitel 14). 12.1.3 Interpretation der zentralen Ergebnisse bezüglich des Schreibtests in Französisch Eine statistische Analyse der Gesamtergebnisse des Schreibtests ergab im ersten Rating, das die Sprachhandlungskompetenz maß, und im zweiten Rating, das sowohl formale als auch inhaltliche und sprachliche Kriterien berücksich‐ tigte, jeweils einen signifikanten Unterschied zugunsten der Mädchen. Bei ausschließlicher Berücksichtigung sprachlicher Kriterien im dritten Rating wurden im Gesamtergebnis hingegen keine signifikanten Unterschiede, jedoch ein schwacher Effekt zugunsten der Mädchen gemessen. Die gefundenen Effekte bezüglich der Gesamtergebnisse der drei Ratings (1. Rating: p = .031, d = .452, vgl. Tabelle 50; 2. Rating: p = .046, d = .435, vgl. Tabelle 53; 3. Rating: p = .172, d = .296, vgl. Tabelle 55) sind jeweils kleiner als der derjenige, der in der schriftlichen Textproduktion in der DESI-Studie für das Englische gemessen wurde (d-=-.53; vgl. Hartig/ Jude 2008: 204). Im ersten Rating lag bezüglich der Sprachhandlungskompetenz ein signifi‐ kanter Unterschied zugunsten der Mädchen vor (vgl. Tabelle 50, Kapitel 11.4.3.1), wobei die Varianz der Leistungen bei den Jungen erneut etwas größer war als bei den Mädchen, und die Leistungsspitzen bei den Mädchen lagen, was erneut 548 12 Interpretation der Ergebnisse die Hypothese von Lange et al. (2016) bezüglich der größeren Leistungsspanne von Jungen teilweise bestätigt. Eine Niveauzuordnung der Gesamtergebnisse fand, aufgrund der nicht mög‐ lichen Bestimmung des Sprachniveaus innerhalb der inhaltlichen Kategorien Inhalt 1 und Inhalt 2 im zweiten Rating, ausschließlich im ersten und im dritten Rating statt: Bei der Sprachhandlungskompetenz erreichten sowohl die Mädchen als auch die Jungen durchschnittlich ein Niveau zwischen A2.1 und A2.2, wobei die Mädchen insgesamt deutlich näher an das Niveau A2.2 kamen als die Jungen. Im Gesamtergebnis des dritten Ratings wurden jeweils genau dieselben Niveaustufen erreicht. Die erzielten Leistungen im Bereich der Sprachhandlungskompetenz und im Gesamtergebnis zu Wortschatz, Text(kompetenz), Grammatik und Orthographie blieben somit ein wenig hinter den durch die Vorgaben der Bildungsstandards erwartbaren Kompetenzstufen zurück, nach denen am Ende der 10. Jahrgangs‐ stufe durchschnittlich das Niveau B1.2 erreicht werden soll (vgl. KMK 2004, Landesinstitut für Schulentwicklung/ Statistisches Landesamt Baden-Württem‐ berg 2018: 262). Zunächst werden nun die einzelnen erhobenen Teilbereiche des Schreibtests genauer betrachtet, bevor Erklärungsansätze für vergleichbare und unterschiedliche Leistungen der Mädchen und Jungen innerhalb der Ergebnisse des Schreibtests analysiert werden. Betrachtet man die stärksten Prädiktoren der Sprachhandlungskompetenz der Mädchen, so haben die integrative Orientierung gepaart mit dem Ideal L3 Self, die Länge des Auslandsaufenthalts und die wahrgenommene Aufmerksamkeits‐ verteilung der Französischlehrkräfte zugunsten der Mädchen einen positiven Einfluss auf ihre Leistung. Außerdem übt die L3-Angst einen schwachen, nicht signifikanten negativen Einflusses auf deren Sprachhandlungskompetenz aus (vgl. Tabelle 95, Kapitel 11.10.1.4). Also trägt das integrative Ziel, in naher und ferner Zukunft mit französischen Muttersprachlerinnen und Mut‐ tersprachlern kommunizieren zu können und persönliche Kontakte knüpfen zu können am meisten zur Leistung in der Sprachhandlungskompetenz der Mädchen bei. Außerdem scheinen die Mädchen von ihren Kenntnissen, die sie während ihrer Aufenthalte im französischsprachigen Raum erwerben konnten, zu profitieren; eine Kombination mit der gesteigerten Aufmerksamkeit der Französischlehrkräfte zu ihren Gunsten lässt sie entsprechend hohe Leistungen im Bereich Sprachhandlungskompetenz erzielen. Dies kann als komplementäres Ergebnis zur Studie von McGannon und Medeiros (1995) verstanden werden, die nachweisen konnten, dass diejenigen Schülerinnen und Schüler, die von ihrer Französischlehrkraft Ermutigung erfuhren, das Fach Französisch eher weiterbelegten und folglich auch motivierter waren, Französisch zu erlernen. 12.1 Interpretation der zentralen Ergebnisse in Französisch 549 Auch Helmke et al. (2008: 393) wiesen nach, dass unter anderem Schülerinnen- und Schülerorientierung einen zentralen Aspekt des Fremdsprachenunterrichts darstellt, der wiederum direkten Einfluss auf die fremdsprachliche Leistung hat. Wie bereits bei den Ergebnissen zum Hörverstehen und zum Leseverstehen deutlich wurde, scheint in der Französischstichprobe die Schülerinnenorien‐ tierung deutlich ausgeprägter zu sein als die Schülerorientierung, was den Mädchen direkte Leistungsvorteile zu verschaffen scheint. Bei den Jungen beeinflussen hingegen vor allem das Arbeitstempo (BZO), die wahrgenommenen Erwartungen der Eltern, das FFS Selbstkonzept und der sozioökonomische Status die Leistung im Bereich der Sprachhandlungskompe‐ tenz (vgl. Tabelle 96, Kapitel 11.10.1.4). Auffällig ist hierbei insbesondere, dass mit Ausnahme des FFS Selbstkonzepts keinerlei motivational-affektive Faktoren als Prädiktoren für die Sprachhandlungskompetenz der Jungen wirken und die Leistungen der Jungen im Bereich Sprachhandlungskompetenz im Gegensatz zu den Mädchen stärker auf die Ausprägung ihrer kognitiven Grundfertigkeiten zurückzuführen sind. Betrachtet man die einzelnen Teilbereiche des zweiten Ratings, das sowohl sprachliche als auch formale und inhaltliche Kriterien berücksichtigte, so fallen die Ergebnisse durchaus uneinheitlich aus: Bei Wortanzahl, Inhalt 1, Inhalt 2 sowie Morphosyntax und grammatische Orthographie wurden jeweils signi‐ fikante Unterschiede zugunsten der Mädchen gemessen. Bei den Kategorien Kohärenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, Syntax sowie Verwendung der Tempi und Modi traten im zweiten Rating keine signifikanten Unterschiede, aber schwache Effekte zugunsten der Mädchen auf. Lediglich bei der Befolgung des Arbeitsauftrags und der lexikalischen Ortho‐ graphie und Interpunktion waren keinerlei statistisch relevante Unterschiede messbar, wobei lexikalische Orthographie und Interpunktion die einzige Kate‐ gorie darstellt, bei der die Jungen durchschnittlich minimal höhere Punktzahlen erzielten als die Mädchen. Dies widerspricht der Mehrzahl der Ergebnisse der Bildungsmonitorings, in denen in der Erstsprache Deutsch signifikante Unterschiede zugunsten der Mädchen im Bereich Rechtschreibung gefunden wurden (vgl. Bos et al. 2003; Bos et al. 2012; McElvany et al. 2017; May 2006b: 121; Mielke et al. 2006: 100; Schneider et al. 1997; Stanat/ Kunter 2001). Außerdem weist dieses Ergebnis darauf hin, dass der oftmals durch Studien bestätigte Befund, dass bei Jungen häufiger Legasthenie diagnostiziert wird als bei Mädchen (vgl. Bornstein et al. 2004; Gerlach 2010: 18; Sambanis 2013: 56; Szagun 2016), für die vorliegende Stichprobe nicht bestätigt werden kann. In den schriftlichen Textproduktionen wurden weder bei den Mädchen noch bei den Jungen Symptome für LRS oder Legasthenie festgestellt (vgl. Mendez 2013), 550 12 Interpretation der Ergebnisse noch konnte durch Nachfrage bei den Lehrkräften ein Fall von Legasthenie ermittelt werden. Im Laufe der statistischen Analyse wurden außerdem die Gründe für die signifikanten Geschlechterunterschiede in den Bereichen Wortanzahl, Inhalt 1, Inhalt 2 sowie Morphosyntax und grammatische Orthographie über Regressions‐ analysen, die für die Gruppe der Mädchen und für die Gruppe der Jungen separat durchgeführt wurden, näher untersucht: Positive Prädiktoren für die Wortanzahl der Mädchen sind erneut die wahrge‐ nommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen, das schlussfolgernde Denken, die Häufigkeit der Freizeitaktivitäten auf Französisch und die L3 WTC (vgl. Tabelle 97, Kapitel 11.10.1.4). Dies bedeutet, dass neben den Mädchen, die über ein hohes Niveau im schlussfolgernden Denken verfügen, diejenigen Mädchen, die sich gerne regelmäßig mündlich am Unterricht beteiligen und auch in ihrer Freizeit häufiger Aktivitäten auf Französisch durchführen, am meisten Wörter im Schreibtest produziert haben. Dieses Ergebnis spricht gegen die Hypothese von Gardner (2010: 45, 84), dass Sprachproduktion im informellen Lernkontext, in der vorliegenden Studie gemessen durch die Häufigkeit der Freizeitaktivitäten auf Französisch, eher zu nicht-sprachlichen Outcomes wie Selbstvertrauen oder L2-Angst, positiven oder negativen Einstellungen führe. Vielmehr wird deutlich, dass bei den Mädchen sowohl die Sprachproduktion innerhalb des formalen Lernkontexts, gemessen über die L3 WTC, als auch die Sprachproduktion innerhalb des informellen Lernkontexts zur Quantität der Sprachproduktion beitragen. Bei den Jungen manifestiert sich der sprachliche Hintergrund als signifi‐ kanter Prädiktor für die Wortanzahl, in dem Sinne, dass mehrsprachige Jungen weniger Wörter produzieren als einsprachige. Daher kommt an dieser Stelle, ähnlich wie bereits beim Leseverstehen, erneut die Frage nach der Chancen‐ ungleichheit von Jungen mit Migrationshintergrund auf (vgl. Geißler 2013: 95). Weitere schwache, nicht signifikante Prädiktoren für die im Schreibtest produzierte Wortanzahl der Jungen sind das FFS Selbstkonzept und die wahr‐ genommenen Erwartungen der Eltern, wobei letztere zeigen, dass insbesondere die Eltern der Jungen einen gewissen Einfluss auf die fremdsprachliche Leistung auszuüben scheinen, anders als man dies in der Adoleszenz vermuten könnte (vgl. Kirchner 2004: 6). Für die Jungen bestätigt sich folglich die Annahme von McGannon und Medeiros (1995), dass die Ermutigung durch Eltern auch zu einer erhöhten Lernanstrengung führt. Die wahrgenommene Aufmerksam‐ keitsverteilung der Lehrkräfte zugunsten der Mädchen übt schließlich erneut einen schwachen, nicht signifikanten, negativen Einfluss auf die Wortanzahl der Jungen aus (vgl. Tabelle 98, Kapitel 11.9.1.4). Wie bereits bei der Sprach‐ 12.1 Interpretation der zentralen Ergebnisse in Französisch 551 handlungskompetenz, beim Leseverstehen und beim Hörverstehen ist also auch bezüglich der Wortanzahl feststellbar, dass diejenigen Jungen, die eine verstärkte Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen wahrnehmen, tendenziell weniger Wörter im Schreibtest produzieren, wodurch sich dieses Konstrukt immer deutlicher als wesentlich für das Entstehen von Geschlechterunterschieden herauskristallisiert. Da sowohl in Inhalt 1 als auch in Inhalt 2 signifikante Unterschiede zugunsten der Mädchen gefunden wurden, muss die Frage gestellt werden, inwiefern die inhaltlichen Anforderungen, das eigene Zimmer zu beschreiben (Inhalt 1) und einen gemeinsamen Kinobesuch zu verschieben (Inhalt 2) eher Themen darstellten, die tendenziell mehr Interesse bei den Mädchen hervorriefen als bei den Jungen. Ein weiterer möglicher Grund für die schwächere inhaltliche Leistung der Jungen könnte auch ihre weniger sorgfältige Bearbeitung der Aufgabenstellung gewesen sein, da in den Anweisungen genau festgehalten war, welche inhaltlichen Aspekte in den jeweiligen Texten erscheinen sollten. Zwar schrieben die Jungen auch signifikant weniger Wörter als die Mädchen, aber darüber hinaus schweiften sie auch verhältnismäßig oft vom verlangten Thema ab und erzählten beispielsweise von ihren Lieblingsfußball- (vgl. Fall 016) oder -basketballspielern (vgl. Fall 063). Aufschluss über diese Fragestellungen geben, zumindest teilweise, die nach Geschlecht getrennt vorgenommenen Regressionsanalysen bezüglich der In‐ haltskategorien: Sie belegen, dass bei den Mädchen das Wortschatzspektrum den größten positiven Prädiktor für die Leistung in Inhalt 1 darstellt, während die L3-Angst einen negativen, nicht signifikanten Prädiktor bildet (vgl. Modell 1b, Tabelle 99). Da die Mädchen im Wortschatzspektrum tendenziell höhere Leistungen erzielten als die Jungen, bildet dies einen wichtigen Erklärungsan‐ satz für die signifikant höhere Leistung der Mädchen im Bereich Inhalt 1. Die L3-Angst stellt sich bei den weiblichen Lernenden erneut als debilitating anxiety heraus (vgl. Horwitz 2001; Horwitz et al. 1986), wobei die Mädchen trotz des negativen Einflusses der L3-Angst zu einem signifikant höheren Ergebnis in Inhalt 1 kommen als die Jungen. Bei den Jungen bildet die genderstereotyp weibliche Wahrnehmung des Französischen einen relativ starken, jedoch nicht signifikanten, negativen Prädiktor für die Leistung in Inhalt 1; dies bedeutet, dass diejenigen Jungen, die das Französische als stark genderstereotyp weibliche Sprache wahrnehmen, in Inhalt 1 tendenziell schwächere Leistungen erzielen, wodurch in gewisser Weise ein Prozess des Doing Gender sichtbar wird. Dieses Ergebnis deutet somit darauf hin, dass die erste Teilaufgabe des Schreibtests, in der das eigene Zimmer beschrieben werden sollte, eventuell von manchen Jungen als eher 552 12 Interpretation der Ergebnisse genderstereotyp weibliches Thema aufgefasst und deshalb eventuell teilweise sogar bewusst verweigert wurde. Des Weiteren zeigt sich erneut, dass diejenigen Jungen, die eine hohe Erwartung der Eltern bezüglich ihrer Französischleistung wahrnehmen, auch tendenziell bessere Leistungen in Inhalt 1 erzielen (vgl. Modell 1, Tabelle 100, Kapitel 11.7.1). Dieses Phänomen war bereits bezüglich der Wortanzahl und der Sprachhandlungskompetenz zu beobachten. Den stärksten Einflussfaktor für die Leistung in Inhalt 1 stellt aber bei den Jungen, genauso wie bei den Mädchen, das Wortschatzspektrum dar (vgl. Modell 2, Tabelle 100, Kapitel 11.7.1). Bezüglich Inhalt 2 wirken bei den Mädchen das Wortschatzspektrum, das Interesse am Fach Französisch und die wahrgenommene Aufmerksamkeitsver‐ teilung der Französischlehrkräfte zugunsten der Mädchen als Prädiktoren für ihre Leistung (vgl. Modell 2, Tabelle 101, Kapitel 11.7.1), was erneut bestätigt, dass insbesondere eine Kombination aus großem Wortschatzwissen, Aufmerk‐ samkeit der Lehrkräfte, kommunikativem Verhalten der Mädchen im Unterricht und stark ausgeprägten affektiven Faktoren bei den Mädchen zum Lernerfolg führt. Bei den männlichen Französischlernenden zeigt die Regressionsanalyse, dass neben dem Wortschatzspektrum die wahrgenommene Unterstützung durch die Französischlehrkraft und die kognitiven Grundfertigkeiten positive Prädiktoren für Inhalt 2 darstellen, während die genderstereotyp weibliche Wahrnehmung des Französischen erneut einen signifikanten negativen Einfluss auf die Leis‐ tung der Jungen in Inhalt 2 hat (vgl. Modell 2, Tabelle 102, Kapitel 11.7.1): Je stärker die Jungen das Französische als genderstereotyp weiblich wahrnehmen, desto schwächer sind ihre Leistungen in Inhalt 2. Dies deutet erneut darauf hin, dass die thematische Aufgabenstellung der zweiten Teilaufgabe, die darin bestand, einen Kinobesuch zu verschieben, von eventuell einigen Jungen mit einer genderstereotyp weiblichen Wahrnehmung des Französischen assoziiert wurde, was sich negativ auf ihre Leistung auswirkte. Es muss daher ernsthaft hinterfragt und weiter untersucht werden, inwiefern Schreibaufgaben zu anderen Themen, zu anderen Textsorten und Kommuni‐ kationssituationen und mit anderen inhaltlichen Anforderungen zu höheren Resultaten von Jungen in den inhaltlichen Kategorien führen könnten (vgl. Kapitel Didaktische Implikationen14). Das letzte Konstrukt des zweiten Ratings, bei dem signifikante Unterschiede zugunsten der Mädchen auftraten, ist Morphosyntax und grammatische Or‐ thographie. Nach Geschlecht getrennte Regressionsanalysen zeigen, dass bei den Mädchen die integrative Orientierung gepaart mit dem Ideal L3 Self den stärksten positiven Prädiktor für die Leistung bildet, dicht gefolgt von der Länge 12.1 Interpretation der zentralen Ergebnisse in Französisch 553 des Auslandsaufenthalts, dem schlussfolgernden Denken und dem sozioökono‐ mischen Status (vgl. Tabelle 103, Kapitel 11.7.1). Selbst bei dieser genuin sprachli‐ chen Kategorie bildet bei den Mädchen also erneut ein affektiver Faktor, nämlich das integrative Bedürfnis nach Kommunikation mit Muttersprachlerinnen und Muttersprachlern gepaart mit dem Wunsch, in der Zukunft eine kompetente Sprecherin des Französischen zu werden, einen größeren Einflussfaktor als die kognitiven Grundfertigkeiten oder der sozioökonomische Status. Hingegen konnte bezüglich der Leistung der Jungen in Morphosyntax und grammatischer Orthographie berechnet werden, dass die L3-Angst einen signi‐ fikanten negativen Einfluss auf ihre Leistung ausübt; Arbeitstempo (BZO), schlussfolgerndes Denken und der sozioökonomische Status stellen hingegen positive Prädiktoren für die Leistung in Morphosyntax und grammatischer Orthographie dar (vgl. Modell 1b, Tabelle 104). Im Umkehrschluss bedeutet dies, dass spezifisch für die Jungen und in Bezug auf Morphosyntax und grammati‐ sche Orthographie didaktische Überlegungen angestellt werden müssten, durch welche methodischen und eventuell auch schulpsychologischen Ansätze die Angst, Fehler im Französischen zu machen und sich womöglich vor der Klasse zu blamieren, überwunden werden könnte (vgl. Kapitel 14). Schließlich wurde im dritten Rating des Schreibtests in Französisch im Bereich Grammatik, der sich aus Morphosyntax und grammatischer Orthogra‐ phie, Syntax sowie Verwendung der Tempi und Modi zusammensetzt, ebenfalls ein signifikanter Unterschied zugunsten der Mädchen gemessen (vgl. Kapitel 11.4.3.1). Die Regressionsanalyse zeigt, dass insbesondere das FFS Selbstkonzept als starker, signifikanter Prädiktor für die Grammatikleistung der Mädchen wirkt und das schlussfolgernde Denken, die Häufigkeit der Freizeitaktivitäten auf Französisch und die Länge des Auslandsaufenthalts jeweils schwache, nicht signifikante Prädiktoren für die Grammatikleistung der Mädchen darstellen (vgl. Tabelle 105, Kapitel 11.10.1.4). Bei den männlichen Französischlernenden offenbaren Regressionsanalysen, dass der Gesamtindex der kognitiven Grund‐ fertigkeiten und das FFS Selbstkonzept als signifikante positive Prädiktoren wirken und der sozioökonomische Status ebenfalls einen statistisch relevanten Einfluss auf die Grammatikleistung der Jungen hat, wobei diese drei Faktoren gemeinsam eine Varianzaufklärung von 46.8% der Grammatikleistung der Jungen bieten (vgl. Tabelle 106, Kapitel 11.10.1.4). Somit sind in diesem Fall keinerlei signifikante negative Einflussfaktoren auf die Grammatikleistung der Jungen messbar. Es wird lediglich erneut deutlich, dass die Jungen ihre Leistung verstärkt aufgrund ihrer kognitive Faktoren, das FFS Selbstkonzept und den sozioökonomischen Status erzielen und abgesehen vom FFS Selbstkonzept keinerlei andere affektiv-motivationale Faktoren eine Rolle zu spielen scheinen. 554 12 Interpretation der Ergebnisse 254 Die Teilbereiche des dritten Ratings zeigen bei Grammatik einen signifikanten Unter‐ schied zugunsten der Mädchen, bei Wortschatz und Text(kompetenz) (einen schwachen Effekt zugunsten der Mädchen und bei Orthographie keinen Geschlechterunterschied (vgl. Kapitel 11.4.3.1). Die Prädiktoren für die Leistungen der Mädchen sind indes im affektiv-moti‐ vationalen Bereich vielfältiger und auch deshalb breiter gefächert, weil bei ihnen die Häufigkeit der Freizeitaktivitäten auf Französisch und die Länge des Auslandsaufenthalts zur Varianzaufklärung der Leistung im Bereich Grammatik beitragen. 254 Nachdem die einzelnen Teilfertigkeiten im Detail bezüglich der Gründe für geschlechtsspezifische Unterschiede analysiert wurden, werden im Folgenden Erklärungsansätze für das Gesamtergebnis des zweiten Ratings im Schreibtest, das signifikant zugunsten der Mädchen ausfiel, untersucht: Die Überprüfung eines möglichen Interaktionseffekts zwischen Geschlecht und sozioökonomi‐ schem Status hinsichtlich der Schreibleistung mittels zweifaktorieller Varian‐ zanalysen zeigte einen kleinen, nicht signifikanten Effekt des Geschlechts, einen mittleren, nicht signifikanten Effekt des sozioökonomischen Status und eine minimale, nicht signifikante Interaktion zwischen den beiden Variablen (vgl. Tabelle 68, Kapitel 11.6.1). Die durchschnittlichen Ergebnisse der Jungen mit niedrigem sozioökonomischem Status liegen, ähnlich wie beim Hör- und beim Leseverstehen, leicht über dem durchschnittlichen Ergebnis der Mädchen mit niedrigem sozioökonomischem Status. Hingegen ist bei den Jungen und Mädchen mit mittlerem sozioökonomischem Status sowie bei Jungen und Mädchen mit hohem sozioökonomischem Status jeweils tendenziell ein Vorteil der weiblichen Lernerinnen erkennbar. Es könnte sich also auch bei der Schreib‐ leistung erneut um das von Legewie und DiPrete (2012) beobachtete Phänomen handeln, dass insbesondere Jungen mit niedrigem sozioökonomischem Status von einem Umfeld mit hohem sozioökonomischen Status profitieren. Bei einer zweifaktoriellen Varianzanalyse bezüglich der Interaktion von Geschlecht und sprachlichem Hintergrund wurden ein signifikanter schwacher Effekt des Geschlechts, kein Effekt des sprachlichen Hintergrunds und ein kleiner, nicht signifikanter Interaktionseffekt zwischen den beiden Variablen gemessen (vgl. Tabelle 69, Kapitel 11.6.1). Dabei wurde, ähnlich wie beim Leseverstehenstest, die Tendenz ersichtlich, dass einsprachige Mädchen und Jungen vergleichbare Ergebnisse erzielen, während mehrsprachige Mädchen tendenziell bessere Leistungen im Schreibtest zeigen als mehrsprachige Jungen und sich somit eine scherenförmige Verteilung ergibt (vgl. Kapitel 11.6.1). Dadurch wird, ähnlich wie beim Leseverstehen auch bezüglich des Schreibens 12.1 Interpretation der zentralen Ergebnisse in Französisch 555 erneut eine leichte Benachteiligung mehrsprachiger Jungen bezüglich der Fran‐ zösischleistungen sichtbar. In einer Regressionsanalyse wurde berechnet, wie hoch die Prädiktorstärke des Geschlechts im Vergleich zu anderen möglichen Prädiktoren bezüglich der gesamten Schreibleistung im Französischen ist. Dabei wurde ersichtlich, dass der sozioökonomische Status einen nicht signifikanten Prädiktor darstellt, das Geschlecht einen signifikanten Einfluss auf die Schreibleistung zeigt, aber sowohl die kognitiven Grundfertigkeiten als auch das FFS Selbstkonzept einen stärkeren Einfluss auf die Schreibleistung ausüben als das Geschlecht (vgl. Modell 4, Tabelle 80). Fügt man die Länge des Auslandsaufenthalts als Prädiktor hinzu, verliert das Geschlecht seine signifikante Prädiktorstärke und die kogni‐ tiven Grundfertigkeiten sowie das FFS Selbstkonzept erreichen beide einen genau gleich großen Einfluss (vgl. Modell 5, Tabelle 80, Kapitel 11.9.1.4). Wie auch bei den anderen Fertigkeiten lässt sich beim Schreiben erkennen, dass die Prädiktorstärke des Geschlechts umso mehr abnimmt, je mehr Faktoren in das Regressionsmodell aufgenommen werden, was die intersektionale Ansicht verstärkt, dass das Geschlecht eine Lernervariable darstellt, die interdependent zu weiteren Lernervariablen wirkt. Betrachtet man ausschließlich die Prädiktoren, die für die gesamte Schreib‐ leistung der Mädchen wirken, so stellt die L3 WTC den stärksten Einfluss‐ faktor dar, gefolgt von der wahrgenommenen Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen und dem schlussfolgernden Denken. Die wahrgenommenen Erwartungen der Eltern haben hingegen einen schwachen, nicht signifikanten negativen Einfluss auf die Schreibleistung der Mädchen (vgl. Tabelle 93, Kapitel 11.10.1.4). Bei den Jungen bildet das Arbeitstempo (BZO) den stärksten Prädiktor für ihre Schreibleistung, gefolgt vom FFS Selbstkonzept und der wahrgenommenen Erwartung der Eltern, die, im Gegensatz zu den Mädchen, bei den Jungen einen nicht signifikanten schwachen positiven Einfluss auf die Schreibleistung ausübt (vgl. Tabelle 94, Kapitel 11.10.1.4). Somit konnte für das Schreiben gezeigt werden, dass vor allem signifikante Geschlechterunterschiede zugunsten der Mädchen in der Sprachhandlungskom‐ petenz, der Wortanzahl, den inhaltlichen Kategorien und den grammatischen Kategorien aufzufinden sind und auch im Gesamtergebnis von Rating 2, das sowohl sprachliche als auch inhaltliche und formale Aspekte berücksichtigte, insgesamt ein signifikanter Unterschied zugunsten der Mädchen vorliegt. Bei den Kategorien Kohärenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, Syntax sowie Verwendung der Tempi und Modi traten im zweiten Rating keine signifikanten Unterschiede, aber schwache Effekte zugunsten der 556 12 Interpretation der Ergebnisse Mädchen auf. Lediglich bei der Befolgung des Arbeitsauftrags und der lexika‐ lischen Orthographie und Interpunktion waren keinerlei statistisch relevante Unterschiede messbar, wobei lexikalische Orthographie und Interpunktion die einzige Kategorie darstellt, bei der die Jungen durchschnittlich minimal höhere Punktzahlen erzielten als die Mädchen, was anderen Studien, die Vorteile von Mädchen im Bereich der Rechtschreibung (vgl. z. B. Bos et al. 2012) erfassten, widerspricht. Auffällig ist, dass in fast allen sprachlichen Teilkompetenzen, mit Ausnahme des FFS Selbstkonzepts keinerlei motivational-affektive Faktoren als Prädik‐ toren für die Leistungen der Jungen wirken und dass die Prädiktoren der Mädchen für die schriftlichen Leistungen entsprechend vielfältiger sind als diejenigen der Jungen. Bei den Jungen stellen zudem im Bereich der Wortanzahl ein mehrsprachiger Hintergrund einen signifikant negativen Einfluss dar, wobei auch für das gesamte Schreibergebnis deutlich wird, dass mehrsprachige Jungen tendenziell eher schwächere Leistungen erzielen. Zudem kommt erneut die negative Wirkung der verstärkten Aufmerksam‐ keitsverteilung der Französischlehrkräfte zugunsten der Mädchen und im Falle der inhaltlichen Kategorien die genderstereotyp weibliche Wahrnehmung des Französischen, sowie im Fall der Morphosyntax und grammatischen Orthogra‐ phie die L3-Angst. Insgesamt stellt sich die Frage, inwiefern die hohe Anzahl an untersuchten Variablen bei der Schreibleistung zu einem höheren Erkenntnisgewinn geführt hat und ob es im Sinne der Praktikabilität und Beschleunigung des Auswer‐ tungsprozesses nicht sinnvoller gewesen wäre, lediglich ein anstatt drei Ratings vorzunehmen sowie beispielsweise ausschließlich die in Rating 3 ausgewerteten Oberkategorien anzulegen. Beweggründe für die sehr detaillierte Kategorienbil‐ dung bei der Auswertung waren zum einen das Forschungsdesign der DESI- (vgl. Harsch et al. 2007) und der IEF-Studie (Studer et al. 2004) sowie das detaillierte Korrekturraster der DELF-Prüfungen, die sich direkt am GeR (Europarat 2001) orientieren. Vorteile der sehr detaillierten Auswertung sind ein sehr hohes Maß an Validität des Schreibtests sowie ein detaillierter Erkenntnisgewinn bezüglich der Leistungsstärke der Geschlechtergruppen in den einzelnen Teilbereichen. Ein möglicher Nachteil ist, dass in den jeweiligen Kategorien aufgrund der teilweise geringen Trennschärfe eventuell ähnliche Ergebnisse erzielt werden könnten. Betrachtet man jedoch die erzielten Ergebnisse, stellt man fest, dass dies nicht der Fall war, da von den beiden Geschlechtergruppen durchaus von einander abweichende Resultate in den einzelnen Subkategorien erzielt wurden, wie in diesem Kapitel dargelegt wurde. Dies erlaubt im Umkehrschluss die Ab‐ leitung spezifischer didaktischer Implikationen bezüglich des Förderbedarfs der 12.1 Interpretation der zentralen Ergebnisse in Französisch 557 jeweiligen Geschlechtergruppen der vorliegenden Stichprobe. Beispielsweise wäre aufgrund des Ergebnisses des Schreibtests in Französisch eine vertiefte Förderung der Jungen im Bereich Morphosyntax und grammatische Orthographie ratsam. Außerdem wurde deutlich, dass die Auswahl motivierender Themen bzw. das Abwägen, inwiefern thematische Freiräume bei Schreibaufgaben geschaffen werden können für den Erfolg bzw. Misserfolg bei den inhaltlichen Kategorien für die jeweiligen Geschlechtergruppen zentral sind. Der motivati‐ onale Aspekt der Themenauswahl könnte eventuell auch dazu beitragen, die produzierte Wortanzahl zu erhöhen. Dies sind Erkenntnisse, die vor allem aufgrund der detaillierten Kategoriebildung erzielt werden konnten. 12.1.4 Interpretation der zentralen Ergebnisse bezüglich der Gesamtleistungen in den Französischtests Die Auswertung der Gesamtergebnisse der vorliegenden Studie zeigte schließ‐ lich, dass im Französischen insgesamt signifikante Geschlechterunterschiede zugunsten der Mädchen vorliegen (d = .456; vgl. Tabelle 67, Kapitel 11.5). Dieser Unterschied ist, wenn man die Effektstärken vergleicht, deutlich größer als derjenige, der in der DESI-Studie beim Gesamtergebnis in Englisch (d = .29) oder in Deutsch (d = .41) gefunden wurde (vgl. Hartig/ Jude 2008: 203). Auch gestaltet er sich deutlich größer als die geschlechtsspezifischen Unterschiede, die bei KESS 8 (d = .24; vgl. Nikolova/ Ivanov 2010: 54) oder KESS 10 (d = .21; vgl. Nikolova 2011: 130) in den Englischleistungen gefunden wurden. Die Streuung der Leistungen der Jungen ist größer als diejenige der Mädchen, wobei die Höchstleistungen innerhalb der Stichprobe bei den Mädchen zu finden sind und daher die Annahme von Lange et al. (2016) bezüglich der größeren Varianz der Leistungen der Jungen lediglich teilweise bestätigt wird. Bei zweifaktoriellen Varianzanalysen wurden bezüglich der Interaktion von Geschlecht und sozioökonomischem Status sowohl ein kleiner, nicht signifi‐ kanter Effekt des Geschlechts als auch ein kleiner, nicht signifikanter Effekt des sozioökonomischen Status und ein kleiner, nicht signifikanter Effekt der Interaktionsvariable „sozioökonomischer Status * Geschlecht“ festgestellt. Ge‐ nauso wie beim Schreiben und beim Lesen fallen auch im Gesamtergebnis die durchschnittlichen Punktzahlen von Jungen und Mädchen mit niedrigem sozi‐ oökonomischem Status vergleichbar aus, während bei mittlerem und höherem sozioökonomischem Status die Mädchen tendenziell höhere durchschnittliche Punktzahlen erzielen (vgl. Tabelle 68, Kapitel 11.6.1). Die Durchführung einer zweifaktoriellen Varianzanalyse mit den Variablen Geschlecht und sprachlicher Hintergrund zeigen, genau wie beim Ergebnis 558 12 Interpretation der Ergebnisse im Schreibtest, einen signifikanten Effekt des Geschlechts, keinen Effekt des sprachlichen Hintergrunds sowie einen schwachen, nicht signifikanten Inter‐ aktionseffekt der beiden Variablen (vgl. Tabelle 69, Kapitel 11.6.1). Genauso wie beim Leseverstehen und beim Schreiben ist auch im Gesamtergebnis zu erkennen, dass die Mittelwerte der einsprachigen Jungen und Mädchen im Gesamtergebnis sehr eng beieinanderliegen, während die mehrsprachigen Jungen tendenziell schwächere Ergebnisse erzielen als die mehrsprachigen Mädchen. Somit wurde mehrfach ersichtlich, dass die Diskussion um die „Risikogruppe“ der mehrsprachigen Jungen (vgl. Aktionsrat Bildung 2009; Buchmann et al. 2008; Diefenbach 2010; Hannover/ Kessels 2011; Martino et al. 2009; OECD 2009; Quenzel/ Hurrelmann 2010) durchaus ernst zu nehmen ist. Die in der vorliegenden Studie erzielten Gesamtergebnisse hinsichtlich einsprachiger und mehrsprachiger Jungen und Mädchen weichen außerdem insofern von denjenigen von KESS 10 für Englisch (vgl. Nikolova 2011: 131) ab, als dass in der vorliegenden Studie mehrsprachige Mädchen tendenziell besser abschneiden als einsprachige, während bei KESS 10 mehrsprachige Mädchen schwächere Ergebnisse erzielen als einsprachige. Es stellt sich daher die Frage, wie insbesondere mehrsprachige Jungen im Französischunterricht gezielter gefördert werden könnten. Bonin (2009: 21) schlägt diesbezüglich bei‐ spielsweise interkomprehensionsdidaktische Ansätze vor, bei denen zahlreiche Erschließungs- und Problemlösestrategien zum Einsatz kommen, welche ana‐ lytische, sprachbewusstseinsfördernde Lernprozesse von Jungen und Mädchen gleichermaßen fördern und die jeweiligen Herkunftssprachen entsprechend gewinnbringend in den Lernprozess einbeziehen. Regressionsanalysen bezogen auf die gesamte Französischstichprobe zeigen, dass das Geschlecht immer deutlicher an Prädiktorstärke verliert, desto mehr Prädiktoren in das jeweilige Modell aufgenommen werden. Das Regressions‐ modell mit der höchsten Prädiktorstärke belegt, dass das FFS Selbstkonzept, die kognitiven Grundfertigkeiten und der sozioökonomische Status einen größeren Einfluss auf die Gesamtleistung im Französischen haben als das Geschlecht. Schließlich stellt die Häufigkeit der Freizeitaktivitäten auf Französisch einen schwachen, nicht signifikanten Prädiktor für die Gesamtleistung dar (vgl. Modell 5, Tabelle 76, Kapitel 11.9.1.1). Betrachtet man die Prädiktoren der Gesamtleistung der Mädchen, so errei‐ chen das schlussfolgernde Denken, das FFS Selbstkonzept und die wahrge‐ nommene Aufmerksamkeitsverteilung zugunsten der Mädchen die höchste Varianzaufklärung (vgl. Modell 1a, Tabelle 85, Kapitel 11.10.1.1). Aus dem Bereich des Ought-to L3 Self hat auch die wahrgenommene Unterstützung der Französischlehrkraft einen schwachen, nicht signifikanten positiven Effekt auf 12.1 Interpretation der zentralen Ergebnisse in Französisch 559 die Gesamtleistung der Mädchen, während die wahrgenommenen Erwartungen der Peers einen schwachen, nicht signifikanten negativen Effekt ausüben und die wahrgenommenen Erwartungen der Eltern keinen Einfluss auf die Gesamtleis‐ tung der Mädchen zeigen (vgl. Modelle 1b, 1c, 1d, Tabelle 85, Kapitel 11.10.1.1). Auch die L3 WTC und die integrative Orientierung gepaart mit dem Ideal L3 Self haben einen positiven Einfluss auf die Gesamtleistung der Mädchen (vgl. Modelle 1e, 1 f, Tabelle 85, Kapitel 11.10.1.1). Bei den Jungen erreichen das Arbeitstempo (BZO), das FFS Selbstkonzept und die wahrgenommene Unterstützung der Lehrkraft die höchste Varian‐ zaufklärung, wobei die wahrgenommene Unterstützung der Lehrkraft einen schwachen, nicht signifikanten negativen Prädiktor bildet (vgl. Modell 1b, Tabelle 86, Kapitel 11.10.1.1). Die Frage, weshalb eine verstärkte Unterstützung durch die Französischlehrkraft eher einen negativen Einfluss hat, konnte nicht abschließend geklärt werden, hängt aber eventuell mit der Ausbildung geschlechterstereotyper Verhaltensweisen der Jungen zusammen, die mögli‐ cherweise Unterstützungsmaßnahmen ihrer weiblichen Französischlehrkräfte nur teilweise annehmen. May (2009: 26) machte außerdem im Zusammenhang mit den Ergebnissen von KESS 4 und KESS 7 darauf aufmerksam, dass die Englischleistungen am Ende der Grundschulzeit noch in hohem Maße von außerschulischen Faktoren bestimmt sind, weshalb entsprechend in KESS 4 keinerlei Geschlechterunterschiede gefunden wurden, während die Engli‐ schleistungen von Sechstklässlerinnen und Sechstklässlern bereits „Resultat des systematischen Unterrichts in der Schule“ seien. Dies könnte laut May (2009: 26) ein Indiz dafür sein, dass Mädchen stärker vom Englischunterricht profitierten als Jungen. Dass die Mädchen aus der vorliegenden Französischstichprobe ebenfalls stärker vom Französischunterricht profitieren als die Jungen, kann durch die hier vorliegenden Ergebnisse teilweise bestätigt werden und ähnlich wie bei den KESS-Studien scheint insbesondere der Einfluss des Unterrichts und der Lehrpersonen besonders ausschlaggebend zu sein. Alternative Regressionsmodelle zeigen entsprechend, dass die wahrgenom‐ mene Aufmerksamkeitsverteilung der Lehrkräfte zugunsten der Mädchen, aber auch die wahrgenommenen Erwartungen der Peers jeweils nicht signifikante negative Prädiktoren für die Gesamtleistung der Jungen darstellen (vgl. Modell 1a, 1c, Tabelle 86, Kapitel 11.10.1.1). Die einzige Variable aus dem Bereich des Ought-to L3 Self, die einen nicht signifikanten positiven Einfluss auf die Gesamt‐ leistung der Jungen ausübt, besteht in den wahrgenommenen Erwartungen der Eltern (vgl. Modell 1d, Tabelle 86, Kapitel 11.10.1.1). Es wird also ersichtlich, dass innerhalb der affektiv-motivationalen Faktoren bei den Mädchen neben dem FFS Selbstkonzept insbesondere die L3 WTC und 560 12 Interpretation der Ergebnisse die integrative Orientierung gepaart mit dem Ideal L3 Self einen wesentlichen Anteil an der gesamten Französischleistung ausmachen, während bei den Jungen lediglich das FFS Selbstkonzept als positiver Prädiktor wirkt. Darüber hinaus stellt das FFS Selbstkonzept, ähnlich wie Sparfeldt et al. (2003) und Lohaus/ Vierhaus (2019) dies bereits beobachtet hatten, den stärksten Prädiktor für die Gesamtleistung im Französischen dar und übt somit einen wesentlich stärkeren Einfluss auf die Gesamtleistung aus als die Variable Geschlecht. Auffällig ist außerdem, dass die Einstellungen zur französischen Zielkultur bei beiden Geschlechtergruppen nur einen geringen Zusammenhang mit der fremdsprachlichen Leistung darstellen. Auch die kognitiven Grundfertigkeiten zeigen immer wieder hohe Prädik‐ torstärken für die Französischleistungen, wobei Tendenzen dahingehend zu er‐ kennen sind, dass bei den Mädchen insbesondere das schlussfolgernde Denken und bei den Jungen insbesondere das Arbeitstempo (BZO) starke Prädiktoren darstellen und bei den Jungen die kognitiven Fertigkeiten insgesamt oftmals stärkere Einflüsse auf die fremdsprachliche Leistung zeigen als bei den Mäd‐ chen. Somit bewährt sich bezüglich der Erhebung der kognitiven Variablen als Kontrollvariablen und als Einflussfaktor für die fremdsprachliche Leistung der Ansatz von Möller und Zaunbauer (2008) sowie von Zaunbauer et al. (2009). Die Hauptunterschiede bei den Prädiktoren für die jeweiligen Gesamtleis‐ tungen von Jungen und Mädchen liegen jedoch im Bereich des Ought-to L3 Self: Die Mädchen profitieren in besonderem Maße von der Aufmerksamkeitsfo‐ kussierung der Lehrkräfte sowie von deren Unterstützung, während die wahr‐ genommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen für die Jungen einen relativ starken negativen Einflussfaktor darstellt. Die wahrgenommenen Erwartungen der Peers zeigen bei beiden Geschlechtergruppen eher negative Effekte auf deren Leistungen. Ein zweiter großer Unterschied innerhalb des Ought-to L3 Self wird aber darin deutlich, dass die wahrgenommenen Erwartungen der Eltern für die Jungen einen positiven Prädiktor für ihre fremdsprachliche Leistung darstellen und für die Mädchen keinen bzw. eher einen negativen. Darüber, aus welchem Grund insbesondere die Erwartungen der Eltern so unterschiedlich wirken, kann zunächst nur spekuliert werden. Eventuell handelt es sich bei den Jungen, die hohe Erwartungshaltungen der Eltern verspüren um Eltern, die einen großen Bezug zu Frankreich haben und bei denen insbesondere auch die Väter einen wichtigen Teil zur Erwartungshaltung beitragen. Die Be‐ fragung zu den Französischkenntnissen der Eltern zeigte jedoch, dass die Mütter (bzw. ersten Elternteile) der Mädchen einen Mittelwert von 2.24 und diejenigen der Mütter der Jungen einen Mittelwert von 2.27 erreichten. Die Väter der 12.1 Interpretation der zentralen Ergebnisse in Französisch 561 Mädchen kamen auf einen Mittelwert von 1.71 und die Väter der Jungen auf 1.94. Daher ist zumindest eine leichte Tendenz dahingehend erkennbar, dass die Eltern der Jungen einen etwas größeren Bezug zur französischen Sprache aufweisen (vgl. Kapitel 11.2.1). Festgehalten werden kann jedoch, dass eine hohe Leistungserwartung der Eltern bezüglich der Französischkenntnisse dem Lernprozess der Jungen zu‐ träglich ist, während eine zu starke Aufmerksamkeitsfokussierung der Lehr‐ kräfte auf die Mädchen, die Lernprozesse der Jungen erheblich zu hemmen scheint. Somit scheint die Vermutung von Driessen und Van Langen (2013) zuzutreffen, dass Geschlechterunterschiede, die ausschließlich in einzelnen Bildungszweigen bestimmter Länder und Zielsprachen und darin wiederum lediglich in einzelnen fremdsprachlichen Teilkompetenzen zu finden sind, vor allem ein Indiz für die negativen Effekte für die jeweilige Geschlechtergruppe des spezifischen Bildungssystems darstellen, wobei im vorliegenden Fall die Jungen betroffen sind. Im Gegensatz dazu scheint das von Boyle (1987: 274) beschriebene Phänomen der Self-fulfilling prophecy einen gewissen Anteil an der höheren Leistung der Mädchen zu haben: Boyle (1987: 274) geht davon aus, dass Lehrkräfte, die denken, dass Mädchen besser im Französischen sind als Jungen, dies vor allem in ihren Erwartungshaltungen und Aufmerksamkeitsfo‐ kussierungen widerspiegeln, weshalb am Ende die Mädchen besser abschneiden als die Jungen. 12.1.5 Interpretation der Ergebnisse der Diskriminanzanalyse in Französisch Nachdem nun die unterschiedlichen Wirkungen der verschiedenen Prädik‐ toren auf die einzelnen und gesamten sprachlichen Leistungen im Französi‐ schen bezüglich der beiden Geschlechtergruppen diskutiert wurden, erfolgt abschließend eine Interpretation der Ergebnisse der Diskriminanzanalyse, die untersuchte, welche Variablen sich am besten für die Vorhersage der jeweiligen Geschlechtergruppe eignen (vgl. Kapitel 11.11.1): Die Diskriminanz‐ analyse innerhalb der Französischstichprobe zeigt, dass die Ergebnisse zu den wahrgenommenen Erwartungen der Eltern die größte Prädiktorstärke für das Geschlecht aufweisen, wobei sie eine gruppenspezifische Korrelation der männlichen Lernenden mit dem Diskriminanzwert manifestieren, wäh‐ rend alle anderen gepoolten Korrelationskoeffizienten der Strukturmatrix eine gruppenspezifische Korrelation der weiblichen Lernenden mit dem Diskrimi‐ nanzwert aufweisen (vgl. Tabelle 118, Kapitel 11.11.1). Dies entspricht den vorhergehenden statistischen Analysen, bei denen ersichtlich wurde, dass die 562 12 Interpretation der Ergebnisse 255 In Kapitel 11.10 konnte zudem herausgefunden werden, dass die L3-Angst der ten‐ denziell stärkste negative Prädiktor für die Leistungen der Mädchen im Sinne einer debilitating anxiety (vgl. Martinović/ Sorić 2018: 40) darstellt und bei den Jungen ledig‐ lich bei der Kategorie Morphosyntax und grammatische Orthographie des Schreibtests als negativer Prädiktor wirkt und beispielsweise überhaupt keine messbare Bedeutung für die Gesamtleistung im Französischen aufweist (vgl. Kapitel 9.3.4.10). Jungen tendenziell höhere Erwartungen durch die Eltern wahrnehmen als die Mädchen und diese bei den Jungen einen positiven Einfluss und bei den Mädchen hingegen keinen ober aber einen eher negativen Einfluss auf die Französischleistungen haben (vgl. Kapitel 11.7.1). Die L3-Angst, die in der Studie von Kissau (2006a) kaum Prädiktorstärke für das Geschlecht der Französischlernenden in Grade 9 in Kanada hatte, erweist sich in der vorliegenden Studie im Rahmen der Diskriminanzanalyse als der zweitgrößte Prädiktor für das Geschlecht (vgl. Tabelle 118, Kapitel 11.11.1), wobei die Mädchen eine tendenziell höhere L3-Angst verspüren als die Jungen (vgl. Kapitel 11.7.1). 255 Nach der L3-Angst folgen in der Diskriminanzanalyse die wahrgenommenen Erwartungen der Französischlehrkraft als Prädiktor für das Geschlecht (vgl. Tabelle 118, Kapitel 11.11.1), wobei diese bei den Mädchen tendenziell etwas stärker ausgeprägt sind als bei den Jungen (vgl. Kapitel 11.7.1). Das heißt, dass die Erwartungen der Französischlehrkräfte von den Mädchen als tendenziell höher empfunden werden als von den Jungen, was ein gegenläufiges Ergebnis zu den wahrgenommenen Erwartungen durch die Eltern darstellt, die von den Jungen als höher empfunden wurden als von den Mädchen. Folglich scheinen die Französischlehrkräfte die tradierten Genderstereotype eher weiterzugeben als die Eltern. Inwiefern dies auch mit dem Geschlecht der Lehrkräfte zusammenhängt, konnte hier nicht abschließend geklärt werden, da alle Französischlehrkräfte der untersuchten Klassen weiblich waren und daher keine Vergleichsmöglichkeit mit Schülerinnen und Schülern von männlichen Französischlehrkräften bestand. Die wahrgenommene Unterstützung durch die Lehrkraft weist die nächst‐ höchste Prädiktorstärke für das Geschlecht auf (vgl. Tabelle 118, Kapitel 11.11.1). Bei diesem Faktor wurde bei der Prüfung der Unterschiedshypothese ein ver‐ nachlässigbarer Effekt gemessen, sodass bei der Ausprägung der Unterstützung der Französischlehrkraft nicht von einem Geschlechterunterschied gesprochen werden kann (vgl. Kapitel 11.7.1). Jedoch wurde ersichtlich, dass die wahrge‐ nommene Unterstützung durch die Lehrkraft bei den Mädchen positiv mit den Französischleistungen korreliert und oftmals auch als positiver Prädiktor für die Leistungen wirkt, während bei den Jungen teilweise eine negative Prädiktorwirkung für die Französischleistungen gemessen wurde (vgl. Kapitel 12.1 Interpretation der zentralen Ergebnisse in Französisch 563 9.3.4.10). Zudem korreliert bei den Jungen die wahrgenommene Unterstützung durch die Lehrkraft signifikant negativ mit dem HISEI (vgl. Anhang 7.2), was bedeutet, dass Jungen mit niedrigen sozioökonomischem Status tendenziell weniger Unterstützung durch die Lehrkräfte erfahren als Jungen mit hohem so‐ zioökonomischem Status. Drei der vier Faktoren, die die größte Prädiktorstärke für das Geschlecht aufweisen, stammen also aus dem Ought-to L3 Self, wodurch die soziale Konstruktion von Gender in gewisser Weise statistisch bestätigt wird: Wahrgenommene Erwartungs- und Unterstützungshaltungen von Eltern und Lehrkräften sagen die Zugehörigkeit zu einer Geschlechtergruppe am besten voraus. Und auch L3-Angst kann als eine Variable betrachtet werden, die geschlechtsspezifisch sozialisiert wird und durch die Personen innerhalb der Lernumgebung entweder verstärkt oder aber abgeschwächt werden kann (vgl. Horwitz 2001). Nach diesen vier Faktoren, von denen drei aus dem Ought-to L3 Self stammen, erweist sich in der Diskriminanzanalyse das Interesse am Fach als fünfstärkster Prädiktor für das Geschlecht (vgl. Kapitel 11.11.1). Die Untersuchung von Ge‐ schlechterunterschieden bei den affektiven Faktoren zeigte, dass die Mädchen der Französischstichprobe insbesondere beim Interesse am Fach signifikant höhere Werte erzielen (vgl. Kapitel 11.7.1). Dennoch liegen die Mittelwerte bei beiden Geschlechtergruppen für das Interesse am Fach Französisch relativ niedrig und insgesamt erreicht die gesamte Stichprobe einen Mittelwert von 2.32. Für das Interesse am Fach Englisch wurde von Rumlich (2016: 403) mittels einer sehr ähnlichen Skala, die ebenfalls von 1 bis 4 kodiert wurde, für die achte Jahrgangstufe ein Mittelwert von 2.78 für die Schülerinnen und Schüler des regulären Englischunterrichts gemessen. Das höhere Ergebnis von Rumlich (2016) könnte aber auch damit zusammenhängen, dass er das Interesse am Fach Englisch in einer 8. Jahrgangsstufe maß, wobei davon ausgegangen werden muss, dass Motivation und Interesse im Laufe der Schulzeit abnehmen, was nach Reinfried (2002: 185, 187) als „brüsker Einschnitt“ ab der 7. Jahrgangsstufe beginnt und dann durch Aspekte wie die engmaschige Benotung eine kontinu‐ ierliche Verringerung des Selbstwertgefühls und des affektiven Bezugs zum Fach bewirkt. Daher bleibt offen, ob das bei Rumlich (2016: 403) gemessene höhere Interesse auf die Fremdsprache Englisch zurückzuführen ist oder aber auf das tendenziell abnehmende schulische Interesse ab Jahrgangsstufe 7, das eventuell alle Fächer gleichermaßen betrifft. Außerdem ließen sich in der vorliegenden Studie durch ein signifikantes Ergebnis beim Chi-Quadrat-Test nachweisbare geschlechtsspezifische Interes‐ sensgebiete finden: Die Mädchen interessieren sich mehr für soziale Bereiche, Küche, Kino und Musik, während die Jungen sich mehr für die Arbeitswelt, 564 12 Interpretation der Ergebnisse Geschichte, Sport und Wirtschaft zu interessieren scheinen. Dennoch gibt es einige Themengebiete, die nicht mit der bisherigen Forschung übereinstimmen: Das Thema Natur und Umwelt wurde von 38% der Jungen und lediglich 28% der Mädchen als Interessensgebiet angegeben und bei Immigration und Integration, Politik, Regionen und Städte Frankreichs, den deutsch-französischen Bezie‐ hungen und den Gebieten der Frankophonie außerhalb Frankreichs wurden zu vergleichbaren Anteilen von beiden Geschlechtergruppen als Interessensge‐ biete angegeben. In der Diskriminanzanalyse werden nach dem Interesse am Fach Französisch die instrumentelle Orientierung und die integrative Orientierung gepaart mit dem Ideal L3 Self als nächstkleinere Prädiktoren für das Geschlecht gemessen. Instrumentelle Orientierung und integrative Orientierung gepaart mit Ideal L3 Self liegen in ihrer Prädiktorstärke sehr eng beieinander und weisen beide eine gruppenspezifische Korrelation mit den weiblichen Französischlernenden auf, sodass ersichtlich wird, dass nicht von einer dichotomen Zuschreibung von Integrativität gepaart mit Ideal L3 Self und Instrumentalität ausgegangen werden kann (vgl. Schmenk 2016: 255), auch weil die Mädchen in beiden Kategorien tendenziell höhere Werte erzielen. Das in der vorliegenden Studie erzielte Ergebnis für die instrumentelle Orientierung und somit die Bewertung des Nützlichkeitsaspekts des Französischen zeigt, dass dieser insgesamt von den Probandinnen und Probanden als eher gering eingeschätzt wird, was sowohl von einem geringen Bewusstsein des Französischen als Weltsprache, das von derzeit 300 Millionen Menschen als Erstsprache gesprochen und von 235 Millionen Sprecherinnen und Sprechern täglich verwendet wird (vgl. ODCF 2014) als auch von der Wahrnehmung des Englischen als alleinig nützliche Lingua franca herrühren könnte (vgl. Reinfried 2017: 81). Die Häufigkeit der Freizeitaktivitäten auf Französisch, bei der die Mädchen si‐ gnifikant höhere Werte erzielten als die Jungen, stellen in der Diskriminanzana‐ lyse den achtstärksten Prädiktor für das Geschlecht dar. Erst als neuntstärkster Prädiktor für das Geschlecht entpuppt sich die fremdsprachliche Gesamtleis‐ tung im Französischen, wobei deren Prädiktorstärke in etwa halb so groß ist wie die Prädiktorstärke der wahrgenommenen Erwartungen der Eltern. Die niedrigsten Prädiktorstärken für das Geschlecht haben schließlich die Einstellungen zur französischen Zielkultur, das FFS Selbstkonzept, die Länge des Auslandsaufenthalts in einem französischsprachigen Land und die L3 WTC. Die Einstellungen zur französischen Zielkultur erreichen bei beiden Ge‐ schlechtergruppen zudem eher geringe Mittelwerte: Sowohl die Mittelwerte der Mädchen als auch die Mittelwerte der Jungen liegen unter den Ergebnissen von Venus (2017a: 264). Während bei Venus (2017a) signifikante Geschlechterunter‐ 12.1 Interpretation der zentralen Ergebnisse in Französisch 565 256 Genaue statistische Zusammenhänge zwischen Selbstkonzept und Leistung wurden in den Kapiteln 11.8.1 und 11.9 ausführlicher durch Korrelationsanalysen und multiple lineare Regressionsanalysen untersucht. schiede bei den Einstellungen zur französischen Zielkultur gemessen wurden, ist in der vorliegenden Studie kein signifikanter Unterschied messbar, jedoch ein schwacher Effekt zugunsten der Mädchen. Obwohl die Mädchen in der vorliegenden Studie signifikant höhere Ergeb‐ nisse in der Gesamtleistungen im Französischen erzielen, schlägt sich dies nicht in signifikanten Geschlechterunterschieden im FFS Selbstkonzept nieder, jedoch in einem schwachen Effekt zugunsten der Mädchen (vgl. Kapitel 11.7.1). 256 Der Mittelwert für die gesamte Französischstichprobe liegt bei 2.64. Bei Rumlich (2016: 393) erreichten die Achtklässlerinnen und Achtklässler des regulären Englischunterrichts bei derselben Skala für Englisch in ihrem EFS Selbstkonzept einen Mittelwert von 3.05. Die könnte ein Indiz dafür sein, dass das Französische insgesamt als schwerere Sprache empfunden wird als das Englische, insbeson‐ dere von Jungen. Darauf deuten auch die Ergebnisse aus dem rekodierten Item „Ich finde das Fach Französisch schwer. (-)“ hin, bei dem ersichtlich wird, dass die Jungen Französisch tendenziell als schwerer empfinden als die Mädchen (vgl. Anhang 6.8). Ein zusätzlich durchgeführter t-Test ergibt allerdings, dass bei diesem Item der Unterschied zwischen den Geschlechtergruppen nicht signifikant ist, aber ein schwacher Effekt vorliegt (p-=-.117; d-=-.347). Dass die L3 WTC schließlich nur einen so geringen Prädiktorwert für das Geschlecht bei der Diskriminanzanalyse einnimmt, belegt außerdem, dass die Hypothese von Frauen als genuin kommunikativere Wesen und entsprechenden eindimensionalen Schlussfolgerungen daraus stark infrage zu stellen sind (vgl. Schmenk 2002). Einige Variablen konnten nicht mit in die Diskriminanzanalyse aufge‐ nommen werden, da sie in beiden Geschlechtergruppen sehr ähnlich ausgeprägt waren: Die wahrgenommene Aufmerksamkeitsverteilung der Französischlehr‐ kräfte zugunsten der Mädchen fällt bei Jungen und Mädchen vergleichbar hoch aus, d. h. dass sich beide Geschlechtergruppen einig darüber sind, dass die Aufmerksamkeit der Französischlehrkräfte stärker bei den Mädchen liegt als bei den Jungen. Trotz des vergleichbaren Ergebnisses wurde aber vorher deutlich, dass diese Variable bezüglich der fremdsprachlichen Leistung sich entsprechend positiv bei Mädchen und entsprechend negativ bei Jungen auswirkt. Auch die genderstereotyp weibliche Wahrnehmung des Französischen kommt bei beiden Geschlechtergruppen zu vergleichbaren Ergebnissen, wobei diese mit einem Mittelwert von 2.162 (von maximal vier) insgesamt nicht so hoch ausfällt, wie auf Grundlage der Studien wie beispielsweise derjenigen von Willems 566 12 Interpretation der Ergebnisse et al. (2002) angenommen werden könnte. Schließlich fallen sowohl bei den Jungen als auch bei den Mädchen die wahrgenommenen Erwartungen der Peers vergleichbar gering aus und es sind keinerlei Geschlechterunterschiede messbar. Daher konnte nicht gezeigt werden, dass die Mädchen die Erwartungen der Peers bezüglich der Französischleistungen, die von Autoren wie Budde (2011) als stereotyp weiblich beschrieben werden, als höher empfinden würden als die Jungen. Es kann also festgehalten werden, dass im Französischen sowohl bei den fremdsprachlichen Leistungen als auch bei den endogenen motivational-affek‐ tiven und exogenen Faktoren deutliche Vorteile bei den Mädchen festgestellt wurden. Daher kann die Forderung von Budde (2011) eines überfälligen Boy turns in der Französischdidaktik nur unterstrichen werden. Außerdem wurde erneut die Notwendigkeit deutlich, die Dekonstruktion des Geschlechts in der Genderforschung voranzutreiben, insofern als das Geschlecht vor allem als interdependente, kontextabhängige Variable wirkt, die nur in Abhängigkeit mit anderen Variablen zu erklären ist (vgl. Grein 2012). Insbesondere die verstärkte Öffnung gegenüber Heterogenität im Klassenzimmer kann als Postulat am Ende dieser Studie formuliert werden, um dieser Kontextgebundenheit Rechnung zu tragen (vgl. Pavlenko 2008). Diese könnte eventuell mit einer offenen Diskussionskultur sowohl in Bezug auf die Sprache als auch bezüglich der Vorstellungen von Weiblichkeit und Männlichkeit einhergehen (vgl. Schmenk 2002: 8 f.), wobei berücksichtigt werden sollte, dass insbesondere Konstrukte aus dem Ought-to L3 Self, aber auch einige affektive Faktoren wie die L3-Angst viel stärker zur Konstruktion von Gender beitragen, als dies durch fremdsprachliche Leistungsunterschiede der Fall ist. Um dies zu erreichen, schlagen Decke-Cornill und Volkmann (2007) die Nutzung des Potenzials von Literatur und Film vor, um Geschlechterverhältnisse zu thematisieren. Dies könnte eventuell auch ein Zugang darstellen, um genderspezifische Unterstützungs- und Erwartungshal‐ tungen der Sozialisationsinstanzen offen zu diskutieren. Auch andere Ansätze, wie derjenige des bilingualen deutsch-französischen Unterrichts in naturwis‐ senschaftlichen Fächern, könnten dazu beitragen, die französische Sprache als Kommunikationsinstrument mehr ins Bewusstsein der Jungen, aber auch der Mädchen, zu rücken (vgl. Willems 2007) und Genderstereotype bezüglich des Französischen auf Seite der Lehrenden und Lernenden dadurch zu überwinden. 12.1 Interpretation der zentralen Ergebnisse in Französisch 567 12.2 Interpretation der zentralen Ergebnisse in Spanisch Vorweg sei angemerkt, dass, aufgrund der interessensgeleiteten Fächerwahl von Spanisch als dritter Fremdsprache und aufgrund des Ungleichgewichts in der Geschlechterverteilung der Spanischstichprobe (n (w) = 73, n (m) = 21), mit hoher Wahrscheinlichkeit ein starkes Präselektionsbias vorliegt. Dieser äußert sich darin, dass vor allem Jungen und Mädchen mit einem persönlichen Bezug zum Spanischen, mit einem besonders hohen Interesse am Fach Spanisch oder besonders positiven Einstellungen zum Spanischen und einer daraus resultierenden hohen Motivation, dieses Fach gewählt haben (vgl. hierzu auch Henry 2011: 95). Aufgrund dessen ist die gezogene Spanischstichprobe zwar durchaus repräsentativ für die Grundgesamtheit der Spanischschülerinnen und -schüler im Regierungspräsidium Tübingen, aber nicht für die gesamte Gruppe von Fremdsprachenlernenden im Alter von ca. 15 Jahren. Bezüglich einzelnen gemessenen Teilfertigkeiten und den Ergebnissen in den einzelnen Teilaufgaben wurden insgesamt überwiegend vergleichbare Er‐ gebnisse von Jungen und Mädchen festgestellt, wobei je nach Teilfertigkeit bzw. Teilaufgabe schwache, nicht signifikante Effekte zugunsten der Jungen oder auch zugunsten der Mädchen gemessen werden und signifikante Ergeb‐ nisse sehr selten und ausschließlich zugunsten der Mädchen auftreten. Im Gesamtergebnis in Spanisch sind jedoch leichte, nicht signifikante Vorteile zugunsten der Jungen messbar. Im Folgenden werden die zentralen Ergebnisse der vorliegenden Studie zusammengefasst und deren Ursachen sowohl auf Basis der durchgeführten statistischen Analysen als auch auf Grundlage der Forschungsliteratur analysiert und interpretiert. 12.2.1 Interpretation der zentralen Ergebnisse bezüglich des Hörverstehenstests in Spanisch Im Hörverstehenstest schneiden die Jungen nicht signifikant, aber mit einem schwachen Effekt besser ab als die Mädchen (d = .298, vgl. Tabelle 29, Kapitel 11.4.1.2). Aufgrund dessen steht das Ergebnis der vorliegenden Studie im Kontrast zu den Befunden der großen Bildungsmonitorings in Englisch und Französisch, bei denen beim Hörverstehen stets Vorteile zugunsten der Mädchen gemessen wurden (vgl. Bos et al. 2009a; Hartig/ Jude 2008; Winkelmann/ Groe‐ neveld 2010). Jedoch entspricht das Ergebnis einigen Studien mit Lernenden im Erwachsenenalter: Beispielsweise konnte Boyle (1987) bei Studierenden aus Hong Kong beim Hörverstehen einzelner Lexeme des Englischen signi‐ fikante Vorteile zugunsten der männlichen Lernenden finden. Bacon (1992) 568 12 Interpretation der Ergebnisse fand außerdem, ähnlich wie in der vorliegenden Studie, keine signifikanten ge‐ schlechtsspezifischen Leistungsunterschiede beim Hörverstehen im Spanischen bei US-amerikanischen Studierenden im zweiten Semester (vgl. Kapitel 4.2). Konträr zu Lange et al. (2016), die von einer höheren Leistungsvarianz der Jungen ausgehen, wird in der vorliegenden Studie bei den Mädchen eine größere Streuung der Hörverstehensleistungen im Spanischen festgestellt als bei den Jungen und auch die Höchstleistungen innerhalb der Stichprobe liegen bei den Mädchen (vgl. Tabelle 29, Kapitel 11.4.1.2). Dies mag allerdings beides auch an der ungleichen Verteilung von männlichen und weiblichen Spanischlernenden innerhalb der Stichprobe liegen und ist daher nur mit Vorsicht zu interpretieren. Obwohl kein statistisch signifikanter Unterschied zwischen den Hörverste‐ hensleistungen der Jungen und derjenigen der Mädchen vorliegt, kann den‐ noch ein divergierendes Ergebnis bei der Zuweisung der Feinniveaustufen festgestellt werden: Während die Jungen im Hörverstehenstest Spanisch mit einem Mittelwert von 27.10 Punkten nach der Klassifizierung von Lenz und Studer (2008d) durchschnittlich knapp das Niveau A2.1 erzielen, bleiben die Mädchen mit durchschnittlich 25.28 erzielten Punkten im Hörverstehen in Spanisch unter dem Niveau A2.1, wodurch, ähnlich wie beim Hörverstehen in Französisch, insgesamt ein etwas niedrigeres Niveau erzielt wird als aufgrund der Vorgaben der Bildungsstandards, die nach Abschluss von Jahrgangsstufe 10 das durchschnittliche Niveau B1.2 voraussetzen, zu erwarten wäre (vgl. KMK 2004). Daher stellt sich die Frage, inwiefern die eventuell unbekannten Aufgabenformate, die eventuell wenig bekannten Inhalte wie beispielsweise Autorennsport, möglicherweise unbekannte geographische Angaben (vgl. Grot‐ jahn/ Tesch 2010), die Prüfungssituation an sich, die Aufgabenstellungen auf Deutsch (vgl. Grosjean 2012 zum Bilingual Mode) oder der authentische, teils alltagssprachliche Sprachgebrauch der muttersprachlichen Sprecherinnen und Sprecher insgesamt einen höheren Schwierigkeitsgrad darstellten als durch das Aufgabenformat vorgesehen. Jedoch lag im Hörverstehenstest in Spanisch bezüglich der Verwendung diatopischer Varietäten ein vermutlich leicht nied‐ rigerer Schwierigkeitsgrad vor: Während im Hörverstehenstest in Französisch teilweise das Französische der Westschweiz gesprochen wurde, verwendeten die Sprecherinnen und Sprechern der Hörtexte in Spanisch nur sehr vereinzelt Elemente der diatopischen Varietät des Spanischen der Region um Madrid (z. B. bezüglich der Aussprache: verdad [berˈðaθ] anstelle von [berˈða ð ]; vgl. RAE 2005) und ansonsten überwiegend die norma castellana. Neben dem Testformat muss daher auch der Spanischunterricht als mögliche Ursache für das insgesamt eher niedrige Niveau im Hörverstehen in Betracht gezogen werden, da jener 12.2 Interpretation der zentralen Ergebnisse in Spanisch 569 den Lernerinnen und Lernern eventuell zu wenig Möglichkeiten bot, um das Hörverstehen auf der verlangten Niveaustufe adäquat auszubilden. Allerdings bleibt festzuhalten, dass die Jungen die Herausforderungen des Hörverstehenstests in Spanisch tendenziell erfolgreicher meisterten als die Mädchen, auch wenn beide Merkmalsgruppen etwas unter dem erwartbaren Kompetenzniveau blieben. Dies könnte laut der Ergebnisse von Fuchs (2014: 193), die die Motivation für das Erlernen des Englischen bezüglich der ein‐ zelnen kommunikativen Fertigkeiten untersuchte, eventuell auch daran liegen, dass Jungen tendenziell ein höheres Interesse an Hörverstehensaktivitäten empfinden als Mädchen. Betrachtet man die Ergebnisse in den einzelnen Teilaufgaben des Hörverste‐ henstests, die jeweils von den weiblichen und männlichen Spanischlernenden erzielt wurden, so fallen diese niemals signifikant, aber tendenziell stets zu‐ gunsten der Jungen aus, wobei lediglich statistisch relevante, schwache Effekte bei der ersten (Autorennsport, HV-28, d = .204) und bei der fünften Teilaufgabe (Werbung, HV-27, d = .410) gemessen werden und in allen anderen Teilaufgaben vernachlässigbare Effekte vorliegen. Bei den Teilergebnissen des Hörverste‐ henstests in Spanisch zeigen sich folglich keinerlei Tendenzen, die auf den Einfluss geschlechtsspezifischer Interessensgebiete auf die fremdsprachliche Leistung zurückzuführen wären (vgl. Bügel/ Buunk 1996: 17), da sowohl bei traditionellen „Jungenthemen“ wie Autorennsport als auch bei traditionellen „Mädchenthemen“ wie Liebesgeschichten jeweils die Jungen tendenziell höhere Punktzahlen erzielen. Nichtsdestotrotz ergab die Umfrage des Schülerfragebo‐ gens (vgl. Frage 11, Anhang 3.3) zu den Interessensgebieten der Spanischlern‐ enden insgesamt einen signifikanten Geschlechterunterschied, wobei sich ei‐ nige geschlechtsspezifische Interessensgebiete, wie beispielsweise das „Leben der Jugendlichen in Spanien“ wofür sich mehrheitlich die Mädchen interessieren und „Texte über Sport“, die mehrheitlich bei den Jungen auf Interesse stoßen (vgl. Kapitel 11.7.5), als traditionelle „Mädchen-“ bzw. „Jungenthemen“ interpretieren lassen. Zudem decken sich diese Ergebnisse auch teilweise mit den bisherigen Studien zu geschlechtsspezifischen Interessensgebieten (vgl. Dresel et al. 2005: 3; Jansen et al. 2013; Sparfeldt et al. 2004). Ausführliche statistische Analysen bezüglich des Gesamtergebnisses des Hörverstehenstests in Spanisch geben zusätzliche Aufschlüsse über mögliche Ursachen für die leichten Vorteile der Jungen: Zweifaktorielle Varianzanalysen, die im Sinne der Intersektionalitätsforschung Wechselwirkungen zwischen Geschlecht und sozioökonomischem Status untersuchen, ergeben, dass der schwache, nicht signifikante Haupteffekt beim Geschlecht liegt und weder ein Effekt des sozioökonomischen Status noch ein Interaktionseffekt zwischen den 570 12 Interpretation der Ergebnisse beiden Variablen vorhanden ist. Daher erzielen sowohl bei niedrigem als auch bei mittlerem und hohem sozioökonomischem Status die Jungen tendenziell höhere Hörverstehensleistungen als die Mädchen (vgl. Tabelle 70, Kapitel 11.6.3). Eine zweifaktorielle Varianzanalyse bezüglich einer möglichen Interaktions‐ wirkung zwischen Geschlecht und sprachlichem Hintergrund kommt ebenfalls zu dem Ergebnis, dass der schwache, nicht signifikante Haupteffekt beim Geschlecht liegt, während der sprachliche Hintergrund keinerlei statistischen Einfluss auf die Hörverstehensleistung in Spanisch nimmt und auch keine Inter‐ aktion zwischen den beiden Variablen vorliegt (vgl. Tabelle 71): Dies äußert sich darin, dass sowohl unter den einsprachigen als auch unter den mehrsprachigen Spanischlernenden jeweils die Jungen tendenziell höhere durchschnittliche Hörverstehensleistungen als die Mädchen erzielen (vgl. Kapitel 11.6.3). Innerhalb der Spanischstichprobe kann also bezüglich des Hörverstehens weder bei Jungen aus sozioökonomisch schwach gestellten Familien noch bei mehrsprachigen Jungen ein Nachteil gefunden werden, wie dies beispielsweise Feliciano und Rumbaut (2005) oder Støren und Helland (2010) für unterschied‐ liche Schulleistungen feststellten. Ganz im Gegenteil: Beide Merkmalsgruppen zeigen Vorteile gegenüber den Mädchen mit schwachem sozioökonomischem Hintergrund und gegenüber mehrsprachigen Mädchen. Obwohl außerdem der durchschnittliche HISEI der Mädchen bei 60.12 liegt und die Jungen lediglich einen durchschnittliche HISEI von 52.88 erreichen (vgl. Tabelle 20, Kapitel 11.2.2), erzielen die Jungen im Durchschnitt tendenziell höhere Ergebnisse im Hörverstehenstest, auch weil der sozioökonomische Status einen vernachläs‐ sigbaren Effekt auf die Leistung hat. Dieses Ergebnis steht auch im Gegensatz zu den Forschungsergebnissen von Carr und Pauwels (2006) die in Australien belegten, dass insbesondere Jungen aus der Arbeiterklasse die schwächsten fremdsprachlichen Leistungen erzielten, auch weil sie seltener die Möglichkeit hatten, ins Ausland zu verreisen. In der vorliegenden Studie korreliert jedoch der sozioökonomische Hintergrund insgesamt lediglich vernachlässigbar mit der Länge des Auslandsaufenthalts in spanischsprachigen Ländern (r s = .15, vgl. Anhang 7.3), was auch daran liegen mag, dass sowohl Jungen als auch Mädchen bisher durchschnittlich weniger als eine Woche im spanischsprachigen Ausland waren (vgl. Kapitel 11.2.2). Vielmehr korreliert die Länge des Aufenthalts im spanischsprachigen Ausland signifikant negativ mit dem sprachlichen Hinter‐ grund (r s = -.26*, vgl. Anhang 7.3), was bedeutet, dass mehrsprachige Jungen und Mädchen tendenziell seltener im spanischsprachigen Ausland waren als einsprachige Jungen und Mädchen. Da aber insgesamt eine sehr geringe Auslandserfahrung vorliegt, scheinen mehrsprachige Spanischlernende keine 12.2 Interpretation der zentralen Ergebnisse in Spanisch 571 Nachteile in der Hörverstehensleistung aufzuweisen. Bei einer Verstärkung dieses Unterschieds könnte diesbezüglich in zukünftigen Untersuchungen in Jahrgangsstufe 10 oder 11 ein Effekt gefunden werden, wofür sich eine Längs‐ schnittstudie sehr gut eigenen würde. Für diese Hypothese spricht auch, dass im Rahmen von Regressionsanalysen neben der erneuten Bestätigung, dass das Geschlecht keinen signifikanten Prädiktor für die Hörverstehensleistung in Spanisch darstellt (vgl. Anhang 8.4), die Leistung im schlussfolgernden Denken (SPM, Raven 2009), die Ausprägung des SFS Selbstkonzepts und eben die Länge des Aufenthalts im spanischsprachigen Ausland als signifikante Einflussfaktoren identifiziert wurden (vgl. Tabelle 82, Kapitel 11.9.3.2). Diese Prädiktoren entsprechen exakt denjenigen Einflussfaktoren, die auch für die Hörverstehensleistungen in Französisch ermittelt wurden. Zudem konnte mittels einfacher linearer Regressionsanalysen herausge‐ funden werden, dass jeweils auch die L4 WTC einen signifikanten positiven Einfluss und die L4-Angst wiederum einen signifikanten negativen Einfluss auf die Hörverstehensleistung in Spanisch haben (vgl. Tabelle 156, Anhang 8.4). Somit wird deutlich sichtbar, dass neben schlussfolgerndem Denken und der Länge des Auslandsaufenthalts im Wesentlichen die Ausprägung der affektiven Faktoren relevant für die Ausprägung der Hörverstehensleistungen in Spanisch sind. Die Leistung hängt also stark vom Willen, innerhalb des Unterrichts zu kommunizieren, vom eigenen Fähigkeitsselbstkonzept und komplementär dazu von der L4-Angst ab, während die Intersektionalitätsaxiome Geschlecht, sozio‐ ökonomischer Status oder sprachlicher Hintergrund keinerlei Auswirkungen auf die Hörverstehensleistung haben. Regressionsanalysen, die getrennt nach Mädchen und Jungen durchgeführt wurden, gaben einen noch detaillierteren Aufschluss über geschlechtsspezi‐ fische Wirkungen der erhobenen Faktoren: Bei den Mädchen stellen, wie auch bei der gesamten Spanischstichprobe, die Leistung im schlussfolgernden Denken und die Ausprägung des SFS Selbstkonzepts positive Einflussfaktoren dar, wobei lediglich letzterer signifikant ist. Allerdings manifestieren sich die wahrgenommenen Erwartungen der Eltern als signifikanter negativer Prädiktor für die Hörverstehensleistung der Mädchen (vgl. Tabelle 109). Dies könnte eventuell am wachsenden Streben nach Unabhängigkeit von den Eltern im Laufe der Adoleszenz liegen, welche ein den Erwartungen der Eltern entgegen‐ gerichtetes Verhalten mit sich bringt. Dieses Ergebnis könnte aber auch darin begründet liegen, dass die wahrgenommenen Erwartungen der Eltern bezüglich der Spanischleistungen der Schülerinnen und Schüler, auch im Vergleich zu den wahrgenommenen Erwartungen durch die Spanischlehrkräfte, eher niedrig ausfallen (vgl. Kapitel 11.7.5) und die Mädchen die Erwartungen der Eltern um 572 12 Interpretation der Ergebnisse 257 Der einzige Teilbereich, bei dem in Französisch bei den Jungen ein signifikanter Einfluss des Interesses am FachFranzösisch auf die fremdsprachliche Leistung festgestellt werden konnte, war die zweite Teilaufgabe des Leseverstehenstests (vgl. Tabelle 92). ein Vielfaches übertreffen. Dieses Ergebnis widerspricht dementsprechend in gewisser Weise der Annahme von McGannon und Medeiros (1995), dass die Ermutigung durch Eltern auch zu einer erhöhten Lernanstrengung führt, da diese vor allem während der Adoleszenz nicht mehr zwingend nötig zu sein scheint. Das vorliegende Ergebnis bestätigt vielmehr die Annahme von Kirchner (2004: 6), die behauptet, dass in der Adoleszenz der Einfluss der Eltern stark abnimmt. Diese Abnahme äußert sich aber eher andersherum als eventuell zu erwarten gewesen wäre: Es ist keinesfalls so, dass eine hohe Leistungserwartung der Eltern keinerlei Einfluss auf die Leistungen der Schülerinnen zeigt, sondern, dass trotz einer vergleichsweise niedrigen Leistungserwartung der Eltern eine verhältnismäßig hohe Hörverstehensleistung erzielt wird. Bei den Jungen bilden hingegen das schlussfolgernde Denken und das Interesse am Fach Spanisch signifikante positive Prädiktoren für ihre Hörvers‐ tehensleistung. Dabei fällt direkt auf, dass, im Gegensatz zu Französisch, bei dem das Interesse am Fach nur ein einziges Mal als signifikanter Einflussfaktor für die Leistung der Jungen gemessen wurde (vgl. Tabelle 92). 257 Allerdings üben die wahrgenommenen Erwartungen der Peers einen signifikanten negativen Einfluss auf die Hörverstehensleistung der Jungen in Spanisch aus (vgl. Tabelle 110). Eventuell könnte die Ursache für dieses Ergebnis darin liegen, dass die Erwartungen der Peers der Jungen im Durchschnitt eher niedrig ausfallen (vgl. Kapitel 11.7.5), die Leistungen der Jungen im Hörverstehen jedoch deutlich über diesen Erwartungen liegen. Die männlichen Spanischlernenden scheinen also nicht, wie von van Houtte (2004) angenommen, danach zu streben, ein ideales männliches Image aufbauen, was in diesem Zusammenhang bedeuten würde, konforme fremdsprachliche Leistungen zu den wahrgenommenen Erwartungen der Peers zu erbringen. Vielmehr scheint sich das persönliche Interesse der Jungen am Fach Spanisch über die niedrigen Erwartungen der Peers hinwegzu‐ setzen. Insgesamt bleibt festzuhalten, dass im Gesamtergebnis im Hörverstehen ein schwacher, nicht signifikanter Effekt zugunsten der Jungen gefunden wurde, sich keine signifikanten Interaktionseffekte zwischen Geschlecht und sozioöko‐ nomischem Status oder zwischen Geschlecht und sprachlichem Hintergrund manifestierten, sowohl bei den Jungen als auch bei den Mädchen positive Höverstehensleistungsprädiktoren unter den kognitiven Grundfertigkeiten und den affektiven Faktoren auftraten, als auch negative Prädiktoren aus dem Ought-to L4 Self zu beobachten waren. Diese lagen bei den Mädchen bei 12.2 Interpretation der zentralen Ergebnisse in Spanisch 573 den wahrgenommenen Erwartungen der Eltern und bei den Jungen bei den Erwartungen der Peers und könnten eventuell dadurch erklärt werden, dass die wahrgenommenen Erwartungen von Eltern und Peers im Vergleich zu den wahr‐ genommenen Erwartungen der Spanischlehrkräfte bei beiden Geschlechter‐ gruppen relativ niedrig ausfielen, die Jungen und Mädchen aber Hörverstehens‐ leistungen zeigen, die die Erwartungen der beiden Sozialisationsinstanzen, weit übertrafen. Dies zeigt, dass die oftmals proklamierten Konstruktionsprozesse des Doing Gender im Sinne eines erwartungskonformen Verhaltens gegenüber der geschlechterstereotypen Erwartungen der Peers durch die interessensgelei‐ tete Wahl von Fremdsprachen durchaus durchbrochen werden kann. 12.2.2 Interpretation der zentralen Ergebnisse bezüglich des Leseverstehenstests in Spanisch Auch der Leseverstehenstest in Spanisch bringt keinerlei statistisch signifi‐ kante Geschlechterunterschiede hervor. Bei allen Teilaufgaben sowie bei der durchschnittlichen Gesamtpunkzahl im Leseverstehen liegen vernachlässigbare Effekte vor, wobei eine minimal höhere durchschnittliche Gesamtpunktzahl bei den Jungen zu beobachten ist. Beide Merkmalsgruppen erreichen nach der Klassifikation von Lenz und Studer (2008d) das Niveau B1.1, wodurch sowohl von den Jungen als auch von den Mädchen ein erwartbares durchschnittliches fremdsprachliches Leistungslevel erzielt wird (vgl. KMK 2004). Dieses Ergebnis steht, ähnlich wie die Ergebnisse des Hörverstehenstests in Spanisch, in Opposition zu den Befunden der Bildungsmonitorings in Englisch und Französisch: Der Effekt zugunsten der Jungen, der in der vorliegenden Studie bei der Leseverstehensleistung in Spanisch gemessen wird (d-=-.165), ist nur etwas kleiner als diejenigen Effekte, die im Rahmen der Ländervergleichs‐ studie von 2009 im Leseverstehen in Französisch in Baden-Württemberg (d = .19) und auf Bundesebene (d = .23) gemessen wurden, wobei diese zugunsten der Mädchen ausfielen (vgl. Winkelmann/ Groeneveld 2010: 182). Auch der Effekt, der in der DESI-Studie beim Hörverstehen in Englisch (d-= .25; vgl. Hartig/ Jude 2008: 204) zugunsten der Mädchen festgestellt wurde, ist nur etwas größer als der in der vorliegenden Studie gefundene Effekt, mit dem wesentlichen Unterschied, dass bei DESI die Mädchen Vorteile im Leseverstehen zeigten und in der vorliegenden Studie die Jungen. Es lassen sich daher eher Bezüge zu Stu‐ dien mit älteren Lernenden herstellen: Beispielsweise wurde in der Studie von Carrell und Wise (1998) mit 104 Studierenden des Englischen als Zweitsprache eine leicht höhere Leistung männlicher Lernender beim Textverständnistest gefunden. 574 12 Interpretation der Ergebnisse Außerdem spiegeln die Ergebnisse der vorliegenden Studie bezüglich des Spanischen nicht die Ergebnisse von Fuchs (2014: 193) wider, die für das Fach Englisch herausgefunden hatte, dass sich Mädchen eher für den Lernbereich Lesen interessieren als Jungen. Auch dieses Ergebnis könnte unter anderem durch das starke Präselektionsbias durch das Verfahren der Fächerwahl zur dritten Fremdsprache bedingt sein (vgl. Henry 2011: 95). Des Weiteren gestaltet sich in der vorliegenden Studie die Streuung der Le‐ severstehensleistung der Jungen tendenziell größer als diejenige der Mädchen, wobei sowohl weibliche als auch männliche Spanischlernende unter denjenigen sind, die innerhalb des Samples die höchsten Resultate erzielen. Die Ergebnisse im Leseverstehenstest in Spanisch bestätigen also, anders als diejenigen des Hörverstehenstests, zumindest teilweise die Hypothese von Lange et al. (2016) bezüglich einer größeren Varianz der Leistungen der Jungen. Da in keiner der Teilaufgaben statistisch relevante Effekte zugunsten einer der beiden Geschlechtergruppen identitifierbar sind, können ausgehend von den Leistungen im Leseverstehenstest innerhalb der Spanischstichprobe auch keinerlei geschlechtsspezifische Präferenzen bezüglich Textsorte, Leseintention oder Inhalt des Lesetextes ausgemacht werden, wie dies etwa Bügel und Buunk (1996) versuchten. Auch wenn innerhalb der Spanischstichprobe keinerlei geschlechtsspezifi‐ sche Leistungsunterschiede im Leseverstehenstest, dessen zweite Teilaufgabe einen narrativen Text zur Grundlage hatte, auftraten, wurde indessen im Kontext der Fragebogenstudie bezüglich des Interessensgebiets „spanische Lek‐ türen/ Literatur“ ein deutlicher geschlechtsspezifischer Unterschied gefunden: Während 32% der Mädchen für dieses Themengebiet Interesse zeigen, liegt der Anteil der sich dafür interessierenden Jungen lediglich bei 5%. Innerhalb der Abfrage der Häufigkeit der Freizeitaktivitäten auf Spanisch erreichen hingegen die Jungen beim „Lesen spanischer Bücher, Zeitungen oder Zeitschriften“ einen tendenziell höheren Mittelwert als die Mädchen, wobei der Unterschied laut Mann-Whitney-U-Test nicht signifikant ist (vgl. Kapitel 11.7.5) und dieses Item keinerlei präzise Aussagen über einzelne Textsorten erlaubt. Die in der vorliegenden Studie erzielten Ergebnisse könnten also sowohl Indi‐ zien dafür darstellen, dass Jungen bezüglich der präferierten Interessensgebiete in der Fremdsprache Spanisch zwar genderstereotypenkonforme Angaben ma‐ chen, in Wirklichkeit aber in ihrer Freizeit genauso viel Literatur konsumieren wie die Mädchen. Es könnte aber auch der Fall sein, dass die Jungen zwar in ihrer Freizeit etwas mehr lesen als die Mädchen, jedoch durchaus andere Textsorten bevorzugen als ihre Mitschülerinnen. Hierzu müssten bezüglich des fremdsprachlichen Leseverhaltens der Geschlechtergruppen im Fach Spanisch 12.2 Interpretation der zentralen Ergebnisse in Spanisch 575 258 Auch das Interesse am Fach Spanisch stellt, wenn man eine einfache lineare Regressi‐ onsanalyse mit dieser Variable als alleinigem Prädiktor durchführt, einen signifikanten Einflussfaktor auf die Leseverstehensleistung im Spanischen dar (vgl. Tabelle 156). und darüber hinaus weiterführende Untersuchungen durchgeführt werden, welche eventuell zu nicht genderstereotypenkonformen Ergebnissen kommen könnten, ähnlich wie dies beispielsweise bereits bezüglich des wahrgenom‐ menen Einflusses der Peers oder auch der Hörverstehensleistung der Jungen zu beobachten war. Zusammenfassend kann also festgehalten werden, dass die Umfrage bezüg‐ lich der persönlichen Interessensgebiete in gewisser Weise die Annahmen von Braun und Schwemer (2013) sowie von Bügel und Buunk (1996) bestätigt, welche davon ausgehen, dass geschlechtsspezifische Präferenzen bezüglich Textsorten gegeben sind. Gleichzeitig widersprechen die Ergebnisse des Lese‐ verstehenstests den Annahmen von Bügel und Buunk (1996), da eine nicht in‐ teressenskonforme Auswahl der Lesetexte in Testformaten nicht zwangsläufig Auswirkungen auf die Leseverstehensleistungen von Jungen und Mädchen zu haben scheint. Das Ergebnis des Leseverstehenstests in Spanisch steht außerdem auch im Widerspruch zur Annahme von Burstall et al. (1974: 30), die davon ausgehen, dass eine gewisse kulturell bedingte kollektive genderstereotype Wahrnehmung des Lesens als spezifisch weibliche Fertigkeit vorliegen könnte, welche zu besseren Leseverstehensleistungen der Mädchen führen kann. Diesbezüglich ist infragezustellen, ob eine solche Annahme im 21. Jahrhundert überhaupt noch gemacht werden kann. Darüber hinaus müssen diese Ergebnisse im Kontext der interessensgeleiteten Fächerwahl und den daher stark wirkenden Präselektonsprozessen (vgl. Henry 2011: 95 ff.) bezüglich des Faches Spanisch gesehen werden, wodurch, wie bereits erwähnt, keinerlei Rückschlüsse auf die gesamte Altersgruppe oder das Erlernen anderer Fremdsprachen möglich sind. Im Gegensatz zur Variable Geschlecht, die keinen Einfluss auf die Leseleis‐ tung im Spanischen hat, erweisen sich das SFS Selbstkonzept und die wahrge‐ nommene Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen als zentrale Prädiktoren für die Leseverstehensleistung, was die Regressionsanalysen in Kapitel 11.9.3.3 ergaben. 258 Dass die wahrgenommene Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen einen signifikanten positiven Einfluss auf die Leseleistung der gesamten Spanischstichprobe hat, liegt aber höchstwahrscheinlich daran, dass sich die Spanischstichprobe zu 78% aus Mädchen und lediglich zu 22% aus Jungen zu‐ sammensetzt. Betrachtet man ausschließlich die Gruppe der Mädchen und führt innerhalb dieser erneut Regressionsanalysen durch, bestätigt sich diese Ver‐ 576 12 Interpretation der Ergebnisse mutung: Die wahrgenommene Aufmerksamkeitsverteilung der Spanischlehr‐ kräfte zugunsten der Mädchen stellt den einzigen signifikanten Prädiktor für die Leseverstehensleistung der weiblichen Spanischlernerinnen dar; das SFS Selbstkonzept trägt hingegen nur geringfügig und nicht signifikant zur Varianzaufklärung bei (vgl. Modell 1, Tabelle 111, Kapitel 11.10.3.3). Es bestätigt sich also auch bezüglich der Spanischstichprobe, dass die Interaktion zwischen Lehrkräften und Lernenden in Verknüpfung mit der Themenwahl entscheidend für die fremdsprachlichen Leistungen ist (vgl. Dörnyei 1994a; Helmke et al. 2008; Kirchner 2004; Williams/ Burden 1997) und dass dabei durchaus Prozesse des Doing Gender ablaufen (vgl. Budde 2005, 2006). Ein überraschendes Ergebnis der vorliegenden Studie ist jedoch, dass sowohl Jungen als auch Mädchen eine sehr ausgeprägte Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen wahrnehmen und diese sogar tendenziell als noch stärker ausgeprägt empfinden als dies bei der Französischstichprobe der Fall war, was wiederum die signifikante Prädiktorstärke dieser Variable für die Leseleistung der Mädchen erklären mag. Dennoch geben die Jungen sowohl eine tendenziell höhere wahrgenommene Unterstützung als auch eine tendenziell höhere wahrgenom‐ mene Erwartungshaltung durch die Lehrkräfte an als die Mädchen (vgl. Kapitel 11.7.7), weshalb hier insgesamt ein uneinheitliches Ergebnis erzielt wird, das nicht konform mit den Studienergebnissen von Worrall und Tsarna (1987) oder MacIntyre et al. (2002: 542) ausfällt, sie herausgefunden hatten, dass Lehrkräfte unabhängig von ihrem eigenen Geschlecht im Fremdsprachenunterricht ten‐ denziell Mädchen mehr unterstützten als Jungen sowie höhere Erwartungen an Mädchen richteten als an Jungen. Bei den Jungen erweist sich hingegen das SFS Selbstkonzept als stärkster alleiniger signifikanter Prädiktor für die Leseverstehensleistung im Spanischen (vgl. Modell 1b, Tabelle 112, Kapitel 11.10.3.3). Auch das Interesse am Fach Spanisch wirkt in einer einfachen linearen Regression als signifikanter Einfluss‐ faktor (vgl. Modell 1a, Tabelle 112, Kapitel 11.10.3.3), sodass sich die Leseleistung der Jungen vor allem durch die hohe Ausprägung der affektiven Faktoren begründen lässt und nicht etwa eine negative Wirkung der Aufmerksamkeits‐ verteilung der Spanischlehrkräfte zugunsten der Mädchen feststellbar ist, so wie dies bei Französisch der Fall war. 12.2.3 Interpretation der zentralen Ergebnisse bezüglich des Schreibtests in Spanisch Bezüglich der Gesamtergebnisse des Schreibtests wurden in keinem der drei Ratings statistisch relevante Geschlechterunterschiede gemessen (vgl. Kapitel 12.2 Interpretation der zentralen Ergebnisse in Spanisch 577 11.4.3.2). Dieses Ergebnis steht folglich im Kontrast zu den Ergebnissen der DESI-Studie zur schriftlichen Textproduktion in Englisch, bei der in der 9. Klasse ein mittlerer Effekt zugunsten der Mädchen gemessen wurde (d = .53; vgl. Hartig/ Jude 2008: 204). Einordnungen in Feinniveaustufen wurden ausschließlich bezüglich der Gesamtergebnisse im ersten und im dritten Rating vorgenommen: Im ersten Rating, welches die Sprachhandlungskompetenz maß, ergaben sich neben ver‐ gleichbaren durchschnittlichen Punktzahlen auch eine vergleichbare Streuung der Leistungen beider Geschlechtergruppen. Sowohl bei den Jungen als auch bei den Mädchen wurde außerdem ein durchschnittliches Niveau knapp unter A2.2 gemessen, wobei eine minimale, statistisch nicht relevante Tendenz zugunsten der Jungen sichtbar wurde (vgl. Tabelle 59, Kapitel 11.4.3.2). Im dritten Rating, das die sprachlichen Kategorien Wortschatz, Grammatik, Orthographie und Text(kompetenz) evaluierte, erreichen außerdem sowohl die Jungen als auch die Mädchen ein durchschnittliches Niveau knapp über A2.2 (vgl. Tabelle 64, Kapitel 11.4.3.2). Die erzielten Leistungen im Bereich der Sprachhandlungskompetenz und im sprachlichen Gesamtergebnis des dritten Ratings blieben folglich auch in Spanisch leicht hinter den aufgrund der Vorgaben der Bildungsstandards er‐ wartbaren Kompetenzstufen zurück, nach denen am Ende der 10. Jahrgangsstufe durchschnittlich das Niveau B1.2 erreicht werden soll (vgl. KMK 2004). Nach diesen ersten Einordnungen der erreichten Kompetenzniveaus im Schreibtest werden im Folgenden die einzelnen erhobenen Teilbereiche aus dem zweiten und dritten Rating genauer analysiert: Betrachtet man die einzelnen Teilbereiche des zweiten Ratings, so kann fest‐ gehalten werden, dass bei Wortanzahl (vgl. Tabelle 60), Kohärenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, lexikalischer Orthographie und Interpunktion (vgl. Tabelle 61), Verwendung der Tempi, Modi und ser/ estar/ hay und auch bei Morphosyntax und grammatischer Orthographie (vgl. Tabelle 62) keine statistisch relevanten Geschlechterunterschiede gefunden wurden (vgl. Kapitel 11.4.3.2). Entsprechend wurden im dritten Rating, welches sich ausschließlich auf sprachliche Kriterien konzentrierte und die oben genannten Bereiche noch einmal in Oberkategorien zusammenfasste, in den jeweiligen Teilkompetenzen Wortschatz, Grammatik, Orthographie und Text(kompetenz) (Tabelle 64, Kapitel 11.4.3.2) ebenfalls keinerlei statistisch relevante Geschlech‐ terunterschiede vorgefunden. Auffällig ist also vor allem, dass innerhalb der sprachlichen Teilkompetenzen des zweiten und des dritten Ratings, mit der einzigen Ausnahme von Syntax, bei der die Jungen einen schwachen, nicht signifikanten Vorteil zeigen, überall ausgeglichene Ergebnisse zwischen den Geschlechtergruppen vorliegen. Die 578 12 Interpretation der Ergebnisse ausgeglichenen Ergebnisse zu den unterschiedlichen produktiven fremdsprach‐ lichen Fertigkeiten widersprechen somit den Ergebnissen der meisten bisher durchgeführten Studien. Beispielsweise wurden im Bereich Orthographie oft‐ mals signifikante Unterschiede zugunsten der Mädchen festgestellt (vgl. Bos et al. 2003; Bos et al. 2012; McElvany et al. 2017; May 2006b: 121; Mielke et al. 2006: 100; Schneider et al. 1997; Stanat/ Kunter 2001). Außerdem weisen die vorliegenden Textproduktionen in Spanisch darauf hin, dass in der vorliegenden Studie auch keine Häufung von Fällen von Legasthenie bei den Jungen vorliegt (vgl. Bornstein et al. 2004; Gerlach 2010: 18; Sambanis 2013: 56; Szagun 2016). In den von den Schülerinnen und Schülern verfassten Texten wurden, genau wie in Französisch, weder bei den Mädchen noch bei den Jungen Symptome für Legasthenie festgestellt (vgl. Mendez 2013), noch konnten durch Nachfrage bei den Lehrkräften Fälle von Legasthenie ermittelt werden. Bezüglich des Wortschatzspektrums und der Verwendung des Wortschatzes gab es auch bisher oftmals uneinheitliche Ergebnisse: In der DESI-Studie wurde beim Sprechen im Leistungsbereich Wortschatz ein Vorteil der Mädchen gegenüber den Jungen gemessen (vgl. Nold/ Rossa 2008: 178). Hingegen wiesen beispielsweise Scarcella und Zimmerman (1998) bei männlichen Studienanfängern in Englisch als Zweit‐ sprache eine signifikante Überlegenheit bei der Verwendung wissenschaftlicher englischer Fachtermini nach. Auch im Bereich der Grammatik wurde für Eng‐ lisch als Fremdsprache in der 9. Jahrgangsstufe im Rahmen der DESI-Studie ein klarer Vorteil der Mädchen festgestellt (vgl. Hartig/ Jude 2008: 204). Auch diesem Ergebnis widerspricht das vorliegende Ergebnis für Spanisch, sodass auch in Zukunft ein stärkerer Fokus auf die Genderdynamiken im Bereich der dritten Fremdsprache und der Wirkung des dadurch entstehenden Präselektionsbias gelegt werden sollte. Die einzigen signifikanten Unterschiede, die zugunsten der Mädchen im Schreibtest zu verzeichnen sind, treten bei den Kategorien Befolgung des Ar‐ beitsauftrags und Inhalt 1 (vgl. Tabelle 60) auf. Hingegen manifestieren sich bei Inhalt 2 schwache, nicht signifikante Effekte zugunsten der Jungen. Abseits der produktiven sprachlichen Leistungen scheinen also, ähnlich wie in der Französischstichprobe, die weiblichen Lernerinnen vor allem dann, wenn es darum geht, den Arbeitsauftrag zu erfüllen, in der schriftlichen Textproduktion in Spanisch etwas sorgfältiger vorgegangen zu sein als die Jungen. Regres‐ sionsanalysen, die getrennt nach Geschlecht durchgeführt wurden, geben jedoch genauer Aufschluss über die Ursachen des signifikant schwächeren Abschneidens der Jungen: Die Befolgung des Arbeitsauftrags korreliert bei den Mädchen mit keiner der erhobenen Variablen signifikant (vgl. Anhang 7.4), weshalb für diese Kategorie aus den erhobenen Variablen keinerlei Prädiktoren 12.2 Interpretation der zentralen Ergebnisse in Spanisch 579 259 U = 22.000, Z = -2.919, p = .004, d = 1.177 gefunden werden konnten. Regressionsanalysen bezüglich der Befolgung des Arbeitsauftrags der Jungen zeigen jedoch, dass der sprachliche Hintergrund und die genderstereotyp weibliche Wahrnehmung des Spanischen jeweils einen nicht signifikanten, aber dennoch schwachen negativen Einfluss auf die Leistung haben (vgl. Tabelle 115). Der negative Einfluss der genderstereotyp weiblichen Wahrnehmung des Spanischen könnte also durchaus daher rühren, dass auch die geforderten persönlichen Kurznachrichten mit Begrüßungs- und Verabschiedungsformel von manchen männlichen Probanden der Spanischs‐ tichprobe eher als genderstereotyp weiblich empfunden werden. Außerdem hatten mehrsprachig aufgewachsene Jungen deutlich schwächere Ergebnisse bei der Befolgung des Arbeitsauftrags als einsprachige. Ein zusätzlich durchge‐ führter Mann-Whitney-U Test zeigt, dass der Unterschied zwischen beiden Merkmalsgruppen signifikant ist. 259 Dies könnte zum einen daran liegen, dass die mehrsprachigen Jungen Probleme mit der Arbeitsanweisung auf Deutsch hatten. Was indes gegen diese Vermutung spricht, ist, dass weder bei den Mädchen noch bei den Jungen signifikante Zusammenhänge zwischen den Leistungen im Hören, Lesen und Schreiben und dem sprachlichen Hintergrund gefunden wurden (vgl. Anhang 7.4) und die Befolgung des Arbeitsauftrags tatsächlich die einzige Teilkategorie darstellt, in der sich dieser Unterschied bei den Jungen so deutlich manifestiert. Dieses Ergebnis belegt also, dass alle anderen Anweisungen auf Deutsch von den mehrsprachig aufgewachsenen Schülerinnen und Schülern genauso gut verstanden wurden als von den einspra‐ chigen. Daher könnte es einfach passiert sein, dass die mehrsprachigen Jungen den Arbeitsauftrag, eine Begrüßung und eine Verabschiedung anzubringen, etwas weniger sorgfältig berücksichtigt haben als die einsprachigen Jungen. Für die Leistung der Mädchen in Inhalt 1 erweisen sich SFS Selbstkonzept und Wortschatzspektrum im Rahmen von Regressionsrechnungen als jeweils signifikante Prädiktoren (vgl. Modell 1a, Tabelle 116). Bei den Jungen nimmt das Wortschatzspektrum einen sehr starken Einfluss auf die Leistung in Inhalt 1 (vgl. Tabelle 117). Da das Wortschatzspektrum der Mädchen (p = .557, d = .147, vgl. Tabelle 61) tendenziell minimal größer ausfällt, auch wenn hier die statistischen Unterschiede nicht relevant sind, könnte dieses teilweise zur signifikant besseren Leistung der Mädchen in Inhalt 1 beitragen. Dies kann aber nicht der einzige Grund sein und daher werden an dieser Stelle Überlegungen bezüglich weiterer möglicher Erklärungsansätzen angeführt: Anders als in der Textproduktion in Französisch, in der bei den Jungen im Rahmen des Ratingverfahrens von Inhalt 1 immer wieder Abschweifungen von 580 12 Interpretation der Ergebnisse den geforderten Inhaltsaspekten zu beobachten waren, sind bei den Jungen in den Textproduktionen zur ersten Teilaufgabe des Schreibtests in Spanisch kaum Abweichungen von den verlangten inhaltlichen Aspekten erkennbar. Dennoch wird deutlich, dass in den spanischen Textproduktionen von den Jungen oftmals vergessen wurde, die Farben der Möbel und der Gegenstände im Zimmer zu benennen, was eventuell auch dafür spricht, dass dieser Aspekt von den Jungen schlichtweg als weniger wichtig empfunden wurde. Stattdessen nannten die Jungen deutlich öfter elektronische Geräte (z. B. Computer oder Playstation) sowie Poster und die darauf abgebildeten Stars bzw. Filmfiguren als die Mädchen (vgl. Anhang 9). Interessant ist bezüglich der Ergebnisse der Schreibproduktion in Spanisch auch, dass bei der Kategorie Inhalt 2, in der die inhaltlichen Aspekte des Verschiebens eines gemeinsamen Kinobesuchs verlangt waren, die Jungen wie gesagt leichte Vorteile aufweisen, sodass nicht die Schlussfolgerung gezogen werden kann, dass die Jungen generell etwas weniger Wert auf die Erfüllung der inhaltlichen Anforderungen legen. Weitere Forschungsarbeiten zur Schreibproduktion könnten daher Aufklärung darüber leisten, inwiefern solche Leistungsunterschiede auch durch die Themen- und Textsortenwahl zu begründen sind, wobei hierfür deutlich mehr Texte unterschiedlicher Textsorten und Themenbereiche pro Probandin bzw. Proband verfasst werden und eine größere Stichprobe herangezogen werden müssten. Als Referenz für die Gesamtleistung im Schreiben in Spanisch wurde das Gesamtergebnis des zweiten Ratings statistisch vertieft analysiert. Zweifakto‐ rielle Varianzanalysen zeigten, dass weder ein Effekt des Geschlechts noch ein Effekt des sozioökonomischen Status, aber ein mittlerer Interaktionseffekt zwischen diesen beiden Variablen vorliegt, der sich darin äußert, dass, ähnlich wie bei der Französischstichprobe, Jungen mit niedrigem sozioökonomischem Status tendenziell höhere durchschnittliche Ergebnisse erzielen als Mädchen mit niedrigem sozioökonomischem Status, dass aber Mädchen mit mittlerem und hohem sozioökonomischem Status jeweils tendenziell höhere durchschnittliche Leistungen im Schreibtest vorweisen als die Jungen, die jeweils zu diesen beiden Kategorien zählen (vgl. Tabelle 70, Kapitel 11.6.3). Vergleicht man mittels zweifaktorieller Varianzanalysen die Effekte von Geschlecht und sprachlichem Hintergrund auf die Schreibleistung, so weisen beide Variablen jeweils keinerlei Effekt auf. Die Interaktion zwischen beiden Intersektionalitätsaxiomen ist ebenfalls nicht signifikant, verzeichnet aber einen schwachen Effekt. Dieser Effekt drückt sich dadurch aus, dass einsprachige Jungen einsprachige Mädchen tendenziell leicht übertreffen, während mehr‐ sprachige Jungen tendenziell etwas schwächer abschneiden als mehrsprachige Mädchen (vgl. Tabelle 71, Kapitel 11.6.3). Daher kommt an dieser Stelle erneut 12.2 Interpretation der zentralen Ergebnisse in Spanisch 581 die Frage nach der Chancenungleichheit von Jungen mit Migrationshintergrund auf (Geißler 2013: 95). Die mehrsprachigen Mädchen weisen also tendenziell die höchsten Leis‐ tungen auf, gefolgt von den einsprachigen Jungen, den einsprachigen Mädchen und schließlich den mehrsprachigen Jungen, wobei die Unterschiede jeweils sehr gering und wie gesagt nicht statistisch signifikant sind. Daher kann bezüglich des Spanischen, weder beim Schreiben, noch, wie vorher ausgeführt, beim Hör- oder beim Leseverstehen von einer Chancenungleichheit von Jungen mit Migrationshintergrund (vgl. Geißler 2013: 95) gesprochen werden. Regressionsanalysen bezüglich des Gesamtergebnisses des zweiten Schreib‐ ratings zeigten entsprechend erneut, dass weder das Geschlecht noch der sozioökonomische Hintergrund, noch die Moderatorvariable Geschlecht * sozioökonomischer Hintergrund oder kognitive Grundfähigkeiten signifikante Prädiktoren für die Schreibleistung in Spanisch darstellen. Vielmehr entpuppen sich das SFS Selbstkonzept, aber auch das Interesse am Fach Spanisch, die L4-Angst und die L4 WTC jeweils in einfachen linearen Regressionsmodellen als signifikante Einflussfaktoren auf die Schreibleistung, wobei das SFS Selbst‐ konzept mit 29.7% mit Abstand die größte Varianzaufklärung bietet (vgl. Kapitel 11.9.3.4). Untersucht man abschließend noch einmal die Prädiktoren der Schreibleistung der Mädchen auf Unterschiede mit den Prädiktoren der Schreibleistung der Jungen, fällt auf, dass bei den Jungen ausschließlich das SFS Selbstkonzept als signifikanter Prädiktor wirkt und 17% der Varianz ihrer Schreibleistung erklärt (vgl. Tabelle 114), während bei den Mädchen in jeweils einfachen linearen Regressionsmodellen sowohl das SFS Selbstkonzept als auch die L4-Angst signifikante Prädiktoren darstellen L4-Angst (vgl. Tabelle 113, Kapitel 11.10.3.4). Die L4-Angst wirkt also ausschließlich bei den Mädchen und lediglich bei der produktiven Fertigkeit Schreiben als signifikante Einflussva‐ riable, im Sinne einer debilitating anxiety (vgl. Horwitz et al. 1986; Horwitz 2001). Es scheint sich also nicht nur für Französisch, sondern auch für Spanisch abzuzeichnen, dass die Mädchen öfter und stärker L3bzw. L4-Angst verspüren als die Jungen und diese Angst auch immer wieder negative Auswirkungen auf bestimmte Teilbereiche ihrer fremdsprachlichen Leistung hat. Dies ist auch im Kontext der Studienergebnisse von Martinović und Sorić (2018: 46) zu betrachten: Sie wiesen im Englischen eine signifikant höhere L2-Angst bei weib‐ lichen Studierenden nach, wobei sie gleichzeitig höhere Englischleistungen, allerdings gemessen durch Noten, erzielten. Eventuell könnte sich also die tendenziell höhere L2-Angst im Laufe der späten Adoleszenz und des frühen Erwachsenenalters von der debilitating anxiety zu einer faciliating anxiety ent‐ wickeln. Auch dies müsste bezogen auf die romanischen Schulfremdsprachen 582 12 Interpretation der Ergebnisse 260 1077 spricht zuhause Türkisch, Englisch und Deutsch, stammt aus einer Familie mit hohem sozioökonomischem Status und ihre Eltern können beide kein Spanisch. Sie belegt als erste Fremdsprache Englisch und als zweite Fremdsprache Französisch. Die Probandin war noch nie im spanischsprachigen Ausland, schaut aber gelegentlich Serien oder Fernsehsendungen auf Spanisch und hört sich Lieder an. Sie zeigt ein mittleres Interesse am Fach Spanisch (2.13), eine mittlere Ausprägung der integrativen Orientierung gepaart mit Ideal L4 Self (2.29), jedoch eine relativ hohe instrumentelle Orientierung (2.75), eine relativ geringe L4-Angst (1.83), eine relativ positive Einstellung zur spanischen Zielkultur (2.71), ein mittleres SFS Selbstkonzept (2.38), eine sehr hohe in zukünftigen Forschungsarbeiten näher betrachtet werden. Schließlich fällt auf, dass beim Schreiben keinerlei Variablen aus dem Bereich des Ought-to L4 Self als signifikante Prädiktoren für die Leistung der beiden Geschlechter‐ gruppen wirken, was erneut dafür spricht, dass beide Geschlechtergruppen aus persönlichem Interesse heraus Leistungsmotivation verspüren und die Sozialisationsinstanzen insgesamt deutlich weniger Einfluss nehmen als dies bei anderen schulischen Fächern der Fall sein mag, die zu einem früheren Zeitpunkt belegt werden. 12.2.4 Interpretation der zentralen Ergebnisse bezüglich der Gesamtleistungen in den Spanischtests Abschließend werden noch einmal die zentralen Befunde bezüglich des Gesamt‐ ergebnisses in Spanisch zusammengefasst und interpretiert. Es ist wie gesagt zu beobachten, dass im Gesamtergebnis in Spanisch die Jungen nicht signifikant, aber mit einem schwachen Effekt besser abschneiden als die Mädchen (vgl. Tabelle 67). Dabei ist die Streuung der Leistungen der Mädchen etwas größer als diejenige der Jungen und die Leistungsspitzen werden von den Mädchen erzielt. Während im Gesamtergebnis in Französisch keinerlei Ausreißer zu beobachten waren, gibt es innerhalb der Spanischstichprobe bei den Mädchen eine Ausreißerin nach unten (169 - Fallcode 1077) und bei den Jungen ebenfalls einen Ausreißer nach unten (140 - Fallcode 1048). Aus den Angaben in den Schülerfragebögen und den Ergebnissen der kognitiven Tests lässt sich aber lediglich ansatzweise nachvollziehen, weshalb gerade diese beiden Fälle die schwächsten Leistungen zeigen: Bei Probandin 1077 handelt es sich um eine mehrsprachig türkisch-deutsch aufgewachsene Probandin, die zuhause auch noch Englisch spricht und Französisch als zweite Fremdsprache belegt, jedoch im Motivationsprofil kaum Auffälligkeiten zeigt. Neben der Mehrsprachigkeit der Probandin sticht lediglich hervor, dass die wahrgenommenen Erwartungen der Peers äußerst gering ausfallen, was eventuell einen ersten Erklärungsansatz für ihre schwachen Leistungen bieten könnte. 260 Proband 1048 fällt leicht durch 12.2 Interpretation der zentralen Ergebnisse in Spanisch 583 Unterstützung durch die Lehrkraft (3.75), jedoch nur relativ geringe wahrgenommene Erwartungen durch die Lehrkraft (2.00), eine mittlere L4 WTC (2.25), sehr niedrige wahrgenommene Erwartungen durch die Peers (1.00), mittlere wahrgenommene Er‐ wartungen der Eltern (2.20), eine kaum genderstereotyp weibliche Wahrnehmung des Spanischen (1.17) und eine hohe Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen (4.00). Außerdem liegt ihr Ergebnis im schlussfolgernden Denken innerhalb der Norm und die Konzentrationsleistung konnte nicht gemessen werden. 261 1048 spricht zu Hause Englisch zu Hause und stammt aus einer Familie mit mittlerem sozioökonomischem Status. Er hat Latein als zweite Fremdsprache und gibt an, dass seine Elternteile beide mittlere Spanischkenntnisse haben, war jedoch selbst noch nie im spanischsprachigen Ausland. Außerdem beschäftigt er sich in seiner Freizeit, abgesehen davon, dass er hin und wieder spanische Lieder anhört und vereinzelt mündliche Unterhaltungen auf Spanisch führt. Er zeigt ein mittleres Interesse am Fach Spanisch (2.50), eine mittlere Ausprägung der integrativen Orientierung gepaart mit dem Ideal L4 Self (2.57), eine mittlere instrumentelle Orientierung (3.00), jedoch auch eine mittlere L4-Angst (3.00), eine relativ positive Einstellung zur spanischen Zielkultur (2.57), ein etwas schwächeres SFS Selbstkonzept (1.88), eine mittlere wahrgenommene Unterstützung der Spanischlehrkraft (3.00), mittlere wahrgenommene Erwartungen der Spanischlehrkraft (3.00), eine mittlere L4 WTC (2.50), mittlere wahrgenommene Erwartungen der Peers (2.33), mittlere wahrgenommene Erwartungen der Eltern (2.60), eine mittlere stereotyp weibliche Wahrnehmung des Spanischen (2.83), eine mittlere Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen (3.00) auch eher selten mit Spanisch, zeigt aber eine Konzentrationsleistung (KL) und eine Ausprägung des schlussfolgernden Denkens (SPM) leicht oberhalb der Altersnorm. seine etwas erhöhte L4-Angst bei gleichzeitig vergleichsweise niedrigem SFS Selbstkonzept auf, wobei er eine etwas höhere Motivation und etwas positivere Einstellungen zeigt als Probandin 1077; bei 1048 lässt sich außerdem eine etwas erhöhte genderstereotyp weibliche Wahrnehmung des Spanischen feststellen. Daher könnten eventuell diese genderstereotype Wahrnehmung zusammen mit der erhöhten L4-Angst die gemessene schwache Spanischleistung teilweise erklären. 261 Betrachtet man noch einmal die Gesamtleistungen der Jungen und Mädchen der gesamten Spanischstichprobe genauer, zeigen zweifaktorielle Varianzanal‐ ysen bezüglich des Einflusses des Geschlechts und des sozioökonomischen Status, dass ein vernachlässigbarer Effekt des Geschlechts, ein vernachlässig‐ barer Effekt des sozioökonomischen Status und ein kleiner, nicht signifikanter Interaktionseffekt zwischen den beiden Variablen vorliegt (vgl. Tabelle 70). Dieser äußert sich darin, dass Jungen mit niedrigem sozioökonomischem Hin‐ tergrund tendenziell etwas höhere Ergebnisse erzielen die Mädchen dieser Kategorie, während die Mädchen mit mittlerem und hohem sozioökonomi‐ schem Hintergrund jeweils vergleichbare Werte erzielen wie Jungen, die zu diesen beiden Kategorien zählen. Besonders auffällig ist das Ergebnis, dass die 584 12 Interpretation der Ergebnisse Jungen mit niedrigem sozioökonomischem Hintergrund innerhalb von diesen Merkmalsgruppen durchschnittlich das höchste Gesamtergebnis erzielen. Ob dieses dadurch erklärt werden kann, dass Jungen aus Familien mit niedrigem sozioökonomischem Status besonders von einem Umfeld mit höherem sozio‐ ökonomischem Status profitieren (vgl. Legewie/ DiPrete 2012) oder ob es sich hier lediglich um ein zufälliges Ergebnis handelt, kann nicht abschließend geklärt werden. Jedoch kann festgehalten werden, dass durch die Ergebnisse der hier untersuchten Spanischstichprobe die Befunde anderer Studien, die bei den Jungen aus der Arbeiterklasse die schwächsten fremdsprachlichen Leistungen beobachten (vgl. Carr/ Pauwels 2006; Entwisle et al. 2007; Mensah/ Kiernan 2010), nicht bestätigt werden können. Zweifaktorielle Varianzanalysen bezüglich des Einflusses des Geschlechts und des sprachlichen Hintergrunds auf die fremdsprachliche Gesamtleistung im Spanischen offenbaren erneut, dass keinerlei Effekte vom Geschlecht oder vom sprachlichen Hintergrund zu messen sind. Darüber hinaus liegt auch kein Interaktionseffekt zwischen den beiden Variablen vor (vgl. Tabelle 71, Kapitel 11.6.3). Betrachtet man die Mittelwerte, so liegen mehrsprachige Jungen und mehrsprachige Mädchen sehr eng beieinander, während einsprachige Jungen tendenziell minimal besser abschneiden als einsprachige Mädchen. Die einsprachigen Jungen liegen also in allen gemessenen Fertigkeiten tendenziell leicht über den einsprachigen Mädchen, während die mehrsprachigen Jungen lediglich beim Hörverstehen tendenziell besser abschneiden als die Mädchen und beim Lesen und Schreiben die mehrsprachigen Mädchen tendenziell etwas höhere Ergebnisse erzielen als die mehrsprachigen Jungen, wobei keiner der Unterschiede signifikant ist. Diese Ergebnisse der vier Merkmalsgruppen sind also sehr ausgeglichen und die in der Kategorie Befolgung des Arbeitsauftrags im Schreibtest gemessenen signifikanten Nachteile der mehrsprachigen Jungen sind somit die einzigen, die überhaupt gefunden wurden. Diese Ergebnisse, die keinerlei statistisch relevante Effekte des Geschlechts, des sprachlichen Hinter‐ grunds oder der Interaktion beider Variablen bezüglich der fremdsprachlichen Gesamtleistung zeigen, widersprechen also der Mehrzahl bisher durchgeführter Studien, die oft Nachteile bei Jungen mit Migrationshintergrund bekundeten (vgl. z. B. Böhme et al. 2010: 208; Feliciano/ Rumbaut 2005; Segeritz et al. 2010; Støren/ Helland 2010). Vielmehr scheinen hier so ausgeglichene Ergebnisse erzielt zu werden, wie man sie ansonsten vor allem aus dem Grundschulbereich kennt (vgl. Häckel/ Piske 2016; Steinlen 2018; Steinlen/ Piske 2016). Dies zeigt erneut, wie differenziert die Variable Geschlecht in den jeweiligen Forschungs‐ arbeiten behandelt werden muss, da je nach Umfeld, Zielsprache und Präselek‐ tionseffekten andere Ergebnisse erzielt werden können. 12.2 Interpretation der zentralen Ergebnisse in Spanisch 585 Analysiert man mittels Regressionsrechnungen, welche Variablen die höchsten Prädiktorstärken für die fremdsprachliche Gesamtleistung in Spa‐ nisch aufweisen, so wird ersichtlich, dass das SFS Selbstkonzept als alleiniger Prädiktor die Spanischleistung am besten erklärt und für 22.3% der Varianz in der Spanischleistung verantwortlich ist. Das Geschlecht, der sprachliche Hintergrund, der sozioökonomische Status, die Ausprägung der kognitiven Grundfertigkeiten, Variablen des des Ought-to L4 Self oder Variablen aus dem Bereich des Doing Gender zeigen im Gegensatz zu Französisch keinen statis‐ tisch signifikanten Einfluss auf die Spanischleistung. Auch L4 WTC, Interesse am Fach Spanisch und L4-Angst bilden jeweils in einfachen linearen Regres‐ sionsmodellen signifikante Prädiktoren für die Gesamtleistung in Spanisch, wenngleich deren Varianzaufklärung jeweils nicht so stark ist wie diejenige des SFS Selbstkonzept. Dieses Ergebnis bestätigt erneut, dass der Präselektionsbias der Wahl der dritten Fremdsprache sehr stark wirkt und insbesondere diejenigen Schülerinnen und Schüler erfolgreich sind, die über ein hohes Maß an Interesse und Motivation verfügen. Die üblichen Intersektionalitätsaxiome Geschlecht, sozioökonomischer und sprachlicher Hintergrund scheinen dadurch komplett an Bedeutung zu verlieren. Bei der Durchführung von Regressionsanalysen getrennt nach Geschlecht wurde zudem festgestellt, dass bei den Mädchen neben dem signifikanten Einfluss des SFS Selbstkonzepts, auch das schlussfolgernde Denken und der so‐ zioökonomische Status schwache, nicht signifikante Prädiktoren für deren Ge‐ samtleistung im Spanischen darstellen und dass diese drei Faktoren zusammen 22.9% der Varianz der Gesamtleistung der Mädchen erklären (vgl. Tabelle 107, Kapitel 11.10.3.1). Die L4-Angst korreliert bei den Mädchen hingegen nicht signifikant mit deren Gesamtleistung und ergibt auch keinen signifikanten Prädiktor, sodass deutlich wird, dass sich deren negativer Einfluss bei den Mädchen insbesondere auf die produktive Fertigkeit Schreiben beschränkt. Bei den Jungen zeigte sich hingegen bezüglich der Gesamtleistung in Spa‐ nisch die Kombination aus dem signifikant positiven Einfluss des Interesses am Fach Spanisch und dem nicht signifikanten negativen Einfluss der wahr‐ genommenen Erwartungen der Peers als Regressionsmodell mit der höchsten Varianzaufklärung von 28.7% (vgl. Tabelle 108, Kapitel 11.10.3.1). Allerdings liegen die wahrgenommenen Erwartungen der Peers der Jungen eher niedrig (vgl. Tabelle 75, Kapitel 11.7.7) und deren fremdsprachliche Leistungen sind eher als hoch zu beurteilen. Je niedriger also die wahrgenommenen Erwartungen der Peers sind, desto höher fallen tendenziell die Spanischleistungen der Jungen aus. Die männlichen Spanischlernenden setzen sich folglich gewissermaßen über 586 12 Interpretation der Ergebnisse die Dynamiken des Doing Gender hinweg, die von der Sozialisationsinstanz der Peers ausgehen. 12.2.5 Interpretation der Ergebnisse der Diskriminanzanalyse in Spanisch Abschließend erfolgt nun eine Interpretation der Ergebnisse der Diskriminanz‐ analyse, die untersuchte, welche Variablen sich am besten für die Vorhersage der jeweiligen Geschlechtergruppe eignen, wobei die endogenen affektiven Faktoren, die exogenen Faktoren und die Gesamtleistung in den Spanischtests als mögliche Prädiktoren für das Geschlecht herangezogen wurden (vgl. Kapitel 11.11.2). Diese letzte statistische Analyse innerhalb der Spanischstichprobe zeigt, dass, im Gegensatz zu Französisch, wo vor allem die wahrgenommenen Erwartungen und Unterstützung von Eltern und Lehrkräften sowie die L3-Angst die stärksten Prädiktoren für das Geschlecht darstellen, die endogenen affektiven Faktoren SFS Selbstkonzept, Interesse am Fach Spanisch und auch L4-Angst die stärkste relative Vorhersagekraft für das Geschlecht haben. Während in Französisch außerdem lediglich die wahrgenommenen Erwartungen der Eltern eine grup‐ penspezifische Korrelation der männlichen Probanden mit der Diskriminanz‐ funktion zeigen und alle anderen Variablen gruppenspezifische Korrelationen der weiblichen Probanden mit der Diskriminanzfunktion aufweisen, zeichnet sich in Spanisch ein deutlich ausgeglicheneres Bild, da die jeweiligen Faktoren teilweise zugunsten der Jungen und teilweise zugunsten der Mädchen wirken: Den stärksten Prädiktor für die Geschlechtergruppe stellt innerhalb der Spanischstichprobe wie gesagt das SFS Selbstkonzept dar, wobei diese Variable eine gruppenspezifische Korrelation der männlichen Lernenden mit dem Dis‐ kriminanzwert aufweist (vgl. Tabelle 119, Kapitel 12.2). Die Jungen (M-=-2.953) verfügen also tendenziell über ein etwas stärker ausgeprägtes SFS Selbstkonzept als die Mädchen (M = 2.883), wobei der statistische Unterschied vernachlässigbar ist und der Gesamtdurchschnitt bei einem Mittelwert von 2.899 liegt (vgl. Kapitel 11.7.5). Dadurch, dass die Diskriminanzanalyse der vorliegenden Studie aber nicht nur den Unterschied zwischen den mittleren Lagemaßen der Gruppen, sondern auch die Verteilung innerhalb der Streudiagrammswolken und die Kor‐ relationen zu den anderen im Modell befindlichen Variablen berücksichtigt, geht vom SFS Selbstkonzept trotz des nicht signifikanten Geschlechterunterschieds eine hohe Prädiktorstärke für die jeweilige Geschlechtergruppe aus. Die in der vorliegenden Studie für das SFS Selbstkonzept gemessenen Werte sind vergleichbar mit den Ergebnissen von Rumlich (2016: 393), der für Acht‐ 12.2 Interpretation der zentralen Ergebnisse in Spanisch 587 klässlerinnen und Achtklässler beim Selbstkonzept im Fach Englisch einen Mittelwert von 3.05 maß und ebenfalls keine signifikanten Geschlechterunter‐ schiede feststellte. Außerdem liegen sie deutlich über dem Durchschnitt, der für Französisch gefunden wurde (M = 2.637). Insgesamt wird laut der Ergebnisse in Item SkSub6 das Fach Spanisch (M = 2.72) als deutlich weniger schwer empfunden als das Fach Französisch (M-= 2.38; vgl. Anhang 6.8). Studienergeb‐ nisse, die keinerlei Geschlechterunterschiede oder auch Vorteile der Jungen im fremdsprachlichen Selbstkonzept finden, gibt es durchaus einige: Ryckman und Peckham (1987) fanden beispielsweise in Seattle in den Klassenstufen 4 bis 12 keinerlei Geschlechterunterschiede beim Fähigkeitsselbstkonzept in den sprachlichen Fächern. Clark und Trafford (1995) konnten für den Fremdspra‐ chenunterricht in England ein höheres Selbstvertrauen der Jungen feststellen, sich mündlich im Fremdsprachenunterricht zu äußern, obwohl die Mädchen höhere fremdsprachliche Leistungen verzeichnen konnten. Holder (2005: 237) stellte signifikante Geschlechterunterschiede für das Französische, aber nicht für das Englische fest. Außerdem wurde in der vorliegenden Studie für Franzö‐ sisch festgestellt, dass sich der beobachtete Leistungsunterschied zugunsten der Mädchen nicht in einem höheren FFS Selbstkonzept der Mädchen widerspiegelt (vgl. Kapitel 11.7.3). Daher wird für Französisch beobachtet, dass die Jungen über ein etwas höheres FFS Selbstkonzept verfügen als ihre Leistungen vermuten lassen und dass sich die Jungen in Spanisch etwas realistischer bezüglich ihrer tatsächlichen Leistung einschätzen. Da die vorhergehenden Regressions‐ analysen zeigten, dass das SFS Selbstkonzept alleine die Gesamtleistung im Spanischen am besten erklärt und sich diese Variable bei der Diskriminanzana‐ lyse als diejenige herausstellt, die die höchste relative Prädiktorstärke für das Geschlecht bietet, kann davon ausgegangen werden, dass der schwache Effekt zugunsten der Jungen in der Gesamtleistung in Spanisch vor allem auf ihr tendenziell etwas höher ausgeprägte SFS Selbstkonzept zurückzuführen ist. Solche Ergebnisse, bei denen geringe Unterschiede im Fähigkeitsselbstkonzept geringe Geschlechterunterschiede bei der Leistung erklären, sind bisher vor allem aus dem Bereich der Mathematik und der Naturwissenschaften bekannt: Beispielsweise fand die TIMSS-Grundschulstudie von 2007 heraus, dass die geringen Geschlechterunterschiede in den naturwissenschaftlichen und in den mathematischen Kompetenzen vor allem auf das fachbezogene Fähigkeitsselbst‐ konzept zurückzuführen waren (vgl. Bonsen et al. 2008: 137 f.). Nach dem SFS Selbstkonzept erweist sich das Interesse am Fach Spanisch in‐ nerhalb der Diskriminanzanalyse als zweitgrößter Prädiktor für das Geschlecht (vgl. Tabelle 119, Kapitel 12.2), wobei die Jungen ein tendenziell höheres Interesse am Fach Spanisch verspüren als die Mädchen (vgl. Kapitel 11.7.5) 588 12 Interpretation der Ergebnisse und dieses laut der in der gesamten Spanischstichprobe durchgeführten Re‐ gressionsanalyse ebenfalls ein signifikanter Prädiktor für die Gesamtleistung darstellt. Auch dieses Ergebnis widerspricht, wie es für die Spanischstichprobe bereits sehr oft der Fall war, vielen der bisher durchgeführten Studien: Bei‐ spielsweise wiesen Sparfeldt et al. (2004), Dresel et al. (2005: 3) und Jansen et al. (2013) in der Adoleszenz deutliche Geschlechterunterschiede bezüglich der fachspezifischen Interessen auf, in dem Sinne, dass bei Mädchen oft ein höheres Interesse an Sprachen festgestellt wurde. Das Ergebnis in der Spanischstichprobe, das ein tendenziell größeres Interesse für Spanisch bei den Jungen konstatiert, ist gleichzeitig ein weiterer Beleg dafür, dass im Fach Spanisch die Prozesse des schulischen Doing Gender nicht nach sonst als gängig beschriebenen Strukturen ablaufen: Die Interpretationsprozesse von dem, was für das eigene Geschlecht als typisch gilt, welche mit der Hervorbringung von einer entsprechenden geschlechtlichen Identität und geschlechtsadäquaten fachbezogenen Interessen verknüpft werden, verlaufen im Fach Spanisch als dritte Fremdsprache scheinbar nicht nach dem in anderen fremdsprachlichen Fächern vorgefundenen Mustern, welche Leistungsdifferenzen zugunsten der Mädchen oft auf genderstereotype Interessensgebiete zurückführen (vgl. z. B. Helmke et al. 2008: 255; Meißner et al. 2008: 150; Rumlich 2016: 358, 376; Thorn 2017: 87). Nach dem Interesse am Fach Spanisch folgt die L4-Angst als drittstärkster Prä‐ diktor für das Geschlecht (vgl. Tabelle 119, Kapitel 12.2), wobei die L4-Angst bei den Mädchen signifikant stärker ausgeprägt ist als bei den Jungen (vgl. Kapitel 11.7.5). In Kapitel 11.9.3.1 wurde gezeigt, dass die L4-Angst einen signifikanten negativen Prädiktor für die fremdsprachliche Gesamtleistung der gesamten Spanischstichprobe darstellt. In Kapitel 11.10.3 konnte zudem herausgefunden werden, dass die L4-Angst vor allem einen signifikant negativen Einfluss auf die Schreibleistung der Mädchen im Sinne einer debilitating anxiety (vgl. Martinović/ Sorić 2018: 40) hat, während sie bei den Jungen keinen signifikanten negativen Einfluss auf einzelne sprachliche Teilleistungen auszuüben scheint. Bei der Diskriminanzanalyse von Kissau (2006a), der Geschlechterunterschiede in Grade 9 von kanadischen Französischlernenden untersuchte, stellte hingegen die French Class Anxiety, also die Angst vor dem Französischunterricht, eine der Variablen dar die am wenigsten Vorhersagekraft für das Geschlecht besaßen. So wird deutlich, dass insbesondere diese Variable je nach Lerneralter und Zielsprache eine stark unterschiedliche Wirkung bei den beiden Geschlechter‐ gruppen entfalten kann, auch wenn die vorliegende Studie erneut bestätigt, dass Mädchen eine tendenziell höhere L4-Angst besitzen, was ein vergleichsweise 12.2 Interpretation der zentralen Ergebnisse in Spanisch 589 häufiges Ergebnis in bisherigen Studien darstellt (vgl. z. B. Martinović/ Sorić 2018: 46). Die wahrgenommenen Erwartungen der Peers nehmen in der Spanischs‐ tichprobe den viertstärksten Anteil der Gesamtdiskriminanz bezüglich der Unterscheidung der Geschlechtergruppen ein, wobei diese bei den Mädchen tendenziell höher ausfallen als bei den Jungen (vgl. Tabelle 75, Kapitel 11.7.7). Besonders interessant ist das Ergebnis, dass schwache wahrgenommene Erwar‐ tungen der Peers der Jungen trotzdem eine tendenziell höhere Gesamtleistung im Spanisch zu generieren scheinen, wodurch erneut ersichtlich wird, dass in Spanisch als dritter Fremdsprache Prozesse des Doing Gender teilweise nicht konform zu bisherigen Ergebnissen bezüglich des Erlernens schulischer Fremdsprachen verlaufen (vgl. hierzu auch Budde 2005, 2011). Als nächststärkster Prädiktor für das Geschlecht wirken innerhalb der Spa‐ nischstichprobe die Einstellungen zur spanischen Zielkultur (vgl. Tabelle 119, Kapitel 12.2), wobei die Mädchen eine signifikant höhere Ausprägung der Einstellungen zur spanischen Zielkultur besitzen als die Jungen (vgl. Kapitel 11.7.5). Interessant ist jedoch, dass sich diese signifikant höheren Einstellungen der Mädchen zur spanischen Zielkultur nicht in der fremdsprachlichen Leistung bemerkbar machen. Die für Spanisch vorgefundenen Ergebnisse bestätigen somit einige Befunde aus aktuellen Studien, die bei Mädchen eine positivere Einstellung zur Zielkultur finden (vgl. Meißner et al. 2008; Venus 2017a, 2017b). Als sechststärkster Prädiktor für das Geschlecht innerhalb der Spanischstich‐ probe wirken die wahrgenommenen Erwartungen der Spanischlehrkraft, wobei die Jungen tendenziell eine etwas höhere Erwartung der Spanischlehrkraft wahrnehmen, der Unterschied zu den Mädchen aber nicht signifikant ist (vgl. Tabelle 75, Kapitel 11.7.7). Die Erwartungen der Spanischlehrkraft liegen bei beiden Geschlechtergruppen vergleichsweise hoch, konnten aber nicht als signifikante Prädiktoren für deren Spanischleistung identifiziert werden. Es konnte also in dieser Studie nicht bestätigt werden, dass im Fremdsprachenun‐ terricht die Mädchen von den durchgehend weiblichen Lehrkräften stärkere Unterstützung sowie höhere Erwartungen erfahren als die Jungen (vgl. hierzu Bacher et al. 2008; Helbig 2010a, 2010b; Holmlund/ Sund 2008; Jones/ Jones 2001; MacIntyre et al. 2002: 542; Worrall/ Tsarna 1987). An siebter Stelle innerhalb der Diskriminanzanalyse stehen die wahrgenom‐ menen Erwartungen der Eltern als Prädiktoren für das Geschlecht, welche ebenfalls bei den Jungen tendenziell höher ausfallen (vgl. Tabelle 75, Kapitel 11.7.7). Es wurde aber lediglich bei der Hörverstehensleistung der Mädchen ein signifikanter negativer Einfluss der wahrgenommenen Erwartungen der Eltern festgestellt, in dem Sinne, dass besonders niedrige Erwartungen zu besonders 590 12 Interpretation der Ergebnisse hohen Hörverstehensleistungen bei den Mädchen führten. In allen anderen Teilbereichen und auch bezüglich der gesamten Spanischstichprobe wurde keinerlei Einfluss der wahrgenommenen Erwartungen der Eltern gemessen. Es bestätigt sich also auch für das Fach Spanisch, dass der Einfluss der Eltern auf die fremdsprachlichen Leistungen in der Pubertät abnimmt (vgl. Kirchner 2004: 6). Eine eher geringe Prädiktorstärke für das Geschlecht kommt nach der Diskriminanzanalyse der L4 WTC zu (vgl. Tabelle 119, Kapitel 12.2), die bei den Jungen tendenziell höher ausgeprägt ist als bei den Mädchen (vgl. Kapitel 11.7.5). Die L4 WTC stellt gleichzeitig einen signifikanten Prädiktor für die Gesamtleistung in Spanisch dar (vgl. Modell 1a, Tabelle 152), weshalb die tendenziell höhere Ausprägung dieser Variable bei den Jungen ebenfalls zur tendenziell höheren Gesamtleistung der Jungen in Spanisch beigetragen haben könnte, wobei der Einfluss insgesamt weniger stark gemessen wird als dies beim SFS Selbstkonzept der Fall ist. Das Ergebnis, dass die Jungen eine tendenziell höhere L4 WTC besitzen, ist auch komplementär zu dem Befund zu sehen, dass bei den Mädchen der Spanischstichprobe die L4-Angst stärker ausgeprägt ist als bei den Jungen und steht im Gegensatz zu den Befunden von MacIntyre et al. (2002), die in Kanada eine signifikant stärker ausgeprägte L2 WTC bezüglich des Französischen bei Mädchen vorfanden als bei Jungen. Die L4 WTC als relativ schwacher Prädiktor für das Geschlecht wird in der Diskriminanzanalyse gefolgt von der Länge des Aufenthalts in einem spanischsprachigen Land, wobei die Mädchen tendenziell etwas häufiger im spanischsprachigen Ausland waren, hier jedoch kein statistisch relevanter Geschlechterunterschied vorliegt und sich der Durchschnittswert bei beiden Geschlechtergruppen auf ca. 1 Woche im spanischsprachigen Ausland beläuft (vgl. Kapitel 11.2.2). Auch die instrumentelle Orientierung weist lediglich eine geringe Prädiktor‐ stärken für das Geschlecht auf (vgl. Tabelle 119, Kapitel 12.2), wobei alle drei Variablen eine Trennstärke zugunsten der Mädchen aufweisen. Die instrumen‐ telle Orientierung bezüglich des Erlernen des Spanischen ist nicht signifikant, aber mit einem schwachen Effekt bei den Mädchen stärker ausgeprägt als bei den Jungen, wodurch die in der zweiten Hälfte des 20. Jahrhunderts oftmals an‐ genommene dichotome Verteilung im Sinne von stärker integrativ orientierten Mädchen und stärker instrumentell orientierten Jungen (vgl. Bacon/ Finneman 1990; Burstall et al. 1974; Ludwig 1983) wiederlegt wird. Somit können sämtliche damit verbundene Genderrollenstereotypen wie beispielsweise das Bild vom Mann als an Beruf und Karriere interessierten Menschen und von der Frau als kommunikatives und soziales Wesen im Kontext der Spanischstichprobe 12.2 Interpretation der zentralen Ergebnisse in Spanisch 591 nicht bestätigt werden, sondern vielmehr die Auffassung, dass eine derlei simplifizierende Zuweisung problematisch ist und nicht der Realität entspricht (vgl. Schmenk 2002: 50-53). Darüber hinaus wurde in den Regressionsanalysen keinerlei signifikanter Einfluss der instrumentellen Orientierung auf die fremd‐ sprachlichen Leistungen ersichtlich. Dennoch erscheint die Messung dieser Variable auch im Nachhinein sinnvoll, da sie Aufschluss über den subjektiven Nützlichkeitsaspekt der jeweiligen Fremdsprache bei den beiden Geschlechter‐ gruppen gibt: Während dieser für Spanisch als relativ hoch angesehen wird (M = 2.873; vgl. Tabelle 74), fällt er für das Französische eher mittelmäßig aus (M = 2.038; vgl. Tabelle 72). Diese Variable ist sogar diejenige, bei der die höchste Differenz zwischen den Mittelwerten in der Französisch- und in der Spanischstichprobe gefunden wurde. Bei der Häufigkeit der Freizeitaktivitäten auf Spanisch, die eine noch ge‐ ringere Prädiktorstärke für das Geschlecht aufweist als die instrumentelle Orientierung, liegt ebenfalls kein statistisch relevanter Geschlechterunterschied vor. Die Häufigkeit der Freizeitaktivitäten auf Spanisch ist mit einem Mittelwert von 1.684 nur gering höher als die in der Französischstichprobe gemessene Häu‐ figkeit der Freizeitaktivitäten auf Französisch (M = 1.567), wobei in Französisch ein signifikanter Unterschied zugunsten der Mädchen vorlag. Anders als bei Französisch werden bei Spanisch keine signifikanten Einflüsse der Häufigkeit der Freizeitaktivitäten auf der Fremdsprache bezüglich der Spanischleistung gemessen. Vernachlässigbar zur Unterscheidung zwischen den Geschlechtergruppen trägt die wahrgenommene Unterstützung der Spanischlehrkraft bei, obwohl mittels eines Mann-Whitney-U-Tests ein mittlerer Effekt zugunsten der Jungen gemessen wurde (Tabelle 75, Kapitel 11.7.7). Dies zeigt erneut, dass innerhalb der Spanischstichprobe das Doing Gender durch die Lehrkräfte eher zugunsten der Jungen verläuft, aber insgesamt relativ wenig Vorhersagekraft für die Geschlechtergruppe besitzt. Die wahrgenommene Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen trägt laut Diskriminanzanalyse am zweitwenigsten zur Unterscheidung der Geschlechtergruppen bei. Dies bedeutet, dass beide Geschlechtergruppen ein ähnliches Maß der Aufmerksamkeitsverteilung der Spanischlehrkräfte zugunsten der Mädchen wahrnehmen. Am wenigsten zur Vorhersage des Geschlechts trägt innerhalb der ins Diskriminanzmodell aufge‐ nommenen Variablen die fremdsprachliche Gesamtleistung in Spanisch bei, wobei hier wie gesagt die Jungen mit einem schwachen, nicht signifikanten Ef‐ fekt besser abschnitten als die Mädchen. Es kann somit schlussgefolgert werden, dass in Spanisch alle bisher genannten Variablen mehr zur Unterscheidung der 592 12 Interpretation der Ergebnisse Geschlechtergruppen beitragen als deren fremdsprachliche Leistung, was, ähn‐ lich wie dies bereits bei den zweifaktoriellen Varianz- und bei den Regressionsa‐ nalysen der Fall war, erneut bestätigt, dass das Geschlecht für die fremdsprach‐ liche Gesamtleistung in Spanisch von vernachlässigbarer Relevanz ist. Vielmehr müsste also im Zusammenhang mit Spanisch als dritter Fremdsprache überlegt werden, wie im Unterricht das SFS Selbstkonzept und das Interesse am Fach Spanisch bei den Mädchen etwas gesteigert und gleichzeitig deren L4-Angst reduziert werden könnte. Als Umsetzungsmöglichkeit werden insbesondere für die Pubertät die Durchführung einzelner monoedukativer Gruppenarbeiten für Aussprache- und Kommunikationsübungen empfohlen (vgl. Bonin 2009; Braun/ Schwemer 2013). Inwiefern solche Ansätze der die L4-Angst reduzieren können, kann beispielsweise innerhalb von quasi-experimentellen Studien untersucht werden. Bezüglich der Diskriminanzanalyse bleibt noch darauf hinzuweisen, dass, aufgrund fehlender Trennschärfe zwischen den Geschlechtergruppen die integrative Orientierung gepaart mit Ideal L4 Self und die genderstereotyp weibliche Wahrnehmung des Spanischen nicht mit in das Diskriminanzmodell aufgenommen werden konnten (vgl. Schendera 2011). Bei beiden Variablen wurde in Kapitel 11.7.5 auch kein statistisch relevanter Unterschied zwischen den weiblichen und den männlichen Spanischlernenden festgestellt. Demzu‐ folge sind diese beiden Faktoren nicht nur bezüglich der jeweiligen durch die Geschlechtergruppen erzielten Mittelwerte, sondern auch aufgrund der starken Überschneidungen der Streudiagrammswolken und unter Berücksichtigung der Korrelation mit den anderen Variablen nicht geschlechtsspezifisch unterschied‐ lich. Es kann also festgehalten werden, dass Jungen und Mädchen für Spanisch vergleichbar integrativ motiviert sind und ähnliche Ideal L4 Selfs entwickelt haben, was erneut gegen früher vorherrschende dichotome Zuschreibungen spricht (vgl. Schmenk 2002). Schließlich verfügen beide Geschlechtergruppen über eine sehr schwach ausgebildete genderstereotyp weibliche Wahrnehmung des Spanischen (M-= 1.637). Im Gegensatz dazu war die genderstereotyp weib‐ liche Wahrnehmung des Französischen (M = 2.162) deutlich ausgeprägter, wobei auch hier keinerlei Unterschiede zwischen Jungen und Mädchen bezüglich ihrer genderstereotyp weiblichen Wahrnehmung des Französischen erfasst wurde. Das Motivationsprofil von Mädchen und Jungen bezüglich des Spanischen fällt also insofern ausgeglichen aus, als dass einzelne Variablen stärkere Prädik‐ toren für die Jungen und andere Variablen stärkere Prädiktoren für die Mädchen darstellen. Im Gegensatz zu Französisch scheinen die Lehrkräfte und die Eltern in Spanisch den Jungen eine etwas höhere Unterstützung und Erwartungshal‐ tung entgegenzubringen, wodurch keine Reproduktion der genderstereotyp weiblichen Sozialisation im Rahmen des Fremdsprachenlernens in Spanisch 12.2 Interpretation der zentralen Ergebnisse in Spanisch 593 erfolgt. Genauso wenig scheinen die Eltern das Doing Gender im Sinne einer Zuschreibung weiblicher Eigenschaften zum Spanischlernen voranzutreiben. Die einzigen, die bezüglich des Spanischen eine genderstereotype Sozialisation voranzutreiben scheinen sind die Peers der Jungen und Mädchen, wobei sich vor allem die Jungen, wie bereits dargelegt, erfolgreich über die niedrigen Erwartungen ihrer Peers hinwegsetzen und daher diesen Prozess des Doing Gender weitestgehend durchbrechen. Bezeichnend für Spanisch ist schließlich außerdem, dass, im Gegensatz zu Französisch, die fremdsprachliche Gesamt‐ leistung kaum Trennstärke für die Unterscheidung der Geschlechtergruppen besitzt, sondern diese vielmehr von den endogenen affektiven Faktoren und den Variablen des Ought-to L4 Self ausgeht. Abgesehen von diesen Dynamiken innerhalb der Spanischstichprobe bleibt festzuhalten, dass die Fächerwahl zur dritten Fremdsprache einen starken Präselektionsbias darstellt, was statis‐ tisch auch dadurch ersichtlich wurde, dass, anders als in Französisch, weder sozioökonomischer Status, noch Geschlecht, kognitive Grundfertigkeiten oder sprachlicher Hintergrund sondern meistens ausschließlich SFS Selbstkonzept, L4 WTC und Interesse am Fach Spanisch signifikante Prädiktoren für die Gesamtleistung darstellen. Insgesamt stellt sich die Frage, wie ein ausgeglicheneres Geschlechterver‐ hältnis in der dritten Fremdsprache und parallel dazu in den ab der achten Jahr‐ gangsstufe wählbaren naturwissenschaftlichen Zügen erreicht werden kann. Jedoch wäre im Fach Spanisch als dritte Fremdsprache nach den in der vorlie‐ genden Studie erzielten Ergebnissen in den fremdsprachlichen Leistungen und in den ausgeglichenen Ausprägungen der affektiven und exogenen Faktoren nicht dieselbe Art von Boy turn notwendig, wie er für die Französischdidaktik (vgl. Budde 2011) gefordert wird. Vielmehr ist müssten sowohl bezüglich der Unterrichtspraxis als auch bezüglich der zukünftigen Genderforschung in der Spanischdidaktik Ansätze erarbeitet werden, die den Anteil der männlichen Lernenden anheben und gleichzeitig an der bereits erreicht zu scheinenden Überwindung von Geschlechterstereotypen festhalten. Denkbar wären in diesem Zusammenhang sowohl bilinguale Angebote in Zusammenarbeit mit natur- und gesellschaftswissenschaftlichen Fächern, auch um die dichotomen Bildungswege, d. h. die grundlegende Entscheidung zwischen einer dritten Fremdsprache oder einer verstärkten naturwissenschaftlichen Bildung teilweise aufzuheben bzw. um diese beiden Fachbereiche auch bei den Schülern nicht womöglich gegenseitig auszuspielen. Aber auch eine gezielte gendersensible Informationspolitik der Schulen und Ministerien hinsichtlich der Rolle des Spanischen in der Welt, der Möglichkeiten, die sich durch das Erlernen des Spanischen als Weltsprache für den weiteren Lebensweg der Schülerinnen 594 12 Interpretation der Ergebnisse 262 Einzig in der Kategorie Inhalt 2 des zweiten Ratings des Schreibtests liegen die Punktzahlen der Französischlernenden leicht über denjenigen der Spanischlernenden (vgl. Tabelle 51 und 60). Dies könnte eventuell darauf zurückzuführen sein, dass ein Kriterium von Inhalt 2 darin bestand, zu erklären, dass man bei einem Wettbewerb etwas gewonnen hätte. Die Mehrheit der Spanischlernenden vermied beispielsweise das Wort Wettbewerb (sp. competición, concurso), eventuell, weil dieses noch nicht Teil ihres aktiven Wortschatzes war. 263 Im Gesamtergebnis erreichen die Mädchen in Französisch durchschnittlich 46.440 von 66 Punkten. Die Mädchen in Spanisch erreichen mit durchschnittlich 46.686 Punkten einen fast identischen Wert. Hingegen liegen die männlichen Französischlernenden bei durchschnittlich 43.135 Punkten und die männlichen Spanischlernenden bei 48.322 Punkten (vgl. Tabelle 67). und Schüler eröffnen sowie der Vorteile der dritten Fremdsprache, bei deren Erlernen auf Vorwissen aus bereits erworbenen Sprachen zurückgegriffen werden kann, könnte einen Ausgleich des Geschlechteranteils bedingen. 12.3 Vergleich der Ergebnisse aus den Fächern Französisch und Spanisch Abschließend werden die zentralen Ergebnisse aus den beiden Teilstudien in Französisch und Spanisch gegenübergestellt und miteinander verglichen. Die fremdsprachlichen, aber auch die endogenen affektiven und die exogenen Konstrukte weisen jeweils etwas andere Charakteristika aufgrund der unter‐ schiedlichen Forschungsgegenstände Französisch als zweite und Spanisch als dritte Fremdsprache auf. Daher kann dieser Vergleich nicht mithilfe von sta‐ tistischen Verfahren vorgenommen werden, sondern erfolgt auf Grundlage von Beobachtungen und Interpretationen der vorliegenden Ergebnisse und entsprechend ohne Angabe von Signifikanzen. In allen drei erhobenen Teilfertigkeiten, also im Hörverstehen, im Lesever‐ stehen und im Schreiben, ist zu beobachten, dass die Spanischlernenden den Französischlernenden tendenziell minimal überlegen sind. 262 Bei genauerer Be‐ trachtung der Geschlechtergruppen wird jedoch ersichtlich, dass die Mädchen im Französischen und im Spanischen in allen drei Teilfertigkeiten vergleichbare Ergebnisse erzielen, während ein klarer Leistungsvorteil der männlichen Spa‐ nischlernenden gegenüber den männlichen Französischlernenden erkennbar ist (vgl. Tabelle 67). 263 Außerdem erzielen die Mädchen in Französisch ein signifikant höheres Gesamtergebnis in den Sprachtests, während in Spanisch die Jungen nicht signifikant, aber mit einem schwachen Effekt besser abschneiden (vgl. Kapitel 11.5). 12.3 Vergleich der Ergebnisse aus den Fächern Französisch und Spanisch 595 264 Es muss jedoch angemerkt werden, dass nicht ganz ausgeschlossen werden kann, dass die tendenziell höheren Mittelwerte der Spanischstichprobe in den fremdsprachlichen Leistungen auch zu einem gewissen Maße durch die eigenständige Adaptation der Tests von lingualevel (vgl. Lenz/ Studer 2007a) für das Spanische bedingt sind. Gegen diese Vermutung spricht jedoch, dass die Mädchen jeweils in beiden Sprachen vergleichbare Ergebnisse erzielen und die tendenziell besseren Ergebnisse in Spanisch vor allem auf den Leistungsunterschied zwischen den männlichen Französischlernenden und den männlichen Spanischlernenden zurückzuführen sind (vgl. Kapitel 13). Betrachtet man die durchschnittlich erreichten Feinniveaustufen, so liegen diese im Hörverstehen jeweils bei den männlichen und weiblichen Probanden der Französischstichprobe sowie bei den weiblichen Spanischlernerinnen unter Niveau A2.1 und somit im selben Kompetenzbereich. Einzig die männlichen Spanischlernenden erreichen beim Hörverstehen das Niveau A2.1 (vgl. Lenz/ Studer 2007d). Im Leseverstehen erzielen alle getesteten Schülerinnen und Schüler jeweils im Durchschnitt Niveau B1.1. Hingegen liegt das Niveau der Sprachhandlungskompetenz bei den männlichen und weiblichen Lernenden beider Fremdsprachen durchschnittlich zwischen A2.1 und A2.2. Im dritten Rating des Schreibtests, bei dem produktive fremdsprachliche Kompetenzen in den Bereichen Wortschatz, Grammatik, Orthographie und Text(kompetenz) ge‐ messen wurden, erreichen die Jungen und Mädchen der Französischstichprobe ebenfalls jeweils ein Niveau zwischen A2.1 und A2.2, während sowohl die Jungen als auch die Mädchen der Spanischstichprobe mit einem Niveau leicht über A2.2 ein wenig besser abschneiden. Zu erwarten gewesen wäre aufgrund der Tatsache, dass sich die Spanischlernenden erst im zweiten Lernjahr und die Französischlernenden bereits im vierten Lernjahr befinden, dass erstere etwas niedrigere Ergebnisse erzielen als letztere (vgl. Abbildung 3). Weshalb bei den Spanischlernenden so ein rascher Lernfortschritt zu verzeichnen ist, zeigt ein Blick in die Ergebnisse abseits der fremdsprachlichen Kompetenzen: 264 Zunächst einmal scheint das Sprachbewusstsein der Spanischlernenden ins‐ gesamt etwas stärker ausgeprägt zu sein als dies bei den Französischlernenden der Fall ist, wobei ein Teil des Sprachbewusstseins der Spanischlernenden sicherlich auch auf das Erlernen des Französischen als zweite Fremdsprache zurückgeht. Das erhöhte Sprachbewusstsein der Spanischlernenden lässt sich also unter anderem auf die Tatsache zurückführen, dass es sich bei Spanisch um die dritte Fremdsprache handelt und folglich diesen Probandinnen und Probanden auf eine umfassende Sprachlernerfahrung zurückgreifen können. Außerdem kann ein etwas höheres Sprachbewusstsein der Spanischlernenden auch aufgrund ihrer durchschnittlich höheren produktiven fremdsprachlichen Leistungen, welche im dritten Rating des Schreibtests gemessen wurden, ange‐ nommen werden. Zudem liegt der Anteil der mehrsprachig aufwachsenden 596 12 Interpretation der Ergebnisse Schülerinnen und Schülern in der Spanischstichprobe mit 43.62% deutlich über dem Anteil von 35.63% in der Französischstichprobe. Auch dies spricht für ein durchschnittlich stärker ausgeprägtes Sprachbewusstsein innerhalb der Spanischstichprobe. Bei genauerer Analyse lässt sich außerdem beobachten, dass die Gesamtergebnisse der einsprachig und mehrsprachig aufwachsenden Jungen und Mädchen in Spanisch vergleichbar sind, während in Französisch die mehrsprachig aufwachsenden Jungen leichte Nachteile gegenüber den anderen Merkmalsgruppen zeigen (vgl. Kapitel 11.6.1 und 11.6.3). Weshalb die mehrspra‐ chig aufwachsenden Jungen ausschließlich in Französisch tendenziell schwä‐ cher abschneiden als die einsprachig aufwachsenden und dieses Phänomen in Spanisch nicht zu beobachten ist, kann allerdings nicht abschließend geklärt werden. Es fällt lediglich auf, dass der sprachliche Hintergrund der Jungen in Französisch signifikant negativ mit der Länge des Auslandsaufenthalts in französischsprachigen Ländern korreliert (r s = -.34*), was bedeutet, dass die mehrsprachig aufwachsenden Jungen tendenziell seltener im französischspra‐ chigen Ausland waren als die einsprachig aufwachsenden. Um die Ursachen genauer zu erforschen müssten aber in Zukunft vertieftere Studien durchgeführt werden, da auch ein zufälliger Effekt in der vorliegenden Studie nicht ganz ausgeschlossen werden kann. In Spanisch zeigt des Weiteren der sozioökonomische Status keinen signifi‐ kanten Einfluss auf die Gesamtleistung (vgl. Kapitel 11.6.3 und 11.9.3.1), wobei die männlichen Spanischlernenden mit niedrigem sozioökonomischem Status tendenziell am besten abschneiden, eventuell auch, weil ihr HISEI signifikant negativ mit dem sprachlichen Hintergrund korreliert (r s = -.56**; vgl. Anhang 7.4). Dies bedeutet, dass die männlichen Spanischlernenden mit niedrigem so‐ zioökonomischem Status tendenziell mehrsprachig sind, was ein Grund für ihre tendenziell besseren Gesamtleistungen in Spanisch sein könnte. In Französisch ist hingegen ein deutlicher Einfluss des sozioökonomischen Status auf die fremdsprachliche Gesamtleistung erkennbar, welcher laut Regressionsanalyse auch statistisch signifikant ist (vgl. Kapitel 11.9.1.1). Dabei schneiden Mädchen mit hohem sozioökonomischem Status in der Gesamtleistung tendenziell am besten ab. Jedoch ist auch beobachten, dass Jungen mit niedrigem sozioökono‐ mischem Status vergleichbare Ergebnisse erzielen wie Jungen mit mittlerem und hohem sozioökonomischem Status (vgl. Kapitel 11.6.1). Folglich verkehren die Jungen der Spanischstichprobe den Prototyp des mehrsprachigen Jungen mit niedrigem sozioökonomischem Status als Bildungsverlierer (vgl. Geißler 2013: 95) ins Gegenteil und erweisen sich als „Bildungsgewinner“, während in der Französischstichprobe zwar die Jungen mit mehrsprachigem Hintergrund tendenziell etwas schwächer abschneiden, aber gleichzeitig die Jungen mit nied‐ 12.3 Vergleich der Ergebnisse aus den Fächern Französisch und Spanisch 597 265 Die Spanischstichprobe erreicht bei der instrumentellen Orientierung insgesamt einen Mittelwert von 2.873 und die Französischstichprobe einen Mittelwert von 2.038, wo‐ durch sich eine Differenz von .835 ergibt (vgl. Tabelle 72 und Tabelle 74). 266 Die Spanischstichprobe erreicht bei der integrativen Orientierung gepaart mit dem Ideal L4 Self insgesamt einen Mittelwert von 2.608 und die Französischstichprobe bei der integrativen Orientierung gepaart mit dem Ideal L3 Self einen Mittelwert von 2.033, wodurch sich eine Differenz von .575 ergibt (vgl. Tabelle 72 und Tabelle 74). 267 Die Spanischstichprobe erreicht beim Interesse am Fach Spanisch insgesamt einen Mittelwert von 2.866 und die Französischstichprobe beim Interesse am Fach Französisch einen Mittelwert von 2.324, wodurch sich eine Differenz von .542 ergibt (vgl. Tabelle 72 und Tabelle 74). 268 Die Spanischstichprobe erreicht bei den Einstellungen zur spanischen Zielkultur ins‐ gesamt einen Mittelwert von 3.012 und die Französischstichprobe bei den Einstellungen zur französischen Zielkultur einen Mittelwert von 2.483, wodurch sich eine Differenz von .538 ergibt (vgl. Tabelle 72 und Tabelle 74). rigem sozioökonomischem Hintergrund im Gesamtergebnis keinerlei Nachteile zeigen. Einzig im Leseverstehenstest in Französisch erweist sich die Gruppe der Jungen mit niedrigem sozioökonomischem Status als tendenziell benachteiligte Gruppe (vgl. Kapitel 11.6.1), was erneut darauf hindeutet, dass eine gezielte Leseförderung von Jungen mit sozioökonomisch schwachem Status sinnvoll wäre. Der starke Präselektionsprozess bei der freiwilligen Wahl der dritten Fremd‐ sprache Spanisch scheint sich zudem deutlich durch eine erhöhte Lernbe‐ reitschaft und L4-Motivation bemerkbar zu machen (vgl. Henry 2011), was wiederum neben dem erhöhten Sprachbewusstsein die tendenziell höheren Ergebnisse der Spanischlernenden in den fremdsprachlichen Tests erklären könnte. Der Unterschied innerhalb der affektiven Faktoren bezüglich der beiden fremdsprachlichen Fächer wird dadurch ersichtlich, dass sowohl bei den Jungen als auch bei den Mädchen der Spanischstichprobe eine höhere Ausprägung der integrativen Orientierung gepaart mit dem Ideal L4 Self, eine höhere instrumentelle Orientierung, eine höhere L4 WTC, eine häufigere Durchführung von Freizeitaktivitäten in der Fremdsprache, ein höheres Interesse am Fach, po‐ sitivere Einstellungen zur Zielkultur, ein höheres fachbezogenes Selbstkonzept und eine geringere L4-Angst gemessen werden als in den Vergleichsgruppen der Französischstichprobe (vgl. Tabellen 72 und 74). Die größten Unterschiede zwischen den beiden Stichproben innerhalb der affektiven Faktoren werden bei der instrumentellen Orientierung 265 festgestellt, gefolgt von der integrativen Orientierung gepaart mit dem Ideal L3 bzw. L4 Self 266 , dem Interesse am Fach 267 und den Einstellungen zu den Zielkulturen 268 . Es kristallisiert sich also heraus, dass insbesondere der Nützlichkeitsaspekt des Spanischen als deutlich größer wahrgenommen wird als derjenige des Französischen und dass die persönlichen 598 12 Interpretation der Ergebnisse 269 Die L3bzw. L4-Angst liegt in der Französischstichprobe im Mittelwert bei 2.049 und in der Spanischstichprobe bei 1.970 (vgl. Tabelle 72 und Tabelle 74). Bedürfnisse, mit Mitgliedern aus der Zielkultur in Kontakt zu treten und in Zu‐ kunft eine hohe fremdsprachliche Kompetenz zu besitzen, bei den Spanischlern‐ enden stärker ausgeprägt sind als bei den Französischlernenden. Der etwas längere durchschnittliche Auslandsaufenthalt der Probandinnen und Probanden der Französischstichprobe (M = 1.85; vgl. Kapitel 11.2.1) im Vergleich zu den Probandinnen und Probanden der Spanischstichprobe (M = 1.23; vgl. Kapitel 11.2.2) scheint diese Tendenzen nicht ausgleichen zu können und sich weder in einer höheren produktiven Sprachkompetenz der Französischlernenden noch in stärkeren Ausprägungen der affektiven Variablen niederzuschlagen. Es stellt sich diesbezüglich die Frage, inwiefern sich sowohl die Motivation als auch die Leistungen langfristig verbessern könnten, wenn die Möglichkeit für beide Stichproben bestünde, öfter und länger ins Ausland zu reisen, um dort die jeweilige Fremdsprache anzuwenden. Außerdem ist eine leicht höhere L3-Angst der Französischlernenden im Vergleich zu den Spanischlernenden zu beobachten, wobei der Unterschied in diesem Bereich tatsächlich nur minimal ist 269 , sodass nicht davon ausgegangen werden kann, dass in einem Fach eine angespanntere oder angsterfülltere At‐ mosphäre herrscht als im anderen, was als positives Ergebnis der vorliegenden Studie interpretiert werden kann, auch weil die Werte in beiden Stichproben relativ niedrig ausfallen. Ähnlich hohe Unterschiede innerhalb der affektiven Faktoren bezüglich der beiden Fremdsprachen Französisch und Spanisch, beispielsweise hinsichtlich der Nützlichkeit der Fremdsprache, der Einstellungen zum Fremdsprachenun‐ terricht, der Einstellungen zur Fremdsprache und der Anwendungsmöglich‐ keiten der Fremdsprache, finden sich in der 9. Jahrgangsstufe auch bei Meißner et al. (2008: 69 ff.). Allerdings wurden in der Studie von Meißner et al. (2008) aufgrund der Stichprobenzahlen von 127 Französischlernenden und sechs Spa‐ nischlernenden insbesondere für Spanisch keine repräsentativen Ergebnisse erzielt. Bezüglich der Geschlechterverhältnisse bei den affektiven Faktoren fällt in der vorliegenden Studie zudem auf, dass in Spanisch teils die Jungen, teils die Mädchen tendenziell ausgeprägtere affektive Variablen vorweisen. Den‐ noch zeigen die Mädchen signifikant positivere Einstellungen zur spanischen Zielkultur als die Jungen, jedoch auch eine signifikant höhere L4-Angst. Die Jungen hingegen besitzen durchschnittlich ein etwas höheres Interesse am Fach Spanisch als die Mädchen, auch wenn der Unterschied nicht signifikant ist. 12.3 Vergleich der Ergebnisse aus den Fächern Französisch und Spanisch 599 270 Diese Werte konnten statistisch verglichen werden, da genau dieselben kognitiven Tests unter denselben Testbedingungen von beiden Stichproben bearbeitet wurden (vgl. Kapitel 11.3). Im Gegensatz dazu weisen in Französisch die Mädchen bei allen affektiven Variablen tendenziell höhere Ausprägungen auf, wobei die Geschlechterunter‐ schiede lediglich bei der Häufigkeit der Freizeitaktivitäten auf Französisch und beim Interesse am Fach Französisch signifikant sind (vgl. Tabellen 72 und 74). Folglich können die Ergebnisse bezüglich der endogenen affektiven Faktoren als komplementär zu denjenigen in den fremdsprachlichen Leistungen interpretiert werden. Bezüglich des Doing Gender ist festzustellen, dass die genderstereotyp weib‐ liche Wahrnehmung des Spanischen (M = 1.637) deutlich geringer ausgeprägt ist als diejenige des Französischen (M = 2.162), was erneut bestätigt, dass Französisch scheinbar eher als weibliche Sprache wahrgenommen wird als Spanisch (vgl. Kissau 2006a; Williams et al. 2002). Bei den Variablen des Ought-to L3 bzw. L4 Self fallen die Ergebnisse in Französisch und Spanisch überwiegend vergleichbar aus: Während die wahr‐ genommene Unterstützung und die wahrgenommenen Erwartungen der Lehr‐ kräfte von beiden Geschlechtergruppen und in beiden Fächern als relativ hoch empfunden werden und alle Merkmalsgruppen ein hohes Maß an Aufmerksam‐ keitsverteilung der Lehrkräfte zugunsten der Mädchen wahrnehmen, können die wahrgenommenen Erwartungen der Eltern bezüglich beider Fächer und Geschlechtergruppen als mittelstark interpretiert werden. Der einzige deutliche Unterschied zwischen Französisch und Spanisch ergibt sich bei den wahrge‐ nommenen Erwartungen der Peers, die in Spanisch (M (w) = 2.671; M (m) = 2.373; vgl. Tabelle 75) sowohl bei den Jungen als auch bei den Mädchen deutlich höher ausfallen als in Französisch (M (w) = 1.762 M (m) = 1.718; vgl. Tabelle 73). Folglich stellt der beobachtete Unterschied in den wahrgenommenen Erwartungen der Peers einen weiteren Erklärungsansatz für die leicht höheren fremdsprachlichen Leistungen der Spanischstichprobe im Vergleich zur Französischstichprobe dar. Es lässt sich außerdem festhalten, dass in beiden Stichproben im Bereich des Ought-to L3/ L4 Self keine signifikanten Geschlechterunterschiede messbar sind. Ein weiterer Aspekt, der die etwas höheren Ergebnisse der Spanischstich‐ probe in den fremdsprachlichen Tests erklären könnte, liegt darin begründet, dass die Spanischlernenden signifikant höhere Werte in den kognitiven Grund‐ fertigkeiten Arbeitstempo (BZO, d2-R, Brickenkamp et al. 2010) und Konzentra‐ tionsleistung (KL, d2-R, Brickenkamp et al. 2010) erreichten. 270 Dieses Ergebnis könnte eventuell auch mit den durch die Fächerwahl stattgefundenen Präse‐ lektionsprozessen zusammenhängen. Gleichzeitig bedeutet dieser Befund aber 600 12 Interpretation der Ergebnisse 271 Da es sich um ein rekodiertes Item handelt, müssen die statistischen Ergebnisse auch in rekodierter Weise gelesen und interpretiert werden. auch eine weitere Einschränkung der Vergleichbarkeit der fremdsprachlichen Ergebnisse der beiden Stichproben, da die kognitiven Grundvoraussetzungen der Spanischstichprobe etwas vorteilhafter zu sein scheinen (vgl. Kapitel 11.3). Wegen des gemessenen nicht signifikanten Einflusses der kognitiven Grund‐ fertigkeiten der Spanischlernenden auf deren fremdsprachliche Leistungen (vgl. Kapitel 11.9.3 und 11.10.3) kann aber wiederum infrage gestellt werden, inwiefern das signifikant höhere durchschnittliche Arbeitstempo und die si‐ gnifikant höhere durchschnittliche Konzentrationsleistung der Spanischstich‐ probe tatsächlich ausschlaggebend für deren etwas höhere fremdsprachliche Leistungen im Vergleich zur Französischstichprobe sind und ob vor allem die bereits erläuterte Kombination aus einem höheren Sprachbewusstsein, höheren Ausprägungen der affektiven Variablen und höheren wahrgenommenen Erwar‐ tungen der Peers zu ihrem größeren Sprachlernerfolg beiträgt. Bei Französisch zeigte sich im Gegensatz zu Spanisch ein signifikanter Ein‐ fluss der kognitiven Grundfertigkeiten auf die fremdsprachliche Gesamtleistung (vgl. Kapitel 11.9.1.1). Ob dies auch damit zusammenhängen könnte, dass das Erlernen des Französischen für Muttersprachlerinnen und Muttersprachler des Deutschen auch kognitiv herausfordernder ist als das Erlernen des Spanischen, müsste in Folgestudien näher untersucht werden. Dieses Forschungsdesiderat ergibt sich auch aus dem Ergebnis des Items SkSub6 („Ich finde das Fach Französisch/ Spanisch schwer. (-)“), bei dem zu erkennen ist, dass Französisch (M-=-2.38) als deutlich schwerer eingeschätzt wird als Spanisch (M-=-2.72). 271 Abschließend bleibt festzuhalten, dass der fremdsprachliche Leistungsun‐ terschied zwischen Jungen und Mädchen im Französischen vorwiegend sozio‐ logisch bedingt zu sein scheint, in dem Sinne, dass die Mädchen eher das Bedürfnis verspüren, Fremdsprachenlernprozesse vorzuweisen, weil dies gesell‐ schaftlich erwünscht ist, während die Jungen, bewusst oder unbewusst, weniger Motivation und geringere Leistungen zeigen, weil Fremdsprachenlernerfolge eventuell vermeintlich kein Teil ihrer sozial und stereotyp konstruierten Ge‐ schlechterrolle darstellen (vgl. Oxford/ Shearin 1994: 18; Schmenk 2002). Für diese Schlussfolgerung spricht das Ergebnis, dass die wahrgenommene Auf‐ merksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen (vgl. Tabelle 85) einen gewissen positiven Einfluss auf die Gesamtfranzösischleistung der Mädchen ausübt und sich bei den Jungen hingegen vor allem die wahrge‐ nommene Aufmerksamkeitsverteilung der Französischlehrkräfte zugunsten der Mädchen und die wahrgenommene Unterstützung der Französischlehrkräfte 12.3 Vergleich der Ergebnisse aus den Fächern Französisch und Spanisch 601 als negative Einflussfaktoren auf die Gesamtfranzösischleistung erweisen (vgl. Tabelle 86). Auch die wahrgenommenen Erwartungen der Peers haben, je nach fremdsprachlicher Teilkompetenz, einen mehr oder weniger starken negativen Einfluss auf die Französischleistungen der Jungen, was die Hypothese des ne‐ gativen sozialen Einflusses auf die Jungen im Falle des Französischen ebenfalls bestätigt. In Spanisch erklärt sich hingegen der Befund, dass keine signifikanten Geschlechterunterschiede in der fremdsprachlichen Gesamtleistung, aber ein schwacher Effekt zugunsten der Jungen gefunden wurden, vor allem durch die Einflüsse des SFS Selbstkonzepts, der L4 WTC und des Interesses am Fach Spanisch, die sich als signifikante Prädiktoren offenbaren. Weder das Geschlecht noch andere Einflüsse des Doing Gender durch Sozialisationsinstanzen scheinen Auswirkungen auf die fremdsprachliche Leistung in Spanisch zu haben (vgl. Tabellen 107 und 108). Daher werden die stärksten Unterschiede zwischen Französisch und Spanisch bei den Einflussfaktoren auf die fremdsprachliche Leistung sichtbar. Folglich sind in beiden Stichproben sowohl was die Geschlechter- und Genderdynamiken betrifft als auch bezüglich der Erklärungsansätze für diese Prozesse sehr unterschiedliche Ergebnisse zu verzeichnen. Die Befunde zeigen, wie stark Genderdynamiken je nach Zielsprache, Fächerwahlverhalten, Sprach‐ lernfolge und gesellschaftlichen Einflüssen schwanken können. 602 12 Interpretation der Ergebnisse 13 Einschränkungen und Grenzen Die Ergebnisse und Interpretationen der vorliegenden Studie haben neben dem beschriebenen Erkenntnisgewinn auch klaren Grenzen: An erster Stelle ist festzuhalten, dass sowohl die Französischals auch die Spanischstichprobe vergleichsweise klein sind und größere Stichproben zu repräsentativeren Er‐ gebnissen geführt hätten (vgl. Döring/ Bortz 2016: 298-299). Dennoch liegen beide Stichproben knapp unter 100, sodass zumindest ein erster Eindruck in die Genderdynamiken in den Fächern Französisch und Spanisch in einzelnen Gebieten des Regierungspräsidiums Tübingen gegeben werden konnte. Au‐ ßerdem wurde versucht über Poweranalysen mittels der Software G*Power stets die untere Grenze der Stichprobengröße abzusichern (Bortz/ Döring 2006: 736). Neben der Größe der Stichproben kann auch deren Zusammensetzung kritisch infrage gestellt werden: Wie bereits angemerkt, handelt es sich aufgrund der institutionellen Einschränkungen durch die sogenannten Gatekeepers in Form von Schlüsselpersonen und -institutionen (vgl. Grum/ Legutke 2016: 79) beim Sampling-Verfahren trotz der anfänglichen Intention der probabilistischen Stichprobenziehung zu einem gewissen Anteil auch um eine Selbstselektionss‐ tichprobe (vgl. Döring/ Bortz 2016: 294). Bezüglich der Spanischstichprobe muss außerdem angemerkt werden, dass ein unausgeglichener Anteil von Jungen und Mädchen vorliegt, was zwar durchaus repräsentativ für die Grundgesamtheit ist (vgl. Kapitel 8), aber für manche statistische Verfahren wie beispielsweise die zweifaktorielle Varianz‐ analyse keine optimale Grundvoraussetzung darstellt (vgl. Bühner/ Ziegler 2009: 391 ff.). Daher müssen insbesondere die Ergebnisse dieses Verfahrens mit ent‐ sprechender Vorsicht interpretiert werden. Der Einsatz der Tests d2-R (Brickenkamp et al. 2010) und SPM (Raven 2009) erlaubte einen aufschlussreichen Einblick in die kognitiven Grundfähigkeiten der Lernenden sowie in deren Einflüsse auf die einzelnen fremdsprachlichen Leistungen. Nicht erhoben wurden jedoch kognitive Fähigkeiten im Bereich der verbalen Intelligenz (vgl. z. B. Liepmann et al. 2007), welche eventuell noch genauere Aufschlüsse über die fremdsprachlichen Leistungen von Jungen und Mädchen gegeben hätten (vgl. López Rúa 2006). Auch eine Erhebung der Kom‐ petenzen in der Erstsprache Deutsch wäre in diesem Zusammenhang eventuell sinnvoll gewesen, da sich oftmals Parallelen zwischen den erstsprachlichen und den fremdsprachlichen Kompetenzen finden lassen (vgl. Fuchs 2013: 46). Ein Vorteil der vorliegenden Arbeit liegt indes darin, dass zahlreiche kommunikative Teilfertigkeiten in den Fremdsprachen erhoben wurden, welche detaillierte Auf‐ schlüsse über Stärken und Schwächen der untersuchten Geschlechtergruppen in Französisch und Spanisch geben. Dennoch wäre im Bereich der fremdsprach‐ lichen Leistungen zu erwägen gewesen, durch C-Tests vertiefte Einblicke in spezifische Wortschatz-, Grammatik- und Lesekompetenzen zu erhalten (vgl. Grotjahn 2010) und auch das Sprechen zu erheben. Tests bezüglich des Sprechens hätten eventuell auch in Französisch, ähnlich wie dies auch bei der DESI-Studie (vgl. DESI-Konsortium 2006, 2008) für Englisch der Fall war, höhere Kompetenzen bei den Jungen offenbart, auch weil die Studie von Fuchs (2013) bestätigt, dass sich Mädchen eher für die Fertigkeiten Lesen und Schreiben und Jungen eher für Sprechen und Hören interessieren. Da im Hörverstehen in Französisch keinerlei Geschlechterunterschiede gefunden wurden, wäre möglicherweise ein ähnliches Ergebnis für das Sprechen zustande gekommen. Daher sollten zukünftige Studien zum Themenkomplex Geschlecht und fremdsprachliche Kompetenz die Fertigkeit Sprechen genauer in den Blick nehmen und insbesondere, ähnlich wie in der DESI-Studie, die Teilbereiche Flüssigkeit, Aussprache und Satzbau näher analysieren (vgl. Nold/ Rossa 2008: 178). Die in der vorliegenden Studie verwendeten Testinstrumente sind außerdem lediglich teilweise standardisiert: Bei den eingesetzten kognitiven Tests d2-R und SPM und bei den Sprachtests in Französisch (vgl. Lenz/ Studer 2008a) handelt es sich um standardisierte Tests, während bei den Sprachtests in Spanisch le‐ diglich eine Adaptation eines standardisierten Tests angefertigt wurde. Obwohl die Adaptierung des Sprachtests für Spanisch mit größter Sorgfalt und auf Grundlage von wissenschaftlicher Fachliteratur (vgl. z. B. Instituto Cervantes 2007, 2016) vorgenommen wurde, können leichte Verzerrungseffekte nicht ausgeschlossen werden. Dennoch stellte dies im Rahmen der Möglichkeiten aufgrund des fehlenden identisch konzipierten Testmaterials für Französisch und Spanisch die beste Möglichkeit dar, um erste Erkenntnisse auf der Ebene des Sprachvergleichs zu erzielen. Bezüglich des Fragebogens wurden bereits einige Grenzen aufgezeigt (vgl. Kapitel 9.3.6): Eine größere, quantitativ angelegte Pilotierungsstudie, Subskalen die mehr als drei oder vier Items besitzen und eine leichte Reduktion der untersuchten Konstrukte hätten teilweise zu eindeutigeren Ergebnissen geführt. Beispielsweise wäre zu überlegen gewesen, entweder das Interesse am Fach oder aber die Einstellungen zur Zielkultur und nicht beide Konstrukte zu erfassen. Die Reliabilität der Skala zur instrumentellen Orientierung fiel darüber hinaus vergleichsweise gering aus, weshalb auch infrage gestellt werden sollte, inwiefern dieses Konstrukt in der 9. Jahrgangsstufe des Gymnasiums in den 604 13 Einschränkungen und Grenzen Fächern Französisch und Spanisch von Relevanz ist (vgl. Csizér/ Dörnyei 2005: 21; Dörnyei 1994a). Dennoch gaben die Ergebnisse dieser Skalen wesentliche Einblicke in die Wahrnehmung der Probandinnen und Probanden bezüglich des Nützlichkeitsaspekts der beiden Fremdsprachen. Bezüglich der Skalenbildung im Bereich der affektiven Faktoren besteht allerdings noch viel Forschungsbedarf, da die vorliegende Studie gezeigt hat, dass Items, die aus anderen Kulturkreisen und/ oder für die Zielsprache Englisch erarbeitet wurden, nur bedingt auf das Französische und Spanische im deut‐ schen Schulsystem übertragbar sind und dass die Anpassung, Überarbeitung und Erweiterung dieser Items einen wichtigen Bestandteil der Erforschung der Lernprozesse darstellt, den es nicht zu unterschätzen gilt. Insbesondere die Faktoranalysen der Skalen bezüglich der Fächer Französisch und Spanisch haben immer wieder deutlich gemacht, dass einzelne Items für Französisch hohe Faktorladungen aufweisen, für Spanisch aber nicht verwertbar sind und andersherum (vgl. Kapitel 9.3). Bezüglich der exogenen Faktoren kann darüber hinaus durchaus infrage‐ gestellt werden, ob die Erhebung der wahrgenommenen Erwartungen der Sozialisationsinstanzen ganauso valide und reliabel ist wie eine Erhebung der tatsächlichen Erwartungen der Sozialisationsinstanzen, welche sicherlich zu teils anderen Ergebnissen geführt hätte. Da zum einen aber im Erwar‐ tungs-mal-Wert-Modell von Eccles (2005: 106) deutlich wird, dass die Wahrneh‐ mung der Erwartungen für die Leistungsmotivation von größerer Relevanz ist als die Erwartungen selbst und zum anderen eine Fragebogenbefragung von den Eltern und den Lehrkräften, aber vor allem von den Peers der Schülerinnen und Schüler in der praktischen Ausführung höchst problematisch ist, hat sich diese Entscheidung als positiv für den Studienverlauf erwiesen. Obwohl für die einzelnen Fächer Französisch und Spanisch jeweils gewinn‐ bringende Ergebnisse gefunden wurden, muss angemerkt werden, dass diese nur eingeschränkt vergleichbar sind, da es sich, auch bedingt durch vorher stattgefundene Prozesse der Fächerwahl, um zwei unterschiedlich zusammen‐ gesetzte Stichproben handelt und um zwei unterschiedliche Zielsprachen mit unterschiedlichen formalen Schwierigkeiten, welche genuin unterschiedliche Lerngegenstände darstellen. Auch bezüglich der Sprachenfolge sind die beiden Stichproben nicht direkt vergleichbar, da sich die Lernenden des Französischen als zweiter Fremdsprache im vierten Lernjahr und die Lernenden des Spanischen als dritter Fremdsprache im zweiten Lernjahr befinden. Zudem muss berücksichtigt werden, dass die erhobenen Daten jeweils ein‐ zelne Momentaufnahmen darstellen und nicht etwa Teil einer Längsschnitt‐ studie sind. Sowohl fremdsprachliche Leistungen als auch endogene affektive 13 Einschränkungen und Grenzen 605 und exogene Faktoren können aber gerade in der Pubertät von starken Ent‐ wicklungen und Schwankungen geprägt sein (vgl. Dörnyei 2001, 2005; Fuchs 2013: 325). Um dennoch aussagekräftige Daten von unterschiedlichen Schulen zu erlangen, wurde bereits bei der Planung der Studie darauf Wert gelegt, auf motivationale Variablen, die verschiedenen Lernsituationen gemein sind, zurückzugreifen. Situationsspezifische Motive, die im näheren Lernumfeld anzusiedeln sind, wurden bewusst nicht miteinbezogen, auch weil die beiden untersuchten Stichproben aus unterschiedlichen Lernkontexten stammen. Den‐ noch bleibt aufgrund des querschnittlichen Designs offen, inwiefern zu einem späteren Zeitpunkt, beispielsweise am Ende von Jahrgangsstufe 10 ein ausge‐ glicheneres Ergebnis zustande gekommen wäre. Budde (2008: 21) argumentiert nämlich, dass der geschlechtsspezifische Lernzuwachs unterschiedlich schnell vonstattengeht und der Kompetenzzuwachs der Jungen etwas länger dauert, die geschlechtsspezifischen Unterschiede aber mit zunehmendem Alter ver‐ schwinden. Meißner et al. (2008: 158) sind außerdem davon überzeugt, dass sich diese Entwicklungsverläufe auch auf die zweite Fremdsprache Französisch übertragen lassen, wobei es möglich wäre, dass der Effekt des Verschwindens des Unterschieds sogar deutlich später auftreten könnte als im Englischen als erste Fremdsprache und womöglich die Zäsur nach der 10. Jahrgangsstufe, nach der Französisch abgewählt werden kann, den Prozess des Ausgleichs der Kompetenzniveaus vorzeitig beenden könnte. Ob dies aber wirklich zutrifft, könnte wie gesagt nur eine Längsschnittstudie belegen. Die von Budde (2008) und Meißner et al. (2008) beschriebenen etwas versetzten Entwicklungsverläufe von Mädchen und Jungen könnten des Weiteren auch im Zusammenhang mit neurologischen Erklärungsansätzen betrachtet werden, nach denen die Myelinisierung der Sprachzentren des Gehirns bei Jungen später erfolgt als bei Mädchen (vgl. Macintyre 2009; Seeman 2013: 1245), wobei mit der schnelleren Myelinisierung der Mädchen von manchen Forschenden vor allem Vorteile in der Lese- und Schreibkompetenz bis circa zum 18. Lebensjahr in Verbindung gebracht werden (vgl. Böttger 2016: 93-94). Jedoch warnen Aslin und Schlaggar (2006) sowie Chiang et al. (2009), wie bereits erläutert, vor einer Überbewertung der Myeliniserung, da diese nur einen kleinen Teil der Sprachentwicklung des Gehirns darstelle. Westerhoff (2008) hinterfragt in diesem Zusammenhang auch, inwiefern überhaupt direkte Rückschlüsse von neuronalen Prozessen zu fremdsprachlichen schulischen Leistungen möglich sind. Aus diesen Gründen wurden auch in der vorliegenden Studie keine Rückschlüsse auf neuronale Prozesse angestrebt. Um eine Kontinuität zu bereits stattgefundenen Studien und ein möglichst hohes Maß an Replizierbarkeit herzustellen, wurden Ergebnisse aus bisherigen 606 13 Einschränkungen und Grenzen Studien sowohl bezüglich der Erhebung als auch bezüglich der Auswertung der Daten so stark wie möglich berücksichtigt, weshalb viele Vergleiche zu Befunden der Geschlechterforschung möglich waren. Dennoch stellt auch die vorliegende Studie keine Replikation einer bereits stattgefundenen Studie und auch keine Metastudie dar, weshalb die Kritik von Aries (1996) durchaus ihre Berechtigung findet: If we place emphasis on statistical significance, on single studies without replication, on the behavior of individuals with extreme scores, we find many gender differences. If we place emphasis on the magnitude of results, on the replicability of results, or on the percentage of variance in behavior accounted for by sex, gender differences appear to be more minimal and much more variable in their appearance. (Aries 1996: 11) Abschließend soll festgehalten, dass die Ergebnisse der vorliegenden Studie einige Aufschlüsse über die Vielschichtigkeit der interdependenten und inter‐ sektionalen Lernervariablen Geschlecht und Gender bieten. Um aber noch ge‐ nauere Abhängigkeitsverhältnisse zwischen den Variablen zu ermitteln, müsste neben der Ziehung einer deutlich größeren Stichprobe und der Erfassung einer weniger hohen Anzahl an untersuchten Variablen auch ein Strukturglei‐ chungsmodell (vgl. Rumlich 2016) berechnet werden. Dies war aufgrund der relativ geringen Teilnehmerzahl und der Vielfalt der erhobenen Daten im vorlie‐ genden Kontext nicht möglich. Aus forschungsmethodischer Perspektive würde außerdem ein triangulativer Ansatz, der quantitative Verfahren mit qualitativen Erhebungen kombiniert (vgl. Kissau 2006a) eventuell noch tiefgründigere Auf‐ schlüsse über Ursachen und Erklärungsansätze von Gemeinsamkeiten und Unterschieden von Mädchen und Jungen in bei der fremdsprachlichen Leistung geben. 13 Einschränkungen und Grenzen 607 272 Mädchenprodukte werden oft als „sauberer“, als sorgfältiger und zügiger erstellt wahr‐ genommen. Dadurch werden sie unabhängig vom Inhalt und übrigens auch unabhängig vom Geschlecht der Lehrkraft leicht besser eingeschätzt als die Arbeitsprodukte von Jungen (vgl. Braun/ Schwemer 2013: 5) 14 Didaktische Implikationen Insbesondere für das Fach Französisch hat die vorliegende Studie gezeigt, dass Maßnahmen notwendig sind, um ein ausgeglicheneres Leistungsverhältnis zwischen den Geschlechtergruppen herzustellen. Daher werden im Folgenden Methoden des gendersensiblen Französischunterrichts vorgestellt und reflek‐ tiert. Es sei festgehalten, dass die vorgeschlagenen Maßnahmen keinesfalls auf dem Unterricht einzelner an der Studie beteiligter Lehrkräfte basieren, sondern sie stellen vielmehr eine Aufarbeitung des Stands der Forschung sowie eine Reflexion zu den Lernendenergebnissen der vorliegenden Studie dar. Auf Basis der schwächeren Leistungen der Jungen in den Französischtests muss die Frage gestellt werden, wie Jungen erfolgreicher an das Französische herangeführt werden können. Ein erstes grundlegendes Ziel aller Lehrkräfte sollte daher darin bestehen, zu versuchen, sich des gender stereotyping bewusst zu werden und eine verbesserte gender awareness zu erlangen. Dieses Anliegen ist insbesondere vor dem Hintergrund der in der vorliegenden Studie je nach Geschlechtergruppe stark unterschiedlich wirkenden wahrgenommenen Auf‐ merksamkeitsverteilung zugunsten der Mädchen im Fach Französisch von großer Bedeutung. Braun und Schwemer (2013) schlagen daher vor, Lehrkräfte mit konkreten Fragen zu konfrontieren, die die Selbstreflexion anregen: 1. „Wie sehe ich meine eigene Gender-Rolle? “ 2. „Wie nehme ich Jungen und Mädchen in der Schule wahr? “ 3. „Welche Rolle weise ich Jungen und Mädchen in meinem Unterricht zu? “ 4. „Welche Rollenbilder projiziere ich auf Schülerinnen und Schüler? “ 5. „Wie bewerte ich die Arbeitsprodukte von Mädchen bzw. Jungen? “ (vgl. Braun/ Schwemer 2013: 5) 272 6. „Mache ich Unterschiede in der Zuwendung gegenüber oder Ansprache von Mädchen und Jungen? “ (vgl. Bonin 2009: 22) Abgesehen von der Selbstreflektion zu diesen Fragen sollten auch Videoauf‐ nahmen des eigenen Unterrichts gemacht werden, welche anschließend von den Lehrkräften selbst analysiert werden. Wichtig erscheint dabei, dass die Lehrkraft reflektiert, inwieweit ihre eigene Gender-Identität und ihre Sensibilität für diese 273 Die genannten Fragen sind außerdem auf andere Diversitätsaxiome wie Ethnie und Religion übertragbar und können daher auch in anderen Zusammenhängen des stere‐ otyping hilfreich sein. Fragen ihr eigenes und das Verhalten der Schülerinnen und Schüler beeinflussen (vgl. Bonin 2009: 22). Auch Hospitationen durch andere Lehrkräfte und eine anschließende kritische Diskussion der Fragestellungen können dazu beitragen, gender sterotyping bewusst zu machen und in Zukunft zu vermeiden. 273 Konkretere Maßnahmen während des Unterrichts sind vor allem im Be‐ reich der Binnendifferenzierung und Individualisierung anzusiedeln und zielen darauf ab, die Fähigkeiten, Fertigkeiten und Interessensgebiete aller Schüle‐ rinnen und Schüler im selben Maße anzusprechen und den Unterricht für alle Schülerinnen und Schüler attraktiv und motivierend zu gestalten. Dies ist vor dem Hintergrund der in der vorliegenden Studie gemessenen eher niedrigen Motivation beider Geschlechtergruppen ein zentrales Anliegen. Ein wichtiges Ziel sollte dabei sein, weder Jungen noch Mädchen im Unterricht zu vernachlässigen bzw. zu bevorzugen und zu berücksichtigen, dass nicht immer jedes Individuum den Eigenschaften, den Jungen und Mädchen jeweils stereotyp zugeschrieben werden, entspricht. Die bisherige Forschung (vgl. z. B. Schmenk 2009: 5) und auch die vorliegende Studie haben nämlich gezeigt, dass Mädchen und Jungen individuell stark unterschiedliche Leistungsstärken, Eigenschaften und Interessensgebiete besitzen. Ein methodischer Ansatz, der in diesem Zusammenhang von Praxisrelevanz ist, nennt sich „implizite Jungenförderung“ nach Bonin (2009). Damit ist ge‐ meint, dass die Jungen im Unterricht nicht zu stark und zu offensichtlich fokussiert und die Mädchen in keiner Weise vernachlässigt werden, sondern dass vielmehr ganz bewusst ein didaktisch-methodisches Gleichgewicht zwi‐ schen Mädchen- und Jungenförderung geschaffen wird, welches sich stark an den einzelnen Individuen und weniger an der Kategorisierung in die beiden Geschlechtergruppen orientiert. Teil davon ist zum Beispiel die ausgeglichene Repräsentation männlicher Protagonisten und weiblicher Protagonistinnen in Lehrbüchern, Lektüren und insgesamt in allen ausgewählten Unterrichts‐ medien. Bereits bei Informationsveranstaltungen zur Präsentation des Fran‐ zösischunterrichts, d. h. bevor dieser einsetzt, sollten daher gleichermaßen Jungen und Mädchen einbezogen werden (vgl. Braun/ Schwemer 2013: 6). Übergreifendes Ziel sollte es also sein, für alle Schülerinnen und Schüler Identifikationspotenziale im fremdsprachlichen Unterricht zu schaffen sowie vielfältige Geschlechterrollenmodelle anzubieten, die nicht den üblichen Ge‐ schlechterklischees entsprechen. Zentrale Rollenmodelle wären vor allem das des sprachgewandten mehrsprachigen Mannes und das der sprachgewandten 610 14 Didaktische Implikationen mehrsprachigen Frau (vgl. Bonin 2009: 22). Auch die Thematisierung von Geschlechterstereotypen im Unterricht, das heißt von Gender im Lehrwerk, in Zeitschriften, in der Werbung, in Film und Fernsehen kann zum Aufbrechen von Geschlechterstereotypen beitragen, da die Schülerinnen und Schüler dadurch lernen, dass es unterschiedliche Auffassungen und Images von Männlichkeit und Weiblichkeit gibt. In diesem Zusammenhang bietet es sich im Fremdspra‐ chenunterricht an, die Kulturgebundenheit von Gender bewusst zu machen und beispielsweise über die Bedeutung der Familie, die Ausgestaltung der Vater- und Mutterrolle, Schönheitsideale von Männern und Frauen oder Höflichkeits- und Umgangsformen zwischen Männern und Frauen im deutschsprachigen und im frankophonen Kulturraum zu diskutieren. Die Rolle des Fremsprachenlernens kann dabei beispielsweise auch im Rahmen einer Sequenz zu (traditionellen bzw. klischeehaften) Männer- und Frauenberufen und -fächern, gegebenenfalls auch zu unterschiedlichen Epochen und in verschiedenen Kulturen diskutiert werden (vgl. Schmenk 2009: 7). Diskussionen darüber, woher solche tradierten Auffas‐ sungen kommen sowie welche Alternativen es dazu gibt und geben könnte, verhelfen möglicherweise dazu, auch aktuelle Stereotype in Sachen Fremdspra‐ chenlernen zu thematisieren und der kritischen Reflexion zugänglicher zu machen. Dass Französisch und andere Sprachen nicht per se „Frauensache“ sind, könnte so vielleicht im Unterricht als Alltagsmythos entlarvt werden. Ein weiterer Aspekt der impliziten Jungenförderung ist außerdem eine erhöhte Förderung der Lesekompetenz und der Lesemotivation (vgl. Grüne‐ wald-Huber 2011: 443; Braun/ Schwemer 2013: 3; Budde 2011: 103 f.). Dabei sollte auf eine große Vielfalt an Texten wertgelegt werden und insbesondere Genres und Textarten sollten gelesen werden, die sich in der Forschung als oftmals von Jungen bevorzugt erwiesen haben. Darunter fallen Science-Fiction, Fantasy- und Abenteuergeschichten, Helden- oder Bandengeschichten, BDs und andere Bild-Schrift-Kombinationen, Sachtexte, Infografiken oder auch digitale Textformate (vgl. Besser 2012). Der gezielte Einsatz neuer Medien kann den Fremdsprachenunterricht nicht nur im Literaturunterricht, sondern auch dar‐ über hinaus sowohl für Jungen als auch für Mädchen motivierender gestalten, da insbesondere Jungen gerne mithilfe von Computerlernprogrammen und Computerlernspielen Fremdsprachen erwerben (vgl. Bonin 2009) und neue Medien Teil der Lebenswelt der Jugendlichen sind. Im Literaturunterricht selbst scheint es zudem zentral, von Anfang an authentische Texte zu lesen, um die Frustrationstoleranz zu erhöhen und gleichzeitig Erfolgserlebnisse zu ermöglichen, die didaktisierte Lektionstexte nicht im selben Maße bieten (vgl. Nieweler 2017). 14 Didaktische Implikationen 611 Auch ein stark handlungsorientierter Unterricht trägt zur Gendersensibilität bei, da bezüglich der Auswahl der Aufgaben und der zu bearbeitenden Themen stark variiert werden kann, was zu einer erhöhten Lernerautonomie und zu einem kompetenteren Umgang mit Lernstrategien beiträgt. Bezüglich der Lernstrategien ist es außerdem sinnvoll, die Selbstwirksamkeit zu steigern, indem interkomprehensionsdidaktische Ansätze eingesetzt werden, bei denen beispielsweise das Verständnis eines französischen Zeitungsartikels durch die Anwendung sprachlichen Wissens aller den Schülerinnen und Schülern be‐ kannten Sprachen sowie durch die Anwendung von Erschließungsstrategien die Motivation gesteigert werden kann (vgl. Bonin 2009: 21). Dabei ist es wichtig, keine Konkurrenz zu anderen Schulsprachen aufzubauen, sondern vielmehr Synergieeffekte und Transferbasen zu nutzen. Der Nützlichkeitsaspekt des Französischen kann auch dadurch stärker betont werden, dass auf seine Funktion als sogenannte Brückensprache für die Romania (vgl. Braun/ Schweber 2013: 8; Nieweler 2017: 32) aufmerksam gemacht wird: Mithilfe von Französisch‐ kenntnissen können schriftliche Texte, die in anderen romanischen Sprachen verfasst sind, relativ gut verstanden werden, da darin sehr viele Transferbasen enthalten sind: 82% der Lexeme des spanischen und 86% des italienischen Grundwortschatzes sind mit dem Französischen verwandt und auch auf der Ebene der Grammatik gibt es viele Gemeinsamkeiten, was auch im Schreibtest der vorliegenden Studie deutlich wurde. Somit stellt das Ziel der rezeptiven Mehrsprachigkeit eine ausgezeichnete Ergänzung zum Erwerb des Englischen als lingua franca dar. Bezüglich des Englischen sei außerdem noch hervorzu‐ heben, dass 70% des französischen Grundwortschatzes für das Erschließen des englischen Grundwortschatzes genutzt werden können, sodass der Erwerb des Französischen auch zu einer Leistungssteigerung in Englisch beitragen kann - ein Potential, dass laut Nieweler (2017: 32) noch nicht ausreichend genutzt wird und die Jugendlichen zusätzlich motivieren könnte. Braun, Schwemer (2013) und Bonin (2009) schlagen außerdem vor, während der Adoleszenz einzelne monoedukative Gruppenarbeiten durchzuführen, bei‐ spielsweise bei Aussprache- und Kommunikationsübungen, wobei auch hier die Technikaffinität der Jugendlichen genutzt werden kann und dies mit der Arbeit mit Podcasts und Diktiergeräten in Smartphones verknüpft werden kann. Unter Berücksichtigung der Ergebnisse der vorliegenden Studie in Morphosyntax und grammatischer Orthographie im Schreibtest, die bei den Jungen signifikant schwächer ausfielen als bei den Mädchen, konnte durch Regressionsanalysen statistisch nachgewiesen werden, dass die L3-Angst einen signifikanten nega‐ tiven Einfluss auf die Leistung der Jungen ausübte. Im Umkehrschluss bedeutet dies, dass spezifisch für die Jungen didaktische Überlegungen angestellt werden 612 14 Didaktische Implikationen müssten, wie sie im Bereich Morphosyntax und grammatische Orthographie gefördert werden können sowie gleichzeitig die Angst, Fehler in diesem Bereich zu machen, überwunden werden könnte; auch zu diesem Ziel könnten eventuell monoedukative Maßnahmen beitragen, um geschützte Räume für Grammati‐ kübungen zu schaffen (vgl. Bonin 2009: 21); außerdem könnte, wie Helmke et al. (2008) vorschlagen, darüber hinaus ein noch stärkerer Schwerpunkt auf eine positive Fehlerkultur im Französischunterricht gelegt werden, um im Allgemeinen die Angst vor Fehlern zu reduzieren. Bonin (2009: 20) schlägt außerdem vor, die bei Jungen bereits ausgeprägte, auf den Beruf bzw. den sozialen Kontext bezogene Motivation verstärkt für das Französischlernen zu nutzen und zum einen den Prestigegewinn durch die Französischkenntnisse hervorzuheben, indem beispielsweise Erfolgserlebnisse praktischer und berufsbezogenener Natur geschaffen werden, wie das erfolg‐ reiche Sprachmitteln für Mitschülerinnen und Mitschüler im Supermarkt, das gute Ankommen vor Freunden, dadurch, dass sie mit ihren Französischkennt‐ nissen auf dem französischen Zeltplatz beeindrucken können. Dieser Ansatz ist aufgrund der Ergebnisse der vorliegenden Studie allerdings kritisch zu sehen, da die Peers der Jungen sich oftmals als negativer Prädiktor für deren fremdsprachliche Leistung gezeigt haben. Dennoch können ein hohes Maß an Aktualität, Aufgabenorientierung, Alltagstauglichkeit und Realitätsbezug sowie das Schaffen konkreter Begegnungssituationen im Rahmen von Klas‐ senaustauschen oder E-Mail-Projekten dazu beitragen, die Jugendlichen zum Französischlernen zu motivieren. Sinnvoll könnte es darüber hinaus sein, die Bedeutung des Französischen für das Wirtschafts- und Berufsleben stärker hervorzuheben und auf deutsch-französische Wirtschaftspartner wie EADS und Airbus oder auch deutsch-französische Medien wie ARTE verstärkt aufmerksam zu machen. Schließlich sollte der Unterricht den unterschiedlichen Interessen innerhalb der Klasse gerecht werden und auch in diesem Bereich binnendifferenzierende Maßnahmen anbieten. Dabei können die Lehrkräfte zum einen darauf achten, zu gleichen Teilen Inhalte zu thematisieren, die aus traditionellen Mädchen- und Jungendomänen stammen. Als traditionelle Mädchendomänen wären Mode, Kosmetik, Sport (Tanzen, Reiten), Kultur und Literatur zu nennen, während unter traditionellen Jungendomänen Themen wie Sport (Fußball, Rugby, Tour de France, Extremsportarten), Comics, Musik (Rap, Hip Hop), Technik und Politik zu nennen sind (vgl. Bonin 2009). Da aber auch die vorliegende Studie mehrfach gezeigt hat, dass die traditionellen Mädchen- und Jungendomänen oftmals nicht den einzelnen Individuen zuzuschreiben sind, wäre es zielführender, ähnlich wie in der vorliegenden Studie, eine Umfrage zu individuellen Interessen am Anfang 14 Didaktische Implikationen 613 des Schuljahrs durchzuführen und diese dann immer wieder zu berücksichtigen. Gleichzeitig sollte es ein Anliegen der Lehrkraft sein, neue, noch unbekannte Themen motivierend zu präsentieren, insbesondere was die fremdkulturellen Inhalte sowie das Wissen über die Frankophonie betrifft. Der Schreibtest der vorliegenden Studie hat des Weiteren gezeigt, dass Jungen öfter von den strengen Vorgaben der Schreibaufgaben abweichen und Themen erwähnen, nach denen nicht gefragt ist: Beispielsweise erzählten die Jungen von ihren Lieblingsfußball- (vgl. Fall 016) oder -basketballspielern (vgl. Fall 063). Daher wäre zu überlegen, auch bei Klassenarbeiten Aufgaben anzubieten, bei denen die Themen etwas freier wählbar sind. Gerade bei informellen Evaluationsinst‐ rumenten scheint es durchaus möglich, hin und wieder thematische Freiräume zu lassen. Inwiefern die oben genannten Maßnahmen des gendersensiblen Unterrichts bezüglich der fremdsprachlichen Leistung im Französischen tatsächlich positive Effekte erzielen und zu ausgeglicheneren Ergebnissen führen, bleibt in der vorliegenden Studie jedoch offen und müsste in weiteren quasi-experimentellen Forschungsarbeiten untersucht werden. 614 14 Didaktische Implikationen 15 Fazit Die vorliegende Studie erbringt für Französisch und Spanisch in vielerlei Hinsicht unterschiedliche Ergebnisse bezüglich der Variablen Geschlecht und Gender: Während die Mädchen in Französisch tendenziell höhere fremdsprach‐ liche Kompetenzen aufweisen als die Jungen, wobei der Geschlechterunter‐ schied im Gesamtergebnis signifikant ist, weisen in Spanisch die Jungen leichte, aber nicht signifikante Leistungsvorteile gegenüber den Mädchen auf. Nicht nur bezüglich des fremdsprachlichen Gesamtergebnisses, sondern auch bezüg‐ lich der einzelnen Teilfertigkeiten Hörverstehen, Leseverstehen und Schreiben werden in den beiden romanischen Fremdsprachen unterschiedliche Ergebnisse gemessen: In Französisch findet sich der stärkste Geschlechterunterschied zugunsten der Mädchen in der Schreibfertigkeit, ähnlich wie dies auch bei der DESI-Studie der Fall war (vgl. Nold/ Rossa 2008). Hingegen schneiden die Jungen und die Mädchen im Hörverstehen in Französisch vergleichbar ab. Im Gegensatz dazu werden in Spanisch die stärksten Geschlechterunterschiede beim Hörverstehen sichtbar, wobei diese zugunsten der Jungen ausfallen, während beide Geschlechtergruppen im Schreiben vergleichbare Ergebnisse erzielen. Die in Französisch gefundenen Geschlechterunterschiede zugunsten der Mädchen ähneln den Befunden vorhergegangener Studien in dieser Altersstufe, wie zum Beispiel denen der Ländervergleichsstudie (vgl. Winkelmann/ Groene‐ veld 2010), wohingegen die Spanischergebnisse andere Dynamiken vorweisen, die wenig vergleichbar mit bisherigen Studien zu den Zielsprachen Englisch oder Französisch sind. Daher konnten durch die vorliegende Studie insbeson‐ dere für Spanisch, aber auch für Französisch, neue Einblicke in die Wirkungen der Variablen Gender und Geschlecht gewonnen werden, die es nun durch weitere Untersuchungen zu erhärten oder zu revidieren gilt. Besonders der Vergleich der beiden Fächer und damit der zwei unterschiedli‐ chen romanischen Zielsprachen zeigt, dass es bei der interdependenten Variable Geschlecht vonnöten ist, im Sinne der Intersektionalität weitere Ausdifferen‐ zierungen vorzunehmen, der jeweiligen Zielsprache mehr Gewicht zu verleihen und das Geschlecht der Fremdsprachenlernenden in Interaktion mit den Inter‐ sektionalitätsaxiomen zu untersuchen (vgl. Kapitel 11.6). So zeigt sich zum Beispiel in Französisch, dass die mehrsprachigen Jungen tendenziell schwächere fremdsprachliche Leistungen erzielen als die mehrsprachigen Mädchen, wobei die signifikant negative Korrelation des sprachlichen Hintergrunds der Jungen mit der Länge des Auslandsaufenthalts darauf hindeutet, dass die familiären und institutionellen Voraussetzungen, unter denen die mehrsprachigen Jungen Französisch lernen, nicht besonders lernförderlich sind. In Spanisch hingegen wurde ein ausgeglichenes Verhältnis der Jungen und Mädchen in Interaktion mit dem sprachlichen Hintergrund gefunden, was auf eine bessere Chancengleich‐ heit in diesem Schulfach hindeutet. Ein weiteres Ergebnis in Französisch ist, dass die Geschlechterunterschiede mit steigendem sozioökonomischem Status stetig zunehmen, sodass hier Ansätze einer intersektionalen Wirkung erkennbar sind, während in Spanisch das überraschende Ergebnis erzielt wird, dass die Jungen mit niedrigem sozioökonomischem Status im durchschnittlichen Ge‐ samtergebnis am höchsten abschneiden. Obwohl dieses Ergebnis aufgrund der geringen Stichprobengröße zufällig entstanden sein könnte, kann eventuell auch davon ausgegangen werden, dass die Jungen mit niedrigem sozioökono‐ mischem Status in Spanisch vom gegebenen Lernumfeld besonders profitieren und dass diese Merkmalsgruppe die Wichtigkeit der Weltsprache Spanisch für ihre weitere berufliche Karriere besonders im Blick hat. Ein weiteres interessantes Ergebnis ist, dass die Leistungen der Jungen insbesondere im Französischen stärker von den kognitiven Grundfertigkeiten abhängen als die Leistungen der Mädchen, bei denen die affektiven Faktoren eine eindeutig wichtigere Rolle spielen. Dies deutet darauf hin, dass die Jungen tendenziell weniger aus einer affektiven Bindung an das Fach Französisch heraus sondern eher auf Grundlage ihrer kognitiven Fertigkeiten entsprechende Französischleistungen erzielen. Außerdem ist bemerkenswert, dass sich die kognitiven Grundfähigkeiten insgesamt für das Französische als zentrale Leis‐ tungsprädiktoren erwiesen haben, während sie für die Spanischleistung nur wenig Prädiktorstärke zeigten. Dieses Ergebnis ist als Diskussionsbeitrag zur Frage zu interpretieren, inwiefern es sich beim Französischen tatsächlich um eine „schwer zu erlernende“ Sprache handelt, eine Frage, die nach dem vorlie‐ genden Ergebnis durchaus affirmativ zu beantworten ist. Neben der Messung der Interaktionen mit den Intersektionalitätsaxiomen und der Wirkung der kognitiven Grundfertigkeiten wurde deutlich, wie wichtig die Erhebung endogener affektiver und exogener Variablen ist, um die Erfor‐ schung von Erklärungsansätzen für Geschlechterunterschiede in den fremd‐ sprachlichen Leistungen voranzutreiben. Die Befunde bezüglich der affektiven Faktoren zeigen, dass im Französischen bei beiden Geschlechtergruppen insgesamt eher niedrige motivationale und attitudinale Werte gemessen wurden und dass ausschließlich beim Interesse am Fach Französisch ein signifikanter Unterschied zugunsten der Mädchen besteht. Die Spanischlernenden erreichen hingegen insgesamt deutlich höhere 616 15 Fazit Werte bei den affektiven Faktoren, was zeigt, dass sie deutlich motivierter und interessierter sind, als das bei den Französischlernenden der Fall ist. Darüber hinaus wird in Spanisch bei den affektiven Faktoren lediglich ein signifikanter Geschlechterunterschied, und zwar zugunsten der Mädchen, bei den Einstellungen zur spanischen Zielkultur gemessen, sich letztere aber als nicht als zentrale Prädiktoren für die Spanischleistung erwiesen. Die Erhebung der wahrgenommenen exogenen Faktoren führte ebenfalls zu interessanten Ergebnissen, da zwar weder in Französisch noch in Spanisch signifikante Geschlechterunterschiede auftreten, aber die Wirkung auf die Leistungen stark unterschiedlich ausfallen. Somit wird deutlich erkennbar, dass die wahrgenommene Aufmerksamkeitsverteilung der Französischlehrkräfte zu‐ gunsten der Mädchen, die wahrgenommene Unterstützung der Französischlehr‐ kraft und die wahrgenommenen Erwartungen der Peers insbesondere auf die Französischleistungen der Jungen recht starke negative Einflüsse haben, was auf einen negativen Einfluss des spezifischen Bildungssystems (vgl. Driessen/ VanLangen 2013) und des sozialen Kontexts der Jungen hindeutet. Self-fulfilling prophecies (vgl Boyle 1987: 274) scheinen in dem Sinne zu wirken, dass sich ge‐ nderstereotype Erwartungshaltungen der Lehrkräfte und Peers eher negativ auf die Französischleistungen der Jungen und eher positiv auf die Französischleis‐ tungen der Mädchen auswirken. Somit reproduziert sich leider das Ergebnis des Französischen als „Mädchenfachs“, weshalb es angebracht scheint, einige didaktische Implikationen für einen gendersensiblen Französischunterricht abzuleiten (vgl. Kapitel 14). Die Diskriminanzanalyse hat schließlich noch gezeigt, dass überraschen‐ derweise die wahrgenommenen Erwartungen der Eltern denjenigen Faktor darstellt, der die höchste Prädiktorstärke für das Geschlecht innerhalb der Französischstichprobe aufweist, in dem Sinne, dass die Eltern den Jungen relativ hohe Leistungserwartungen in Französisch vermitteln und dies als starkes distinktives Merkmal im Vergleich zu der Gruppe der Mädchen wirkt. Im Gegensatz zu den Lehrkräften und Peers scheinen also die Eltern der männlichen Französischlernenden keine genderstereotypen Erwartungen an ihre Sprösslinge weiterzugeben, was ein überraschendes und optimistisch stimmendes Ergebnis der vorliegenden Studie darstellt. Somit ist es scheinbar der Sozialisationsinstanz der Eltern bereits gelungen, gängige Genderstereotype zu überwinden, was sich laut der Regressionsanalysen auch positiv auf die Leistungen der Jungen auswirkt. In Spanisch hingegen offenbart die Diskriminanzanalyse keinen exogenen Faktor, sondern das SFS Selbstkonzept als Prädiktor mit der höchsten Vorher‐ sagekraft für das Geschlecht, wobei das SFS Selbstkonzept in den Regressions‐ 15 Fazit 617 analysen gleichzeitig auch als wichtigsten Prädiktor für die Spanischleistung errechnet wurde (vgl. Kapitel 11.11). Dadurch wird ersichtlich, dass im Fach Spanisch im Gegensatz zum Fach Französisch kaum Tradierungen von genders‐ tereotypen Erwartungen messbar sind, sondern vielmehr affektiv-motivationale Faktoren die fremdsprachliche Leistung bestimmen. Folglich konnte in der vorliegenden Studie deutlich illustriert werden, dass bei dem Forschungsgegenstand „Geschlecht und fremdsprachliche Leistung“ sowohl eine alleinige Konzentration auf kognitive und neuronale Faktoren (vgl. Böttger 2016; Böttger/ Sambanis 2017) als auch eine alleinige Erfassung affektiver Faktoren (vgl. Fuchs 2013) zu kurz greifen und vielmehr möglichst alle relevanten Faktoren in ihrer Kombination betrachtet werden müssen. Allerdings wurde auch ersichtlich, dass der Erfassung einer solchen multiplen Faktorenkomplexion bezüglich der Variablen Geschlecht und Gender durchaus Grenzen gesetzt sind, die vor allem auf der herausfordernden Abwägung zwischen der Stichprobengröße und der Anzahl der zu erhebenden Faktoren be‐ ruhen. Auch in der vorliegenden Studie wäre es unter Umständen zielführender gewesen, insgesamt weniger Faktoren zu erheben, um durch eine weniger feingliedrige Kategorisierung klarere Ergebnisse zu erzielen. Daher besteht bezüglich der begründeten Auswahl der entsprechenden Untersuchungsgegen‐ stände zur Erfassung von Genderdynamiken im Bereich des schulischen Fremd‐ sprachenlernens und bezüglich der Bestimmung geeigneter Forschungsdesigns nach wie vor großer Forschungsbedarf. Auch in anderen Bereichen lässt die vorliegende Studie noch Fragen offen. Beispielsweise wurden Schulnoten bewusst aus der Studie ausgeschlossen. Eine interessante Fragestellung wäre jedoch, inwiefern die von den Lehrkräften erteilten Schulnoten, welche unter Umständen teilweise auf Aspekte zurück‐ zuführen sind, die nicht direkt mit der fremdsprachlichen Leistung zusammen‐ hängen, sondern das Verhalten im Unterricht oder auch die Sauberkeit der Schrift betreffen (vgl. Schmenk 2002), auch eine motivationale bzw. demotiva‐ tionale Wirkung auf das Lernverhalten und dementsprechend auf den Sprach‐ lernerfolg der Schülerinnen und Schüler haben. Auch die Fertigkeit Sprechen, die in der DESI-Studie als von den Jungen dominiert erfasst wurde, konnte in der vorliegenden Studie nicht erhoben werden. Eine wichtige Fragestellung wäre in diesem Zusammenhang, inwiefern eventuell im Falle des Französischen eine oftmals eher als „weiblich“ klingend bewertete Sprache von Jungen schlechter ausgesprochen wird als von Mädchen, das heißt welche Rolle die Phonetik bezüglich der stereotypen Wahrnehmung des Französischen als „weiblich“ einnimmt (vgl. Grein 2011) und inwiefern sich diese gegebenenfalls auf die Imitationsleistung von Mädchen und Jungen aus‐ 618 15 Fazit wirken, zumal in der Literatur häufig ein Zusammenhang zwischen Aussprache und Selbstbild bzw. Identität postuliert wird (vgl. Abel 2018: 51-59; Moyer 2014; Segalowitz et al. 2011). Auf einem höheren Abstraktionsniveau bleibt die Frage offen, bis zu welchem Grad Prozesse des Doing Gender überhaupt anhand statistischer Verfahren nachgewiesen und auf eine gesamte Stichprobe bezogen werden können, auch wenn zahlreiche endogene und exogene Variablen erhoben werden. Es ist offensichtlich, dass durch quantitative Verfahren nur allgemeine Tendenzen des Doing Gender, nicht jedoch individuelle psychologische Prozesse nachvollzogen werden können. Um diese zu erfassen müssten qualitative Verfahren oder aber mixed-method-Designs eingesetzt werden. Es steht nach dieser Studie dennoch fest, dass auch in Bezug auf die Ado‐ leszenz nicht pauschal behauptet werden kann, dass Mädchen Jungen in der fremdsprachlichen Kompetenz generell überlegen seien (vgl. z. B. Börsch 1982), wie dies Schmenk (2002) bereits in ihrer Metastudie begründet anzweifelte. Dichotome Zuweisungen greifen augenscheinlich zu kurz. Vielmehr bestätigt sich, auch aufgrund der Tatsache, dass in der vorliegenden Studie die Prädik‐ torstärke der Variable Geschlecht in den durchgeführten Regressionsanalysen bei Hinzunahme weiterer Prädiktoren immer weiter abnimmt (vgl. Kapitel 11.9), dass das biologische Geschlecht, wenn überhaupt, nur zu einem sehr geringen Anteil für Leistungsunterschiede verantwortlich ist. Es erhärtet sich die These, dass ein Netzwerk aus Variablen, die mit dem Geschlecht in einer wechselseitigen Beziehung stehen, kontextabhängig wirkt (vgl. Kapitel 6). Neben der Abhängigkeit der fremdsprachlichen Leistungen von den kognitiven Grundvoraussetzungen, den endogenen affektiven Faktoren, den exogenen Faktoren, dem sprachlichem Hintergrund und dem sozioökonomischem Status scheinen die fremdsprachlichen Leistungen von Jungen und Mädchen auch von den makrostrukturellen soziokulturellen Gegebenheiten wie beispielsweise gesellschaftlich verbreiteten Genderstereotypen, sozial definierten Geschlech‐ terrollen und tradierten Sprachimages beeinflusst zu werden. Auch makrostruk‐ turelle Faktoren wie das Schulsystem und die damit verbundenen Prozesse der Fächerwahl, die vorgegebene Sprachlernfolge und die Unterrichtsformen (z. B. traditioneller vs. bilingualer Unterricht) scheinen einen erheblichen Einfluss auf das Entstehen von Geschlechterunterschieden in der fremdsprachlichen Leistung zu haben. Daher müsste insbesondere für das Fach Französisch erprobt und erneut erforscht werden, inwiefern - neben individueller Leistungs- und Motivationsförderung auf Unterrichtsebene - durch eine Veränderung der Sprachlernfolge, eine Stärkung bilingualer Angebote oder durch die bewusste Anwendung von Methoden des gendersensiblen Unterichts (vgl. Kapitel 14) 15 Fazit 619 Unterschiede zwischen Jungen und Mädchen in der fremdsprachlichen Leistung ausgeglichen werden könnten (vgl. Grein 2012). Die Ergebnisse der vorlie‐ genden Studie für Spanisch zeigen nämlich, dass der vermeintliche Motivations‐ abfall während der Pubertät bezüglich des schulischen Lernens bei Jungen nicht generell stärker ausgeprägt ist als bei Mädchen, wie dies teilweise angenommen wird (vgl. Fuchs 2014). Auch die L3bzw. L4-Motivation scheinen trotz der zahl‐ reichen individuellen Veränderungen des Lernverhaltens während der Pubertät von außen beeinflussbar zu sein. Interessant wäre daher, zu untersuchen, wie sich die Leistungs- und Motivationsverläufe der Geschlechtergruppen im derzeit gegebenen System in Französisch als zweiter Fremdsprache von der sechsten bis zur zwölften Jahrgangsstufe bzw. in Spanisch als dritter Fremdsprache von der achten bis zur zwölften Jahrgangsstufe langfristig entwickeln, ähnlich wie dies bei den KESS-Studien für Englisch durchgeführt wurde (vgl. Bos et al. 2009a; Bos/ Gröhlich 2010; Bos/ Pietsch 2006; Vieluf et al. 2012). Außerdem wäre es durchaus ein Erkenntnisgewinn, die Entwicklung von Mädchen und Jungen in Spanisch als zweiter Fremdsprache, wie es in anderen Bundesländern belegt werden kann, genauer zu verfolgen, da in diesem Fall sicherlich andere Dyna‐ miken bezüglich der Leistungsverläufe von Jungen und Mädchen auftreten und diese noch besser mit dem Französischen als zweite Fremdsprache vergleichbar sind. Auf diese Weise könnten mehr empirische Befunde über die Zeitspannen herausgefunden werden, in denen sich das Geschlechterverhältnis bezüglich der fremdsprachlichen Leistungen und der affektiven Faktoren eventuell verändert (vgl. Meißner et al. 2008) und für diese Zeitspannen zielgerichtete, mit Hilfe der wissenschaftlichen Empirie etablierte, Maßnahmen eingesetzt und erneut auf deren Wirksamkeit geprüft werden. 620 15 Fazit Bibliographie A B E L , Clémentine (2018): Ausspracheschulung. Erhebung der Kompetenzen, Überzeu‐ gungen und Praktiken von Französischlehrkräften. Entwicklung eines bedarfsbezogenen Fördermoduls. Tübingen: Narr. A B E L , Fritz (2000): Interaktion und menschliche Sprachkompetenz. In: Bausch, Karl-Ri‐ chard/ Christ, Herbert/ Königs, Frank G./ Krumm, Hans-Jürgen (Hrsg.): Interaktion im Kontext des Lehrens und Lernens fremder Sprachen. Arbeitspapiere der 20. Frühjahrs‐ konferenz zur Erforschung des Fremdsprachenunterrichts. Tübingen: Narr, S.-11-19. A C A D É M I E F R A N ÇA I S E : Questions de langue. Accentuation des majuscules. Online verfügbar unter http: / / www.academie-francaise.fr/ questions-de-langue#5_strong-em-accentua tion-des-majuscules-em-strong, zuletzt geprüft am 11.09.2020. A C H T E N , Michael (2005): Die fehleranalytische Relevanz der prädominanten Spracher‐ werbshypothesen. Göttingen. Online verfügbar unter https: / / ediss.uni-goettingen.de/ bitstream/ handle/ 11858/ 00-1735-0000-0006-AECC-B/ achten.pdf ? sequence=1, zuletzt geprüft am 11.09.2020. A C K E R M A N , Phillip L./ Beier, Margaret E./ Boyle, Mary D. (2002): Individual differences in working memory within a nomological network of cognitive and perceptual speed abilities. In: Journal of Experimental Psychology: General 131 (4), S.-567-589. A D A M Z I K , Kirsten (2008): Textsorten und ihre Beschreibung. In: Janich, Nina (Hrsg.): Textlinguistik. 15 Einführungen. Tübingen: Narr, S.-145-175. A D A M Z I K , Kirsten (2016): Textlinguistik. Grundlagen, Kontroversen, Perspektiven. 2. Aufl. Berlin, Boston: de Gruyter. AG S P R A C H E N D-EDK (2014): Umsetzung der EDK-Sprachenstrategie in der Deutsch‐ schweiz. Einschätzung der AG Sprachen D-EDK zum aktuellen Stand des Fremdsprachen‐ unterrichts und Überlegungen zum Handlungsbedarf. Luzern. Online verfügbar unter ht tps: / / regionalkonferenzen.ch/ sites/ default/ files/ 2019-02/ d-edk_ag_sprachen_einscha etzung_fremdsprachen_2014-10-31.pdf, zuletzt geprüft am 30.09.2020. A G E R , Dennis (2001): Motivation in language planning and language policy. Clevedon, UK: Multilingual Matters. A G U A D O , Karin (2000): Empirische Fremdspracherwerbsforschung. Ein Plädoyer für mehr Transparenz. In: Aguado, Karin (Hrsg.): Zur Methodologie in der empirischen Fremdsprachenforschung. Baltmannsweiler: Schneider Hohengehren, S.-119-131. A G U A D O , Karin (Hrsg.) (2000): Zur Methodologie in der empirischen Fremdsprachenfor‐ schung. Baltmannsweiler: Schneider Hohengehren. A I N C I B U R U , María Cecilia (Hrsg.) (2017): La adquisición del sistema verbal del español. Datos empíricos del proceso de aprendizaje del español como lengua extranjera. Frankfurt a. M.: Lang. A K T I O N S R A T B I L D U N G (2009): Geschlechterdifferenzen im Bildungssystem: Jahresgutachten für 2009. Wiesbaden: Springer VS. A L D E R S O N , J. Charles (2000): Assessing reading. Cambridge: Cambridge University Press. A L E X I O U , Thomaï (2016): Gender Research in EFL-Classrooms - or: Are Gils Better Language Learners? In: Elsner, Daniela/ Lohe, Viviane (Hrsg.): Gender and Language Learning. Research and Practice. Tübingen: Narr, S.-85-94. A L L E M A N N -G H I O N D A , Cristina (Hrsg.) (2010): Migration, Identität, Sprache und Bildungs‐ erfolg. Weinheim: Beltz (Zeitschrift für Pädagogik: Beiheft 55). ALTE (s. a.): The CEFR Grid for Writing Tasks. v. 3.1 (analysis). Online verfügbar unter h ttps: / / rm.coe.int/ 16806979e0, zuletzt geprüft am 25.07.2020. A L T M A Y E R , Claus/ Mehlhorn, Grit/ Neveling, Christiane/ Schlüter, Norbert/ Schramm, Karen (Hrsg.) (2010): Grenzen überschreiten: sprachlich---fachlich---kulturell. Doku‐ mentation zum 23. Kongress für Fremdsprachendidaktik der Deutschen Gesellschaft für Fremdsprachenforschung (DGFF) Leipzig, 30. September - 3. Oktober 2009. Baltmanns‐ weiler: Schneider Hohengehren. A M T H A U E R , Rudolf/ Brocke, Burkhard/ Liepmann, Detlev/ Beauducel, André (2001): I-S-T 200 R: Intelligenz-Struktur-Test 2000 R. Göttingen: Hogrefe. A M T S B L A T T D E R E U R O P ÄI S C H E N G E M E I N S C H A F T E N (2000): Charta der Grundrechte der Euro‐ päischen Union. 2000/ C 364/ 01. Online verfügbar unter https: / / www.europarl.europa. eu/ charter/ pdf/ text_de.pdf, zuletzt geprüft am 16.05.2021. A N A S T A S I , Anne (1958): Differential Psychology. Individual and Group Differences in Behavior. 3. Aufl. New York: Macmillan. A N D E R S , Yvonne/ McElvary, Nele/ Baumert, Jürgen (2010): Die Einschätzung lernrele‐ vanter Schülermerkmale zum Zeitpunkt des Übergangs von der Grundschule auf die weiterführende Schule: Wie differenziert urteilen Lehrkräfte? In: Maaz, Kai/ Baumert, Jürgen/ Gresch, Cornelia/ McElvany, Nele (Hrsg.): Der Übergang von der Grundschule in die weiterführende Schule. Leistungsgerechtigkeit und regionale, soziale und eth‐ nisch-kulturelle Disparitäten. Bonn: Bundesministerium für Bildung und Forschung (BMBF), Referat Bildungsforschung, S.-313-354. A N D E R S S O N , Ida/ Gaudig, Jenny/ Graca, Anna/ Holm, Katarina/ Öhlin, Linda/ Marklund, Ulrika/ Ericsson, Anna (2011): Productive Vocabulary Size Development in Children Aged 18-24 Month---Gender Differences. In: Proceedings of FONETIK 2011: Speech, Music and Hearing; Quarterly Progress and Status Report (51), S.-109-112. A R I E S , Elizabeth J. (1996): Men and women in interaction: Reconsidering the differences. New York: Oxford University Press. 622 Bibliographie A R N O L D , Jane (Hrsg.) (1999): Affect in Language Learning. New York: Cambridge Univer‐ sity Press. A R N O L D , Margret (2002): Aspekte einer modernen Neurodidaktik: Emotionen und Kogni‐ tionen im Lernprozess. München: Vögel. A S L I N , Richard N./ Schlaggar, Bradley L. (2006): Is myelination the precipitating neural event for language development in infants and toddlers? In: Neurology 66 (3), S.-304-305. A T K I N S O N , John W. (1975): Einführung in die Motivationsforschung. Stuttgart: Klett. A U , Shun Y. (1988): A Critical Appraisal of Gardner's Social-Psychological Theory of Second-Language (L2) Learning. In: Language Learning 38 (1), S.-75-99. A U T O R E N G R U P P E B I L D U N G S B E R I C H T E R S T A T T U N G (Hrsg.) (2018): Bildung in Deutschland 2018. Ein indikatorengestützter Bericht mit einer Analyse zu Wirkungen und Erträgen von Bildung. Kultusministerkonferenz/ Bundesministerium für Bildung und Forschung. Bie‐ lefeld: wbv. B A C H E R , Johann/ Beham, Martina/ Lachmayr, Norbert (2008): Geschlechterunterschiede in der Bildungswahl. Wiesbaden: Springer VS. B A C H M A N , Lyle F./ Palmer, Adrian S. (2010): Language Assessment in Practice. Developing Language Assessments and Justifying their Use in the Real World. Oxford: Oxford University Press. B A C K H A U S , Klaus/ Erichson, Bernd/ Plinke, Wulff/ Weiber, Rolf (Hrsg.) (2016): Multivariate Analysemethoden. 14. Aufl. Berlin, Heidelberg: Springer Gabler. B A C K H A U S , Klaus/ Erichson, Bernd/ Plinke, Wulff/ Weiber, Rolf (2018): Multivariate Ana‐ lysemethoden. Eine anwendungsorientierte Einführung. 15. Aufl. Berlin, Heidelberg: Springer Gabler. B A C K H A U S , Klaus/ Erichson, Bernd/ Weiber, Rolf/ Plinke, Wulff (2016): Diskriminanzana‐ lyse. In: Backhaus, Klaus/ Erichson, Bernd/ Plinke, Wulff/ Weiber, Rolf (Hrsg.): Multi‐ variate Analysemethoden. 14. Aufl. Berlin, Heidelberg: Springer Gabler, S.-215-282. B A C O N , Susan M. (1992): The Relationship between Gender, Comprehension, Processing Strategies, and Cognitive and Affective Response in Foreign Language Listening. In: The Modern Language Journal 76 (2), S.-160-178. B A C O N , Susan M./ Finnemann, Michael D. (1990): A Study of the Attitudes, Motives, and Strategies of University Foreign Language Students and Their Disposition to Authentic Oral and Written Input. In: The Modern Language Journal 74 (4), S. 459-473. B A I L E Y , Kathleen M. (1983): Competitiveness and Anxiety in Adult Second Language Learning: Looking at and through the Diary Studies. In: Seliger, Herbert W./ Long, Michael H. (Hrsg.): Classroom-Oriented Research in Second Language Acquisition. Cambridge (Mass.): Newbury House, S.-67-103. Bibliographie 623 B A K E R , Susan C./ MacIntyre, Peter D. (2000): The Role of Gender and Immersion in Communication and Second Language Orientations. In: Language Learning 50 (2), S.-311-341. B A L L S T A E D T , Steffen-Peter (1997): Wissensvermittlung. Die Gestaltung von Lernmaterial. Weinheim: Beltz. B A L T E S , Paul B./ Lindenberger, Ulman/ Staudinger, Ursula M. (2006): Life-span theory in developmental psychology. In: Lerner, Richard M. (Hrsg.): Handbook of child psychology/ 1: Theoretical models of human development. 6. Aufl. New York: Wiley, S.-569-665. B A N D U R A , Albert (1986): Social foundations of thought and action: A social cognitive theory. Englewood-Cliffs, NJ: Prentic Hall. B A R B U , Stéphanie/ Nardy, Aurélie/ Chevrot, Jean-Pierre/ Guellaï, Bahia/ Glas, Ludi‐ vine/ Juhel, Jacques/ Lemasson, Alban (2015): Sex Differences in Language Across Early Childhood: Family Socioeconomic Status does not Impact Boys and Girls Equally. In: Frontiers in psychology 6, S. 1874. Online verfügbar unter https: / / www.frontiersin.org / articles/ 10.3389/ fpsyg.2015.01874/ full, zuletzt geprüft am 12.11.2019. B A R K O W S K I , Hans/ Krumm, Hans-Jürgen (Hrsg.) (2010): Fachlexikon Deutsch als Fremd- und Zweitsprache. Tübingen: Francke. B A R O N -C O H E N , Simon (2004): Vom ersten Tag an anders. Das weibliche und das männliche Gehirn. München: Heyne. B A R T O N , Amanda (2002): Teaching modern foreign languages to single-sex classes. In: The Language Learning Journal 25 (1), S.-8-14. B A T E S , Elizabeth/ Thal, Donna/ Janowsky, James (1992): Early language development and its neural correlates. In: Segalowitz, Sid J./ Rapin, Isabelle (Hrsg.): Handbook of Neuropsychology. Amsterdam: Elsevier, S.-69-110. B Ä U E R L E I N , Kerstin (2014): Leseverständnisdiagnostik in der Sekundarstufe. Theoretische Grundlagen sowie Konstruktion und empirische Erprobung der Lesetests LESEN 6-7 und LESEN 8-9. Würzburg: Univ. Press. B A U M E R T , Jürgen/ Baader, Andreas/ Barkawi, Karim/ Stanat, Petra/ Watermann, Rainer (Hrsg.) (2006): Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bil‐ dungsprozesse und Probleme der Verteilungsgerechtigkeit. Wiesbaden: Springer VS. B A U M E R T , Jürgen/ Gruehn, Sabine/ Hayn, Susanne/ Köller, Olaf/ Schnabel, Kai-Uwe (1997): Bildungsverläufe und psychosoziale Entwicklung im Jungendalter (BIJU). Dokumenta‐ tion Band-1. Skalen Längsschnitt I, Wellen 1-4. Max-Planck-Institut für Bildungsfor‐ schung. B A U M E R T , Jürgen/ Stanat, Petra/ Watermann, Rainer (2006): Schulstruktur und die Entste‐ hung differenzieller Lern- und Entwicklungsmilieus. In: Baumert, Jürgen/ Baader, Andreas/ Barkawi, Karim/ Stanat, Petra/ Watermann, Rainer (Hrsg.): Herkunftsbedingte 624 Bibliographie Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Ver‐ teilungsgerechtigkeit. Wiesbaden: Springer VS, S.-95-188. B A U R , Nina/ Blasius, Jörg (Hrsg.) (2014): Handbuch Methoden der empirischen Sozialfor‐ schung. Wiesbaden: Springer. B A U S C H , Karl-Richard (Hrsg.) (2003): Handbuch Fremdsprachenunterricht. 4. Aufl. Tü‐ bingen: Francke. B A U S C H , Karl-Richard/ Christ, Herbert/ Königs, Frank G./ Krumm, Hans-Jürgen (Hrsg.) (2000): Interaktion im Kontext des Lehrens und Lernens fremder Sprachen. Arbeitspapiere der 20. Frühjahrskonferenz zur Erforschung des Fremdsprachenunterrichts. Tübingen: Narr. B A Y E R I S C H E S L A N D E S A M T F Ü R S T A T I S T I K (2019a): Bayerische Schulen. Eckzahlen sämtlicher Schularten nach kreisfreien Städten und Landkreisen. Stand: Oktober 2018. Fürth. Online verfügbar unter https: / / www.statistik.bayern.de/ mam/ produkte/ veroffentlichungen/ statistische_berichte/ b0100c_201800.pdf, zuletzt geprüft am 06.03.2020. B A Y E R I S C H E S L A N D E S A M T F Ü R S T A T I S T I K (2019b): Gymnasien,-Abendgymnasien, Kollegs, Schulen besonderer Art, Freie Waldorfschulen sowie internationale und ausländische Schulen in Bayern. Stand: Oktober 2018. Fürth. Online verfügbar unter https: / / www.s tatistik.bayern.de/ mam/ produkte/ veroffentlichungen/ statistische_berichte/ b1400c_2 01800.pdf, zuletzt geprüft am 06.03.2020. B E C K , Bärbel/ Klieme, Eckhardt (Hrsg.) (2007): Sprachliche Kompetenzen. Konzepte und Messung: DESI-Studie (Deutsch Englisch Schülerleistungen International). Weinheim: Beltz. B E C K E R , Rolf/ Müller, Walter (2011): Bildungsungleichheiten nach Geschlecht und Her‐ kunft im Wandel. In: Hadjar, Andreas (Hrsg.): Geschlechtsspezifische Bildungsungleich‐ heiten. Wiesbaden: Springer VS, S.-55-75. B E C K E R , Rolf/ Solga, Heike (Hrsg.) (2012): Soziologische Bildungsforschung. Wiesbaden: Springer. B E L T Z , Adriene M./ Kelly, Dominic P./ Berenbaum, Sheri A. (2013): Sex differences in brain and behavioral development. In: Rubenstein, John/ Rakic, Pasko (Hrsg.): Neural Circuit and Cognitive Development. Oxford: Elsevier, S.-467-499. B E R G E R , Peter A./ Kahlert, Heike (Hrsg.) (2013): Institutionalisierte Ungleichheiten. Wie das Bildungswesen Chancen blockiert. 3. Aufl. Weinheim: Beltz. B E R K , Laura E. (1989): Child development. Boston: Allyn and Bacon. B E R T H E L E , Raphael (2006): Ort und Weg. Die sprachliche Raumreferenz in Varietäten des Deutschen, Rätoromanischen und Französischen. Berlin, New York: de Gruyter. B E S S E R , Sarah (2012): Und wo bleiben die Jungs? Wege einer geschlechtersensiblen Leseförderung im Französischunterricht. In: Französisch heute 43, S.-78-83. B I C K E L , Hans/ Schläpfer, Robert (Hrsg.): Die viersprachige Schweiz. 2. Aufl. Aarau: Sauer‐ länder. Bibliographie 625 BIG-K R E I S (2015): Der Lernstand im Englischunterricht am Ende von Klasse 4. Ergebnisse der BIG-Studie. München: Domino Verlag. B I T T N E R , Christoph (2003): Der Teilnehmerschwund im Französischunterricht - Eine unabwendbare Entwicklung? Eine empirische Studie am Beispiel der gymnasialen Oberstufe. In: Französisch heute 34 (4), S.-338-353. B L A N C H E -B E N V E N I S T E , Claire (2003): L'orthographe. In: Yaguello, Marina/ Blanche-Benve‐ niste, Claire (Hrsg.): Le grand livre de la langue française. Paris: Editions du Seuil, S.-345-390. B L A N Z , Mathias (2015): Forschungsmethoden und Statistik für die Soziale Arbeit. Grund‐ lagen und Anwendungen. Stuttgart: Kohlhammer. B L A S I U S , Jörg/ Baur, Nina (Hrsg.) (2014): Handbuch Methoden der empirischen Sozialfor‐ schung. Wiesbaden: Springer VS. B L U M E N T H A L , Peter (1997): Sprachvergleich Deutsch---Französisch. 2. Aufl. Berlin, New York: de Gruyter. B O H L , Thorsten/ Budde, Jürgen/ Rieger-Ladich, Markus (Hrsg.) (2017): Umgang mit Hete‐ rogenität in Schule und Unterricht. Grundlagentheoretische Beiträge, empirische Befunde und didaktische Reflexionen. Bad Heilbrunn: UTB. B ÖH M E , Katrin/ Sebald, Susanne/ Weirich, Sebastian/ Stanat, Petra (2016a): Geschlechts‐ bezogene Disparitäten. In: Stanat, Petra/ Böhme, Katrin/ Schipolowski, Stefan/ Haag, Nicole (Hrsg.): IQB-Bildungstrend 2015. Sprachliche Kompetenzen am Ende der 9. Jahr‐ gangsstufe im zweiten Ländervergleich. Münster: Waxmann, S.-377-407. B O H N E N S T E F F E N , Markus (2010): Fehler-Korrektur. Lehrer- und lernerbezogene Untersu‐ chungen zur Fehlerdidaktik im Englischunterricht der Sekundarstufe II. Frankfurt a. M., Bern: Lang. B O H N E R , Gerd/ Janke, M. (2002): Attitudes and Attitude Change. Hove: Psychology Press. B O N I N , Jan (2009): Jungenförderung im Französischunterricht. In: Französisch heute 40 (1), S.-15-24. B O N S E N , Martin/ Lintorf, Katrin/ Bos, Wilfried (2008): Kompetenzen von Jungen und Mädchen. In: Bos, Wilfried/ Bonsen, Martin/ Baumert, Jürgen/ Prenzel, Manfred/ Selter, Christoph/ Walther, Gerd (Hrsg.): TIMSS 2007. Mathematische und naturwissenschaft‐ liche Kompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich. Münster: Waxmann, S.-125-140. B O R N , Joachim/ Folger, Robert, Laferl, Christopher F./ Poll, Bernhard (Hrsg.) (2013): Hand‐ buch Spanisch. Sprache, Literatur, Kultur, Geschichte in Spanien und Hispanoamerika. Berlin: Schmidt. B O R N S T E I N , Marc H./ Cote, Linda R./ Maital, Sharone/ Painter, Kathleen/ Park, Sung-Yun/ Pascual, Liliana/ Pêcheux, Marie-Germaine/ Ruel, Josette/ Venuti, Paola/ Vyt, Andre (2004): Cross-Linguistic Analysis of Vocabulary in Young Children: Spanish, Dutch, 626 Bibliographie French, Hebrew, Italian, Korean, and American English. In: Child Development 75 (4), S.-1115-1139. B O R N S T E I N , Marc H./ Hahn, Chun-Shin/ Haynes O. Maurice (2004): Specific and general language performance across early childhood: Stability and gender considerations. In: First Language 24 (3), S.-267-304. B O R N S T E I N , Marc H./ Haynes, O. Maurice/ O'Reilly, Anne W./ Painter, Kathleen M. (1996): Solitary and Collaborative Pretense Play in Early Childhood: Sources of Individual Variation in the Development of Representational Competence. In: Child Development 67 (6), S.-2910-2929. B Ö R S C H , Sabine (1982): Fremdsprachenstudium - Frauenstudium? Subjektive Bedeutung und Funktion des Fremdspracherwerbs und -studiums für Studentinnen und Studenten. Tübingen: Stauffenburg. B O R T Z , Jürgen (Hrsg.) (2010): Statistik für Human- und Sozialwissenschaftler. 7. Aufl. Berlin: Springer. B O R T Z , Jürgen/ Döring, Nicola (2006): Forschungsmethoden und Evaluation. Für Human- und Sozialwissenschaftler; mit 87 Tabellen. 4. Aufl. Heidelberg: Springer. B O R T Z , Jürgen/ Schuster, Christof (2010): Statistik für Human- und Sozialwissenschaftler. 7. Aufl. Berlin, Heidelberg: Springer. B O R T Z , Jürgen/ Schuster, Christoph (2010): Faktorenanalyse. In: Jürgen Bortz (Hrsg.): Statistik für Human- und Sozialwissenschaftler. 7. Aufl. Berlin: Springer, S.-385-433. B O S , Wilfried/ Bonsen, Martin/ Baumert, Jürgen/ Prenzel, Manfred / Selter, Christoph/ Walther, Gerd (Hrsg.) (2008): TIMSS 2007. Mathematische und naturwissenschaftliche Kompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich. Münster: Waxmann. B O S , Wilfried/ Bonsen, Martin/ Gröhlich, Carola (Hrsg.) (2009a): KESS 7 - Kompetenzen und Einstellungen von Schülerinnen und Schülern an Hamburger Schulen zu Beginn der Jahrgangsstufe 7. Münster: Waxmann. B O S , Wilfried/ Bonsen, Martin/ Gröhlich, Carola/ Guill, Karin/ Scharenberg, Katja (2009b): KESS 7 - Skalenhandbuch zur Dokumentation der Erhebungsinstrumente. Skalenhand‐ buch zur Dokumentation der Erhebungsinstrumente. Münster: Waxmann. B O S , Wilfried/ Gröhlich, Carola (Hrsg.) (2010): KESS 8 - Kompetenzen und Einstellungen von Schülerinnen und Schülern am Ende der Jahrgangsstufe 8. Münster: Waxmann. B O S , Wilfried/ Lankes, Eva-Maria/ Prenzel, Manfred/ Schwippert, Knut/ Valtin, Renate/ Walther, Gerd (Hrsg.) (2003): Erste Ergebnisse aus IGLU. Schülerleistungen am Ende der vierten Jahrgangsstufe im internationalen Vergleich. Münster: Waxmann. B O S , Wilfried/ Pietsch, Marcus (Hrsg.) (2006): KESS 4---Kompetenzen und Einstellungen von Schülerinnen und Schülern am Ende der Jahrgangsstufe 4 in Hamburger Schulen. Münster: Waxmann. Bibliographie 627 B O S , Wilfried/ Tarelli, Irmela/ Bremerich-Vos, Albert/ Schwippert, Knut (Hrsg.) (2012): IGLU 2011. Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich. Münster: Waxmann. B ÖT T C H E R , Wolfgang/ Klemm, Klaus (Hrsg.) (1995): Bildung in Zahlen. Statistisches Hand‐ buch zu Daten und Trends im Bildungsbereich. Weinheim, München: Juventa. B ÖT T G E R , Heiner (2016): Neurodidaktik des frühen Sprachenlernens. Wo die Sprache zuhause ist. Bad Heilbrunn: Klinkhardt. B ÖT T G E R , Heiner/ Festman, Julia/ Müller, Tanja (Hrsg.) (2020): Language Education and Acquisition Research. Focusing Early Language Learning. Bad Heilbrunn: Klinkhardt. B ÖT T G E R , Heiner/ Gien, Gabriele (Hrsg.) (2014): The Multilingual Brain. Zum neurodidak‐ tischen Umgang mit Mehrsprachigkeit. Eichstätt: Eichstätt Academic Press. B ÖT T G E R , Heiner/ Sambanis, Michaela (Hrsg.) (2017): Sprachen lernen in der Pubertät. Tübingen: Narr Francke Attempto. B ÖT T G E R , Heiner/ Sambanis, Michaela (Hrsg.) (2018): Focus on Evidence II---Netzwerke zwischen Fremdsprachendidaktik und Neurowissenschaft. Tübingen: Narr. B O U R D A I S , Danièle/ Talon, Geneviève (2017): Cambridge IGCSE and O level French as a foreign language. Cambridge: Cambridge University Press. B O Y L E , Joseph P. (1987): Sex Differences in Listening Vocabulary. In: Language Learning 37 (2), S.-273-284. B R A H , Avtar/ Phoenix, Ann (2004): Ain't I a women? Revisiting intersectionality. In: Journal of International Women's Studies (5), S.-74-86. B R A U N , Henry (2000): A postmodern view of the problem of assessment. In: Kunnan, Antony J. (Hrsg.): Fairness and validation in language assessment. Selected papers from the 19th Language Testing Research Colloquium. Orlando, Florida. Cambridge: Cambridge University Press, S.-263-272. B R A U N , Carl/ Klassen, Bernard (1971): A Transformational Analysis of Oral Syntactic Structures of Children Representing Varying Ethnolinguistic Communities. In: Child Development 42 (6), S.-1859-1871. B R A U N , Cordula/ Schwemer, Kay (2013): Jungen im Französischunterricht fördern. In: Der fremdsprachliche Unterricht Französisch 122, S.-2-10. B R E E N , Richard/ Luijkx, Ruud/ Müller, Walter/ Pollak, Reinhard (2010): Long-term Trends in Educational Inequality in Europe: Class Inequalities and Gender Differences. In: European Sociological Review 26 (1), S.-31-48. B R E G A , Evelyn/ Newell, John M. (1967): High-School Performance of FLES and Non-FLES Students. In: The Modern Language Journal 51 (7), S.-408-411. B R I C K E N K A M P , Rolf/ Schmidt-Atzert, Lothar/ Liepmann, Detlev (2010): Test d2-Revision. Aufmerksamkeits- und Konzentrationstest. Göttingen: Hogrefe. B R I N K E R , Klaus (2010): Linguistische Textanalyse. Eine Einführung in Grundbegriffe und Methoden. 7. Aufl. Berlin: Schmidt. 628 Bibliographie B R I N K E R , Klaus/ Antos, Gerd/ Heinemann, Wolfgang (Hrsg.) (2000): Text- und Gesprächs‐ linguistik. Ein internationales Handbuch zeitgenössischer Forschung. Berlin, New York: de Gruyter. B R I S L I N , Richard W./ Lonner, Walter J./ Thorndike, Robert M. (1973): Cross-cultural research methods. New York: Wiley. B R O S I U S , Felix (2018): SPSS. Umfassendes Handbuch zu Statistik und Datenanalyse. 8. Aufl. Frechen: mitp. B R O W N , Annie (2004): Legibility and the rating of second-language writing. In: Milanovic, Michael/ Weir Cyril J. (Hrsg.): European Language Testing in a Global Context: Procee‐ dings of the ALTE Barcelona Conference July 2001. Cambridge: Cambridge University Press, S.-117-125. B R U N N E R , Ewald Johannes (Hrsg.) (2003): Diagnose und Intervention in schulischen Hand‐ lungsfeldern. Münster: Waxmann. B R U Y N E , Jacques de (2002): Spanische Grammatik. 2. Aufl. Tübingen: Niemeyer. B U C H M A N N , Claudia/ DiPrete, Thomas A./ McDaniel, Anne (2008): Gender Inequalities in Education. In: Annual Review of Sociology 34 (1), S.-319-337. B U D D E , Jürgen (2005): Männlichkeit und gymnasialer Alltag. Doing Gender im heutigen Bildungssystem. Bielefeld: Transcript. B U D D E , Jürgen (2006): Wie Lehrkräfte Geschlecht (mit)machen - doing gender als schu‐ lischer Aushandlungsprozess. In: Jösting, Sabine/ Seemann, Malwine (Hrsg.): Gender und Schule. Geschlechterverhältnisse in Theorie und schulischer Praxis. Oldenburg: BIS-Verlag, S.-45-60. B U D D E , Jürgen (2008): Bildungs(miss)erfolge von Jungen und Berufswahlverhalten bei Jungen/ männlichen Jugendlichen. Bonn, Berlin: Bundesministerium für Bildung und Forschung (BMBF), Referat Chancengleichheit in Bildung und Forschung. B U D D E , Jürgen (2011): Geschlechtersensible Schule. In: Faulstich-Wieland, Hannelore (Hrsg.): Umgang mit Heterogenität und Differenz. 2. Aufl. Baltmannsweiler: Schneider Hohengehren, S.-99-119. B Ü G E L , Karin/ Buunk, Bram P. (1996): Sex Differences in Foreign Language Text Compre‐ hension: The Role of Interests and Prior Knowledge. In: The Modern Language Journal 80 (1), S.-15-31. B ÜH N E R , Markus (2011): Einführung in die Test- und Fragebogenkonstruktion. 3. Aufl. München, Boston: Pearson. B ÜH N E R , Markus/ Ziegler, Matthias (2009): Statistik für Psychologen und Sozialwissen‐ schaftler. München: Pearson. B ÜH R M A N N , Andrea D. (2009): Intersectionality---ein Forschungsfeld auf dem Weg zum Paradigma? Tendenzen, Herausforderungen und Perspektiven der Forschung über Intersektionalität. In: Gender (2), S.-28-44. Bibliographie 629 B U R L I N G , Robbins (1986): The selective advantage of complex language. In: Ethology and Sociobiology 7 (1), S.-1-16. B U R L I N G , Robbins (2005): The talking ape: How language evolved. New York: Oxford University Press. B U R M E I S T E R , Petra/ Piske, Thorsten/ Rohde, Andreas (Hrsg.) (2002): An integrated view of language development. Papers in honor of Henning Wode. Trier: Wissenschaftlicher Verlag. B U R S T A L L , Clare (1970): French in Primary School. Attitudes and Achievement. Slough: National Foundation for Educational Research. B U R S T A L L , Clare (1975): Factors Affecting Foreign Language Learning: A Consideration of Some Relevant Research Findings. In: Language Teaching and Linguistic Abstracts 8 (1), S.-5-25. B U R S T A L L , Clare/ Jamieson, Monika/ Cohen, Susan/ Hargreaves, Margaret (1974): Primary French in the Balance. A report of the National Foundation for Educational Research in England and Wales. Windsor: NFER Publishing Company. B U R W I T Z -M E L Z E R , Eva/ Mehlhorn, Grit/ Riemer, Claudia/ Bausch, Karl-Richard (Hrsg.) (2016): Handbuch Fremdsprachenunterricht. 6. Aufl. Frankfurt a. M.: Lang. B UẞM A N N , Hadumod (Hrsg.) (2008): Lexikon der Sprachwissenschaft. 4. Aufl. Stuttgart: Kröner. C A P L A N , Paula J./ Crawford, Mary/ Shibley Hyde, Janet/ Richardson, John T. E. (Hrsg.) (1997): Gender differences in human cognition. New York: Oxford University Press. C A R R , Jo/ Pauwels, Anne (2006): Boys and foreign language learning. Real boys don't do languages. Basingstoke: Palgrave Macmillan. C A R R E L L , Patricia L./ Wise, Teresa E. (1998): The Relationship between Prior Knowledge and Topic Interest in Second Language Reading. In: Studies in Second Language Acquisition 20 (3), S.-285-309. C A R R O L L , John B. (1963): Research on Teaching Foreign Languages. In: Gage, Nathaniel L. (Hrsg.): Handbook of Research on Teaching. A Project on The American Educational Research Association. Chicago: McNally, S.-1060-1100. C A R R O L L , John Bissell/ Husén, Torsten (1975): The teaching of French as a foreign language in eight countries. New York: Wiley. C A S A L E , Rita/ Rendtorff, Barbara (Hrsg.) (2008): Was kommt nach der Genderforschung? Zur Zukunft feministischer Theoriebildung. Bielefeld: Transcript. C A S P A R I , Daniela/ Klippel, Friederike/ Legutke, Michael K. (Hrsg.) (2016): Forschungsme‐ thoden in der Fremdsprachendidaktik. Ein Handbuch. Tübingen: Narr. C H A M B E R S , Gary (2005): Teaching Modern Foreign Languages in Single-Sex Classes in a Co-Educational Context. Review of a Project in a North Yorkshire Comprehensive School. In: Language Learning Journal 32 (1), S.-45-54. 630 Bibliographie C H A P E L L E , Carol A. (Hrsg.) (2012): The Encyclopedia of Applied Linguistics. Oxford, UK: Blackwell. C H A U V E T , Aude (2008): Référentiel de programmes pour l'Alliance Française élaboré à partir du Cadre européen commun. Paris: Alliance Française, CLE International. C H I A N G , Ming-Chang/ Barysheva, Marina/ Shattuck, David W./ Lee, Agatha D./ Madsen, Sarah K./ Avedissian, Christina/ Klunder, Andrea D./ Toga, Arthur W./ McMahon, Katie L./ Zubicaray, Greig I. de/ Wright, Margaret J./ Srivastava, Anuj/ Balov, Ni‐ kolay/ Thompson, Paul M. (2009): Genetics of brain fiber architecture and intellectual performance. In: The Journal of Neuroscience 29 (7), S.-2212-2224. C H O M S K Y , Noam (1969): Linguistics and Philosophy. In: Hook, Sidney (Hrsg.): Language and Philosophy: A Symposium. New York: New York University Press, S.-51-94. C H O M S K Y , Noam (2001): The architecture of language. New Delhi: Oxford University Press. C H R I S T , Ingeborg (1996): Fremdsprachenlernen---Mädchensache? In: Neusprachliche Mitteilungen aus Wissenschaft und Praxis 49 (1), S.-21-26. C H U D A S K E , Jana (2012): Sprache, Migration und schulfachliche Leistung. Einfluss sprach‐ licher Kompetenz auf Lese-, Rechtschreib- und Mathematikleistungen. Wiesbaden: Springer VS. CIEP (s. a.): Grille d'évaluation de la production écrite B1. Online verfügbar unter ht tp: / / www.delfdalf.fr/ _media/ grille-evaluation-production-ecrite-delf-b1-scolaire.pdf, zuletzt geprüft am 03.03.2020. CIEP (2015): La lettre du CIEP. Numéro Spécial. Les 30 ans du DELF-DALF. Online verfügbar unter https: / / www.ciep.fr/ sites/ default/ files/ lettre-ciep-30-ans-delf-dalf.pd f, zuletzt geprüft am 04.03.2020. C L A R K , Ann/ Trafford, John (1995): Boys into Modern Languages: An investigation of the discrepancy in attitudes and performance between boys and girls in modern languages. In: Gender and education 7 (3), S.-315-326. C L E A R F I E L D , Melissa W./ Nelson, Naree M. (2006): Sex Differences in Mothers' Speech and Play Behavior with 6-, 9-, and 14-Month-Old Infants. In: Sex Roles 54 (1-2), S. 127-137. C L É M E N T , R./ Gardner, R. C./ Smythe, Padric C. (1980): Social and individual factors in second language acquisition. In: Canadian Journal of Behavioural Science/ Revue canadienne des sciences du comportement 12 (4), S.-293-302. C L É M E N T , Richard/ Dörnyei, Zoltán/ Noels, Kimberly A. (1994): Motivation, Self-confi‐ dence, and Group Cohesion in the Foreign Language Classroom. In: Language Learning 44 (3), S.-417-448. C O H E N , Jacob (1988): Statistical power analysis for the behavioral sciences. 2. Aufl. Hillsdale, N. J.: Erlbaum. C O H E N , Jacob (1992): A power primer. In: Psychological Bulletin 112 (1), S.-155-159. C O H E N , Michèle (2010): Sexualising and Gendering the French Tongue in Eighteenth-Cen‐ tury England. In: French Studies Bulletin 117, S.-73-76. Bibliographie 631 C O H E N , Jacob/ Cohen, Patricia/ West, Stephen G./ Aiken, Leona S. (2003): Applied Multiple Regression/ Correlation Analysis for the Behavioral Sciences. 3. Aufl. New York, London: Routledge. C O H E N , Lewis/ Manion, Lawrence/ Morrison, Keith (2011): Research Methods in Education. Hoboken: Taylor and Francis. C O N N O L L Y , Paul (2006): The effects of social class and ethnicity on gender differences in GCSE attainment: a secondary analysis of the Youth Cohort Study of England and Wales 1997-2001. In: British Educational Research Journal 32 (1), S.-3-21. C O R B I È R E , Marc/ Fraccaroli, Franco/ Mbekou, Valenti/ Perron, Jacques (2006): Academic self-concept and academic interest measurement: A multi-sample European study. In: European Journal of Psychology of Education 21 (1), S.-3-15. C O R R , Philip J./ Matthews, Gerald (Hrsg.) (2009): The Cambridge Handbook of Personality Psychology. New York: Cambridge University Press. C O R T É S , Kristin H. (2002): Youth and the Study of Foreign Language: An Investigation of Attitudes. In: Foreign Language Annals 35 (3), S.-320-332. C O S E R I U , Eugenio (1967): Lexikalische Solidaritäten. In: Poetica 1, S.-293-303. C R O N B A C H , Lee J. (1951): Coefficient alpha and the internal structure of tests. In: Psychometrica 23 (1), S.-105-111. C R O O K E S , Graham/ Schmidt, Richard W. (1991): Motivation: Reopening the research agenda. In: Language Learning 41, S.-469-512. C R O S N O E , Robert (2009): Low-Income Students and the Socioeconomic Composition of Public High Schools. In: American sociological review 74 (5), S.-709-730. C R O S S , David (1983): Sex differences in achievement. In: System 11 (2), S.-159-162. C R Y S T A L , David (2008): A dictionary of linguistics and phonetics. 6. Aufl. Oxford: Blackwell. C S I Z É R , Kata/ Dörnyei, Zlotán (2005): The Internal Structure of Language Learning Motivation and Its Relationship with Language Choice and Learning Effort. In: The Modern Language Journal 89 (1), S.-19-36. C S I Z É R , Kata/ Dörnyei, Zoltán (2005): The Internal Structure of Language Learning Motivation and Its Relationship with Language Choice and Learning Effort. In: The Modern Language Journal 89 (1), S.-19-36. C U R R A N , Patrick J./ West, Stephen G./ Finch, John F. (1996): The Robustness of Test Statistics to Nonnormality and Specification Error in Confirmatory Factor Analysis. In: Psychological Methods 1 (1), S.-16-29. D A H R E N D O R F , Ralf (1965): Bildung ist Bürgerrecht. Osnabrück: Nannen. D A N I E L S , Zoe (2008): Entwicklung schulischer Interessen im Jugendalter. Münster: Wax‐ mann. D A V I E R , Alina A. von (2011): Statistical Models for Test Equating, Scaling, and Linking. New York, NY: Springer. 632 Bibliographie D A V I E S , Samuel A. (Hrsg.) (2011): Gender gap: causes, experiences and effects. New York: Nova Science Publishers. D E B O T , Kees/ Roche, Jörg (2018): Kognitive Aspekte. In: Roche, Jörg/ Terrasi-Haufe, Elisabetta (Hrsg.): Mehrsprachigkeit und Sprachenerwerb. Tübingen: Narr, S.-18-28. D E L A T O R R E , Nuria/ Ainciburu, Maria Cecilia (2019): Complejidad y corrección de las construcciones con Ser/ Estar en diferentes niveles de competencia del español como lengua extanjera. In: Porta Linguarum 32, S.-167-180. D E C I , Edward L./ Ryan, Richard M. (1985): Intrinsic motivation and self-determination in human behavior. New York: Plenum Press. D E C I , Edward L./ Ryan, Richard M. (1993): Die Selbstbestimmungstheorie der Motivation und ihre Bedeutung für die Pädagogik. In: Zeitschrift für Pädagogik 27 (2), S.-223-238. D E C I , Edward L./ Ryan, Richard M. (Hrsg.) (2002): Handbook of Self-Determination Re‐ search. Rochester, NY: University of Rochester Press. D E C I , Edward L./ Ryan, Richard M. (2009): Self-determination theory: A consideration of human motivational universals. In: Corr, Philip J./ Matthews, Gerald (Hrsg.): The Cambridge Handbook of Personality Psychology. New York: Cambridge University Press, S.-441-456. D E C K E -C O R N I L L , Helene/ Volkmann, Laurenz (Hrsg.) (2007a): Gender studies and foreign language teaching. Tübingen: Narr. D E C K E -C O R N I L L , Helene/ Volkmann, Lorenz (2007b): Introduction. In: Decke-Cornill, Helene/ Volkmann, Laurenz (Hrsg.): Gender studies and foreign language teaching. Tübingen: Narr, S.-7-14. D E G E N H A R D T , Marion (2003): Was Jungen gerne lesen: Lektüreempfehlungen für die Mittelstufe. In: Der fremdsprachliche Unterricht Französisch 47, S.-11-14. D E N Z I N , Norman K.: The research act. Chicago: Butterworth. DESI-K O N S O R T I U M (2006): Unterricht und Kompetenzerwerb in Deutsch und Englisch. Zentrale Befunde der Studie Deutsch-Englisch-Schülerleistungen-International (DESI). Unter Mitarbeit von Eckhard Klieme, Wolfgang Eichler, Andreas Helmke et al. Online verfügbar unter https: / / www.dipf.de/ de/ forschung/ aktuelle-projekte/ pdf/ biqua/ desi -zentrale-befunde, zuletzt geprüft am 20.05.2021. DESI-K O N S O R T I U M (Hrsg.) (2008): Unterricht und Kompetenzerwerb in Deutsch und Eng‐ lisch. Ergebnisse der DESI-Studie. Weinheim, Basel: Beltz. D E U T S C H E G E S E L L S C H A F T F Ü R P S Y C H O L O G I E (DGPs) (Hrsg.) (2019): Richtlinien zur Manu‐ skriptgestaltung. 5. Aufl. Göttingen: Hogrefe. D E U T S C H E S PISA-K O N S O R T I U M (Hrsg.) (2001): PISA 2000. Basiskompetenzen von Schüle‐ rinnen und Schülern im internationalen Vergleich. Opladen: Leske + Budrich. D E W A E L E , Jean-Marc/ Konstantinos V. Petrides/ Adrian Furnham (2008): Effects of Trait Emotional Intelligence and Sociobiographical Variables on Communicative Anxiety Bibliographie 633 and Foreign Language Anxiety Among Adult Multilinguals: A Review and Empirical Investigation. In: Language Learning 58 (4), S.-911-960. D I C K HÄU S E R , Oliver (2003): Überprüfung des erweiterten Modells des internal/ external frame of reference. In: Zeitschrift für Entwicklungspsychologie und Pädagogische Psy‐ chologie 35 (4), S.-200-207. D I E F E N B A C H , Heike (2010): Jungen - die „neuen" Bildungsverlierer. In: Quenzel, Gudrun/ Hurrelmann, Klaus (Hrsg.): Bildungsverlierer. Neue Ungleichheiten. Wiesbaden: Springer VS, S.-245-272. D I T T O N , Hartmut (2007): Kompetenzaufbau und Laufbahnen im Schulsystem. Ergebnisse einer Längsschnittuntersuchung an Grundschulen. Münster: Waxmann. D I V I N E , George W./ Norton, H. James/ Barón, Anna E./ Juarez-Colunga, Elizabeth (2018): The Wilcoxon-Mann-Whitney Procedure Fails as a Test of Medians. In: The American Statistician 72 (3), S.-278-286. D O F F , Sabine (Hrsg.) (2012): Fremdsprachenunterricht empirisch erforschen. Grundlagen - Methoden - Anwendung. Tübingen: Narr. D Ö R I N G , Nicola (2013): Zur Operationalisierung von Geschlecht im Fragebogen: Probleme und Lösungsansätze aus Sicht von Mess-, Umfrage-, Gender- und Queer-Theorie. In: Gender 2, S.-94-113. D Ö R I N G , Nicola/ Bortz, Jürgen (2016): Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften. 5. Aufl. Berlin, Heidelberg: Springer. D Ö R N Y E I , Zoltán (1994a): Motivation and Motivating in the Foreign Language Classroom. In: The Modern Language Journal 78 (3), S.-273-284. D Ö R N Y E I , Zlotán (1994b): Understanding second language motivation: On with the challenge! In: Modern Language Journal 78, S.-515-523. D Ö R N Y E I , Zoltán (1998): Motivation in second and foreign language learning. In: Language Teaching 31, S.-117-135. D Ö R N Y E I , Zoltán (2001): Teaching and researching motivation. Harlow u.a.: Longman. D Ö R N Y E I , Zoltán (2003): Attitudes, Orientations, and Motivations in Language Learning: Advances in Theory, Research, and Applications. In: Language Learning 53 (S1), S. 3-32. D Ö R N Y E I , Zoltán (2005): The Psychology of the Language Learner. Individual Differences in Second Language Acquisition. Mahwah, New Jersey: Erlbaum. D Ö R N Y E I , Zoltán (2007): Research methods in applied linguistics: quantitative, qualitative, and mixed methodologies. Oxford: Oxford University Press. D Ö R N Y E I , Zoltán (2010): Questionnaires in second language research. Construction, admi‐ nistration, and processing. 2. Aufl. New York, London: Routledge. D Ö R N Y E I , Zoltán (2018): Research Methods in Applied Linguistics. Oxford, New York: Oxford University Press. D Ö R N Y E I , Zlotán/ Clément, Richard (2002): Motivational Characteristics of Learning Different Target Languages: Results of a Nationwide Survey. In: Dörnyei, Zoltán/ 634 Bibliographie Schmidt, Richard (Hrsg.): Motivation and second language acquisition. Honolulu, Hawaii: University of Hawaii Press, S.-399-432. D Ö R N Y E I , Zlotán/ Csizér, Kata (2002): Some Dynamics of Language Attitudes and Moti‐ vation: Results of a Longitudinal Nationwide Survey. In: Applied Linguistics 23 (4), S.-421-462. D Ö R N Y E I , Zlotán/ Kormos, Judit (2000): The Role of Individual and Social Variables in Oral Task Performance. In: Language Teaching Research 4 (3), S.-275-300. D Ö R N Y E I , Zlotán/ Ottó, István (1998): Motivation in action: A process model of L2 motivation. In: Working Papers in Applied Linguistics 4, S.-43-69. D Ö R N Y E I , Zlotán/ Ryan, Stephen (2015): The Psychology of the language learner. Revisited. New York, London: Routledge. D Ö R N Y E I , Zoltán/ Schmidt, Richard (Hrsg.) (2002): Motivation and second language acqui‐ sition. Honolulu, Hawaii: University of Hawaii Press. D Ö R N Y E I , Zoltán/ Ushioda, Ema (Hrsg.) (2009): Motivation, Language identity and the L2 Self. Bristol: Multilingual Matters. D O U G H T Y , Catherine J./ Long, Michael H. (Hrsg.) (2003): The Handbook of Second Language Acquisition. Oxford, UK: Blackwell. D R A L L E , Anette et al. (Hrsg.) (2015): Großwörterbuch Französisch. Französisch---Deutsch, Deutsch---Französisch. Stuttgart: PONS. D R E S E L , Markus/ Stöger, Heidrun/ Ziegler, Albert (2005): Geschlechtsunterschiede bei Leis‐ tungsbewertungen und Leistungsaspirationen: Eine Dreiebenenanalyse zu Klassen- und Schulunterschieden im Ausmaß von Geschlechterdifferenzen. Universität Ulm, Abt. Pädagogische Psychologie. Ulm. Online verfügbar unter https: / / www.psycho.ewf.uni -erlangen.de/ mitarbeiter/ ziegler/ publikationen/ Publikation15.pdf, zuletzt geprüft am 19.10.2020. D R I E S S E N , Gert/ Van Langen, Annemarie (2013): Gender differences in primary and secondary education: Are girls really outperforming boys? In: International Review of Education 59 (1), S.-67-86. D R O N K E R S , Jaap/ de Heus, Manon (2010): The Educational Performance of Childrenof Immigrants in Sixteen OECD Countries. CReAM Discussion Paper No 10/ 12. London. Online verfügbar unter https: / / m.cream-migration.org/ publ_uploads/ CDP_10_12.pdf , zuletzt geprüft am 13.11.2019. D U F T E R , Andreas/ Stark, Elisabeth (2017): Manual of romance morphosyntax and syntax. Berlin: de Gruyter. D U N K E L , Curtis/ Kerpelman, Jennifer (Hrsg.) (2006): Possible selves. Theory, Research and Applications. New York: Nova Science. D Ü R S C H E I D , Christa (2007): Syntax: Grundlagen und Theorien. 4. Aufl. Göttingen: Vanden‐ hoeck & Ruprecht. Bibliographie 635 D ÜW E L L , Henning (1979): Fremdsprachenunterricht im Schülerurteil. Untersuchungen zu Motivation, Einstellungen und Interessen von Schülern im Fremdsprachenunterricht Schwerpunkt Französisch. Tübingen: Narr. E C C L E S , Jacquelynne S. (2005): Subjective task value and the Eccles et al. model of achievement related choices. In: Elliot, Andrew J. (Hrsg.): Handbook of competence and motivation. New York: The Guilford Press, S.-105-121. E C C L E S , Jacquelynne S./ Wigfield, Allan/ Harold, Rena D./ Blumenfeld, Phyllis (1993): Age and Gender Differences in Children's Selfand Task-Perceptions during Elementary School. In: Child Development 64 (3), S.-830-847. E C K E R T , Thomas/ Gniewosz, Burkhard (Hrsg.) (2017): Bildungsgerechtigkeit. Wiesbaden: Springer VS. E D M O N D S O N , Willis J./ House, Juliane (2011): Einführung in die Sprachlehrforschung. 4. Aufl. Stuttgart: Francke. E H L A N D , Christoph/ Mindt, Ilka/ Tönnies, Merle (Hrsg.) (2016): Anglistentag 2015 Pader‐ born. Proceedings. Trier: Wissenschaftlicher Verlag. E H L E R S , Swantje (2006): Entwicklung von Lesekompetenz in der Fremdsprache. In: Babylonia (3-4), S.-31-38. E H R M A N , Madeleine/ Oxford, Rebecca (1988): Effects of Sex Differences, Career Choice, and Psychological Type on Adult Language Learning Strategies. In: The Modern Language Journal 72 (3), S.-253-265. E I S E N B E R G , Leon/ Berlin, Charles I./ Dille, Anne/ Frank, Sheldon (1968): Class and race effects on the intelligibility of monosyllables. In: Child Development 39, S.-1077-1089. E K S T R A N D , Lars Henric (1980): Sex differences in second language learning? Empirical studies and a discussion of related findings. In: Applied Psychology 29 (1-2), S. 205-259. E L L I O T , Andrew J. (Hrsg.) (2005): Handbook of competence and motivation. New York: The Guilford Press. E L S N E R , Daniela/ Lohe, Viviane (Hrsg.) (2016): Gender and Language Learning. Research and Practice. Tübingen: Narr. E L Y , Christopher M. (1995): Tolerance of ambiguity and the teaching of ESL. In: Reid, Joy M. (Hrsg.): Learning styles in the ESL/ EFL classroom. New York: Heinle and Heinle, S.-216-217. E N T W I S L E , Doris R./ Alexander, Karl L./ Olson, Linda S. (2007): Early Schooling: The Handicap of Being Poor and Male. In: Sociology of Education 80 (2), S.-114-138. E R I K S S O N , Mårten/ Marschik, Peter B./ Tulviste, Tiia/ Almgren, Margareta/ Pérez Pereira, Miguel/ Wehberg, Sonja/ Marjanovič-Umek, Ljubica/ Gayraud, Frederique/ Kovacevic, Melita/ Gallego, Carlos (2012): Differences between girls and boys in emerging language skills: evidence from 10 language communities. In: The British journal of developmental psychology 30 (2), S.-326-343. 636 Bibliographie E R K I N G E R , Margot (2012): Kognitive Interviews - eine methodologische Studie zur Konsistenz der Ergebnisse zweier kognitiver Pretestungen. Universität Wien. E U R O P A R A T (2001): Gemeinsamer europäischer Referenzrahmen für Sprachen: lernen, lehren, beurteilen. Online verfügbar unter http: / / student.unifr.ch/ pluriling/ assets/ files/ Refe‐ renzrahmen2001.pdf, zuletzt geprüft am 07.10.2019. E U R O P E A N A S S O C I A T I O N F O R L A N G U A G E T E S T I N G A N D A S S E S S M E N T (EALTA) (Hrsg.): EALTA-Richtlinien zur Qualitätssicherung bei der Bewertung von Sprachkompe‐ tenzen. Online verfügbar unter http: / / www.ealta.eu.org/ documents/ archive/ guideli nes/ German.pdf, zuletzt geprüft am 16.09.2019. F A B E R , Günther (2009): Die Erfassung kognitiv-motivationaler Lernermerkmale gegen Ende der gymnasialen Sekundarstufe I. Ergebnisse aus einem interdisziplinären Forschungsprojekt zur mündlichen Erzählkompetenz in Englisch. In: Zeitschrift für Fremdsprachenforschung (ZFF) 20 (2), S.-179-212. F A R H A D Y , Hossein (1982): Measures of Language Proficiency from the Learner's Perspec‐ tive. In: TESOL Quarterly 16 (1), S.-43. F A S O L D , Ralph (1984): The sociolinguistics of society. An introduction to sociolinguistics. Oxford: Blackwell. F A U L S T I C H -W I E L A N D , Hannelore (2004): Geschlechteraspekte in der Bildung. Bundeszentrale für politische Bildung. Berlin. Online verfügbar unter https: / / www.ew.uni-hambu rg.de/ ueber-die-fakultaet/ personen/ faulstich-wieland/ files/ bpb-2004-pdf.pdf, zuletzt geprüft am 30.09.2020. F A U L S T I C H -W I E L A N D , Hannelore (Hrsg.) (2011): Umgang mit Heterogenität und Differenz. 2. Aufl. Baltmannsweiler: Schneider Hohengehren. F A U L S T I C H -W I E L A N D , Hannelore/ Horstkemper, Marianne (2012): Schule und Genderfor‐ schung. In: Kampshoff, Marita/ Wiepcke, Claudia (Hrsg.): Handbuch Geschlechterfor‐ schung und Fachdidaktik. Wiesbaden: Springer VS, S.-25-38. F A U S T O -S T E R L I N G , Anne (2000): Sexing the Body. Gender Politics and the Construction of Sexuality. New York: Basic Books. F A Y O L , Michel/ Jaffré, Jean-Pierre (2014): L'orthographe. Paris: PUF. F E I N G O L D , Alan (1988): Cognitive Gender Differences Are Disappearing. In: American Psychologist 43 (2), S.-95-103. F E L D M A N , Heidi M./ Dollaghan, Christine A./ Campbell, Thomas F./ Kurs-Lasky, Marcia/ Janosky, Janine E./ Paradise, Jack L. (2000): Measurement properties of the MacArthur communicative development inventories at ages one and two years. In: Child Deve‐ lopment 71 (2), S.-310-322. F E L I C I A N O , Cynthia/ Rumbaut, Rubén G. (2005): Gendered paths: Educational and occupa‐ tional expectations and outcomes among adult children of immigrants. In: Ethnic and Racial Studies 28 (6), S.-1087-1118. Bibliographie 637 F E N S O N , Larry/ Dale, Philip S./ Reznick, J. Steven/ Bates, Elizabeth/ Thal, Donna J./ Pethick, Stephen J./ Tomasello, Michael/ Mervis, Carolyn B./ Stiles, Joan (1994): Variability in Early Communicative Development. In: Monographs of the Society for Research in Child Development 59 (5), S.-174-185. F E R NÁN D E Z A M M A N N , Eva Maria/ Kropp, Amina/ Müller-Lancé, Johannes (Hrsg.) (2015): Herkunftsbedingte Mehrsprachigkeit im Unterricht der romanischen Sprachen. Berlin: Frank & Timme. F I E L D , John (25-27 February 2005): Second Language Writing. A language problem or a writing problem? Paper presented at IA TEFL Research SIG 'Writing Revisited' conference, 25-27 February 2005. F I E L D , John (2009): Psycholinguistics. A resource book for students. London: Routledge. F I L L M O R E , Charles J. (2013): Berkeley Construction Grammar. In: Hoffmann, Thomas/ Trousdale, Graeme (Hrsg.): The Oxford Handbook of Construction Grammar. Oxford: Oxford University Press, S.-111-132. F I N K B E I N E R , Claudia (2005): Interessen und Strategien beim fremdsprachlichen Lesen. Wie Schülerinnen und Schüler englische Texte lesen und verstehen. Tübingen: Narr. F I N K B E I N E R , Claudia/ Schnaitmann, Gerhard W. (Hrsg.) (2001): Lehren und Lernen im Kontext empirischer Forschung und Fachdidaktik. Donauwörth: Auer. F O L T A -S C H O O F S , Kristian/ Ostermann, Britta (2019): Neurodidaktik. Grundlagen für Stu‐ dium und Praxis. Stuttgart: Kohlhammer. F R A N K , Blye/ Kehler, Michael/ Lovell, Trudy/ Davison, Kevin (2003): A Tangle of Trouble: Boys, masculinity and schooling---future directions. In: Educational Review 55 (2), S.-119-133. F R E U D , Sigmund (1925): Einige psychische Folgen des anatomischen Geschlechterunter‐ schieds. In: Internationale Zeitschrift für Psychoanalyse 9 (4), S.-401-410. F R O M M , Sabine (2012): Datenanalyse mit SPSS für Fortgeschrittene. 2. Aufl. Wiesbaden: Springer VS. F U C H S , Claudia (2005): Selbstwirksam Lernen im schulischen Kontext. Kennzeichen---Be‐ dingungen---Umsetzungsbeispiele. Bad Heilbrunn: Klinkhardt. F U C H S , Stefanie (2013): Geschlechtsunterschiede bei motivationalen Faktoren im Kontext des Englischunterrichts. Eine empirische Studie zu Motivation, Selbstkonzept und Interesse im Fach Englisch in der Sekundarstufe I. Frankfurt a. M.: Lang. F U C H S , Stefanie (2014): Geschlechtsunterschiede bei motivationalen Faktoren im Kontext des Englischunterrichts der Sekundarstufe I: Ausgewählte Ergebnisse einer empiri‐ schen Studie zu Motivation und Interesse. In: Zeitschrift für Fremdsprachenforschung (ZFF) 25 (2), S.-175-205. G A G E , Nathaniel L. (Hrsg.) (1963): Handbook of Research on Teaching. A Project on The American Educational Research Association. Chicago: McNally. 638 Bibliographie G A N Z E B O O M , Harry B. G. (2010): A new international socio-economic index (ISEI) of occupational status for the international standard classification of occupation 2008 (ISCO-08) constructed with data from the ISSP 2002-2007. With an analysis of quality of occupational measurement in ISSP. Paper presented at the Annual Conference of In‐ ternational Social Survey Programme. Lisbon, May 1 2010. Online verfügbar unter htt p: / / citeseerx.ist.psu.edu/ viewdoc/ download? doi=10.1.1.627.203&rep=rep1&type=pdf, zuletzt geprüft am 25.01.2020. G A N Z E B O O M , Harry B. G./ Treiman, Donald J. (2019): International Stratification and Mobility File. VU University of Amsterdam. Online verfügbar unter http: / / www.harry ganzeboom.nl/ ismf/ , zuletzt aktualisiert am 10.05.2019, zuletzt geprüft am 25.01.2020. G A R A I , Josef E./ Scheinfeld, Amram (1968): Sex differences in mental and behavioral traits. In: Genetic Psychology Monographs 77, S.-169-199. G A R D N E R , Robert C. (1985): Social psychology and second language learning: The role of attitudes and motivation. London: Edward Arnold. G A R D N E R , Robert C. (2002): Integrative motivation and second language acquisition. In: Dörnyei, Zoltán/ Schmidt, Richard (Hrsg.): Motivation and second language acquisition. Honolulu, Hawaii: University of Hawaii Press, S.-1-19. G A R D N E R , Robert C. (2005): Integrative motivation and second language acquisition. Joint Plenary Talk - May 30, 2005. Canadian Association of Applied Linguistics. London, Canada. Online verfügbar unter http: / / publish.uwo.ca/ ~GARDNER/ docs/ caaltalk5final.pdf, zuletzt geprüft am 30.08.2020. G A R D N E R , Robert C. (2010): Motivation and Second Language Acquisition. The socio-edu‐ cational model. New York, Washington: Lang. G A R D N E R , Robert C./ Clément, Richard/ Smythe, Padric C./ Smythe, Cynthia L. (1979): Attitude Motivation Test Battery - Revised. London, Canada: University of Western Ontario. G A R D N E R , Robert C./ Lambert Wallace E. (1959): Motivational variables in second language acquisition. In: Canadian Journal of Psychology 13, S.-266-272. G A R D N E R , Robert C./ Lambert Wallace E. (1972): Attitudes and motivation in second language learning. Rowley, MA: Newbury House. G A R D N E R , Robert C./ MacIntyre Peter D. (1993b): A student's contribution to second-lang‐ uage learning. Part II: Affective variables. In: Language Teaching 26 (26), S.-1-11. G A R D N E R , Robert C./ MacIntyre Peter D. (1993a): On the measurement of affective variables in second language learning. In: Language Learning 43, S.-157-194. G A R D N E R , Robert C./ Masgoret, Anne-Marie/ Tennant, Jeff/ Mihic, Ljiljana (2004): Integra‐ tive Motivation: Changes During a Year-Long Intermediate-Level Language Course. In: Language Learning 54 (1), S.-1-34. G E I S E R , Christian (2011): Datenanalyse mit Mplus. Eine anwendungsorientierte Einführung. 2. Aufl. Wiesbaden: Springer VS. Bibliographie 639 G E IẞL E R , Rainer (2013): Die Metamorphose der Arbeitertochter zum Migrantensohn. In: Berger, Peter A./ Kahlert, Heike (Hrsg.): Institutionalisierte Ungleichheiten. Wie das Bildungswesen Chancen blockiert. 3. Aufl. Weinheim: Beltz, S.-71-100. G E R L A C H , David (2010): Legasthenie und LRS im Englischunterricht. Theoretische Befunde und praktische Einsichten. Münster: Waxmann. G I L L B O R N , David/ Mirza, Heidi S. (2000): Educational inequality. Mapping race, class and gender. A synthesis of research evidence. London: Ofsted. Online verfügbar unter https: / / dera.ioe.ac.uk/ 4428/ 2/ Educational_inequality_mapping_race ,_class_and_gender_(PDF_format).pdf, zuletzt geprüft am 13.01.2019. G I P P E R , Helmut (1985): Kinder unterwegs zur Sprache. Düsseldorf: Schwann. G LÜ C K , Helmut/ Rödel, Michael (Hrsg.) (2016): Metzler Lexikon Sprache. Stuttgart: Metzler. G O H A R D -R A D E N K O V I C , Aline (Hrsg.) (2005): Plurilinguisme, interculturalité et didactique des langues étrangères dans un contexte bilingue. Mehrsprachigkeit, Interkulturalität und Fremdsprachendidaktik in einem zweisprachigen Kontext. Bern: Lang. G O L D M A N , Marlene B./ Troisi, Rebecca/ Rexrode, Kathryn M. (Hrsg.) (2012): Women and Health. Amsterdam: Elsevier. G O L O M B O K , Susan/ Fivush, Robyn (1994): Gender Development. Cambridge: Cambridge University Press. G O R A R D , Stephen/ Rees, Gareth/ Salisbury, Jane (1999): Reappraising the Apparent Under‐ achievement of Boys at School. In: Gender and education 11 (4), S.-441-454. G O T T B U R G S E N , Anja/ Gross, Christiane (2012): Welchen Beitrag leistet "Intersektionalität" zur Klärung von Kompetenzunterschieden bei Jugendlichen? In: Becker, Rolf/ Solga, Heike (Hrsg.): Soziologische Bildungsforschung. Wiesbaden: Springer, S.-86-110. G R E I N , Matthias (2012): Geschlechterforschung und Fachdidaktik Französisch (mit Hinweisen auf Fachdidaktik Spanisch). In: Kampshoff, Marita/ Wiepcke, Claudia (Hrsg.): Handbuch Geschlechterforschung und Fachdidaktik. Wiesbaden: Springer VS, S.-169-183. G R E I N , Matthias (2015): Migrationshintergrund, Gender und Mehrsprachigkeit: Eine intersektionale Perspektive auf zwei Französischlernende und deren Fächerwahl vor dem Übergang in die Oberstufe. In: Fernández Ammann, Eva Maria/ Kropp, Amina/ Müller-Lancé, Johannes (Hrsg.): Herkunftsbedingte Mehrsprachigkeit im Unterricht der romanischen Sprachen. Berlin: Frank & Timme, S.-93-112. G R E V I S S E , Maurice/ Goosse, André (2016): Grevisse langue française. Le bon usage. 16. Aufl. Louvain-la-Neuve: De Boeck. G R O S J E A N , François (2012): Bilingual and Monolingual Language Modes. In: Chapelle, Carol A. (Hrsg.): The Encyclopedia of Applied Linguistics. Oxford, UK: Blackwell. G R O T J A H N , Rüdiger (Hrsg.) (2010): Der C-Test. Beiträge aus der aktuellen Forschung. Frankfurt a. M.: Lang. 640 Bibliographie G R O T J A H N , Rüdiger/ Tesch, Bernd (2010): Messung der Hörverstehenskompetenz im Fach Französisch. In: Porsch, Raphaela (Hrsg.): Standardbasierte Testentwicklung und Leistungsmessung. Französisch in der Sekundarstufe I. Münster: Waxmann, S.-125-150. G R U M , Urška/ Legutke, Michael K. (2016): Sampling. In: Caspari, Daniela/ Klippel, Friede‐ rike/ Legutke, Michael K. (Hrsg.): Forschungsmethoden in der Fremdsprachendidaktik. Ein Handbuch. Tübingen: Narr, S.-78-89. G R ÜN E W A L D , Andreas/ Küster, Lutz (Hrsg.) (2018): Fachdidaktik Spanisch. Stuttgart: Klett. G R ÜN E W A L D -H U B E R , Elisabeth (2011): Was können wir aus den Befunden lernen? Empfehlungen für Lehrpersonen, Lehrpersonenausbildende und Bildungspolitik. In: Hadjar, Andreas (Hrsg.): Geschlechtsspezifische Bildungsungleichheiten. Wiesbaden: VS Springer, S.-441-447. H Ä C K E L , Andrea/ Piske, Thorsten (2016): Welche Rolle spielen Faktoren wie fremdsprach‐ liche Kontaktzeit, Alter, Geschlecht und Migrationshintergrund beim frühen Fremd‐ sprachenlernen in bilingualen Kindertageseinrichtungen? In: Steinlen, Anja K./ Piske, Thorsten (Hrsg.): Bilinguale Programme in Kindertageseinrichtungen. Umsetzungsbei‐ spiele und Forschungsergebnisse. Tübingen: Narr Francke Attempto, S.-161-193. H A D J A R , Andreas (Hrsg.) (2011): Geschlechtsspezifische Bildungsungleichheiten. Wies‐ baden: Springer VS. H A I R , Joseph F. (2014): Multivariate data analysis. 7. Aufl. Harlow, Essex: Prentice Hall. H A L D , Katja/ Schmitz, Marieluise (2008): PONS Großwörterbuch Spanisch. Spanisch-- -Deutsch, Deutsch---Spanisch. Stuttgart: Klett. H A L P E R N , Diane F. (1986): Sex differences in cognitive abilities. Hillsdale: Erlbaum. H A L P E R N , Diane F. (2000): Sex differences in cognitive abilities. 3. Aufl. Mahwah, New Jersey: Erlbaum. H A N N O V E R , Bettina/ Kessels, Ursula (2011): Sind Jungen die neuen Bildungsverlierer? Empirische Evidenz für Geschlechterdisparitäten zuungunsten von Jungen und Er‐ klärungsansätze. In: Zeitschrift für Pädagogische Psychologie 25 (2), S.-89-103. H A N N O V E R , Bettina/ Wolter, Ilka/ Zander, Lysann (2017): Geschlechtergerechtigkeit im Klassenzimmer. In: Eckert, Thomas/ Gniewosz, Burkhard (Hrsg.): Bildungsgerechtig‐ keit. Wiesbaden: Springer VS, S.-201-216. H A N S F O R D , Brian C./ Hattie, John A. (1982): The Relationship Between Self and Achieve‐ ment/ Performance Measures. In: Review of Educational Research 52 (1), S.-123-142. H A R S C H , Claudia (2012): Tests als Untersuchungsgegenstand und Forschungsinstrument in der Fremdsprachenforschung. In: Doff, Sabine (Hrsg.): Fremdsprachenunterricht em‐ pirisch erforschen. Grundlagen - Methoden - Anwendung. Tübingen: Narr, S.-150-168. H A R S C H , Claudia (2016): Testen. In: Caspari, Daniela/ Klippel, Friederike/ Legutke, Mi‐ chael K. (Hrsg.): Forschungsmethoden in der Fremdsprachendidaktik. Ein Handbuch. Tübingen: Narr, S.-205-218. Bibliographie 641 H A R S C H , Claudia/ Martin, Guido (2012): Adapting CEF-descriptors for rating purposes: Validation by a combined rater training and scale revision approach. In: Assessing Writing 17, S.-228-250. H A R S C H , Claudia/ Martin, Guido (2013): Comparing holistic and analytic scoring methods: issues of validity and reliability. In: Assessment in Education: Principles, Policy & Practice 20 (3), S.-281-307. H A R S C H , Claudia/ Pant, Hans Anand/ Köller, Olaf (Hrsg.) (2010): Calibrating standards based assessment tasks for English as a first foreign language. Münster: Waxmann. H A R T , Anna (2001): Mann-Whitney test is not just a test of medians: differences in spread can be important. In: BMJ (Clinical research) 323 (7309), S.-391-393. H A R T E R , Susan (1981): A new self-report scale of intrinsic versus extrinsic orientation in the classroom: Motivational and informational components. In: Developmental Psychology 17 (3), S.-300-312. H A R T I G , Johannes/ Jude, Nina (2008): Sprachkompetenzen von Mädchen und Jungen. In: DESI-Konsortium (Hrsg.): Unterricht und Kompetenzerwerb in Deutsch und Englisch. Ergebnisse der DESI-Studie. Weinheim, Basel: Beltz, S.-202-207. H A S S E L H O R N , Marcus/ Gold, Andreas (2017): Pädagogische Psychologie. Erfolgreiches Lernen und Lehren. 4. Aufl. Stuttgart: Kohlhammer. H A Y I O U -T H O M A S , Marianna E. (2008): Genetic and environmental influences on early speech, language and literacy development. In: Journal of communication disorders 41 (5), S.-397-408. H E C K H A U S E N , Heinz (1989): Motivation und Handeln. 2. Aufl. Berlin, Heidelberg: Springer. H E C K H A U S E N , Jutta/ Heckhausen, Heinz (2018): Entwicklung der Motivation. In: Heck‐ hausen, Jutta/ Heckhausen, Heinz (Hrsg.): Motivation und Handeln. 5. Aufl. Berlin, Heidelberg: Springer, S.-493-540. H E C K H A U S E N , Jutta/ Heckhausen, Heinz (Hrsg.) (2018): Motivation und Handeln. 5. Aufl. Berlin, Heidelberg: Springer. H E D G E S , Larry V./ Nowell, Amy (1995): Sex differences in mental test scores, variability, and numbers of high-scoring individuals. In: Science 269 (5220), S.-41-45. H E I D E R , Fritz (1977): Psychologie der interpersonalen Beziehungen. Stuttgart: Klett. H E I N E M A N N , Margot/ Heinemann, Wolfgang (2002): Grundlagen der Textlinguistik. Inter‐ aktion - Text - Diskurs. Tübingen: Niemeyer. H E I N T S , Detlef/ Müller, Jürgen Eugen/ Reiberg, Ludger (Hrsg.) (2006): Mehrsprachigkeit macht Schule. Münster: Waxmann. H E L B I G , Gerhard (2016): Geschichte der neueren Sprachwissenschaft. 8. Aufl. Wiesbaden: Springer VS. H E L B I G , Marc (2015): Brauchen Mädchen und Jungen gleichgeschlechtliche Lehrkräfte? Eine Überblicksstudie zum Zusammenhang des Lehrergeschlechts mit dem Bildungs‐ 642 Bibliographie erfolg von Jungen und Mädchen. In: Enzyklopädie Erziehungswissenschaft Online 406, S.-1-46. H E L B I G , Marcel (2010a): Sind Lehrerinnen für den geringeren Schulerfolg von Jungen verantwortlich? In: Kölner Zeitschrift für Soziologie und Sozialpsychologie (KZfSS) 62 (1), S.-93-111. H E L B I G , Marcel (2010b): Geschlecht der Lehrer und Kompetenzentwicklung der Schüler. In: Quenzel, Gudrun/ Hurrelmann, Klaus (Hrsg.): Bildungsverlierer. Neue Ungleich‐ heiten. Wiesbaden: Springer VS, S.-273-288. H E L M K E , Andreas (1992): Selbstvertrauen und schulische Leistungen. Göttingen: Hogrefe. H E L M K E , Andreas (2015): Unterrichtsqualität und Lehrerprofessionalität. Diagnose, Evalua‐ tion und Verbesserung des Unterrichts. 7. Aufl. Seelze-Velber: Klett Kallmeyer. H E L M K E , Andreas/ Helmke, Tuyet/ Schrader, Friedrich-Wilhelm/ Wagner, Wolfgang (2009): Skalen der Schülerbefragung. In: Wagner, Wolfgang/ Helmke, Andreas/ Rösner, Ernst (Hrsg.): Deutsch Englisch Schülerleistungen International. Dokumentation der Erhe‐ bungsinstrumente für Schülerinnen und Schüler, Eltern und Lehrkräfte. Frankfurt a. M.: peDOCS, S.-12-156. H E L M K E , Andreas/ Helmke, Tuyet/ Schrader, Friedrich-Wilhelm/ Wagner, Wolf‐ gang/ Klieme, Eckhard/ Nold, Günter/ Schöder, Konrad (2008): Wirksamkeit des Eng‐ lischunterrichts. In: DESI-Konsortium (Hrsg.): Unterricht und Kompetenzerwerb in Deutsch und Englisch. Ergebnisse der DESI-Studie. Weinheim, Basel: Beltz, 382-397. H E L M K E , Andreas/ Ridder, Arnd/ Schrader, Friedrich-Wilhelm (2000): Fragebogen für Schü‐ lerinnen und Schüler der 8. Klassenstufe. Projekt MARKUS. Mathematik-Gesamterhe‐ bung Rheinland-Pfalz: Kompetenzen, Unterrichtsbedingungen, Schulkontext. Online verfügbar unter http: / / andreas-helmke.de/ wordpress/ wp-content/ uploads/ 2015/ 01/ m arkus_SchuelerFB.pdf, zuletzt geprüft am 30.09.2020. H E L M K E , Andreas/ Schrader, Friedrich-Wilhelm/ Wagner, Wolfgang/ Nold, Gün‐ ther/ Schröder, Konrad (2008): Selbstkonzept, Motivation und Englischleistung. In: DESI-Konsortium (Hrsg.): Unterricht und Kompetenzerwerb in Deutsch und Englisch. Ergebnisse der DESI-Studie. Weinheim, Basel: Beltz, S.-244-257. H E M M E R I C H , Wanja (2019): StatistikGuru: Poweranalyse und Stichprobenberechnung für Regression. Online verfügbar unter https: / / statistikguru.de/ rechner/ poweranalyse-re gression.html, zuletzt geprüft am 20.08.2020. H E N R I C H S , Jens/ Rescorla, Leslie/ Schenk, Jacqueline J./ Schmidt, Henk G./ Jaddoe, Vincent W. V./ Hofman, Albert/ Raat, Hein/ Verhulst, Frank C./ Tiemeier, Henning (2011): Exa‐ mining Continuity of Early Expressive Vocabulary Development: The Generation R Study. In: Journal of Speech, Language, and Hearing Research 54 (3), S.-854-869. H E N R Y , Alastair (2009): Gender differences in compulsory school pupils’ L2 self-concepts: A longitudinal study. In: System 37 (2), S.-177-193. Bibliographie 643 H E N R Y , Alastair (2011): Gender differences in L2 motivation: A reassessment. In: Samuel A. Davies (Hrsg.): Gender gap: Causes, experiences and effects. New York: Nova Science Publishers, S.-81-101. H E N R Y , Alastair (2012): L3 Motivation. Doctoral dissertation. Gothenburg, Schweden: Acta Universitatis Gothoburgensis. H E N R Y , Alastair/ Apelgren, Britt M. (2008): Young learners and multilingualism: A study of learner attitudes before and after the introduction of a second foreign language to the curriculum. In: System 36 (4), S.-607-623. H E N R Y , Alastair/ Cliffordson, Christina (2013a): Motivation, Gender, and Possible Selves. In: Language Learning 63 (2), S.-271-295. H E N R Y , Alastair/ Cliffordson, Christina (2013b): Motivation, Gender, and Possible Selves. Supplementary materials. Online verfügbar unter https: / / onlinelibrary.wiley.com/ ac tion/ downloadSupplement? doi=10.1111%2Flang.12009&file=lang12009-sup-0001-Tab leS1.pdf, zuletzt geprüft am 20.03.2020. H E R M A N N , Gisela (1978): Lernziele im affektiven Bereich. Eine empirische Untersuchung zu den Beziehungen zwischen Englischunterricht und Einstellungen von Schülern. Paderborn: Schöningh. H E R M A N N , Gisela (1980): Attitudes and Success in Children's Learning of English as a Second Language: The Motivational vs. the Resultative Hypothesis. In: English Language Teaching Journal 34 (4), S.-247-254. H E R T E L , Elke (1994): Der Schüler der Sekundarstufe I im Bundeswettbewerb Fremdsprachen. Empirische Untersuchungen zur Effizienz des Wettbewerbs als Instrument der Sprachen‐ förderung. Augsburg: Univ., Lehrstuhl für Didaktik des Englischen. H I D I , Suzanne/ Renninger, K. Ann (2006): The Four-Phase Model of Interest Development. In: Educational Psychologist 41 (2), S.-111-127. H I G G I N S , E. Tory (1996): The "self digest": Self-knowledge serving self-regulatory func‐ tions. In: Journal of Personality and Social Psychology 71 (6), S.-1062-1083. H O F F M A N N , Thomas/ Trousdale, Graeme (Hrsg.) (2013): The Oxford Handbook of Construc‐ tion Grammar. Oxford: Oxford University Press. H O L D E R , Martin C. (2005): Fähigkeitsselbstkonzept und Leistungsmotivation im Fremdspra‐ chenunterricht. Bern: Lang. H O L M L U N D , Helena/ Sund, Krister (2008): Is the Gender Gap in School Performance Affected by the Sex of the Teacher? In: Labour Economics 15 (1), S.-37-53. H O O K , Sidney (Hrsg.) (1969): Language and Philosophy: A Symposium. New York: New York University Press. H O P P , Holger/ Kieseier, Teresa/ Vogelbacher, Markus/ Thoma, Dieter (2018): Einflüsse und Potenziale der Mehrsprachigkeit im Englischerwerb in der Primarstufe. In: Mehlhorn, Grit/ Brehmer, Bernhard (Hrsg.): Potenziale von Herkunftssprachen. Sprachliche und außersprachliche Einflussfaktoren. Tübingen: Stauffenburg, S.-57-80. 644 Bibliographie H O R N B E R G E R , Nancy H./ King, Kendall A. (Hrsg.) (2008): Encyclopedia of language and education. 2. Aufl. New York: Springer. H O R S T K E M P E R , Marianne (1995): Mädchen und Frauen im Bildungswesen. In: Böttcher, Wolfgang/ Klemm, Klaus (Hrsg.): Bildung in Zahlen. Statistisches Handbuch zu Daten und Trends im Bildungsbereich. Weinheim, München: Juventa, S.-188-216. H O R W I T Z , Elaine K. (2001): Language Anxiety and Achievement. In: Annual Review of Applied Linguistics 21, S.-112-126. H O R W I T Z , Elaine K./ Horwitz, Michael B./ Cope, Joann (1986): Foreign Language Classroom Anxiety. In: The Modern Language Journal 70 (2), S.-125. H O S E N F E L D , Ingmar (Hrsg.) (2006): Schulische Leistung. Grundlagen, Bedingungen, Perspek‐ tiven. Münster: Waxmann. H U N Z E , Annette (2003): Geschlechtertypisierung in Schulbüchern. In: Stürzer, Mo‐ nika/ Roisch, Henrike/ Hunze, Annette/ Cornelißen, Waltraud (Hrsg.): Geschlechterver‐ hältnisse in der Schule. Wiesbaden: Springer VS, S.-53-81. H UẞM A N N , Anke/ Wendt, Heike/ Bos, Wilfried/ Bremerich-Vos, Albert/ Kasper, Dankel/ Lankes, Eva-Maria/ McElvany, Nele/ Stubbe, Tobias C./ Valtin, Renate (Hrsg.) (2017): IGLU 2016. Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich. Münster, New York: Waxmann. H U T T E N L O C H E R , Janellen/ Haight, Wendy/ Byrk, Anthony/ Seltzer, Michael/ Lyosn, Thomas (1991): Early vocabulary growth: Relation to language input and gender. In: Develop‐ mental Psychology 27, S.-236-248. H Y D E , Janet S. (2005): The Gender Similarities Hypothesis. In: American Psychologist 60 (6), S.-581-592. H Y D E , Janet S./ Linn, Maria C. (1988): Gender Differences in Verbal Ability: A Meta-Ana‐ lysis. In: Psychological Bulletin 104 (1), S.-53-69. H Y D E , Janet S./ McKinley, Nita M. (1997): Gender Differences in Cognition: Results from Meta-Analyses. In: Caplan, Paula J./ Crawford, Mary/ Shibley Hyde, Janet/ Richardson, John T. E. (Hrsg.): Gender differences in human cognition. New York: Oxford University Press, S.-30-51. H Y L A N D , Ken (2002): Teaching and Researching Writing. Harlow: Pearson. H Y L A N D , Ken (2016): Teaching and Researching Writing. 3. Aufl. New York: Routledge. IBM (2019): IBM SPSS Missing Values 26. Armonk, NY. Online ver‐ fügbar unter ftp: / / public.dhe.ibm.com/ software/ analytics/ spss/ documentation/ sta‐ tistics/ 26.0/ de/ client/ Manuals/ IBM_SPSS_Missing_Values.pdf, zuletzt geprüft am 30.09.2020. I G O , Robert P. (2010): Influential Data Points. In: Salkind, Neil J. (Hrsg.): Encyclopedia of Research Design. Bd.-2. Thousand Oaks, Calif.: Sage, S.-600-602. I N S T I T U T Z U R Q U A L I TÄT S E N T W I C K L U N G I M B I L D U N G S W E S E N (IQB) (2013): Bildungsstandards, Bildungsmonitoring und Bildungsforschung: Ländervergleichsstudien des IQB. Berlin. Bibliographie 645 Online verfügbar unter http: / / ratswd.de/ 6kswd/ style/ praesentationen/ G-6KSWD_Ra tSWD_Stanat.pdf, zuletzt geprüft am 16.05.2021. I N S T I T U T O C E R V A N T E S (2007): Plan curricular del Instituto Cervantes. Niveles de referencia para el español. Madrid: Edelsa. I N S T I T U T O C E R V A N T E S (2014): Guía del examen B1. Online verfügbar unter https: / / exam enes.cervantes.es/ sites/ default/ files/ guia_examen_dele_b1_1.pdf, zuletzt geprüft am 20.09.2020. I N S T I T U T O C E R V A N T E S (2016): Elaboración exámenes DELE. Online verfügbar unter https: / / examenes.cervantes.es/ sites/ default/ files/ instituto_cervantes_elaboracion_dele.pdf, zuletzt geprüft am 17.10.2019. I T T E L , Angela/ Merkens, Hans/ Stecher, Ludwig (Hrsg.) (2011): Jahrbuch Jugendforschung. Wiesbaden: Springer VS. J Ä G E R , Adolf Otto/ Süß, Heinz-Martin/ Beauducel, André (1997): Berliner Intelligenz‐ struktur-Test: BIS-Test: Form 4: mit einem separat verwendbaren Kurztest der Allge‐ meinen Intelligenz und der Verarbeitungskapazität. Göttingen: Hogrefe. J A M E S , Carl (2013): Errors in language learning and use. Exploring error analysis. London, New York: Routledge. J A M E S , Sharon L./ Miller, John F. (1973): Children's Awareness of Semantic Constraints in Sentences. In: Child Development (44), S.-69-76. J A N I C H , Nina (Hrsg.) (2008): Textlinguistik. 15 Einführungen. Tübingen: Narr. J A N S E N , Malte/ Schroeders, Ulrich/ Stanat, Petra (2013): Motivationale Schülermerkmale in Mathematik und den Naturwissenschaften. In: Pant, Hans Anand/ Stanat, Petra/ Schroeders, Ulrich/ Roppelt, Alexander/ Siegle, Thilo/ Pöhlmann, Claudia (Hrsg.): IQB-Ländervergleich 2012. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I. Münster: Waxmann, S.-347-365. J E R U S A L E M , Matthias/ Hopf, Diether (Hrsg.) (2002): Selbstwirksamkeit und Motivationspro‐ zesse in Bildungsinstitutionen. Weinheim: Beltz (Zeitschrift für Pädagogik, Beiheft 44). J E S S N E R , Ulrike (1992): Zur Ontogenese von geschlechtsbedingten Sprachmerkmalen. In: Grazer Linguistische Studien 38, S.-111-136. J I M É N E Z C A T A LÁN , Rosa María (2003): Sex differences in L2 vocabulary learning strategies. In: International Journal of Applied Linguistics 13 (1), S.-54-77. J I M É N E Z C A T A LÁN , Rosa María/ Terrazas Gallego, Melania (2005-2008): The Receptive Vocabulary of English Foreign Language Young Learners. In: Journal of English Studies 5-6, S.-173-191. J O N E S , Barry/ Jones, Gwenneth (2001): Boys' performance in modern foreign languages: Listening to learners. A project carried out by Homerton College, Cambridge on behalf of QCA. London: CILT. J O P T , Uwe-Jörg (1978): Selbstkonzept und Ursachenerklärung in der Schule. Zur Attribuie‐ rung von Schulleistungen. Bochum: Kamp. 646 Bibliographie J Ö S T I N G , Sabine/ Seemann, Malwine (Hrsg.) (2006): Gender und Schule. Geschlechterver‐ hältnisse in Theorie und schulischer Praxis. Oldenburg: BIS-Verlag. J U D E , Nina (2008): Zur Struktur von Sprachkompetenz. Frankfurt am Main: Univ. Diss. Online verfügbar unter http: / / publikationen.ub.uni-frankfurt.de/ volltexte/ 2009/ 6794/ , zuletzt geprüft am 01.04.2018. K A B A T E K , Johannes/ Pusch, Claus D. (2011): Spanische Sprachwissenschaft. Eine Einfüh‐ rung. 2. Aufl. Tübingen: Narr. K A H L K E , Ruth (1996): Frauen und Sprachvermittlung. In: Neusprachliche Mitteilungen aus Wissenschaft und Praxis 49 (1), S.-19-25. K A L L U S , Konrad Wolfgang (2016): Erstellung von Fragebogen. 2. Aufl. Wien: Facultas. K A M P S H O F F , Marita/ Wiepcke, Claudia (Hrsg.) (2012): Handbuch Geschlechterforschung und Fachdidaktik. Wiesbaden: Springer VS. K A N T O N Z Ü R I C H (2018): Volksschulamt. Zürich. Online verfügbar unter https: / / vsa.zh.c h/ internet/ bildungsdirektion/ vsa/ de/ schulstufen_schulen/ schulstufen/ sekundar.html , zuletzt geprüft am 01.04.2018. K A S S , Richard A./ Tinsley, Howard E. A. (1979): Factor Analysis. In: Journal of Leisure Research 11 (2), S.-120-138. K E C K E R , Gabriele (2016): Der GeR als Referenzsystem für kompetenzorientiertes Testen: -Was bedeutet der Bezug zum GeR für eine Sprachprüfung? In: Zeitschrift für Fremdsprachenforschung (ZFF) 27 (1), S.-13-37. K E L L E , Udo (2014): Mixed Methods. In: Baur, Nina/ Blasius, Jörg (Hrsg.): Handbuch Methoden der empirischen Sozialforschung. Wiesbaden: Springer, 153-166. K E L L E R , Carmen (1998): Geschlechterdifferenzen in der Mathematik: Prüfung von Erklä‐ rungsansätzen: eine mehrebenenanalytische Untersuchung im Rahmen der 'Third inter‐ national mathematics and science study'. Zürich: Universität Zürich. K E L L E R , John M. (1983): Motivational design of instruction. In: Reigeluth, Charles M. (Hrsg.): Instruction-design theories and models. An overview of their current status. Hillsdale, NJ: IEA, S.-386-433. K E M M E L M E I E R , Markus/ Oyserman, Daphna (2001): Gendered Influence of Downward Social Comparisons on Current and Possible Selves. In: Journal of Social Issues 57 (1), S.-129-148. K E R S T E N , Kristin/ Rohde, Andreas/ Schelleter, Christina/ Steinlen, Anja (Hrsg.) (2010): Bilingual preschools. Volume I: Learning and Development. Trier: Wissenschaftlicher Verlag. K H A T R A , Simrit (2013): Je parle française, où? Interlangue française d'un germanophone. Étude longitudinale du lexique. Innsbruck: Innsbruck University Press. K I M , Tae-Young (2009): Korean Elementary School Students’ Perceptual Learning Style, Ideal L2 Self, and Motivated Behavior. In: Korean Journal of English Language and Linguistics 9 (3), S.-461-486. Bibliographie 647 K I R C H N E R , Katharina (2004): Motivation beim Fremdsprachenerwerb. Eine qualitative Pi‐ lostudie zur Motivation schwedischer Deutschlerner. In: Zeitschrift für Interkulturellen Fremdsprachenunterricht 9 (2), S.-1-33. K I S S A U , Scott (2006a): Gender differences in second language motivation: An investiga‐ tion of microand macro-level influences. In: Canadian Journal of Applied Linguistics (CJAL)/ Revue canadienne de linguistique appliquée (RCLA) 9 (1), S.-73-96. K I S S A U , Scott (2006b): Gender differences in motivation to learn French. In: Canadian modern language review 62 (3), S.-401-422. K I S S A U , Scott/ Kolano, Lan Quach/ Wang, Chuang (2010): Perceptions of Gender Diffe‐ rences in High School Students' Motivation to Learn Spanish. In: Foreign Language Annals 43 (4), S.-703-712. K I S S A U , Scott/ Turnbull, Miles (2008): Boys and French as a second language: A research agenda for greater understanding. In: Canadian Journal of Applied Linguistics (CJAL)/ Revue canadienne de linguistique appliquée (RCLA) 11, S.-151-170. K L A N N -D E L I U S , Gisela (2005): Sprache und Geschlecht. Stuttgart: Metzler. K L E I N , Hans-Wilhelm/ Kleineidam, Hartmut (2011): Grammatik des heutigen Französisch. Das bewährte Standardwerk für Schule, Studium und Beruf. 16. Aufl. Stuttgart: Klett. K L I E M E , Eckhard/ Hartig, Johannes (2007): Kompetenzkonzepte in den Sozialwissen‐ schaften und im erziehungswissenschaftlichen Diskurs. In: Prenzel, Manfred/ Gogolin, Ingrid/ Krüger, Heinz-Hermann (Hrsg.): Kompetenzdiagnostik. Wiesbaden: Springer VS, S.-11-29. K L I N E , Rex B. (2016): Principles and Practice of Structural Equation Modeling. 4. Aufl. New York, London: The Guilford Press. K N A P P , Gudrin-Axeli (2008): Intersectionality---ein neues Paradigma der Geschlechter‐ forschung? In: Casale, Rita/ Rendtorff, Barbara (Hrsg.): Was kommt nach der Gender‐ forschung? Zur Zukunft feministischer Theoriebildung. Bielefeld: Transcript, S.-33-53. K N E C H T , Pierre: Die französischsprachige Schweiz. In: Bickel, Hans/ Schläpfer, Robert (Hrsg.): Die viersprachige Schweiz. 2. Aufl. Aarau: Sauerländer, S.-139-176. K N O X , Michele (2006): Gender and Possible Selves. In: Dunkel, Curtis/ Kerpelman, Jennifer (Hrsg.): Possible selves. Theory, Research and Applications. New York: Nova Science, S.-61-77. K O B A Y A S H I , Miyoko (2002): Method effects on reading comprehension test performance: text organization and response format. In: Language Testing 19 (2), S.-193-220. K O C H , Corinna (2018): Curriculare Vorgaben für Spanischunterricht in Deutschland. In: Grünewald, Andreas/ Küster, Lutz (Hrsg.): Fachdidaktik Spanisch. Stuttgart: Klett, S.-28-36. K O C H , Peter/ Oesterreicher, Wulf (2011): Gesprochene Sprache in der Romania. Französisch, Italienisch, Spanisch. 2. Aufl. Berlin: de Gruyter. 648 Bibliographie K O E N I G S K N E C H T , Roy A./ Friedman, Philip (1976): Syntax development in boys and girls. In: Child Development 47, S.-1109-1115. K ÖL L E R , Olaf (1998): Zielorientierungen und schulisches Lernen. Münster: Waxmann. K ÖL L E R , Olaf/ Knigge, Michel/ Tesch, Bernd (Hrsg.) (2010): Sprachliche Kompetenzen im Ländervergleich. Befunde des ersten Ländervergleichs zur Überprüfung der Bildungsstan‐ dards für den Mittleren Schulabschluss in den Fächern Deutsch, Englisch und Französisch. Münster: Waxmann. K ÖN I G , Lotta/ Surkamp, Carola/ Decke-Cornill, Helene (2015): Negotiating Gender. In: Der fremdsprachliche Unterricht Englisch 49, S.-135. K O N R A D , Klaus (2010): Mündliche und schriftliche Befragung. Ein Lehrbuch. 6. Aufl. Landau: Verlag empirische Pädagogik. K O N R A D , Kerstin/ Firk, Christine/ Uhlhaas, Peter J. (2013): Brain development during adolescence: neuroscientific insights into this developmental period. In: Deutsches Ärzteblatt international 110 (25), S.-425-431. K O N S O R T I U M H A R M O S F R E M D S P R A C H E N (2009): Wissenschaftlicher Kurzbericht und Kompetenzmodell. Provisorische Fassung (vor Verabschiedung der Standards). On‐ line verfügbar unter https: / / edudoc.educa.ch/ static/ web/ arbeiten/ harmos/ L2_wissB _ 25_1_10_d.pdf, zuletzt geprüft am 20.09.2019. K O R H O N E N , Jarmo (2016): Idiom. In: Glück, Helmut/ Rödel, Michael (Hrsg.): Metzler Lexikon Sprache. Stuttgart: Metzler, S.-279. K ÖT T E R , Markus/ Rymarczyk, Jutta (Hrsg.) (2015): Englischunterricht auf der Primarstufe. Neue Forschungen - weitere Entwicklungen. Frankfurt a. M.: Lang. K R A P P , Andreas (2002b): Structural and dynamic aspects of interest development: theo‐ retical considerations from an ontogenetic perspective. In: Learning and Instruction 12 (4), S.-383-409. K R A P P , Andreas (2002): An Educational-Psychological Theory of Interest and Its Relation to SDT. In: Deci, Edward L./ Ryan, Richard M. (Hrsg.): Handbook of Self-Determination Research. Rochester, NY: University of Rochester Press, S.-405-427. K R A P P , Andreas (2010): Interesse. In: Detlef Rost (Hrsg.): Handwörterbuch Pädagogische Psychologie. 4. Aufl. Weinheim, Basel: Beltz, S.-286-296. K R A P P , Andreas/ Lewalter, Doris (2001): Development of Interests and Interest-based Mo‐ tivational Orientations: A Longitudinal Study in Vocation School and Work Settings. In: Volet, Simone/ Järvelä, Sanna (Hrsg.): Advances in learning and instruction series. Motivation in learning contexts: Theoretical advances and methodological implications. New York: Pergamon Press, S.-209-232. K R A P P , Andreas/ Ryan, Richard M. (2002): Selbstwirksamkeit und Lernmotivation. Eine kritische Betrachtung der Theorie von Bandura aus der Sicht der Selbstbestimmungs‐ theorie und der pädagogisch-psychologischen Interessentheorie. In: Jerusalem, Mat‐ Bibliographie 649 thias/ Hopf, Diether (Hrsg.): Selbstwirksamkeit und Motivationsprozesse in Bildungsin‐ stitutionen. Weinheim: Beltz (Zeitschrift für Pädagogik, Beiheft 44), S.-54-82. K R E L L , Gertraude/ Riedmüller, Barbara/ Sieben, Barbara/ Vinz, Dagmar (Hrsg.) (2007a): Diversity Studies. Grundlagen und disziplinäre Ansätze. Frankfurt a. M.: Campus Frankfurt. K R E L L , Gertraude/ Riedmüller, Barbara/ Sieben, Barbara/ Vinz, Dagmar (2007b): Diversity Studies als integrierende Forschungsrichtung. In: Krell, Gertraude/ Riedmüller, Bar‐ bara/ Sieben, Barbara/ Vinz, Dagmar (Hrsg.): Diversity Studies. Grundlagen und diszi‐ plinäre Ansätze. Frankfurt a. M.: Campus Frankfurt, S.-7-16. K R E T S C H M A N N , Rudolf/ Schulte, Werner (2004): Risikolagen bei Vorschulkindern---Er‐ gebnisse der bremerischen Sprachstandsprüfungen für den Einschulungsjahrgang 2004. In: Lüdtke, Ulrike (Hrsg.): Fokus: Mensch. Subjektzentrierte Unterrichts- und Therapiemodelle in der Sprachbehindertenpädagogik. Würzburg: edition freisleben, S.-87-122. K R I S T E N , Cornelia (2006): Ethnische Diskriminierung im deutschen Schulsystem? Theore‐ tische Überlegungen und empirische Ergebnisse. Berlin: Arbeitsstelle Interkulturelle Konflikte und gesellschaftliche Integration, Wissenschaftszentrum Berlin für Sozial‐ forschung. K R U M M , Hans-Jürgen/ Fandrych, Christian/ Hufeisen, Britta/ Riemer, Claudia (Hrsg.) (2010): Deutsch als Fremd- und Zweitsprache. Ein internationales Handbuch. Berlin u. a.: de Gruyter. K R U M M , Stefan/ Schmidt-Atzert, Lothar/ Michalczyk, Kurt/ Danthiir, Vanessa (2008): Speeded Paper-Pencil Sustained Attention and Mental Speed Tests. In: Journal of Individual Differences 29 (4), S.-205-216. K U B I N G E R , Klaus D. (2014): Large-Scale Assessment. In: Wirtz, Markus Antonius (Hrsg.): Dorsch - Lexikon der Psychologie. 18. Aufl. Bern: Hogrefe Verlag, S.-915. K U C K A R T Z , Udo/ Rädiker, Stefan/ Ebert, Thomas/ Schehl, Julia (2013): Statistik. Eine ver‐ ständliche Einführung. 2. Aufl. Wiesbaden: Springer VS. K U H L , Poldi/ Haag, Nicole/ Federlein, Felicitas/ Weirich, Sebastian/ Schipolowski, Stefan (2016a): Soziale Disparitäten. In: Stanat, Petra/ Böhme, Katrin/ Schipolowski, Stefan/ Haag, Nicole (Hrsg.): IQB-Bildungstrend 2015. Sprachliche Kompetenzen am Ende der 9.-Jahrgangsstufe im zweiten Ländervergleich. Münster: Waxmann, S.-409-430. K U H L , Poldi/ Stanat, Petra/ Lütje-Klose, Birgit/ Gresch, Cornelia/ Pant, Hans Anand/ Prenzel, Manfred (Hrsg.) (2015): Inklusion von Schülerinnen und Schülern mit sonder‐ pädagogischem Förderbedarf in Schulleistungserhebungen. Wiesbaden: Springer. K U N N A N , Antony John (Hrsg.) (2000): Fairness and validation in language assessment. Selected papers from the 19th Language Testing Research Colloquium, Orlando, Florida. Cambridge: Cambridge University Press. 650 Bibliographie K U N T E R , Mareike/ Schümer, Gundel/ Artelt, Cordula/ Baumert, Jürgen/ Klieme, Eckhard/ Neubrand, Michael/ Prenzel,Manfred/ Schiefele, Ulrich/ Schneider, Wolf‐ gang/ Stanat, Petra/ Tillmann, Klaus-Jürgen/ Weiß, Manfred (2002): PISA 2000: Doku‐ mentation der Erhebungsinstrumente. Berlin: Max-Planck-Institut für Bildungsfor‐ schung. K Ü P E R S , Hannelore (2002): Empirische Forschung aus konstruktivistischer Sicht. In: Küpers, Hannelore/ Souchon, Marc (Hrsg.): Appropriation des langues au centre de la recherche. Spracherwerb als Forschungsgegenstand. Frankfurt a. M.: Lang, S.-145-158. K Ü P E R S , Hannelore/ Souchon, Marc (Hrsg.) (2002): Appropriation des langues au centre de la recherche. Spracherwerb als Forschungsgegenstand. Frankfurt a. M.: Lang. K Ü P P E R S , Almut/ Quertz, Jürgen (Hrsg.) (2006): Motivation Revisited. Festschrift für Gert Solmecke. Berlin: Lit. K Ü S T E R , Lutz (2007): Schülermotivation und Unterrichtsalltag im Fach Französisch. Ergebnisse einer schriftlichen Befragung an Berliner Gymnasien. In: Französisch heute 38 (3), S.-208-226. L A B O V , William (1991): The intersection of sex and social class in the course of linguistic change. In: Language Variation and Linguistic Change 2, S.-205-251. L A K E N S , Daniël (2013): Calculating and reporting effect sizes to faciliate comulative science: a practical primer for t-tests and ANOVAs. In: Frontiers in psychology 4 (863). Online verfügbar unter https: / / www.frontiersin.org/ articles/ 10.3389/ fpsyg.2013.0086 3/ full, zuletzt geprüft am 20.05.2021. L A N D E S H A U P T S T A D T M A I N Z (2019): Ratsinformationssystem. Online verfügbar unter https: / / bi.mainz.de/ vo0050.php? __kvonr=21812, zuletzt geprüft am 16.12.2019. L A N D E S I N S T I T U T F Ü R S C H U L E N T W I C K L U N G (2016a): Bildungsplan 2016. Gymnasium. Sy‐ nopsen der inhaltsbezogenen Kompetenzen für das Fach Französisch als zweite Fremdsprache. Online verfügbar unter https: / / www.schule-bw.de/ service-und-tool s/ bildungsplaene/ allgemein-bildende-schulen/ bildungsplan-2016/ synopsen/ gymna‐ sium/ BP2016BW_ALLG_GYM_F2_SYNOPSE.pdf, zuletzt geprüft am 14.12.2020. L A N D E S I N S T I T U T F Ü R S C H U L E N T W I C K L U N G (2016b): Bildungsplan 2016. Gymnasium. Synopsen der inhaltsbezogenen Kompetenzen für das Fach Spanisch. Online verfügbar unter https: / / www.schule-bw.de/ service-und-tools/ bildungsplaene/ allgemein-bildende-sch ulen/ bildungsplan-2016/ synopsen/ gymnasium/ BP2016BW_ALLG_GYM_SPA3_ SY‐ NOPSE.pdf, zuletzt geprüft am 14.12.2020. L A N D E S I N S T I T U T F Ü R S C H U L E N T W I C K L U N G / S T A T I S T I S C H E S L A N D E S A M T B A D E N -W Ü R T T E M ‐ B E R G (2018): Bildung in Baden-Württemberg 2018. Stuttgart. Online verfügbar unter https: / / ibbw.kultus-bw.de/ site/ pbs-bw-new/ get/ documents/ KULTUS.Dachma ndant/ KULTUS/ Dienststellen/ ibbw/ Systemanalysen/ Bildungsberichterstattung/ Bil‐ dungsberichte/ Bildungsbericht_2018/ Bildungsbericht_BW_2018.pdf, zuletzt geprüft am 14.12.2020. Bibliographie 651 L A N D T A G V O N B A D E N -W Ü R T T E M B E R G (2017): Antrag der Fraktion der SPD und Stellung‐ nahme des Ministeriums für Kultus, Jugend und Sport. Basiert die geplante Abschaf‐ fung des Fremdsprachenunterrichts in der ersten und zweiten Klasse der Grundschule auf wissenschaftlichen Erkenntnissen oder ist es eine reine Sparmaßnahme? Druck‐ sache 16/ 2384. Online verfügbar unter https: / / www.landtag-bw.de/ files/ live/ sites/ L TBW/ files/ dokumente/ WP16/ Drucksachen/ 2000/ 16_2384_D.pdf zuletzt geprüft am 14.12.2020. L A N G E , Benjamin P./ Euler, Halard A./ Zaretsky, Eugen (2016): Sex differences in lang‐ uage competence of 3to 6-year-old children. In: Applied Psycholinguistics 37 (6), S.-1417-1438. L A N G E , Benjamin P./ Euler, Harald A. (2014): Writers have groupies, too: High quality literature production and mating success. In: Evolutionary Behavioral Sciences 8 (1), S.-20-30. L A Z A R I D E S , Rebecca (2011): Die Bedeutung von Freunden und Fachnote für das schulfach‐ spezifische Interesse bei Mädchen und Jungen. In: Ittel, Angela/ Merkens, Hans/ Ste‐ cher, Ludwig (Hrsg.): Jahrbuch Jugendforschung. Wiesbaden: Springer VS, S. 157-178. L E A P E R , Campbell/ Anderson, Kristin J./ Sanders, Paul (1998): Moderators of Gender Effects on Parents' Talk to Their Children: A Meta-Analysis. In: Developmental Psychology 34 (1), S.-3-27. L E G E W I E , Joscha/ DiPrete, Thomas A. (2012): School Context and the Gender Gap in Educational Achievement. In: American sociological review 77 (3), S.-463-485. L E G U T K E , Michael (2017): Motivation. In: Carola Surkamp (Hrsg.): Metzler Lexikon Fremd‐ sprachendidaktik. Ansätze - Methoden - Grundbegriffe. 2. Aufl. Stuttgart: Metzler, S.-254-256. L E H M A N N , Rainer H./ Hunger, Susanne/ Ivanov, Stanislav/ Gänsfuß, Rüdiger (2004): Aspekte der Lernausgangslage und der Lernentwicklung - Klassenstufe 11. Ergebnisse einer längsschnittlichen Untersuchung in Hamburg. LAU 11. Hamburg: Behörde für Bildung und Sport. L E N H A R D , Wolfgang/ Lenhard, Alexandra (2016): Berechnung von Effektstärken. Dettel‐ bach. Online verfügbar unter https: / / www.psychometrica.de/ effektstaerke.html, zu‐ letzt geprüft am 20.02.2021. L E N Z , Peter/ Studer, Thomas (2004): Sprachkompetenzen von Jugendlichen einschätzbar machen. In: Babylonia 2, 21-25. L E N Z , Peter/ Studer, Thomas (2005): Neue Instrumente für die Beurteilung der Franzö‐ sisch- und Englischkompetenzen von Deutschschweizer Schülerinnen und Schülern. In: Gohard-Radenkovic, Aline (Hrsg.): Plurilinguisme, interculturalité et didactique des langues étrangères dans un contexte bilingue. Mehrsprachigkeit, Interkulturalität und Fremdsprachendidaktik in einem zweisprachigen Kontext. Bern: Lang, S.-37-56. 652 Bibliographie L E N Z , Peter/ Studer, Thomas (2008a): Lingualevel. Instrumente zur Evaluation von Fremd‐ sprachenkompetenzen. 5.-9. Schuljahr. 2. Aufl. Bern: Schulverlag. L E N Z , Peter/ Studer, Thomas (2008b): Lingualevel: Kompetenzraster Schreiben. Bern: Schul‐ verlag. Online verfügbar unter www.lingualevel.de (lizensierter Zugang), zuletzt aktualisiert am 21.04.2020. L E N Z , Peter/ Studer, Thomas (2008c): Lingualevel: Instrumente zur Evaluation von Fremdsprachenkompetenzen. Referenzleistungen: Kommentierte Beispiele von Lerner‐ leistungen. Bern: Schulverlag. L E N Z , Peter/ Studer, Thomas (2008d): Materialien für Standortbestimmungen. Bern: Schul‐ verlag. (Nur über lizensierten Zugang einsehbar). Online verfügbar unter www.lingu alevel.ch, zuletzt aktualisiert am 21.04.2020. L E N Z , Peter/ Studer, Thomas (2009): Lingualevel: Instrumente zur Evaluation von Fremd‐ sprachenkompetenzen. 5. bis 9. Schuljahr Französisch und Englisch Onlinezugang. Herausgegeben von Nordwestschweizerische Erziehungsdirektorenkonferenz (NW EDK), Erziehungsdirektoren-Konferenz der Ostschweizer Kantone und des Fürs‐ tentums Liechtenstein (EDK-Ost) undBildungsdirektoren-Konferenz Zentralschweiz (BKZ), Bern: Schulverlag. Online verfügbar unter www.lingualevel.ch., zuletzt aktua‐ lisiert am 21.04.2020. L E N Z , Peter/ Studer, Thomas/ Mettler, Monika (2006): Projekt IEF „Entwicklung von In‐ strumenten für die Evaluation von Fremdsprachenkompetenzen“. Schlussbericht vom Dezember 2006. NW EDK/ EDK-OST. Freiburg/ Luzern. Online verfügbar unter http: / / fo lk.uio.no/ sirilu/ 2010-Jessheim/ ief-schlussbericht-mit-anhang.pdf, zuletzt geprüft am 11.11.2019. L E R N E R , Richard Martin (Hrsg.) (2006): Handbook of child psychology/ 1: Theoretical models of human development. 6. Aufl. New York: Wiley. L E U C H T , Michael/ Kampa, Nele/ Köller, Olaf (Hrsg.) (2016): Fachleistungen beim Abitur. Vergleich allgemeinbildender und beruflicher Gymnasien in Schleswig-Holstein. LISA 6. Münster: Waxmann. L E U P O L D , Eynar (2007): Französischunterricht als Lernort für Sprache und Kultur. Prinzipien und Praxisbeispiele. Seelze-Velber: Klett Kallmeyer. L E V E L S , Mark/ Dronkers, Jaap/ Kraaykamp, Gerbert (2008): Immigrant Children's Educati‐ onal Achievement in Western Countries: Origin, Destination, and Community Effects on Mathematical Performance. In: American sociological review 73 (5), S.-835-853. L I E N E R T , Gustav A./ Raatz, Ulrich (1998): Testaufbau und Testanalyse. 6. Aufl. Weinheim: Beltz. L I E P M A N N , Detlev/ Beauducel, André/ Brocke, Burkhard/ Amthauer, Rudolf (2007): I-S-T 2000R. Intelligenz-Struktur-Test 2000 R. 2. Aufl. Göttingen: Hogrefe. Bibliographie 653 L I N K E , Angelika/ Nussbaumer, Markus (2000): Rekurrenz. In: Brinker, Klaus/ Antos, Gerd/ Heinemann, Wolfgang (Hrsg.): Text- und Gesprächslinguistik. Ein internationales Handbuch zeitgenössischer Forschung. Berlin, New York: de Gruyter, S.-305-315. L O H A U S , Arnold/ Vierhaus, Marc (Hrsg.) (2015a): Entwicklungspsychologie des Kindes- und Jugendalters für Bachelor. Berlin, Heidelberg: Springer. L O H A U S , Arnold/ Vierhaus, Marc (2015b): Geschlechtertypisierung. In: Lohaus, Ar‐ nold/ Vierhaus, Marc (Hrsg.): Entwicklungspsychologie des Kindes- und Jugendalters für Bachelor. Berlin, Heidelberg: Springer, S.-195-210. L O H A U S , Arnold/ Vierhaus, Marc (2019): Entwicklungspsychologie des Kindes- und Jugend‐ alters für Bachelor. 4. Aufl. Berlin, Heidelberg: Springer. L Ó P E Z R ÚA , Paula (2006): The sex variable in foreign language learning: an integrative approach. In: Porta Linguarum 6, S.-99-114. L O V A S , Gretchen S. (2011): Gender and patterns of language development in mother-tod‐ dler and father-toddler dyads. In: First Language 31 (1), S.-83-108. L U C H T A M A Y A , Svetlana/ Baron-Cohen, Simon/ Reggatt, Peter (2002): Foetal testosterone and vocabulary size in 18and 24-month-old infants. In: Infant Behavior and Develop‐ ment 24, S.-418-424. L ÜD T K E , Ulrike (Hrsg.) (2004): Fokus: Mensch. Subjektzentrierte Unterrichts- und Therapie‐ modelle in der Sprachbehindertenpädagogik. Würzburg: edition freisleben. L U D W I G , Jeanette (1983): Attitudes and Expectations: A Profile of Female and Male Students of College French, German, and Spanish. In: The Modern Language Journal 67 (3), S.-216-227. L ÜH E , Josefine/ Becker, Michael/ Neumann, Marko/ Maaz, Kai (2017): Geschlechtsspezifi‐ sche Leistungsunterschiede in Abhängigkeit der sozialen Herkunft. Eine Untersu‐ chung zur Interaktion zweier sozialer Kategorien. In: Zeitschrift für Erziehungswissen‐ schaft 20 (3), S.-499-519. M A A Z , Kai/ Baumert, Jürgen/ Gresch, Cornelia/ McElvany, Nele (Hrsg.) (2010): Der Über‐ gang von der Grundschule in die weiterführende Schule. Leistungsgerechtigkeit und regionale, soziale und ethnisch-kulturelle Disparitäten. Deutschland. Bonn: Bundesminis‐ terium für Bildung und Forschung (BMBF), Referat Bildungsforschung. Online verfügbar unter https: / / www.nds-zeitschrift.de/ fileadmin/ user_upload/ nds_6-7-2018/ PDFs/ 16_ Der_U__ bergang_von_der_Grundschule_in_die_weiterfu__hrende_Schule.pdf, zu‐ letzt geprüft am 20.11.2020. M A C C A L L U M , Robert C./ Widaman, Keith F./ Zhang, Shaobo/ Hong, Sehee (1999): Sample size in factor analysis. In: Psychological Methods 4 (1), S.-84-99. M A C C O B Y , Eleanor E. (1966a): Sex differences in intellectual functioning. In: Maccoby, Eleanor E. (Hrsg.): The development of sex differences. Stanford, California: Stanford University Press, S.-25-55. 654 Bibliographie M A C C O B Y , Eleanor E. (Hrsg.) (1966b): The development of sex differences. Stanford, California: Stanford University Press. M A C C O B Y , Eleanor E./ Jacklin, Carol N. (1974): The Psychology of Sex Differences. Stanford, California: Stanford University Press. M A C I N T Y R E , Christine (2009): Dyspraxia 5-14: Identifying and supporting young people with movement difficulties. 2. Aufl.: Routledge. M A C I N T Y R E , Peter D./ Baker, Susan C./ Clément, Richard/ Donovan, Leslie A. (2002): Sex and Age Effects on Willingness to Communicate, Anxiety, Perceived Competence, and L2 Motivation Among Junior High School French Immersion Students. In: Language Learning 52 (3), S.-537-564. M A C I N T Y R E , Peter D./ Baker, Susan C./ Clément, Richard/ Donovan, Leslie A. (2003): Tal‐ king in order to learn: Willingness to communicate and intensive language programs. In: Canadian modern language review 59, S.-589-607. M A C I N T Y R E , Peter D./ Clément, Richard/ Dörnyei, Zoltán/ Noels, Komberly A. (1998): Conceptualizing Willingness to Communicate in a L2: A Situational Model of L2 Confidence and Affiliation. In: The Modern Language Journal 82 (4), S.-545-562. M A C I N T Y R E , Peter D./ Doucette, Jesslyn (2010): Willingness to communicate and action control. In: System 38 (2), S.-161-171. M A N N O , Guiseppe (2017): Lesekompetenz im Französisch als 1. und 2. Fremdsprache in einer mehrsprachigen Perspektive bei Primarschüler/ innen am Ende der 6. Klasse. In: Zeitschrift für Interkulturellen Fremdsprachenunterricht. Didaktik und Methodik im Bereich Deutsch als Fremdsprache 22 (1), S.-139-151. M A R J A N O V IČ -U M E K , Ljubica/ Fekonja-Peklaj, Urška (2017): Gender Differences in Child‐ ren’s Language: A Meta-Analysis of Slovenian Studies. In: CEPS Journal 7 (2), S. 97-111. M A R K U S , Hazel R./ Kitayama, Shinobu (1991): Culture and the Self: Implications for Cognition, Emotion, and Motivation. In: Psychological Review 98 (2), S.-224-253. M A R K U S , Hazel/ Nurius, Paula (1986): Possible selves. In: American Psychologist 41 (9), S.-954-969. M A R S H , Herbert W./ Ayotte, Violaine (2003): Do Multiple Dimensions of Self-Concept Become More Differentiated With Age? The Differential Distinctiveness Hypothesis. In: Journal of Educational Psychology 95 (4), S.-687-706. M A R S H , Herbert W./ Yeung, Alexander Seeshing (1998): Longitudinal Structural Equation Models of Academic Self-Concept and Achievement: Gender Differences in the Development of Math and English Constructs. In: American Educational Research Journal 35 (4), S.-705-738. M A R T I N O , Wayne (1995): Boys and literacy: Exploring the construction of hegemonic masculinities and the formation of literate capacities for boys in the English classroom. In: English in Australia 112, S.-11-24. Bibliographie 655 M A R T I N O , Wayne/ Kehler, Michael/ Weaver-Hightower, Marcus B. (2009): The problem with boys. Beyond recuperative masculinity politics in boys' education. New York, London: Routledge. M A R T I N O V IĆ , Anna/ Sorić, Izabela (2018): The L2 motivational self system, L2 interest, and L2 anxiety: A study of motivation and gender differences in the Croatian context. In: Exploations in English Language and Linguistics (ExELL) 6 (1), S.-37-56. M A S G O R E T , Anne-Marie/ Gardner, Robert C. (2003): Attitudes, Motivation, and Second Language Learning: A Meta-Analysis of Studies Conducted by Gardner and Asso‐ ciates. In: Language Learning 53 (S1), S.-167-210. M A Y , Peter (2006a): Englisch-Hörverstehen am Ende der Grundschulzeit. In: Bos, Wil‐ fried/ Pietsch, Marcus (Hrsg.): KESS 4 - Kompetenzen und Einstellungen von Schüle‐ rinnen und Schülern am Ende der Jahrgangsstufe 4 in Hamburger Schulen. Münster: Waxmann, S.-203-224. M A Y , Peter (2006b): Orthographische Kompetenzen und ihre Bedingungen am Ende der vierten Jahrgangsstufe. In: Bos, Wilfried/ Pietsch, Marcus (Hrsg.): KESS 4 - Kom‐ petenzen und Einstellungen von Schülerinnen und Schülern am Ende der Jahrgangsstufe 4 in Hamburger Schulen. Münster: Waxmann, S.-111-142. M A Y , Peter (2009): Kompetenz in Englisch: Vertiefende Analysen. In: Bos, Wil‐ fried/ Bonsen, Martin/ Gröhlich, Carola (Hrsg.): KESS 7 - Kompetenzen und Einstel‐ lungen von Schülerinnen und Schülern an Hamburger Schulen zu Beginn der Jahrgangs‐ stufe 7. Münster: Waxmann, S.-54-67. M A Y R I N G , Philipp (2003): Qualitative Inhaltsanalyse. Grundlagen und Techniken. 8. Aufl. Weinheim, Basel: Beltz. M C C A L L , Ian (2011): "Score in French": Motivating Boys with Football in Key Stage 3. In: Language Learning 39 (1), S.-5-18. M C C R O S K E Y , James C./ Bear, J. Elaine (1985): Willingness to communicate. The construct and its measurement. Paper presented at the annual convention of the Speech Communication Association. Denver: CO. M C E L V A N Y , Nele/ Bos, Wilfried/ Holtappels, Heinz Günter/ Gebauer, Miriam M./ Schwabe, Franziska (Hrsg.) (2016): Bedingungen und Effekte guten Unterrichts. Münster: Wax‐ mann. M C E L V A N Y , Nele/ Kessels, Ursula/ Schwabe, Franziska/ Kasper, Daniel (2017): Geschlecht und Lesekompetenz. In: Hußmann, Anke/ Wendt, Heike/ Bos, Wilfried/ Bremerich-Vos, Albert/ Kasper, Dankel/ Lankes, Eva-Maria/ McElvany, Nele/ Stubbe, Tobias C./ Valtin, Renate (Hrsg.): IGLU 2016. Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich. Münster, New York: Waxmann, S.-177-194. M C G A N N O N , Judith/ Medeiros, Anna (1995): Factors influencing elective language choice: A study of French language students. In: Australian Review of Applied Linguistics (ARAL) 18 (1), S.-95-108. 656 Bibliographie M C N A M A R A , Tim (2006): Validity in Language Testing: The Challenge of Sam Messick's Legacy. In: Language Assessment Quarterly 3 (1), S.-31-51. M E H L H O R N , Grit (2017): Wörterbuch. In: Carola Surkamp (Hrsg.): Metzler Lexikon Fremd‐ sprachendidaktik. Ansätze - Methoden - Grundbegriffe. 2. Aufl. Stuttgart: Metzler, S.-376-377. M E H L H O R N , Grit/ Brehmer, Bernhard (Hrsg.) (2018): Potenziale von Herkunftssprachen. Sprachliche und außersprachliche Einflussfaktoren. Tübingen: Stauffenburg. M E IẞN E R , Franz-Josef (2017): Interferenz. In: Carola Surkamp (Hrsg.): Metzler Lexikon Fremdsprachendidaktik. Ansätze - Methoden - Grundbegriffe. 2. Aufl. Stuttgart: Metzler, S.-145-146. M E IẞN E R , Franz Josef/ Beckmann, Christine/ Schröder-Sura, Anna (2008): Mehrsprachig‐ keit fördern. Vielfalt und Reichtum Europas in der Schule nutzen (MES). Zwei deutsche Stichproben einer internationalen Studie in den Klassen 5 und 9 zu Sprachen und Fremdsprachenunterricht. Tübingen: Narr. M E N D E Z , Carmen (2013): "Kann ich als Legastheniker Französisch lernen? ". Vom Umgang mit Legasthenie und LRS. In: Praxis Fremdsprachenunterricht 3, S.-4-7. M E N S A H , Fiona K./ Kiernan, Kathleen E. (2010): Gender differences in educational attain‐ ment: influences of the family environment. In: British Educational Research Journal 36 (2), S.-239-260. M E R C E R , Sarah (2011): Towards an Understanding of Language Learner Self-Concept. Dordrecht: Springer. M E S S I C K , Samuel (1994): The interplay of evidence and consequences in the validation of performance assessments. In: Educational Researcher 23 (2), S.-13-23. M E S S I C K , Samuel (1996): Validity and washback in language testing. In: Language Testing 13 (3), S.-241-256. M E T T L E R , Monika/ Lenz, Peter/ Studer, Thomas (2006): Materialbeispiele. Vor-Publikations‐ fassungen. Instrumente für die Evaluation von Fremdsprachenkompetenzen - Englisch, Französisch (IEF). Ein Projekt der Deutschschweizer Kantone und Liechtensteins. Lern- und Forschungszentrum Fremdsprachen Universität Freiburg/ CH. Online verfügbar unter http: / / folk.uio.no/ sirilu/ 2010-Jessheim/ ief-schlussbericht-mit-anhang.pdf, zu‐ letzt geprüft am 12.10.2020. M I E L K E , Rosemarie/ Goy, Martin/ Pietsch, Marcus (2006): Das Leseselbstkonzept am Ende der Grundschulzeit. In: Bos, Wilfried/ Pietsch, Marcus (Hrsg.): KESS 4 - Kompetenzen und Einstellungen von Schülerinnen und Schülern am Ende der Jahrgangsstufe 4 in Hamburger Schulen. Münster: Waxmann, S.-87-110. M I L A N O V I C , Michael/ Weir Cyril J. (Hrsg.) (2004): European Language Testing in a Global Context: Proceedings of the ALTE Barcelona Conference July 2001. Cambridge: Cam‐ bridge University Press. Bibliographie 657 M I N I S T E R I U M F Ü R K U L T U S , J U G E N D U N D S P O R T B A D E N -W Ü R T T E M B E R G (2020a): Fremdsprachen am Gymnasium. Online verfügbar unter https: / / km-bw.de/ Kultusministerium,Len/ Startseite/ Schule/ Fremdsprachen, zuletzt geprüft am 06.03.2020. M I N I S T E R I U M F Ü R K U L T U S , J U G E N D U N D S P O R T B A D E N -W Ü R T T E M B E R G (2020b): Gymna‐ sium. Profile. Online verfügbar unter https: / / km-bw.de/ Kultusministerium,Len/ Start‐ seite/ Schule/ Profile, zuletzt geprüft am 06.03.2020. M I N I S T E R I U M F Ü R K U L T U S , J U G E N D U N D S P O R T B A D E N -W Ü R T T E M B E R G (2003): Französisch in der Grundschule. Information für Schulen, Kindergärten und Eltern. Online ver‐ fügbar unter https: / / www.km-bw.de/ site/ pbs-bw-new/ get/ documents/ KULTUS.Dach mandant/ KULTUS/ kultusportal-bw/ zzz_pdf/ Brosch_Franz_in_der_GS%20-%2001030 5.pdf, zuletzt geprüft am 23.06.2018. M I N I S T E R I U M F Ü R K U L T U S , J U G E N D U N D S P O R T B A D E N -W Ü R T T E M B E R G (2016): Bildungsplan 2016 Gymnasium. Spanisch als dritte Fremdsprache - Profilfach. Online verfügbar unter http: / / www.bildungsplaene-bw.de/ site/ bildungsplan/ get/ documents/ lsbw/ export-pdf / depot-pdf/ ALLG/ BP2016BW_ALLG_GYM_SPA3.pdf, zuletzt geprüft am 20.09.2020. M I S L E V Y , Robert J. (2007): Validity by Design. In: Educational Researcher 36 (8), S. 453-469. M ÖL L E R , Jens/ Trautwein, Ulrich (2009): Selbstkonzept. In: Wild, Elke/ Möller, Jens (Hrsg.): Pädagogische Psychologie. Heidelberg: Springer, S.-179-204. M ÖL L E R , Jens/ Zaunbauer-Womelsdorf, Anna Chr. M. (2008): Erwerb fremdsprachlicher Kompetenzen. In: Schneider, Wolfgang/ Hasselhorn, Marcus (Hrsg.): Handbuch der Pädagogischen Psychologie. Göttingen: Hogrefe, S.-587-596. M O O R E , Terence (1967): Language and Intelligence: A Longitudinal Study of the First Eight Years: Part I: Patterns of Development in Boys and Girls. In: Human Development 10 (2), S.-88-106. M O O S B R U G G E R , Helfried/ Kelava, Augustin (2012): Testtheorie und Fragebogenkonstruktion. 2. Aufl. Berlin, Heidelberg: Springer. M O R I , Setsuko/ Goebel, Peter: Motivation and gender in the Japanese EFL-classroom. In: System (34), S.-194-210. M O Y E R , Alene (2014): The Social Nature of L2 Pronunciation. In: Levis, John M./ Moyer, Alene (Hrsg.): Social dynamics in second language Accent. Berlin/ Boston: De Gruyter, S.-11-30. M U C H N I C K , Arlene Goldberg/ Wolfe, David E. (1982): Attitudes and Motivations of Ame‐ rican Students of Spanish. In: Canadian modern language review 38, S.-262-281. M ÜL L E R , Natascha/ Riemer, Beate (1998): Generative Syntax der romanischen Sprachen: Französisch, Italienisch, Portugiesisch, Spanisch. Tübingen: Stauffenburg. M Y E R S , David G./ Hoppe-Graff, Siegfried/ Keller, Barbara (2014): Psychologie. 3. Aufl. Berlin: Springer. M Y S T K O W S K A -W I E R T E L A K , Anna/ Pawlak, Mriosłav (2016): Designing a Tool for Measuring the Interrelationship between L2 WTC, Confidence, Beliefs, Motivation, and Context. 658 Bibliographie In: Pawlak, Mirosław (Hrsg.): Classroom-Oriented Research. Reconciling Theory and Practice. Cham: Springer, S.-19-37. N A T O R P , Elke (1975): Französisch im Vorschulalter. Eine empirische Untersuchung. In: Die neueren Sprachen 24, S.-495-512. N E L S O N , Katherine (1973): Structure and strategy in learning to talk. Chicago: University of Chicago Press. N E T T E N , Joan E./ Riggs, Cheryl/ Hewlett, Scott L. R. (1999): Choosing French in the senior high school : Grade 9 student attitudes to the study of French in the Western Avalon School District. St. John's: Memorial University, Faculty of Education. N I E P E L , Christoph/ Brunner, Martin/ Preckel, Franzis (2014): The Longitudinal Interplay of Students' Academic Self-Concepts and Achievements Within and Across Domains: Replicationg and Extending the Reciprocal Internal/ External Frame of Reference Model. In: Journal of Educational Psychology 106 (4), S.-1170-1191. N I E W E L E R , Andreas (Hrsg.) (2017a): Fachdidaktik Französisch. Das Handbuch für Theorie und Praxis. Stuttgart: Klett. N I E W E L E R , Andreas (2017b): Französischunterricht unter veränderten Bedingungen. In: Nieweler, Andreas (Hrsg.): Fachdidaktik Französisch. Das Handbuch für Theorie und Praxis. Stuttgart: Klett, S.-11-18. N I E W E L E R , Andreas (2017c): Schulung der funktionalen kommunikativen Kompetenzen. In: Nieweler, Andreas (Hrsg.): Fachdidaktik Französisch. Das Handbuch für Theorie und Praxis. Stuttgart: Klett, 144-131. N I K O L O V A , Roumina (2011): Englischleistungen und Einstellungen zum Englischunter‐ richt. In: Vieluf, Ulrich/ Ivanov, Stanilsav/ Nikolova, Roumania (Hrsg.): KESS 10/ 11 - Kompetenzen und Einstellungen von Schülerinnen und Schülern an Hamburger Schulen am Ende der Sekundarstufe I und zu Beginn der Gymnasialen Oberstufe. Münster: Waxmann, S.-121-157. N I K O L O V A , Roumina/ Ivanov, Stanislav (2010): Englischleistungen. In: Bos, Wilfried/ Gröh‐ lich, Carola (Hrsg.): KESS 8 - Kompetenzen und Einstellungen von Schülerinnen und Schülern am Ende der Jahrgangsstufe 8. Münster: Waxmann, S.-49-65. N I K O L O V A , Rouminiana/ Ivanov, Stanislav/ Vieluf, Ulrich (2012): Anlage und Durchfüh‐ rung der Untersuchung. In: Vieluf, Ulrich/ Ivanov, Stanilsav/ Nikolova, Roumania (Hrsg.): KESS 10/ 11 - Kompetenzen und Einstellungen von Schülerinnen und Schülern an Hamburger Schulen am Ende der Sekundarstufe I und zu Beginn der Gymnasialen Oberstufe. Münster: Waxmann, S.-15-29. N I S B E T , John Donald/ Welsh, Jennifer (1972): A Local Evaluation of Primary School French. In: Journal of Curriculum Studies 4 (2), S.-169-175. N O E L S , Kimberly A./ Pelletier, Luc/ Clément, Richard/ Vallerand, Robert J. (2000): Why Are You Learning a Second Language? Motivational Orientations and Self-Determination Theory. In: Language Learning 50, S.-57-85. Bibliographie 659 N O L D , Günter (2003): The impact of the learning culture on achievement in the English as a foreign language classroom - a view from Germany. In: Rymarczyk, Jutta/ Haudeck, Helga (Hrsg.): In Search of the Active Learner. Untersuchungen zu Fremdsprachenunter‐ richt, bilingualen und interdisziplinären Kontexten. Frankfurt a. M.: Lang, S.-163-184. N O L D , Günter/ Rossa, Henning (2007): Leseverstehen. In: Beck, Bärbel/ Klieme, Eckhardt (Hrsg.): Sprachliche Kompetenzen. Konzepte und Messung: DESI-Studie (Deutsch Eng‐ lisch Schülerleistungen International). Weinheim: Beltz, S.-197-211. N O L D , Günter/ Rossa, Henning (2008): Sprechen Englisch. In: DESI-Konsortium (Hrsg.): Unterricht und Kompetenzerwerb in Deutsch und Englisch. Ergebnisse der DESI-Studie. Weinheim, Basel: Beltz, S.-170-179. N O R T H , Brian (2000): Linking language assessments: an example in a low stakes context. In: System 28, S.-555-577. N O R T H , Brian (2012): The Development of a Common Framework Scale of Language Proficiency. Bern: Lang. N O R T O N , Bonny (2001): Identity and language learning. Gender, ethnicity and educational change. London, New York: Longman. N O R T O N , Bonny/ Pavlenko, Aneta (2004): Gender and English language learners. Alexan‐ dria, Virginia: Teachers of English to Speakers of Other Languages (TESOL). N Y I K O S , Martha (1990): Sex-Related Differences in Adult Language Learning: Socializa‐ tion and Memory Factors. In: The Modern Language Journal 74 (3), S.-273-287. O B S E R V A T O I R E D É M O G R A P H I Q U E E T S T A T I S T I Q U E D E L ' E S P A C E F R A N C O P H O N E (ODSEF) (ODSEF): Estimation des francophones dans le monde en 2015. Sources et démarches méthodologi‐ ques. Hrsg. v. Harton, Marie-Eve/ Marcoux, Richard/ Wolff, Alexandre/ Jacob-Wagner, Sarah. Online verfügbar unter http: / / observatoire.francophonie.org/ wp-content/ uplo ads/ 2016/ 03/ odsef_nr_lfdm_2015_finalweb-elp-1.pdf, zuletzt geprüft am 22.12.2020. OECD (2003): The PISA 2003 Assessment Framework. Mathematics, Reading, Science and Problem Solving Knowledge and Skills. Paris: OECD Publishing. OECD (2007): Understanding the Brain. The Birth of a Learning Science. Paris: OECD Publishing. OECD (2014a): PISA 2012 Ergebnisse: Was Schülerinnen und Schüler wissen und können. Schülerleistungen in Mathematik, Lesekompetenz und Naturwissenschaften. Bielefeld: Bertelsmann. OECD (2014b): PISA 2012 Ergebnisse: -Exzellenz durch Chancengerechtigkeit. Allen Schü‐ lerinnen und Schülern die Voraussetzungen zum Erfolg sichern. Bielefeld: Bertelsmann. OECD (2016): PISA 2015 Ergebnisse. Paris, Bielefeld: Bertelsmann. OECD (2019): PISA-2018 Ergebnisse: Was Schülerinnen und Schüler wissen und können. Paris, Bielefeld: Bertelsmann. O E R T E R , Rolf (Hrsg.) (2006): Entwicklungspsychologie. 5. Aufl. Weinheim: Beltz. 660 Bibliographie O E S C H , Dominique (2017): Potenzielle und realisierte Durchlässigkeit in gegliederten Bil‐ dungssystemen. Eine lokalstrukturelle Übertrittsanalyse in zwei Schulsystemen. Wies‐ baden: Springer VS. O H A R A , Yumiko (2001): Finding one's voice in Japanese: A study of pitch levels of L2 users. In: Pavlenko, Aneta/ Blackledge, Adrian/ Piller, Ingrid/ Teutsch-Dwyer, Marya (Hrsg.): Multilungualism, Second Language Learning, and Gender. Berlin: de Gruyter, S.-231-254. O S B O R N E , Jason W. (Hrsg.) (2008): Best practices in quantitative methods. Los Angeles: Sage Publ. O S B O R N E , Jason W./ Costello, Anna B./ Kellow, J. Thomas (2008): Best Practices in Explo‐ ratory Factor Analysis. In: Osborne, Jason W. (Hrsg.): Best practices in quantitative methods. Los Angeles: Sage Publ, S.-86-99. O S W A L D , Wolf Dieter/ Roth, Erwin (1978): Der Zahlenverbindungstest (ZVT). Göttingen: Hogrefe. O W E N , Kenneth (1992): The suitability of Raven’s Standard Progressive Matrices for various groups in South Africa. In: Personality and Individual Differences 13 (2), S.-149-159. O X F O R D , Rebecca (1999): Anxiety and the language learner: new insights. In: Arnold, Jane (Hrsg.): Affect in Language Learning. New York: Cambridge University Press, S. 58-67. O X F O R D , Rebecca/ Nyikos, Martha (1989): Variables Affecting Choice of Language Lear‐ ning Strategies by University Students. In: The Modern Language Journal 73 (3), S.-291-300. O X F O R D , Rebecca/ Nyikos, Martha/ Ehrman, Madeline (1988): Vive la Différence? Reflec‐ tions on Sex Differences in Use of Language Learning Strategies. In: Foreign Language Annals 21 (4), S.-321-329. O X F O R D , Rebecca/ Shearin, Jill (1994): Language Learning Motivation: Expanding the Theoretical Framework. In: The Modern Language Journal 78 (1), S.-12-28. O Y S E R M A N , Daphna/ Bybee, Deborah/ Terry, Kathy/ Hart-Johnson, Tamera (2004): Possible selves as roadmaps. In: Journal of Research in Personality 38 (2), S.-130-149. P A J A R E S , Frank/ Urdan, Tim (Hrsg.) (2002): Academic motivation of adolescents. Greenwich, CT: Information Age. P A N T , Hans Anand/ Stanat, Petra/ Schroeders, Ulrich/ Roppelt, Alexander/ Siegle, Thilo/ Pöhlmann, Claudia (Hrsg.) (2013): IQB-Ländervergleich 2012. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I. Münster: Waxmann. P A T Z E L T , Doreen (2011): Sprache und Intelligenz bei Vorschulkindern - Entwicklungszu‐ sammenhänge im Kontext von Sprachfördermaßnahmen. Pädagogische Hochschule Weingarten. Dissertation. Online verfügbar unter https: / / hsbwgt.bsz-bw.de/ frontdo or/ deliver/ index/ docId/ 15/ file/ Dissertation_Patzelt_Veroeffentlichung.pdfzuletzt ge‐ prüft am 16.03.2021. Bibliographie 661 P A V L E N K O , Aneta (2008): Research Methods in the Study of Gender in Second/ Foreign Language Education. In: Hornberger, Nancy H./ King, Kendall A. (Hrsg.): Encyclopedia of language and education. 2. Aufl. New York: Springer, S.-165-174. P A V L E N K O , Aneta/ Blackledge, Adrian/ Piller, Ingrid/ Teutsch-Dwyer, Marya (Hrsg.) (2001): Multilungualism, Second Language Learning, and Gender. Berlin: de Gruyter. P A W L A K , Mirosław (Hrsg.) (2016): Classroom-Oriented Research. Reconciling Theory and Practice. Cham: Springer. P E I R C E , Bonny N. (1995): Social Identity, Investment, and Language Learning. In: Teachers of English to Speakers of Other Languages (TESOL) 29 (1), S.-9-31. P H A K I T I , Aek (2007): Strategic competence and EFL reading test performance. A structural equation modeling approach. Frankfurt a.-M., New York: Lang. P I A G E T , Jean/ Inhelder, Bärbel (1973): Die Psychologie des Kindes. 2. Aufl. Olten, Freiburg i. Br.: Walter. P I L L E R , Ingrid/ Pavlenko, Aneta (2007): Globalization, gender, and multilingualism. In: Decke-Cornill, Helene/ Volkmann, Laurenz (Hrsg.): Gender studies and foreign lang‐ uage teaching. Tübingen: Narr, S.-15-30. P I N N O W , Marlies (2010): Gendering motivation: -Geschlechterdifferenz im Wechselspiel von Nature und Nurture. In: Gisela Steins (Hrsg.): Handbuch Psychologie und Ge‐ schlechterforschung. Wiesbaden: Springer VS, S.-55-67. P I S K E , Thorsten (2017): Old dogs in new tricks? Aktuelle Erkenntnisse der Spracherwerbs‐ forschung zur Rolle des Alters, des Geschlechts und eines Migrationshintergrunds beim Erlernen von Fremdsprachen. In: Praxis Englisch (4), S.-44-46. P ÖL L , Bernhard (2017): Französisch außerhalb Frankreichs. 2. Aufl. Berlin: de Gruyter. P O L Z I N I -H A U M A N N , Claudia (2013): Standardsprache, Norm und Normierung. In: Born, Joachim/ Folger, Robert, Laferl, Christopher F./ Poll, Bernhard (Hrsg.): Handbuch Spa‐ nisch. Sprache, Literatur, Kultur, Geschichte in Spanien und Hispanoamerika. Berlin: Schmidt, S.-44-54. P O R S C H , Raphaela (Hrsg.) (2010): Standardbasierte Testentwicklung und Leistungsmessung. Französisch in der Sekundarstufe I. Münster: Waxmann. P O R S C H , Raphaela/ Tesch, Bernd/ Köller, Olaf (Hrsg.) (2010): Standardbasierte Testentwick‐ lung und Leistungsmessung. Französisch in der Sekundarstufe 1. Münster: Waxmann. P O W E L L , Robert C./ Batters, Julia D. (1985): Pupils’ Perceptions of Foreign Language Learning at 12 +: some gender differences. In: Educational studies 11 (1), S.-11-23. P R E N Z E L , Manfred/ Artelt, Cordula/ Baumert, Jürgen/ Blum, Werner/ Hammann, Marcus/ Klieme, Eckhard/ Pekrun, Reinhard (Hrsg.) (2008): PISA 2006 in Deutschland. Die Kom‐ petenzen der Jugendlichen im dritten Ländervergleich. Münster, New York: Waxmann. P R E N Z E L , Manfred/ Baumert, J./ Blum, W./ Lehmann, D./ Neubrand, M./ Pekrun, R./ Rost, J./ Schiefele, U. (Hrsg.) (2004): PISA 2003. Der Bildungsstand der Jugendlichen in 662 Bibliographie Deutschland - Ergebnisse des zweiten internationalen Vergleichs. Münster, New York: Waxmann. P R E N Z E L , Manfred/ Gogolin, Ingrid/ Krüger, Heinz-Hermann (Hrsg.) (2007): Kompetenzdi‐ agnostik. Wiesbaden: Springer VS. P R E N Z E L , Manfred/ Krapp, Andreas/ Schiefele, Hans (1986): Grundzüge einer pädagogi‐ schen Interessentheorie. In: Zeitschrift für Pädagogik 32 (2), S.-163-173. P R E N Z E L , Manfred/ Sälzer, Christine/ Klieme, Eckhard/ Köller, Olaf (2013): PISA 2012. Fort‐ schritte und Herausforderungen in Deutschland. Münster: Waxmann. P R I E T , Benoît (2014): Tout le français. Concours orthophoniste. Paris: Dunod. P R I T C H A R D , Rosalind M.O. (1987): Boys' and girls' attitudes towards French and German. In: Educational Research 29 (1), S.-65-72. P R Ü F E R , Katharina (2012): Anwendungsbeitrag: Fragebogenentwicklung und -pilotierung im Rahmen des Dissertationsprojekts "Bilinguale Module im Mathematikunterricht". In: Doff, Sabine (Hrsg.): Fremdsprachenunterricht empirisch erforschen. Grundlagen - Methoden - Anwendung. Tübingen: Narr, S.-136-149. P R Ü F E R , Peter/ Rexroth, Margrit (1996): Verfahren zur Evaluation von Survey-Fragen: ein Überblick. Zentrum für Umfragen, Methoden und Analysen (ZUMA). Mannheim. On‐ line verfügbar unter https: / / nbn-resolving.org/ urn: nbn: de: 0168-ssoar-200204, zuletzt aktualisiert am 15.01.2018. P R Ü F E R , Peter/ Rexroth, Margrit (2005): Kognitive Interviews. Zentrum für Umfragen, Methoden und Analysen (ZUMA). Mannheim. Online verfügbar unter https: / / nbn-res olving.org/ urn: nbn: de: 0168-ssoar-201470, zuletzt aktualisiert am 19.01.2018. P T O K , Martin/ Büssing, Boris/ Schwemmerle, Cornelia/ Lichte, Christiane (2006): Zur Sta‐ bilität der Lautdiskriminationsfähigkeit im Vorschulalter. In: HNO (54), S.-635-642. Q U E N Z E L , Gudrun/ Hurrelmann, Klaus (Hrsg.) (2010): Bildungsverlierer. Neue Ungleich‐ heiten. Wiesbaden: Springer VS. Q U E T Z , Jürgen/ von der Handt, Gerhard (Hrsg.) (2002): Neue Sprachen lehren und lernen: Fremdsprachenunterricht in der Weiterbildung. Fremdsprachenunterricht in der Weiter‐ bildung. Bielefeld: Bertelsmann. R A A B -S T E I N E R , Elisabeth/ Benesch, Michael (2015): Der Fragebogen. Von der Forschungsidee zur SPSS-Auswertung. 4. Aufl. Wien: Facultas. R A M E R , Andrya (1976): Syntactic styles in emerging language. In: Journal of Child Language 3 (1), S.-49-62. R A M M , Gesa/ Prenzel, Manfred/ Baumert, Jürgen/ Blum, Werner/ Lehmann, Rainer/ Leutner, Detlev/ Neubrand, Michael/ Pekrun, Reinhard/ Rolff, Hans-Günther/ Rost, Jürgen/ Schiefele, Ulrich (Hrsg.) (2006): PISA 2003. Dokumentation der Erhebungsinstrumente. Münster, New York: Waxmann. Bibliographie 663 R A N D H A W A , Bikkar S./ Korpan, Susan M. (1973): Assessment of some significant affective variables and the prediction of achievement in French. In: Canadian Journal of Behavioural Science/ Revue canadienne des sciences du comportement 5 (1), S.-24-33. R A T T U N D E , Eckhard (1977): Transfer---Interferenz? Probleme der Begriffsdefinition bei der Fehleranalyse. In: Die neueren Sprachen 76, S.-4-24. R A V E N , John C. (2009): SPM-Classic/ -Parallel/ Plus. Raven's Progressive Matrices und Voca‐ bulary Scales. Standard Progressive Matrices. 2. Aufl. San Antonio: Pearson. R A V E N , John C./ Court, John H./ Raven, John (1996): Manual for Raven’s Progressive Matrices and Mill Hill Vocabulary Scales. Standard Progressive Matrices. Oxford: Oxford Psychologists Press. R A V E N , John/ Raven, John C./ Court, John H. (1995): Manual for Raven’s Progressive Mat‐ rices and Mill Hill Vocabulary Scales. General Overview. Oxford: Oxford Psychologists Press. R A V E N , John/ Raven, John C./ Court, John H. (2001): CPM. Coloured Progressive Matrices. Göttingen: Hogrefe. R A V I D , Ruth D. (1987): The Correlation of Parents' and Students' Attitudes With Hebrew Language Achievement. In: Foreign Language Annals 20 (5), S.-421-425. R E A L A C A D E M I A E S P AÑ O L A (RAE) (2005): d. In: Real Academia Española (RAE) (Hrsg.): Diccionario panhispánico de dudas. Online verfügbar unter https: / / www.rae.es/ dpd/ d , zuletzt geprüft am 20.08.2020. R E A L A C A D E M I A E S P AÑ O L A (RAE) (Hrsg.) (2005): Diccionario panhispánico de dudas. Online verfügbar unter https: / / www.rae.es/ dpd/ , zuletzt geprüft am 20.08.2020. R E A L A C A D E M I A E S P AÑ O L A (RAE) (2010a): Ortografía de la lengua española. Madrid: Real Academia Española, Espasa. R E A L A C A D E M I A E S P AÑ O L A (RAE) (2010b): Nueva gramática de la lengua española. Manual. Madrid: Real Academia Española, Espasa. R E I D , Joy M. (Hrsg.) (1995): Learning styles in the ESL/ EFL classroom. New York: Heinle and Heinle. R E I G E L U T H , Charles M. (Hrsg.) (1983): Instruction-design theories and models. An overview of their current status. Hillsdale, NJ: IEA. R E I M A N N , Daniel (2015): Aufgeklärte Mehrsprachigkeit - neue Wege (auch) für den Spanischunterricht. In: Der fremdsprachliche Unterricht Spanisch 51, S.-4-11. R E I N F R I E D , Marcus (2002): Motivationsförderung im Französischunterricht: Möglich‐ keiten und Grenzen. In: Französisch heute 2, S.-182-197. R E I N F R I E D , Marcus (2017): Didaktisch-methodische Prinzipien heute. In: Nieweler, An‐ dreas (Hrsg.): Fachdidaktik Französisch. Das Handbuch für Theorie und Praxis. Stutt‐ gart: Klett, S.-74-84. R E I N F R I E D , Marcus (2017): Wortschatzarbeit. In: Nieweler, Andreas (Hrsg.): Fachdidaktik Französisch. Das Handbuch für Theorie und Praxis. Stuttgart: Klett, S.-176-191. 664 Bibliographie R E I S S , Kristina/ Weis, Mirjam/ Klieme, Eckhard/ Köller, Olaf (Hrsg.) (2019): PISA 2018. Grundbildung im internationalen Vergleich. Münster: Waxmann. R E N N I N G E R , K. Ann/ Wozniak, Robert H. (1985): Effect of interest on attentional shift, recognition, and recall in young children. In: Developmental Psychology 21 (4), S.-624-632. R E Y , Alain (Hrsg.) (2008): Le Grand Robert de la langue française. Dictionnaires Le Robert. Paris. Online verfügbar unter https: / / grandrobert.lerobert.com/ robert.asp, zuletzt geprüft am 20.11.2019. R H E I N L A N D , Falko/ Wendland, Mirko: Abschlussbericht DFG-Projekt (Rh14/ 8-1). "Kompo‐ nenten der Lernmotivation in Mathematik". Universität Potsdamm. Online verfügbar unter https: / / publishup.uni-potsdam.de/ opus4-ubp/ frontdoor/ deliver/ index/ docId/ 54 5/ file/ rheinberg_DFG_Abschlussbericht.pdf, zuletzt geprüft am 25.01.2020. R I C H A R D S O N , John T. E. (1997): Introduction to the Study of Gender Differences in Cognition. In: Caplan, Paula J./ Crawford, Mary/ Shibley Hyde, Janet/ Richardson, John T. E. (Hrsg.): Gender differences in human cognition. New York: Oxford University Press, S.-3-29. R I E G E L , Martin/ Pellat, Jean-Christophe/ Rioul, René (2018): Grammaire méthodique du français. 7. Aufl. Paris: Presses Universitaires de France. R I E H L , Claudia Maria (2006): Aspekte der Mehrsprachigkeit. Formen Vorteile, Bedeutung. In: Heints, Detlef/ Müller, Jürgen Eugen/ Reiberg, Ludger (Hrsg.): Mehrsprachigkeit macht Schule. Münster: Waxmann, S.-15-23. R I E M E R , Claudia (1997): Individuelle Unterschiede im Fremdsprachenerwerb. Eine Longi‐ tudinalstudie über die Wechselwirksamkeit ausgewählter Einflussfaktoren. Baltmanns‐ weiler: Schneider Hohengehren. R I E M E R , Claudia (2001): Zur Rolle der Motivation beim Fremdsprachenlernen. In: Finkb‐ einer, Claudia/ Schnaitmann, Gerhard W. (Hrsg.): Lehren und Lernen im Kontext empirischer Forschung und Fachdidaktik. Donauwörth: Auer, S.-376-399. R I E M E R , Claudia (2002): Wie lernt man Sprachen? In: Quetz, Jürgen/ von der Handt, Gerhard (Hrsg.): Neue Sprachen lehren und lernen: Fremdsprachenunterricht in der Weiterbildung. Fremdsprachenunterricht in der Weiterbildung. Bielefeld: Bertelsmann, S.-49-82. R I E M E R , Claudia (2006): Der Faktor Motivation in der empirischen Fremdsprachenfor‐ schung. In: Küppers, Almut/ Quertz, Jürgen (Hrsg.): Motivation Revisited. Festschrift für Gert Solmecke. Berlin: Lit, S.-35-48. R I E M E R , Claudia (2016a): Befragung. In: Caspari, Daniela/ Klippel, Friederike/ Legutke, Michael K. (Hrsg.): Forschungsmethoden in der Fremdsprachendidaktik. Ein Handbuch. Tübingen: Narr, S.-155-172. Bibliographie 665 R I E M E R , Claudia (2016b): Forschungsmethodologie. In: Burwitz-Melzer, Eva/ Mehlhorn, Grit/ Riemer, Claudia/ Bausch, Karl-Richard (Hrsg.): Handbuch Fremdsprachenunter‐ richt. 6. Aufl. Frankfurt a. M.: Lang, S.-571-578. R I E M E R , Claudia (2016c): L2-Motivationsforschung für Deutsch als Fremdsprache. Län‐ derspezifische und länderübergreifende Einsichten. In: Fremdsprachen Lehren und Lernen (FLuL) 45 (2), S.-30-45. R I E M E R , Claudia/ Hufeisen, Britta (2010): Spracherwerb und Sprachenlernen. In: Krumm, Hans-Jürgen/ Fandrych, Christian/ Hufeisen, Britta/ Riemer, Claudia (Hrsg.): Deutsch als Fremd- und Zweitsprache. Ein internationales Handbuch. Berlin u. a.: de Gruyter, S.-738-753. R I E M E R , Claudia/ Settinieri, Julia (2010): Empirische Forschungsmethoden in der Zweit- und Fremdsprachenerwerbsforschung. In: Krumm, Hans-Jürgen/ Fandrych, Chris‐ tian/ Hufeisen, Britta/ Riemer, Claudia (Hrsg.): Deutsch als Fremd- und Zweitsprache. Ein internationales Handbuch. Berlin u. a.: de Gruyter, S.-764-781. R O C H E , Jörg (2013): Fremdsprachenerwerb - Fremdsprachendidaktik. 3. Aufl. Stuttgart: Francke. R O C H E , Jörg/ Terrasi-Haufe, Elisabetta (Hrsg.) (2018): Mehrsprachigkeit und Sprachener‐ werb. Tübingen: Narr. R O D R Í G U E Z L Ó P E Z , Patricia (2017): Análisis de interlengua de los rasgos gramaticales y léxico-semánticos con los verbos ser y estar. In: Ainciburu, María Cecilia (Hrsg.): La adquisición del sistema verbal del español. Datos empíricos del proceso de aprendizaje del español como lengua extranjera. Frankfurt a. M.: Lang, S.-201-234. R O G E R , Angela/ Duffield, Jill (2000): Factors underlying persistent gendered option choices in school science and technology in Scotland. In: Gender and education 12 (3), S.-367-383. R O H D E , Andreas (2010): Receptive L2 lexical knowledge in bilingual preschool children. In: Kersten, Kristin/ Rohde, Andreas/ Schelleter, Christina/ Steinlen, Anja (Hrsg.): Bilin‐ gual preschools. Volume I: Learning and Development. Trier: Wissenschaftlicher Verlag, S.-45-68. R O H D E , Andreas/ Steinlen, Anja K. (Hrsg.) (2019): Sprachenvielfalt als Ressource begreifen. Mehrsprachigkeit in bilingualen Kindertagesstätten und Schulen Band II. Berlin: Dohr‐ mann. R O H D E , Andreas/ Tiefenthal, Christine (2002): On L2 lexical learning abilities. In: Bur‐ meister, Petra/ Piske, Thorsten/ Rohde, Andreas (Hrsg.): An integrated view of language development. Papers in honor of Henning Wode. Trier: Wissenschaftlicher Verlag, S.-449-471. R O I S C H , Henrike (2003): Geschlechtsspezifische Interessengebiete und Interessenpräfe‐ renzen. In: Stürzer, Monika/ Roisch, Henrike/ Hunze, Annette/ Cornelißen, Waltraud (Hrsg.): Geschlechterverhältnisse in der Schule. Wiesbaden: Springer VS, S.-123-150. 666 Bibliographie R O S E N T H A L , Alan S. (1999): The Gender-Coded Stereotype: An American perception of France and the French. In: The French Review 72 (5), S.-897-908. R O S S A , Henning (2010): Explorative Untersuchung der Konstruktvalidität von Testauf‐ gaben zum fremdsprachlichen Hörverstehen. In: Altmayer, Claus/ Mehlhorn, Grit/ Ne‐ veling, Christiane/ Schlüter, Norbert/ Schramm, Karen (Hrsg.): Grenzen überschreiten: sprachlich - fachlich - kulturell. Dokumentation zum 23. Kongress für Fremdsprachen‐ didaktik der Deutschen Gesellschaft für Fremdsprachenforschung (DGFF) Leipzig, 30. September---3. Oktober 2009. Baltmannsweiler: Schneider Hohengehren, S.-279-290. R O S T , Detlef (Hrsg.) (2010): Handwörterbuch Pädagogische Psychologie. 4. Aufl. Weinheim, Basel: Beltz. R O S T , Detlef (2013): Interpretation und Bewertung pädagogisch-psychologischer Studien. Eine Einführung. Bad Heilbrunn: Klinkhardt. R O S T , Detlef H./ Schermer, Franz J. (2007): Differentielles Leistungsangst Inventar (DAI). Frankfurt a. M.: Hartcourt Test Services. R U B E N S T E I N , John/ Rakic, Pasko (Hrsg.) (2013): Neural Circuit and Cognitive Development. Oxford: Elsevier. R U M B E R G E R , Russel W./ Palardy, Gregory J. (2005): Does Segregation Still Matter? The Impactof Student Composition on Academic Achievement in High School. In: Teachers College Record 107, S.-1999-2045. R U M L I C H , Dominik (2012): (Sprach-)Tests in der Praxis: Die Studie "Development Of North Rhine-Westphalian CLIL Students" (DENOCS). In: Doff, Sabine (Hrsg.): Fremdspra‐ chenunterricht empirisch erforschen. Grundlagen - Methoden - Anwendung. Tübingen: Narr, 169-183. R U M L I C H , Dominik (2016): Evaluating Bilingual Education in Germany. CLIL Students' General English Proficiency, EFL Self-Concept and Interest. Frankfurt a. M.: Lang. R U P P , André A./ Ferne, Tracy/ Choi, Hyeran (2006): How assessing reading comprehension with multiple-choice questions shapes the construct: a cognitive processing perspec‐ tive. In: Language Testing 23 (4), S.-441-474. R U P P , André A./ Vock, Miriam/ Harsch, Claudia/ Köller, Olaf (2008): Developing stan‐ dards-based assessment tasks for English as a first foreign language. Münster: Waxmann. R Y A N , Stephen (2009): Self and Identity in L2 Motivation in Japan: The Ideal L2 Self and Japanese Learners of English. In: Dörnyei, Zoltán/ Ushioda, Ema (Hrsg.): Motivation, Language identity and the L2 Self. Bristol: Multilingual Matters, S.-120-143. R Y A N , Richard M./ Deci, Edward L. (2002): An Overview of Self-Determination Theory: An Organismic-Dialectical Perspective. In: Deci, Edward L./ Ryan, Richard M. (Hrsg.): Handbook of Self-Determination Research. Rochester, NY: University of Rochester Press, S.-3-33. R Y C K M A N , David B./ Peckham, Percy D. (1987): Gender Differences in Attributions for Success and Failure. In: The Journal of Early Adolescence 7 (1), S.-47-63. Bibliographie 667 R Y M A R C Z Y K , Jutta/ Haudeck, Helga (Hrsg.) (2003): In Search of the Active Learner. Unter‐ suchungen zu Fremdsprachenunterricht, bilingualen und interdisziplinären Kontexten. Frankfurt a. M.: Lang. S A C C U Z Z O , Dennis P./ Johnson, Nancy E. (1995): Traditional psychometric tests and proportionate representation: An intervention and program evaluation study. In: Psychological Assessment 72 (2), S.-183-194. S A C H S E , Karoline A./ Kretschmann, Julia/ Kocaj, Aleksander (2012): Sprachliche Kompe‐ tenzen im Ländervergleich. Skalenhandbuch Schülerfragebogen und Leistungsdaten. Institut zur Qualitätsentwicklung im Bildungswesen (IQB). S A L K I N D , Neil J. (Hrsg.) (2010): Encyclopedia of Research Design. Band-2. Thousand Oaks, Calif.: Sage. S ÄL Z E R , Christine (2016): Studienbuch Schulleistungsstudien. Das Rasch-Modell in der Praxis. Berlin, Heidelberg: Springer. S A M B A N I S , Michaela (2013): Fremdsprachenunterricht und Neurowissenschaften. Tübingen: Narr. S C A R C E L L A , Robin/ Zimmerman, Cheryl (1998): Academic Words and Gender. In: Studies in Second Language Acquisition 20 (1), S.-27-49. S C H A F R O T H , Elmar (2014): Französische Lexikographie: Einführung und Überblick. Berlin, Göttingen: de Gruyter. S C H E L T E N , Andreas (1997): Testbeurteilung und Testerstellung. 2. Aufl. Stuttgart: Steiner. S C H E N D E R A , Christian F. G. (2014): Regressionsanalyse mit SPSS. 2. Aufl. Berlin: de Gruyter. S C H E U N P F L U G , Annette (2001): Biologische Grundlagen des Lernens. Berlin: Cornelsen. S C H I E F E L E , Ulrich (1996): Motivation und Lernen mit Texten. Göttingen: Hogrefe. S C H I E F E L E , Ulrich (2009): Motivation. In: Wild, Elke/ Möller, Jens (Hrsg.): Pädagogische Psychologie. Heidelberg: Springer, S.-151-178. S C H I L L I N G , Susanne R./ Sparfeldt, Jörn R./ Rost, Detlef H. (2006): Facetten schulischen Selbstkonzepts. Welchen Unterschied macht das Geschlecht? In: Zeitschrift für Päd‐ agogische Psychologie 20 (1/ 2), S.-9-18. S C H I P O L O W S K I , Stefan/ Stanat, Petra/ Böhme, Katrin/ Haag, Nicole/ Sachse, Karoline A./ Hoffmann, Lars/ Sebald, Susanne/ Federlein, Felicitas (2016a): Der Blick in die Länder. In: Stanat, Petra/ Böhme, Katrin/ Schipolowski, Stefan/ Haag, Nicole (Hrsg.): IQB-Bil‐ dungstrend 2015. Sprachliche Kompetenzen am Ende der 9.-Jahrgangsstufe im zweiten Ländervergleich. Münster: Waxmann, S.-171-330. S C H L A K , Torsten (2008): Fremdsprachenlerneignung: Tabuthema oder Forschungslücke? Zum Zusammenhang von Fremdsprachenlerneignung, Fremdsprachenlernen und Fremdsprachenvermittlung. In: Zeitschrift für Fremdsprachenforschung (ZFF) 19 (1), S.-3-30. 668 Bibliographie S C H M E L T E R , Lars (2014): Gütekriterien. In: Julia Settinieri (Hrsg.): Empirische Forschungs‐ methoden für Deutsch als Fremd- und Zweitsprache. Eine Einführung. Paderborn: Schöningh, S.-33-45. S C H M E N K , Barbara (2002): Geschlechtsspezifisches Fremdsprachenlernen? Zur Konstruk‐ tion geschlechtstypischer Lerner- und Lernbilder in der Fremdsprachenforschung. Tü‐ bingen: Stauffenburg. S C H M E N K , Barbara (2007): Foreign language research and the feminization of language learning. In: Decke-Cornill, Helene/ Volkmann, Laurenz (Hrsg.): Gender studies and foreign language teaching. Tübingen: Narr, S.-121-135. S C H M E N K , Barbara (2016): Geschlecht. In: Burwitz-Melzer, Eva/ Mehlhorn, Grit/ Riemer, Claudia/ Bausch, Karl-Richard (Hrsg.): Handbuch Fremdsprachenunterricht. 6. Aufl. Frankfurt a. M.: Lang, S.-254-257. S C H M I D T , Siegfried J. (1998): Die Zähmung des Blicks. Konstruktivismus, Empirie, Wissen‐ schaft. Frankfurt a. M.: Suhrkamp. S C H N E I D E R , Günther/ North, Brian (2000): Fremdsprachen können - was heisst das? Skalen zur Beschreibung, Beurteilung und Selbsteinschätzung der fremdsprachlichen Kommu‐ nikationsfähigkeit. Chur, Zürich: Rüegger. S C H N E I D E R , Wolfgang/ Hasselhorn, Marcus (Hrsg.) (2008): Handbuch der Pädagogischen Psychologie. Göttingen: Hogrefe. S C H N E I D E R , Wolfgang/ Stefanek, Jan/ Dotzler, Hans (1997): Erwerb des Lesens und des Rechtschreibens: Ergebnisse aus dem SCHOLASTIK-Projekt. In: Weinert, Franz E./ Helmke, Andreas (Hrsg.): Entwicklung im Grundschulalter. Weinheim: Beltz, S.-114-129. S C H N E L L , Rainer/ Hill, Paul B./ Esser, Elke (2013): Methoden der empirischen Sozialfor‐ schung. 10. Aufl. München: Oldenbourg. S C H O L Z E -S T U B E N R E C H T , Werner (Hrsg.) (2012): Duden. Die deutsche Rechtschreibung. 25. Aufl. Mannheim: Dudenverlag. S C H R A M M , Karen (2016): Empirische Forschung. In: Caspari, Daniela/ Klippel, Friede‐ rike/ Legutke, Michael K. (Hrsg.): Forschungsmethoden in der Fremdsprachendidaktik. Ein Handbuch. Tübingen: Narr, S.-49-58. S C H R ÖD E R , Konrad (1996): Frauen lernen Fremdsprachen. Einige empirische Fakten und die Historie des Phänomens. In: Neusprachliche Mitteilungen aus Wissenschaft und Praxis 49, S.-5-10. S C H R ÖD E R , Konrad (2017): Leistungsbewertung. In: Surkamp, Carola (Hrsg.): Metzler Le‐ xikon Fremdsprachendidaktik. Ansätze - Methoden - Grundbegriffe. 2. Aufl. Stuttgart: Metzler, 209-211. S C H R ÖD E R , Konrad/ Harsch, Claudia/ Nold, Günther (2006): DESI - Die sprachpraktischen Kompetenzen unserer Schülerinnen und Schüler im Bereich Englisch. Zentrale Be‐ funde. In: Neusprachliche Mitteilungen 59 (3), S.-11-32. Bibliographie 669 S C H R ÖD E R , Konrad/ Macht, Konrad (1983): Wieviele Sprachen für Europa? Fremdsprachen‐ unterricht, Fremdsprachenlernen und europäische Sprachenvielfalt im Urteil von Studie‐ renden des Grundstudiums in Deutschland, Belgien und Finnland. Augsburg: Universität Augsburg. S C H R ÖD E R -S U R A , Anna/ Meißner, Franz-Joseph/ Morkötter, Steffi (2009): Fünft- und Neunt‐ klässler zum Französischunterricht in einer quantitativen Studie (MES). In: Französisch heute 40 (1), S.-8-15. S C H U L T E -K Ö R N E , Gerd (Hrsg.) (2002): Legasthenie: zum aktuellen Stand der Ursachenfor‐ schung, der diagnostischen Methoden und der Förderkonzepte. Mit 42 Tabellen. Bochum: Winkler. S C H U M A N N , John H. (1986): Research on the acculturation model for second language acquisition. In: Journal of Multilingual and Multicultural Development 7 (5), S. 379-392. S C H U M A N N , Adelheid/ Poggel, Diana (2008): Zum Frankreichbild deutscher Jugendlicher. Eine Umfrage bei 12bis 16-jährigen Schülerinnen und Schülern. In: Lendemains 130/ 131, S.-112-127. S C H U N K , Dale H./ Miller, Samuel D. (2002): Self-efficacy and adolescents' motivation. In: Pajares, Frank/ Urdan, Tim (Hrsg.): Academic motivation of adolescents. Greenwich, CT: Information Age, S.-29-52. S C H W E I N B E R G E R , Silvia (2009): Sprachen testen. Hören und Lesen. Wien: Praesens. S C H W E I Z E R , Karl (2005): An Overview of Research into the Cognitive Basis of Intelligence. In: Journal of Individual Differences 1 (26), S.-43-51. S C H W I N G E R , Malte/ Wild, Elke/ Lütje-Klose, Birgit/ Grunschel, Carola/ Stranghöner, Da‐ niela/ Yotyodying, Sittipan/ Baumanns, Rebecca/ Gorges, Julia/ Serke, Björn/ Pazen, Claudia/ Neumann, Phillip/ Stelling, Silke (2015): Wie können motivationale und affektive Merkmale bei Kindern mit sonderpädagogischem Förderbedarf valide er‐ fasst werden? In: Kuhl, Poldi/ Stanat, Petra/ Lütje-Klose, Birgit/ Gresch, Cornelia/ Pant, Hans Anand/ Prenzel, Manfred (Hrsg.): Inklusion von Schülerinnen und Schülern mit sonderpädagogischem Förderbedarf in Schulleistungserhebungen. Wiesbaden: Springer, S.-273-300. S E D L M E I E R , Peter/ Renkewitz, Frank (2018): Forschungsmethoden und Statistik. Für Psycho‐ logen und Sozialwissenschaftler. 3. Aufl. Hallbergmoos: Pearson. S E E M A N , Mary V. (2012): Introduction. In: Goldman, Marlene B./ Troisi, Rebecca/ Rexrode, Kathryn M. (Hrsg.): Women and Health. Amsterdam: Elsevier, S.-1242-1246. S E G A L , Harry G./ DeMeis, Debra K./ Wood, Geoffrey A./ Smith, Heidi L. (2001): Assessing Future Possible Selves by Gender and Socioeconomic Status Using the Anticipated Life History Measure. In: Journal of personality 69 (1), S.-57-87. S E G A L O W I T Z , Sid J./ Rapin, Isabelle (Hrsg.) (1992): Handbook of Neuropsychology. Ams‐ terdam: Elsevier. 670 Bibliographie S E G A L O W I T Z , Norman/ Gatbonton, Elizabeth/ Trofimovich, Pavel (2011): Links between Ethnolinguistic Affiliation, Self-related Motivation and Second Language Fluency: Are They Mediated by Psycholinguistic Variables? In: Dörnyei, Zlotán/ Ushioda, Ema (Hrsg.): Motivation, language identity and the L2 self. Bristol: Multilingual Matters, S.-172-192. S E G E R I T Z , Michael/ Stanat, Petra/ Walter, Oliver (2010): Muster des schulischen Erfolgs von Mädchen und Jungen mit Migrationshintergrund. In: Cristina Allemann-Ghionda (Hrsg.): Migration, Identität, Sprache und Bildungserfolg. Weinheim: Beltz (Zeitschrift für Pädagogik: Beiheft 55), S.-165-186. S E I D E L , Tina/ Jurik, Verena/ Häusler, Janina/ Stubben, Sina (2016): Mikro-Umwelten im Klassenverband: Wie sich kognitive und motivational-affektive Schülervorausset‐ zungen auf die Wahrnehmung und das Verhalten im Fachunterricht auswirken. In: McElvany, Nele/ Bos, Wilfried/ Holtappels, Heinz Günter/ Gebauer, Miriam M./ Schwabe, Franziska (Hrsg.): Bedingungen und Effekte guten Unterrichts. Münster: Waxmann, S.-65-87. S E K R E T A R I A T D E R S TÄN D I G E N K O N F E R E N Z D E R K U L T U S M I N I S T E R D E R B U N D E S R E P U B L I K D E U T S C H L A N D (KMK) (Hrsg.) (2004): Bildungsstandards für die erste Fremdsprache (Englisch/ Französisch)-für den Mittleren Schulabschluss. Beschluss vom 04.12.2003. Online verfügbar unter https: / / www.kmk.org/ fileadmin/ Dateien/ veroeffentlichung en_ beschluesse/ 2003/ 2003_12_04-BS-erste-Fremdsprache.pdf, zuletzt geprüft am 07.10.2019. S E K R E T A R I A T D E R S TÄN D I G E N K O N F E R E N Z D E R K U L T U S M I N I S T E R D E R B U N D E S R E P U B L I K D E U T S C H ‐ L A N D (KMK) (Hrsg.) (2012): Bildungsstandards für die fortgeführte Fremdsprache (Eng‐ lisch/ Französisch) für die Allgemeine Hochschulreife. (Beschluss der Kultusministerkon‐ ferenz vom 18.10.2012). Online verfügbar unter https: / / www.kmk.org/ fileadmin/ D ateien/ veroeffentlichungen_beschluesse/ 2012/ 2012_10_18-Bildungsstandards-Fortge f-FS-Abi.pdf, zuletzt geprüft am 07.10.2019. S E K R E T A R I A T D E R S TÄN D I G E N K O N F E R E N Z D E R K U L T U S M I N I S T E R D E R L ÄN D E R I N D E R B U N ‐ D E S R E P U B L I K D E U T S C H L A N D (KMK) (2018): Vorgaben für die Klassenbildung. Schuljahr 2018/ 2019. Berlin/ Bonn. Online verfügbar unter https: / / www.kmk.org/ fileadmin/ Da teien/ pdf/ Statistik/ Dokumentationen/ Klassenbildung_2018.pdf, zuletzt geprüft am 07.10.2019. S E L I G E R , Herbert W./ Long, Michael H. (Hrsg.) (1983): Classroom-Oriented Research in Second Language Acquisition. Cambridge (Mass.): Newbury House. S E L I N K E R , Larry (1972): Interlanguage. In: International Review of Applied Linguistics in Language Teaching (IRAL) 10 (1-4), S.-209-232. S E T T I N I E R I , Julia (Hrsg.) (2014): Empirische Forschungsmethoden für Deutsch als Fremd- und Zweitsprache. Eine Einführung. Paderborn: Schöningh. Bibliographie 671 S E T T I N I E R I , Julia (2016): Quantitative Forschung. In: Burwitz-Melzer, Eva/ Mehlhorn, Grit/ Riemer, Claudia/ Bausch, Karl-Richard (Hrsg.): Handbuch Fremdsprachenunterricht. 6. Aufl. Frankfurt a. M.: Lang, S.-583-587. S H A A B A N , Kassim A./ Ghaith, Ghazi (2000): Student Motivation to Learn English as a Foreign Language. In: Foreign Language Annals 33 (6), S.-632-644. S H A V E L S O N , Richard J./ Hubner, Judith J./ Stanton George C. (1976): Self-concept: Valida‐ tion of Contruct Interpretations. In: Review of Educational Research 46 (3), S.-407-441. S H A W , Stuart D./ Weir, Cyril J. (2007): Examining Writing. Research and practice in assessing second language writing. Cambridge: Cambridge University Press. S H A Y W I T Z , Bennett A./ Shaywitz, Sally E./ Pugh, Kenneth R./ Constable, R. Todd/ Skud‐ larski, Pawel/ Fulbright, Robert K. et al. (1995): Sex differences in the functional organization of the brain for language. In: Nature 373 (6515), S.-607-609. S H A Y W I T Z , Sally E./ Shaywitz, Bennett A. (2008): Paying attention to reading: the neurobio‐ logy of reading and dyslexia. In: Development and psychopathology 20 (4), S. 1329-1349. S H E P A R D , Winifred O. (1970): Word association and definition in middle childhood. In: Developmental Psychology 3, S.-412. S I E G E L , Jeff (2003): Social Context. In: Doughty, Catherine J./ Long, Michael H. (Hrsg.): The Handbook of Second Language Acquisition. Oxford, UK: Blackwell, S.-178-223. S I G O T T , Guenther/ Gassner, Otmar/ Mewald, Claudia/ Siller, Klaus (2007): E8-Standard‐ stests. Entwicklung der Tests für die rezeptiven Fertigkeiten: Überblick. Wien: Bun‐ desministerium für Bildung, Wissenschaft und Kultur. S I N G E L I S , Theodore M. (1994): The mesurement of independent and interdependent self-construals. In: Personality and Social Psychology Bulletin 20 (5), S.-580-591. S K I B A , Dirk (2010): Operationalisierung. In: Barkowski, Hans/ Krumm, Hans-Jürgen (Hrsg.): Fachlexikon Deutsch als Fremd- und Zweitsprache. Tübingen: Francke, S.-234. S M I T H , Emma (2003): Failing boys and moral panics: Perspectives on the underachieve‐ ment battle. In: British Journal of Educational Studies 51 (3), S.-282-295. S M I T H , Peter K./ Daglish, Linda (1977): Sex differences in parent and infant behavior in the Home. In: Child Development 48 (4), S.-1250-1254. S O M M E R , Iris E. C./ Aleman, André/ Bouma, Anke/ Kahn, René S. (2004): Do women really have more bilateral language representation than men? A meta-analysis of functional imaging studies. In: Brain 127 (8), S.-1845-1852. S P A R F E L D T , Jörn R./ Rost, Detlef H./ Schilling, Susanne R. (2003): Das DISK-Gitter - Ein neues diagnostisches Verfahren zur Erfassung des differentiellen schulischen Selbstkonzepts. In: Johannes Brunner, Ewald (Hrsg.): Diagnose und Intervention in schulischen Handlungsfeldern. Münster: Waxmann, S.-111-125. S P A R F E L D T , Jörn R./ Rost, Detlef H./ Schilling, Susanne R. (2004): Schulfachspezifische Interessen - ökonomisch gemessen. In: Psychologie in Erziehung und Unterricht 51 (3), S.-213-220. 672 Bibliographie S P A R K S , Richard L./ Patton, Jon/ Ganschow, Leonore/ Humbach, Nancy/ Javorsky, James (2008): Early first-language reading and spelling skills predict later second-language reading and spelling skills. In: Journal of Educational Psychology 100 (1), S.-162-174. S P E A R M A N , Charles (1923): The nature of intelligence and the principles of cognition. London: Macmillan. S P E A R M A N , Charles (1927): The abilities of man: Their nature and measurement. New York: Macmillan. S P E A R M A N , Charles (1938): Measurement of intelligence. In: Scientia (64), S.-75-82. S T A I N T O N R O G E R S , Wendy/ Stainton Rogers Rex (2001): The psychology of gender and sexuality. An introduction. Buckingham: Open UP. S T A N A T , Petra/ Bergann, Susanne (2010): Geschlechterbezogene Disparitäten in der Bil‐ dung. In: Tippelt, Rudolf/ Schmidt, Bernhard (Hrsg.): Handbuch Bildungsforschung. 3. Aufl. Wiesbaden: Springer, S.-513-527. S T A N A T , Petra/ Böhme, Katrin/ Schipolowski, Stefan/ Haag, Nicole (Hrsg.) (2016a): IQB-Bil‐ dungstrend 2015. Sprachliche Kompetenzen am Ende der 9.-Jahrgangsstufe im zweiten Ländervergleich. Münster: Waxmann. S T A N A T , Petra/ Böhme, Katrin/ Schipolowski, Stefan/ Haag, Nicole (Hrsg.) (2016b): IQB-Bil‐ dungstrend 2015. Sprachliche Kompetenzen am Ende der 9.-Jahrgangsstufe im zweiten Ländervergleich. Zusatzmaterialien. IQB Berlin. Münster/ New York: Waxmann. Online verfügbar unter https: / / www.iqb.hu-berlin.de/ bt/ bt/ BT2015/ BT_2015_Zusatzma.pdf, zuletzt geprüft am 11.03.2020. S T A N A T , Petra/ Kunter, Mareike (2001): Geschlechterunterschiede in Basiskompetenzen. In: Deutsches PISA-Konsortium (Hrsg.): PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich. Opladen: Leske + Budrich, S.-299-322. S T A T I S T I S C H E S B U N D E S A M T (2009): Empfehlung der Kommission vom 29. Oktober 2009 über die Verwendung der Internationalen Standardklassifikation der Berufe (ISCO-08). 2009/ 824/ EG. Amtsblatt der Europäischen Union. Wiesbaden. Online verfügbar unter ht tps: / / op.europa.eu/ en/ publication-detail/ -/ publication/ a6afa5ba-23f6-497b-90c3-48da 8557356e/ language-de/ format-PDF, zuletzt geprüft am 25.01.2020. S T A T I S T I S C H E S B U N D E S A M T (2018): Schulen auf einen Blick. Online verfügbar unter https: / / www.destatis.de/ GPStatistik/ servlets/ MCRFileNodeSe rvlet/ DEHeft_derivate_00035140/ Schulen_auf_einen_Blick_2018_Web_bf.pdf; jsessi‐ onid=5BBFAA19E06C8B05F31D4EF0E0326230, zuletzt geprüft am 06.03.2020. S T A T I S T I S C H E S B U N D E S A M T (2020a): Schüler: Bundesländer, Schuljahr, Geschlecht, Jahr‐ gangsstufen, Schulart. Statistik der allgemeinbildenden Schulen. Online verfügbar unter https: / / www-genesis.destatis.de/ genesis/ online? operation= abruftabelleBe‐ arbeiten&levelindex=2&levelid=1583914066382&auswahloperation=abruftabelleAu‐ spraegungAuswaehlen&auswahlverzeichnis=ordnungsstruktur&auswahlziel=wer‐ Bibliographie 673 teabruf&code=21111-0005&auswahltext=&werteabruf=Werteabruf#astructure, zuletzt geprüft am 11.03.2020. S T A T I S T I S C H E S B U N D E S A M T (2020b): Prüfungen an Hochschulen: -Deutsch‐ land, Jahre, Nationalität, Geschlecht, Prüfungsergebnis, Studi‐ enfach. Französisch. Destatis. Online verfügbar unter https: / / www-genesis.destatis.de/ genesis/ online? operation= abruftabelleBe‐ arbeiten&levelindex=2&levelid=1583917963680&auswahloperation=abruftabelleAu‐ spraegungAuswaehlen&auswahlverzeichnis=ordnungsstruktur&auswahlziel=wer‐ teabruf&code=21321-0003&auswahltext=&werteabruf=Werteabruf#astructure, zuletzt geprüft am 11.03.2020. S T A T I S T I S C H E S B U N D E S A M T (2020c): Prüfungen an Hochschulen: Deutschland, Jahre, Natio‐ nalität, Geschlecht, Prüfungsergebnis, Studienfach. Spanisch. Destatis. Online verfügbar unter https: / / www-genesis.destatis.de/ genesis/ online? operation= abruftabelleBe‐ arbeiten&levelindex=0&levelid=1583919014571&auswahloperation=abruftabelleAu‐ spraegungAuswaehlen&auswahlverzeichnis=ordnungsstruktur&auswahlziel=wer‐ teabruf&code=21321-0003&auswahltext=&werteabruf=Werteabruf#astructure, zuletzt geprüft am 11.03.2020. S T A T I S T I S C H E S L A N D E S A M T B A D E N -W Ü R T T E M B E R G (2018): Statistische Berichte Baden-Würt‐ temberg. Unterricht und Bildung. Allgemeinbildende Schulen in Baden-Württemberg im Schuljahr 2017/ 18. Online verfügbar unter https: / / www.statistik-bw.de/ Service/ Veroe ff/ Statistische_Berichte/ 323117001.pdf, zuletzt geprüft am 06.03.2020. S T A T I S T I S C H E S L A N D E S A M T B A D E N -W Ü R T T E M B E R G (2019a): Schüler je Klassenstufe seit 1987/ 88 nach Schularten. Schüler je Klassenstufe an öffentlichen und privaten allge‐ meinbildenden Schulen im Schuljahr 2017/ 18 nach ausgewählten Schularten Land Baden-Württemberg. Stuttgart. Online verfügbar unter https: / / www.statistik-bw.de/ B ildungKultur/ SchulenAllgem/ 1301530x.tab? R=LA, zuletzt geprüft am 06.03.2020. S T A T I S T I S C H E S L A N D E S A M T B A D E N -W Ü R T T E M B E R G (2019b): Schulabschlüsse nach Geschlecht. Schulabschlüsse von Schülerinnen und Schülern in Baden-Württemberg 2018. Online verfügbar unter https: / / www.statistik-bw.de/ BildungKultur/ SchulenAllgem/ F-SA-G.j sp, zuletzt geprüft am 06.03.2020. S T A T I S T I S C H E S L A N D E S A M T B A D E N -W Ü R T T E M B E R G (2020): Bevölkerung im Überblick. Online verfügbar unter https: / / www.statistik-bw.de/ BevoelkGebiet/ Bevoelkerung/ 01035055.tab? R=GS435016, zuletzt geprüft am 06.03.2020. S T E D E , Manfred (2018): Korpusgestützte Textanalyse. Grundzüge der Ebenen-orientierten Textlinguistik. 2. Aufl. Tübingen: Narr Francke Attempto. S T E I N L E N , Anja K. (2016): Die Entwicklung des Englischen und des Deutschen von Kindern mit Migrationshintergrund in bilingualen Kindergärten. In: Steinlen, Anja K./ Piske, Thorsten (Hrsg.): Bilinguale Programme in Kindertageseinrichtungen. Umsetzungsbei‐ spiele und Forschungsergebnisse. Tübingen: Narr Francke Attempto, S.-197-218. 674 Bibliographie S T E I N L E N , Anja K. (2018): Grundschulen mit verschiedenen Englischprogrammen: Ge‐ schlecht und Mehrsprachigkeit auf dem Prüfstand. In: Zeitschrift für Fremdsprachen‐ forschung (ZFF) 29 (1), S.-1-26. S T E I N L E N , Anja K./ Håkansson, Gisela/ Housen, Alex/ Schelleter, Christina (2010): Recep‐ tive L2 grammar knowledge development in bilingual preschools. In: Kersten, Kristin/ Rohde, Andreas/ Schelleter, Christina/ Steinlen, Anja (Hrsg.): Bilingual preschools. Volume I: Learning and Development. Trier: Wissenschaftlicher Verlag, S.-69-100. S T E I N L E N , Anja K./ Kersten, Kristin/ Piske, Thorsten (2019): Mehrsprachige Jungen als Problemfall in bilingualen Kitas? Zur Rolle von Geschlecht und sprachlichem Hinter‐ grund. In: Rohde, Andreas/ Steinlen, Anja K. (Hrsg.): Sprachenvielfalt als Ressource begreifen. Mehrsprachigkeit in bilingualen Kindertagesstätten und Schulen Band II. Berlin: Dohrmann, S.-71-88. S T E I N L E N , Anja K./ Piske, Thorsten (Hrsg.) (2016): Bilinguale Programme in Kindertages‐ einrichtungen. Umsetzungsbeispiele und Forschungsergebnisse. Tübingen: Narr Francke Attempto. S T E I N L E N , Anja K./ Piske, Thorsten (2016): Minority Language Students as At-Risk Lear‐ ners: Myth or Reality? Findings from an Early German-English Partial Immersion Programme. In: Ehland, Christoph/ Mindt, Ilka/ Tönnies, Merle (Hrsg.): Anglistentag 2015 Paderborn. Proceedings. Trier: Wissenschaftlicher Verlag, S.-9-28. S T E I N S , Gisela (Hrsg.) (2008a): Geschlechterstereotype in der Schule - Realität oder Mythos? Anregungen aus und für die schulische Praxis. Lengerich u. a.: Pabst. S T E I N S , Gisela (2008b): Grundlagen der Entwicklung geschlechtsspezifischer Differenzen. In: Steins, Gisela (Hrsg.): Geschlechterstereotype in der Schule---Realität oder Mythos? Anregungen aus und für die schulische Praxis. Lengerich u. a.: Pabst, S.-12-21. S T E I N S , Gisela (2010a): Einführung in "Psychologie und Geschlechterforschung". In: Gisela Steins (Hrsg.): Handbuch Psychologie und Geschlechterforschung. Wiesbaden: Springer VS, S.-11-26. S T E I N S , Gisela (Hrsg.) (2010b): Handbuch Psychologie und Geschlechterforschung. Wies‐ baden: Springer VS. S T E N N E S , Leif M./ Burch, Melissa M./ Sen, Maya G./ Bauer, Patricia J. (2005): A longitudinal study of gendered vocabulary and communicative action in young children. In: Developmental Psychology 41 (1), S.-75-88. S TØ R E N , Liv A./ Helland, Håvard (2010): Ethnicity Differences in the Completion Rates of Upper Secondary Education: How Do the Effects of Gender and Social Background Variables Interplay? In: European Sociological Review 26 (5), S.-585-601. S T R A N D , Steve/ Deary, Ian J./ Smith, Pauline (2006): Sex differences in cognitive abilities test scores: a UK national picture. In: British Journal of Educational Psychology 76 (3), S.-463-480. Bibliographie 675 S T R E I N E R , David L. (2003): Starting at the Beginning: An Introduction to Coefficient Alpha and Internal Consistency. In: Journal of Personality Assessment 80 (1), S.-99-103. S T U D E R , Thomas (2007): Lesekompetenzen in der Fremdsprache. In: Babylonia 4 (15), S.-30-34. S T U D E R , Thomas/ Lenz, Peter/ Mettler, Monika (2004): Entwicklung von Instrumenten für die Evaluation von Fremdsprachenkompetenzen (Englisch/ Französisch): -Ziele, Kontext, Gegenstände und methodologische Aspekte des IEF-Projekts. Bd.-26, S. 419-434. Online verfügbar unter http: / / www.rsse.ch/ past-issues/ 26-3-2004-fremdsp rachenlern-und-%E2%80%93lehrfoschung-in-der-schweiz-innovationen-in-guter-beg leitung/ thomas-studer-peter-lenz-und-monika-mettler-entwicklung-von-instrument en-fur-die-evaluation-von-fremdsprachenkompetenzen-franzosisch-englisch-ziele-k ontext-gegenstande-und-methodologische-asp/ , zuletzt geprüft am 23.11.2017. S T U D E R , Thomas/ Wiedenkeller, Eva (2009): Standortbestimmungen mit lingualevel. Ein‐ führung. Freiburg. Online verfügbar unter https: / / www.lingualevel.ch/ platform/ conte nt/ element/ 10206/ Standortbestimmungen_mit_lingualevel_Einfuehrung.pdf, zuletzt geprüft am 07.10.2019. S TÜ R Z E R , Monika (2003): Geschlechtsspezifische Schulleistungen. In: Stürzer, Monika/ Ro‐ isch, Henrike/ Hunze, Annette/ Cornelißen, Waltraud (Hrsg.): Geschlechterverhältnisse in der Schule. Wiesbaden: Springer VS, S.-83-122. S TÜ R Z E R , Monika/ Roisch, Henrike/ Hunze, Annette/ Cornelißen, Waltraud (Hrsg.) (2003): Geschlechterverhältnisse in der Schule. Wiesbaden: Springer VS. S U L E I M A N , Mahmoud F. (1993): A Study of Arab Students' Motivations and Attitudes for Learning English as a Foreign Language: Arizona State University. S U N D E R L A N D , Jane (2000): Issues of language and gender in second and foreign language education. In: Language Teaching 33 (4), S.-203-223. S U R K A M P , Carola (Hrsg.) (2017): Metzler Lexikon Fremdsprachendidaktik. Ansätze - Me‐ thoden - Grundbegriffe. 2. Aufl. Stuttgart: Metzler. S U T E R , Lilian/ Waller, Gregor/ Bernath, Jael/ Külling, Céline/ Willemse, Isabel/ Süss, Daniel (2018): JAMES - Jugend, Aktivitäten, Medien - Erhebung Schweiz. Zürich: Züricher Hochschule für Angewandte Wissenschaften. S Z A G U N , Gisela (2016): Sprachentwicklung beim Kind. Ein Lehrbuch. 6. Aufl. Weinheim: Beltz. T A C H T S O G L O U , Sarantis/ König, Johannes (2017): Statistik für Erziehungswissenschaftler‐ innen und Erziehungswissenschaftler. Konzepte, Beispiele und Anwendungen in SPSS und R. Wiesbaden: Springer. T A G U C H I , Tatsuya/ Magid, Michael/ Papi, Mostafa (2009): The L2 Motivational Self System among Japanese, Chineses and Iranian Learners of English: A Comparative Study. In: Dörnyei, Zoltán/ Ushioda, Ema (Hrsg.): Motivation, Language identity and the L2 Self. Bristol: Multilingual Matters, S.-66-97. 676 Bibliographie T E M P L I N , Mildred C. (1957): Certain language skills in children---their development and interrelations. Minneapolis: University of Minnesota Press. T E S C H , Bernd (2010): Tests für Französisch auf Grundlage des Gemeinsamen europäischen Referenzrahmens (GER). In: Porsch, Raphaela/ Tesch, Bernd/ Köller, Olaf (Hrsg.): Stan‐ dardbasierte Testentwicklung und Leistungsmessung. Französisch in der Sekundarstufe 1. Münster: Waxmann, S.-69-72. T E S N I È R E , Lucien (1988): Éléments de syntaxe structurale. 2. Aufl. Paris: Klincksieck. T H I B A U L T , André (2004): Dictionnaire suisse romand. Particularités lexicales du français contemporain. Carouge, Schweiz: Zoé. T H O M A , Gun-Brit/ Köller, Olaf (2018): Test-wiseness: ein unterschätztes Konstrukt? Em‐ pirische Befunde zur Überprüfung und Erlernbarkeit von test-wiseness. In: Zeitschrift für Bildungsforschung 8, S.-63-80. T H O R N , Christine (2017): Kategorie Geschlecht. In: Bohl, Thorsten/ Budde, Jürgen/ Rieger-Ladich, Markus (Hrsg.): Umgang mit Heterogenität in Schule und Unterricht. Grundlagentheoretische Beiträge, empirische Befunde und didaktische Reflexionen. Bad Heilbrunn: UTB, S.-77-92. T I E D E M A N N , Joachim/ Faber, Günther (1995): Mädchen im Mathematikunterricht: Selbst‐ konzept und Kausalattribution im Grundschulalter. In: Zeitschrift für Entwicklungs‐ psychologie und Pädagogische Psychologie 27, S.-61-71. T I P P E L T , Rudolf/ Schmidt, Bernhard (Hrsg.) (2010): Handbuch Bildungsforschung. 3. Aufl. Wiesbaden: Springer. T O D T , Eberhard (2000): Geschlechtsspezifische Interessen - Entwicklungen und Möglich‐ keiten der Modifikation. In: Empirische Pädagogik 14 (3), S.-215-254. T R A U T N E R , Hanns M. (2006): Entwicklung der Geschlechtsidentität. In: Rolf Oerter (Hrsg.): Entwicklungspsychologie. 5. Aufl. Weinheim: Beltz, S.-648-674. T R E M B L A Y , Paul F./ Gardner, Robert C. (1995): Expanding the Motivation Construct in Language Learning. In: The Modern Language Journal 79 (4), S.-505-518. T Y L E R , Leona E. (1965): The psychology of human differences. New York: Appleton-Cen‐ tury-Crofts. U H L , Patricia (2019): Fremdsprachenforschung extended: Die Erforschung der intersek‐ tionalen Kategorien Geschlecht und Gender mit Hilfe interdisziplinärer Ansätze und Triangulation. In: Wilden, Eva/ Rossa, Henning (Hrsg.): Fremdsprachenforschung als interdisziplinäres Projekt. Berlin u. a.: Peter Lang, S.-207-224. U H L , Patricia/ Schwanke, Katrin/ Piske, Thorsten (2020): Französisch in der Grundschule - Erste empirische Ergebnisse aus einem bayernweiten Modellprojekt. In: Böttger, Heiner/ Festman, Julia/ Müller, Tanja (Hrsg.): Language Education and Acquisition Research. Focusing Early Language Learning. Bad Heilbrunn: Klinkhardt, S.-62-81. U L L R I C H , Heiner (2014): Exzellenz und Elitenbildung in Gymnasien. Traditionen und Innovationen. In: Zeitschrift für Erziehungswissenschaft 17 (3), S.-181-201. Bibliographie 677 U N I T E D N A T I O N S H U M A N D E V E L O P M E N T P R O G R A M M E (UN HDI) (2011): Sustainability and equity: A better future for all. Houndmills, UK: Palgrave Macmillan. U R Q U H A R T , Sandy/ Weir, Cyril (1998): Reading in a Second Language. Process, Product and Practice. New York: Addison Wesley Longman. U R R U T I A C Á R D E N A S , Hernán/ Bizcarrondo Ibáñez, Gema (2010): Escribir y editar. Guía práctica para la redacción y edición de textos. Bilbao: Publicaciones de la Universidad de Deusto. U S H I O D A , Ema (1996): Learner Autonomy 5: The Role of Motivation. Dublin: Authentik. U S H I O D A , Ema (2002): Language learning at university: Exploring the role of motivational thinking. In: Dörnyei, Zoltán/ Schmidt, Richard (Hrsg.): Motivation and second lang‐ uage acquisition. Honolulu, Hawaii: University of Hawaii Press, S.-91-124. U S H I O D A , Ema (2009): A Person-in-Context Relational View of Emergent Motivation, Self and Identity. In: Dörnyei, Zoltán/ Ushioda, Ema (Hrsg.): Motivation, Language identity and the L2 Self. Bristol: Multilingual Matters, S.-215-228. V A N H O U T T E , Mieke (2004): Why boys achieve less at school than girls: the difference between boys' and girls' academic culture. In: Educational studies 30 (2), S.-159-173. V E N U S , Theresa (2017a): Einstellungen als individuelle Lernervariable. Schülereinstellungen zum Französischen als Schulfremdsprache - Deskription, Korrelationen und Unter‐ schiede. Tübingen: Narr Francke Attempto. V E N U S , Theresa (2017b): Schülereinstellungen zum Französischen als Schulfremdsprache: Erste empirische Befunde einer Fragebogenstudie. In: Zeitschrift für Interkulturellen Fremdsprachenunterricht. Didaktik und Methodik im Bereich Deutsch als Fremdsprache 22 (1), S.-122-138. V E R A M O R A L E S , José (2013): Spanische Grammatik. 6. Aufl. München: Oldenburg. V E R S P O O R , Marjolijn/ Schmid, Monika Susanne/ Xu, Xiaouyan (3): A dynamic usage based perspective on L2 writing. In: Journal of Second Language Writing 21, S.-239-263. V I E L U F , Ulrich/ Ivanov, Stanilsav/ Nikolova, Roumania (Hrsg.) (2012): KESS 10/ 11 - Kom‐ petenzen und Einstellungen von Schülerinnen und Schülern an Hamburger Schulen am Ende der Sekundarstufe I und zu Beginn der Gymnasialen Oberstufe. Münster: Waxmann. V O L E T , Simone/ Järvelä, Sanna (Hrsg.) (2001): Advances in learning and instruction series. Motivation in learning contexts: Theoretical advances and methodological implications. New York: Pergamon Press. V O N O W , Anna/ Husfeldt, Vera (2011): Geschlechterdifferenzen und schulische Leistungen. Eine Übersicht zum Forschungsstand. Aarau. W A G E M A K E R , Hans (1996): Are girls better readers? Gender differences in reading literacy in 32 countries. Amsterdam: The International Association for the Evaluation of Educational Achievement. 678 Bibliographie W A G N E R , Rudi F. (2016): Unterricht aus Sicht der Lehrerinnen und Lehrer. Subjektive Theorien zur Unterrichtsgestaltung und ihre Veränderung durch ein Training zu neuen Unterrichtsmethoden. Bad Heilbrunn: Klinkhardt. W A G N E R , Wolfgang/ Helmke, Andreas/ Rösner, Ernst (Hrsg.) (2009): Deutsch Englisch Schü‐ lerleistungen International. Dokumentation der Erhebungsinstrumente für Schülerinnen und Schüler, Eltern und Lehrkräfte. Deutsches Institut für Internationale Pädagogische Forschung (DIPF). Frankfurt a. M.: peDOCS. W A G N E R , Wolfgang/ Helmke, Andreas/ Schrader, Friedrich-Wilhelm/ Eichler, Wolf‐ gang/ Thomé, Günther/ Willenberg, Heiner (2008): Selbstkonzept und Motivation im Fach Deutsch. In: DESI-Konsortium (Hrsg.): Unterricht und Kompetenzerwerb in Deutsch und Englisch. Ergebnisse der DESI-Studie. Weinheim, Basel: Beltz, S.-231-243. W A L K E R , Carolyn Rosemary (2013): What students talk about when they talk about reading: a study of self-concept in reading in a second or foreign language. University of Exeter. W A L K E R , John K./ Perry, Frank A. (1978): Males Versus Females as Second-Language Learners. In: TESL Talk 9 (3), S.-69-70. W A L L E N T I N , Mikkel (2008): Putative sex differences in verbal abilities and language cortex: A critical review. In: Brain & Language 108 (3), S.-175-183. W A R D E N , Clyde A./ Lin, Hsiu Ju (2000): Existence of Integrative Motivation in an Asian EFL Setting. In: Foreign Language Annals 33 (5), S.-535-545. W E B E R , Johanna Eleonore/ Rammsayer, Thomas (2012): Differentielle Psychologie - Per‐ sönlichkeitsforschung. Göttingen: Hogrefe. W E H B E R G , Sonja/ Vach, Werner/ Bleses, Dorthe/ Jensen, Pia T./ Madsen, Thomas O./ Basbøll, Hans (2008): Girls talk about dolls and boys about cars? Analyses of group and individual variation in Danish children's first words. In: First Language 28 (1), S. 71-85. W E I N E R , Bernard (1992): Human motivation. Metaphors, theories and research. Newbury Park: Sage Publications. W E I N E R , Bernard (2010): The Development of an Attribution-Based Theory of Motivation: A History of Ideas. In: Educational Psychologist 45 (1), S.-28-36. W E I N E R T , Franz E. (Hrsg.) (1997): Psychologie des Unterrichts und der Schule. Göttingen: Hogrefe. W E I N E R T , Franz E. (2014): Leistungsmessungen in Schulen. 3. Aufl. Weinheim: Beltz. W E I N E R T , Franz E./ Helmke, Andreas (1997a): Bedingungsfaktoren schulischer Leis‐ tungen. In: Franz E. Weinert (Hrsg.): Psychologie des Unterrichts und der Schule. Göttingen: Hogrefe, S.-71-176. W E I N E R T , Franz E./ Helmke, Andreas (Hrsg.) (1997b): Entwicklung im Grundschulalter. Weinheim: Beltz. W E I R , Cyril J. (2005): Language Testing and Validation. An Evidence-Based Approach. Basingstoke: Palgrave Macmillan. Bibliographie 679 W E I S , Martina (2009): Stereotyp, et alors? Das Frankreichbild bayerischer Schüler im Kontext von Lehrplan, Schulbuch und individueller Frankreicherfahrung. Tönning: Der Andere Verlag. W E I S S , Elisabeth M./ Kemmler, Georg/ Deisenhammer, Eberhard A./ Fleischhacker, W.Wolfgang/ Delazer, Margarete (2003): Sex differences in cognitive functions. In: Personality and Individual Differences 35 (4), S.-863-875. W E S T , Candace/ Zimmerman, Don H. (1987): Doing Gender. In: Gender and Society 1 (2), S.-125-151. W E S T E R H O F F , Nikolas (2008): Neurodidaktik auf dem Prüfstand. In: Gehirn & Geist. Das Magazin für Psychologie und Hirnforschung (12), S.-36-43. W E S T H O F F , Karl/ Hagemeister, Carmen (2005): Konzentrationsdiagnostik. Lengerich: Pabst. W I D D E L , Heino (1977): Attribuierungsfragebogen für Erfolg und Mißerfolg in der Schule (AEM 5-7). Weinheim: Beltz. W I L D , Elke/ Möller, Jens (Hrsg.) (2009): Pädagogische Psychologie. Heidelberg: Springer. W I L D E N , Eva/ Porsch, Raphaela (2015): Die Hör- und Leseverstehensleistungen von Kindern im Fach Englisch am Ende der Grundschulzeit unter besonderer Berücksich‐ tigung lebensweltlicher Ein- und Mehrsprachigkeit. In: Kötter, Markus/ Rymarczyk, Jutta (Hrsg.): Englischunterricht auf der Primarstufe. Neue Forschungen - weitere Entwicklungen. Frankfurt a. M.: Lang, S.-59-80. W I L D E N , Eva/ Rossa, Henning (Hrsg.) (2019): Fremdsprachenforschung als interdiszipli‐ näres Projekt. Berlin u. a.: Lang. W I L L E M S , Katharina (2007): Schulische Fachkulturen und Geschlecht. Physik und Deutsch - natürliche Gegenpole? Bielefeld: Transcript. W I L L I A M S , Marion (1994): Motivation in foreign and second language learning: an interactive perspective. In: Educational and child psychology 11 (2), S.-77-84. W I L L I A M S , Marion/ Burden, Robert (1997): Psychology for Language Teachers. A Social Constructivist Approach. Cambridge: Cambridge University Press. W I L L I A M S , Marion/ Burden, Robert/ Lanvers, Ursula (2002): "French is the Language of Love and Stuff": student perceptions of issues related to motivation in learning a foreign language. In: British Educational Research Journal 28 (4), S.-503-528. W I N K E L M A N N , Henrik/ Groeneveld, Imke (2010): Geschlechterdisparitäten. In: Köller, Olaf/ Knigge, Michel/ Tesch, Bernd (Hrsg.): Sprachliche Kompetenzen im Ländervergleich. Befunde des ersten Ländervergleichs zur Überprüfung der Bildungsstandards für den Mittleren Schulabschluss in den Fächern Deutsch, Englisch und Französisch. Münster: Waxmann, S.-175-184. W I R T Z , Markus Antonius (Hrsg.) (2014): Dorsch - Lexikon der Psychologie. 18. Aufl. Bern: Hogrefe Verlag. W O L F F , Dieter (2002): Fremdsprachenlernen als Konstruktion. Grundlagen für eine kon‐ struktivistische Fremdsprachendidaktik. Frankfurt a. M.: Lang. 680 Bibliographie W O R R A L L , Norman/ Tsarna, Helen (1987): Teachers' Reported Practices towards Girls and Boys in Science and Languages. In: British Journal of Educational Psychology 57 (3), S.-300-312. W O J N E S I T Z , Alexandra/ Konzett-Firth, Carmen (2022): Mündlichkeit im Französischun‐ terricht: Multiperspektivische Zugänge/ L'oralité dans l'enseignement du français: Perspectives multiples.-Tübingen: Narr. W R I G H T , Margaret (1999): Influences on learner attitudes towards foreign language and culture. In: Educational Research 41 (2), S.-197-208. Y A G U E L L O , Marina/ Blanche-Benveniste, Claire (Hrsg.) (2003): Le grand livre de la langue française. Paris: Editions du Seuil. Y A N G , Yonglin L. (2001): Sex and language proficiency level in color-naming perfor‐ mance: an ESL/ EFL perspective. In: International Journal of Applied Linguistics 11 (2), S.-238-256. Z A U N B A U E R , Anna C. M./ Retelsdorf, Jan/ Möller, Jens (2009): Die Vorhersage von Engli‐ schleistungen am Anfang der Sekundarstufe. In: Zeitschrift für Entwicklungspsycho‐ logie und Pädagogische Psychologie 41 (3), S.-153-164. Z H A N G , Houcan/ Wang, Xiaoping (1989): Chinese Standardization of Raven’s Standard Progressive Matrices. In: Psychological Test Bulletin 2 (2), S.-36-39. Z U G H O U L , Muhammad R./ Taminian, Lucine (1984): The linguistic attitudes of Arab university students: factorial structure and intervening variables. In: International Journal of the Sociology of Language 50, S.-155-179. Z Y D A T Iẞ , Wolfgang (2012): Fragebogenkonstruktion im Kontext des schulischen Fremd‐ sprachenlernens. Grundlagenbeitrag. In: Doff, Sabine (Hrsg.): Fremdsprachenunter‐ richt empirisch erforschen. Grundlagen - Methoden - Anwendung. Tübingen: Narr, S.-115-135. Bibliographie 681 Abbildungsverzeichnis Abb. 1: Netzwerkmodell der interaktiven Faktoren des genderbezogenen Fremdsprachenlernerfolgs (Adaptation und Erweiterung des Modells von López Rúa 2006: 112) . . 138 Abb. 2: Poweranalyse zur Ermittlung der nötigen Stichprobengröße mit Hilfe der Software G*Power . . . . . . . . . . . . . . . . . . . . . . . 155 Abb. 3: Progression nach den Niveaustufen des GeR in der zweiten Fremdsprache Französisch und in der dritten Fremdsprache Spanisch am Gymnasium in Baden-Württemberg . . . . . . . . 171 Abb. 4: Boxplots zur Verteilung der Punktzahlen im gesamten Hörverstehenstest Französisch, aufgeteilt nach Geschlecht 295 Abb. 5: Boxplots zur Verteilung der Punktzahlen im gesamten Hörverstehenstest Spanisch, aufgeteilt nach Geschlecht . . 298 Abb. 6: Boxplots zur Verteilung der Punktzahlen im gesamten Leseverstehenstest Französisch, aufgeteilt nach Geschlecht 305 Abb. 7: Boxplots zur Verteilung der Punktzahlen im gesamten Leseverstehenstest Spanisch, aufgeteilt nach Geschlecht . . 309 Abb. 8: Boxplots zur Sprachhandlungskompetenz im Schreibtest Französisch, aufgeteilt nach Geschlecht . . . . . . . . . . . . . . . . 363 Abb. 9: Boxplots zum Gesamtdurchschnitt im Schreibtest Französisch (Rating 2), aufgeteilt nach Geschlecht . . . . . . . 371 Abb. 10: Boxplots zur sprachlichen Gesamtleistung im Schreibtest Französisch (Rating 3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375 Abb. 11: Boxplots zur Sprachhandlungskompetenz im Schreibtest Spanisch, aufgeteilt nach Geschlecht . . . . . . . . . . . . . . . . . . . 382 Abb. 12: Boxplots zum Gesamtdurchschnitt im Schreibtest Spanisch (Rating 2), aufgeteilt nach Geschlecht . . . . . . . . . . . . . . . . . . 389 Abb. 13: Boxplots zur sprachlichen Gesamtleistung im Schreibtest Spanisch (Rating 3), aufgeteilt nach Geschlecht . . . . . . . . . . 393 Abb. 14: Boxplots zur sprachlichen Gesamtleistung in Französisch (Hörverstehenstest, Leseverstehenstest und Schreibtest), aufgeteilt nach Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402 Abb. 15: Boxplots zur sprachlichen Gesamtleistung in Spanisch (Hörverstehenstest, Leseverstehenstest und Schreibtest), aufgeteilt nach Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402 Abb. 16: Geschätzte Randmittel der Ergebnisse des Hörverstehenstests in Französisch (SöS, Geschlecht) . . . . . 410 Abb. 17: Geschätzte Randmittel der Ergebnisse des Leseverstehenstests in Französisch (SöS, Geschlecht) . . . . . 410 Abb. 18: Geschätzte Randmittel der Ergebnisse des Schreibtests in Französisch (SöS, Geschlecht) . . . . . . . . . . . . . . . . . . . . . . . . . 411 Abb. 19: Geschätzte Randmittel der Gesamtergebnisse in den Französischtests (SöS, Geschlecht) . . . . . . . . . . . . . . . . . . . . . 411 Abb. 20: Geschätzte Randmittel der Ergebnisse des Hörverstehenstests in Französisch (sprachlicher Hintergrund, Geschlecht) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 Abb. 21: Geschätzte Randmittel der Ergebnisse des Leseverstehenstests in Französisch (sprachlicher Hintergrund, Geschlecht) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 Abb. 22: Geschätzte Randmittel der Ergebnisse des Schreibtests in Französisch (sprachlicher Hintergrund, Geschlecht) . . . . . . 415 Abb. 23: Geschätzte Randmittel der Gesamtergebnisse in den Französischtests (sprachlicher Hintergrund, Geschlecht) . . 415 Abb. 24: Geschätzte Randmittel des Hörverstehenstests in Spanisch (SöS, Geschlecht) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419 Abb. 25: Geschätzte Randmittel des Leseverstehenstests in Spanisch (SöS, Geschlecht) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419 Abb. 26: Geschätzte Randmittel des Schreibtests in Spanisch (SöS, Geschlecht) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420 Abb. 27: Geschätzte Randmittel der Gesamtergebnisse der Spanischtests (SöS, Geschlecht) . . . . . . . . . . . . . . . . . . . . . . . 420 Abb. 28: Geschätzte Randmittel des Hörverstehenstests in Spanisch (sprachlicher Hintergrund, Geschlecht) . . . . . . . . . . . . . . . . . 423 Abb. 29: Geschätzte Randmittel des Leseverstehenstests in Spanisch (sprachlicher Hintergrund, Geschlecht) . . . . . . . . . . . . . . . . . 423 Abb. 30: Geschätzte Randmittel des Schreibtests in Spanisch (sprachlicher Hintergrund, Geschlecht) . . . . . . . . . . . . . . . . . 424 Abb. 31: Geschätzte Randmittel der Gesamtergebnisse der Spanischtests (sprachlicher Hintergrund, Geschlecht) . . . . 424 Abb. 32: Prozentuale Häufigkeiten der einzelnen Interessensgebiete der Französischstichprobe, aufgeteilt nach Geschlecht . . . . 429 Abb. 33: Prozentuale Häufigkeiten der einzelnen Interessensgebiete der Spanischstichprobe, aufgeteilt nach Geschlecht . . . . . . 437 684 Abbildungsverzeichnis Abb. 34: Netzwerkmodell der interaktiven Faktoren des genderbezogenen Sprachlernerfolgs (Adaptation und Erweiterung des Modells von López Rúa 2006: 112): Darstellung der Prädiktoren für die fremdsprachliche Leistung der weiblichen Französischlernerinnen . . . . . . . . . 507 Abb. 35: Netzwerkmodell der interaktiven Faktoren des genderbezogenen Sprachlernerfolgs (Adaptation und Erweiterung des Modells von López Rúa 2006: 112): Darstellung der Prädiktoren für die fremdsprachliche Leistung der männlichen Französischlerner . . . . . . . . . . . . . 511 Abb. 36: Netzwerkmodell der interaktiven Faktoren des genderbezogenen Sprachlernerfolgs (Adaptation und Erweiterung des Modells von López Rúa 2006: 112): Darstellung der Prädiktoren für die fremdsprachliche Leistung der weiblichen Spanischlernerinnen . . . . . . . . . . . 527 Abb. 37: Netzwerkmodell der interaktiven Faktoren des genderbezogenen Sprachlernerfolgs (Adaptation und Erweiterung des Modells von López Rúa 2006: 112): Darstellung der Prädiktoren für die fremdsprachliche Leistung der männlichen Spanischlerner . . . . . . . . . . . . . . . 528 Abbildungsverzeichnis 685 Tabellenverzeichnis Tabelle 1: Construct Map des Hörverstehenstests von lingualevel . . . . . . . 178 Tabelle 2: Construct Map des Leseverstehenstests von lingualevel . . . . . . 192 Tabelle 3: Construct Map des Schreibtests von lingualevel . . . . . . . . . . . . . 204 Tabelle 4: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen zur „integrativen Orientierung (IntOr) gepaart mit dem Ideal L3/ L4 Self (IdSel) für Französisch bzw. Spanisch“ . . . . . . . 223 Tabelle 5: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen zur „instrumentellen Orientierung (InstOr) für Französisch bzw. Spanisch“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 Tabelle 6: Items, Faktorladungen, Mittelwerte und Standardabweichungen der Skalen zur „L3/ L4 WTC” . . . . . . . . 229 Tabelle 7: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen zum „Interesse am Fach Französisch bzw. Spanisch“ . . 232 Tabelle 8: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „Einstellungen zur französischen bzw. spanischen Zielkultur“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 Tabelle 9: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „genderstereotyp weibliche Wahrnehmung des Französischen bzw. Spanischen“ . . . . . . . . . . . . . . . . . . . . . . . . . 239 Tabelle 10: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „FFS bzw. SFS Selbstkonzept“ . . . . . . . . . . . . . . . . . . . . . . 241 Tabelle 11: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „L3-/ L4-Angst“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244 Tabelle 12: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „wahrgenommene Unterstützung durch die Französischbzw. Spanischlehrkraft“ . . . . . . . . . . . . . . . . . . . . . 246 Tabelle 13: Items, Faktorladungen und Reliabilitätskoeffizienten der Skalen „wahrgenommene Erwartungen der Französischbzw. Spanischlehrkraft“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 Tabelle 14: Items, Faktorladungen, Mittelwerte und Standardabweichungen der Skalen „wahrgenommene Aufmerksamkeitsverteilung der Französischbzw. Spanischlehrkraft zugunsten der Mädchen“ . . . . . . . . . . . . . . . . 249 Tabelle 15: Items, Faktorladungen, Mittelwerte und Standardabweichungen der Skalen „wahrgenommene Erwartungen der Peers“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250 Tabelle 16: Items, Faktorladungen, Mittelwerte und Standardabweichungen der Skalen „wahrgenommene Erwartungen der Eltern in Französisch bzw. Spanisch“ . . . . . . 253 Tabelle 17: Übersicht über die statistischen Merkmale der Klumpenstichprobe im Fach Französisch (9. Jgst. Gymnasium) bezüglich der Merkmalsgruppen Geschlecht und sprachlicher Hintergrund, aufgeteilt nach den einzelnen Klumpen . . . . . . . 264 Tabelle 18: Übersicht über die statistischen Merkmale der Klumpenstichprobe im Fach Französisch bezüglich der Merkmale sozioökonomischer beruflicher Status (HISEI) und Geschlecht, aufgeteilt nach den einzelnen Klumpen (9. Jgst. Gymnasium) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266 Tabelle 19: Übersicht über die statistischen Merkmale der Klumpenstichprobe im Fach Spanisch (9. Jgst. Gymnasium) bezüglich der Merkmalsgruppen Geschlecht, sprachlicher Hintergrund, aufgeteilt nach den einzelnen Klumpen . . . . . . . 271 Tabelle 20: Übersicht über die statistischen Merkmale der Klumpenstichprobe im Fach Spanisch bezüglich der Merkmale sozioökonomischer beruflicher Status (HISEI) und Geschlecht, aufgeteilt nach den einzelnen Klumpen (9. Jgst. Gymnasium) . 272 Tabelle 21: Schiefe und Kurtosis der Verteilungen von BZO (SW), KL (SW) und F% (SW) des d2-R-Tests (Brickenkamp et al. 2010) . . . . . . . 278 Tabelle 22: Ergebnisse aus dem Test d2-R, aufgeteilt nach den Merkmalsgruppen Französisch und Spanisch . . . . . . . . . . . . . . 281 Tabelle 23: Ergebnisse aus dem Test d2-R, aufgeteilt nach den Merkmalsgruppen Französisch weiblich, Französisch männlich, Spanisch weiblich, Spanisch männlich . . . . . . . . . . . 282 Tabelle 24: Schiefe und Kurtosis der Verteilung der Ergebnisse im schlussfolgernden Denken, erhoben durch den SPM-Test (Raven 2009) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286 Tabelle 25: Ergebnisse des SPM-Tests, aufgeteilt nach den Merkmalsgruppen Französisch, Spanisch, Französisch weiblich, Französisch männlich, Spanisch weiblich und Spanisch männlich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 688 Tabellenverzeichnis Tabelle 26: Schiefe und Kurtosis der Verteilungskurven der erreichten Punktzahlen im Hörverstehenstest in Französisch, unterteilt in die jeweiligen Teilaufgaben und die Gesamtpunktzahl . . . . . . . 292 Tabelle 27: Ergebnisse im Hörverstehenstest Französisch, aufgeteilt nach Teilaufgaben und Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293 Tabelle 28: Schiefe und Kurtosis der Verteilungskurven der Punktezahlen im Hörverstehenstest in Spanisch, unterteilt in die jeweiligen Teilaufgaben und die Gesamtpunktzahl . . . . . . . . . . . . . . . . . . . 296 Tabelle 29: Ergebnisse im Hörverstehenstest Spanisch, aufgeteilt nach Teilaufgaben und Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296 Tabelle 30: Schiefe und Kurtosis der Verteilungskurven in den drei Teilaufgaben des Leseverstehenstests sowie der erreichten Gesamtpunktzahlen in Französisch . . . . . . . . . . . . . . . . . . . . . . . 301 Tabelle 31: Statistische Ergebnisse der Französischstichprobe im Leseverstehenstest, aufgeteilt nach Teilaufgaben und Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303 Tabelle 32: Schiefe und Kurtosis der Verteilungskurven der Ergebnisse drei Teilaufgaben und des Gesamtergebnisses des Leseverstehenstests in Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . 306 Tabelle 33: Statistische Ergebnisse der Spanischstichprobe im Leseverstehenstest, aufgeteilt nach Teilaufgaben und Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 Tabelle 34: Holistisches Rating der Sprachhandlungskompetenz im Schriftlichen, in Anlehnung an Lenz/ Studer (2008c) . . . . . . . . . 311 Tabelle 35: Evaluationsraster für das zweite, analytische Ratingverfahren der Schülerinnen- und Schülertexte aus dem Schreibtest . . . . . 316 Tabelle 36: Deskriptoren zu Text (im Sinne von produktiver Textkompetenz) als Subkategorie von Kohärenz und Kohäsion 323 Tabelle 37: Deskriptoren zu Verwendung von Konnektoren als Subkategorie von Kohärenz und Kohäsion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 Tabelle 38: Deskriptoren zu räumlichen und zeitlichen Bezügen als Subkategorie von Kohärenz und Kohäsion . . . . . . . . . . . . . . . . . 325 Tabelle 39: Deskriptoren zu Koreferenz als Subkategorie von Kohärenz und Kohäsion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 Tabelle 40: Deskriptoren zu Wortschatzspektrum . . . . . . . . . . . . . . . . . . . . . 331 Tabelle 41: Deskriptoren zu Verwendung des Wortschatzes . . . . . . . . . . . . . 335 Tabelle 42: Deskriptoren zu lexikalischer Orthographie und Interpunktion 337 Tabelle 43: Deskriptoren zu Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340 Tabellenverzeichnis 689 Tabelle 44: Deskriptoren zu Verwendung der Tempi und Modi (sowie von ser/ estar/ hay im Spanischen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344 Tabelle 45: Deskriptoren zu Morphosyntax und grammatischer Orthographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351 Tabelle 46: Korrekturraster des dritten Ratings (vgl. Lenz/ Studer 2008a, 2008b, 2008c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357 Tabelle 47: Schiefe und Kurtosis der Verteilungskurve in der Sprachhandlungskompetenz im Schreibtest in Französisch (Rating 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358 Tabelle 48: Schiefe und Kurtosis der Teilkonstrukte Wortanzahl (klassifiziert), Befolgung der Arbeitsanweisung, Inhalt 1 und Inhalt 2 im Schreibtest in Französisch (Rating 2) . . . . . . . . . . . . 360 Tabelle 49: Schiefe und Kurtosis der Kategorien Kohärenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, lexikalische Orthographie und Interpunktion, Verwendung der Tempi und Modi, Morphosyntax und grammatische Orthographie sowie der gesamten durchschnittlichen Punktzahl im Schreibtest in Französisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362 Tabelle 50: Statistische Ergebnisse der Französischstichprobe im Teilkonstrukt Sprachhandlungskompetenz des Schreibtests, aufgeteilt nach Geschlecht (Rating 1) . . . . . . . . . . . . . . . . . . . . . 363 Tabelle 51: Statistische Ergebnisse der Französischstichprobe in den Teilkonstrukten Wortanzahl, Befolgung der Arbeitsanweisung, Inhalt 1 und Inhalt 2 im Schreibtest, aufgeteilt nach Geschlecht (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364 Tabelle 52: Statistische Ergebnisse der Französischstichprobe in den Teilkonstrukten Kohärenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, lexikalische Orthographie und Interpunktion im Schreibtest in Französisch, aufgeteilt nach Geschlecht (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367 Tabelle 53: Statistische Ergebnisse der Französischstichprobe in den Teilkonstrukten Syntax, Verwendung der Tempi und Modi, Morphosyntax und grammatische Orthographie sowie im Gesamtdurchschnitt des Schreibtests, aufgeteilt nach Geschlecht (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370 Tabelle 54: Schiefe und Kurtosis der Verteilungskurven in den Teilkonstrukten Wortschatz, Grammatik, Orthographie und Text der Schreibleistung in Französisch (Rating 3) . . . . . . . . . . 373 690 Tabellenverzeichnis Tabelle 55: Statistische Ergebnisse der Französischstichprobe in den Teilkonstrukten Wortschatz, Grammatik, Orthographie und Text sowie in der sprachlichen Gesamtleistung im Schreibtest in Französisch, aufgeteilt nach Geschlecht (Rating 3) . . . . . . . . 374 Tabelle 56: Schiefe und Kurtosis der Verteilungskurve in der Sprachhandlungskompetenz im Schreibtest in Spanisch (Rating 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377 Tabelle 57: Schiefe und Kurtosis der Teilkonstrukte Wortanzahl, Befolgung der Arbeitsanweisung, Inhalt 1 und Inhalt 2 im Schreibtest in Spanisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378 Tabelle 58: Schiefe und Kurtosis der Kategorien Kohärenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, lexikalische Orthographie und Interpunktion, Verwendung der Tempi und Modi, Morphosyntax und grammatische Orthographie sowie die gesamte durchschnittliche Punktzahl im Schreibtest in Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380 Tabelle 59: Statistische Ergebnisse der Spanischstichprobe im Teilkonstrukt Sprachhandlungskompetenz des Schreibtests, aufgeteilt nach Geschlecht (Rating 1) . . . . . . . . . . . . . . . . . . . . . 382 Tabelle 60: Statistische Ergebnisse der Spanischstichprobe in den Teilkonstrukten Wortanzahl, Befolgung der Arbeitsanweisung, Inhalt 1 und Inhalt 2 im Schreibtest in Spanisch, aufgeteilt nach Geschlecht (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383 Tabelle 61: Statistische Ergebnisse der Spanischstichprobe in den Teilkonstrukten Kohärenz und Kohäsion, Wortschatzspektrum, Verwendung des Wortschatzes, lexikalische Orthographie und Interpunktion im Schreibtest in Spanisch, aufgeteilt nach Geschlecht (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385 Tabelle 62: Statistische Ergebnisse der Spanischstichprobe in den Teilkonstrukten Syntax, Verwendung der Tempi und Modi, Morphosyntax und grammatische Orthographie sowie im Gesamtergebnis des Schreibtests in Spanisch, aufgeteilt nach Geschlecht (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 388 Tabelle 63: Schiefe und Kurtosis der Verteilungskurven in den Teilkonstrukten Wortschatz, Grammatik, Orthographie und Text der Schreibleistung in Spanisch (Rating 3) . . . . . . . . . . . . . . . . . 391 Tabelle 64: Statistische Ergebnisse der Spanischstichprobe in den Teilkonstrukten Wortschatz, Grammatik, Orthographie und 392 Tabellenverzeichnis 691 Text sowie in der sprachlichen Gesamtleistung im Schreibtest in Spanisch, aufgeteilt nach Geschlecht (Rating 3) . . . . . . . . . . Tabelle 65: Gesamtergebnisse des Schreibtests aus Rating 2 und Rating 3 in Französisch und Spanisch im Vergleich, aufgeteilt nach Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396 Tabelle 66: Schiefe und Kurtosis der Verteilungskurven der Gesamtergebnisse aus allen Sprachtests in Französisch und Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 Tabelle 67: Gesamtergebnisse in Französisch und Spanisch, ermittelt über die Hörverstehenstests, die Leseverstehenstests und die Schreibtests (Rating 2), aufgeteilt nach Geschlecht . . . . . . . . . . 400 Tabelle 68: Zweifaktorielle Varianzanalysen bezüglich der Interaktion von Geschlecht und sozioökonomischem Status (HISEI) in den einzelnen Französischtests und im Gesamtergebnis in Französisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409 Tabelle 69: Zweifaktorielle Varianzanalysen bezüglich der Interaktion von Geschlecht und sprachlichem Hintergrund in den einzelnen Französischtests und im Gesamtergebnis in Französisch . . . . . 413 Tabelle 70: Zweifaktorielle Varianzanalysen bezüglich der Interaktion von Geschlecht und sozioökonomischem Status (HISEI) in den einzelnen Spanischtests und im Gesamtergebnis in Spanisch . 418 Tabelle 71: Zweifaktorielle Varianzanalysen bezüglich der Interaktion von Geschlecht und sprachlichem Hintergrund in den einzelnen Spanischtests und im Gesamtergebnis in Spanisch . . . . . . . . . . 422 Tabelle 72: Medianwerte (Mdn), mittlere Ränge (M Rang ), Mittelwerte (M), Standardabweichungen (SD) und Ergebnisse der t-Tests bzw. Mann-Whitney-U-Tests zu endogenen Faktoren in der Französischstichprobe, aufgeteilt nach Geschlecht . . . . . . . . . . 430 Tabelle 73: Medianwerte (Mdn), mittlere Ränge (M Rang ) , Mittelwerte (M), Standardabweichungen (SD) und Ergebnisse der t-Tests bzw. Mann-Whitney-U-Tests zu den wahrgenommenen exogenen Faktoren in der Französischstichprobe, aufgeteilt nach Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434 Tabelle 74: Medianwerte (Mdn), mittlere Ränge (M Rang ), Mittelwerte (M), Standardabweichungen (SD) und Ergebnisse der t-Tests bzw. Mann-Whitney-U-Tests zu den endogenen Faktoren in der Spanischstichprobe, aufgeteilt nach Geschlecht . . . . . . . . . . . . 438 Tabelle 75: Medianwerte (Mdn), mittlere Ränge (M Rang ), Mittelwerte (M), Standardabweichungen (SD) und Ergebnisse der t-Tests bzw. 442 692 Tabellenverzeichnis Mann-Whitney-U-Tests zu den wahrgenommenen exogenen Faktoren in der Spanischstichprobe, aufgeteilt nach Geschlecht Tabelle 76: Regressionsmodelle 1 bis 5 zum Gesamtergebnis in Französisch 454 Tabelle 77: Regressionsmodelle 1 und 2 zum Ergebnis des Hörverstehenstests in Französisch . . . . . . . . . . . . . . . . . . . . . . . 458 Tabelle 78: Regressionsmodelle 3 bis 5 zum Ergebnis des Hörverstehenstests in Französisch . . . . . . . . . . . . . . . . . . . . . . . 459 Tabelle 79: Regressionsmodelle 1 bis 3 zum Ergebnis des Leseverstehenstests in Französisch . . . . . . . . . . . . . . . . . . . . . . . 460 Tabelle 80: Regressionsmodelle 1 bis 5 zum Ergebnis des Schreibtests in Französisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462 Tabelle 81: Regressionsmodelle 1 bis 3 zum Gesamtergebnis in Spanisch . 467 Tabelle 82: Regressionsmodelle 1 bis 3 zum Ergebnis des Hörverstehenstests in Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . 469 Tabelle 83: Regressionsmodelle 1 bis 3 zum Ergebnis des Leseverstehenstests in Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . 471 Tabelle 84: Regressionsmodelle 1 und 2 zum Ergebnis des Schreibtests in Spanisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472 Tabelle 85: Regressionsmodelle 1a bis 1 f zum Gesamtergebnis der Mädchen in den Französischtests . . . . . . . . . . . . . . . . . . . . . . . . . 477 Tabelle 86: Regressionsmodelle 1a bis 1d zum Gesamtergebnis der Jungen in den Französischtests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 479 Tabelle 87: Regressionsmodelle 1 bis 3 zum Ergebnis der Mädchen im Hörverstehenstest in Französisch . . . . . . . . . . . . . . . . . . . . . . . . 481 Tabelle 88: Regressionsmodell zum Ergebnis der Jungen im Hörverstehenstest in Französisch . . . . . . . . . . . . . . . . . . . . . . . . 482 Tabelle 89: Regressionsmodell zum Ergebnis der Mädchen im Leseverstehenstest in Französisch . . . . . . . . . . . . . . . . . . . . . . . . 484 Tabelle 90: Regressionsmodell zum Ergebnis der Jungen im Leseverstehenstest in Französisch . . . . . . . . . . . . . . . . . . . . . . . . 485 Tabelle 91: Regressionsmodell zum Ergebnis der Mädchen in Teilaufgabe 2 (LV-33, Kurze Geschichte) des Leseverstehenstests in Französisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486 Tabelle 92: Regressionsmodell zum Ergebnis der Jungen in Teilaufgabe 2 (LV-33 Kurze Geschichte) des Leseverstehenstests in Französisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 487 Tabelle 93: Regressionsmodell zum Ergebnis der Mädchen im Schreibtest in Französisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488 Tabellenverzeichnis 693 Tabelle 94: Regressionsmodell zum Ergebnis der Jungen im Schreibtest in Französisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 489 Tabelle 95: Regressionsmodell zur Sprachhandlungskompetenz der Mädchen im Schreibtest in Französisch (Rating 1) . . . . . . . . . . 491 Tabelle 96: Regressionsmodell zur Sprachhandlungskompetenz der Jungen im Schreibtest in Französisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . 492 Tabelle 97: Regressionsmodell zum Ergebnis in Wortanzahl (klassifiziert) der Mädchen im Schreibtest in Französisch (Rating 2) . . . . . . . 493 Tabelle 98: Regressionsmodell zum Ergebnis in Wortanzahl (klassifiziert) der Jungen im Schreibtest in Französisch (Rating 2) . . . . . . . . . 494 Tabelle 99: Regressionsmodelle 1a und 1b zum Ergebnis in Inhalt 1 der Mädchen im Schreibtest in Französisch (Rating 2) . . . . . . . . . . 495 Tabelle 100: Regressionsmodelle 1 und 2 zum Ergebnis in Inhalt 1 der Jungen im Schreibtest in Französisch (Rating 2) . . . . . . . . . . . . . . . . . . . 496 Tabelle 101: Regressionsmodelle 1 und 2 zum Ergebnis in Inhalt 2 der Mädchen im Schreibtest in Französisch (Rating 2) . . . . . . . . . . 497 Tabelle 102: Regressionsmodelle 1 und 2 zum Ergebnis in Inhalt 2 der Jungen im Schreibtest in Französisch (Rating 2) . . . . . . . . . . . . . . . . . . . 499 Tabelle 103: Regressionsmodell zum Ergebnis in Morphosyntax und grammatischer Orthographie der Mädchen im Schreibtest in Französisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500 Tabelle 104: Regressionsmodell zum Ergebnis in Morphosyntax und grammatischer Orthographie der Jungen im Schreibtest in Französisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 501 Tabelle 105: Regressionsmodell zum Ergebnis in Grammatik der Mädchen im Schreibtest in Französisch (Rating 3) . . . . . . . . . . . . . . . . . . . 502 Tabelle 106: Regressionsmodell zum Ergebnis in Grammatik der Jungen im Schreibtest in Französisch (Rating 3) . . . . . . . . . . . . . . . . . . . . . . 503 Tabelle 107: Regressionsmodelle 1a bis 1c zum Gesamtergebnis der Mädchen in Spanischtests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512 Tabelle 108: Regressionsmodell zum Gesamtergebnis der Jungen in den Spanischtests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514 Tabelle 109: Regressionsmodell zum Ergebnis der Mädchen im Hörverstehenstest in Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . 515 Tabelle 110: Regressionsmodell zum Ergebnis der Jungen im Hörverstehenstest in Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . . 516 Tabelle 111: Regressionsmodelle 1 und 2 zum Ergebnis der Mädchen im Leseverstehenstest in Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . 517 694 Tabellenverzeichnis Tabelle 112: Regressionsmodelle 1a und 1b zum Ergebnis der Jungen im Leseverstehenstest in Spanisch . . . . . . . . . . . . . . . . . . . . . . . . . . 518 Tabelle 113: Regressionsmodelle 1a, 1b und 2 zum Ergebnis der Mädchen im Schreibtest in Spanisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . 519 Tabelle 114: Regressionsmodell zum Ergebnis der Jungen im Schreibtest in Spanisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 520 Tabelle 115: Regressionsmodell zum Ergebnis in Befolgung des Arbeitsauftrags der Jungen im Schreibtest in Spanisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 521 Tabelle 116: Regressionsmodell zum Ergebnis in Inhalt 1 der Mädchen im Schreibtest in Spanisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . 522 Tabelle 117: Regressionsmodell zum Ergebnis in Inhalt 1 der Jungen im Schreibtest in Spanisch (Rating 2) . . . . . . . . . . . . . . . . . . . . . . . . 523 Tabelle 118: Standardisierte kanonische Diskriminanzfunktionskoeffizienten und Strukturmatrix der Prädiktoren des Geschlechts in der Französischstichprobe . . . 531 Tabelle 119: Standardisierte kanonische Diskriminanzfunktionskoeffizienten und Strukturmatrix der Prädiktoren des Geschlechts in der Spanischstichprobe . . . . . . 534 Tabellenverzeichnis 695 Inhaltsverzeichnis Anhang (online auf https: / / files.narr.digital/ 9783823386223/ Zusatzmaterial.pdf ) 1 Testleiterskripte.................................................................................................... 4 1.1 Testleiterskript für den Leseverstehenstest .................................................. 4 1.2 Testleiterskript für den Hörverstehenstest ................................................... 4 1.3 Testleiterskript für den Schreibtest..................................................................5 1.4 Testleiterskript für den Schülerfragebogen .................................................. 6 2 Sprachtests .......................................................................................................... 7 2.1 Hörverstehenstest ............................................................................................... 7 2.1.1 Transkription der Hörverstehenstexte Französisch (lingualevel, Lenz/ Studer 2008b) ....................................................................................................... 7 2.1.2 Originale Hörverstehenstests Französisch (lingualevel, Lenz/ Studer 2008b) ...................................................................................................................16 2.1.3 Adaptierter Hörverstehenstest Französisch................................................ 28 2.1.4 Transkription der Hörverstehenstexte Spanisch ....................................... 35 2.1.5 Adaptierter Hörverstehenstest Spanisch..................................................... 44 2.1.6 Materialien für die Standortbestimmung im Hörverstehenstest (lingualevel, Lenz/ Studer 2008b) ................................................................................. 51 2.2 Leseverstehenstests .......................................................................................... 54 2.2.1 Originale Leseverstehenstests Französisch (lingualevel, Lenz/ Studer 2008b) .................................................................................................................. 54 2.2.2 Adaptierte Leseverstehenstests Französisch............................................... 62 2.2.3 Adaptierte Leseverstehenstests Spanisch .................................................... 68 2.2.4 Materialien für die Standortbestimmung im Leseverstehenstest (lingualevel, Lenz/ Studer 2008b) ................................................................................ 74 2.3 Schreibtests ......................................................................................................... 76 2.3.1 Originale Schreibtests Französisch (lingualevel, Lenz/ Studer 2008b) .. 76 2.3.2 Adaptierte Schreibtests Französisch .............................................................80 2.3.3 Adaptierte Schreibtests Spanisch .................................................................. 85 2.3.4 Kompetenzraster Schreiben (lingualevel)....................................................90 2.4 Allgemeine Anpassungsmaßnahmen der Französischtests im Überblick ....................................................................................................... 92 3 Fragebögen ........................................................................................................ 94 3.1 Pretest zum Fragebogen................................................................................... 94 3.1.1 Testleiterskript des Pretests zum Fragebogen ............................................ 94 3.1.2 Schülerfragebogen in der Phase des Pretests.............................................. 97 3.1.3 Transkription des kognitiven Interviews zum Fragebogen................... 107 3.1.4 Protokoll der Rückfragen von Versuchsgruppe 2 des Pretests zum Fragebogen............................................................................................................... 114 3.1.5 Übersicht über die Änderungen des Fragebogens aufgrund des Pretests ........................................................................................................ 115 3.2 Schülerfragebogen Französisch.....................................................................122 3.3 Schülerfragebogen Spanisch.......................................................................... 131 3.4 Codebook - Schülerfragebogen Französisch und Spanisch .................. 140 4 Prüfungen auf Normalverteilung ...................................................................... 150 4.1 Prüfung auf Normalverteilung der Ergebnisse des d2-R-Tests..............150 4.2 Prüfung auf Normalverteilung der Ergebnisse des SPM-Tests ..............150 4.3 Prüfung auf Normalverteilung der Ergebnisse des Hörverstehenstests in Französisch ................................................................................................... 151 4.4 Prüfung auf Normalverteilung der Ergebnisse des Hörverstehenstests in Spanisch.........................................................................................................152 4.5 Prüfung auf Normalverteilung der Ergebnisse des Leseverstehenstests in Französisch ................................................................................................... 153 4.6 Prüfung auf Normalverteilung der Ergebnisse des Leseverstehenstests in Spanisch.........................................................................................................154 4.7 Prüfung auf Normalverteilung der Ergebnisse der Ratings des Schreibtests in Französisch.......................................................................................... 155 4.7.1 Prüfung auf Normalverteilung der Ergebnisse aus Rating 1 des Schreibtests in Französisch.......................................................................................... 155 4.7.2 Prüfung auf Normalverteilung der Ergebnisse aus Rating 2 des Schreibtests in Französisch.......................................................................................... 155 4.7.3 Prüfung auf Normalverteilung der Ergebnisse aus Rating 3 des Schreibtests in Französisch.......................................................................................... 157 4.8 Prüfung auf Normalverteilung der Ergebnisse des Schreibtests in Spanisch ....................................................................................................................158 4.8.1 Prüfung auf Normalverteilung der Ergebnisse aus Rating 1 des Schreibtests in Spanisch ...............................................................................................158 4.8.2 Prüfung auf Normalverteilung der Ergebnisse aus Rating 2 des Schreibtests in Spanisch ...............................................................................................158 4.8.3 Prüfung auf Normalverteilung der Ergebnisse aus Rating 3 des Schreibtests in Spanisch .............................................................................................. 160 4.9 Prüfung auf Normalverteilung der Ergebnisse des Schülerfragebogens in Französisch ................................................................................................... 161 4.10 Prüfung auf Normalverteilung der Ergebnisse des Schülerfragebogens in Spanisch.........................................................................................................163 5 Zwischenergebnisse der exploratorischen Faktorenanalysen .......................... 165 5.1 Vorläufige Skalen zur integrativen Orientierung in Französisch bzw. Spanisch..............................................................................................................165 5.2 Vorläufige Skalen zum Ideal L3/ L4 Self....................................................... 165 5.3 Vorläufige Skalen zu den Einstellungen zur Fremdsprache ...................166 5.4 Vorläufige Skalen zu den Einstellungen zu den Sprecherinnen und Sprechern des Französischen/ Spanischen ..................................................166 5.5 Vorläufige Skalen zu den Einstellungen zu Frankreich bzw. Spanien und deren Kulturen..........................................................................................167 6 Deskriptive Statistiken der Subskalen gruppiert nach Geschlecht ................... 168 6.1 Integrative Orientierung und Ideal L3/ L4 Self ..........................................168 6.2 Instrumentelle Orientierung..........................................................................169 6.3 L3/ L4 WTC im Französischbzw. Spanischunterricht ............................169 6.4 Häufigkeit der Freizeitaktivitäten auf Französisch bzw. Spanisch ...... 170 6.5 Interesse am Fach Französisch/ Spanisch .................................................... 171 6.6 Einstellungen zur französischen bzw. spanischen Zielkultur................ 172 6.7 Genderstereotyp weibliche Wahrnehmung des Französischen bzw. Spanischen .........................................................................................................173 6.8 FFL / SFL Selbstkonzept..................................................................................174 6.9 L3bzw. L4-Angst ............................................................................................ 175 6.10 Wahrgenommene Unterstützung durch die Französisch-/ Spanischlehrkraft ..................................................................................................................... 175 6.11 Wahrgenommene Erwartungen der Französisch-/ Spanischlehrkraft .176 6.12 Wahrgenommene Aufmerksamkeitsverteilung der Französisch-/ Spanischlehrkraft zugunsten der Mädchen ......................................................176 6.13 Wahrgenommene Erwartungen der Peers ................................................. 177 6.14 Wahrgenommene Erwartungen der Eltern................................................178 7 Korrelationsanalysen ........................................................................................ 179 7.1 Korrelationsmatrix der gesamten Französischstichprobe.......................179 7.2 Aufgeteilte Korrelationsmatrix nach Geschlecht in Französisch......... 180 7.3 Korrelationsmatrix der gesamten Spanischstichprobe............................ 181 7.4 Aufgeteilte Korrelationsmatrix nach Geschlecht in Spanisch ...............182 8 Regressionsanalysen........................................................................................ 183 8.1 Diagramme zu den Regressionsanalysen für Französisch......................183 8.2 Alternative Regressionsmodelle bezüglich des Französischen..............184 8.3 Diagramme zu den Regressionsanalysen in Spanisch............................. 185 8.4 Alternative Regressionsmodelle bezüglich des Spanischen ...................186 9 Lernendentexte und Korrekturraster ................................................................ 189 9.1 Lernendentexte und Korrekturraster in Französisch...............................189 9.2 Lernendentexte und Korrekturraster in Spanisch ................................... 452 Multilingualism and Language Teaching herausgegeben von Thorsten Piske (Erlangen), Silke Jansen (Erlangen) und Martha Young-Scholten (Newcastle) Bisher sind erschienen: 1 Jessica Barzen, Hanna Lene Geiger, Silke Jansen (Hrsg.) La Española - Isla de Encuentros / Hispaniola - Island of Encounters 2015, 227 Seiten €[D] 64,- ISBN 978-3-8233-6901-1 2 Anja Steinlen, Thorsten Piske (Hrsg.) Bilinguale Programme in Kindertageseinrichtungen Umsetzungsbeispiele und Forschungsergebnisse 2016, 306 Seiten €[D] 68,- ISBN 978-3-8233-6902-8 3 Christine Möller Young L2 learners‘ narrative discourse Coherence and cohesion 2015, 294 Seiten €[D] 68,- ISBN 978-3-8233-6903-5 4 Thorsten Piske, Anja Steinlen (Hrsg.) Cognition and Second Language Acquisition Research on Bilingual and Regular Language Programs 2022, 386 Seiten €[D] 78,- ISBN 978-3-8233-8194-5 5 Viviane Lohe Die Entwicklung von Language Awareness bei Grundschulkindern durch mehrsprachige digitale Bilderbücher Eine quasi-experimentelle Untersuchung zum Einsatz von MuViT in mehrsprachigen Lernumgebungen 2018, 320 Seiten €[D] 78,- ISBN 978-3-8233-8208-9 6 Cordula Glass Collocations, Creativity and Constructions A Usage-based Study of Collocations in Language Attainment 2019, 306 Seiten €[D] 78,- ISBN 978-3-8233-8171-6 7 Anja Steinlen English in Elementary Schools Research and Implications on Minority and Majority Language Children’s Reading and Writing Skills in Regular and Bilingual Programs 2021, 208 Seiten €[D] 49,- ISBN 978-3-8233-8451-9 8 Patrick Wolf-Farré, Katja F. Cantone, Anastasia Moraitis, Daniel Reimann (Hrsg.) Sprachkontrast und Mehrsprachigkeit Linguistische Grundlagen, didaktische Implikationen und Desiderata 2021, 332 Seiten €[D] 78,- ISBN 978-3-8233-8349-9 9 Ruth Trüb An Empirical Study of EFL Writing at Primary School 2022, 293 Seiten €[D] 58,- ISBN 978-3-8233-8543-1 10 Patricia Uhl Die intersektionale Wirkung von Geschlecht und Gender bei Französisch- und Spanischlernenden in Jahrgangsstufe 9 2023, 700 Seiten €[D] 118,- ISBN 978-3-8233-8622-3 Multilingualism and Language Teaching MLT Multilingualism and Language Teaching ISBN 978-3-8233-8622-3 10 In der quantitativen Studie werden 92 Französisch- und 94 Spanischlernende der 9. Jahrgangsstufe des Gymnasiums hinsichtlich der multiplen Einflussfaktoren auf ihre fremdsprachliche Leistung im Hören, Lesen und Schreiben unter besonderer Berücksichtigung der Variablen Geschlecht und Gender miteinander verglichen. Dabei wird ersichtlich, dass die fremdsprachlichen Leistungen der Jungen und Mädchen je nach Zielsprache und Teilkompetenz teilweise stark variieren. Während in Französisch signifikante Geschlechterunterschiede zugunsten der Mädchen gefunden werden, sind in Spanisch schwache, nicht signifikante Effekte zugunsten der Jungen messbar. Einen erhöhten Erkenntnisgewinn erbringt jedoch die Erforschung der Erklärungsansätze für diese Ergebnisse, wobei die Rolle der kognitiven, affektiven und sozialen Leistungsprädiktoren berücksichtigt wird. Patricia Uhl Geschlecht und Gender bei Französisch- und Spanischlernenden 10 Patricia Uhl Die intersektionale Wirkung von Geschlecht und Gender bei Französisch- und Spanischlernenden in Jahrgangsstufe 9 Eine empirische Studie zu multiplen Einflussfaktoren auf die fremdsprachliche Leistung 10