Fremdsprachen Lehren und Lernen
flul
0932-6936
2941-0797
Narr Verlag Tübingen
Es handelt sich um einen Open-Access-Artikel, der unter den Bedingungen der Lizenz CC by 4.0 veröffentlicht wurde.http://creativecommons.org/licenses/by/4.0/121
2001
301
Gnutzmann Küster SchrammZum Problem der Authentizität in L2-Hörverstehenstests
121
2001
Peter Paschke
flul3010150
Peter Paschke * Zum Problem der Authentizität in 12-Hörverstehenstests 1 Abstract. Listening comprehension (LC) is the most important basic ability in everyday communication and hence a fixed part of most L2 proficiency tests. But what do these tests tel1 us about the ability to comprehend spoken language in the real world? After some preliminary remarks about the cognitive aspects of LC, the article breaks down the general question into a (non-exhaustive) series of issues conceming the authenticity of LC tests: the importance of comprehension that goes beyond facts and literal meaning, the role of spontaneous discourse with its specific phonetic and syntactic features, the problematic omission of listening in two-way-interaction, the lack of visual elements which normally assist LC, the question of how many times to administer the LC text and, finally, the influence of different question formats on the test-taker's cognitive operations. 0. Fragestellung Hörverstehen (HV)-mit einem zeitlichen Anteil von 45% (Feyten 1991: 174) die wichtigste Einzelfertigkeit in der Alltagskommunikation ist fester Bestandteil von Sprachstandstests. Was aber sagen die Ergebnisse von HV-Tests tatsächlich über die Fähigkeit aus, im Alltag gesprochene Texte zu verstehen? Inwieweit sind Test- und Realsituation hinsichtlich der Bedingungen, Ziele und Prozesse des Hörverstehens vergleichbar? "Any language test is by its very nature inauthentic, abnormal language behaviour, for the test taker is being asked not to answer a question giving information but to display knowledge or skill". Der von Spolsky (1985: 39) pointiert formulierten prinzipiellen Nicht- Authentizität von L2-Tests kann auch das Hörverstehen nicht entrinnen. Wie kann man dennoch aus der im Test gezeigten Performanz auf eine zugrunde liegende HV-Kompetenz und damit aufHV-Leistungen außerhalb des Tests schließen? D.h. wie lässt sich die Validität von HV-Tests sichern? Bachmann (1990: 316) fordert, "[...] the characterization of authenticity in language tests must take cognizance of the critical features, or essential characteristics of communicative language use, rather than attempting to capture holistic language use situations". Aus dieser Sicht ist nicht die (theorielose) Imitation der Realsituation als solcher das Ziel eines authentischen (und somit validen) HV-Tests, sondern die Auswahl und gezielte Reproduktion der entscheidenden (sprachlichen und kognitiven) Merkmale echter Hörverstehensaufgaben. Allerdings fehlt bisher eine umfassende, empirisch gesicherte und operationalisierbare Definition des Hörverstehens in der Fremd- Korrespondenzadresse: Peter PASCHKE, M.A. Universita di Venezia, Centro Linguistico Interfacolta, S. Croce 2161, 1-30100 VENEZIA. E-mail: paschke@unive.it Arbeitsbereiche: Prüfen und Testen, Lesekurse für Geisteswissenschaftler. 1 Der vorliegende Beitrag beruht in wesentlichen Teilen auf Paschke (2000). lFLllL 30 (2001) Zum Problem der Authentizität in L2-Hörverstehenstests 151 sprache (BuckJ997: 69; Dunkel/ Henning/ Chaudron 1993: 180; Rubin 1994). Ebendaher rührt umgekehrt die Attraktivität eines imitatorischen Begriffs von Authentizität: "The reason is simple: given that there is doubt about exactly what knowledge, skills and abilities need to be included in a communicative test, one way to ensure that all the vital aspects are included is to replicate 'real-world' communication." (Buck 1997: 69 f) Im Spannungsfeld dieser unterschiedlichen Konzepte von Authentizität (vgl. auch das Begriffspaar Kompetenz-/ Performanztest in McNamara 1997; Grotjahn 2000b: 322 ff), erörtert der vorliegende Beitrag nach einer Vorbemerkung zu den kognitiven Grundlagen des Hörverstehens ausgewählte Fragen zur AuthentizitätNalidität von HV-Tests: • Inwieweit sind subjektive Verstehensprozesse objektiv überprüfbar? • Müssen Hörtexte in jedem Fall im strikten Sinn authentisch sein? • Welche unterschiedlichen Hörerrollen sind im Test zu berucksichtigen? • Welche Folgen hat der Verzicht auf visuelle Stimuli im HV-Test? • Darf der Hörtext (anders als in der Sprachrealität) mehrfach präsentiert werden? • Welche Aufgabenformate stellen realistische HV-Anforderungen? 1. Hörverstehen Um die Mitte des 20. Jahrhunderts wurde sprachliche Kommunikation als Übertragung von Nachrichten über einen Kanal von einem Sender zum Empfänger konzipiert. Ein gemeinsamer Code (Grammatik, Lexik) gewährleistete in diesem information processing model eine eindeutige Dekodierung, unabhängig vom Empfänger/ Hörer (vgl. u.a. Hörmann 1981: 139; Rost 1990: 2 f). Dass der Rezipient eine aktive Rolle beim Aufbau von Bedeutung spielt, wurde zunächst im Rahmen der Pragmalinguistik deutlich: Der Hörer muss das Gemeinte, also die Sprecherintention (Illokution) aus dem Gesagten (Lokution) erschließen. Einen grundlegenden Paradigmenwechsel des Verstehensmodells führte jedoch vor allem die kognitive Psychologie herbei, die sprachliches Verstehen als aktiven, komplexen Prozess der Bedeutungskonstitution auffasst, bei dem Daten des rezipierten Textes mit sprachlichen, pragmatischen, soziokulturellen und enzyklopädischen Wissensbeständen des Hörers/ Lesers verknüpft werden. Textverstehen entspringt aus einer „Interaktion" zwischen Text und Rezipient. Modellhaft kann Verstehen als Wechselwirkung „aufsteigender" und „absteigender" kognitiver Prozesse vorgestellt werden: Situative Elemente oder Textelemente führen (bottom up) zur Aktivierung von Vorwissen, welches seinerseits die Einordnung und Verknüpfung von Textdaten (top down) steuert. Texte enthalten in dieser Sicht keine „Informationen", sondern liefern Daten, aus denen erst der Rezipient Bedeutung „konstruiert" (vgl. Hörmann 1981: 137). Dabei werden „untere" und „obere" Ebenen des Verstehens unterschieden: Erstere umfassen akustische Wahrnehmung (speech perception), Worterkennung, syntaktische Analyse (parsing) und (auf dieser Basis) die Rekonstruktion des propositionalen Gehalts einer Äußerung; letztere betreffen das Erkennen von Textsorte und Sprecherintention, das inhaltliche Inferieren und schließlich die Bewertung. Die Verarbeitungsprozesse auf JFJLulL 30 (2001) 152 Peter Paschke diesen Stufen werden nicht nacheinander durchlaufen, sondern finden parallel statt, stehen in Wechselwirkung und kompensieren sich in gewissem Maße gegenseitig (vgl. Rost 1990: 83 f). Verstehen ist also das Ergebnis einer doppelten Interaktion: einerseits zwischen Hörer(wissen) und Text(daten), andererseits zwischen Verarbeitungsprozessen auf verschiedenen Ebenen. Verstehen, d.h. das Herstellen von Bedeutung, hängt damit ganz wesentlich vom Wissen des Rezipienten ab: Derselbe Text kann von verschiedenen Subjekten bzw. (vom selben Subjekt) zu verschiedenen Zeitpunkten ganz unterschiedlich verstanden werden. Verstehen ist aber auch deshalb subjektiv, weil Hörer denselben Text mit unterschiedlichen Intentionen rezipieren können. Nicht nur Sprechen, auch Hören ist ein „zielgerichteter Vorgang" (Hörmann 1981: 135). Unter anderem können wir uns beim Hören je nach Interesse/ Intention auf den globalen Sinn konzentrieren, auf inhaltliche Details oder sogar einzelne Formulierungen. Drei solcher „Hörstile" globales, selektives und detailliertes Hören 2 sind zu gängigen Kategorien in HV-Tests geworden. Mit Solmecke (1993: 26) sei freilich bedacht, dass globale Sinnerfassung und Detailverstehen kaum je in Reinform vorkommen: "Globalverstehen ohne Verstehen relevanter Details ist kaum möglich. Detailverstehen ohne ein gewisses Verstehen des Gesamtzusammenhangs ist ebenfalls nicht gut möglich". Für HV-Tests stellt sich angesichts der Subjektivität des Verstehens die Frage, inwieweit eine objektive Überprüfung möglich ist. Das L2-Hörverstehen unterscheidet sich nicht grundlegend vom muttersprachlichen, d.h. die Prozesse der Interaktion zwischen perzipiertem Signal und Hörerwissen verlaufen prinzipiell ähnlich. Der Unterschied liegt im beschränkteren Vorwissen: "Der L2-Verarbeiter besitzt geringere und weniger automatisierte Kenntnisse über das phonemische Inventar und die lautlichen Kombinationsmuster der L2 als der Muttersprachler, sein syntaktisches Wissen ist weniger ausgeprägt, auch kann er vielen Wortformen keine Bedeutungen zuordnen. Für die höherrangigen Verarbeitungsstufen darf zumindest davon ausgegangen werden, dass der Lerner häufig nicht über das kulturspezifische Weltwissen verfügt, welches für die Verarbeitung eines L2-Textes oder einer Äußerung erforderlich ist. Auch das Diskurswissen ist bei ihm zumindest anders ausgebildet als beim Muttersprachler" (Wolff 1999: 29 f). Wie Wissens- und Fertigkeitsdefizite auf den einzelnen Ebenen im Hinblick auf die Hörverständnisfähigkeit zu gewichten sind, darüber gehen die Meinungen auseinander. Pallier/ Christophe/ Mehler (1997: 129) und Hirschfeld (1992: 17) z.B. machen „fehlende phonetische Grundlagen" für viele Hörverstehensprobleme verantwortlich, Goh (2000) dagegen warnt davor, Probleme mit der Phonemdiskriminierung in ihrer Bedeutung zu überschätzen. Richtig ist, dass sich dysfunktionale Hörmuster durch wissensgeleitete Inferenzen teilweise ausgleichen lassen; auch LI-Sprecher nehmen ja nicht jeden Laut wahr. "[...] der Fremdsprachler besitzt jedoch nur eine Annäherungskompetenz der zu erlernenden Sprache, kann deswegen nicht oder nur beträchtlich weniger kompensieren und benötigt daher in höherem Maße 'unmarkierte' akustisch-phonetische Eingabesignale" (Dirven 1992: 250). Begrenzte Sprachkenntnisse versuchen manche L2-Hörer durch top-down-Inferenzen zu kompensieren, die sich auf außersprachliches Wissen 2 Definitionen und alternative Begrifflichkeiten in Eggers (1996), Neuf-Münkel (1988), Wiemer (1999). Vgl. auch die listener functions von Lund (1990) und die purposes bei Oxford (1993). lFLllllL 30 (2001) Zum Problem· der Authentizität in L2-H örverstehenstests 153 stützen: "Der Dekodierungsprozess verlagert sich[...] auf eine höhere Ebene. Diese kompensatorische Strategie findet sich bei Muttersprachlern seltener" (Wolff 1999: 30). Auch Rubin (1994: 209) berichtet von Studien, die den positiven Einfluss von thematischem Hintergrundwissen auf die Verstehensleistung zeigen und damit auf top-down-Prozesse hindeuten. Den genannten Beobachtungen widerspricht freilich die vielfach erhobene Klage (vgl. Solmecke 1993: 35; Wolff 1983: 291), L2-Lerner seien nicht imstande, muttersprachliche Verstehensstrategien auf das fremdsprachliche Hören zu übertragen, d.h. zielgerichtet an Hörtexte heranzugehen, das Gehörte mit dem Vorwissen in Beziehung zu setzen, Erwartungen aufzubauen und durch Inferenzen Lücken zu schließen. Es heißt, Lerner nutzten ihr Welt 0 und Textwissen zu wenig, hafteten zu sehr an der sprachlichen Oberfläche und ließen sich durch Schwierigkeiten bei den bottom-up-Verstehens~ prozessen zu stark irritieren (Vgl. Anderson/ Lynch 1988: 42f; Eggers 1996: 101; Frerch/ Kasper 1986: 264; Wiemer 1999: 41). Auch wenn sich diese Aussagen möglicherweise vorrangig auf den gesteuerten Erwerb beziehen, wo Nichtverstehen und Abbruch der Kommunikation (in der Fremdsprache) als legitim gelten, während risikobehaftete 3 topdown-Verstehensstrategien eher in Realsituationen zum Einsatz kommen, so wird gleichwohl deutlich, wie wenig über die Rolle von Strategien beim L2-Hörverstehen bekannt ist. Aussagen darüber, welche Strategien wirksam oder weniger wirksam sind, haben nach Solmecke (1993: 100) bislang nur den Charakter begründeter Hypothesen, da ihre Effektivität nicht ausreichend empirisch erforscht ist. 4 Für die Testpraxis heißt dies: Aufgaben sollten so gestaltet sein (Angabe des Kontextes, authentische Textsorten, adressatengerechte Themen), dass sie den Einsatz von Strategien (Aufbau von Erwartungen, Einsatz von Text- und Weltwissen) erlauben bzw. nahe legen; ein gezieltes Testen einzelner Verstehensstrategien ist jedoch nicht sinnvoll. Hörverstehen ist nicht möglich ohne einen komplexen Prozess der Speicherung von Informationen. Zunächst werden die perzipierten Lautfolgen im Kurzbzw. Arbeitsgedächtnis zu kleinsten Sinneinheiten weiterverarbeitet (vgl. Neuf-Münkel 1988: 230); der Aufbau solcher mentalen Repräsentationen, d.h. die Konstruktion von Bedeutung, ist Bedingung für das Behalten und führt in der Regel zum Verlust des genauen Wortlauts (Hörmann 1981: 133; Rost 1994: 66). Darüber hinaus muss das Arbeitsgedächtnis neu einlaufende Daten in Beziehung setzen mit bereits aktivierten oder aufzurufenden Schemata sowie zuvor aufgenommenen Informationen. "Denn verstandene und gespeicherte Informationen sind sozusagen die Anknüpfungspunkte für noch nicht gesprochene Rede ohne Erinnerung an bereits gesprochene Rede ist die zukünftige Rede ohne Basis" (Neuf-Münkel 1992: 34). Eine Überlastung des Arbeitsgedächtnisses ist vermutlich an 3 Dass kontextgestütztes Rati: : n durchaus nicht immer zum Verstehenserfolg führt, zeigt folgendes Telefonat, in dem ein non native speaker (NNS) die Aufgabe hatte, das Abtippen einer Examensarbeit mit einem native speaker (NS) zu vereinbaren: "NS: Which University is it for? -NNS: Yes I have a more lO0-NS: Pardon me? - NNS: I have more lO0 page - NS: Yes but is it for UCLA? or USC? - NNS: UCLA- NS: I see well is.it typed? -NNS: Type? Yes uh for the I don't I don't type -NNS: Is it handwritten? -NS: Uh pardon me? Excuse me? -[ ... ]" (Anderson/ Lynch 1988: 4lf). 4 Zu empirischen Studien über den Strategieeinsatz beimL2-HV vgl. O'Malley/ Chiunot/ Küpper (1989) sowie Rubin (1994: 21 lt). FL11L 30 (2001) 154 Peter Paschke den meisten HV-Problemen in der Fremdsprache mitbeteiligt. Darauf deutet z.B. die Lernerbefragung von Goh (2000: 60 ff) hin: Unter den fünf meistgenannten Hörproblemen rangierten hier "Quickly forget what is heard" und "Neglect the next part when thinking about meaning". Manchmal scheitert sogar die Nutzung klarer visueller Hilfen an einer Überlastung des Arbeitsgedächtnisses. Ur (1984: 21) führt Fälle von Lernern an, die horse statt hause verstehen, obwohl sie eine eindeutige Illustration vor sich haben, oder die sich setzen, wenn der Lehrer come here sagt und dies mit Gestik unterstützt. Auch der bei Anfängern häufige Versuch, "die verstandenen Teile einer Äußerung durch Übersetzung in die Muttersprache zu sichern und in einen Zusammenhang zu bringen" (Solmecke 1993: 36), belastet das Arbeitsgedächtnis. Für die Testpraxis bedeutsam ist die Erkenntnis, wie leicht zusätzliche Stimuli (z.B. die visuell dargebotenen Aufgabenstellungen) den Verstehensprozess behindern und somit die Ergebnisse von HV-Tests verzerren können. 2. L2-Hörverstehenstests 2.1 Verstehensebenen Kann Hörverstehen überhaupt objektiv überprüft werden, wo es doch ganz wesentlich durch Interesse, Aufmerksamkeit und Vorwissen des Rezipienten determiniert ist? Zu bedenken ist, dass Tests versuchen, den Einfluss (konstruktirrelevanter) subjektiver Faktoren weitgehend zu neutralisieren: Unter der Voraussetzung (künstlich) gesteigerter Aufmerksamkeit, einheitlicher Aufgaben (statt subjektiver Verstehensabsichten) sowie zielgruppenadäquater Textinhalte sind Unterschiede in den individuellen Bedeutungskonstruktionen im Idealfall weitgehend auf Unterschiede in der L2-Kompetenz zurückführbar. Der Einfluss des thematischen Vorwissens bereitet in der Praxis freilich die größten Probleme: "How to deal with the potential effects of differing levels of topic knowledge on language test scores is a problem fundamental to all language tests. There are no easy solutions, and there is certainly no universal solution for all testing situations" (Bachman/ Palmer 1996: 127). Wir stehen vor einem Dilemma: Einerseits ist kulturspezifisches und thematisches Vorwissen konstitutives und notwendiges Element der Hörer- Text-Interaktion, uns interessiert also durchaus die Fähigkeit des L2-Hörers, solches Wissen im Verstehensprozess nutzbringend einzusetzen; andererseits soll das Testergebnis aber von diesem Wissen selbst möglichst unbeeinflusst bleiben. Dies kann eigentlich nur dann gewährleistet werden, wenn alle Testteilnehmer über ein vergleichbares Vorwissen verfügen eine Bedingung, die bei weltweit eingesetzten Tests kaum kontrollierbar ist. Schwer operationalisierbar sind besonders solche HV-Lernziele, die bei "vertrauten The~en" bzw. in Bezug auf den eigenen beruflichen Tätigkeitsbereich bestimmte Verstehensleistungen verlangen (vgl. die HV-Deskriptoren in Council ofEurope 1996). Trotz der genannten Probleme ist HV tendenziell objektivierbar, wenn sich die geforderten Verstehensleistungen auf einen Bereich beziehen, der traditionell mit „im Text lFLIIL 30 (2001) Zum Problem der Authentizität in L2-Hörverstehenstests 155 enthaltene Informationen" umschrieben wird, d.h. auf Bedeutungen, welche die ursprünglichen Adressaten des Textes in weitgehend übereinstimmender Weise konstruieren können. Andererseits ist evident, dass es Bedeutungskonstruktionen wie „Interpretation" oder „Bewertung" gibt, die sich nicht unter den Begriff (objektiver) "Information" subsumieren lassen. Solmecke (1992: 7 f; 1993: 26 f) unterscheidet vier „Verstehensebenen", die mit abnehmender Objektivierbarkeit korrelieren: 1. "Wiedererkennen" bezeichnet die Fähigkeit, den Lautgestalten Bedeutung zuzuordnen. 2. "Verstehen" heißt globale oder selektive Entnahme von Informationen, die gespeichert und ggf. wiedergegeben werden können. 3. "Analytisches Verstehen" beinhaltet Schlussfolgerungen bezüglich Sprecherintention und -einstellung sowie nicht explizierten Orts-, Zeit- und Personenbezügen, die „über den unmittelbaren Textinhalt hinausgehen". 4. "Evaluation" meint Verknüpfung von Textinhalt und -darbietung mit eigenen Erfahrungen und Wertvorstellungen als Grundlage für eine angemessene sprachliche oder außersprachliche Reaktion. - Testaufgaben legen fest, auf welcher Ebene die Verstehensleistungen liegen sollen, d.h. sie bestimmen die geforderte „Verstehenstiefe". Je mehr das Verstehen an der Textoberfläche verbleibt, desto einheitlicher ist das Rezeptionsergebnis: Dass ein Wetterbericht das Wort „Gewitter" enthält (1. Ebene) oder warmes Wetter ankündigt (2. Ebene), darüber werden kompetente Hörer schnell Einigkeit erzielen können; ob aber ein „Du" eine freundschaftliche Beziehung signalisiert (3. Ebene) oder ob eine bestimmte Äußerung von Arroganz zeugt (4. Ebene), ist schon eher kontrovers. Der Kernbereich des Verstehens, welcher objektiven HV-Tests zugänglich ist, umfasst die 2. und teilweise die 3. Ebene. Reines „Wiedererkennen" 5 (1. Ebene) gilt als nicht hinreichend, Evaluation des Gehörten (4. Ebene) als nicht notwendig für das Verstehen (vgl. Dunkel/ Henning/ Chaudron 1993: 181). Problematisch sind vor allem die Verstehensprozesse auf der 3. Ebene (implizite „Information" und Intention/ Motivation des Sprechers): Während sich grundlegende Sprechhandlungen (z.B. ein Kompliment) durchaus objektivieren und testen lassen, entzieht sich die „Frage nach den Motiven, Einstellungen und unausgesprochenen Werthaltungen eines Sprechers" (Solmecke 1993: 27) der notwendigen Objektivierung. Allerdings sollte darauf geachtet werden, das Verstehenskonstrukt in HV-Tests nicht unnötig zu verkürzen. Der Begriff „Information" etwa kann das Missverständnis nahe legen, der Bereich objektivierbaren Verstehens beschränke sich auf die Mitteilung von "Tatsachen". Kühns (1996: 112 ff) Kritik an der PNdS-typischen Konzeption der Vorlesung als „Faktenschleuder" ist daher beizupflichten, wenn er die mit dem Begriff „Inhaltsmomente" operierende Nivellierung vorlesungstypischer Handlungsmuster wie "Tatsachenmitteilung, Problemaufriss, Lösungsvorschläge, Begründungen usw." kritisiert. HV-Tests müssen sich durchaus nicht auf Tatsachenmitteilungen beschränken, sondern können und sollen diverse textuelle und pragmatische Aspekte berücksichtigen. Vgl. Glaboniat 1998: 163 f. Auch Testformen wie Diktat (Macht 1997) und Transkription (Voss 1984: 79 ff), von Lund (1990: 109) als replication zusammengefasst, veranlassen den Hörer, sich mehr auf „surface processing than meaningful processing" (ebd.) zu konzentrieren und gelten deshalb nicht als valide Tests der HV-Kompetenz. FLIIL 30 (2001) 156 Peter Paschke 2.2 Authentische Texte Müssen Hörtexte in Sprachstandstests einem „strikten" Authentizitätskriterium genügen, also "in response to real life communicative needs rather than as an imitation of real life communicative needs" (Underwood 1989: 98) erstellt worden sein? Oder dürfen wir uns mit einer „gemäßigten" Authentizität begnügen, was bedeutet"[... ] dass Texte durchaus auch vereinfacht, gekürzt oder sogar eigens für den Unterricht erstellt werden können, vorausgesetzt die Textmerkmale stimmen" (Bolton 1996: 21; vgl. auch Grotjahn 2000a: 13 f)? Die Antwort hängt davon ab, welche Textmerkmale man als relevant erachtet und ob es gelingt, sie in eigens erstellten Hörtexten zu reproduzieren. Für die Produktion von dialogischen Texten nennt Solmecke (1996: 86 f) folgende Kriterien: Beschränkung auf situativ wahrscheinliche Äußerungen; Beachtung von Gesprächskonventionen (z.B. Einleitung, Beendigung); Rückmeldesignale des Hörers; Pausen, Abbrüche, Reformulierungen (wenigstens in begrenztem Umfang); Einschluss von Missverständnissen (und ihre Behebung); Elemente der Beziehungsregelung (Höflichkeit, Vertrautheit, Fremdheit ausdrücken etc.); gesprächsorganisatorische Elemente (z.B. für Sprecherwechsel). In welchem Maße es gelingt, solche Merkmale authentischer Texte im Studio zu reproduzieren, hängt u.a. vom Grad der Formalität bzw. Spontaneität ab: Je informeller und spontaner gesprochene Texte sind, desto stärker unterscheiden sie sich nämlich von schriftlichen bzw. vorgelesenen Texten in syntaktischer, lexikalischer und phonologischer Hinsicht (vgl. Dirven 1977: 4 ff; Ur 1984: 6 ff). Syntaktische Phänomene spontaner Sprache wie Ellipsen, Topikalisierungen, Häsitationen, Satzabbrüche, Selbstkorrekturen, Wiederholungen, Füllwörter und -formeln lassen sich nicht immer bewusst reproduzieren, zumal sie eng verknüpft sind mit prosodischen Merkmalen wie Melodie, Akzent und Rhythmus (und indirekt mit Assimilation, Elision, Reduktion, Sehwachformen). Wenn Transkriptionen (z.B. der Gesprächsforschung) schwer lesbar sind, weil die Syntax spontan gesprochener Sprache der phonetischen Zusatzinformation bedarf, um verstehbar zu werden, dann erhebt sich umgekehrt die Frage, ob Hörtexte, die (wie im L2-Sprachunterricht meist der Fall) in transkribierter Form auf Anhieb erschlossen werden können, überhaupt die in der Sprachrealität geforderte Fähigkeit involvieren, aus syntaktisch "ungeordneten" Sprachdaten unter Rückgriff auf prosodische (und paralinguistische) Elemente Bedeutung zu konstruieren. Fazit: Prinzipiell ist eine „gemäßigte" Authentizität akzeptabel,. solange entscheidende Textmerkmale (und somit HV-Anforderungen) gewahrt werden. Fraglich aber ist insbesondere bei spontan gesprochenen, dialogischen Texten, ob es gelingt, relevante Textmerkmale im Studio zu reproduzieren. Wenig hilfreich ist im Übrigen eine „Schein-Authentizität" (Solmecke 1991b: 288), die massiv auf erschwerende Momenten wie Dialektfärbung, undeutliches, schnelles Sprechen und Störgeräusche zurückgreift und Texte „wirklicher als die Wirklichkeit" macht (Solmecke 1991a: 147). JF[,ll]L 30 (2001) Zum Problem der Authentizität in L2-Hörverstehenstests 157 2.3 Hörerrollen Idealtypisch lassen sich drei Hörerrollen unterscheiden (vgl. Rost 1990: 5 f): (a) Als Dialogteilnehmer, d.h. Adressat, der selbst zum Sprecher werden kann, hat der Hörer die Chance, Bedeutung durch eigene Beiträge mit auszuhandeln: Er kann nachfragen, Gehörtes wiederholen oder umformulieren (reframing, vgl. Rost 1994: 87 ff) und durch Themensteuerung präzise Vorerwartungen aufbauen. Auch durch back-channelling (Rost 1994: 84 f), d.h. mimische und akustische Hörersignale, nimmt er Einfluss auf den Verlauf der „direkten Kommunikation"; (b) der Zuhörer ist als Teil eines Publikums Adressat der Äußerung, kann aber in der Regel weder eingreifen noch die Äußerung des Sprechers sonst wie beeinflussen; dies gilt besonders für mediale Texte wie Radio- und Fernsehsendungen "indirekte Kommunikation"). Größere inhaltliche und phonetische Explizitheit gleichen diese Erschwernis aber zum Teil wieder aus; (c) ein Mithörer ist weder Adressat der „belauschten" Interaktion von Dritten noch kann er in sie eingreifen. Fehlendes, nur den Beteiligten verfügbares Situations- und Sachwissen (shared knowledge) sowie reduzierte phonetische Redundanz können das Verständnis von mitgehörten Interaktionen stark behindern. Offenbar gibt es Übergangsformen: Ein im Rundfunk ausgestrahltes Interview z.B. ist zwar mitgehörte Interaktion, richtet sich aber explizit an ein Publikum, steht also der Kategorie (b) nahe. Ähnliches gilt für Gruppengespräche und -diskussionen, an denen der L2-Hörer teilnimmt, ohne sich aktiv zu beteiligen. HV-Tests beschränken sich im Allgemeinen auf die Rolle des Zuhörers: Die Probanden hören Texte, die an ein Publikum gerichtet sind und in die sie nicht eingreifen können. Problematisch ist vor allem die Vernachlässigung des Hörens in der Interaktion, da es in den Lernzielen des Fremdsprachenunterrichts eine gewichtige Rolle spielt. Besonders auf den unteren Lernstufen nimmt Alltagskommunikation einen hohen Stellenwert ein, während mediale Texte allenfalls global verstanden werden sollen. Ist es legitim, sich in Tests auf das Verständnis von Durch- und Ansagen zu beschränken6, während in den Lernzielen das Verstehen in der Interaktion mit einem lebendigen Gesprächspartner dominiert? Ist die HV-Kompetenz in gängigen Sprachstandstests unterrepräsentiert oder dürfen wir aus der Performanz in der Zuhörer-Rolle auf eine allgemeine HV-Kompetenz schließen (inkl. Hören in der Interaktion)? Vermutlich ist eine rollenübergreifende Generalisierung insofern vertretbar, als Hörverstehen in jedem Fall die verzögerungslose Verarbeitung auditiv wahrgenommener L2-Daten voraussetzt. Das Spezifikum des interaktiven Hörens, also die Möglichkeit des Hörers, die Produktion der L2-Daten zu beeinflussen und Bedeutungen auf diese Weise interaktiv auszuhandeln, wird freilich nicht erfasst. Allerdings lässt sich die Hypothese aufstellen, dass eine Generalisierung eher zulässig ist, wenn nicht ausschließlich stark vorbereitete bzw. abgelesene Texte (wie Wettervorhersagen, Durch- 6 Die „kommunikativen Aufgaben" im HV-Teil der Prüfung „Deutsch im Alltag" zeigen, in welch engen Grenzen sich die Überprüfung "interaktiven" Hörverstehens in den üblichen Gruppenprüfungen bewegt: Die Kandidaten hören vom Tonband fünf Äußerungen zur Situation „Im Bus": "A: Möchten Sie sich setzen? - B: Wie weit ist es bis zum Bahnhof? - C: Bitte, einmal Stadtzentrum. - D: Fahren Sie zum Postplatz? - E: Wann kommt der nächste Bus? " (Koll/ Müller 1995: 57) und sollen aus sieben schriftlich dargebotenen Antworten die fünf passenden auswählen. JFLIIL 30 (2001) 158 Peter Paschke sagen etc.) präsentiert werden, sondern auch solche, die in ihren Textmerkmalen der spontanen Rede in direkter Kommunikation ähneln, also Texte mitgehörter Interaktion. Authentische Mitschnitte von „belauschten" Alltagsgesprächen gelten dabei vielfach als zu schwierig (vgl. Dirven 1984: 23; Kuntz 1986: 36) bzw. lassen nur sehr globale Verstehensleistungen zu. In der Regel greift man auf authentische dialogische Texte aus den Medien zurück (z.B. Rundfunk-Interviews) oder man setzt im Studio aufgenommene Gespräche ein, wobei sich auch in diesem Fall das Interview wachsender Beliebtheit erfreut (z.B. im HV-Teil der ICCNHS-Zertifikatsprüfungen, vgl. von der Handt 1997: 148), da es sich explizit an ein Publikum wendet und somit eine größere inhaltliche Explizitheit und phonetische Klarheit rechtfertigt. Wegen der im vorigen Abschnitt dargestellten Probleme, spontane Sprache zu bewusst nachzuahmen, sollte man freilich, wo immer möglich, Originaltexten gegenüber Studioproduktionen den Vorzug geben. 2.4 Visuelle Komponente Zwar kann die gleichzeitige Beanspruchung des auditiven und des visuellen Kanals das Arbeitgedächtnis überlasten, insbesondere bei der berüchtigten „Ton-Bild-Schere" (vgl. Solmecke 1993: 14), aber wo Bild und Ton sich gegenseitig stützen und die Rezipienten den visuellen Kanal tatsächlich nutzen, wird wie zahlreiche Studien belegen (Rubin 1994: 204 f)das Verstehen meist verbessert (vgl. auch Brett 1997). Im Alltag befindet sich der Hörer überwiegend in Hör-Seh-Situationen; dabei erweist es sich als Vorteil, dass der optische Kanal „eine bis zu sechsmal größere Verarbeitungs- und Speicherkapazität als der auditive Kanal hat" (Wiemer 1999: 51). Visuelle Wahrnehmungen betreffen den situativen Rahmen (Ort, Tageszeit, beteiligte Personen) und liefern Hinweise auf die Textsorte (Bahnhofsdurchsage, Podiumsdiskussion, SmaJI talk usw.); sie umfassen Gegenstände oder Hilfsmittel der Kommunikation (Schaubilder, Tafelanschrieb, Straßenkarte o.ä.), aus denen Inhalte ersichtlich sind; Aufschluss über Stimmungen und Intentionen geben Mimik und Gestik der Sprechenden; beobachtbare Handlungen (z.B. Einkaufsvorgang in einer Bäckerei) lassen Rückschlüsse auf den Inhalt der Kommunikation zu; bei mehreren Sprechern wird durch visuelle Wahrnehmung (und räumliches Hören) die Identifizierung der Sprecher ermöglicht. Nur bei wenigen Textsorten fehlen visuelle Hilfen; wie sehr das Verständnis dadurch erschwert werden kann, erfahren Lerner einer Fremdsprache besonders bei Telefongesprächen. Obwohl visuelle Reize für das Verständnis einer Vielzahl von Textsorten von Bedeutung sind, fehlen sie in den meisten HV-Tests. Jedenfalls hat sich der Wunsch "[... ], dass demnächst das Videogerät den Cassettenrecorder als Eingabemedium für Verstehenstests ablöst" (Grotjahn/ Klein-Braley 1998: 379) bisher nicht erfüllt (vgl. Dirven 1992: 255; Wiemer 1999: 51 f). Im Hinblick auf die Rdevanz des visuellen Kanals sind drei Kategorien von Texten zu unterscheiden: (A) Durchsagen, Radiosendungen, Nachrichten auf dem Anrufbeantworter usw., bei denen visuelle Stimuli nur die situative Einbettung angeben; (B) Texte, bei denen visuelle Informationen in Form von Mimik, Gestik und besprochenen Gegenständen in die Verstehensprozesse einfließen, weshalb die Ausblendung des visuellen Kanals u.U. verbale Explizierungen erfordert; (C) Texte, die als Hör-Seh-Texte lFLlllllL 30 (2001) Zum Problem der Authentizität in L2-Hörverstehenstests 159 produziert wurden, also Fernsehsendungen, Filme und Multimedia-Darbietungen. Texte der Kategorie A können offenbar ohne weiteres rein auditiv dargeboten werden; die visuelle Kontextualisierung kann ebenso gut schriftlich oder durch texttypische Hintergrundgeräusche geleistet werden. In der Kategorie C ist die visuelle Komponente umgekehrt Teil des Textes (statt nur des Kontextes) und daher unverzichtbar. Hier sieht von der Handt (1997: 148) "[...] das Erfordernis, von einem neuen Lernziel Hör-Seh-Verstehen auszugehen". Insoweit dieses (auch im Europäischen Referenzrahmen vorgesehene) Lernziel in Sprachstandstests nicht berücksichtigt wird, ist das Konstrukt Hörverstehen bzw. kommunikative Kompetenz indiesen Tests unterrepräsentiert. Bei Texten der Kategorie B sind visuelle Stimuli zwar nicht konstitutiver Teil des Textes, tragen aber dazu bei, Sprecher und ihre Rollen zu erkennen, Stimmungen und Intentionen zu verstehen, deiktische Bezüge zu erfassen, besprochene Gegenstände zu identifizieren, Abläufe zu verstehen usw. Ob rein auditiv gestaltete Tests in diesem Fall die Validität in Frage stellen, hängt davon ab, welchen Stellenwert man der visuellen Wahrnehmung zuerkennt: Ist sie lediglich ein erleichternder Faktor (leveling variable, Dunkel/ Henning/ Chaudron 1993: 187), dann genügt es, bei der Testgestaltung die fehlenden visuellen Stimuli durch Hilfen auf anderen Ebenen auszugleichen, etwa durch Explizierung von nur visuell interpretierbarer Deixis, durch Steigerung der inhaltlichen Redundanz, Verlangsamung der Sprechgeschwindigkeit o.ä. Kommt der visuellen Wahrnehmung dagegen eine strukturelle Bedeutung im Verstehensprozess zu, dann liefern rein auditive Tests mit Texten der Kategorie B Ergebnisse, die nur bedingt als Grundlage für Angaben über die HV-Kompetenz in den entsprechenden Realsituationen dienen können. Da hier sichere Antworten fehlen, beschränkt man sich unter Berufung auf das Prinzip der Authentizität in HV-Tests oftmals auf „rein auditive" Textsorten der Kategorie A. Wenn es jedoch tatsächlich einen strukturellen Unterschied zwischen „reinem" und „visuell eingebettetem" Hörverstehen gibt, dann liegt auch in dieser Beschränkung eine Unterrepräsentation des Gesamtkonstrukts Hörverstehen: "To claim external validity, construct definitions_ of listening assessment must extend beyond an ability to comprehend discourse presented through audio-tape or the telephone" (Gruba 1997: 336). 2.5 Präsentationshäufigkeit Im Sinne maximaler Wirklichkeitsnähe dürfte man die meisten Hörtexte 7 im Test nur ein einziges Mal präsentieren: « Combien de fois faire ecouter le document? II est clair que si l'on cherche a placer l'apprenant dans une situation la plus proche possible de l 'authentique, on devrait se limiter a une seule ecoute » (Roux 1997: 101 ). In vielen Sprachstandstests hingegen erscheint die Zahl der Präsentationen vor allem ari die Anforderungen der Höraufgabe gekoppelt: Im neuen Zertifikat Deutsch (WBT u.a. 1999) werden die fünf Meinungsäußerungen des ersten HV-Teils (mit je einer, auf globales Verstehen zielenden R/ F-Aufgabe) nur einmal zu Gehör gebracht; in den Teilen zum Detailverstehen (Gespräch/ Interview) bzw. zum selektiven Verstehen (Durchsagen, Wet- Zu den Ausnahmen zählen z.B. Ansagen und Nachrichten auf dem Anrufbeantworter. lFlLllL 30 (2001) 160 Peter Paschke terberichte o.ä.) ist dagegen jeder Text zweimal zu hören. Auch in der Zentralen Mittelstufenprüfung (ZMP) des Goethe-Instituts wird der Hörtext mit Aufgaben zum Detailverstehen zweimal dargeboten: einmal im Ganzen, dann in Abschnitten (vgl. Dittrich/ Frey 1999). Das Österreichische Sprachdiplom Grundstufe 1 8 hingegen ist bemüht, das Kriterium der Authentizität stärker zu berücksichtigen: HV-Aufgabe 1 besteht aus drei inhaltlich gleichen, aber sprachlich (z.B. im Formalitätsgrad) verschieden realisierten medialen Informationstexten (Wetterberichte, Verkehrsfunkdurchsagen o.ä.). "Im Gegensatz zur realitätsfernen Praxis, bei Prüfungen jeden Text prinzipiell zwei (bis drei-)mal vorzuspielen, kann hier im Sinne der Authentizitätsforderung von einem durchaus legitimen Vorgehen gesprochen werden" (Glaboniat 1998: 161). Die zweite HV-Aufgabe besteht aus einer Tonbandansage oder Nachricht auf dem Anrufbeantworter (von hoher Informationsdichte) und wird (da in der Realität beliebig oft wiederholbar) dreimal präsentiert; die Kandidaten müssen selektiv Informationen entnehmen. Die dritte HV- Aufgabe bezieht sich auf ein Alltagsgespräch oder Radiointerview, das nur einmal gehört werden kann; in Anbetracht der Lernstufe wurden deshalb „Sprechsituationen ausgewählt, die sich durch besonders hohe Redundanz auszeichnen" (Glaboniat 1998: 174). Gegen eine solch strikte Orientierung an der Sprachrealität führt Bolton folgende Argumente ins Feld: "[...] Hörverstehen über eine Tonaufnahme ist immer schwieriger als das Hörverstehen in der Realität, wo das situative Umfeld, Gestik, Mimik und die Lippenbewegungen der Sprechenden beim Verstehen helfen. Dazu kommt, dass die mangelhafte Qualität von Tonaufnahmen manchmal das Hören erschwert. [...] Bei Tests zum Hörverstehen auf der Grundstufe sollten die Lernenden deshalb den Text zuerst einmal als Ganzes hören, dann die Aufgabe(n) lesen (um beim zweiten Hören zielgerichteter zuhören zu können), dann den Text zum zweiten Mal hören und dabei- oder danachdie Aufgabe lösen" (Bolton 1996: 47). In jedem Fall (auch außerhalb der face-tojace-Kommunikation) aber gilt, dass der Testkandidat sich Kontext, Rolle und Verstehensziel vergleichsweise mühsam (meist lesend) aneignen muss. Zu fragen ist mit Bachman, ob die Validität von HV-Tests berührt wird, wenn man diese Erschwernis durch zweifache Darbietung kompensiert: "Does this [=mehrmaliges Hören] really compensate for lack of adequate contextualization, or does this change the very nature of the activity, vis-a-vis the TLU [= target language use]? Does it change the construct we're measuring? " 9 Im Gegensatz zu anderen hier aufgeworfenen Fragen (Vernachlässigung des HV in der Interaktion, Unnatürlichkeit nachgeahmter spontaner Rede, Fehlen visueller Stimuli) hat die mehrfache Präsentation m.E. kaum Einfluss auf Art und Struktur der involvierten bzw. gemessenen Fähigkeiten und Fertigkeiten, sondern modifiziert lediglich den Schwierigkeitsgrad der Aufgabe. Bezeichnenderweise kommen bei einmaliger Präsentation häufig andere Mittel der Vereinfachung zum Zug (globale Verstehensziele, erhöhte inhaltliche Redundanz). Ob die Validität eines HV-Tests durch mehrfache Textdarbietung beeinflusst wird, ist aus dieser Entspricht dem Waystage-Level des Common European Framework, vgl. http: / / www.osd.at/ 9 Aus einem Beitrag von Lyle Bachman vom 10.6.2000 zur Sprachtester-Diskussionsliste „Ltest-L" (vgl. http: / / www.surrey.ac.uk/ ELI/ ltest-1.html). lFLlllL 30 (2001) Zum Problem der Authentizität in L2-Hörverstehenstests 161 Sicht keine prinzipielle Frage, sondern hängt davon ab, ob sich (im Vergleich zum realen Sprachgebrauch) die diversen erschwerenden und erleichternden Faktoren letztlich ausgleichen. 2.6 Aufgabentypen HV-Aufgaben sollen beobachtbare Reaktionen auslösen, die „Rückschlüsse auf das stattgehabte HV" (Voss 1984: 74) zulassen, zugleich jedoch verändern sie die Art der sprachlichen Tätigkeit, also den Gegenstand der Messung: Aufgaben müssen nämlich gelesen und verstanden werden; visueller und auditiver Input sind ständig aufeinander zu beziehen; auch Schreibfertigkeiten sind zuweilen gefordert. Ziel der Testgestaltung ist es, den Einfluss dieser (konstruktirrelevanten) Faktoren auf das Messergebnis möglichst gering zu halten. Wer das Hörziel erreicht hat, soll mit einer möglichst hohen Wahrscheinlichkeit die Aufgabe richtig lösen. Umgekehrt lassen korrekte Testantworten nicht immer den Rückschluss auf gelungene Verstehensprozesse zu. Bei geschlossenen Aufgabenformaten können richtige Lösungen auch Zufallstreffer sein. Außerdem entspricht ein Vergleich des Inputs mit vorgegebenen Alternativen nur partiell der Realität des Hörverstehens: Die von Multiple-Choice-Aufgaben (MC) geforderte kognitive Operation des Auswählens ist nur dort realistisch, wo der Verstehensprozess durch präzise Vorerwartungen und/ oder Fragen gelenkt wird und die Bandbreite erwartbarer Antworten beschränkt ist. Richtig-Falsch-Aufgaben (RF) haben zwar den Vorzug, dass ihre Struktur „viele ebenfalls binäre Phänomene in der Sprache" (Klein-Braley 1992: 662) sowie den Vorgang des Testens von Hypothesen (z.B. Erwartungen oder Schemata) reflektiert. Gleichwohl aber lässt sich Hörverstehen außerhalb der Testsituation kaum auf die Überprüfung vorher formulierter und für alle Rezipienten einheitlicher Hypothesen reduzieren. Dasselbe Problem stellt sich bei Zuordnungsaufgaben (ZO): "Authentisch wäre es, wenn die einzelnen Auswahlitems (Aussagen) jenen Erwartungen und Assoziationen entsprechen würden, die ein Hörer aufgrund seines Kontextwissens ohnehin bilden würde" (Glaboniat 1998: 209). In welchem Ausmaß die für geschlossene Aufgabenformen kennzeichnende Operationalisierung des Verstehens (als Auswahlvorgang) die zugrunde liegenden Prozesse und somit das gemessene Konstrukt verfälschen, ist freilich nur schwer abzuschätzen. Halboffene und offene Aufgaben (vgl. zur Abgrenzung Grotjahn/ Klein-Braley 1998: 298) dürfen im Zweifelsfall als „authentischer" gelten, bringen aber neben Hören und Lesen zusätzlich die Schreibfertigkeit ins Spiel: "The tasks which have been labelled open tasks [...] are likely to yield scores which may not be accepted as reflections of listening skill as an isolated construct" (Rost 1990: 179). Gegenüber geschlossenen Aufgaben bieten sie immerhin den Vorteil, die Möglichkeit des Ratens drastisch einzuschränken. Bei RF-Aufgaben führt ja schon blindes Raten zu einer durchschnittlichen Erfolgsquote von 50%, und selbst für MC-Aufgaben wurde in zahlreichen Studien gezeigt, dass Probanden unter Einsatz ihres Weltwissens häufig in der Lage sind, 50--90% der Aufgaben zu lösen, ohne den Text überhaupt rezipiert zu haben (Klein- Braley 1992: 661). Praktisch alle Aufgabenformate setzen voraus, dass geschriebener Text verstanden wird. Falschantworten können also auch durch mangelndes LeseverlFLIIIL 30 (2001) 162 Peter Paschke stehen bedingt sein bzw. durch eine „Leselast", die das Arbeitsgedächtnis überfordert. Besonders MC-Optionen sollten daher so knapp wie möglich und sprachlich nicht schwieriger als der Hörtext selbst ausfallen. Das Problem: Um direktes Zitieren aus dem Hörtext (und somit reines Diskriminationshören) zu vermeiden, beruht die korrekte Antwort oft auf einer (sprachlich schwierigen) Paraphrase bestimmter Textelemente (vgl. Klein-Braley 1992: 661). Eine bessere Lösung ist es, wörtliche Textzitate auch in den Distraktoren zu verwenden. In sprachlich homogenen Zielgruppen kann die Leselast durch LI-Verwendung vermindert werden, möglicherweise aber treten Code Switching- Probleme auf und verzerren ihrerseits die Messung der HV-Kompetenz. Einen weiteren Ausweg bietet die Verwendung.von Bildmaterial (z.B. als Alternativen in MC- oder ZO- Aufgaben), der Einsatzbereich ist allerdings recht beschränkt. Die Gefahr einer Überlastung des Arbeitsgedächtnisses besteht prinzipiell, wenn neben Gehörtem auch Gelesenes zu verarbeiten ist: "Auditiver und visueller Input müssen in ständigem, sich gegenseitig bedingendem Wechsel verarbeitet werden" (Bickes 1996: 152). Eine echte Herausforderung sind manche ZO-Aufgaben, z.B. wenn Meinungen den Gesprächsbeteiligten zugeordnet werden sollen wie in der ZMP-Hörverstehensprüfung (vgl. Dittrich/ Frey 1999: 171 ff, 182 fund 190 f; Hantschel/ Krieger 1998: 47 und 69) oder in der ÖSD-Mittelstufenprüfung (vgl. Glaboniat 1998: 208-220). Da die zuzuordnenden Positionen nicht in chronologischer Folge erscheinen können, müssen die Probanden ständig bis zu zehn Aussagen „im Blick" behalten und mit dem Gehörten vergleichen. Bei komplexeren Sachverhalten ist hier sogar ein Muttersprachler überfordert, d.h. der konstruktiv relevante Störfaktor ist von beträchtlichem Gewicht (vgl. Glaboniat 1998: 213). Hinsichtlich eines möglichen information overload durch schriftliche Stimuli sind RF-Aufgaben am wenigsten problematisch; der Vergleich zwischen auditivem und schriftlichem Input wird durch die Ja-Nein-Struktur deutlich erleichtert. Dies ist vermutlich der Hauptgrund dafür, dass man von MC-Aufgaben verstärkt zu RF-Aufgaben übergeht (vgl. Klein-Braley 1992: 662). In der Prüfung zum neuen „Zertifikat Deutsch" z.B. haben sämtliche HV- Aufgaben dieses Format (WBT u.a. 1999: 384-386; WBT 1999: 16-18). 3. Resümee HV-Tests unterscheiden sich beträchtlich von Situationen authentischer L2-Sprachverwendung, müssen mit diesen aber in wesentlichen Punkten vergleichbar sein, wenn sie valide Aussagen über im Sprachgebrauch relevante Kompetenzen erlauben sollen. Auf welche Merkmale es genau ankommt, dazu lassen sich gegenwärtig kaum mehr als plausible Hypothesen formulieren. So darf man annehmen, valide HV-Tests sollten (wenigstens auf bestimmten Lernstufen) neben reinem Faktenverständnis (implizite) pragmatische und textuelle Aspekte berücksichtigen. Problematisch erscheint die Vernachlässigung des Hörverstehens in der Interaktion (wenn dieses in den Lernzielen vorgesehen ist); ob ersatzweise HV-Leistungen in der Mit-/ Zuhörerrolle generalisiert werden können, wenn die eingesetzten Hörtexte typische Merkmale spontaner Rede aufweisen, wäre empirisch zu prüfen. Bei spontanen dialogischen Texten ist der.Einsatz lFlLIDlL 30 (2001) Zum Problem der Authentizität in L2-Hörverstehenstests 163 von Originalaufnahmen (z.B. aus dem Rundfunk) angezeigt, da sich Phänomene wie Versprecher, Häsitationen, Sprechtempowechsel u.a. nur schwer bewusst nachahmen lassen. Dass als Hörspiel inszenierte, syntaktisch „geglättete" Dialoge die Messung der HV-Kompetenz verfälschen, ist allerdings ebenfalls nur eine Hypothese. In vielen Fällen fragt sich, ob Abweichungen von den Merkmalen der intendierten Sprachgebrauchssituation lediglich eine Erleichterung/ Erschwerung der Aufgabe bewirken oder dazu führen, dass eine andersgeartete Kompetenz gemessen wird. So entspricht die mehrfache Präsentation von Hörtexten im Test zwar u. U. nicht der Sprachwirklichkeit, scheint aber lediglich den Grad der Aufgabenschwierigkeit zu vermindern, ohne die Prozesse des HV strukturell zu modifizieren. Ob dies auch für den Verzicht auf visuelle Stimuli gilt, musste im Rahmen dieses Beitrags jedenfalls für eine bestimmte Klasse von Texten offen bleiben. Da Verstehen als solches nicht beobachtbar ist, sondern nur indirekt aus (mittels Aufgaben elizitierten) Reaktionen erschlossen werden kann, kommt es im Test wohl oder übel zu einer Modifizierung der kognitiven Prozesse des Verstehens; es gilt allerdings, die Verzerrung der Messung möglichst gering zu halten. Zusammenfassend müssen wir sagen, dass sich Bachmans struktureller Authentizitätsbegriff beim gegenwärtigen Stand der Forschung zum L2-Hörverstehen nur begrenzt einlösen lässt; hilfsweise wird man sich in vielen Fällen mit begründeten Hypothesen oder einer imitatorischen Annäherung an reale Sprachgebrauchssituationen zufrieden geben müssen. Literatur ANDERSON, Anne/ LYNCH, Tony (1988): Listening. Oxford: Oxford University Press. BACHMAN, Lyle (1990): Fundamental considerations in language testing. Oxford: Oxford University Press. BACHMAN, Lyle/ PALMER, Adrian S. (1996): Language testing inpractice: designing and developing useful language tests. Oxford: Oxford University Press. BICKES, Gerhard (1996): "Hörverstehensüberprüfungen als methodisches Problem". In: KÜHN, Peter (Hrsg.): Hörverstehen im Unterricht Deutsch als Fremdsprache. Frankfurt/ M.: Lang, 149-170. BOLTON, Sibylle (1996): Probleme der Leistungsmessung. Lernfortschrittstests in der Grundstufe. München: Langenscheidt. BRETT, Paul (1997): "A comparative study of the effects of the use of multimedia on listening comprehension". In: System 25.I, 39-53. BUCK, Gary (1997): "The Testing of Listening in a Second Language". In: CLAPHAM, Caroline / CüR- S0N, David (eds.): Encyclopedia of language and education. Vol. 7: Language testing and assessment. Dordrecht: Kluwer, 65-74. C0UNCIL0FEUR0PE (ed.) (1996): Modern languages: learning, teaching, assessment. A common Europeanframework of reference. Strasbourg 1996. DIRVEN, Rene (1977): "Aspekte der Hörverstehensfertigkeit". In: DIRVEN, Rene (Hrsg.): Hörverständnis im Fremdsprachenunterricht. Listening comprehension in foreign language teaching. Kronberg: Scriptor, 1-13. DIRVEN, Rene (1984): "Was ist Hörverstehen? Synopse vorhandener Theorien und Modelle". In: SCHU- MANN, Adelheid/ V0GEL, Klaus/ Voss, Bernd (Hrsg.): Hörverstehen. Grundlagen, Modelle, Materialien zur Schulung des Hörverstehens im Fremdsprachenunterricht der Hochschule. Tübingen: Narr, 19-40. lFLlllL 30 (2001) 164 Peter Paschke DIRVEN, Rene (1992): "Von der Hörfertigkeit zum Hörverstehen". In: JUNG, Udo O.H. (Hrsg.): Praktische Handreichung für Fremdsprachenlehrer. Frankfurt/ M.: Lang, 249-257. DITTRICH, Roland/ FREY, Evelyn (1999): Training Zentrale Mittelstufenprüfung. Band 1: Leseverstehen. Hörverstehen. München: Verlag für Deutsch. · DUNKEL, Patricia/ HENNING, Grant/ CHAUDRON, Craig (1993): "The Assessment of an L2 Listening Comprehension Construct: A Tentative Model for Test Specification and Development". In: The Modern Language Journal 77.2, 180--191. EGGERS, Dietrich (1996): "Hörverstehen: Bestandsaufnahme und Perspektiven". In: Kühn, Peter (Hrsg.): Hörverstehen im Unterricht Deutsch als Fremdsprache. Frankfurt/ M.: Lang, 13-44. FiERCH, Claus / KASPER, Gabriele (1986): "The role of comprehension in second language learning". In: Applied Linguistics 7, 257-274. FEYTEN, Carine M. (1991): "The power of listening ability: an overlooked dimension in language acquisition". In: The Modern Language Journal 75, 173-180. GLABONIAT, Manuela (1998): Kommunikatives Testen im Bereich Deutsch als Fremdsprache. Innsbruck- Wien: Studienverlag. GOH, Christine C.M. (2000): "A cognitive perspective on language learners' listening comprehension problems". In: System 28.1, 55-75. GROTJAHN, Rüdiger (2000a): "Determinanten der Schwierigkeit von Leseverstehensaufgaben: Theoretische Grundlagen und Konsequenzen für die Entwicklung des TESTDAF". In: BOLTON, Sibylle (Hrsg.): TESTDAF: Grundlagen für die Entwicklung eines neuen Sprachtests. Beiträge aus einem Expertenseminar. Köln: VUB Gilde, 7-55. GROTJAHN, Rüdiger (2000b): "Testtheorie: Grundzüge und Anwendungen in der Praxis". In: WOLFF, Armin / TÄNZER, Harald (Hrsg.): Sprache -Kultur -Politik. Beiträge der 27. Jahrestagung Deutsch als Fremdsprache vom 3. -5. Juni 1999 an der Universität Regensburg. Regensburg: FaDaF, 304-341. GROTJAHN, Rüdiger / KLEIN-BRALEY, Christine (1998): "Testen". In: JUNG, Udo 0.H. (Hrsg.): Praktische Handreichung für Fremdsprachenlehrer. Frankfurt/ M.: Lang, 294-301. GRUBA, Paul Andrew (1997): "The role of video media in listening assessment". In: System 25.3, 335- 345. HANDT, Gerhard von der (1997): "Lernzielinventare und Tests im Fremdsprachenbereich: Möglichkeiten und Tendenzen der Weiterentwicklung der ICC-Sprachenzertifikate". In: GARDENGHI, Monica/ O'CONNELL, Mary (Hrsg.): Prüfen, Testen, Bewerten im modernen Fremdsprachenunterricht. Frankfurt/ M.: Lang, 145-149. HANTSCHEL, Hans-Jürgen/ KRIEGER, Paul (1998): Mit Erfolg zur Mittelstufenprüfung Deutsch als Fremdsprache. Testbuch. Stuttgart: Klett Verlag, HIRSCHFELD, Ursula (1992): "Wer nicht hören will ...". In: Fremdsprache Deutsch 7, 17-20. HöRMANN, Hans (1981): Einführung in die Psycholinguistik. Darmstadt: Wissenschaftliche Buchgesellschaft. KLEIN-BRALEY, Christine (1992): "Objektives Erfassen von Hör- und Leseverstehen. Einige Erkenntnisse aus der Theorie der Leistungsmessung und deren Bezug zur Prüfung zum Nachweis deutscher Sprachkenntnisse". In: lnformationen Deutsch als Fremdsprache 19, 649--663. KOLL, Rotraut / MÜLLER, Heidrun (1995): Prüfung „Deutsch im Alltag". Übungstests zum Hörverstehen, Leseverstehen, schriftlichen Ausdruck und zu den kommunikativen Aufgaben. München: Verlag für Deutsch. KÜHN, Peter (1996): "Lernziel: Vorlesungen verstehen. Zur Prüfungspraxis in der PNdS/ DSH". In: KÜHN, Peter (Hrsg.): Hörverstehen im Unterricht Deutsch als Fremdsprache. Frankfurt/ M.: Lang, 93-147. KUNTZ, Helmut (1986): "Das Hörverstehenstraining und seine Progression. Überlegungen zur Konzeption des HV-Unterrichts auf der Mittelstufe 1". In: Informationen Deutsch als Fremdsprache 13, 25- 41. lFLll! L 30 (2001) Zum Problem der Authentizität in L2-Hörverstehenstests 165 LUND, Randall J. (1990): "A Taxonomy for Teaching Second Language Listening". In: Foreign Language Annals 23, 105-115. MACHT, Konrad (1997): "Das Diktat: ein zu Unrecht verdammtes Testinstrument". In: GARDENGHI, Monica/ O'CONNELL, Mary (Hrsg.): Prüfen, Testen, Bewerten im modernen Fremdsprachenunterricht. Frankfurt/ M.: Lang, 109-116. MCNAMARA, Tim F. (1997): "Performance testing". In: CLAPHAM, Caroline/ CORSON, David (eds.): Encyclopedia of language and education. Vol. 7: Language testing and assessment. Dordrecht: Kluwer,.131-139. NEUF-MÜNKEL, Gabriele (1988): "Hörverstehen". In: lnformationenDeutsch als Fremdsprache 15, 229- 241. NEUF-MÜNKEL, Gabriele (1992): "Der dicke Junge weint, weil ... Übungen zur Ausbildung der Antizipations- und Speicherfähigkeit". In: Fremdsprache Deutsch 7, 31-35. O'MALLEY, J. Michael/ CHAMOT, Anna Uhl / KÜPPER, Lisa (1989): "Listening comprehension strategies in second language acquisition". In: Applied Linguistics 10.4, 418--437. OXFORD, Rebecca (1993): "Research Update on Teaching L2 Listening". In: System 21.2, 205-211. P ALLIER, Christophe / CHRISTOPHE, Anne/ MEHLER, J. ( 1997): "Language-specific listening". In: Trends in Cognitive Sciences 1.4, 129-132. PASCHKE, Peter (2000): Fremdsprachliches Hörverstehen: Grundlagen, Lernziele und Probleme der Leistungsmessung. University College Dublin 2000 (M.A.-Thesis). ROST, Michael (1990): Listening in language learning. Harlow: Longman. ROST, Michael (1994): lntroducing listening. London: Penguin. Roux, Pierre-Yves (1997): « La comprehension orale en langue etrangere et son evaluation ». In: GARDENGHI, Monica/ O'CONNELL, Mary (Hrsg.): Prüfen, Testen, Bewerten im modernen Fremdsprachenunterricht. Frankfurt/ M.: Lang, 95-107. RUBIN, Joan (1994): "A review of second language listening comprehension research". In: The Modern Language Journal 78.2, 199-221. SOLMECKE, Gert (1991a): "Hörverstehenstexte". In: BAUSCH, Karl-Richard [u.a.] (Hrsg.): Texte im Fremdsprachenunterricht als Forschungsgegenstand. Arbeitspapiere der 11. Frühjahrskonferenz zur Erforschung des Fremdsprachenunterrichts. Bochum: Brockmeyer, 145-149. SOLMECKE, Gert (1991 b ): "Wie schwierig ist eine Hörverstehensübung? " In: Informationen Deutsch als Fremdsprache 18, 287-295. SOLMECKE, Gert (1992): "Ohne Hören kein Sprechen. Bedeutung und Entwicklung des Hörverstehens im Deutschunterricht". In: Fremdsprache Deutsch 7, 4-11. SOLMECKE, Gert (1993): Texte hören, lesen und verstehen. Eine Einführung in die Schulung der rezeptiven Kompetenz mit Beispielen für den Unterricht Deutsch als Fremdsprache. München: Langenscheidt. SOLMECKE, Gert (1996): "Authentische Texteauthentisches Hören? " In: KÜHN, Peter (Hrsg.): Hörverstehen im Unterricht Deutsch als Fremdsprache. Frankfurt/ M.: Lang, 79-92. SPOLSKY, Bernard (1985): "The limits ofauthenticity in language testing". In: Language Testing 2.1, 31- 40. UNDERWOOD, Mary (1989): Teaching listening. London: Longman. UR, Penny (1984): Teaching listening comprehension. Cambridge: Cambridge University Press. Voss, Bernd (1984): "Zur Überprüfung von Hörverstehen im Fremdsprachenunterricht". In: SCHUMANN, Adelheid/ VOGEL, Klaus / Voss, Bernd (Hrsg.): Hörverstehen. Grundlagen, Modelle, Materialien zur Schulung des Hörverstehens im Fremdsprachenunterricht der Hochschule. Tübingen: Narr, 69-85. WBT (Weiterbildungs-Testsysteme GmbH) (Hrsg.) (1999): Die Europäischen Sprachenzertifikate: Zertifikat Deutsch. Modelltest 2. Frankfurt/ M.: WBT. WBT / Goethe Institut/ ÖSD / EDK (Hrsg.) (1999): Zertifikat Deutsch. Lernziele und Testformat. Frankfurt/ Main: WBT. lFlLllL 30 (2001) 166 Peter Paschke WIEMER, Claudia (1999): "Aspekte des Hörverstehens im fremdsprachlichen Lernprozess". In: Eggers, Dietrich (Hrsg.): Sprachandragogik Jahrbuch 1998: Hörverstehen aus andragogischer Sicht. Sprachlern- und Spracherwerbsstrategien im Fremdsprachenunterricht mit Erwachsenen. Mainz: Zentralstelle für universitäre Fort- und Weiterbildung, 37-55. WOLFF, Dieter (1983): "Überlegungen zum Hörverstehen im Fremdsprachenunterricht". In: Die Neueren Sprachen 82, 282-297. WOLFF, Dieter (1999): "Hörverstehen in einer Fremdsprache: Ein psycholinguistisches Ratespiel? " In: EGGERS, Dietrich (Hrsg.): Sprachandragogik Jahrbuch 1998: Hörverstehen aus andragogischer Sicht. Sprachlern- und Spracherwerbsstrategien im Fremdsprachenunterricht mit Erwachsenen. Mainz: Zentralstelle für universitäre Fort- und Weiterbildung, 17-35. lFJLlllL 30 (2001)
