Hörverstehen: Konstrukt und Messung

Rüdiger Grotjahn

eJournals Fremdsprachen Lehren und Lernen 41/1

Fremdsprachen Lehren und Lernen

0932-6936

2941-0797

Narr Verlag Tübingen

Es handelt sich um einen Open-Access-Artikel der unter den Bedingungen der Lizenz CC by 4.0 veröffentlicht wurde.http://creativecommons.org/licenses/by/4.0/

2012

411 Gnutzmann Küster Schramm

Hörverstehen: Konstrukt und Messung

2012

Rüdiger Grotjahn

© 2012 Narr Francke Attempto Verlag 41 (2012) • Heft 1 R ÜDIGER G ROTJAHN * Hörverstehen: Konstrukt und Messung Abstract. The article focuses on the definition and measurement of listening comprehension construct. It begins with some remarks on the importance of listening comprehension for (everyday) communication. It then briefly describes three different approaches to defining test constructs, favouring an interactive approach which takes both linguistic competencies and task characteristics into account. Subsequently, pertinent psycholinguistic aspects are dealt with in some detail, including the relationship between listening and reading comprehension processes, the dimensionality of listening comprehension and the importance of understanding difficulty-generating task characteristics. In the final section, the author concludes that the ability to process realistic spoken language automatically in real time is at the core of listening comprehension construct and should hence be the primary focus of assessment tasks. 1. Bedeutung von Hörverstehen Hörverstehen spielt sowohl in der Alltagskommunikation als auch in vielen universitären und beruflichen Kontexten eine wichtige Rolle. Trotz dieser faktischen Bedeutsamkeit wurde zumindest in Deutschland die Vermittlung und die Überprüfung der fremdsprachlichen 1 Hörverstehenskompetenz lange Zeit nicht gebührend beachtet. In jüngerer Zeit ist allerdings ein deutlicher Wandel zu beobachten. Im deutschen Schulkontext belegen dies u.a. die Ausführungen zum Hörverstehen in den Bildungsstandards für die erste Fremdsprache Englisch/ Französisch (vgl. KMK 2004) und die zur Implementierung und Überprüfung der Bildungsstandards entwickelten Hörverstehensaufgaben (vgl. P ORSCH / T ESCH / K ÖLLER 2010; R UPP / V OCK / H ARSCH / K ÖLLER 2008). Auch in der Fachliteratur ist sowohl in Deutschland als auch international ein verstärktes Interesse an Fragen der Vermittlung und des Testens des Hörverstehens zu beobachten. In diesem Zusammenhang werden angesichts der Wichtigkeit multimodaler Medienkompetenz für die heutige Informationsgesellschaft auch zunehmend Aspekte des Hör-Seh- Verstehens thematisiert. Im Hinblick auf die Testung des Hörverstehens ist von zentraler Bedeutung, was unter Hörverstehen zu verstehen ist. Denn ohne ein tiefer gehendes Verständnis und * Korrespondenzadresse: Prof. Dr. Rüdiger G ROTJAHN , Ruhr-Universität Bochum, Seminar für Sprachlehrforschung, 44780 B OCHUM . E-Mail: ruediger.grotjahn@rub.de Arbeitsbereiche: Sprachtestforschung, Forschungsmethodologie, Lernerfaktoren 1 „Fremdsprache“ ist im Folgenden in einem weiten Sinne zu verstehen, der die Bedeutung „Zweitsprache“ mit einschließt. Aus Platzgründen bleiben Unterschiede zwischen fremdsprachlichem und zweitsprachlichem Hörverstehen unberücksichtigt. Hörverstehen: Konstrukt und Messung 73 41 (2012) • Heft 1 eine genaue Beschreibung des Konstrukts können weder begründet Aufgaben und Instrumente zur Messung des Hörverstehens entwickelt werden noch die Güte vorliegender Aufgaben und Instrumente beurteilt werden. Ich werde mich deshalb im Folgenden vor allem mit Aspekten der Konstruktdefinition beschäftigen. Dazu gehe ich zunächst kurz auf drei Ansätze der Konstruktdefinition ein. Anschließend beschäftige ich mich relativ ausführlich mit psycholinguistischen Aspekten des Hörverstehens und der Aufgabenkonstruktion. Der Beitrag schließt mit einigen generellen Implikationen aus den Darlegungen zur Konstruktdefinition und Aufgabenkonstruktion für die Messung des Hörverstehens. Argumentiert wird insgesamt aus der Perspektive standardisierten Testens. Aus Platzgründen unberücksichtigt bleiben spezifische Aspekte der Testung des Hör-Seh-Verstehens. Aktuelle Hinweise hierzu finden sich in P ORSCH / G ROTJAHN / T ESCH (2010). 2. Kompetenzorientierte vs. aufgabenbasierte Definition des Testkonstrukts Theoretisch und empirisch begründete Modellvorstellungen zu den psycholinguistischen Merkmalen des Hörverstehens sowie zu den psycholinguistischen Anforderungen der zu konstruierenden Aufgaben sind zusammen mit einer Beschreibung der Testkandidaten und der Testziele die Basis für die Definition des Testkonstrukts, d.h. der zu messenden Fähigkeiten, Fertigkeiten und Wissensbestände. Eine adäquate Definition des Testkonstrukts ist damit von zentraler Bedeutung für die Entwicklung von validen Hörverstehenstests. Bei der Definition des Testkonstrukts kann man mit B UCK (2001: 102 ff) und anderen Autoren folgende drei Vorgehensweisen unterscheiden: a) einen kompetenzbasierten Ansatz; b) einen aufgabenbasierten Ansatz und c) einen interaktiven Ansatz in Form einer Verbindung von kompetenz- und aufgabenorientierten Vorstellungen. 2 Beim kompetenzbasierten Ansatz der Konstruktdefinition geht man davon aus, dass die im Test gezeigte Leistung ein Indikator lernerseitiger Kompetenzen ist - so z.B. sprachlicher und strategischer Kompetenzen im Rahmenmodell des Hörverstehens bei B UCK (2001: 104). Entsprechende Kompetenzen sind nicht direkt beobachtbar und werden als relativ stabil im Hinblick auf kontextuelle und aufgabenspezifische Faktoren angesehen. Die entscheidende Frage bei einer rein kompetenzbasierten Definition des Konstrukts Hörverstehen ist, inwieweit eine gezeigte Leistung, wie z.B. die korrekte Lösung von Mehrfachwahlaufgaben, ein valider Indikator der nicht direkt beobachtbaren zugrundeliegenden Kompetenz Hörverstehen ist. Bei einem streng aufgabenbasierten Ansatz ist man dagegen in erster Linie daran interessiert, welche Aufgaben die Testteilnehmer lösen können. Unterschiede zwischen 2 B UCK (2001) stützt sich seinerseits vor allem auf die grundlegende Arbeit von C HAPELLE (1998). Weitere Hinweise zur Berücksichtigung der Interaktion von Fähigkeiten und Kontextfaktoren bei der Konstruktdefinition findet man z.B. bei B ACHMAN (2007) und C HALHOUB -D EVILLE / D EVILLE (2006). 74 Rüdiger Grotjahn 41 (2012) • Heft 1 den Testteilnehmern werden hier nicht auf Unterschiede in zugrunde liegenden Kompetenzen, sondern auf Kontext- und Aufgabenmerkmale zurückgeführt. Die Aufgaben werden so gewählt, dass sie die zielsprachliche Verwendungsdomäne (im Sinne von B ACHMAN / P ALMER 2010: 60) möglichst adäquat repräsentieren. Ist dies der Fall, dann lässt sich relativ direkt von der Testleistung auf entsprechende Leistungen außerhalb der Testsituation schließen. Ein streng aufgabenbasierter Ansatz vermeidet damit zwar das Problem der Validität des Schlusses von Testleistungen auf zugrunde liegende Kompetenzen, nicht jedoch das Problem der Inhaltsvalidität der eingesetzten Aufgaben in Bezug auf die zielsprachliche Verwendungsdomäne. Dies ist vor allem dann ein gravierendes Problem, wenn die zielsprachliche Verwendungsdomäne nicht adäquat beschrieben werden kann oder wenn z.B. aus testökonomischen Gründen nur relativ wenige Aufgaben eingesetzt werden können. Der interaktive Ansatz bei der Definition des Testkonstrukts führt die gezeigte Leistung sowohl auf zugrunde liegende Kompetenzen als auch auf Merkmale von Aufgaben zurück. Während beim reinen aufgabenbasierten Ansatz entscheidend ist, dass die Testaufgaben möglichst weitgehend mit den im zielsprachlichen Verwendungskontext zu lösenden kommunikativen Aufgaben übereinstimmen, ist beim interaktiven Ansatz entscheidend, dass die Lösung der Testaufgaben ähnliche Kompetenzen verlangt wie die Lösung relevanter zielsprachlicher Aufgaben. B UCK (2001: 111) argumentiert zu Recht, dass der interaktive Ansatz das größte (praktische) Potenzial für die Testentwicklung aufweist. Entsprechend gehen aktuelle Testentwicklungsprojekte mittlerweile zumeist von komplexen interaktiven Vorstellungen bei der Definition des Testkonstrukts aus (vgl. z.B. B ACHMAN / P ALMER 2010; W EIR 2005). Auch ich werde im Folgenden ein interaktives Modell zugrunde legen. 3. Psycholinguistische Merkmale des Hörverstehens 3 Fremdsprachliches Hörverstehen beinhaltet die Rezeption akustisch präsentierter Sprache durch einen Hörer, wobei dieser das Ziel verfolgt, eine mentale semantische Repräsentation der akustisch präsentierten Informationen aufzubauen. Dementsprechend charakterisiert M EIßNER (2006: 258) Hörverstehen auch als einen „Prozess, in dem sensorisch einlaufende verbal-lautliche Daten Sinnkonstruktionen auslösen“. Weder der Prozess des Hörverstehens noch das Produkt in Form des erzielten Hörverständnisses sind unmittelbar beobachtbar. Beobachtbar sind lediglich bestimmte Reaktionen des Rezipienten, wie z.B. eine Verständnis oder Unverständnis signalisierende Antwort auf eine Frage oder eine nichtsprachliche Reaktion, so etwa das Schließen eines Fensters als Reaktion auf eine Äußerung wie „Es ist kalt“; oder auch das Ankreuzen einer bestimmten Antwortoption in einem Test. In ihrer nicht direkten Beobachtbarkeit unter- 3 Die Ausführungen des Abschnitts 3 beruhen in Teilen auf G ROTJAHN / T ESCH (2010a: Abschnitt 2.2.3.1) sowie G ROTJAHN (2003: Kap. 6), G ROTJAHN (2005) und G ROTJAHN (in Vorbereitung). Hörverstehen: Konstrukt und Messung 75 41 (2012) • Heft 1 scheidet sich das Hörverstehen ähnlich wie das Leseverstehen in zentraler Weise von den produktiven Teilkompetenzen des „Sprechens“ und des „Schreibens“. Bei der Modellierung des fremdsprachlichen Hörverstehens kann man in Anlehnung an das Leseprozessmodell von K HALIFA / W EIR (2009: 42) u.a. folgende Komponenten, Ebenen und Prozesse unterscheiden (vgl. auch G ROTJAHN / T ESCH 2010b: 95): a) eine metakognitive Komponente mit Prozessen wie: Entscheidung über ein Hörziel; Wahl einer dem Ziel entsprechenden Hörstrategie; Überwachung des Hörprozesses (z.B. in Bezug auf sich widersprechende Informationen); b) eine zentrale Verarbeitungskomponente mit hierarchisch aufeinander aufbauenden Prozessen wie: Dekodierung des akustischen Inputs und Worterkennung; Konstruktion einer auditiv basierten Textoberfläche; Zugriff auf das mentale Lexikon; syntaktische Analyse; Konstruktion einer propositionalen Bedeutung auf der Teilsatz- und Satzebene in Form einer sog. Textbasis; Inferenzen anhand der bisherigen Textinformationen und weiterer Wissensbestände; Konstruktion eines mentalen Modells (Situationsmodells) und schließlich c) eine Wissenskomponente als Basis der Verarbeitungsprozesse mit Teilkomponenten wie: sprachliches Wissen; thematisches Wissen; allgemeines Weltwissen; Diskursstrukturwissen in Form von Wissen über Textsorten und rhetorische Figuren (vgl. für weitere Modellkomponenten auch B UCK 2001: 104, F IELD 2008: 242 sowie das integrierte Modell des Hör- und Leseverstehens bei K ÜRSCHNER / S CHNOTZ 2008). Vor dem Hintergrund des beschriebenen Modells lassen sich anhand der Verarbeitungsrichtung zwei grundlegende Typen von Prozessen unterscheiden: aufsteigende Prozesse und absteigende Prozesse - auch als bottom-upbzw. top-down-Prozesse bezeichnet. Bei der aufsteigenden Verarbeitung werden kleinere Elemente zu größeren Einheiten zusammengesetzt, z.B. lautliche Segmente zu Silben, Wörtern und Teilsätzen. Bei der absteigenden Verarbeitung beeinflussen dagegen hierarchiehöhere Komponenten die Verarbeitung auf den hierarchieniedrigeren Stufen. So können z.B. der sprachliche und situationelle Kontext oder auch die Kenntnis möglicher Kollokationen die Dekodierung einzelner Wörter beeinflussen (vgl. F IELD 2008: 132 f). Dabei kann der Rückgriff auf den sprachlichen Kontext und die Hörsituation zwei Funktionen haben: a) Weiterverarbeitung bereits dekodierten Materials z.B. mit dem Ziel der Disambiguierung homophoner Lautketten; b) Ausgleich von fehlendem Wissen und/ oder beschränkter kognitiver Verarbeitungskapazität (kompensatorische Funktion). Da bei der aufsteigenden Verarbeitung in erster Linie das Hördokument den Verstehensprozess steuert, bei der absteigenden Verarbeitung dagegen die im Langzeitgedächtnis des Hörers gespeicherten Wissensrepräsentationen der primäre Steuerungsfaktor sind, wird der Gegensatz zwischen aufsteigender und absteigender Verarbeitung zuweilen auch als „datengesteuert“ vs. „wissensgesteuert“ charakterisiert. In der Regel wird das fremdsprachliche Hörverstehen als ein interdependentes Wechselspiel von aufsteigender und absteigender Verarbeitung gesehen (vgl. F IELD 2008: 132 f; K ÜRSCHNER / S CHNOTZ 2008; L EUCHT / R ETELSDORF / M ÖLLER / K ÖLLER 2010; M EIßNER 2006: 259; W OLFF 2003). So setzen z.B. Identifikation und Einschätzung der Relevanz des Themas eines Hörbeitrages sowohl eine (rudimentäre) Verarbeitung des lautlichen Inputs (Dekodierung) als auch eine Berücksichtigung des 76 Rüdiger Grotjahn 41 (2012) • Heft 1 sprachlichen Kontextes und der Hörsituation voraus. Für diese Interaktion zwischen Daten und Wissen gibt F IELD (2008: 133) ein illustratives Beispiel. Angenommen ein Lerner hat in einem Hördokument die Lautkette [ve t blz] korrekt als das ihm bekannte Wort vegetables („Gemüse“) identifiziert. Bei einer aufsteigenden Verarbeitung ist der Lerner zwar möglicherweise zunächst über den Laut [ ] gestolpert. Bei der weiteren Dekodierung könnte dann aber der sprachliche Kontext und weiteres sprachliches Wissen geholfen haben (z.B. in Form von Wörtern wie cabbages, carrots oder einer Kollokation wie fruit and vegetables) oder auch die außersprachliche Situation (ein Gemüseladen). In der praxisorientierten fremdsprachenbezogenen Hörverstehensdidaktik wird häufig vor allem die Bedeutung von top-down-Prozessen herausgestellt und der strategische Aspekt des Hörverstehens betont. Dagegen wird vor allem in psycholinguistisch orientierten (fremdsprachenbezogenen) Arbeiten verstärkt auf die Bedeutung effizienter bottom-up-Prozesse hingewiesen - und zwar speziell auf die Wichtigkeit einer schnellen und korrekten Worterkennung (vgl. z.B. P OELMANS 2003; F IELD 2008). So konnte u.a. gezeigt werden, dass insbesondere weniger effiziente Hörer auf top-down- Prozesse zurückgreifen, um Defizite bei der bottom-up-Verarbeitung zu kompensieren (vgl. z.B. T SUI / F ULLILOVE 1998; G OH 2000; F IELD 2008: 134 ff). Bei einer solchen kompensatorischen Verarbeitung kommt es jedoch nicht selten zu einem inadäquaten Hörverständnis. Vor diesem Hintergrund sollten m.E. Hörverstehenstests vor allem bei nicht sehr weit fortgeschrittenen Lernern auch speziell die Fähigkeit zum schnellen und korrekten Dekodieren des sprachlichen Inputs in hinreichendem Maße erfassen (vgl. auch die Forderung von M EIßNER 2006: 267 nach Schulung und Überprüfung der Fähigkeit des „auf die Sprachform gerichteten Feinverstehens“). Ein gravierender Unterschied zwischen Hör- und Leseverstehen ist, dass Hörverstehen ein Echtzeit-Prozess ist (vgl. auch F IELD 2008: 27 f; K ÜRSCHNER / S CHNOTZ 2008; L EUCHT [et al.] 2010). Dies heißt u.a., dass beim Hören der auditive Eindruck wegen des zeitlich-sequentiellen Charakters des Signals im Gegensatz zum Lesen flüchtig ist. Die Tatsache, dass Hörverstehen in Echtzeit abläuft und dass der Hörer damit im Vergleich zu einem Leser ein weit geringeres Maß an Kontrolle über den Text ausüben kann, hat u.a. zur Folge, dass ein inadäquates Verständnis beim weiteren Hören zumeist nur sehr eingeschränkt korrigiert werden kann. Außerdem scheinen Hörer aufgrund der geringeren Selbststeuerungsmöglichkeiten dazu zu neigen, bei der Verarbeitung längerer und semantisch reichhaltiger Texte vergleichsweise früh semantische Makrostrukturen zu bilden, d.h. die wesentlichen Informationen zu fokussieren, während Leser leichter auch Details fokussieren können (vgl. K ÜRSCHNER / S CHOTZ 2008: 142 f). Sind noch parallel zum Hören Items zu lesen oder vorher gelesene oder gehörte Arbeitsanweisungen und Items zusammen mit (früheren) Textinformationen im Gedächtnis zu halten, kann es leicht zu einer Überlastung des Arbeitsgedächtnisses kommen. Insbesondere dann, wenn die Items erst nach dem Hören des Textes zu lösen sind, testet man zudem, neben dem ‚eigentlichen‘ Hörverstehen, auch stets die Fähigkeit zur mittelfristigen Speicherung von Informationen (vgl. auch B UCK 2001: Kap. 1; G ROT - JAHN 2005; M EIßNER 2006: 263). Hier kann man allerdings argumentieren, dass auch Hörverstehen: Konstrukt und Messung 77 41 (2012) • Heft 1 außerhalb von Testsituationen viele zielsprachliche Hörkontexte hohe Anforderungen an das Gedächtnis stellen und diese Anforderungen deshalb durchaus als konstruktrelevant angesehen werden können. Während es sich bei Hörtexten um kontinuierliche akustische Signale handelt, liegen schriftliche Texte als Systeme mehr oder minder diskreter Einheiten vor (Buchstaben, Wörter etc.). Ein Hörtext ist für den Hörer zunächst einmal ein mit Pausen unterbrochener Lautstrom, in dem im Unterschied zu Lesetexten die Wortgrenzen nur sehr bedingt markiert sind. Um den Text zu verstehen, muss der Hörer den Lautstrom zumindest partiell in Einzelwörter zerlegen. Die Segmentierung in Wörter und die korrekte Worterkennung stellt eine der Hauptschwierigkeiten beim Hören (fremdsprachiger) Texte dar. Die Schwierigkeiten werden noch verstärkt, wenn der Hörtext eine deutliche Tendenz z.B. zu Koartikulation, Assimilation, Reduktion und Elision aufweist. 4 F IELD (2008: 141) unterscheidet in diesem Zusammenhang zwischen der Zitierform eines Wortes, d.h. einer kontextfreien, isolierten Realisation eines Wortes durch einen sorgfältig artikulierenden Standardsprecher, und den vielfältigen lautlichen Realisationen ein und derselben Zitierform in authentischer zusammenhängender Sprache. Lernende erwerben im Fremdsprachenunterricht zunächst in der Regel die Zitierform, z.B. [ækt u li] oder auch [æktju li] für engl. actually. Begegnet der Lerner dann Realisationen wie [æ li] oder [æk i], dann gelingt häufig nicht die Zuordnung dieser Realisationsformen zu der gespeicherten Zitierform (vgl. ebd.: 153). Diese Variabilität des lautlichen Signals ist eine der zentralen Schwierigkeiten beim fremdsprachlichen Hörverstehen. Angesichts dieser und weiterer Spezifika des Hörverstehens kommt F IELD (2008: 27 f) zu Recht zu folgender sehr kritischen Bewertung des Ausmaßes an Übereinstimmung zwischen Hör- und Leseverstehen: „A reader has the advantage of a standardised spelling system. By contrast, a listener is exposed to speech sounds which vary considerably from one utterance to another, and from one speaker to another, and which even blend into each other. […] the signal which the listener has to deal with requires an entirely different kind of processing to that demanded by reading. […] Of course, it cannot be denied that the two skills have certain meaning-building elements in common. They both draw upon the same comprehension processes (extracting ideas, relating the ideas to what has gone before, interpreting what the speaker/ reader has left unsaid, making connections to world knowledge). But this resemblance should not be overstated. Because of the temporary nature of the speech signal, a listener has to carry forward in her memory all the ideas that have been expressed so far if she wishes to build a complete account of a conversation. By contrast, […] a reader can always look back. So even at the level of comprehension the processes are distinct. “ Eine partiell ähnliche Position vertreten auch K ÜRSCHNER / S CHNOTZ (2008) in Bezug auf den muttersprachlichen Leseprozess. Die Autoren unterscheiden zunächst einmal 4 Vgl. z.B. G OH (2000), F LOWERDEW / M ILLER (2005: Kap. 4); F IELD (2008, Kap. 9) sowie auch die Diskussion von Unterschieden zwischen „konzeptioneller Mündlichkeit“ und „konzeptioneller Schriftlichkeit“ bei G ROTJAHN (2005: 128 ff) und zwischen Schreib- und Sprechgrammatik im Französischen bei M EIßNER (2006: 246 f). 78 Rüdiger Grotjahn 41 (2012) • Heft 1 zwischen einer eher monistischen und einer eher dualistischen Position. Vertreter der monistischen Position gehen davon aus, dass zumindest bei geübten Lesern „das Lesen und das Hören von Texten auf den höheren kognitiven Verarbeitungs- und Repräsentationsebenen auf gleichartigen Prozessen beruhen“ (ebd.: 141). Dies bedeutet zugleich, dass bei geübten Lesern und Hörern modalitätsspezifische Unterschiede bei der Wahrnehmung sprachlichen Inputs auf den hierarchisch niedrigeren Ebenen keinen Einfluss auf die Verarbeitung auf den höheren Ebenen haben. Vertreter der dualistischen Position sind dagegen der Ansicht, „dass zwischen Hören und Lesen modalitätsbedingt grundlegende Unterschiede bestehen, die sowohl auf den unteren als auch auf den höheren Ebenen der kognitiven Verarbeitung vorhanden sind“ (ebd.: 141). K ÜRSCHNER / S CHNOTZ (2008) präferieren vor dem Hintergrund der Forschungslage selbst ein integriertes Modell des Hör- und Leseverstehens, bei dem „die Prozesse im Arbeitsgedächtnis auf unteren Verarbeitungsebenen noch teilweise modalitätsspezifisch sind und auf den höheren Verarbeitungsebenen zunehmend modalitätsunspezifisch werden“ (ebd.: 146). Entsprechend können auf den höheren semantischen Verarbeitungsebenen „zwar quantitative Unterschiede zwischen dem Hörverstehen und dem Leseverstehen hinsichtlich der Elaboriertheit und Differenziertheit der mentalen Repräsentationen auftreten. Diese Unterschiede sind jedoch nicht auf qualitativ unterschiedliche Prozesse auf den höheren Verarbeitungsebenen zurückzuführen, sondern durch Unterschiede auf den niedrigeren Verarbeitungsebenen bedingt“ (ebd.: 146). Dabei beziehen sich K ÜRSCHNER / S CHNOTZ (2008) allerdings auf (kompetente) Muttersprachlern. M.E. spricht vieles dafür, dass es im Fall von Fremdsprachenlernern, vor allem, wenn diese nicht sehr weit fortgeschritten sind, auch bei den hierarchiehöheren Verarbeitungsprozessen qualitative Unterschiede zwischen Hör- und Leseverstehen gibt. Neuere Befunde zur empirischen Unterscheidbarkeit von Hörverstehen und Leseverstehen sowie zur Unterscheidbarkeit von Teilkompetenzen beim Hörbzw. Leseverstehen finden sich z.B. in S ONG (2008) und L EUCHT [et al.] (2010). Insgesamt gesehen sind die Befunde nicht eindeutig. So kommt S ONG (2008) zu dem Schluss, dass sich Teilkompetenzen wie „understanding the main and topical ideas“ und „understanding supporting and specific details“ (ebd.: . 441) empirisch unterscheiden lassen. Dagegen kommen L EUCHT [et al.] (2010) in Bezug auf die Fertigkeiten selektives vs. genaues Verstehen zu dem Ergebnis, dass diese für Lerner der achten Jahrgangsstufe „keine empirisch voneinander abgrenzbaren Teilkompetenzen innerhalb englischsprachigen Lese- und Hörverstehens“ (ebd.: 134) darstellen. Allerdings weist S ONG (2008) darauf hin, dass die Ergebnisse von Studien zur Trennbarkeit von Teilkompetenzen vom Sprachstand der Testteilnehmer sowie von Merkmalen der Aufgabe abhängen können (vgl. hierzu auch S HIN 2008). Dies bedeutet, dass in Studien, in denen empirisch nicht zwischen modalitätsspezifischen Teilkompetenzen unterschieden werden konnte, bei einer gezielten Messung anhand von trennschärferen Merkmalen und Aufgabenformaten möglicherweise eine empirische Differenzierung hätte erreicht werden können. Zudem gilt, dass metrische Mehrdimensionalität zwar eine hinreichende, aber keine notwendige Bedingung für die qualitative Unterschiedlichkeit der bei der Lösung einer Aufgabe involvierten Kompetenzen ist. Konkret bedeutet dies, dass auch im Fall hoch Hörverstehen: Konstrukt und Messung 79 41 (2012) • Heft 1 korrelierter Leistungsdaten aus Verstehenstests die jeweils zugrundeliegenden kognitiven Kompetenzen durchaus qualitativ unterschiedlich sein können (vgl. H ARTIG / H ÖHLER 2010; S CHNOTZ [et al.] 2010: 144). Eine Vielzahl von Aufgabenmerkmalen, die das Verstehen erschweren oder erleichtern können, werden unter Angabe weiterer Literatur z.B. bei B UCK (2001: 32 ff, 149 ff), G ROTJAHN (2005), A LDERSON / F IGUERAS / K UIJPER / N OLD / T AKALA / T ARDIEU (2006), G ROTJAHN / T ESCH (2010a, b), G REEN / Ü NALDI / W EIR (2010), R OSSA (2010: 140 ff), H ARTIG / F REY (2012) und L EUCHT / H ARSCH / P ANT / K ÖLLER (2012) aufgeführt. Wichtige Merkmale sind z.B.: Akzent und Dialekt, Prosodie, Sprechgeschwindigkeit, Zahl der Sprecher und Unterscheidbarkeit der Stimmen, Verzögerungen und Pausen, Häufigkeit der Textdarbietung, konzeptuelle Schwierigkeit des Textinhalts, (interkulturell differierende) non-verbale Signale. Entsprechende Merkmale sind bei der Entwicklung von Testaufgaben als potenziell schwierigkeitsgenerierende Faktoren zu berücksichtigen. Natürlich müssen Merkmale, die sich allein auf den Text oder allein auf die zugehörigen Items beziehen, noch um Merkmale ergänzt werden, die der Wechselwirkung zwischen Hörtext und Item Rechnung tragen. So ist z.B. ein Item, zu dessen Lösung Informationen nötig sind, die über den gesamten Text verstreut sind, tendenziell schwieriger als ein Item, das sich auf eine sprachlich einfach formulierte Einzelinformation bezieht. Im bekannten „Dutch CEFR Grid for Reading and Listening“ (vgl. A LDERSON [et al.] 2006 sowie www.lancs.ac.uk/ fss/ projects/ grid/ [letzter Zugriff: 26.2.2012]), das u.a. im Projekt „Deutsch Englisch Schülerleistungen International (DESI)“ sowie bei der Entwicklung von Testaufgaben zur Überprüfung der Bildungsstandards für die erste Fremdsprache am IQB eingesetzt wurde, werden entsprechende Wechselwirkungen leider unzureichend berücksichtigt (vgl. auch die entsprechende Kritik in L EUCHT [et al.] 2012). Die Abschätzung des Anteils eines Merkmals an der Gesamtschwierigkeit einer Aufgabe kann z.B. regressionsanalytisch (vgl. z.B. L EUCHT [et al.] 2012) oder auch auf der Basis der Item-Response-Theorie erfolgen (vgl. z.B. W ILSON / M OORE 2011). Die vorangehenden Ausführungen zu potenziellen schwierigkeitsgenerierenden Merkmalen haben eine Reihe von Konsequenzen für die Gestaltung von Hörverstehensaufgaben und die Interpretation der Testergebnisse. So sollte man potenzielle Schwierigkeitsfaktoren bereits bei der Textauswahl berücksichtigen. Weiterhin kann man (zusätzlich) versuchen, die Schwierigkeit einer Aufgabe über die Manipulation relevanter Merkmale systematisch in Richtung auf eine bessere Übereinstimmung mit dem Fähigkeitsprofil der Testpopulation verändern. Außerdem lassen sich Aussagen zu den schwierigkeitsbestimmenden Merkmalen von Aufgaben auch für eine Festlegung und inhaltliche Beschreibung von Kompetenzniveaus (vgl. H ARSCH / H ARTIG 2011) oder auch für die individuelle Diagnose spezifischer Stärken und Schwächen bei einzelnen Teilkompetenzen des Hör- und Leseverstehens (vgl. z.B. S AWAKI / K IM / G EN - TILE 2009) nutzen. Bei der gezielten Veränderung der Schwierigkeit von Aufgaben stellt sich allerdings das Problem, dass die Manipulation von Hörtexten zum einen sehr aufwändig ist, da sie die Neuaufnahme des Textes auf Tonträger erfordert, und dass zum anderen sowohl die Veränderung von Textmerkmalen als auch eine Neuaufnahme 80 Rüdiger Grotjahn 41 (2012) • Heft 1 (mit anderen Sprechern) zu einer Verringerung der Authentizität führen kann. Weiterhin ergibt sich beim Versuch der Steuerung der Aufgabenschwierigkeit über eine Manipulation einzelner Merkmale das Problem, dass die Merkmale in der Regel in einer komplexen Wechselwirkung stehen. Dies hat zur Folge, dass die Schwierigkeit einer bestimmten Konfiguration von Merkmalen nur sehr bedingt anhand der Schwierigkeiten der zugehörigen Einzelmerkmale vorhergesagt werden kann. Eine wichtige Kontextvariable in Bezug auf die Schwierigkeit und (kognitive) Validität von Hörverstehensaufgaben ist die Präsentationshäufigkeit der Texte zusammen mit der Positionierung der zum Text gehörenden Items. Da die Frage der Präsentationshäufigkeit der Texte und Positionierung der Items in Testentwicklungsprojekten häufig kontrovers diskutiert wird, gehe ich auf diesen Aspekt etwas ausführlicher ein (weitere Hinweise finden sich in G ROTJAHN 2003: Kap. 6; G ROTJAHN / T ESCH 2010a: 131 f). Die meisten Texte werden in der Realität nur einmal gehört und können zudem auch häufig nur einmal gehört werden. Auch in einer face-to-face-Kommunikation kann man im Fall von Nichtverstehen bestenfalls hin und wieder nachfragen. Allerdings sind insbesondere Gespräche häufig durch ein hohes Maß an Redundanz und Wiederholung gekennzeichnet. Ein zweimaliges Hören hilft jedoch, den potenziellen Einfluss störender Kontextfaktoren zu minimieren. So kann in der Praxis häufig nicht sichergestellt werden, dass die räumlichen Gegebenheiten und die technische Ausstattung bei jeder Testadministration eine vergleichbar hohe Qualität aufweisen. Außerdem kann jederzeit unvorhergesehener, störender Lärm auftreten (vgl. G ERANPAYEH / T AYLOR 2008: 3). Weiterhin kann es sein, dass bestimmte Testteilnehmer ein Item nicht adäquat bearbeiten, weil sie noch dabei sind, ein sehr schwieriges vorangehendes Item zu lösen (vgl. G ERAN - PAYEH 2008: 20). Ein zweites Hören bedeutet in diesem Fall eine zweite Chance. Insgesamt sprechen diese und weitere Argumente eher für eine mehrmalige Präsentation insbesondere im Fall von längeren Texten (vgl. auch S AKAI 2009). Nicht ohne Grund werden mittlerweile in fast allen Cambridge ESOL Tests die Hörtexte zweimal präsentiert. Eine in Teilen traditionsbedingte Ausnahme ist das International English Language Testing System (IELTS). Allerdings wird dort darauf geachtet, dass die Hörtexte so viel Redundanz aufweisen, dass die zugehörigen Items auch bei nur einmaliger Präsentation des Textes z.B. im Fall von kurzen Störgeräuschen mit einer hinreichenden Wahrscheinlichkeit gelöst werden können (vgl. G ERANPAYEH / T AYLOR 2008: 4). Letztlich sollte man allerdings die Entscheidung über die Zahl der Präsentationen vom jeweiligen Testziel, vom zielsprachlichen Verwendungskontext und auch vom Aufgabenformat abhängig machen. So ist bei einer sehr kurzen Lautsprecherdurchsage mit nur einem Item eine einmalige Präsentation gut begründbar, zumal wenn in relevanten zielsprachlichen Hörsituationen entsprechende Durchsagen ebenfalls nur ein einziges Mal gehört werden können (vgl. auch K OPPENHAGEN 2011: 140). Was die Positionierung der Items betrifft, so spricht sich z.B. B OLTON (1996: 47) dafür aus, beim Testen auf der Grundstufe den Text zweimal zu präsentieren, und zwar wie folgt: Die Testteilnehmer hören zunächst den Text. Sie lesen dann die Aufgabe(n), Hörverstehen: Konstrukt und Messung 81 41 (2012) • Heft 1 damit sie bei der zweiten Präsentation zielgerichteter hören können. Anschließend hören sie den Text zum zweiten Mal und lösen dabei - oder danach - die Aufgabe(n). Diese sog. Sandwich-Variante, die auch bei den DESI-Hörverstehenstests zum Einsatz gekommen ist, wird von S CHNEIDER (2007) eher kritisch gesehen, da aus den Testresultaten nicht ersichtlich sei, „ob das Hören ohne oder mit Frage oder ob einfach das erste oder das zweite Hören die Lösung der Aufgabe ermöglicht hat“ (ebd.: 281). Die Ansicht, dass die Sandwich-Variante das Verstehen insgesamt erleichtert, wird u.a. durch S HERMAN (1997) empirisch gestützt (vgl. auch S AKAI 2009: 362 f). Die Befunde von S HERMAN deuten weiterhin darauf hin, dass sich im Fall einer einmaligen Präsentation vorangestellte Items in unterschiedlicher Weise auf das Verstehen auswirken können. Indem vorangestellte Items die Aufmerksamkeit auf bestimmte Informationen lenken, können sie einerseits das Verstehen erleichtern. Andererseits können sie jedoch auch zu einer Informationsüberlastung und als Folge „flacheren“ Verarbeitung des Textes führen. Allerdings hat nach S HERMAN die Voranstellung der Items einen positiven affektiven Effekt, da der Hörer nicht im Unklaren über die als relevant erachteten Informationen gelassen wird. Außerdem sind vorangestellte Items häufig authentischer als nachgestellte Aufgaben, da in der Realität das Hören eines Textes zumeist mit spezifischen Zielsetzungen und Fragestellungen auf Seiten des Hörers verbunden ist und als Folge Texte auch in realen Sprachverwendungssituationen unterschiedlich tief verarbeitet werden. Bei zweimaliger Präsentation des Hörtextes besteht zudem die Möglichkeit, dass sich die Schüler zunächst das Item anschauen, dann den Text hören, ohne schon eine Antwort oder Lösung eintragen zu müssen und erst nach oder während des zweiten Hörens ihren Eintrag machen. Dadurch reduziert sich die potenzielle Beeinträchtigung des Hörvorgangs durch Lesen und Schreiben. Hörverstehen ist wie Leseverstehen eine zielgerichtete Aktivität. Der Hörer kann bei seinem Bemühen um Verstehen unterschiedliche und im Zuge des Hörens auch wechselnde Ziele verfolgen: Er kann z.B. bestimmte Detailinformationen dem Text entnehmen wollen oder lediglich ein globales Verständnis des Textes anstreben. Das jeweilige Hörziel steuert somit die Art und Weise, wie der Hörer den Text verarbeitet und damit die jeweilige spezifische Höraktivität/ Hörstrategie. Entsprechend wird in der Literatur analog zu den Lesetypen u.a. zwischen folgenden Hörtypen differenziert: detailliert, selektiv, global, orientierend, kursorisch, total (vgl. die Literaturbelege in G ROTJAHN 2005 sowie auch F IELD 2008: 66 für eine Klassifikation von Hörtypen anhand des Ausmaßes und des Fokus der Aufmerksamkeit). Ähnlich wird auch in Testspezifikationen häufig u.a. zwischen folgenden Hörzielen bzw. Höraktivitäten unterschieden: Verstehen von a) Kernaussagen, b) Hauptaussagen und c) relevanten Details (vgl. für ein Beispiel G ROTJAHN / T ESCH 2010a: 138). Weiterhin kann der Hörer in einer Kommunikationssituation eine Reihe unterschiedlicher Rollen einnehmen. Er kann z.B. Gesprächsteilnehmer, Adressat, Zuhörer oder auch (zufälliger) Mithörer sein (vgl. F IELD 2008: 60 ff; I MHOF 2003: 37 ff; R OST 2004). Die verschiedenen Rollen beinhalten höchst unterschiedliche Anforderungen an den Hörer. Vor allem die Rolle als aktiver Gesprächsteilnehmer stellt deutlich andere kognitive Anforderungen als z.B. die Rolle eines Zuhörers bei einem Vortrag. Als Ge- 82 Rüdiger Grotjahn 41 (2012) • Heft 1 sprächsteilnehmer kann der Hörer z.B. Bedeutungen aushandeln und sein eigenes Verstehen anhand der Reaktionen der Gesprächsteilnehmer überprüfen. Die Notwendigkeit, die eigenen Gesprächsbeiträge zu planen, kann jedoch zugleich das Verstehen der Äußerungen des Gesprächspartners erheblich beeinträchtigen. Aus den genannten Gründen kann man im Rahmen von mündlichen Interviews auch nur sehr eingeschränkt die Fähigkeit zum Verstehen von Einwegkommunikation überprüfen. Ebenfalls problematisch im Hinblick auf das Testen ist die Rolle als Mithörer z.B. eines Gesprächs von Fremden. Dem Mithörer steht nicht das Situations- und Sachwissen der Sprecher zur Verfügung. Dies kann das Verstehen sogar für Muttersprachler unmöglich machen. 4. Schlussfolgerungen Es dürfte im Vorangehenden deutlich geworden sein, dass das jeweils zu Grunde gelegte Testkonstrukt sowie die Anforderungen der eingesetzten Aufgaben von entscheidender Bedeutung für die Validität des jeweiligen Hörverstehenstest ist. Da die Angemessenheit eines Testkonstrukts von den jeweiligen Zielsetzungen und Adressaten eines Tests und den aufgrund der Testergebnisse zu treffenden Entscheidungen sowie auch von praktischen Zwängen bei der Testerstellung und beim Testeinsatz abhängt, ist es nicht möglich, ein für alle Testverwendungssituationen ideales Hörverstehenskonstrukt zu definieren. Dennoch lassen sich einige Empfehlungen definieren, die für eine Vielzahl von Verwendungskontexten relevant sind. Bereits B UCK (2001: 112-115) hat entsprechende Empfehlungen in Bezug auf ein sog. „default listening construct“, d.h. eines Standardkonstrukts für das Hörverstehen, formuliert. Es handelt sich dabei um ein kompetenzorientiertes Konstrukt, das sich jedoch leicht um Merkmale wie Art der zu bewältigenden Aufgaben, Spezifika der Hörsituation und Merkmale der Testteilnehmer zu einem interaktiven Modell erweitern lässt. Kern des Standardkonstrukts ist die Fähigkeit des Hörers zur Verarbeitung sprachlichen Inputs. Das Modell fokussiert dabei zentrale sprachliche Kompetenzen unter Ausschluss soziolinguistischen Wissens. B UCK (2001: 113) gibt sechs Empfehlungen für eine adäquate Definition dieses Standardkonstrukts. Von zentraler Bedeutung ist die Empfehlung, vor allem jene Aspekte zu testen, die spezifisch für das Hörverstehen sind und die nicht in anderen Testteilen getestet werden können. Entsprechend sollte in Hörverstehenstests die Fähigkeit zur schnellen, automatischen On-line-Verarbeitung von Texten mit typischen Merkmalen mündlicher Sprache der primäre Fokus sein. Auch für F IELD (2008) ist dies ein zentrales Merkmal von Hörverstehenskompetenz. Betrachtet man bekannte internationale Sprachtests wie TOEFL iBT oder TestDaF oder auch Untersuchungen wie DESI wird allerdings deutlich, dass dieser grundlegende Aspekt einer validen Messung von Hörverstehen bisher nicht immer hinreichend berücksichtig wird. So werden z.B. in DESI aus curricularen Erwägungen nicht wenige „Texte eingesetzt, die sich stärker an schriftsprachlichen Konventionen orientieren“ (N OLD / R OSSA 2007: 182). Dies wird Hörverstehen: Konstrukt und Messung 83 41 (2012) • Heft 1 von S CHNEIDER (2007: 280) explizit kritisiert, der darauf hinweist, dass „auch reale Anwendungssituationen nach bzw. außerhalb der Schule die Auswahl der Hörtexte und der Aufgaben mitbestimmen“ sollten. Eine stärkere Berücksichtigung von authentischen Texten mit deutlichen Kennzeichen von konzeptioneller Mündlichkeit ist in vielen Kontexten auch im Hinblick auf einen potentiellen positiven Washback-Effekt in Form einer stärkeren Beschäftigung mit entsprechenden Texten im Fremdsprachenunterricht, angezeigt. Bei den aktuellen Vergleichsarbeiten Jahrgangsstufe 8 (VERA-8) werden auch aus diesem Grunde bei der Testung des Hörverstehens in der ersten Fremdsprache relativ häufig Texte mit deutlichen Merkmalen von Mündlichkeit eingesetzt. Vor dem Hintergrund der Ausführungen in Abschnitt 3 ist über den Aspekt der hinreichenden Berücksichtigung von Merkmalen konzeptioneller mündlicher Sprache hinaus zu fragen, welche Verstehensprozesse, Wissensbestände und Strategien auf welchen Hierarchieebenen hörverstehensspezifisch sind und nicht in anderen Testteilen hinreichend valide getestet werden können. Geht man davon aus, dass sich Hörverstehen und Leseverstehen in erster Linie in Bezug auf Spezifika der unteren Ebenen unterscheiden, dass jedoch auf den oberen Ebenen keine grundlegenden qualitativen Unterschiede in den involvierten Prozessen existieren, dann sollte bei der Testung des Hörverstehens - mehr als bisher in der Regel üblich - die Messung hierarchieniedriger Kompetenzen wie die Fähigkeit zum oberflächennahen Hören fokussiert werden. Weiterhin sollten auf den hierarchiehöheren Ebenen vor allem solche inferenziellen Fähigkeiten überprüft werden, die in einem engen Zusammenhang mit typischen Merkmalen des akustischen Signals stehen, wie z.B. Intonations- und Akzentverläufe zur Signalisierung bestimmter Bedeutungen und Einstellungen. Aufgaben, deren Lösung oberflächennahes Hören erfordert, finden sich u.a. im neuen Pearson Test of English Academic (vgl. z.B. die Formate „Repeat sentence“, „Highlight incorrect words“, „Write from dictation“ in P EARSON E DUCATION 2011: 10, 34, 35). In Bezug auf inferenzielle Hörverstehensprozesse, die in ähnlicher Weise auch beim Leseverstehen zum Einsatz kommen, ist zu überlegen, ob diese Kompetenzen nicht kostengünstiger im Zuge der Testung des Leseverstehens überprüft werden können. Ein weiterer Bereich, der bei der Testung des Hörverstehens stärker als bisher Berücksichtigung finden sollte, ist das interaktive Hören in einer Sprechsituation. Dieses stellt spezifische Anforderungen an den Hörer, da Sprache mehr oder minder gleichzeitig rezipiert, produziert, geplant und überwacht werden muss. Dies unterscheidet interaktives Hören substantiell vom Mithören oder Zuhören monologischer oder dialogischer Hörtexte. Die unterschiedlichen Anforderungen können u.a. dazu führen, dass ein Hörer, der hochkompetent in nicht interaktiven Situationen ist, deutlich geringere Leistungen beim interaktiven Hören zeigt - z.B. als Folge einer unzureichenden Automatisierung der produktiven mündlichen Teilkompetenzen. Üblicherweise wird die Fähigkeit zum interaktiven Hören bei der Überprüfung der mündlichen Produktion miterfasst, so z.B. im Zuge eines Gesprächs zwischen Prüfling und Prüfer. Damit jedoch die Überprüfung interaktiver Hörkompetenz in valider Weise geschieht, muss 84 Rüdiger Grotjahn 41 (2012) • Heft 1 zum einen dem Kandidaten im Gespräch geeigneter Input geliefert werden, und zum anderen muss die jeweilige Reaktion des Kandidaten auf den Input anhand geeigneter Kriterien bewertet werden. Wie hier am besten vorzugehen ist, ist bisher nicht hinreichend empirisch untersucht. Literatur A LDERSON , J. Charles / F IGUERAS , Neus / K UIJPER , Henk / N OLD , Günter / T AKALA , Sauli / T ARDIEU , Claire (2006): „Analysing tests of reading and listening in relation to the Common European Framework of Reference: The experience of the Dutch CEFR Construct Project“. In: Language Assessment Quarterly 3.1, 3-30. B ACHMAN , Lyle F. (2007): „What is the construct? The dialectic of abilities and contexts in defining constructs in language assessment“. In: F OX , Janna / W ESCHE , Marjorie B. / B AYLISS , Doreen / C HENG , Liying / T URNER , Carolyn / D OE , Christine (Hrsg.): Language Testing Reconsidered. Ottawa: Ottawa UP, 41-71. B ACHMAN , Lyle F. / P ALMER , Adrian S. (2010): Language Assessment in Practice: Developing Language Assessments and Justifying their Use in the Real World. Oxford: Oxford UP. B OLTON , Sibylle (1996): Probleme der Leistungsmessung: Lernfortschrittstests in der Grundstufe. Berlin: Langenscheidt. B UCK , Gary (2001): Assessing Listening. Cambridge: Cambridge UP. C HALHOUB -D EVILLE , Micheline / D EVILLE , Craig (2006): „Old, borrowed and new thoughts in second language testing“. In: B RENNAN , Robert L. (Hrsg.): Educational Measurement. 4. Aufl., Westport, CT: American Council on Education/ Praeger, 517-530. C HAPELLE , Carol A. (1998): „Construct definition and validity inquiry in SLA research“. In: B ACHMAN , Lyle F. / C OHEN , Andrew D. (Hrsg.): Interfaces between Second Language Acquisition and Language Testing Research. Cambridge: Cambridge UP, 32-70. F IELD , John (2008): Listening in the Language Classroom. Cambridge: Cambridge UP. F LOWERDEW , John / M ILLER , Lindsay (2005): Second Language Listening: Theory and Practice. Cambridge: Cambridge UP. G ERANPAYEH , Ardeshir (2008): „Using DIF to explore item difficulty in CAE“. In: Research Notes 32, 16-23 [www.cambridgeesol.org/ rs_notes/ rs_nts32.pdf (29.02.2012)]. G ERANPAYEH , Ardeshir / T AYLOR , Lynda (2008): „Examining listening: developments and issues in assessing second language listening“. In: Research Notes 32, 2-5. [www.cambridgeesol.org/ rs_notes/ rs_nts32.pdf (29.02.2012)] G OH , Christine C. M. (2000): „A cognitive perspective on language learners’ listening comprehension problems“. In: System 28.1, 55-75. G REEN , Anthony / Ü NALDI , Aylin / W EIR , Cyril J. (2010): „Empiricism versus connoisseurship: Establishing the appropriacy of texts in tests of academic reading“. In: Language Testing 27.2, 191- 211. G ROTJAHN , Rüdiger (2003): Leistungsmessung und Leistungsbewertung. Hagen: FernUniversität. [Fernstudienbrief für den Weiterbildungs-Masterstudiengang „Deutschlandstudien“]. G ROTJAHN , Rüdiger (2005): „Testen und Bewerten des Hörverstehens“. In: Ó D ÚILL , Micheál / Z AHN , Rosemary / H ÖPPNER , Kristina D. (Hrsg.): Zusammenarbeiten: Eine Festschrift für Bernd Voss. Bochum: AKS, 115-144. G ROTJAHN , Rüdiger (in Vorbereitung): Testen und Evaluieren fremdsprachlicher Kompetenzen: Ein Arbeitsbuch. Tübingen: Narr. Hörverstehen: Konstrukt und Messung 85 41 (2012) • Heft 1 G ROTJAHN , Rüdiger / T ESCH , Bernd (2010a): „Messung der Hörverstehenskompetenz im Fach Französisch“. In: P ORSCH / T ESCH / K ÖLLER (Hrsg.), 125-150. G ROTJAHN , Rüdiger / T ESCH , Bernd (2010b): „Messung der Leseverstehenskompetenz im Fach Französisch“. In: P ORSCH / T ESCH / K ÖLLER (Hrsg.), 91-124. H ARSCH , Claudia / H ARTIG , Johannes (2011): „Modellbasierte Definition von fremdsprachlichen Kompetenzniveaus am Beispiel der Bildungsstandards Englisch“. In: Zeitschrift für Interkulturellen Fremdsprachenunterricht 16.2, 6-17 [http: / / zif.spz.tu-darmstadt.de/ (29.02.2012)]. H ARTIG , Johannes / F REY , Andreas (2012): „Konstruktvalidierung und Skalenbeschreibung in der Kompetenzdiagnostik durch die Vorhersage von Aufgabenschwierigkeiten“. In: Psychologische Rundschau 63.1, 43-49. H ARTIG , Johannes / H ÖHLER , Jana (2010): „Modellierung von Kompetenzen mit mehrdimensionalen IRT-Modellen: Projekt MIRT“. In: K LIEME , Eckhard / L EUTNER , Detlev / K ENK , Martina (Hrsg.): Kompetenzmodellierung: Zwischenbilanz des DFG-Schwerpunktprogramms und Perspektiven des Forschungsansatzes. Weinheim: Beltz, 189-198. I MHOF , Margarete (2003): Zuhören: Psychologische Aspekte auditiver Informationsverarbeitung. Göttingen: Vandenhoeck & Ruprecht. K HALIFA , Hanan / W EIR , Cyril J. (2009): Examining Reading: Research and Practice in Assessing Second Language Reading. Cambridge: Cambridge UP. KMK [Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland] (Hrsg.) (2004): Bildungsstandards für die erste Fremdsprache (Englisch/ Französisch) für den Mittleren Schulabschluss: Beschluss vom 4.12.2003. Neuwied: Luchterhand. K OPPENHAGEN , Andrea (2011): „Gegenwärtige Formate von Hörverstehenstests und ihre empirische Evaluierung“. In: Deutsch als Fremdsprache 48.3, 138-146. K ÜRSCHNER , Christian / S CHNOTZ , Wolfgang (2008): „Das Verhältnis gesprochener und geschriebener Sprache bei der Konstruktion mentaler Repräsentationen“. In: Psychologische Rundschau 59.3, 139-149. L EUCHT , Michael / H ARSCH , Claudia / P ANT , Hans A. / K ÖLLER , Olaf (2012): „Steuerung zukünftiger Aufgabenentwicklung durch Vorhersage der Schwierigkeiten eines Tests für die erste Fremdsprache Englisch durch Dutch Grid Merkmale“. In: Diagnostica 58.1, 31-44. L EUCHT , Michael / R ETELSDORF , Jan / M ÖLLER , Jens / K ÖLLER , Olaf (2010): „Zur Dimensionalität rezeptiver englischsprachiger Kompetenzen“. In: Zeitschrift für Pädagogische Psychologie 24.2, 123-138. M EIßNER , Franz-Joseph (2006): „Linguistische und didaktische Überlegungen zur Entwicklung von Kompetenzaufgaben im Lernbereich Mündlichkeit“. In: Französisch heute 37.3, 240-282. N OLD , Günter / R OSSA , Henning (2007): „Hörverstehen“. In: B ECK , Bärbel / K LIEME , Eckhard (Hrsg.): Sprachliche Kompetenzen: Konzepte und Messung. DESI-Studie (Deutsch Englisch Schülerleistungen International). Weinheim: Beltz, 178-196. P EARSON E DUCATION (2011). Score Guide. London: Pearson Education. [http: / / pearsonpte.com/ PTEAcademic/ scores/ Documents/ PTEA_Score_Guide.pdf (26.02.2012)] P OELMANS , Petra (2003): Developing Second-language Listening Comprehension: Effects of Training Lower-order Skills versus Higher-order Strategy. Utrecht, Netherlands: LOT. P ORSCH , Raphaela / G ROTJAHN , Rüdiger / T ESCH , Bernd (2010): „Hörverstehen und Hör-Sehverstehen in der Fremdsprache - unterschiedliche Konstrukte? “ In: Zeitschrift für Fremdsprachenforschung 21.2, 143-189. P ORSCH , Raphaela / T ESCH , Bernd / K ÖLLER , Olaf (Hrsg.) (2010): Standardbasierte Testentwicklung und Leistungsmessung: Französisch in der Sekundarstufe I. Münster: Waxmann. 86 Rüdiger Grotjahn 41 (2012) • Heft 1 R OSSA , Henning (2010): „Was messen Hörverstehensaufgaben? Ansätze zur Konstruktvalidierung von Sprachtestaufgaben als Beitrag zur Qualitätssicherung in der Kompetenzforschung“. In: A GUADO , Karin / S CHRAMM , Karen / V OLLMER , Helmut J. (Hrsg.): Fremdsprachliches Handeln beobachten, messen, evaluieren: Neue methodische Ansätze der Kompetenzforschung und der Videographie. Frankfurt/ M.: Lang, 119-152. R OST , Michael (2004): Teaching and Researching Listening. Harlow: Longman. R UPP , André A. / V OCK , Miriam / H ARSCH , Claudia / K ÖLLER , Olaf (2008): Developing Standardsbased Assessment Tasks for English as a First Foreign Language: Context, Processes, and Outcomes in Germany. Münster: Waxmann. S AKAI , Hideki (2009): „Effect of repetition of exposure and proficiency level in L2 listening tests“. In: TESOL Quarterly 43.2, 360-372. S AWAKI , Yasuyo / K IM , Hae-Jin / G ENTILE , Claudia (2009): „Q-matrix construction: Defining the link between constructs and test items in large-scale reading and listening comprehension assessments“. In: Language Assessment Quarterly 6.3, 190-209. S CHNEIDER , Günther (2007): „Auf dem Weg zu Skalen für die rezeptiven Kompetenzen im Bereich des Englischen“. In: B ECK , Bärbel / K LIEME , Eckhard (Hrsg.): Sprachliche Kompetenzen: Konzepte und Messung. DESI-Studie (Deutsch Englisch Schülerleistungen International). Weinheim: Beltz, 273-289. S CHNOTZ , Wolfgang / H ORZ , Holger / M C E LVANY , Nele / S CHROEDER , Sascha / U LLRICH , Mark / B AUMERT , Jürgen / H ACHFELD , Axinja / R ICHTER , Tobias (2010): „Das BITE-Projekt: Integrative Verarbeitung von Bildern und Texten in der Sekundarstufe I“. In: K LIEME , Eckhard / L EUTNER , Detlev / K ENK , Martina (Hrsg.): Kompetenzmodellierung: Zwischenbilanz des DFG-Schwerpunktprogramms und Perspektiven des Forschungsansatzes. Weinheim: Beltz, 143-153. S HERMAN , Jane (1997): „The effect of question preview in listening comprehension tests“. In: Language Testing 14.2, 185-213. S HIN , Sunyoung (2008): „Examining the construct validity of a web-based academic listening test: An investigation of the effects of response formats“. In: Spaan Fellow Working Papers in Second or Foreign Language Assessment 6, 95-125. S ONG , Min-Young (2008): „Do divisible subskills exist in second language (L2) comprehension? A structural equation modeling approach“. In: Language Testing 25.4, 435-464. T SUI , Amy B. / F ULLILOVE , John (1998): „Bottom-up or top-down processing as a discriminator of L2 listening performance“. In: Applied Linguistics 19.4, 432-451. W EIR , Cyril J. (2005): Language Testing and Validation: An Evidence-based Approach. New York: Palgrave Macmillan. W ILSON , Mark / M OORE , Stephen (2011): „Building out a measurement model to incorporate complexities of testing in the language domain“. In: Language Testing 28.4, 441-462. W OLFF , Dieter (2003): „Hören und Lesen als Interaktion: zur Prozesshaftigkeit der Sprachverarbeitung“. In: Der Fremdsprachliche Unterricht Englisch 64/ 65.4/ 5, 11-16.