eJournals Fremdsprachen Lehren und Lernen 30/1

Fremdsprachen Lehren und Lernen
flul
0932-6936
2941-0797
Narr Verlag Tübingen
Es handelt sich um einen Open-Access-Artikel, der unter den Bedingungen der Lizenz CC by 4.0 veröffentlicht wurde.http://creativecommons.org/licenses/by/4.0/121
2001
301 Gnutzmann Küster Schramm

DIALANG - ein diagnostisches Online-Testverfahren

121
2001
Gerhard von der Handt
flul3010167
Gerhard von der Handt • DIALANG ein diagnostisches Online-Testverfahren (Schwerpunkt Hörverstehen) Abstract. DIALANG stands for Diagnostic Language Testing. The article describes the airns and the approach of this project which is financed within the Sokrates prograrn. The main focus is on listening comprehension. Possibilities and restraints of online diagnostic tests like DIALANG are explored, and ways offurther developing the DIALANG systemare suggested. This may allow.a more specific analysis of test-takers' input as a basis for a more detailed and individualized instruction on improving their language competence. 0. Einleitung DIALANG steht für Diagnostic Language Testing. Der nachfolgende Artikel beschreibt Ansatz und Ziele dieses Sokrates-Projekts, wobei das Hörverstehen im Mittelpunkt steht. Im Anschluss daran werden Besonderheiten und Einschränkungen untersucht, welche mit dem Online-Testen verbunden sind zumindest beim heutigen Stand der Technik. In einzelnen Punkten sind die Einschränkungen DIALANG-spezifisch. Die Einschränkungen können sich sowohl auf den Verstehens-Input beziehen (z.B. Textlänge, keine visuellen Komponenten) als auch auf die Aufgabenstellung (es sind fast ausschließlich Mehrfachwahlaufgaben möglich). DIALANG bezieht sich auf den Gemeinsamen Europäischen Referenzrahmen fü.r Sprachen: Lernen, Lehren und Beurteilen, ein Vorhaben, dessen endgültige Fassung im Europäischen Jahr der Sprachen vorgestellt wird, aber schon jetzt auch in der deutschen Fassung über Internet öffentlich ist (http: / / www.goethe.de/ z/ 50/ commeuro/ i00.htm). Aus dem Referenzrahmen wurden Forderungen für die Testkonstruktion abgeleitet. Die praktischen Konsequenzen dieser Ableitungen für DIALANG werden in einem weiteren Abschnitt diskutiert. Dabei werden auch die Probleme ausgewiesen, die durch die DIA- LANG-spezifischen Aufgabenformen einerseits und gewisse Prinzipien der Kompetenzbeschreibungen des Referenzrahmens andererseits entstehen. Der Hauptteil des Beitrags beschäftigt sich mit der Weiterentwicklung der Diagnosefunktion von DIALANG in Richtung auf Differenzierungsmöglichkeiten und Individualisierung. Abgesehen von der Möglichkeit des jederzeit möglichen freien Zugriffs (vorausgesetzt natürlich, man verfügt über die technischen Voraussetzungen) ist DIALANG der Korrespondenzadresse: Gerhard VON DER HANDT, wissenschaftlicher Angestellter, Deutsches Institut für Erwachsenenbildung, Abteilung Planung und Entwicklung, Hansaallee 150, 60320 FRANKFURT. E-mail: von-der-Handt@die-frankfurt.de Arbeitsbereiche: ,Selbstgesteuertes Lernen, Lernorganisation, Neue Medien lFLiulL 30 (2001) 168 Gerhard von der Handt Fremdevaluation verpflichtet. Die im Rahmen des Gesamtsystems vorgesehene Selbsteinschätzung dient ebenso wie ein vorgeschalteter Wortschatztest der Groborientierung auf eine der Niveaustufen hin, in deren Bereich die ersten Aufgaben gestellt werden. Die Selbsteinschätzung ist somit eine Vorstufe zu dem eigentlichen Test. Vorgesehen ist allerdings eine Rückmeldung über Unterschiede zwischen Selbstevaluation und den Testergebnissen, um das Bewusstsein für die Angemessenheit der Selbsteinschätzung zu entwickeln. Im Unterschied dazu beruht der PORTFOLIO-Ansatz (vgl. http: / / www.unifr.ch/ ids/ Portfolio/ bzw. den Beitrag von Günther Schneider in diesem Band) entschiedener auf Selbstevaluation. Jedes der Systeme hat sowohl Vorals auch Nachteile. Im abschließenden Kapitel wird versucht, die Möglichkeiten einer Weiterentwicklung von DIALANG unter Stärkung der diagnostischen Funktion zu beschreiben. DIALANG und PORTFOLIO würden sich auf dieser Grundlage (noch stärker als bisher) gegenseitig ergänzen. Damit wird im vorliegenden Zusammenhang mit Fremdevaluation ein Verfahren bezeichnet, bei welchem der gesamte Evaluationsprozess, angefangen von der Zielauswahl bis zur Auswertung/ Bewertung der Testergebnisse abgesehen von der Lösung der Testaufgaben -, ohne eine aktive Beteiligung des Testanden abläuft. Im Gegensatz dazu erfordern selbstevaluative Verfahren wenigstens in Teilbereichen eine selbständige Leistung. Im Prinzip kann sich diese auf alle Elemente des Prozesses beziehen: was will ich lernen was kann ich schon wie stellt sich das Ziel im Einzelnen dar was ist dabei wichtig oder weniger wichtig auf welcher Grundlage kann ich meirie Leistungen mit einer Norm oder den Leistungen anderer vergleichen? Wenn dieser Ablauf völlig unangeleitet oder ohne Beratung verläuft, kann sich die Selbsteinschätzung bestenfalls auf den individuellen Lernfortschritt beziehen. Allein die genauere Vorstellung von sprachlichen Lernzielen setzt schon ein gewisses Maß von Sprachbewusstsein voraus; der Bezug auf eine Leistungsstufe oder der Vergleich mit anderen Leistungen ist ohne vereinbarte Erfassungskategorien und Bewertungskriterien nicht möglich. In den als selbstevaluativ bezeichneten Verfahren (z. B. PORTFOLIO) werden für diese Bereiche Vorgaben gemacht; der eigentliche Einschätzungsprozess auf Grund dieser Vorgaben erfolgt jedoch nicht durch ein Auswertungsprogramm oder Experten, sondern durch den Testanden selbst. Die hier als Selbsteinschätzung angesprochenen Verfahren sind also Mischtypen. 1. Der sprachenpolitische und lemtheoretische Hintergrund von DIALANG DIALANG ist Teil des europäischen sprachenpolitischen Konsenses, dass • jeder europäische Bürger mehr als eine Fremdsprache beherrschen sollte und • seltener gelernte, Minderheiten- und Migranten-Sprachen im europäischen „Sprachengesamthaushalt" eine wichtige Rolle spielen sollen. Der erste Spiegelpunkt schließt das Konzept der differenzierten Mehrsprachigkeit ein: z. B. Englisch+ eine weitere Sprache, so dass jeder europäische Bürger einschließlich seiner Muttersprache mindestens drei Sprachen beherrschen soll, jedoch nicht notwendilFLd 30 (2001) DIALANG ein diagnostisches Online-Testverfahren (Schwerpunkt Hörverstehen) 169 gerweise mit demselben Kompetenzgrad bzw. in der aktiven Sprachbeherrschung. Über diesen allgemeinen Konsens hinaus besteht eine Reihe von Modellen für Sprachenfolgen und -auswahl, deren Umsetzung in erster Linie über die Schule möglich ist da die „Verordnung" bestimmter Sprachen in der Erwachsenenbildung nicht möglich ist. Als Beispiel für die Auswahlkriterien mögen Sprachen in grenzriahen Nachbarregionen oder im Land gesprochene Migranten- oder Minderheitensprachen gelten. In der Weiterbildung folgt die Auswahl in erster Linie individuellen Interessen und Bedürfnissen; über diese können sich als Tendenz wirtschaftliche Bedarfe ausdrücken, wenn z. B. (ebenfalls in Grenzregionen) ein Beruf im anderssprachigen Nachbarland ausgeübt wird. Durch die freie individuelle Wahl im Weiterbildungsbereich gibt es nur eingeschränkte Möglichkeiten einer bildungspolitischen Lenkung der Sprachauswahl. Allerdings sind bildungspolitische bzw. bildungsstrukturelle Entscheidungen in vielen Fällen die Voraussetzung für die Möglichkeit, überhaupt eine bestimmte Sprache zu lernen, so z.B. die selten(er) gelernten Sprachen (zweiter Punkt). Erreichen kann man diese ehrgeizigen Ziele nur, indem man die Strukturen des Lernens grundlegend ändert und das Lernen als lebenslanger Prozess angelegt ist, der zu einem großen Teil nicht mehr in den klassischen formalen Lernstrukturen (Schule, normierte Kurssysteme in der Weiterbildung) stattfinden kann. Komplementär zu organisiertem Lernen in angeleiteten Gruppen werden Sprachen zunehmend in selbstgesteuerten Formen gelernt werden. Die Notwendigkeit hierzu ist nicht allein in der Reaktion auf ad-hoc-Anforderungen oder auf individuelle Bedürfnisse zu sehen, die in einer Gruppe nur sehr bedingt über Binnendifferenzierung berücksichtigt werden können. Vielmehr erfordern das komplexe Lernziel interkulturelle sprachliche Kommunikationsfähigkeit und neuere (konstruktivistische) Auffassungen integrierte Phasen von Lernen und Anwendung. Über die Einschätzung, ob gesteuerte Vorbereitungsstufen auf das Lernen in und über Anwendungssituationen hin sinnvoll sind oder als kontraproduktiv anzusehen sind, gibt es keine Einigkeit. Aber auch unter den Befürwortern der Möglichkeit (und Notwendigkeit) von Instruktion beim Zweitsprachenerwerb, was wohl die Mehrheitsmeinung darstellt, hat sich die Auffassung verbreitet, dass ein hoher Selbstlernanteil notwendig ist, um die angestrebten Ziele zu erreichen. DIALANG ist ein Schritt (neben vielen anderen notwendigen, die hier nicht ausgeführt werden können) auf dem Weg zu dem neuen Lernen mit hohen selbstgesteuerten Anteilen. Mit Hilfe von DIALANG soll der einzelne in die Lage versetzt werden, seinen aktuellen Kenntnisstand festzustellen, ohne große fachlich/ inhaltliche und zugangsorganisatorische Schwellen überwinden zu müssen, was eine wichtige Voraussetzung für Selbstlernaktivitäten darstellt 2. Diagnose-Tests: eine nutzerorientierte Bestimmung Als Diagnoseinstrument ist DIALANG nicht Selbstzweck; eigentliches Ziel ist es, über eine „Therapie~' eine Zustandsverbesserung einzuleiten. DIALANG wird dementsprechend in einem zweiten Entwicklungsabschnitt gezielte Hinweise für das Weiterlernen geben. lFLl! lL 30 (2001) 170 Gerhard von der Handt Die Kennzeichnung eines Tests als Diagnoseinstrument ergibt sich aus dem Zweck, dem er dienen soll. Im Hinblick auf den Nutzungsaspekt kann weiterhin unterschieden werden zwischen: • Einstufungstests, welche einen Lerner in eine definierte Lernabfolge einsortieren sollen, • Sprachstandstests, welche z.B. einen Kompetenzgrad (mit Bezug auf ein vereinbartes Referenzsystem) dokumentieren, sowie • Lernfortschritttests, die Auskunft darüber geben, ob oder in welchem Maße ein bestimmtes vorgegebenes Ziel erreicht wurde, wobei nicht wie bei Sprachstandstests notwendig ein Bezug auf ein Referenzsystem gegeben ist und das zu erreichende Ziel und der methodische Weg unabhängig voneinander sind. Die Systematik darf nicht zu dem Schluss führen, dass die Testformen völlig unterschiedlich sind. Es gelten zumindest teilweise dieselben Testformen und -kriterien, und erst der konkrete Einsatz lässt einen Test zu dem einen oder anderen werden. So ist nicht auszuschließen, dass bestimmte Sprachstandstests zu diagnostischen Zwecken eingesetzt werden können und ein Diagnostiktest Auskunft über den Sprachstand gibt. In der Praxis geschieht dies oft und manchmal durchaus erfolgreich. Allerdings kann man keine Regel daraus machen, und eine deutliche Trennung zwischen Sprachstands- und Diagnosefunktion besteht u.a. darin, dass im ersten Fall holistische Verfahren eingesetzt werden können (oder sollen), während im zweiten ein möglichst hoher Differenzierungsgrad als Voraussetzung für die detaillierte Lernplanung das Ziel ist. DIALANG stützt sich in den Kompetenzbeschreibungen und deren Stufung auf die Systematik des Europarats (s. die Beiträge von Günther Schneider und Michael Milanovic in diesem Band) und operationalisiert sie weiter als Handlungsanweisungen für die Testkonstrukteure. DIALANG umfasst bisher die traditionellen drei Teilfertigkeiten Hören, Lesen, Schreiben; zusätzlich gibt es Testbatterien zu Wortschatz und Grammatik. Es fehlt sowohl das monologische Sprechen als auch die mündliche Interaktion. Für das erstere war ein Benchmark-Ansatz vorgesehen, bei dem der Testand die von ihm produzierten Texte mit Modelltexten (Benchmarks) verglich, die für die Stufen des Europarats charakteristisch sind. Offensichtlich konnten die hierbei auftretenden Probleme noch nicht gelöst werden, denn ein entsprechender Teil fehlt in der demnächst vorgestellten DIA- LANG-Version. Die im Referenzrahmen definierte Fertigkeit mündliche Interaktion ist über ein automatisiertes online-Testverfahren z. Z. nicht realisierbar. Das DIALANG-System ist über Internet verfügbar, steht also allen Personen offen, die über einen PC, Internet-Anschluss und die nötigen Basiskenntnisse im Umgang mit beiden verfügen. Die Nutzung ist kostenfrei. Über einen einleitenden Vokabeltest und/ oder eine Selbsteinschätzung (noch sind nicht alle Komponenten in allen Sprachen verfügbar) wird der Kandidat grob hinsichtlich des Niveaus voreingeschätzt und erhält per Internet Aufgaben. Die Lösungen werden online übermittelt und ausgewertet. Abhängig von der gelungenen/ misslungenen Lösung werden die weiteren Aufgaben auf einem höheren oder niedrigeren Anspruchsniveau gestellt. Dies erfolgt, bis sich die Antworten auf einem Niveau stabilisieren oder eine bestimmte Anzahl von Aufgaben gelöst wurde. lFlLw. 30 (2001) DIALANGein diagnostisches Online-Testverfahren (Schwerpunkt Hörverstehen) 171 Der Kandidat erhält eine Rückmeldung zu folgenden Bereichen: Kompetenzstufe, Vergleichsresultat von Selbsteinschätzung und Test (einschließlich möglicher Gründe für eine Diskrepanz zwischen beiden), Überblick über die richtig und falsch gelösten Aufgaben (mit der Möglichkeit, sich jede Aufgabe noch einmal anzusehen). Weiterhin erhält er eine Beschreibung der Stufe, der er zugeordnet wurde, sowie die Beschreibung der anderen Stufen und schließlich konkrete Hinweise, wie er seine Hörverstehensfertigkeit weiter entwickeln kann. Der technische Rahmen bedingt eine Reihe von Beschränkungen, die für die Teilfertigkeit Hörverstehen validitätswirksam werden. Die Vorgaben für die Testkonstrukteure waren für das Hörverstehen: nur zwei Medien, was eine automatische Beschränkung auf Text und Ton bedeutete. Interessante Varianten mit visuellen Elementen waren vorerst nur als sog. Demonstrations- oder Experimental-ltems möglich. Der Tonteil sollte im allgemeinen zwischen 30 bis 60 sec. dauern. Wie wenig Zeit das ist, merkt man, wenn man möglichst „authentische" Tonaufnahmen mit den üblichen Pausen, Redundanzen, Rückfragen etc. anstrebt. Ein bestimmter Anteil von Aufgaben soll dem inferencing/ schließenden (Hör-)Verstehen gewidmet sein, was ebenfalls eine bestimmte Informationsmenge bzw. Textumfang voraussetzt. Eine weitere Einschränkung bestand im Aufgabentypus; im Grunde sind nur Mehrfachwahlaufgaben (multiple choice/ MC) möglich; eine Auswertung offener Antworten ist z. Z. und realistischerweise auch in naher Zukunft nicht gegeben. Für die rezeptiven Fertigkeiten stellt MC m. E. ein durchaus akzeptables und sogar empfehlenswertes Testformat dar, aus Gründen, die im weiteren Verlauf zur Sprache kommen. Diese Angaben sind als eine erste Einführung in ein komplexes System anzusehen. Folgende Internet-Adresse bietet eine umfassende Information über das Internet-System und zusätzlich einen Überblick über aktuelle Entwicklungen: http: / / www.dialang.org. Die Testentwicklung für Deutsch in der ersten Projektphase oblag einer Gruppe aus mehreren Universitäten (FU Berlin, Hohenheim, Münster und Linz/ Österreich) sowie dem Deutschen Institut für Erwachsenenbildung. Der Teil Hörverstehen wurde vom Autor dieses Beitrags sowie Beate Zeidler von der Weiterbildungstestsysteme gGmbH und im Rahmen eines Seminars des Aufbaustudiengangs DaF an der Universität Mainz zusammen mit den Studierenden entwickelt. 3. Die DIALANG-Vorgaben für die Testkonstruktion: vom Konstrukt zur Aufgabe Die DIALANG Assessment Specifications (DAS) differenzieren die Teilfertigkeit Hörverstehen in vielfältiger Weise. Im Folgenden werden die wichtigsten Kategorien mit einigen Beispielen benannt, d. h., die Aufzählungen sind nicht vollständig. Für unangemessene Übersetzungen des englischen Originals ist allein der Autor des vorliegenden Beitrags verantwortlich. Es sollen sowohl monologische als auch dialogische Hörszenarien zu Grunde gelegt werden. Beispiele für Diskursformen monologischen Sprechens sind: beschreibend lFLIIIL 30 (2001) 172 Gerhard von der Handt "descriptive"); "impressionistische/ technischeBeschreibungen''), erzählend (Geschichten, Witze, Anekdoten/ Berichte), darlegend (= "expository"; Definitionen/ Erklärungen/ „Abriss" = "outlines"/ Zusammenfassungen/ lnterpretationen) etc. Das Erkenntnisinteresse des (Zu-)Hörers kann in erster Linie bestehen im Suchen von Informationen, Erkennen von Haltungen, Erkennen von Versuchen der Einflussnahme "recognising persuasion"/ "persuading"). Der Hörer kann als Teilnehmer (im Rahmen eines Gesprächs), als Adressat, als Teil eines größeren Zuhörerkreises "audience member"), als Lauscher "overhearer") etc. in das Hörszenario eingebunden sein. Inhalte werden als Liste von Themen erfasst (u. a.: die eigene Person und das persönliche Umfeld, Essen und Trinken, Wirtschaft, Politik, Arbeitswelt). Die Informationen können aus dem Blickwinkel des Sprechers objektive Fakten darstellen oder subjektive Meinungen, Wünsche etc. Das Verstehensinteresse des Hörers kann sich auf eine Kerninformation beziehen oder auf besondere Einzelheiten. Manche Informationen lassen sich nicht unmittelbar dem Text entnehmen, sondern sind erst verfügbar, wenn man sie über eine Verbindung verschiedener Hinweise im Text erschließt "inferencing"). Alle diese Parameter sollten bei der Testkonstruktion möglichst gleichmäßig berücksichtigt werden, und zwar verteilt auf sechs Schwierigkeitsniveaus "estimated difficulty"), die den Kompetenzstufen des Europarats entsprechen. Die Multiplikation aller Faktoren ergibt eine astronomische Zahl, die den vorgesehenen Aufgabenpool bei weitem übersteigt. Es kommt letztlich darauf an, dass eine ausgewogene Verteilung/ Parameterkombination erreicht wird und der Testkonstrukteur keine unbewusste einseitige Auswahl trifft. Dies wird erreicht durch die Vorgaben für die Testkonstrukteure, die Evaluation von Hörtexten und Testaufgaben/ items, durch unabhängige Gutachter sowie über die Erprobung mit Gruppen, deren Kompetenzstand bekannt ist. Der folgende Abschnitt beschreibt Tendenzen, die sich trotz dieser qualitätssichernden Maßnahmen beim Abtesten der Teilfertigkeit Hörverstehen über ein internet-gestütztes, fremdauswertendes System ergeben. 4. Tendenzen bei der Entwicklung von online-gestützten Hörverstehens- Tests Die den DIALANG-Nutzern vorgelegten Aufgaben sindabgesehen von der Ausrichtung auf einen mutmaßlichen Kompetenzgrad hin (auf der Grundlage der Selbsteinschätzung und/ oder des vorgeschalteten Vokabeltests) nicht weiter in Bezug auf den Einzelnen sortiert. Eine solche Sortierung hätte z.B. im Hinblick auf die unter Abschnitt 3 genannten Aspekte erfolgen können. Jeder erhält also im Prinzip dieselben Aufgaben (in unterschiedlicher Auswahl) das DIALANG-Verfahren sieht noch nicht vor, Zielgruppen bestimmte Aufgaben zuzuordnen. DIALANG unterscheidet sich darin nicht von der überwiegenden Mehrzahl anderer Hörverstehenstests. Daraus ergeben sich einige "Effekte", die im Folgenden ausführlicher erörtert werden. Sowohl für Unterricht/ Lernen als auch für Tests werden „authentische" Texte eingefordert. Ein vereinfachtes Verständnis von „Authentizität" definiert sich über den TatlFJLll.llL30(2001) DIALANG ein diagnostisches Online-Testverfahren (Schwerpunkt Hörverstehen) 173 bestand, dass entsprechende Hörtexte aus „echten" Kommunikationszusammenhängen genommen wurden bzw. diese nicht aus didaktischen oder sonstigen Gründen manipuliert wurden. Wahlweise kann man auch Texte konstruieren und sich von einer Anzahl von Muttersprachlern bestätigen lassen, dass diese ihrem (unreflektierten) Eindruck nach "authentische" Texte seien (vgl. auch den Beitrag von Paschke in diesem Band). Angemessen sind solche Verfahren, wenn es sich um Texte aus alltäglichen Kommunikationsvorgängen ohne Adressatenspezifik handelt oder wenn die Bewertung von Muttersprachlern erfolgt, für die Texte gleichermaßen lebensweltspezifisch sind. Dass selbst "alltägliche" Texte, wie sie im Rahmen von Rundfunknachrichten verbreitet werden, eigentlich nicht selbstverständlich „authentisch" sind, zeigen die seit der Verbreitung kommerzieller Rundfunksender entstandenen vielfältigen Varianten, die der unterschiedlichen Ausrichtung eines Senders auf eine bestimmte Zielgruppe folgen. Die deutschen HV-Texte entstammen weitgehend Nachrichtensendungen „seriöser" Rundfunkanstalten, ergänzt durch Beispiele regionaler Sendungen. Letzteres erschließt eine größere thematische Vielfalt, da die überregionalen Nachrichtensendungen sich auf politische Großereignisse, Katastrophen etc. beschränken, während die Lokalnachrichten alltagsnaher sind. Allerdings ist mit der Nähe zu alltäglichen Abläufen ein Bezug zu lokalen Besonderheiten verbunden. Die Kenntnis des entsprechenden Hintergrunds ist oft entscheidend für das Verständnis ganz abgesehen davon, dass der ferne Hörer eigentlich kein Interesse an den jeweiligen Informationen hat, da kein Bezug zu seiner Lebenswelt besteht. Solche Hörtexte sind in Bezug auf den Hörer also kaum authentisch zu nennen. An diesem und anderen Beispielen zeigt sich, dass eine „Vollauthentizität" nie erreicht werden kann, da dies u.a. eine Differenzierung auf den Hörer hin erfordert. Aber auch die standardisierten Nachrichtentexte „für alle" weisen schon wegen der unvermeidlichen Zeitparallaxe ein „Authentizitäts-Defizit" auf. Zum Verstehen eines Nachrichtentextes greift der Hörer nicht nur auf ein allgemeines Weltwissen zurück, seine Verstehensaktivität ist eingebunden in eine Vielzahl kommunikativer Vorgänge (Zeitungslektüre auch in der Muttersprache, Gespräche mit anderen über das jeweilige Thema etc.). Wenn durch fehlende Aktualität diese Einbettung fehlt, verläuft der Verstehensprozess anders; u. a. wird der notwendige Anteil von schließendem Verstehen "inferencing") größer. Dementsprechend ist die Versuchung groß, Nachrichtentexte mit schnellem Aktualitätsverfall zu meiden und solche mit weniger zeitgebundenen Inhalten zu bevorzugen. Damit wird die für die meisten Testanden relevante Kategorie von Nachrichtensendung mit aktuellem Inhalt ausgeschlossen. Selbst wenn unter Verzicht auf die Aktualität die Vollform einer früheren Nachrichtensendung verwendet wird, ist eine Beschränkung auf die klassische Nachrichtensendung nicht zwangsläufig „rest-authentisch". Für eine große Zahl von Sendern stellt sie inzwischen ganz einfach nicht mehr die vorherrschende Form dar. Die Nachrichten in auf Sendung populärer Musik abgestellte Sender sind in Themenwahl und Sprache sehr unterschiedlich von den klassischen Formaten, die ihrerseits beeinflusst werden von den flapsigen Formen, die ursprünglich nur den Jugend- und Popsendern eigen waren. Die „neuen" Nachrichtensendungen sind „mündlicher" und entfernen sich vom Typus des schriftsprachlichen Textes, mit der Tendenz zu paratakti- FlLuL 30 (2001) 174 Gerhard von der Handt sehen Konstruktionen, Beschränkung auf wenige Kernaussagen etc. Sie müssten somit auch „einfacher" zu verstehen sein. Andererseits werden sie meist sehr viel schneller gesprochen und weisen keine Redundanz mehr auf, sind also gleichzeitig „schwieriger". Welches Schwierigkeitskriterium ist gewichtiger? Führen die Veränderungen dazu, dass die entsprechenden Nachrichtentexte in eine niedrigere Referenzstufe eingeordnet werden? Sicherlich hängt es auch von den Hörgewohnheiten (oder Informationsverarbeitungsgewohnheiten) in der Muttersprache ab, auf welchem Niveau eine solche Aufgabe einsortiert wird. Diese Hörerabhängigkeit hat zu der (nicht ganz ernst gemeinten) These Anlass gegeben, dass es eigentlich unmöglich ist, überhaupt Hörverstehen abzutesten. Wenn selbst in so selbstverständlichen Fällen wie den Nachrichten prinzipielle Schwierigkeiten zu verzeichnen sind, ist es kaum verwunderlich, wenn diese in anderen Hörszenarien noch viel gravierender sind. Das im folgenden beschriebene Hörszenario Wohngemeinschaft soll dies verdeutlichen. Wie schon erwähnt, wurde ein Teil der Aufgaben im Rahmen eines Seminars an der Universität Mainz erstellt. Die Studenten machten Vorschläge für Hörszenarien, die sie „selbstverständlich" aus ihrer Lebenswelt entnahmen die also für sie authentisch sind. Eine Kritik lautete prompt: zu speziell. Sortiert man alle diese „zu speziellen" Hörszenarien aus, die sich auf die Lebenswelt einzelner Gruppen beziehen, verbleibt ein Rest von kommunikativen Standardabläufen "Auf dem Postamt"). Diese können zwar für sich „authentisch" sein, der Ausschluss anderer Hörszenarien ergibt jedoch einen Aufgabenpool, der nur einen Teilbereich der sprachlichen Anforderungen umfasst. Mögen die Restbeispiele auch „authentisch" sein, so ist es der Pool in seiner Gesamtheit jedoch nicht. Dieser Effekt könnte auch auftreten, wenn zwar die Beschränkung auf Standardszenarien im Gesamtpool nicht gilt, die zufällige Auswahl für einen Testanden aber eben denselben Effekt zeitigt. Alternativ zum Weglassen lebensweltspezifischer Hörszenarien ist das Verfahren des „Plausibilisierens", indem man Hörszenarien jeglicher einen Einzelfall charakterisierenden Besonderheiten entkleidet. Die ausgeblendeten Besonderheiten mögen für jedes Ereignis unterschiedlich sein, sie gehören jedoch als solche zum Szenario. Eine Einbuße an Authentizität kann auch entstehen, wenn die Auswahl von Verständnisfragen zu den Hörtexten allein dadurch gesteuert wird, dass zu ihrer Beantwortung keine hohen Anforderungen an Weltwissen gefordert werden. Besonders problematisch ist die Kategorie der „Lauscher-Szenarien" "overhearer"), in denen um es überspitzt zu sagen der zufällige Zuhörer einen ihn eigentlich nicht interessierenden Dialog fremder Menschen über Inhalte, deren Hintergrund nicht bekannt sind und deren Verständnis in hohem Maße von einem gemeinsamen Hintergrundwissen abhängt, auf bestimmte Informationen absuchen soll. Natürlich kann man den Test auch hier wieder auf Informationen abstellen, die zweifelsfrei und unmittelbar (ohne „inferencing") aus dem Gehörten zu entnehmen sind. Dies brauchen keinesfalls die wichtigen oder den potentiellen Hörer interessierenden zu sein. Es ist im Gegenteil oft so, dass die Hauptinformationen/ Aussagen erst durch Hypothesen des Hörers zu dem vermuteten Hintergrund des Dialogs generiert werden. Das ist eine interessante Variante des schließenden Hörverstehens, die wegen ihrer Mehrdeutigkeit nicht über ein Programm ausgewertet werden kann. In den realen Lauscher-Szenarien fehlen dem Hörer nicht nur das lFJLl! lL 30 (2001) DIALANG ein diagnostisches Online-Testverfahren (Schwerpunkt Hörverstehen) 175 Hintergrundwissen zum Dialog (in erster Linie das „shared knowledge" der beiden Sprecher), zudem ist das Gehörte meist ein Ausschnitt eines längeren Gesprächszusammenhangs, welches mannigfaltigen Störungen und Unterbrechungen ausgesetzt ist. DIA- LANG beschränkt sich deshalb auf das schließende Verstehen innerhalb eines Textes. Die Problematik der Authentizität entsteht nicht nur durch den notwendigen Bezug auf die Lebenswelt von Hörergruppen. Der Verstehensvorgang ist grundsätzlich individuell und als solcher von den besonderen Informationsinteressen abhängig. Selbst wenn ein und derselbe Text im Rahmen der Hörgewohnheiten der Lerner als authentisch anzusehen ist, können aus ihm unterschiedliche Informationen entnommen werden, wobei alle "richtig" sind. Abgefragt wird meist eine „plausible" Auswahl, da die individuell unterschiedlichen Perspektiven nicht oder nur eingeschränkt (s. u.) eingenommen werden können. Die genannten Effekte verlaufen meist wenig bewusst im Rahmen der Testkonstruktion; sie sind insbesondere bei den unteren Niveaustufen wirksam. Sie sind nicht auf DIALANG beschränkt. Offensichtlicher sind hingegen folgende Reduktionen: • das fehlende visuelle Umfeld der Hörszenarien, die nur als akustische Information vermittelt werden (dies gilt nicht für bestimmte Kategorien, z.B. Radiosendungen; ein gewisser Ausgleich ist durch die Möglichkeit einer kurzen verbalen Situierung gegeben) • die einkanalige Wiedergabe von Hörereignissen; insbesondere, wenn sich mehrere Tonquellen überlagern, gewährleistet die stereofone Wiedergabe eine Vorsortierung im Raum und ermöglicht gezieltes Hören und Wegblenden von Überlagerungen aus anderen Richtungen • die Beschränkung auf das Hören monologischer Texte; interaktives Hören/ Sprechen ist hingegen nicht möglich das Vorhandensein von Dialogen als Hörtexte stellt keinen Ersatz für die interaktive Teilnahme im Rahmen eines Gesprächs dar 5. Besonderheiten der DIALANG-Aufgabenstellung Das DIALANG-Format erlaubt aus technischen Gründen in erster Linie Mehrfachwahl- Aufgaben/ multiple-choice. Die angegebenen Alternativen gap filling oder short answer sind entweder nur oberflächlich Optionen, da sie letztlich wiederum auf eine Auswahl von vorgegebenen Alternativen hinauslaufen, oder ihr Einsatz ist nur sehr eingeschränkt möglich. Bildliche Darstellungen (Fotos, Zeichnungen), sei es zur Visualisierung/ Situierung eines Hör-Szenarios, sei es als nichtsprachliche Aufgabenstellung, sind aus technischen Gründen nicht möglich. (Eine Reihe von Beispielen mit visuellen Elementen wurde als „experimental items" erstellt, diese sind jedoch nicht im eigentlichen Testkorpus enthalten). Gerade für die unterste Kompetenzstufe von DIALANG/ REFERENZRAHMEN sind nonverbale Alternativen unentbehrlich. Andererseits sind MC-Aufgaben nicht per se ungeeignet, insbesondere bei den rezeptiven Fertigkeiten. Voraussetzung ist allerdings, dass man die Distraktoren nicht nach dem Prinzip der größtmöglichen Gemeinheit (in Form JFLuL 30 (2001) 176 Gerhard von der Handt sehr attraktiver falscher Optionen wenn ein Distraktor z. B. fast identisch mit einer Hörpassage ist aber eben nur fast. Gemeinheit ist sicherlich kein Begriff aus der Testtheorie, aber manche Tests vermitteln eben diesen Eindruck) konstruiert. Vielmehr sollten die Mehrfachwahlaufgaben in erster Linie erwartbare Verstehenshypothesen darstellen. Da es sich um einen Diagnostik-Text handelt, hält der Autor auch die testtheoretische Ablehnung von nur zwei- oder drei Auswahlantworten wegen zu hoher Ratewahrscheinlichkeit für nicht begründet: wichtiger als das solchermaßen begründete Minimum von drei (falschen) Alternativaussagen zusätzlich zur richtigen ist die Angemessenheit der Anzahl vernünftiger Hypothesen. Für manche Aussagen ist nur die Richtig/ Falsch-Alternative angemessen, für andere drei oder mehr, und man sollte entsprechend auch Aufgaben mit unterschiedlicher Distraktorenzahl kombinieren. Hinzu kommt beim Hörverstehen, dass bei mehreren Aufgaben zu einem Hörtext nicht wie beim Leseverstehen die verschiedenen Alternativen noch einmal an Hand eines vorliegenden (schriftlichen) Textes im Detail gegengeprüft werden können. Dementsprechend findet man bei den (deutschen) DIALANG-HV-Aufgaben, wenn zu einem Text mehrere Items gestellt wurden, keine Vierfachalternativen. Wenn nur eine einzige Frage/ Aufgabe zu einem Text (die vorherrschende Form bei DIALANG) gestellt wurde, gelten die genannten Einwände nicht in demselben Maße und die Vierfachalternative wurde bevorzugt. 6. Praxisnahe Lösungen für konkurrierende Ansprüche Eine Vielzahl der erwähnten Schwierigkeiten teilt DIALANG mit anderen Testverfahren, die seit langer Zeit eingesetzt werden und die trotz aller Defizite akzeptierte Aussagen über die Hörverstehenskompetenz liefern. Die dort gefundenen Kompromisse finden sich bei den Testaufgaben von DIALANG wieder. So stellen zwar die meisten Dialoge im Prinzip „Lauscher-Szenarien" dar; im Falle von Alltagssituationen ist oft die Identifikation mit einer der Sprecherrollen möglich (z. B. als Kunde in einem Geschäft), ebenso ist der Handlungskontext bekannt. Auch die Unmöglichkeit, die individuellen Hörziele der einzelnen Testanden abzubilden, kann (wenigstens teilweise) dadurch kompensiert werden, dass der Testand die Aufgabenstellung vor dem Hören erfährt und auf diese Weise eine Fokussierung der Hörinteressen gewährleistet ist. Trotz solcher erfahrungsbewährter Verfahren bleiben bestimmte Aspekte ausgeschiossen. Der Ausgleich der unterschiedlichen Ansprüche (wie siez. B. in den Hinweisen für die DIALANG-Konstrukteure als parallele Listen ohne Verknüpfungshinweise vorgegeben sind) ist sehr komplex. Der Abgleich dieser unterschiedlichen Ansprüche liegt beim Testkonstrukteur und kann nur begrenzt durch feste Regeln oder Verfahrensvorschriften erfolgen. Vielmehr ist es die lange Erfahrung des Testkonstrukteurs und der intensive Diskurs mit anderen Testkonstrukteuren/ Gutachtern, welche bezogen auf die einzelne, konkrete Aufgabe zu einer „vernünftigen" Lösung führen. Dergestalt werden Extreme vermieden, aber vielleicht auch Traditionen begründet, die nicht immer sinnvoll sind. Sicherlich wird es Tendenzen geben; z. B. werden die Testautoren mehr oder minder lfllLIIL 30 (2001) DIALANG ein diagnostisches Online-Testverfahren (Schwerpunkt Hörverstehen) 177 bewusst Hörszenarien aus ihrer eigenen Lebenswelt bevorzugen. Solange die Identifikation mit der vorgegebenen Hörerrolle gegeben ist, müssen solche Tendenzen nicht unbedingt gravierend sein. Es wird interessant sein, bei der Auswertung und Erprobung der Aufgaben für alle DIALANG-Sprachen solche Tendenzen aufzuspüren. In jedem Falle beruht die Testkonstruktion von DIALANG im Bereich des Hörverstehens unabhängig von der Innovation des Online-Testens und der geschilderten Schwierigkeiten/ fendenzen auf bewährten Verfahren, so dass man davon ausgehen kann, dass das Ziel, eine individuelle Hörerleistung einer der sechs Kompetenzstufen .auf der Skala des Referenzrahmens zuzuweisen, erreicht wird. Es sei erwähnt, dass Zuordnungsprobleme zusätzlich durch die Niveaustufencharakterisierungen des Referenzrahmens Unsicherheiten entstehen (können); denn die Deskriptoren in Form von 'can-do-statements' sind in hohem Maße interpretationsfähig und -bedürftig (Beispiel: für die Stufe B 2: I can understand extended speech and lectures and follow even complex lines of argument provided the topic is reasonably familiar (http: / / culture.coe.fr/ lang/ eng/ eedu2. 4i.htm, Chapter 8: Scaling and Levels -A Common European Framework of Reference). Auch die Prinzipien der Gradierung werfen noch Fragen auf, die jedoch im Rahmen dieses Beitrags nicht diskutiert werden können (vgl. hierzu die detaillierte Darstellung im Beitrag von Günther Schneider in diesem Band). 7. Weiterentwicklungsmöglichkeiten der diagnostischen Funktion Für den Nachweis von Sprachkenntnissen erbringt die Stufeneinsortierung die gewünschte Leistung; für einen diagnostischen Test jedoch ist diese Rückmeldung allein nicht ausreichend. Über die Stufenzuordnung hinaus (und die Differenz zwischen Eigen- und Fremdeinschätzung) wäre eine detaillierte Auskunft über Teilbereiche der Hörverstehenskompetenz wünschenswert sowie Hinweise, warum etwas nicht verstanden wurde. Beides setzt eine ausformulierte Theorie des (Hör-)Verstehens voraus. Zumindest für die Differenzierung bieten die Vorgaben für die Testerstellung/ DAS eine Grundlage, da sie Operationalisierungen einer entsprechenden Theorie darstellen (inwieweit diese umfassend, wiederspruchsfrei etc. ist, soll in diesem Zusammenhang außen vor bleiben). Ob sich jede der Kategorien (s. Abschnitt 3: Vom Konstrukt zur Testaufgabe) gleichermaßen als Basis für Lernhinweise eignet, müsste sich noch in den weiteren Phasen des Projekts erweisen. Neben dem thematischen Bereich sind es sicherlich die Unterkategorien Verstehen der Kernbotschaft "main ideas/ information/ purpose" = Globalverstehen? ), Detailverstehen "listening intensively for specific detail"), (er)schließendes Verstehen "inferencing including lexical inferencing"). Während die beiden ersten Kategorien über das Hörerinteresse generiert wird, gehört das schließende Verstehen zu einem anderen Paradigma, welches verstehenspsychologische Prozesse oder Strategien aufschlüsselt. Eine (unvollständige) Auflistung umfasst: • Hypothesenbildung über kommende Informationen (oder zu bestimmten Bereichen) • schließendes Verstehen (bei unvollständiger und/ oder gestörter Information; bei FlLlUIL 30 (2001) 178 Gerhard von der Handt Fremdsprachen auch aus nicht verstandenen Textteilen; Einbettung einer Information in umfassendes Szenario) • Monitoring: Bewusstsein der Verläufe beim Verstehensprozess. DIALANG legt den Testkonstrukteuren nahe, für experimental items solche Strategien bei der Aufgabenstellung zu berücksichtigen und liefert hierzu eine differenzierte Liste (S. 21, 2.5 Specifications for demonstration tasks in listening/ DAS). Ein systematischer Einbezug dieser Dimension ist in der vorliegenden Fassung jedoch nicht vorgesehen, da mit dem augenblicklichen technischen Rahmen und über eine automatisierte Aufgabenauswertung Verstehensstrategien nicht unmittelbar erfassbar sind. Die z. Z. verwendeten Aufgaben weisen zwar das Verstehen oder Nichtverstehen für bestimmte Bereiche aus; sie lassen aber bestenfalls indirekt Rückschlüsse darauf zu, ob der Hörer bewusst oder unbewusst erfolgreiche Strategien einsetzt. Der DIALANG-Nutzer erhält im augenblicklichen System Aufgaben ausschließlich im Hinblick auf die Stufenfunktion zugeteilt. Es ist dem Zufall überlassen, um welches Thema oder eine sonstige Charakteristik es sich bei der zugewiesenen Aufgabe handelt. Eine Aussage, ob der Hörtext wegen des Themas oder auf Grund anderer Aspekte nicht verstanden wurde, ist z. Z. nicht möglich. Eine Querauswertung aller einer Person zugewiesenen Aufgaben im Hinblick auf Teilaspekte des Gesamtbereichs Hörverstehen würde bei der vergleichsweise geringen Zahl von Aufgaben und der Vielzahl der Aspekte nicht zuverlässig und systematisch eine Rückmeldung ermöglichen (Beispiel: in allen Aufgaben mit dem Thema Politik ist die Lösungsrate niedrig). Sie kann trotzdem als Ausgangspunkt für Erklärungen über das Warum der Verstehensleistung genutzt werden, dem man über weitere einschlägige Aufgaben nachgehen kann. Dabei wäre der thematische Aspekt weniger wichtig als die Verstehensstrategien; denn er ist in hohem Maße von den individuellen Interessen abhängig. Demzufolge ist es näherliegender, erst thematische Interessenbereiche abzufragen und dann entsprechende Aufgaben zuzuweisen. Die Möglichkeiten der Individualisierung des Diagnoseverfahrens wird im Vergleich des DIALANG- Verfahrens mit dem PORTFOLIO-Ansatz noch einmal aufgegriffen. Zuvor sei noch einmal auf das Problem der Vielfalt der Verknüpfungen der einzelnen Teilbereiche eingegangen und zwar am Beispiel Thema plus weitere Kategorien. Verstehensstrategien sind an Wissen geknüpft; denn ohne dieses ist die Entwicklung vernünftiger Hypothesen (als wesentliche Operation des Verstehens) nicht möglich. Versucht man dieses Wissen im Falle der DAS zum Bereich Themen näher zu bestimmen, dann sieht man sich der Schwierigkeit gegenüber, dass die Themen nur indirekt über ihre Kombination mit den anderen Kategorien genauer charakterisiert .sind, also z. B. über die Schwierigkeitsstufen. Es ist nicht eindeutig, ob das Themafood and drink im Sinne sprachlichen Handelns in Szenarien wie Einkauf oder Restaurantbesuch aufzufassen ist und/ oder ob es sich (auf einer höheren Stufe? ) um ein argumentatives Gespräch über dieses Thema handelt. Eine systematische Verbindung aller Elemente ist wegen der astronomischen Vielzahl möglicher Kombinationen ausgeschlossen. Eine Möglichkeit, die ungeheuere Zahl der Kombinationen in den Griff zu bekommen, ist der Ausweis von Kriterienbündeln, die in der Lebenswelt der Hörer eine wichtige lFJL1111L 30 (2001) DIALANG ein diagnostisches Online-Testverfahren (Schwerpunkt Hörverstehen) 179 Rolle spielen. So kann man zwar die thematische Kategorie Wetter mit allen möglichen anderen Kategorien verbinden (z. B. Diskursformen: beschreibend, erzählend, instruierend etc.), gleichermaßen mit der Rolle des Hörers (Dialogpartner, Zuhörer etc.); doch nicht alle dieser Verbindungen entsprechen realem sprachlichen Verhalten. Die Testkonstrukteure haben „vernünftigerweise" mehr oder minder bewusst Hörszenarien ausgesucht, die Standardverknüpfungen in der alltäglichen Kommunikation darstellen: einen Wetterbericht im Radio hören oder im Small Talk über das Wetter schimpfen und wahrscheinlich weniger (jedoch durchaus vorstellbar auf den höheren Niveaus) als wissenschaftliches Feature (z. B. als Radiobeitrag über klimatische Veränderungen). In solchen typischen (in unserem Falle Hör-)Szenarien ist auch der Lebensweltbezug der Hörer ein notwendiger Bestandteil, während er zwischen den parallelisierten Kategorienlisten leicht verloren geht. Es wäre notwendig, auch diese Ebene auszuweisen, um u. a. die Vergleichbarkeit der Tests in den einzelnen Sprachen schon auf der Ebene der Konstruktion zu fördern. Der Gemeinsame Europäische Referenzrahmen (auf den sich auch DIALANG bezieht) und das PORTFOLIO weisen in ihren Stufenbeschreibungen ähnliche Bündel/ Deskriptoren aus, allerdings nicht mit dem Detailreichtum der hier aufgeführten Beispiele. Sie enthalten dafür oft eine Angabe, dass sich der Deskriptor auf einen eingeschränkten Bereich bezieht (z.B. auf den bekannten/ persönlichen Bereich; eins der Gradierungsprinzipien ist die Weite des Geltungsbereichs, so dass die Deskriptoren der unteren Stufen oft durch diese Einschränkung charakterisiert sind). Dieser Individualisierungsansatz ist in dem Referenzrahmen/ PORTFOLIO (also z.B. für die Selbsteinschätzung) zwar nicht problemlos, aber im Prinzip durchführbar. Die Deskriptorenbündel und -auswahl sind in erster Linie der Stufenzuweisung verpflichtet, erst in zweiter Linie der diagnostischen Funktion. Die Diagnosefunktion kann z. T. nur über Extrapolation bzw. eine Art stufenübergreifendes inferencing erreicht werden, da nicht jedes Deskriptorenmerkmal von der untersten bis zur obersten Stufe repräsentiert ist eine bewusste Entscheidung der Autoren von Referenzrahmen/ PORTFOLIO, welche die Stufeneinordnung erst praktikabel macht, die Diagnosefunktion jedoch erschwert. DIALANG steht hier vor grundsätzlichen Schwierigkeiten; eine Individualisierung durch den Bezug auf die individuelle Lebenswelt des Lerners, wie es im Referenzrahmen/ PORTFOLIO geschieht, ist nicht möglich. Die augenblickliche Lösung (die im Sinne einer Individualisierung keine ist), besteht darin, die Hörszenarien soweit zu „entindividualisieren", dass sie für „jeden" angemessen sind. In dem Instrument „Deskriptor" steht ein Mittel zur Verfügung, mit dessen Hilfe auch in einem System wie DIALANG die Individualisierung - und damit ein entscheidender Gewinn an Lebensweltbezug und somit Validität erreicht werden kann. Der Individualisierung entspricht eine aktive Beteiligung an der Auswahl von zu testenden Aspekten durch den Einzelnen und erweitert das weitgehend fremdevaluative Verfahren von DIALANG um eine Selbststeuerungskomponente. Was könnte die Basis für das Auswahlsystem sein? Die im DAS (Vorgaben für den Testkonstrukteur) enthaltenen isolierten Kategorien können die Grundlage für ein Auswahlsystem abgeben. Sicherlich sind nicht alle gleichermaßen geeignet, denn einige der Kategorien dürften dem nicht durch eine (Sprach-, Lern-)Bewusstseinsbildung ausgezeichneten Lerner, für den DIALANG einen JFL111L 30 (2001) 180 Gerhard von der Handt ersten, möglichst niedrigschwelligen Zugang zum Wieder-/ Weiterlemen darstellt, erst einmal ratlos lassen: z. B. die einzelnen Verstehensstrategien. Andere hingegen (z. B. Themen, Domänen, bestimmte Anwendungsparameter) dürften für ihn unmittelbar verständlich sein, so dass er hier eine Auswahl treffen kann. Die gesamte Vielfalt von möglichen Kombinationen ist hierdurch eingeschränkt, aber noch immer zu groß. Die weiter oben geforderte Bündelung muss für den Testanden nicht weiter sichtbar auf der Aufgabenebene geleistet werden, was eine beträchtliche Erweiterung und Systematisierung des Aufgabenpools darstellt. Bestimmte Ebenen (wie die verschiedenen Verstehensstrategien) gehören nicht zu den wählbaren Kriterien, werden aber in den Aufgaben systematisch berücksichtigt und können in der Analyse ausgewiesen werden. Es ergibt sich ein differenziertes Diagnoseinstrument mit individualisierend-auswählenden Anteilen (Beispiel: Themen) und solchen individualisiert 0 auswertenden Charakters (z.B. Verstehensstrategien). Sicherlich wird man bei einer Systematisierung entsprechender Merkmalbündel für die Aufgabentypisierung und -auswahl zu anderen Ergebnissen kommen als sie im Falle von Referenzrahmen/ PORTFOLIO vorliegen; Der Arbeitsaufwand für die Weiterentwicklung dürfte erheblich sein und viele Praxiserprobungen einschließen. Zu vermuten ist, dass die Betonung der Diagnosefunktion zu Lasten der Eindeutigkeit der Stufenzuweisung geht; aber das wäre zu untersuchen. In jedem Fall würde eine entsprechende Weiterentwicklung es ermöglichen, (noch) stärker als bisher DIALANG und PORTFOLIO als sich ergänzende Teilsysteme aufzufassen und mit unterschiedlichen Funktionsschwerpunkten den Lerner gezielt zu unterstützen. Literatur • zu DIALANG: http: / / www.dialang.org/ • zu DIALANG und diagnostischen Tests (Symposium on Language Assessment - How to Design Adaptative and Diagnostic Assessment): http: ! ! www.languages .dkleurocall! eurocall99/ recordings/ symposium _ on_language _ assessment.htm • zu Tests im Internet (The Language Tester's Guide to Cyberspace): http: ! lwww.surrey.ac .uk! EU! ltr.html • Eine Praxis-Evaluation von Fremdsprachentests im Internet: LANGNER, Michael (2000): "Online-Tests, ausprobiert! - Was leisten Fremdsprachen-Tests im Internet? " In: Babylonia 1, 55-59. • Grundsätzliche Ausführungen zu adaptiven Tests: DUNKEL, P.A. (1999): "Considerations in developing or using second/ foreign language proficiency computer adaptive tests". In: Language technology 2(2), 77-93. http: / / www.polyglot.cal.msu.edu.ltt! • Die deutsche Fassung des Gemeinsamen Europäischen Referenzrahmens für Sprachen: Lernen, Lehren und Beurteilen: http: / / www.goethe.de/ z/ 50/ commeuro! iOO.htm • Englischer (französischer) Referenzrahmen des Europarates: http: / / culture.coefr! langleng! eedu2.4.html • Portfolio-Seite des Europarates: http: ! Iculture.coe fr! langl engleedu2 .5 .html • Schweizer Portfolio: http: llwww.unifr.ch/ ids! Portfoliol JFLuL 30 (2001)