Fremdsprachen Lehren und Lernen
flul
0932-6936
2941-0797
Narr Verlag Tübingen
Es handelt sich um einen Open-Access-Artikel, der unter den Bedingungen der Lizenz CC by 4.0 veröffentlicht wurde.http://creativecommons.org/licenses/by/4.0/121
2001
301
Gnutzmann Küster SchrammZur Einführung in den Themenschwerpunkt
121
2001
Rüdiger Grotjahn
flul3010003
Leistungsmessung und Leistungsevaluation Rüdiger Grotjahn Zur Einführung in den Themenschwerpunkt 1. Problemaufriss Während die Evaluation fremdsprachlicher Fähigkeiten und Fertigkeiten mit Hilfe formeller Verfahren z.B. in den USA zum schulischen und akademischen Alltag gehört, haben entsprechende Verfahren der Leistungsfeststellung in nicht wenigen Ländern Europas bisher einen eher geringen Stellenwert. So werden z.B. in Deutschland im schulischen oder auch im universitären Fremdsprachenunterricht bisher nur äußerst selten Evaluationsverfahren angewendet, die einen über den jeweiligen Lernkontext hinausgehenden Vergleich der fremdsprachlichen Kompetenz erlauben. Es werden vielmehr häufig auf der Basis wenig transparenter Kriterien -Noten vergeben, die je nach Lehrer, Lerngruppe, Schule oder auch Bundesland für ganz unterschiedliche fremdsprachliche Leistungen stehen können. Die Folge ist u.a., dass ein potenzieller Arbeitgeber kaum in der Lage ist, anhand der vorgelegten Zeugnisse zu einer halbwegs verlässlichen Einschätzung der fremdsprachlichen Fähigkeiten und Fertigkeiten des Bewerbers zu gelangen. Im Zuge des Zusammenwachsens von Europa und der größer werdenden beruflichen Mobilität wird jedoch eine transparente, den jeweiligen Lernkontext überschreitende Messung und Beurteilung fremdsprachlicher Leistungen immer wichtiger. Entsprechend bemüht sich insbesondere der Europarat seit vielen Jahren um mehr Transparenz und Vergleichbarkeit bei der Beurteilung und Zertifizierung fremdsprachlicher Kompetenz. Ende 1995 hat er erstmals einen Vorschlag für ein umfassendes Rahmenmodell für das Lernen, Lehren und Beurteilen von modernen Fremdsprachen im europäischen Kontext vorgelegt, das nunmehr in der endgültigen Fassung unter dem Titel "A Common European Framework of Reference for Languages: Leaming, teaching, assessment" in englischer, französischer und deutscher Sprache vorliegt (Council of Europe 2001; Conseil de l'Europe 2001; Europarat 2001). Der Referenzrahmen des Europarats beeinflusst mittlerweile zunehmend sowohl die theoretische Diskussion als auch die Entwicklung von Verfahren der Fremd- und Selbstevaluationsverfahren. Zudem wird immer häufiger die Forderung erhoben, dass fundierte Kenntnisse im Bereich der Evaluation fremdsprachlicher Leistungen zu den zentralen Qualifikationsmerkmalen eines jeden Fremdsprachenlehrers gehören sollten. 1 Die Bedeutung des Europäischen Referenzrahmens für Sprachen spiegelt sich auch im vorliegenden Themenheft wider. So beziehen sich mehrere Beiträger explizit auf die Begriffe wie Lehrer oder Lerner werden in diesem Beitrag nicht im geschlechtsspezifischen, sondern im generischen Sinne verwendet. lFLlllL 30 (2001) 4 Rüdiger Grotjahn Kompetenzskalen und das Modell kommunikativer Kompetenz des Europarats - und zwar sowohl im Hinblick auf den schulischen als auch den außerschulischen Kontext. Auch das vom Europarat initiierte und im Hinblick auf Mobilität, Vergleichbarkeit, lebenslanges (autonomes) Sprachenlernen und Selbstevaluation wichtige Europäische Sprachenportfolio wird in einem eigenen Beitrag thematisiert. Evaluationsverfahren müssen bestimmten Gütekriterien genügen u.a. der Objektivität, Reliabilität, Validität, Fairness, Nützlichkeit, Transparenz und Authentizität. Allerdings herrscht nur bedingt Einigkeit darüber, welche Kriterien im Einzelnen zugrunde zu legen sind und wie sie jeweils genau definiert werden sollten (vgl. die ausführliche Diskussion in Bachman/ Palmer 1996, Kunnan 2000, Grotjahn 2000, 2001 sowie Vollmer 2001). Angesichts der Bedeutsamkeit von Gütekriterien für die Qualität von Evaluationsverfahren nimmt die Kriteriendiskussion im vorliegenden Themenheft einen relativ breiten Raum ein. Die Evaluation mündlicher Kompetenz und des Hörverstehens sind weitere wichtige Themen. Das isolierte Überprüfen einzelner Fertigkeiten wird zwar zuweilen eher kritisch gesehen so z.B. aus der Sicht des "Task-Based Language Assessment" (vgl. z.B. Robinson/ Ross 1996 und Norris [et al.] 1998 sowie auch das Themenheft "Kombinierte Fertigkeiten", Fremdsprache Deutsch 24, 2001); nichtsdestoweniger eröffnet eine fertigkeitenspezifische Diagnostik wertvolle Möglichkeiten in Form eines für den Lerner oder auch andere Testbenutzer informativen Feedbacks. Insbesondere in Bezug auf den wichtigen Bereich der Evaluation mündlicher Kompetenz, vor allem auch im schulischen Kontext, gilt zudem, dass die Überprüfung mündlicher Fertigkeiten in der Regel eher impressionistisch und unter Missachtung der üblichen Gütekriterien erfolgt. Wie die vorliegenden Ausführungen zeigen, lassen sich auch hier qualitätsverbessernde Verfahrensregeln formulieren. In zwei Beiträgen geht es schließlich um das Thema "(adaptive)web-basierte Evaluation". Es wird deutlich, dass die web-basierte Evaluation u.a. im Hinblick auf die Selbstevaluation im Rahmen autonomen Lernens ein großes Potenzial aufweist trotz der technischen und konzeptuellen Beschränkungen, die die meisten vorliegenden Systeme aufweisen (vgl. hierzu auch Chapelle 2001). Weitgehend ausgespart bleiben im vorliegenden Themenheft u: a. die im hohen Maße mathematisierte Test- und Messtheorie sowie die statistische Test- und ltemanalyse. Über neuere Entwicklungen in diesem wichtigen Bereich informieren z.B. Embretson/ Hershberger (1999) und Masters/ Keeves (1999) sowie die Zeitschrift Language Testing. Bevor ich die einzelnen Beiträge kurz charakterisiere, soll noch ein zentraler Aspekt angesprochen werden, der bei der Evaluation fremdsprachlicher Fähigkeiten und Fertigkeiten zumeist unzureichend Berücksichtigung findet. Es wird immer deutlicher, dass es sich beim Fremdsprachenlernen um einen diskontinuierlichen Prozess handelt, der durch Rückschritte, Umstrukturierungen im Wissensstand, wechselnden Graden der Automatisierung von Fertigkeiten, Plateaubildungen (bestimmte Teilfertigkeiten entwickeln sich nicht weiter) und plötzliche steile Lernzuwächse gekennzeichnet ist. Das Resultat ist ein dynamisches System fremdsprachlicher Kompetenzen, das aus einer Menge unterschiedlich stabiler und unterschiedlich weit entwickelter Teilsysteme besteht. Nur eine kontinulr'LlllL 30 (2001) Zur Einführung in den Themenschwerpunkt 5 ierliche formative Evaluation des Lernfortschritts kann den diskontinuierlichen Prozess des Fremdsprachenlernens und die sich dynamisch entwickelnden fremdsprachlichen Kompetenzen hinreichend valide dokumentieren. Eine einmalige punktuelle summative Evaluation ergibt dagegen lediglich eine „Momentaufnahme", die die tatsächlichen Fähigkeiten und Fertigkeiten des Lerners - und vor allem auch dessen sprachliches Entwicklungspotential nur sehr bedingt widerspiegelt. Die Tatsache, dass eine einmalige punktuelle Evaluation nur eine eingeschränkt valide Momentaufnahme liefert, sollte beim Einsatz eines Evaluationsverfahrens niemals vergessen werden (vgl. auch Bleyhl 2000; Larsen-Freeman 1997; Perkins/ Brutten/ Gass 1996; Tarone 1998). 2. Die einzelnen Beiträge Im ersten Schwerpunkt geht es vor allem um die Frage der Gütekriterien und den Aspekt der Qualitätssicherung. Olaf Bärenfänger und Jan Stevener (Bielefeld) legen in Anlehnung an ausgewählte methodologische und testtheoretische Arbeiten einen aus 10 Hauptkriterien und einer Reihe Unterkriterien bestehenden Kriterienkatalog zur Evaluation (fremdsprachenerwerbsspezifischer) Datenerhebungs- und -auswertungsverfahren unter Einschluss von Tests und Prüfungen vor. Der Katalog ist gedacht als Grundlage für die Evaluation einzelner Verfahren sowie als Voraussetzung für die Vergleichbarkeit unterschiedlicher Datenerhebungsmethoden und soll, insgesamt gesehen, zu mehr Transparenz und Nachvollziehbarkeit sowie einer „größeren methodischen und theoretischen Reflektiertheit" führen. Die Autoren leisten damit nicht nur einen Beitrag zur Qualitätssicherung im Bereich der Evaluation fremdsprachlicher Fähigkeiten und Fertigkeiten, sondern tragen auch zur allgemeinen Diskussion um methodologische Standards in der empirischen Fremdsprachenforschung bei. Das Problem der Qualitätssicherung ist ebenfalls ein wichtiger Aspekt im Beitrag von Michael Milanovic (Cambridge). Der Autor beschreibt die Struktur und Funktion der "Association ofLanguage Testers in Europe" (ALTE)-ein wichtiger Zusammenschluss europäischer Sprachtestorganisationen, die Tests für die jeweilige Landes- oder Regionalsprache als Fremdsprache produzieren. Dabei geht Milanovic u.a. auf die grundlegenden Arbeiten von ALTE in Richtung auf ein theoretisch und empirisch fundiertes Rahmenmodell zur Charakterisierung von Fremdsprachenprüfungen und fremdsprachlichen Leistungen ein. Im Zentrum steht das ALTE "Can-Do-Projekt" zur Entwicklung von benutzerorientierten Skalen zur multilingualen Beschreibung fremdsprachlicher Leistungen in den Domänen privates und öffentliches Leben, Arbeits- und Berufswelt und Bildungsbereich sowie die Einordnung der Can-Do-Aussagen auf der fünfstufigen ALTE-Skala fremdsprachlicher Leistungen bzw. der sechsstufigen Skala des „Gemeinsamen Europäischen Referenzrahmens für Sprachen". Weiterhin thematisiert der Autor kurz das von ALTE gemeinsam mit der "European Association for Quality Language Services" für das Europäische Jahr der Sprachen entwickelte Sprachenportfolio. Wolf-Dieter Krause und Uta Sändig (Potsdam) beschreiben die Konzeption und Ergebnisse eines im Jahre 2000 abgeschlossenen LINGUA-Projekts zur "Evaluation of Communicative Competence in European Language Learning Encompassing New Testing Technologies" (ECCELLENTT). Übergeordnetes Ziel des von Institutionen aus lFLuL 30 (2001) 6 Rüdiger Grotjahn sechs EU Ländern getragenen Projekts war es, ausgehend vom Problem der Bewertung kommunikativer Kompetenz im Fremdsprachenunterricht, einen Beitrag für eine abgestimmte und stringente schulbezogene Fremdsprachenpolitik im europäischen Kontext zu leisten. Damit bezieht sich das ECCELLENTT-Projekt explizit auf den schulischen Kontext. Die Umsetzung des Ziels erfolgte zum einen über spezielle LINGUA-B-Fortbildungskurse für Fremdsprachenlehrer zu Problemen des Bewertens und Testens und zum anderen in Form von theoretischer Grundlagenarbeit und Entwicklung praktischer Testmaterialien. Im Rahmen der theoretischen Grundlagenarbeit wurden u.a. Qualitätsmerkmale für Tests zur Ermittlung kommunikativer Kompetenz weiter spezifiziert und umfangreiche Typologien von Aufgaben zur Überprüfung produktiver und rezeptiver fremdsprachlicher Fertigkeiten entwickelt. Der Beitrag von Werner Kieweg (München) bezieht sich ebenfalls auf den schulischen Kontext. Der Autor diskutiert zunächst u.a. die Funktion der Leistungsmessung und Leistungsbeurteilung im Rahmen der „Lebensqualitätschancenverteilungsinstitution Schule" und weist auf die Bedeutung einer regelmäßigen Rückmeldung über Lehr- und Lernerfolge für die Lehrenden und Lernenden hin. Zugleich kritisiert er, dass die Leistungsmessung und -beurteilung in der Lehrerausbildung weitgehend unberücksichtigt bleibt. Anschließend werden auf der Basis des „Gemeinsamen Europäischen Referenzrahmens für Sprachen" unterschiedliche Dimensionen sprachlicher Kompetenz unter Einschluss der soziokulturellen Dimension unterschieden und eine Vielzahl möglicher Prüfungsverfahren skizziert. Relativ ausführlich geht der Autor auch auf Alternativen zur traditionellen schulischen Notengewinnung ein. Abschließend werden als Diskussionsbeitrag zur Qualitätsverbesserung der Leistungsmessung und -beurteilung im schulischen Kontext zehn Prinzipien zur Erstellung von Lernzielkontrollen vorgestellt. Auch im Beitrag von Kieweg ist damit die Frage der Qualitätssicherung ein zentraler Aspekt. Im zweiten Schwerpunkt dieses Themenheftes geht es um die Überprüfung mündlicher Kompetenz. In den beiden Beiträgen von Erwin Tschirner (Leipzig) steht das "Oral Proficiency Interview" (OPI) des "American Council on the Teaching of Foreign Languages" (ACTFL) im Vordergrund. Beim ACTFL OPI handelt es sich um ein in den USA zentrales Verfahren zur Evaluation mündlicher Handlungskompetenz, das in Deutschland bisher nur wenig Beachtung gefunden hat. Im ersten Teil des ersten Beitrags diskutiert Tschirner selbst zertifizierter ACTFL Prüfer und Prüferausbilder die Evaluation mündlicher Handlungskompetenz im Hinblick auf die bei Bachman/ Palmer (1996) dargelegten Gütebzw. Nützlichkeitskriterien und deren Modell der kommunikativen Kompetenz. Im zweiten Teil des Beitrags werden die theoretische und empirische Basis des ACTFL OPI und der ACTFL Skalen sowie die OPI-Prüfungsstruktur detailliert beschrieben. Hervorgehoben wird u.a. die empirische Fundierung der ACTFL Skalen, die Adaptivität des OPI (im Sinne einer Ausrichtung am thematischen Wissen und Sprachstand des Lerners) sowie die hohe Reliabilität des Verfahrens u.a. als Folge einer äußerst aufwändigen Interviewer- und Bewerterschulung. Vor diesem Hintergrund geht der Autor kritisch auf das Zertifikat Deutsch, den SPEAK Test des T0EFL sowie die Zentrale Mittelstufenprüfung und Zentrale Oberstufenprüfung des Goethe-Instituts ein. Beim zweiten Beitrag von Tschirner handelt es sich um eine zusammen mit Annett lFlLlUIL 30 (2001) Zur Einführung in den Themenschwerpunkt 7 Zupke angefertigte autorisierte deutsche Übersetzung der 1999 revidierten "Oral Proficiency Guidelines" des ACTFL. Eingeleitet wird die Übersetzung mit einer kurzen Einführung in das OPI und die "ACTFL Guidelines". Gabriele Kniffka (Köln) und Dörthe Üstünsöz-Beurer (Tübingen) beschreiben die Entwicklung des Testteils „Mündlicher Ausdruck" des neuen „Test Deutsch als Fremdsprache" (TestDaF) der deutschen Entsprechung zum IELTS und TOEFL. Im Gegensatz zuni ACTFL OPI wird beim TestDaF ein kassettengesteuertes Format verwendet, das sich an das "Simwated Oral Proficiency Interview" (SOPI) und hier speziell am "German Speaking Test'-' (GST) des "Center for Applied Linguistics" in Washington anlehnt. Im ersten Teil beschreiben die Autorinnen beide ehemalige Mitglieder des TestDaF-Entwicklungsteams .,... die Gründe für die Wahl eines kassettengesteuerten Formats und Unterschiede '.zwischen dem kassettengesteuerten Format desTestDaF und dem SOPI/ GST. Im zweiten Teil wird der Testteil „Mündlicher Ausdruck" anhand der Testgütekriterien „Objektivität, Reliabilität, Validität und Akzeptanz" beurteilt, und es werden Daten zuSchwierigkeit und Akzeptanz präsentiert. Hervorzuheben ist u.a., dass die Befragung der Testteilnehmer entgegen den Befürchtungen von Kritikern für eine relativ hohe Akzeptanz des kassettengesteuerten Formats· spricht. Im letzten Teil des Beitrags präsentieren die Autorinnen Ergebnisse aus den Analysen der Sprechzeiten der Teilnehmer und insbesondere der Adäquatheit der Zeitvorgaben. Im dritten Schwerpunkt geht es um die Überprüfung des Hörverstehens: Peter Paschke (Venedig) setzt sich vor allem mit dem Problem der Authentizität und Validität von L2-Hörverstehenstests auseinander und versucht nach einer kurzen Skizze der kognitiven Grundlagen des Hörverstehens Antworten u.a. auf folgende Fragen zu geben: Inwieweit sind subjektive Verstehensprozesse überhaupt objektiv. messbar? Inwieweit müssen Hörtexte authentisch sein und welche Hörerrollen gilt es im Test zu berücksichtigen? Kann auf eine Visualisierung der Hörsituation verzichtet werden? Sollten Hörtexte mehrfach präsentiert werden? Welche Aufgabenformate beinhalten realistische Hörverstehensanforderungen? Der Autor kommt u.a. zu dem Schluss, dass Verstehensprobleme vor allem durch Wissens- und Fertigkeitendefizite in der Fremdsprache bedingt sind und dass zudem in vielen Fällen eine Überlastung des Arbeitsgedächtnisses eine wichtige Rolle spielt. Fazit des Aufsatzes ist, dass Hörverstehenstests in wesentlichen Merknialen Situationen authentischer Sprachverwendung vergleichbar sein müssen. Der Autor räumt jedoch zugleich ein, dass sich gegenwärtig kaum mehr als plausible Hypothesen hinsieht~ lieh der Vergleichsmerkniale formulieren lassen. Gerd von der Handt (Frankfurt) beschäftigt sich ebenfalls mit der Überprüfung des Hörverstehens, allerdings aus der Perspektive des DIALANG~Systems. DIALANG steht für "Diagnostic Language Testing" und ist ein web-basiertes, adaptives on-line Diagnose- System für 14 europäische Sprachen. Damit ist der Beitrag zugleich Teil des vierten Schwerpunkts, der im Bereich des web-basierten Testens liegt. Im DIALANG-System werden dem Lerner nach einer Selbsteinstufung und/ oder einem vorgeschalteten Vokabeltest in Abhängigkeit von der jeweils vorangehenden Leistung Aufgaben mit einem geringeren oder höheren Schwierigkeitsgrad gestellt. Ist eine zufriedenstellende diagnostische Sicherheit erreicht, gibt das System eine Rücknieldung zum Leistungsstand FLuL 30 (2001) 8 Rüdiger Grotjahn anhand der Stufen des „Gemeinsamen Europäischen Referenzrahmes für Sprachen" und im Hinblick auf die Selbsteinstufung. Der Autor skizziert u.a. eine Reihe von aktuellen technischen Einschränkungen, wie z.B. die fehlende visuelle Einbettung der Hörszenarien, die einkanalige Wiedergabe von Hörereignissen, die Beschränkung auf monologische Texte und auf Aufgaben vorwiegend im Multiple-Choice-Format und schließt mit Hinweisen bezüglich einer stärkeren Individualisierung der Testinhalte. Carsten Röver (Honolulu) gibt einen Überblick über die Möglichkeiten web-basierten Testens. Als Vorteile nennt er neben der räumlichen und zeitlichen Ungebundenheit des Internets als Testmedium u.a. die Möglichkeit, kürzere und präzisere Tests zu konstruieren, die Antworten automatisch auszuwerten, die Ergebnisse den Teilnehmern sofort rückzumelden und einfache web-basierte Tests mit vergleichsweise wenig technischem Wissen und Aufwand zu realisieren. Das größte Potenzial web-basierten Testens sieht er im unterrichtsbegleitenden Prüfen und Üben mit dem Ziel, den Lernern Rückmeldung über den Lernfortschritt zu geben und selbstständiges Arbeiten zu ermöglichen. Als weiteren Einsatzbereich nennt er die Bearbeitung gleicher Aufgaben durch geographisch weit verstreute Lerngruppen z.B. in Fernlernkursen. Als Probleme führt er u.a. mangelnde Computer-Erfahrung der Probanden und eine im Vergleich zu Papier-und-Bleistift- Tests höhere Störanfälligkeit an. Es folgen Hinweise zu Inhalt und Implementierung (JavaScript) eines relativ komplexen web-basierten "Test of interlanguage pragmatic knowledge"; Abschließend demonstriert der Autor, dass mit Hilfe von HTML einfache web-basierte Aufgaben auch ohne tiefergehende Programmierkenntnisse vergleichsweise leicht zu realisieren sind. Das Europäische Sprachenportfolio ist das zentrale Thema des abschließenden Beitrags von Günther Schneider (Freiburg/ Schweiz). Im ersten Teil beschreibt der Autor ausführlich die unterschiedlichen Ziele und Funktionen des Portfolios (Dokumentations- und Vorzeigefunktion, pädagogisch-didaktische Funktion; Selbstbeurteilung vs. Fremdbeurteilung), die drei Teile des Portfolios (Sprachenpass, Sprachbiographie, Dossier) und den Stellenwert der auf dem „Gemeinsamen Europäischen Referenzrahmen für Sprachen" beruhenden Kompetenzbeschreibungen. Insbesondere geht er darauf ein, welche Anforderungen multilinguale Kompetenzbeschreibungen im Hinblick auf unterschiedliche Funktionen und Adressaten erfüllen müssen. Anschließend werden detailliert unterschiedliche Typen und Entwicklungsmethoden von Sprachkompetenzskalen beschrieben, wobei der Autor auf seine eigene theoretische und empirische Arbeit aus einem grundlegenden Schweizer Forschungsprojekt zurückgreifen kann. Der Leser findet hier u.a. eine Fülle von praktischen Hinweisen für die Entwicklung von Kompetenzskalen und Sprachenportfolios. 3. Weitere Informationsquellen In einer Reihe von Fällen wird der Leser sicherlich auf Begriffe und Inhalte stoßen, zu denen er sich (weitere) Informationen verschaffen möchte. Es sind deshalb im Folgenden einige Informationsquellen aufgeführt - und zwar vor allem solche, auf die man über das Internet Zugriff hat. Eine grundlegende Quelle ist das bereits erwähnte "Common European Framework of lFLllllL 30 (2001) Zur Einführung in den Themenschwerpunkt 9 Reference for Languages" (Council of Europe 2001), dessen deutsche Version abrufbar ist unter http: / / www.goethe.de/ z/ 50/ commeuro/ . Ein Vielzahl von allerdings sehr knappen terminologischen Hinweisen in insgesamt 10 Sprachen (unter Einschluss von Deutsch) enthält das "Multilingual Glossary ofLanguage Testing Terms" (Association ofLanguage Testers in Europe (ALTE) 1998), das auch als CD erhältlich ist. Ausführlichere, allerdings ausschließlich englischsprachige Einträge finden sich im "Dictionary of Language Testing" von Davies [et al.] (1999). Grundlegend, wenn auch nicht fremdsprachenbezogen, sind die "Standards for Educational and Psychological Testing" (American Educational Research Association [et al.] 1999). Als deutschsprachige Internet-Quelle ist u.a. das Internet-Lexikon der Methoden der empirischen Sozialforschung (ILMES) zu nennen (http: / / www.lrz-muenchen.de/ ~wlm/ ilmes.htm). Dieses enthält gut lesbare Einträge zu einer Vielzahl von forschungsmethodischen und statistischen Begriffen sowie eine Reihe von Links zu weiteren Informationsquellen. Eine wahre Fundgrube im Bereich des Sprachtestens mit einer Vielzahl von Links ist die "Resources in Language Testing Page" (http: / / www.surrey.ac.uk/ ELI/ ltr.html) von Glenn Fulcher. Dort findet sich u.a. eine Video-FAQ-Seite zu einer Reihe von Sprachtestthemen sowie Links z.B. zur International Language Testing Association (ILTA) und deren Internet-Diskussionsliste LTEST-L. Hingewiesen sei auch auf die trotz ihrer internationalen Bedeutung in Deutschland bisher relativ selten rezipierte Zeitschrift Language Testing das offizielle Publikationsorgan der ILTAsowie auf das Language Testing Update (LTU) der offizielle Newsletter der ILTA. Die Beiträge in Language Testing sind allerdings für den Nichtspezialisten zuweilen nur bedingt verständlich. Eine kommentierte deutschsprachige Bibliographie von Buchpublikationen zum Testen und Prüfen findet sich auf der Web-Seite des Goethe-Instituts Inter Nationes unter http: / / www.goethe.de/ z/ 82/ acwww25/ katalop/ deindex.htm. Diese ist auch als Print~ Version publiziert (Quetz 2000). Eine umfangreiche nicht-kommentierte Bibliographie ausschließlich englischsprachiger Publikationen zum Sprachtesten (unter Einschluss von Aufsätzen) haben Banerjee/ Clapharn/ Clapham/ Wall (1999) zusammengestellt. Ein nützliches kommentiertes Verzeichnis wichtiger Sprachtestliteratur enthält McNarnara (2000). Kommentierte Hinweise in deutscher Sprache zu Internet-Adressen, Zeitschriften und Büchern zum Thema „Sprachtesten" finden sich in der Zeitschrift Babylonia Nr. 1/ 2000, S. 67ff. Die Web-Seite der Association of Language Testers in Europe (ALTE) (http: / / www. alte.org) bietet Informationen zu einer Vielzahl europäischer Sprachprüfungen sowie u.a. eine Beschreibung der ALTE-Niveaustufen, des "ALTE Code of Practice" und ein kurzes englischsprachiges Glossar. Einen Überblick über deutsche Sprachprüfungen (DaF) gibt das Heft 2/ 97 der Zeitschrift Begegnung, das auch unterhttp: / / www.auslandsschulwesen.de/ zfa/ begegnung/ 97- 2.htm abrufbar ist. Speziell über die europäischen Sprachenzertifikate im Bereich Deutsch als Fremdsprache (Grundbaustein Deutsch; Zertifikat Deutsch für den Beruf; Zertifikat Deutsch) informiert: http: / / www.sprachenzertifikate.de/ tests/ Deutsch/ . Weitere lFLllL 30 (2001) 10 Rüdiger Grotjahn Informationen zu Sprachprüfungen im Bereich DaF mit Links zu diversen Informationsquellen findet man u.a. unter: http: / / www.goethe.de/ z/ pruef/ depangeb.htm (Goethe-Institut Inter Nationes), http: / / www.osd.at (Österreichisches Sprachdiplom) und http: / / www.rz.uni-frankfurt.de/ die/ wbt/ (WBT Weiterbildungs-Testsysteme). Ausführliche Informationen zum Test Deutsch als Fremdsprache unter Einschluss eines herunterladbaren Modell-Testsatzes bietet http: / / www.testdaf.de. Kommentierte Hinweise speziell zu Online-Sprachtests im Internet mit Links zu diversen Institutionen geben u: a. Langner (2000), Fulcher (2000) sowie von der Handt (in diesem Heft). Über das Europäische Sprachenportfolio des Europarats informiert http: / / culture2.coe. int/ portfolio/ . Hinweise zur nordrhein-westfälischen und zur Schweizer Version des Europäischen Sprachenportfolios mit zahlreichen weiteren Links geben http: / / www.learnline.nrw.de/ angebote/ portfolio/ index.html und http: / / www. unifr.ch/ ids/ portfolio (vgl. auch den Beitrag von Schneider in diesem Heft) Eine Beschreibung des Projekts „Profile Deutsch" (Ausarbeitung von Wortschatzlisten, Kann-Beschreibungen und grammatischen Beschreibungen für die Niveaus Al bis B2 des Europarats~ vormaliger Arbeitstitel ENDaF oder NDaF) findet sich unter http: / / www.goethe.de/ z/ 52/ profile.htm/ . Das "American Council on the Teaching of Foreign Languages" (ACTFL) (h! ! P; LL www.actfl.org/ ) gibt unter der Rubrik "Proficiency Testing" u.a. Hinweise zum ACTFL OPI und zur Tester-Zertifizierung. Dort ist auch eine herunterladbare Fassung der "ACTFL Proficiency Guidelines - Speaking (Revised 1999)" verfügbar. Das Heft 5(2), 2001 der Zeitschrift Language Testing & Technology ist dem Thema "Computer-Assisted Language Testing" (unter Einschluss von web-basiertem Testen) gewidmet; es ist abrufbar unter: http: / / llt.msu.edu/ . Das "Educational Testing Service" (ETS, Princeton) gibt unter http: / / www.ets.org u.a. Hinweise zu den "ETS Standards for Quality and Fairness" und zu einer Reihe bekannter Tests (u.a. TOEFL, TOEIC). Weitere Informationen und Links bietet auch das ''ERIC Clearinghouse on Assessment and Evaluation" unter http: / / ericae.net/ und das "Center for Applied Linguistics" (CAL), in Washington, DC, und dort speziell der Bereich "Language Testing": http: / / www.cal. org/ pubs/ tests p.html. Hier findet sich u.a. auch ein Hinweis auf die "Foreign Language Test Database" des CALeine on-line-Datenbank mit Informationen über Tests in mehr als 70 Sprachen (http: / / www.cal.org/ nclrc/ fltestdb/ ). Informationen speziell zum C-Test unter Einschluss einer umfangreichen C-Test- Bibliographie und eines kurzen Glossars testtheoretischer Begriffebietet http: / / www.ctest.de. Wichtige allgemeine Hinweise und Links zum Testen finden sich auch auf der Web- Seite der "American Psychological Association" (APA) (http: / / www.apa.org/ science/ testing.htrnl). lFLIIL 30 (2001) Zur Einführung in den Themenschwerpunkt 11 Literatur AMERICAN EDUCATIONAL RESEARCH ASSOCIATION/ AMERICAN PSYCHOLOGICAL ASSOCIATION/ NA- TIONAL COUNCIL ON MEASUREMENT IN EDUCATION ( 1999): Standards f or educational and psychological testing. Washington, DC: American Educational Research Association. ASSOCIATION OF LANGUAGE TESTERS IN EUROPE (ALTE) (1998): Multilingual glossary of language testing terms. Cambridge: Cambridge University Press. BACHMAN, Lyle F. / PALMER, Adrian S. (1996): Language testing in practice: Designing and developing useful language tests. Oxford: Oxford University Press. BANERJEE, Jay / CLAPHAM, Caroline / CLAPHAM, Phoebe / WALL, Dianne (1999): ! LTA language testing bibliography 1990-1999. Lancaster University, UK: Department of Linguistics and Modem English Language. (= Language Testing Update- Special Volume). BLEYHL, Werner (2000): "Sprachenlemen, ein konstruktiver, nichtlinearer Selbstorganisationsprozess oder: Die Fehler des Fremdsprachenunterrichts und wie sie zu beheben sind". In: Fremdsprachen Lehren und Lernen 29, 71-90. CHAPELLE, Carol A. (2001): Computer applications in second language acquisition: Foundations for teaching, testing, and research. Cambridge: Cambridge University Press. CONSEIL DE L'EUROPE (2001): Un Cadre europeen commun de refärence pour les langues : apprendre, enseigner, evaluer. Paris: Didier. COUNCIL OF EUROPE (2001): A Common European Framework of Reference for Languages: Learning, teaching, assessment. Cambridge: Cambridge University Press. DAVIES, Alan/ BROWN, Annie/ ELDER, Cathie/ HILL, Kathryn/ LUMLEY, Tom/ MCNAMARA, Tim F. (1999): Dictionary of language testing. Cambridge: Cambridge University Press. EMBRETSON, Susan E./ HERSHBERGER, Scott L. (eds.) (1999): The new rules ofmeasurement: What every psychologist and educator should know. Mahwah, NJ: Erlbaum. EUROPARAT (2001): Gemeinsamer europäischer Referenzrahmen für Sprachen: Lernen, lehren und beurteilen. Berlin: Langenscheidt FuLCHER, Glenn (2000): "Tests online". In: The language tester' s guide to cyberspace. http: / / www. surrey.ac.uk/ ELI/ ltr.html. GROTJAHN, Rüdiger (2000): "Testtheorie: Grundzüge und Anwendungen in der Praxis". In: WOLFF, Armin / TANZER, Harald (Hrsg.): Sprache -Kultur-Politik: Beiträge der 27. Jahrestagung Deutsch als Fremdsprache vom 3.-5. Juni 1999 an der Universität Regensburg. Regensburg: Fachverband Deutsch als Fremdsprache, 304-341. GROTJAHN, Rüdiger (2001): Studieneinheit Leistungsmessung und Leistungsbeurteilung: Band A: Einführung, Glossar, Grundlagen. Patras: Hellenic Open University, Postgraduiertenstudium Deutsch als Fremdsprache. KUNNAN, Antony J. (ed.) (2000): Fairness and validation in language assessment: Selected papers from the 19th Language Testing Research Colloquium, Orlando, Florida. Cambridge: Cambridge University Press. LANGNER, Michael (2000). "Online Tests, ausprobiert! Was leisten Fremdsprachen-Tests im Internet? " In: Babylonia 1, 55-59. LARSEN-FREEMAN, Diane (1997): "Chaos/ complexity science and second language acquisition". In: Applied Linguistics 18, 141-165. MASTERS, Geofferey N. / KEEVES, John P. (eds.) (1999): Advances in measurement in educational research and assessment. Amsterdam: Elsevier Science. MCNAMARA, Tim F. (2000): Language testing. Oxford: Oxford University Press. NORRIS, John M. / BROWN, James D. / HUDSON, Thom / YOSHIOKA, Jim (1998): Designing second language performance assessments (Technical Report #18). University of Hawai'i: Second Language IFLIIL 30 (2001) 12 Rüdiger Grotjahn Teaching & Curriculum Center. PERKINS, Kyle / BRUITEN, Sheila R. / GASS, Susan M. (1996): "An investigation of pattems of discontinuous leaming: Implications for ESL measurement". In: Language Testing 13, 63-82. QUETZ, Jürgen (2000): "Kommentierte Bibliographie Deutsch als Fremdsprache. Teilgebiet: Testen und Prüfen". In: BOLTON, Sibylle (Hrsg.): TESTDAF: Grundlagen für die Entwicklung eines neuen Sprachtests. Beiträge aus einem Expertenseminar. Köln: VUB Gilde, 165-192. ROBINSON, Peter/ Ross, Steven (1996): "The development of task-based assessment in English for academic purposes programmes". In: Applied Linguistics 17.4, 455--476. TARONE, Elaine (1998): "Research on interlanguage variation: Implications for language testing". In: BACHMAN, Lyle F. / COHEN, Andrew D. (eds.): Interfaces between second language acquisition and language testing research. Cambridge: Cambridge University Press, 71-89. VOLLMER, Helmut J. (2001): "Leistungsmessung, Lernerfolgskontrolle, Selbstbeurteilung: Überblick". In: BAUSCH, Karl-Richard/ CHRIST, Herbert/ KRUMM, Hans-Jürgen (Hrsg.): Handbuch Fremdsprachenunterricht. 4. überarb. und erw. Aufl .. Tübingen: Narr [im Druck]. lFLIIL 30 (2001)