Fremdsprachen Lehren und Lernen
flul
0932-6936
2941-0797
Narr Verlag Tübingen
10.2357/FLuL-2020-0007
Es handelt sich um einen Open-Access-Artikel, der unter den Bedingungen der Lizenz CC by 4.0 veröffentlicht wurde.http://creativecommons.org/licenses/by/4.0/61
2020
491
Gnutzmann Küster SchrammSchreibkompetenz beurteilen und rückmelden
61
2020
Claudia Harsch
flul4910099
49 (2020) • Heft 1 DOI 10.2357/ FLuL-2020-0007 C LAUDIA H ARSCH * Schreibkompetenz beurteilen und rückmelden Abstract. The article provides an overview of current approaches to assessing writing with a view to discussing the main aspects that have to be considered. The aspects covered are assessment purposes, constructs, tasks, rating scales and assessors. Furthermore, feasible ways for reporting assessment results are explored, which can then be fed back into the classroom for positive washback effects. Learning-oriented feedback resulting from assessment will take centre-stage, since the main objective of any assessment should be to foster those skills that are being assessed. Throughout the article, reference will be made to the Common European Framework of Reference and the implications that its proficiency system has for the alignment of learning objectives and assessment goals, and also for the alignment of internal and external assessment results. 1. Anforderungen an reliable und valide Schreibbeurteilung Die Entwicklung des Schreibens als wesentlicher Bestandteil der Literalität (s. Beitrag Tesch in diesem Band) erfolgt i.d.R. auf der Basis (schulischer) Instruktion. Lehrkräfte beobachten und beurteilen die Schreibprozesse und Produkte ihrer Lernenden und fördern sie durch gezieltes Feedback. Insofern nimmt die Beurteilung von Schreibkompetenzen eine zentrale Stellung in der Entwicklung und Förderung derselben ein. Bei der Förderung und Beurteilung von Schreibkompetenzen spielt der Gemeinsame Europäische Referenzrahmen für Sprachen (im Folgenden GER, E URO - PARAT 2001 1 ) eine wichtige Rolle als gemeinsamer Bezugsrahmen. So werden etwa Lehr- und Lernziele an ihm ausgerichtet, Lernende und Lehrende können seine Skalen zur Selbst- und Fremdbeurteilung nutzen, und auch die Bildungsstandards orientieren sich am GER, so dass schulinterne Beurteilung in Bezug zum nationalen Bildungsmonitoring gesetzt werden kann. Spätestens seit dem Erscheinen des GER werden Kompetenz- und Handlungsorientierung als Grundprinzipien des Sprachunterrichts angesehen, so auch im Schreibunterricht. Schreibkompetenz wird entwickelt durch Schreibanlässe und Auf- * Korrespondenzadresse: Prof.in Dr.in Claudia H ARSCH , Universität Bremen, Universitäts-Boulevard 13, 28359 B REMEN E-Mail: harsch@uni-bremen.de Arbeitsbereiche: Sprachlehr- und -lernforschung, Testen und Prüfen, Gemeinsamer europäischer Referenzrahmen 1 Wenn im Folgenden der GER genannt wird, ist seine Erweiterung durch das Companion Volume (C OUNCIL OF E UROPE 2018) immer mit eingeschlossen. 100 Claudia Harsch DOI 10.2357/ FLuL-2020-0007 49 (2020) • Heft 1 gaben, die sich an den Anforderungen der realen Welt orientieren. Dabei werden sprachliche Kompetenzen wie etwa Fertigkeiten und Kenntnisse in den Bereichen Grammatik oder Wortschatz nicht vernachlässigt, doch kommt ihnen eine dem Schreiben dienende Funktion zu. Insofern hat der kompetenz- und handlungsorientierte Ansatz des GER den Blick auf die sprachlich-kommunikative Handlungsfähigkeit geschärft. Dies hat auch Auswirkungen auf die Beurteilung der Schreibkompetenzen, denn traditionelle Verfahren wie etwa der Fehlerindex können der Handlungsorientierung nicht Rechnung tragen. Da die Anforderungen an kompetenz- und handlungsorientierte, reliable und valide Schreibbeurteilungsverfahren komplex sind (vgl. z.B. G ROTJAHN 2009; W EIGLE 2002), werden im Folgenden zunächst die Kernaspekte handlungsorientierter Schreibbeurteilung übersichtlich dargestellt. Die einzelnen Teilaspekte werden dann in den folgenden Abschnitten wieder aufgenommen und vertieft. 1.1 Beurteilungszwecke und -gegenstände Valide Verfahren müssen den Zwecken der Beurteilung angemessen sein; Beurteilungszwecke können grob unterschieden werden in Beurteilung zur Diagnose, zur Lernerfolgskontrolle und zur Kompetenzfeststellung (vgl. z.B. G ROTJAHN 2008; H ARSCH 2018). Letztere kann wiederum danach unterschieden werden, ob die Beurteilung dazu dient, die Kompetenzen individueller Lernender zu zertifizieren, oder ob es darum geht, für Zwecke des Bildungsmonitoring Kompetenzaussagen für eine Population von Lernenden auf Gruppenebene zu treffen. Je nach Zweck der Beurteilung sind verschiedene Ansätze und Instrumente angezeigt, auf welche ich im weiteren Verlauf des Beitrags eingehen werde. Ist der Zweck der Beurteilung geklärt, muss man für eine valide Beurteilung vorab genau definieren, was man überprüfen will, d.h. welches Konstrukt der Beurteilung zugrunde gelegt wird. Dabei gilt, dass es nicht „das eine“ Konstrukt der Schreibfertigkeit gibt, sondern dass je nach Kontext und Zweck der Beurteilung spezifische Aspekte des Schreibens in den Fokus genommen und entsprechend definiert werden müssen (vgl. z.B. W EIGLE 2002). So kann man etwa auf Schreibprozesse oder auf bestimmte Aspekte der Schreibprodukte fokussieren, je nach Ausrichtung der Beurteilung. Man kann eine Momentaufnahme überprüfen oder etwa mittels Portfolioansätzen die Entwicklung der Schreibfertigkeiten in den Fokus nehmen. Das jeweilige Schreibkonstrukt kann sich aus Curricula, Bildungsstandards oder aus relevanten theoretischen Modellen speisen. Einflussreiche Modelle sind beispielsweise das Schreibprozessmodell von H AYES / F LOWER (1980), das von B ÖRNER (1989) für den schulischen Fremdsprachenkontext adaptiert und erweitert wurde, sowie die empirischen Arbeiten von K RINGS (1989). Im Kontext der unterrichtsbezogenen Leistungsbeurteilung ist es wichtig, das Konstrukt eng an die jeweils geltenden Lehr- und Lernziele, an curriculare Vorgaben und ggf. an die Bildungsstandards anzubinden, um die curriculare Validität sicherzustellen. Diese Anbindung wird auch constructive alignment genannt (vgl. etwa Schreibkompetenz beurteilen und rückmelden 101 49 (2020) • Heft 1 DOI 10.2357/ FLuL-2020-0007 L ITTLE / E RICKSON 2015); sie soll dazu beitragen, dass die Beurteilung Ziele des Unterrichts valide widerspiegelt. Hier zeigt sich der GER als bedeutsam, stellt er doch den Rahmen vieler Curricula und der KMK-Bildungsstandards dar. Im Verlauf des Beitrags werde ich in den verschiedenen Abschnitten immer auch darauf eingehen, wie die Informationen im GER, seine Skalen und Deskriptoren zur Beurteilung und Rückmeldung eingesetzt werden können. 1.2 Vorgehen bei der Schreibbeurteilung Ausgehend vom jeweiligen Beurteilungszweck und dem dafür relevanten Konstrukt müssen entsprechende Aufgaben entwickelt werden. Die Aufgaben sollen das Konstrukt valide umsetzen, d.h. sie operationalisieren das Konstrukt so, dass die Beurteilung letztlich das misst, was sie auch messen will. In anderen Worten heißt das, dass das Konstrukt sich in der Aufgabe widerspiegeln muss und die Aufgabe folglich zu den Schreibprozessen und sprachlichen Handlungen anregen muss, die man überprüfen möchte. Ein wichtiger Aspekt der validen Beurteilung liegt dabei in der Handlungsorientierung und der Ausrichtung der Aufgaben an authentischen, d.h. auf die reale Lebenswelt ausgelegten Schreibanlässen, wie sie auch der GER anregt. Beurteilungsaufgaben sollten zu solchen Schreib- und Sprachhandlungen anregen, welche bedeutsam für diejenigen Kommunikationssituationen und Anforderungen sind, die die Lernenden auch im realen Leben meistern sollen. Die durch valide Aufgaben elizitierten Schreibprozesse und Produkte müssen im nächsten Schritt bewertet werden. Dazu müssen Bewertungskriterien angelegt werden, die wiederum das Konstrukt valide operationalisieren sollen. Wichtig ist dabei, dass die Kriterien und die darin ausgedrückten Erwartungen den Lernenden vorab bekannt sind. Wenn Kriterien und Aufgaben die Lehr- und Lernziele umsetzen (s.o. constructive alignment) und die Aufgabenformate, Anforderungen und Erwartungen vorab mit den Lernenden erarbeitet werden, schließt sich der Kreis zur curricularvaliden Beurteilung. Dieser transparente Kreisschluss ist eine der Voraussetzungen für lernförderliche Rückmeldungen der Beurteilungsergebnisse (s. Abschnitt 6). Bei der Bewertung muss auf faire, objektive, transparente und reliable Vorgehensweisen geachtet werden. Es sollten für alle die gleichen Bedingungen herrschen, das Vorgehen sollte transparent sein, und unterschiedliche Bewerter sollten zu gleichen Ergebnissen kommen. Deshalb ist es elementar, die Erwartungen in einem transparenten Bewertungsschema festzuschreiben und dieses allen an der Beurteilung Beteiligten zugänglich zu machen. Im Idealfall erhalten die Bewertenden ein Training (z.B. L UMLEY 2005), in dem sie mit dem Schema und dem jeweiligen Vorgehen vertraut gemacht werden. Die Lernenden sollten ebenfalls aus Gründen der Transparenz und Fairness mit den Beurteilungsprozessen und Erwartungen vertraut gemacht werden, was insbesondere in Kontexten, in denen sie etwa über Peer- oder Selbstbeurteilung mit einbezogen werden, unerlässlich ist. 102 Claudia Harsch DOI 10.2357/ FLuL-2020-0007 49 (2020) • Heft 1 1.3 Rückmeldung und Washback Schließlich erfolgt die Rückmeldung der Beurteilungsergebnisse, was unseren Blick auf die Folgen der Beurteilung lenkt. Hier stellen sich Fragen danach, wie die Ergebnisse interpretiert werden, wer sie nutzt und wie sie in den Lehr-/ Lernprozess zurückfließen können. Diese Fragen sollten zu Beginn jeder Beurteilung mitgedacht werden, um die Beurteilungsinstrumente und Verfahren von Anfang an so auszulegen, dass sie eine möglichst positive Wirkung, sog. positiven Washback (z.B. C HENG / W ATA - NABE 2004) erzielen können. Dabei ist zu bedenken, dass Punkte alleine wenig Aussagekraft haben. Zwar mögen sie in einem normorientierten Rahmen anzeigen, wie die Beurteilten in Bezug auf eine bestimmte Gruppe abgeschnitten haben (Stichwort ranking), inhaltlich jedoch wird dadurch nicht deutlich, über welche Kompetenzen die Lernenden verfügen und welche Erwartungen wie gut erfüllt werden. Letzteres ist jedoch unablässig, wenn die Beurteilung zur Rückmeldung führen soll. Dazu sollten die Bewertungskriterien die Grundlage zur qualitativen Beschreibung der Fertigkeiten und Kompetenzen darstellen, über welche die Lernenden verfügen. Dies trägt zu einer transparenten, kriterienorientierten Rückmeldung bei. Auch hier wird deutlich, dass die Art der Rückmeldung vom Beurteilungszweck abhängt: Während ein Kompetenztest zum Zweck des Bildungsmonitoring mit grobrastrigen Kompetenzniveaubeschreibungen auskommen mag, benötigt man für eine Diagnose der Stärken und Schwächen individueller Lernender ein feingliedriges Herangehen, das den Lernenden auch aufzuzeigen vermag, in welchen Bereichen sie sich wie verbessern können. Wiederum zeigt sich die Bedeutung des Konstrukts, das sich nicht nur in den Aufgaben und Beurteilungskriterien spiegelt, sondern bis in die Rückmeldung hineinwirkt. An dieser Stelle kommt der GER, insbesondere seine Kompetenzniveaus, seine Skalen und die Deskriptoren, die die Niveaus beschreiben, zur Geltung. Während die GER-Skalen keine Bewertungsskalen sind, können sie dennoch, wie oben ausgeführt, das Konstrukt, die Aufgaben und die Bewertungskriterien informieren, und sie können helfen, die Beurteilungsergebnisse inhaltlich-qualitativ zu beschreiben, um die inhaltliche Interpretation der Beurteilungsergebnisse zu unterstützen. Insofern hilft der GER dabei, Lehr- und Lernziele, Beurteilungsziele und Rückmeldungen transparent aufeinander zu beziehen. Letztlich sollten alle oben ausgeführten Aspekte (Zwecke, Gegenstand, Vorgehen, Rückmeldung) transparent dokumentiert und in sogenannten Test- oder Beurteilungsspezifikationen festgehalten werden. Solche Spezifikationen informieren die Beurteilungsbeteiligten und potentielle Nutzer der Beurteilungsergebnisse, sie unterstützen die Aufgabenentwicklung und sie stellen eine wichtige Grundlage für Validierungsstudien dar (vgl. etwa S EYFERTH et al. 2018). Schreibkompetenz beurteilen und rückmelden 103 49 (2020) • Heft 1 DOI 10.2357/ FLuL-2020-0007 2. Ansätze zur Schreibbeurteilung Je nach Zweck gibt es unterschiedliche Ansätze zur Beurteilung von Schreibkompetenzen, etwa zur Diagnose, Lernerfolgskontrolle oder Feststellung des Kompetenzniveaus, welche im Folgenden kurz dargestellt werden. Allen Ansätzen gemeinsam ist, dass sie letztlich dazu beitragen sollten, die Schreibfertigkeiten der Lernenden zu verbessern. Dabei kommt lernförderlichem Feedback eine wichtige Rolle zu, auf die unten im Abschnitt 6 näher eingegangen wird. Zur Diagnose benötigt man ein System, das es erlaubt, detailliert und feingliedrig die relevanten Teilfertigkeiten zu erfassen, die zur Schreibfertigkeit beitragen (vgl. H UHTA et al. i.Dr.). Es können je nach Diagnosefokus Schreibprozesse, Strategien der Überarbeitung, sprachliche Teildimensionen des Produkts ebenso wie textuelle Aspekte in ihren Stärken und Schwächen erfasst und rückgemeldet werden. Zur Prozessdiagnose kann man einen Portfolioansatz wählen, in dem die Lernenden sukzessive Entwürfe und Überarbeitungen dokumentieren. Dazu können Fragebögen oder Checklisten treten, welche die Lernenden anregen, über den Einsatz relevanter Schreib- und Überarbeitungsstrategien zu reflektieren. Ebenfalls hilfreich zur Diagnose von Schreibprozessen kann (retrospektives) lautes Denken sein, um gemeinsam mit den Lernenden relevante Strategien und Prozesse zu diagnostizieren und zu entwickeln. Bei der produktorientierten Diagnose werden Schreibprodukte analysiert, etwa über Checklisten oder rating scales (s. Abschnitt 4 unten), um in Bezug auf bestimmte Kriterien Stärken und Schwächen herauszufinden, etwa bezüglich grammatischer Strukturen, Textaufbau oder Adressatenbezug. Diese kriterienorientierte Analyse ist noch wirkungsvoller, wenn sie gemeinsam mit den Lernenden erfolgt. Aufgrund des feinkörnigen, analytischen Vorgehens ist es dann möglich, mit den Lernenden herauszufinden, welche Aspekte sie noch verbessern können. Bei der Diagnose ist es essentiell, den Lernenden detaillierte Rückmeldung dazu zu geben, wie sie die diagnostizierten Schwächen überwinden können, so dass sie sich nicht nur neue Lernziele setzen, sondern auch (gemeinsam mit den Lehrenden) Wege finden, diese Ziele zu erreichen. Hier zeigt sich, dass Diagnose in ihrem Kern formativ ist, also der Lernförderung dient. Ebenso wichtig ist es, Unterricht und Diagnose aufeinander abzustimmen und diejenigen Aspekte im Unterricht wieder aufzugreifen, für die die Diagnose Bedarfe aufgezeigt hat. Diagnostische Instrumente können intern von Lehrenden selbst entwickelt werden. Es gibt aber auch Instrumente wie etwa das DIALANG System (https: / / dialangweb.lancaster.ac.uk), das an die Kompetenzniveaus des GER angebunden ist, der Selbstdiagnose dient und in den Unterricht als Teil der Selbstbeurteilung der Lernenden einfließen kann. In diesem System erhalten die Lernenden Rückmeldung zu den erfassten Teilaspekten, welche im Unterricht wieder aufgenommen werden kann. Die Beurteilung des Lernerfolgs ist ebenfalls eng mit dem Unterrichtsgeschehen verknüpft. Sie fokussiert auf Schreibhandlungen, die unterrichtet wurden, um summativ zu überprüfen, ob die Lernziele auch erreicht werden. Lernerfolgskontrollen sind i.d.R. auf Schreibprodukte beschränkt und in ihrer Auswertung grobkörniger als 104 Claudia Harsch DOI 10.2357/ FLuL-2020-0007 49 (2020) • Heft 1 diagnostische Verfahren. Dennoch können und sollen sie in lernförderliche Rückmeldungen münden. Insofern verfolgen sie sowohl summative als auch formative Zwecke. Oft dienen Lernerfolgskontrollen der Notengebung, stellen also eine Mischung aus normorientiertem und kriterienorientiertem Vorgehen dar, da die Klasse als Bezugsnorm dient und zugleich qualitative Bewertungskriterien angelegt werden. Die Kriterien und Lernziele sollten sich am Curriculum orientieren, welches sich wiederum an Bildungsstandards oder am Kompetenzrahmen des GER orientieren kann. Während Bildungsstandards und GER jedoch eher abstrahierte Kompetenzen beschreiben, sind Lernerfolgskontrollen spezifisch auf den Unterricht und die dort behandelten Textsorten, Themen, sprachlichen Mittel und Register ausgelegt, anders als etwa Kompetenztests. Kompetenztests sind i.d.R. losgelöst von Curricula und spezifischen Lernzielen des Schreibunterrichts, und demnach den externen Ansätzen zuzuordnen. Sie bilden (nationale) Bildungsstandards oder (internationale) Referenzniveaus wie etwa das Kompetenzsystem des GER ab. Ihr primäres Ziel ist es festzustellen, inwieweit Lernende relevante Schreibhandlungen und Anforderungen der „realen“ Lebenswelt meistern, unabhängig davon, auf welchen Wegen und mit welchem unterrichtlichen Input sie diese Kompetenzen erworben haben. Dies dient u.a. (internationalen) Vergleichen und der Zertifizierung. Kompetenzprüfungen sind kriterienorientiert und werden normalerweise in Form von Kompetenzniveaus zurückgemeldet, welche sich an den genannten Standards oder Referenzniveaus orientieren. Die Bewertung und Rückmeldung an die Lernenden sind primär summativ und entsprechend grobkörnig. Im Bereich des Bildungsmonitoring erfolgt sogar nur eine Rückmeldung bezogen auf die untersuchte Population, entsprechend der Ausrichtung und dem Zweck. Auch wenn Kompetenzprüfungen nur grobkörnige Rückmeldungen geben, können diese dennoch wertvolle lernförderliche Informationen enthalten, wenn auch nicht unbedingt auf individueller Ebene, so doch auf Klassen-, Schul- und bildungspolitischer Ebene. Die obigen Ausführungen zu diagnostischen Ansätzen, Lernerfolgskontrollen und Kompetenztests zeigen die wichtige Rolle des GER als gemeinsamen Bezugspunkt für interne und externe, lehrer- und lernerzentrierte, formative und summative Beurteilung (vgl. z.B. H ARSCH / S CHRÖDER 2010). So können interne Beurteilungen bezogen werden auf die Ergebnisse von Studien zum Bildungsmonitoring wie etwa VERA oder Ergebnissen des o.g. DIALANG Selbstdiagnosesystems. Lehrende und Lernende können ihre kriterienbezogenen Beurteilungs- und Diagnoseergebnisse untereinander und mit externen Beurteilungen vergleichen. In diesem Kontext stellt sich immer wieder die Frage, ob unterrichtsbezogene, interne Noten auf die Kompetenzniveaus des GER bezogen werden können. Diese Frage muss m.E. verneint werden, wie in H ARSCH (2017) ausführlich dargelegt, da die beiden Systeme ganz anderen Zwecken dienen, je andere Kriterien anlegen und auf je andere Bezugsnormen zurückgreifen. Im Kontext des GER und seiner Kompetenzniveaus lassen sich Ansätze auch hinsichtlich ihres Bezugs zu den Niveaus charakterisieren. Einerseits gibt es niveauspe- Schreibkompetenz beurteilen und rückmelden 105 49 (2020) • Heft 1 DOI 10.2357/ FLuL-2020-0007 zifische Ansätze, welche auf ein bestimmtes Niveau fokussieren und dazu Aufgaben einsetzen, die genau dieses Niveau operationalisieren und die Leistungen auch nur in Bezug auf dieses Niveau beurteilen. Solche Ansätze sind geeignet zur Zertifizierung eines bestimmten Niveaus. In Kontexten hingegen, in denen heterogene Lernendengruppen beurteilt werden sollen, eignen sich niveauübergreifende Ansätze mit eher offenen Aufgaben, die auf unterschiedlichen Kompetenzniveaus bearbeitet werden können. 3. Charakteristika valider Schreibaufgaben Der folgende Abschnitt wendet sich nun den Aufgaben zu, die der Beurteilung der Schreibfertigkeiten zugrunde gelegt werden. Zunächst lassen sich aus der Forschung und der Praxis folgende Charakteristika „guter“ Schreibaufgaben zur Beurteilung ableiten (vgl. etwa W EIGLE 2002; T ANKÓ 2005): Schreibaufgaben sollten situativ in bedeutungsvolle Zusammenhänge eingebettet sein, die Adressaten sollten genannt sein, und das kommunikative Ziel sollte relevant für die Lebenswelt der Lernenden sein. Dadurch wird erreicht, dass die Aufgaben auch zu authentischen Schreibhandlungen anregen, so dass überprüft werden kann, ob etwa die Registerwahl den Adressaten und die Textsorte dem Ziel angemessen sind. Die Instruktionen sollten in einfacher Sprache (unterhalb des zu überprüfenden Niveaus) gehalten werden, da es sich nicht um die Überprüfung des Leseverstehens 2 handelt. Aus Gründen der Transparenz sollten die Instruktionen die erwartete Länge und die zur Verfügung stehende Zeit enthalten. In Kontexten, in denen die Bewertungskriterien nicht vorab bekannt sind, sollten auch diese mitgeteilt werden, so dass sich die Lernenden vertraut machen können mit den Erwartungen der Schreibprüfung. Grundsätzlich gilt, wie für alle Prüfungen, dass Schreibaufgaben das der Beurteilung zugrunde gelegte Konstrukt, d.h. die Definition der Schreibfertigkeiten, wie sie im jeweiligen Kontext verstanden werden, valide operationalisieren müssen. Das bedeutet, dass die Schreibaufgaben solche Schreibhandlungen, Prozesse und sprachlichen Charakteristika elizitieren müssen, die im jeweiligen Beurteilungskontext als relevant identifiziert wurden. Hier gilt wiederum, dass Konstrukt und Aufgabenanforderungen relevante Lehr-/ Lernziele, Curricula oder Bildungsstandards widerspiegeln müssen, um das o.g. constructive alignment zu gewährleisten, das den Kern jeder validen Beurteilung darstellt. Schreibaufgaben können in ihren Anforderungen und Schwierigkeiten anhand einer Reihe von Faktoren charakterisiert werden, welche bei der Aufgabenerstellung und auch bei der späteren Interpretation der Leistungen eine wertvolle Hilfe sind. Die jeweiligen Anforderungen sollten sich bei unterrichtsbezogenen Beurteilungen aus den Curricula, den Lehr- und Lernzielen und dem Unterrichtsgeschehen ableiten. Aus 2 Dies gestaltet sich völlig anders bei der Überprüfung des integrierten Lese-/ Schreibvermögens, auf das hier aus Platzgründen leider nicht eingegangen werden kann. 106 Claudia Harsch DOI 10.2357/ FLuL-2020-0007 49 (2020) • Heft 1 Forschungen im Bereich der second language acquisition (z.B. N ORRIS et al. 2002; R OBINSON / G ILABERT 2007; S KEHAN / F OSTER 2001) sind folgende Charakteristika als schwierigkeitsbestimmend bekannt: • Bekanntheitsgrad von Thema, Inhalten, Aufgabenstellung, Textsorte, Adressaten: je bekannter, desto einfacher; • Anzahl der Elemente, die bearbeitet werden müssen (z.B. Inhaltsaspekte, Charaktere, Beziehungen): je weniger, desto einfacher; • Kognitive Operationen, Verarbeitungsanforderungen (z.B. Organisieren, Umformen, Interpretieren, Schlussfolgern): je komplexer, desto anspruchsvoller; • Distanz (Aufgabe konkret oder hypothetisch, nahe an Lebenswelt oder eher weiter weg, Adressaten persönlich bekannt oder unbekannte Personen): je näher desto einfacher; • Abstraktionsgrad des Themas (konkrete Objekte oder abstrakte Konzepte): je abstrakter, desto anspruchsvoller; • Präzisions- und Lenkungsgrad (der Instruktionen, der Aufgabenstellung, des Layouts etc.): je präziser und gelenkter desto einfacher; • sprachliche Komplexität (der Aufgabenstellung und des geforderten Produkts): je komplexer, desto anspruchsvoller; • Zeit, Länge (Aufgabenstellung und geforderte Textlänge): je weniger Zeit und je länger, desto anspruchsvoller. Während diese Faktoren bei der Aufgabenerstellung relativ leicht berücksichtigt werden können, ist deren Verortung im GER-System ein komplexeres Unterfangen, da der GER kein Leitfaden zur Aufgabenentwicklung ist. Dennoch können Aufgaben in gewissem Rahmen anhand relevanter Merkmale, die in den GER-Schreibskalen vorkommen, spezifiziert werden, wie es beispielsweise bei den Schreibaufgaben im KMK-Ländervergleich praktiziert wurde (vgl. H ARSCH / R UPP 2011). Dort wurden Charakteristika der Instruktionen und Aufgabenstellungen (Länge, konkretes vs. abstraktes Thema, Grad der Präzision und Lenkung), die geforderten Textsorten und Sprachhandlungen, die Komplexität der geforderten kognitiven Operationen und die Merkmale des geforderten Textes (Länge, sprachliche und organisatorische Komplexität) spezifiziert. Die so charakterisierten Aufgaben konnten mittels eines so genannten Standard-Setting-Verfahrens erfolgreich an diejenigen Kompetenzniveaus des GER angebunden werden, die sie operationalisieren sollten (vgl. ebd.; H ARSCH / P ANT / K ÖLLER 2010). Bei der Spezifizierung von Schreibaufgaben in Bezug auf das GER- Niveau, das Lernende haben sollten, um eine Aufgabe erfolgreich lösen zu können, hilft das ALTE Spezifizierungsraster (ALTE o.J.). Um zu überprüfen, ob die Aufgaben valide sind, also auch tatsächlich die intendierten Schreibhandlungen elizitieren, ist ein Ausprobieren oder Pilotieren unabdingbar. Dies kann in kleinem Rahmen schon in der Erstellungsphase durch KollegInnen erfolgen, oder man geht in Parallelklassen oder Nachbarschulen, um die Aufgaben mit Lernenden vergleichbaren Alters und Niveaus zu erproben. Eine Analyse der Schreibprozesse (s.o., etwa durch Fragebögen oder lautes Denken) und der Schreib- Schreibkompetenz beurteilen und rückmelden 107 49 (2020) • Heft 1 DOI 10.2357/ FLuL-2020-0007 produkte erlaubt Einsichten in die Validität der Aufgaben und ermöglicht ein gezieltes Nachsteuern dort, wo die Pilotierung Nachbesserungsbedarfe zeigt. 4. Bewertungsverfahren und -instrumente Bewertungsverfahren können grundsätzlich unterschieden werden nach analytischen, holistischen und aufgabenbezogenen Verfahren. Diese Verfahren haben jeweils ihre Vor- und Nachteile, und sie eignen sich für je unterschiedliche Beurteilungszwecke und Rückmeldungen (vgl. etwa B ARKAOUI 2011). Je nach Zweck und Zielsetzung der Beurteilung (s.o.) muss das jeweils angemessenste Verfahren gewählt werden. Für eine lernförderliche Diagnose etwa sollten analytische, sehr feingliedrige Verfahren genutzt werden, wohingegen aufgabenbezogene Verfahren sinnvoll sein können bei Lernerfolgskontrollen, die sich auf spezifische Aufgaben beziehen. Holistische, eher grobkörnige Verfahren können etwa bei summativen Kompetenzprüfungen zum Einsatz kommen, wenn individuelle Lernförderung nicht im Zentrum der Beurteilung steht. Die Granularität des Bewertungsverfahrens hängt immer vom Zweck der Beurteilung und vom Nutzerkreis der Rückmeldungen ab, weshalb das jeweils geeignetste Bewertungsverfahren für jeden Beurteilungskontext individuell bestimmt werden muss. Holistische Verfahren sind am grobkörnigsten und definieren die zu bewertenden Merkmale ganzheitlich, wohingegen analytische Verfahren Merkmale in klar voneinander abgegrenzten Kriterien beschreiben. Üblicherweise werden hierbei inhaltliche und sprachliche Kriterien unterschieden. Wichtig ist dabei, dass sich die Kriterien klar voneinander unterscheiden lassen und es nicht zu Überlappungen kommt. Analytische Verfahren geben Einblick in die Beherrschung der verschiedenen Teilaspekte, erlauben eine detaillierte Rückmeldung und bieten mehr Lenkung bei der Bewertung als holistische Verfahren, wodurch potentielle Überlagerungseffekte (so genannte Halo-Effekte) aufgefangen werden können. Sie sind jedoch zeitaufwändiger in der Erstellung und Anwendung als holistische Verfahren. Aufgabenspezifische Verfahren sind am aufwändigsten zu erstellen, bieten jedoch den Vorteil, bewerten zu können, inwieweit Lernende spezifische Anforderungen beherrschen. Allen Verfahren gemeinsam ist, dass sie das Konstrukt, die erwarteten Charakteristika also, valide in horizontalen Dimensionen und vertikalen Abstufungen beschreiben und definieren sollen. Die Anzahl der angelegten Dimensionen hängt davon ob, ob holistische oder analytische Ansätze gewählt werden. Die Anzahl der Abstufungen ist wiederum abhängig vom Kontext und Zweck der Beurteilung. Bei Lernerfolgskontrollen etwa sind die Abstufungen meist durch die Notenskala vorgegeben, bei Kompetenztests durch die Standards oder Rahmenwerke, auf die Bezug genommen wird. Die Abstufung hängt auch davon ab, ob ein niveauspezifischer oder ein niveauübergreifender Ansatz gewählt wurde (s.o.). Bei ersterem bieten sich Checklisten an, die die erwarteten Aspekte auflisten, bei letzterem bieten sich so genannte Rating-Skalen an, wobei die Anzahl der Abstufungen von der Anzahl der Niveaus abhängt, die 108 Claudia Harsch DOI 10.2357/ FLuL-2020-0007 49 (2020) • Heft 1 erfasst werden sollen. In jedem Fall muss die Anzahl der Abstufungen und Kriterien handhabbar sein für die Bewertenden. Als Ausgangspunkt zur Erstellung von Bewertungsinstrumenten kann man Lernerleistungen nehmen oder bereits existente Deskriptoren, d.h. Beschreibungen aus vorhandenen Checklisten oder Ratingskalen. Dabei können die Kompetenzskalen des GER als Ausgangsbasis genutzt werden. Allerdings müssen die Deskriptoren unbedingt adaptiert und spezifiziert werden für den jeweiligen Bewertungskontext und die Zielsprache, da die GER-Skalen kontext- und sprachunabhängig formuliert und nicht zur Bewertung von Einzelleistungen ausgelegt sind. Zur Adaption von GER-Skalen für Schreibbewertungsinstrumente finden sich weiterführende Überlegungen in H ARSCH / M ARTIN (2012) für den Kontext des Bildungsmonitoring und in H ARSCH / S EYFERTH (2019) für unterrichtsbezogene Schreibbewertung. Bei der Erstellung und Validierung von Bewertungsinstrumenten können intuitive, qualitative und quantitative Verfahren zum Einsatz kommen (vgl. E UROPARAT 2001: Appendix B). Bei intuitiven Verfahren werden Experteneinschätzungen und Expertenformulierungen benutzt. Unter qualitative Verfahren fallen etwa die Analyse und Charakterisierung von Lernertexten; mittels quantitativer Verfahren werden Einschätzungen und Bewertungen kalibriert, wie es beispielsweise bei der Erstellung der GER- Skalen praktiziert wurde. Es hat sich in unterschiedlichen Kontexten bewährt, die Nutzer der Bewertungsinstrumente in die Erstellung und Validierung einzubinden, da auf diese Weise ein gemeinsames Verständnis der Kriterien und Abstufungen entwickelt werden kann, ebenso wie eine vergleichbare Interpretation und Anwendung der Instrumente (vgl. z.B. M C N AMARA / H ILL / M AY 2002 oder W EIGLE 2002). Sollte eine Einbindung der Bewertenden in den Entwicklungsprozess nicht möglich sein, so ist ein Rater-Training und eine damit einhergehende Validierung der Instrumente durch die Nutzer unabdingbar (vgl. z.B. K NOCH 2011; L UMLEY 2005). Hier haben sich Verfahren bewährt, bei denen das Training einhergeht mit dem Ausprobieren der neuen Instrumente, mit dem Ziel der Instrumentenrevision, bis die Checklisten oder Skalen so formuliert, kategorisiert und abgestuft sind, dass sie von den Bewertenden auch vergleichbar angewandt werden können (vgl. z.B. H ARSCH / M ARTIN 2012; H ARSCH / S EYFERTH 2019). In Unterrichtskontexten wäre es ideal, auch die Lernenden mit in diesen Prozess einzubinden, denn so schulen und entwickeln sie gleichzeitig ihr Verständnis für das, was eine „gute“ Schreibleistung kennzeichnet und was von ihnen in der Prüfung erwartet wird. Gerade in Kontexten der Selbst- und Peerbewertung ist dies wichtig. Der Einbezug der Lernenden kann zugleich dazu beitragen, dass die Lernenden die Rückmeldungen der Beurteilung verstehen und diese für die Planung der nächsten Lernschritte und Ziele nutzen können. 5. Die Perspektive der Beurteilenden Die Beurteilung, Bewertung und Rückmeldung von Schreibkompetenzen können von verschiedenen Personen und aus unterschiedlichen Perspektiven erfolgen. Bei der Schreibkompetenz beurteilen und rückmelden 109 49 (2020) • Heft 1 DOI 10.2357/ FLuL-2020-0007 schul- oder unterrichtsinternen Beurteilung stehen die Lehrenden und Lernenden im Zentrum. Die Lernenden können entweder sich selbst oder ihre Mitlernenden beurteilen. Der interne Kontext ist dadurch geprägt, dass Lernende und Lehrende sich kennen und mit den Lehr- und Lernzielen vertraut sind. Sie wissen auch, was unterrichtet wurde und was in der Beurteilung erwartet wird. Zudem wird die Rückmeldung i.d.R. im Unterricht gegeben und in der Folge wieder aufgenommen, so dass lernförderliche Maßnahmen gemeinsam eingeleitet und umgesetzt werden können (s. Abschnitt 6). Selbst- und Peerbeurteilung können im Unterricht erlernt und erprobt werden - eine unerlässliche Voraussetzung für das Gelingen lernerzentrierter Beurteilung (vgl. W ILKENING 2013). In externen Beurteilungskontexten hingegen, bei denen entweder die Instrumente extern entwickelt und dann in den Unterricht gegeben werden oder die gesamte Beurteilung von externen Beurteilern durchgeführt wird, herrschen andere Bedingungen. Die Instrumente sind in diesem Fall standardisiert, pilotiert und sie operationalisieren - soweit relevant - die Kompetenzbeschreibungen und -niveaus des GER. In Kontexten, in denen extern entwickelte Instrumente im Unterricht eingesetzt und von den Lehrkräften ausgewertet werden, etwa bei den VERA Vergleichsuntersuchungen (KMK 2012), sind Anleitungen zur Durchführung und Auswertung wichtig, um ein vergleichbares Vorgehen zu gewährleisten. In externen Kompetenztests oder Schulleistungsstudien zum Bildungsmonitoring kommen zur Bewertung der Lernertexte geschulte Bewerter, so genannte Rater, zum Einsatz. Dabei sind die Lernenden den Ratern nicht persönlich bekannt, ebenso wenig wie die Lernkontexte und Unterrichtsinhalte. Dies mag einerseits als Nachteil erscheinen, doch erhöht es andererseits in Kompetenztests die Objektivität und kann somit zu höherer Fairness beitragen. Je nach Nutzerkreis und Zweck einer Beurteilung können existente Bewertungsinstrumente adaptiert werden. So können sehr detaillierte diagnostische Checklisten vereinfacht werden zur Selbstbeurteilung, oder es können externe grobkörnige Rating-Skalen durch unterrichtsrelevante Aspekte ergänzt werden, wenn sie im Unterricht genutzt werden sollen. Die Bewertungsinstrumente bilden die Grundlage für die Rückmeldung der Beurteilung, auf welche im folgenden Abschnitt eingegangen wird. 6. Lernförderliche Rückmeldung Beurteilung ist dann systemisch sinnvoll, wenn sie in lernförderliche Rückmeldung mündet, also zum oben erwähnten positiven Washback führt. Rückmeldungen können je nach Fokus der Beurteilung Informationen geben zur Beherrschung von Schreibprozessen und zur Qualität der Textprodukte, zum erreichten Lernstand ebenso wie zu Bereichen, die der Entwicklung bedürfen. Hier kann die Lehrkraft durch effektives Feedback (vgl. z.B. H ATTIE / T IMPERLEY 2007) die Lernenden dabei unterstützen, Stärken und Schwächen wahrzunehmen, sich neue Lernziele zu setzen und zielorientiert an solchen Aspekten zu arbeiten, die die Beurteilung als verbesserungswürdig aufge- 110 Claudia Harsch DOI 10.2357/ FLuL-2020-0007 49 (2020) • Heft 1 zeigt hat. Dabei ist es wichtig, dass Lehrende den Lernenden, wo nötig, Wege aufzeigen und mit ihnen Strategien entwickeln, wie man zu den gesteckten Zielen kommt. Dieses Aufnehmen und Umsetzen von Beurteilungsergebnissen im Unterricht dient gleichermaßen der Entwicklung von Schreibkompetenzen, Selbstbeurteilungskompetenzen sowie der Lernendenautonomie. Die letztgenannten zwei Aspekte sind eine wesentliche Voraussetzung dafür, dass Beurteilungsergebnisse zu Lernzuwachs führen können, denn nur was Lernende wahrnehmen, können sie auch in ihren zukünftigen Lernprozess einbauen (vgl. z.B. H UHTA et al. i.Dr.). Zudem sind Selbstbeurteilungs- und Revisionsfertigkeiten ein wichtiger Teil im Schreibprozess der Lernenden und tragen zur Weiterentwicklung der Schreibkompetenzen bei. Diese Evaluationsfertigkeiten können nicht nur durch die Evaluation und Revision eigener Texte geschult werden, sondern sehr gut auch über Peerevaluationen. Auf diese Weise können sich die Perspektiven der Lehrenden und der Lernenden ergänzen, und die Lernenden können ihre Selbstwahrnehmung im Licht der Wahrnehmung durch andere reflektieren. Bei dieser Reflexion können ferner externe diagnostische Instrumente wie das oben erwähnte DIALANG-System wertvolle Dienste leisten. Das Selbstdiagnose-System DIALANG bietet zudem den Vorteil, dass dabei diagnostische Informationen zu den Schreibfertigkeiten in Bezug gesetzt werden zu den Kompetenzniveaus des GER und zu den Selbsteinschätzungen, die am Anfang der Selbstdiagnose stehen. So kann Selbsteinschätzung auch bezogen werden auf das externe Referenzsystem des GER, welcher wiederum den Rahmen für Curricula und Bildungsstandards bildet. In Kontexten der externen Beurteilung, seien es nun Schulleistungsstudien zum Zweck des Bildungsmonitoring oder seien es Kompetenztests in internationalen Zertifikatsprüfungen, fallen Rückmeldungen gemäß dem Beurteilungszweck nicht so detailliert aus, wie es in internen Kontexten der Fall ist. Denn bei diesen summativen Beurteilungen geht es nicht um gezielte Lernförderung, sondern darum festzustellen, auf welchem Kompetenzniveau sich individuelle Lernende oder eine Lernendengruppe befinden. Heutzutage operationalisieren externe Beurteilungsinstrumente in der Regel die Kompetenzniveaus des GER, und die Beurteilungsergebnisse werden meist in Bezug auf die GER-Niveaus rückgemeldet. Dazu werden die Tests und die Beurteilungsergebnisse mittels so genannter Standard-Setting-Prozeduren und unter Zuhilfenahme von statistischen Verfahren formal an die Niveaus des GER angebunden, so wie etwa für den Ländervergleich der KMK (vgl. H ARSCH / P ANT / K ÖLLER 2010; K ÖLLER / K NIGGE / T ESCH 2010). Durch den Bezug auf die Kompetenzniveaus und -beschreibungen des GER können externe und interne Beurteilungen sinnvoll zueinander in Bezug gesetzt werden. Dadurch können Erkenntnisse des Bildungsmonitoring rückfließen in den Schulalltag, und Lehrende können in Bezug auf ihre Lernenden reflektieren, wo diese im Vergleich zu anderen Lernendengruppen stehen. Wichtig dabei ist, dass externe Evaluationen nicht zum Ranking individueller Klassen oder zur Beurteilung der Lehrenden genutzt werden dürfen, denn dazu sind diese Monitoring-Studien nicht ausgelegt, da sie nicht alle relevanten Eckdaten für solch ein Ranking erfassen. Um Lehrende hinreichend auf den Umgang mit interner und externer Beurteilung vorzubereiten, ist es Schreibkompetenz beurteilen und rückmelden 111 49 (2020) • Heft 1 DOI 10.2357/ FLuL-2020-0007 dringend angeraten, dass schon in der Ausbildung der Lehrenden Diagnose- und Beurteilungskompetenzen (vgl. H ARSCH 2018) gezielt gefördert werden. Durch die hier aufgezeigten Möglichkeiten der Fremd-, Lehrer-, Selbst- und Peerbeurteilungen können verschiedene Perspektiven der Schreibbeurteilung zusammengeführt werden, die einen validen Blick auf die jeweiligen Stärken und Schwächen eröffnen, die Lernenden zur Aufnahme von Feedback in den Revisionsprozess anregen, zur selbstständigen Evaluation und Revision der eigenen Schreibprozesse und -produkte anleiten und somit letztlich zur Entwicklung der Schreibkompetenzen und der Lernendenautonomie beitragen. Literatur ALTE (o.J.): The CEFR Grid for Writing Tasks (v. 3.1). https: / / rm.coe.int/ CoERMPublicCommonSearchServices/ DisplayDCTMContent? documentId= 09000016806979e0 (04.07.2019). B ARKAOUI , Khaled (2011): „Effects of marking method and rater experience on ESL essay scores and rater performance“. In: Assessment in Education: Principles, Policy & Practice 18.3, 279- 293. B ÖRNER , Wolfgang (1989): „Didaktik schriftlicher Textproduktion in der Fremdsprache“. In: A NTOS , Gerd / K RINGS , Hans P. (Hrsg.): Textproduktion. Ein interdisziplinärer Forschungsüberblick. Tübingen: Niemeyer, 348-376. C HENG , Liying / W ATANABE , Yoshinori (Hrsg.) (2004): Washback in Language Testing: Research Contexts and Methods. Mahwah, N.J.: Erlbaum. C OUNCIL OF E UROPE (2018): CEFR Companion Volume. https: / / rm.coe.int/ cefr-companion-volume-with-new-descriptors-2018/ 1680787989 (04.07.2019). E UROPARAT (2001): Gemeinsamer Europäischer Referenzrahmen für Sprachen: Lernen, Lehren, Beurteilen. Berlin: Langenscheidt. G ROTJAHN , Rüdiger (2008): „Didaktisches Lexikon ‚Klassenarbeit‘, ‚Test‘“. In: Praxis Fremdsprachenunterricht 4.8, 62-63. G ROTJAHN , Rüdiger (2009): „Testen im Fremdsprachenunterricht: Aspekte der Qualitätsentwicklung“. In: Praxis Fremdsprachenunterricht 1.9, 4-8. H ARSCH , Claudia (2017): „Noten und Kompetenzorientierung - wie geht das zusammen? “ In: Die Neueren Sprachen Jahrbuch, 5.6, 11-22. H ARSCH , Claudia (2018): „Diagnose und Beurteilung“. In: H EINZ , Susanne / R IEDEL , Andréa / R IECKE -B AULECKE , Thomas (Hrsg.): Basiswissen Lehrerbildung: Englisch unterrichten. Seelze: Klett/ Kallmeyer, 275-297. H ARSCH , Claudia / M ARTIN , Guido (2012): „Adapting CEF-descriptors for rating purposes: Validation by a combined rater training and scale revision approach“. In: Assessing Writing 17, 228- 250. H ARSCH , Claudia / P ANT , Hans Anand / K ÖLLER , Olaf (2010): Calibrating Standards-based Assessment Tasks for English as a First Foreign Language. Standard-setting Procedures in Germany. Münster: Waxmann. H ARSCH , Claudia / R UPP , André A. (2011): „Designing and scaling level-specific writing tasks in alignment with the CEFR: A test-centered approach“. In: Language Assessment Quarterly 8.1, 1-34. 112 Claudia Harsch DOI 10.2357/ FLuL-2020-0007 49 (2020) • Heft 1 H ARSCH , Claudia / S CHRÖDER , Konrad (2010): „Hoffnungsvoller Aufbruch. Neue Zeiten für Leistungserhebung, Leistungsmessung und Benotung“. In: Praxis Englisch 3, 44-46. H ARSCH , Claudia / S EYFERTH , Sibylle (2019): „Marrying achievement with proficiency - developing and validating a local CEFR-based writing checklist“. In: Assessing Writing. Online First: http: / / doi.org/ 10.1016/ j.asw.2019.100433 (13.12.2019). H ATTIE , John / T IMPERLEY , Helen (2007): „The Power of Feedback“. In: Review of Educational Research, 77.1, 81-112. H AYES , John R. / F LOWER , Linda (1980): „Identifying the organization of writing processes“. In: G REGG , Lee W. / S TEINBERG , Erwin R. (Hrsg.): Cognitive Processes in Writing. Hillsdale, NJ: Erlbaum, 31-50. H UHTA , Ari / H ARSCH , Claudia / L EONTJEV , Dmitri / N IEMINEN , Lea (i.Dr.): Diagnosing Writing. London: Routledge. K NOCH , Ute (2011): „Investigating the effectiveness of individualized feedback to rating behaviour - a longitudinal study“. In: Language Testing 28, 179-200. K ÖLLER , Olaf / K NIGGE , Michael / T ESCH , Bernd (2010): Sprachliche Kompetenzen im Ländervergleich. Überprüfung der Erreichung der Bildungsstandards für den Mittleren Schulabschluss für Deutsch und die erste Fremdsprache in der neunten Jahrgangsstufe. Münster: Waxmann. K RINGS , Hans P. (1989): „Schreiben in der Fremdsprache - Prozeßanalysen zum ,vierten skill‘“. In: A NTOS , Gerd / K RINGS Hans P. (Hrsg.): Textproduktion. Ein interdisziplinärer Forschungsüberblick. Tübingen: Niemeyer, 377-436. KMK (= Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland) (2012): Vereinbarung zur Weiterentwicklung von VERA. (Beschluss der Kultusministerkonferenz vom 08.03.2012). http: / / www.kmk.org/ fileadmin/ veroeffentlichungen_beschluesse/ 2012/ 2012_03_08_Weiterent wicklung-VERA.pdf (04.07.2019). L ITTLE , David / E RICKSON , Gudrun (2015): „Learner identity, leaner agency and the assessment of language proficiency“. In: Annual Review of Applied Linguistics 35, 120-139. L UMLEY , Tom (2005): Assessing second language writing: the rater’s perspective. Frankfurt/ M.: Lang. M C N AMARA , Tim / H ILL , Kathrine / M AY , Lynette (2002): „Discourse and Assessment“. In: Annual Review of Applied Linguistics 22, 221-242. N ORRIS , John M. / B ROWN , James D. / H UDSON , Thom D. / B ONK , William (2002): „Examinee abilities and task difficulty in task-based second language performance assessment“. In: Language Testing 19.4, 395-418. R OBINSON , Peter / G ILABERT , Roger (2007): „Task complexity, the Cognition Hypothesis and second language learning and performance“. In: IRAL: International Review of Applied Linguistics in Language Teaching, 45.3, 161-176. S EYFERTH , Sibylle / L AVAGNO , Antonella / K UCERA , Paola / H ARSCH , Claudia (2018): „Der GER als Grundlage zur Entwicklung sprachbergreifender Testspezifikationen“. In: B RANDT , Anikó / B USCHMANN -G ÖBELS , Astrid / H ARSCH , Claudia (Hrsg.): Der Gemeinsame Europäische Referenzrahmen für Sprachen und seine Adaption im Hochschulkontext. Fremdsprachen in Lehre und Forschung Bd. 51. Bochum: AKS, 118-144. S KEHAN , Peter / F OSTER , Pauline (2001): „Cognition and tasks“. In R OBINSON , Peter (Hrsg.): Cognition and Second Language Instruction. Cambridge: Cambridge University Press, 183-205. T ANKÓ , Gyula (2005): Into Europe. The Writing Handbook. Budapest: British Council. W EIGLE , Sarah C. (2002): Assessing Writing. Cambridge: Cambridge University Press. W ILKENING , Monika (2013): Selbst- und Partnerevaluation unter Schülern. Weinheim: Beltz.