eJournals Fremdsprachen Lehren und Lernen 32/1

Fremdsprachen Lehren und Lernen
flul
0932-6936
2941-0797
Narr Verlag Tübingen
Es handelt sich um einen Open-Access-Artikel, der unter den Bedingungen der Lizenz CC by 4.0 veröffentlicht wurde.http://creativecommons.org/licenses/by/4.0/121
2003
321 Gnutzmann Küster Schramm

Aufmerksamkeit, Automatisierung und Monitoring

121
2003
Jan Stevener
flul3210027
Jan Stevener * Aufmerksamkeit, Automatisierung und Monitoring Zur Forschungsmethodik Abstract. The following article gives a comprehensive survey about recent research dealing with the cognitive processes; Awareness, Automatization and Monitoring in L2 Acquisition. In recent years there has been an increasing number of studies concerning these topics. Y et it seems difficult to state results and findings strongly. This is due to the interdependence of those cognitive processes. This survey therefore aims at raising consciousness for methodological problems by comparing recent research using the following criteria: firstly, the,exact definition of the subject of research is a prerequisite in order to see how it compares to the subject of any research question. Secondly, research designs and operations are reviewed, as they define how characteristics of the research subject can be observed. Thirdly, measures are reviewed, as they should be in line with the operations. The survey will show that on the one hand the interdependence between Awareness, Automatization and Monitoring is not taken into account properly; and on the other hand that operations and designs are hardly comparable. Moreover, different studies utilize a multitude of different measures. The author argues for a theoretical framework or model, which would allow testable hypotheses conceming the above processes and for more comparable operations and designs. 1. Einleitung Der folgende Beitrag soll unter besonderer Berücksichtigung forschungsmethodischer Aspekte einen Überblick über empirische Erhebungen geben, die sich mehr oder weniger explizit mit den kognitiven Prozessen Aufmerksamkeit, Automatisierung und Monitoring befassen. Die Erörterung forschungsmethodischer Aspekte erscheint zwingend notwendig, da methodische Mängel die Aussagekraft empirischer Arbeiten erheblich beeinträchtigen können. Voraussetzung einer fundierten Kritik sind jedoch umfangreiche Kenntnisse des Rezipienten über die Konzeptualisierung des Untersuchungsgegenstandes, der vorgenommenen Operationalisierungen, der eingesetzten Instrumente und Auswertungsverfahren. Oft jedoch kann das Kriterium der Transparenz des Forschungsprozesses auf Grund pragmatischer Zwänge nicht hinreichend erfüllt werden (AGUADO 2000). Im folgenden soll versucht werden, verschiedene methodische Ansätze zur empirischen Erforschung fremdsprachlicher Sprachproduktion vergleichend vorzustellen. Die Vielzahl empirischer Erhebungen läßt jedoch eine Reduktion sinnvoll erscheinen. Einerseits ist festzustellen, daß seit CROOKES (1991) kein umfassender methodisch ausgerich- Korrespondenzadresse: Jan STEVENER, M.A., Khon Kaen University, German Section, Faculty of Humanities and Social Sciences, KHoN KAEN 40002, Thailand. E-mail: janstevener@yahoo.de Arbeitsbereiche: Fremdsprachenerwerbsforschung, Fremdsprachenvermittlung, Sprachproduktionsmodelle. lFILillllL 32 (2003) 28 Jan Stevener teter Überblick zur L2-Erwerbsforschung erschienen ist; so werden vor allem neuere Arbeiten seit 1991 berücksichtigt. Andererseits wird eine Reduktion des Phänomenbereichs vorgenommen. Die kognitiven Prozesse Aufmerksamkeit, Automatisierung und Monitoring sind zentrale Variablen im L2-Sprachproduktionsprozeß (für eine ausführliche Darstellung siehe den Beitrag von AGUADO in diesem Band, 12-27). Obwohl in diesem Forschungsbereich zu konstatieren ist, daß CROOKEs Forderung "it is necessary to conduct studies of the same topic using different techniques in order tobe in a position to state findings strongly" (1991: 123) Rechnung getragen wird, so zeigt doch eine genauere Betrachtung, daß hier unterschiedliche Operationalisierungen und Maße sowie Unklarheiten bezüglich des Untersuchungsgegenstandes die Vergleichbarkeit gewonnener Ergebnisse erschweren. Die Aufgabe des hier vorliegenden Artikels besteht darin, mit Hilfe zentraler inhaltlicher Kriterien die unterschiedlichen methodischen Ansätze kritisch darzustellen. Als zentrale inhaltliche Kriterien gelten die exakte Benennung des Untersuchungsgegenstandes, die Operationalisierung der Forschungsfrage und die verwendeten Maße (BÄRENFÄNGERISTEVENER 2001). Während die Benennung des Untersuchungsgegenstandes eine Einschätzung erlaubt, inwieweit der Gegenstand eines Verfahrens mit dem Gegenstand einer konkreten Fragestellung übereinstimmt, gibt die Operationalisierung an, welche beobachtbaren Sachverhalte den Merkmalen zuzuordnen sind; aus diesen leiten sich dann die verwendeten Maße ab. Obwohl auch die technische Seite eines Verfahrens (z.B. Auswertungssoftware, Apparatur, Datenformat etc.) für die Einschätzung der Effektivität empirischer Forschung relevant ist, muß aus Platzgründen auf eine Erörterung verzichtet werden. Mit der so systematisierten Darstellung empirischer Erhebungen ist zu hoffen, daß einerseits die Interdependenzen zwischen den Phänomenbereichen Aufmerksamkeit, Automatisierung und Monitoring zu Tage treten; andererseits soll so der Weg für die Schaffung eines theoretischen Rahmens, dessen Fehlen bereits von CROOKES (1991) angemahnt und noch 1999 von KORMOS bestätigt wurde, geebnet werden. Ein solcher Rahmen sollte, ähnlich wie das Sprachproduktionsmodell von LEVELT (1989) für die Ll- Sprachproduktionsforschung, die Möglichkeit bieten, stärker hypothesentestend zu arbeiten und unterschiedliche empirische Befunde integrieren zu können. 2. Aufmerksamkeit 2.1 Gegenstand Neuere Arbeiten zur Bedeutung der Aufmerksamkeit gehen einerseits davon aus, daß Aufmerksamkeit und Noticing von zentraler Bedeutung für den Fremdsprachenerwerbsprozeß sind (SCHMIDT 1990, 1994). Diese Auffassung richtet sich gegen frühere Annahmen, nach denen bewußtes Lernen zwar dem Monitor explizites Regelwissen zuführen kann, der Erwerbsprozeß jedoch unbewußt abläuft (vgl. KRASHEN 1981). SCHMIDTS Konzept von Aufmerksamkeit erfuhr eine feinere Gliederung durch TOMLINNILLA (1994), die verschiedene Grade gerichteter Aufmerksamkeit (Alertness, Orientation, Detection) unterscheiden, sowie durch ROBINSON (1995), der neben "Detection" die lFLd 32 (2003) Aufinerksamkeit, Automatisierung und Monitoring. Zur Forschungsmethodik 29 Aufnahme des Inputs in das Kurzzeitgedächtnis zur Bedingung des Erwerbs macht. Andererseits wird angenommen, daß die hierfür notwendigen Ressourcen begrenzt sind (VANPATTEN 1990) und deshalb Aufmerksamkeit selektiv auf bestimmte Aspekte der Sprachproduktion gerichtet wird (LEVELT 1989). Die verschiedenen für die Sprachproduktion und -rezeption relevanten kognitiven Komponenten stehen in einem Konkurrenzverhältnis um diese begrenzten Ressourcen (u.a. FOSTERISKEHAN 1999). Die Entscheidung, Aufmerksamkeit auf einen bestimmten sprachlichen Aspekt zu richten, kann sich sehr wohl nachteilig auf andere sprachliche Aspekte auswirken. Die meisten in diesem Bereich durchgeführten Studien gehen seit VANPATTEN (1990) davon aus, daß Lerner ihre Aufmerksamkeit entweder auf die sprachliche Form einer Äußerung oder auf deren Inhalt richten. V ANPATTEN (1996) zufolge wird den inhaltlichen Aspekten einer Äußerung Priorität eingeräumt. Neuere Studien (FOSTERISKEHAN 1996, 1999; SKEHAN/ POSTER 1996, 1997), die im Zusammenhang mit der Erforschung des Einflusses von unterschiedlichen Planungszeiten innerhalb bestimmter Aufgabentypen durchgeführt worden sind, konnten Wechselwirkungen bei der Verteilung von Aufmerksamkeitsressourcen weiter belegen. FOSTERISKEHAN (1996, 1999) sehen einerseits unterschiedlich lange Planungszeiten als eine Methode, Aufmerksamkeitsprozesse zu beeinflussen, andererseits untersuchen sie drei Bereiche, auf die Aufmerksamkeit gerichtet werden kann: Flüssigkeit, Korrektheit und Komplexität. Flüssigkeit wird als Indiz dafür gesehen, daß der Sprecher vor allem Bedeutung vermitteln will und deshalb seine Aufmerksamkeit auf die inhaltlichen Aspekte einer Äußerung richtet. Korrektheit spiegelt dementsprechend das Maß der Aufmerksamkeit wider, welches auf die formalen Aspekte der Sprachproduktion gerichtet wird; SKEHANIFOSTER (1999: 221) sehen hier vor allem das Bedürfnis von Lernern nach Kontrolle durch konservativen Sprachgebrauch reflektiert. Komplexität wird im Zusammenhang mit höheren kognitiven Prozessen als die Bereitschaft interpretiert, Risiken einzugehen und Sprache innovativ zu gebrauchen. So kann Komplexität aus fremdsprachenerwerbsspezifischer Perspektive als Variable zur Beschreibung von Sprachproduktion dienen. Darüber hinaus scheint Komplexität jedoch eine Beschreibungskategorie für Aufmerksamkeitsprozesse bereitzustellen, welche wertvolle Zusatzinformationen über die Qualität von Sprachproduktionen liefert, die mit den herkömmlichen Kategorien Flüssigkeit und Korrektheit nicht erfaßt werden können. Obwohl deutlich ist, daß Komplexität sowohl inhaltliche als auch formale Aspekte der Sprachproduktion reflektiert, besteht kein Konsens darüber, wie Komplexität in gesprochener Sprache zu beschreiben ist (FOSTERITONKYNIWIGGLESWORTH 2000). Auch legen bisherige Studien (FOSTER/ SKEHAN 1996, 1999; SKEHANIFOSTER 1996, 1997) die Vermutung nahe, daß zwischen Komplexität und Korrektheit ebenfalls Konkurrenz bezüglich erforderlicher Aufmerksamkeitsressourcen besteht. Insbesondere für empirische Forschung ist auch zu beachten, daß unterschiedliche Aufgabenstellungen die zu erzielenden Resultate beeinflussen. So scheinen Aufgaben, bei denen vorherige Planungsphasen vom Forscher gelenkt werden, zu komplexerer Sprachproduktion zu führen, während ungelenkte Planungsphasen eher zu korrekteren Ergebnissen führen (FOSTERISKEHAN 1999). IFJLllllL 32 (2003) 30 Jan Stevener Des weiteren kann der von den jeweiligen Aufgaben geforderte Diskurstyp unterschiedliche kognitive Ressourcen erfordern. GROSJEAN (1980) geht davon aus, daß Bildbeschreibungen kognitiv aufwendiger sind als Interviews. Auch SKEHAN/ FOSTER (1997) sowie BYGATE (1999) untersuchen den Einfluß verschiedener Aufgabentypen und des damit geforderten Diskurstyps (narrative, personal, decision making bzw. argument und narrative) auf die Sprachproduktion. BYGATE (1996) untersucht zusätzlich den Einfluß von Aufgabenwiederholungen auf Aufmerksamkeitsverteilungen. Studien, die den Effekt verschiedener Aufgabentypen auf die Verteilung von Aufmerksamkeitsressourcen thematisieren, verbinden dies mit der Frage nach dem Nutzen, den bestimmte Aufgabentypen für den Fremdsprachenerwerb haben, denn aus den empirischen Befunden lassen sich Entscheidungen über die Curriculum-Planung ableiten. Weiterführend wird hier ein Anknüpfungspunkt an die "focus-on-form"-Diskussion (siehe u.a. LONG/ ROBINSON 1998) geliefert, in der die Verteilung der Ressourcen zwischen Form (focus-on-formS) und Inhalt (focus-on-meaning) im Rahmen von Instruktionsmaßnahmen evaluiert wird. Kritisch ist anzumerken, daß es bislang keine Studien gibt, die den Zusammenhang von Aufmerksamkeitsprozessen und Fremdsprachenerwerb longitudinal untersuchen. Einige empirische Studien verorten den Untersuchungsgegenstand Aufmerksamkeit in Modellen, die den theoretischen Bezugsrahmen bilden. Neben dem bereits genannten Sprachproduktionsmodell von LEVELT (1989) bietet auch das ACT-Modell (Adaptive Control of Thought) von ANDERSON (1983) einen theoretischen Bezugsrahmen für Aufmerksamkeitsprozesse. Andersons Modell beschreibt den Prozeß der Umwandlung aufmerksamkeitsintensiver kognitiver Operationen in automatisierte Vorgänge. Der Nutzen dieses Modells für die Fremdsprachenerwerbsforschung wird seit Anfang der 90er Jahre theoretisch diskutiert (COOK 1991, 1993; CROOKES 1991) und empirisch zu überprüfen versucht (TOWELLIHAWKINS/ BAZERGUI 1996). Im Rahmen dieser theoretischen Grundannahmen ist eine Trennung des Untersuchungsgegenstandes Aufmerksamkeit von Monitoring-Prozessen und Automatisierung problematisch, da sich Fremdsprachenerwerb und Interlanguage-Entwicklung auf einem Kontinuum zwischen kontrollierten, d.h. aufmerksamkeitsintensiven, und automatisierten, d.h. aufmerksamkeitsarmen, Prozessen vollziehen. Auch scheinen Konzepte, die Monitoring als Operation auf der artikulatorischen Stufe und Planung als Operation auf der formulativen Stufe bezeichnen (CROOKES 1991), zu kurz zu greifen (für eine ausführlichere Darstellung siehe den Beitrag von BEYER in diesem Band [69-91]). 2.2 Operationalisierung und Design Der theoretischen Eigenschaft von Aufmerksamkeit, auf unterschiedliche Bereiche der Sprachproduktion gerichtet werden zu können, lassen sich verschiedene beobachtbare Sachverhalte zuordnen. Wird die Aufmerksamkeit auf inhaltliche Aspekte gerichtet, so ist eine flüssige Sprachproduktion zu erwarten; wird sie auf die sprachliche Form gerichtet, so sollte eine korrektere Sprachproduktion zu erwarten sein. Komplexität hingegen kann als ein Anzeichen dafür gesehen werden, daß erhöhte Aufmerksamkeit auf konzeptuelle Aspekte der Sprachproduktion gerichtet wird (FOSTERISKEHAN 1999: 221}. lFILl.lllL 32 (2003) Aufmerksamkeit, Automatisierung und Monitoring. Zur Forschungsmethodik 31 F0STERISKEHAN (1999) trennen hier weiter zwischen dem Fokus der Aufmerksamkeit bzw. Planung und ihrer „Quelle" und untersuchen Planungsprozesse auch hinsichtlich der Frage, wie Aufmerksarnk: eitsverteilungen initiiert werden (selbstinitiiert, lehrerinitiiert, gruppenbasiert). Darüber hinaus kann auch die Menge der zur Verfügung stehenden Aufmerksamkeit manipuliert werden. Da Aufmerksamkeit ein Prozeß ist, der in realer Zeit abläuft, kann sie experimentell über die Zeit, die für Planungsprozesse bereitgestellt wird, beeinflußt werden. Dies geschieht insbesondere in den Studien, die den Zusarnrnenhang von Planungsprozeß und Aufmerksamkeitsfokus herauszuarbeiten versuchen (CR00KES 1989; ELLIS 1987; FOSTERISKEHAN 1996, 1999; MEHNERT 1998; SKEHAN/ F0STER 1996, 1997). Die in diesem Zusarnrnenhang durchgeführten Erhebungen sind ausschließlich experimenteller Natur. Dies erscheint deswegen sinnvoll, weil rnit experimentellen Designs relativ eng gefaßte Fragestellungen bearbeitet werden können. Der daraus entstehenden Gefahr einer hohen Künstlichkeit der Erhebungssituation wird unterschiedlich Rechnung getragen. Während z.B. CR00KES (1989) seine Erhebung in einem Sprachlabor durchführt, argumentieren SKEHANIF0STER für eine möglichst natürliche Erhebungssituation: "Because of the unknown effects on language performance that may be caused by an unfamiliar setting and unusual procedures (as one would be likely to get in a straightforwardly experimental context), it was considered important to maintain a normal classroom setting as far as possible throughout the study" (SKEHANIFOSTER 1997: 193 f). Die genannten Erhebungen von SKEHAN und POSTER (F0STERISKEHAN 1996, 1999; SKEHAN/ F0STER 1996, 1997) wurden deshalb im gewohnten Klassenzirnrner der Probanden durchgeführt. MEHNERT (1998) führt ihre Erhebung zwar in einem Sprachlabor durch, konzipiert aber die Aufgabenstellung so, daß sie in der spezifischen Erhebungssituation natürlich wirkt: Die Probanden sollen in der Fremdsprache eine Nachricht auf einem Anrufbeantworter hinterlassen. Obwohl so mögliche methodische Einwände berücksichtigt werden, bleibt die Verallgemeinerbarkeit der Ergebnisse doch fraglich. Eine frühe Studie zum Einfluß von Planung auf Sprachproduktion ist die von ELLIS (1987). Ellis' Operationalisierung von Planung erfolgt über den zu produzierenden Diskurs. In seiner Studie sollten Probanden in der L2 einen schriftlichen Text, eine mündliche Nacherzählung dieses Textes und eine neue Erzählung produzieren. Ellis argumentiert, daß so fortschreitend weniger geplanter Diskurs zu erwarten ist. CR00KES (1989) hingegen gab seiner Experimentalgruppe 10 Minuten Planungszeit für die Bearbeitung eines Lückentextes. Die Kontrollgruppe erhielt keine Planungszeit. Beide Studien erzielten unterschiedliche Ergebnisse: Bei ELLIS nahm die Korrektheit rnit geringerer Planung ab, während bei CR00KES die Korrektheit nicht signifikant verändert wurde, andererseits aber ein signifikanter Einfluß auf Komplexität und Flüssigkeit zu verzeichnen war. Weiterführende Studien in diesem Bereich versuchen, das Verhältnis von gefordertem Diskurstyp und Planungszeit zu klären. FosTERISKEHAN (1996) verwenden ein 3x3- Design, bei dem zum einen die Planungszeit (10 Minuten geleitete Planung, 10 Minuten IFlLILllL 32 (2003) 32 Jan Stevener ungeleitete Planungszeit, keine Planungszeit) und zum anderen der Aufgabentyp (narrative, personal, decision-making) variiert wird. In SKEHAN/ FOSTER (1997) wird ein 2x2- Design verwendet, bei dem Planungszeit (10 Minuten, keine Planungszeit) und Aufgabentyp (mit und ohne post-task-activity) variiert werden. WIGGLESWORTH (1997) untersucht Planungszeiten (keine Planungszeit versus 1 Minute) und unterschiedliche Sprachniveaus im Kontext mündlicher Sprachtests. MEHNERT (1998) schließlich verwendet ein 4x2-Design, das feinere Zeiteinteilungen (keine Planungszeit versus 1, 5, 10 Minuten Planungszeit) mit 2 unterschiedlichen Aufgabentypen (instruction versus exposition) verbindet. Aus der Vielfalt der verwendeten Operationalisierungen wird deutlich, daß eine systematische Vergleichbarkeit der Studien untereinander nicht unproblematisch ist. Obwohl einige Studien beispielsweise 10 Minuten Planungszeiten verwenden, sind deren Ergebnisse untereinander kaum vergleichbar, da einerseits Planungszeit und Resultat keiner linearen Entwicklung zu folgen scheinen (MEHNERT 1998) und andererseits der Einfluß der zweiten unabhängigen Variablen die Vergleichbarkeit erschwert. Präzise Aussagen zum Einfluß von Aufmerksamkeit und Planung auf die Sprachproduktion sind deshalb nicht möglich. Ein dringendes Desiderat ist hier die Durchführung von Erhebungen, die vergleichbare Operationalisierungen aufweisen. Eine weitere Forschungsrichtung, die den Einfluß von Aufmerksamkeitsverteilungen auf Sprachproduktion untersucht, sind die Studien, die vorrangig den Effekt impliziter und expliziter Instruktionsmaßnahmen auf die Korrektheit des lernersprachlichen Outputs untersuchen. Explizite Instruktion wird in diesen Studien als das Lenken der lernerseitigen Aufmerksamkeit auf die formalen Charakteristika grammatischer Phänomene verstanden (CADIERNO 1995; DEGRAAFF 1997; DEKEYSER 1995; SPADAILIGHTBOWN 1993; ROBINSON 1996; TATEYAMAIKASPERIMUiffAYITHANANART 1997; VANPATTEN/ CA- DIERNO 1993a, 1993b; WmTEISPADAILIGHTBOWN! RANTA 1991; ZHOU 1991). In den genannten Studien wurden Daten ausschließlich in Laborsituationen erhoben, teilweise sogar mit künstlichen Sprachen (DE GRAAFF 1997, DEKEYSER 1995). Obwohl die Spezifik der zu untersuchenden Fragestellungen ein stark kontrolliertes Design rechtfertigt, in welchem die Reihenfolge, Quantität und Qualität des Inputs exakt bestimmt werden können, räumt einzig DEKEYSER (1995) ein, daß möglicherweise hier nur die Fähigkeit der Probanden getestet werde, kognitive Puzzles zusammenzusetzen. Andererseits wird in allen Studien das Lenken der Aufmerksamkeit über den Input operationalisiert: Der Grad der Expliziertheit grammatischer Regeln entscheidet darüber, inwieweit der Proband seine Aufmerksamkeit auf grammatische Phänomene richtet. In diesem Kontext setzen u.a. WmTEISPADAILIGHTBOWNIRANTA (1991) auch "enhanced input" (SHARWOOD~SMITH 1991) ein, welcher in unterschiedlicher Form Markierungen der zu vermittelnden Zielstruktur aufweist. Bei dieser Operationaliserung von Aufmerksamkeit bleibt jedoch fraglich, ob die Probanden wirklich ihre Aufmerksamkeit auf die explizierten Zielstrukturen gelenkt haben. So erzielte die AG FREMDSPRACHENERWERB BIELEFELD (2000) in einer Erhebung zur Effektivität verschiedener Instruktionsmaßnahmen sehr heterogene Ergebnisse, die z.T. darauf zurückzuführen waren, daß die Form des Stimulusmaterials allein nicht lFLuL 32 (2003) Aufmerksamkeit, Automatisierung und Monitoring. Zur Forschungsmethodik 33 ausreicht, um die Aufmerksamkeit der Probanden zu lenken. ROBINSON (1996) und das DFG-Projekt „Mündliche L2-Produktion" (BÄRENFÄNGERIBEYER 2001) versuchen deshalb, durch explizite Anweisung die Aufmerksamkeit der Probanden auf bestimmte Phänomene zu lenken. Um zu klären, welche mentalen Prozesse tatsächlich im Probanden ablaufen, bietet sich der Einsatz von Retrospektionen an. Obwohl sich mit diesem Verfahren nur ausschnitthaft bewußte mentale Prozesse erheben lassen und ROBINSON (1995) daraufhinweist, daß Aufmerksamkeit ein flüchtiges und schwer zu verbalisierendes Erlebnis sei, hat sich ihr Einsatz z.B. im Kontext des Monitoreinsatzes bei Selbstreparaturen bewährt (KORMOS 2000a, 2000b). Weiterführend ergibt sich aus den beschriebenen Wechselwirkungen zwischen den Bereichen Korrektheit, Flüssigkeit und Komplexität zwangsläufig die Frage, wie die genannten Bereiche in der Operationalisierung getrennt werden können, um klare Aussagen zu erhalten. Da Probanden ihre Aufmerksamkeit auf mehr als einen Bereich richten können (SKEHAN/ FOSTER 1997: 207), scheint es sinnvoll zu sein, ihnen in experimentellen Designs wenig Alternativen anzubieten und sie so zu einer klaren Entscheidung zu zwingen. Da in der bisherigen Literatur von starker Konkurrenz zwischen Form und Inhalt ausgegangen und Komplexität zur weiterführenden Qualitätsbeschreibung herangezogen wird, bietet es sich an, die erstgenannten Faktoren im Design zu operationalisieren und Komplexität erst bei der Auswertung und Interpretation der Ergebnisse zu berücksichtigen. 2.3 Maße Da Aufmerksamkeit auf verschiedene Bereiche gerichtet werden kann, müssen Forscher explizieren, mit welchen Maßen die empirisch beobachtbaren Eigenschaften erhoben werden können. Alle genannten Studien untersuchen so entweder die Korrektheit (im Rahmen der Erhebungen zu Instruktionsmaßnahmen) oder darüber hinaus auch die Flüssigkeit und Komplexität der Sprachproduktion (im Rahmen der Erhebungen zu Planungsprozessen). Da die verwendeten Maße nicht nur über die Angemessenheit eines Verfahrens entscheiden, sondern auch den Ausgangspunkt für eine spätere Triangulation von Daten unterschiedlicher Erhebungen bilden können (AGUADO! RIEMER 2001), soll kritisch dargelegt werden, welche Maße in den genannten Studien verwendet werden. Für den Untersuchungsbereich Flüssigkeit werden temporale Variablen gemessen. Die hier genannten Studien verwenden diejenigen Maße, die seit den achtziger Jahren für die Zweitsprachenerwerbsforschung u.a. von DECHERT/ RAUPACH (1980, 1987), FATHMAN (1980), WIESE (1984), MÖHLE/ RAUPACH (1987) RAUPACH (1987) und SAJAVAARA (1987) etabliert wurden. Im einzelnen handelt es sich hier um folgende Maße: Die Sprechrate (SR) erhält man, indem man die Gesamtzahl der produzierten Silben in einem gegebenen "Sample" durch die Gesamtdauer des Samples inklusive Pausen (gerechnet in Sekunden) teilt. Das Ergebnis wird sodann mit 60 multipliziert: Das Ergebnis gibt somit die Anzahl der produzierten Silben pro Minute an. Ein Wert für phonation/ time ratio (PTR) gibt an, in welchem Verhältnis die Zeit, in der gesprochen wird, zur Gesamtzeit steht. Mit der PTR erhält man so einen prozentualen Wert des Verhältnisses lFL1UiL 32 (2003) 34 Jan Stevener von phonierten zu nicht-phonierten Sequenzen. Die Artikulationsrate bestimmt sich durch die Sprechgeschwindigkeit, aus der die Zeit für Pausen herausgerechnet wurde. Die mean length of runs (MLR) ist der Mittelwert produzierter Silben innerhalb eines runs. Einrun wird definiert als eine phonierte Sequenz, die zwischen 2 Pausen liegt. Ergänzend verwenden einige Studien (z.B. TOWELL/ HAWKINSIBAZERGUI 1996) als weiteres Maß die durchschnittliche Pausenlänge ALP (average length of pause), um Veränderungen der Flüssigkeit festzustellen. Für die präzise Errechnung obengenannter Werte sind Pausen von zentraler Bedeutung: Erhöhte Flüssigkeit sollte sich anhand weniger und kürzerer Pausen beobachten lassen (MEHNERT 1998). Uneinigkeit besteht jedoch hinsichtlich der exakten Länge einer Pause. Einerseits kann ein zu niedriger Wert möglicherweise normale Phänomene wie die Artikulation von geminierten Plosiven als Pausen erfassen. Andererseits besteht die Gefahr, durch einen zu hohen Wert Pausen zu übersehen. Während GOLDMAN-EISLER (1968) 0,25 Sekunden als Mindestdauer für Pausen ansetzt, ebenso wie später TOWELL (1987) und RAUPACH (1987), verwenden andere Studien sehr uneinheitliche Festschreibungen dessen, was als Pause definiert wird: RAUPACH (1980) setzt 0,3 Sekunden an, GRIFFITHS (1991) setzt mindestens 0,1 und maximal 0,3 Sekunden an, RrGGENBACH (1991) unterscheidet zwischen Mikropausen (0,2 Sek.), Verzögerungen (0,3-0,4 Sek.) und ungefüllten Pausen (0,5-3 Sek.); Pausen, die länger als 3 Sekunden sind, werden bei ihr eliminiert. TOWELL/ HAWKINSIBAZERGUI (1996) schließlich verwenden ebenso wie das DFG-Projekt „Mündliche L2-Produktion" (BÄRENFÄNGERIBEYER 2001) 0,28 Sekunden als Pausenmaß. Auch wenn hier ein empirisch begründeter Konsens problematisch ist, sollte zumindest ein formaler Konsens angestrebt werden, um die Vergleichbarkeit der unterschiedlichen Studien untereinander zu erhöhen. Bei der exakten Bestimmung von Pausen weichen die zu Planungsprozessen durchgeführten Studien stark von obengenannten Studien ab: MEHNERT (1998) berücksichtigt nur Pausen von einer Sekunde und länger. FoSTERISKEHAN (1996, 1999) und SKEHAN/ POSTER (1997) setzen Pausen ebenfalls erst ab einer Sekunde an. In diesen Studien differiert das Pausenmaß von den seit den achtziger Jahren etablierten Maßen und verbietet einen direkten Vergleich mit anderen Studien. Auch verlangen temporale Variablen bei der technischen Erhebung präziseste Erhebungsinstrumente: Ein Messen mit der Stoppuhr oder analoge Aufnahmen sollten durch geeignetere Erhebungsinstrumente, wie z.B. digitale Aufnahmegeräte und computergestütze Auswertungen temporaler Phänomene (siehe auch BÄRENFÄNGERISTEVENER 2001), ersetzt werden. Darüber hinaus variiert die Auswahl der für Flüssigkeit verwendeten Maße: SKEHAN/ POSTER (1997) verwenden als einziges Maß die Gesamtzahl der Pausen, während FOSTERISKEHAN (1996 und 1999) zwischen "breakdown fluency", die Maße zu nichtphonierten Sequenzen enthält (Pausenanzahl und-länge), und "repair fluency", die Maße zu phonierten Sequenzen enthält (z.B. Wiederholungen, Neustarts etc.), trennen. MEH- NERT (1998) verwendet die Gesamtanzahl von Pausen, ihre Gesamtlänge sowie die MLR und Sprechrate. Durch die unterschiedliche Wahl von Maßen wird eine Vergleichbarkeit empirischer Befunde weiter verkompliziert. lFLl.llL 32 (2003) Aufmerksamkeit, Automatisierung und Monitoring. Zur Forschungsmethodik 35 Auch ist zu beachten, daß Maße sich einerseits untereinander beeinflussen können (beispielsweise kann eine höhere MLR sich in einer höheren SR niederschlagen), andererseits aber auch die einzelnen Maße unterschiedliche Entwicklungen zeigen können (z.B. bei MEHNERT 1998). Um hier eine solide Interpretation vornehmen zu können, empfiehlt es sich, die genannten temporalen Variablen in den theoretischen Rahmen eines Produktions- oder Erwerbsmodells zu integrieren, wie dies von GROSJEAN (1980: 51) gefordert wurde. Ein solcher Ansatz wird zur Zeit vom DFG-Projekt „Mündliche L2- Produktion" verfolgt. Eine hohe Korrektheit zeigt als beobachtbarer Sachverhalt, daß der Proband Aufmerksamkeit auf die sprachliche Form einer Äußerung richtet; diese "reflection of a focus on form" (FOSTER/ SKEHAN 1996: 304) kann mit relativ einfachen und kontrollierten Sätzen erreicht werden. Die eingesetzten Maße unterscheiden sich zunächst darin, daß manche Studien spezifische Maße zur Feststellung von Korrektheit benutzen, während andere Studien allgemeine Maße favorisieren. ELLIS (1987) untersucht Veränderungen der Interlanguage hinsichtlich des Gebrauchs von verschiedenen Vergangenheitsmorphemen im Englischen. CR0OKES (1989) beschränkt sich auf Artikelverwendung und 3. Person Singular (-s). FOSTER/ SKEHAN (1996, 1999) und SKEHANIFOSTER (1997) hingegen setzen als Maß für die Korrektheit die Anzahl fehlerfreier clauses ein. Hier scheint es nur dann angebracht zu sein, spezifische Maße für Korrektheit einzusetzen, wenn diese von zentraler Bedeutung für die Lösung der eingesetzten Aufgaben sind oder bestimmte Zielstrukturen für die Operationalisierung der Forschungsfrage unerläßlich sind (z.B. bei Studien zur Effektivität von Instruktionsmaßnahmen). Es ist jedoch zu beachten, daß den jeweiligen Zielstrukturen unterschiedliche Regeln zugrunde liegen, die z.B. je nach Komplexität, salience oder Verläßlichkeit das Ergebnis unterschiedlich beeinflussen können (für eine Diskussion siehe AG FREMDSPRACHENERWERB BIELEFELD 2000). Weiterführend könnte eine Gewichtung von Fehlern bezüglich ihrer Verbindung zur interessierenden Zielstruktur vorgenommen werden. Werden jedoch Aufgaben eingesetzt, die keine spezifischen Zielstrukturen erfordern (z.B. Aufgaben mit unterschiedlichen Diskursanforderungen), so bieten allgemeine Maße eine höhere Sensibilität für lernerseitige Veränderungen, da diese eine hohe Varianz aufweisen können (FOSTER/ SKEHAN 1996). Jedoch auch das von Poster und Skehan verwendete allgemeine Maß number of error free clauses erscheint nicht unproblematisch. Einerseits ist es oft nicht eindeutig bestimmbar, wie "clauses" in gesprochener Sprache segmentiert werden können (für eine ausführliche Diskussion siehe FOSTERITONKYN/ WIGGLESWORTH 2000), andererseits wird so nicht unterschieden, ob pro "clause" ein oder mehrere Fehler vorliegen. MEH- NERT (1998) schließlich verwendet zusätzlich das Maß errors per 100 words. Ihre Auswertungen unterstützen die Annahme, daß dieses Maß sensibler ist als "number of error free clauses", da nur bei der Anwendung des ersten Maßes ihre Ergebnisse statistische Signifikanz erreichten. Für eine feinere Aufschlüsselung der Fehler können diese dann der Forschungsfrage entsprechend weiter klassifiziert werden. Die Komplexität solch allgemeiner Maße gebietet hier die Absicherung der Auswertungen durch eine möglichst hohe Interrater-Reliabilität. lFLllllL 32 (2003) 36 Jan Stevener Als Maße für Komplexität werden seit Anfang der 90er Jahre zunehmend spezifischere Maße eingesetzt. CROOKES (1989) setzt words per utterance als Maß für Komplexität ein. Weder ist klar, wie eine Äußerung in gesprochener Sprache exakt bestimmt werden kann, noch kann so die Qualität von Sprachproduktion erfaßt werden. Vielmehr scheint es der MLR ähnlich, die zur Erfassung von Flüssigkeit eingesetzt wird. Weitaus validere Maße hingegen sind solche, die Subordinationen erfassen. Zu diesem Zweck wird die zu analysierende Sprachproduktion in verschiedene hierarchisch organisierte Einheiten aufgeschlüsselt. FOSTERISKEHAN (1999) unterscheiden z.B. zwischen clauses und c-units. Der Wert der Subordination wird schließlich errechnet, indem die Anzahl der clauses durch die Anzahl der c-units dividiert wird. BYGATE (1999) verwendet als Maße die Länge der t-unit, den Typ der Subordination, die Anzahl von Verb-Argument-Strukturen und die Frequenz von Verbformen und Verbgruppen. Ohne an dieser Stelle in eine ausführliche Diskussion einsteigen zu können, sei darauf hingewiesen, daß all die genannten Einheiten in gesprochener Sprache ungleich schwieriger zu bestimmen sind als in schriftlichen Texten: Eine t-unit beispielsweise wird definiert als Hauptsatz plus alle von ihm abhängigen Nebensätze. Unklar ist jedoch, inwieweit fragmentarische Sätze als t-units gewertet werden können (siehe FOSTERITOMKYN/ WIGGLESWORTH 2000). Auch verschwimmen die Grenzen zu anderen Einheiten wie z.B. sentence, idea unit, proposition, c-unit, clause und s-node. Eine einheitliche Festlegung von Einheiten mündlicher L2-Sprachproduktion ist jedoch Voraussetzung für die Vergleichbarkeit unterschiedlicher Studien. Da in den meisten Publikationen oft aus Platzgründen auf eine detaillierte Diskussion der Segmentierungsprobleme verzichtet werden muß, sind die für Komplexität verwendeten Maße oft nicht hinreichend nachvollziehbar. Im folgenden Abschnitt sollen nun kritisch-methodische Ansätze zur Erfassung des Phänomenbereichs „Automatisierung" diskutiert werden. 3. Automatisierung 3.1 Gegenstand „Automatisierung" beschreibt einen Prozeß sukzessiver Prozeduralisierung deklarativen Wissens. Es wird unterschieden zwischen dem Prozeß selbst, der Automatisierung, und seinem Ergebnis, den „Automatismen". Während bis in die 80er Jahre von einer klaren Dichotomie zwischen kontrollierten und automatisierten Prozessen ausgegangen wurde, wird in neueren Arbeiten ein Kontinuum zwischen beiden Polen angenommen (vgl. UNDERWOODIEVERATT 1996). Während theoretisch weitgehend Einigkeit über die Merkmale von Automatisierung herrscht, ergibt sich für Automatismen das Problem, daß diese Ausdruck unterschiedlich fortgeschrittener Automatisierung sein können. Automatisierungen wurden bislang hauptsächlich im Rahmen der Kognitionspsychologie untersucht, deren Befunde für die Zweitsprachenerwerbsforschung einen wichtigen Bezugspunkt stellen. Bärenfänger (im Druck) beschreibt als Eigenschaften von Automatisierung das power-law of practice und Spezifität. Das power-law of practice besagt, daß bestimmte Aufgaben mit zunehmender Übung schneller und mit weniger Fehlern ausgelFLwL 32 (2003) Aufmerksamkeit, Automatisierung und Monitoring. Zur Forschungsmethodik 37 führt werden. Typisch für den Verlauf von Automatisierungen ist die Plateaubildung: Während anfangs eine lineare Abhängigkeit zwischen aufgewendeter Zeit und Fertigkeitszunahme besteht, hat weitere Übung in der letzten Phase der Automatisierung kaum noch einen Effekt. Darüber hinaus weisen Automatisierungen eine hohe Spezifität auf. Automatisierte Fertigkeiten, z.B. die Bedienung einer amerikanischen Computertastatur, lassen sich deshalb nicht ohne weiteres auf andere Aufgaben, z.B. die Bedienung einer deutschen Computertastatur, übertragen. Automatismen können unterschiedliche Grade von Automatisierung aufweisen. Dementsprechend können die ihnen aus der Kognitionspsychologie zugeschriebenen Eigenschaften bezüglich ihrer Maße unterschiedliche Ausprägungen annehmen. Zu diesen Eigenschaften zählen die Schnelligkeit und Mühelosigkeit der Ausführung, ihre geringe Varianz, die Nutzung geringer kognitiver Ressourcen und die Schwierigkeit ihrer Kontrolle. Für die Zweitsprachenerwerbsforschung ist festzustellen, daß bislang kaum einschlägige empirische Arbeiten zum Thema Automatisierung vorliegen. Gleichwohl gibt es empirische Studien, die im Rahmen bestimmter Fragestellungen auch Automatisierungen und Automatismen erheben. Einerseits sind dies solche Arbeiten, die sprachliche Automatismen als Ausdruck formelhafter und nicht-kreativer Sprachverwendung erheben. Solche Automatismen (z.B. konventionelle Grüße, Pausenfüller, stereotype Syntagmen und feststehende Idiome) werden begrifflich unterschiedlich gefaßt: als "prefabricated pattems" (HAKUTA 1974), als "routines" und "language pattems" (KRASHEN 1981), als "lexicalized phrases" (NATTINGERIDE CARRICO 1992) oder als Makrolexeme (MÜLLER 2000). Andererseits tragen auch Studien zur Sprechflüssigkeit zu einem Erkenntnisgewinn über die Rolle der Automatisierung im Fremdsprachenerwerbsprozeß bei. So sehen sowohl RAUPACH (1987) als auch TOWELLIHAWKINSIBAZERGUI (1996) eine erhöhte Sprechflüssigkeit als Indikator fortschreitender Automatisierung. TOWELLIHAWKINS/ BAZERGUI (1996) versuchen darüber hinaus, ihre Daten in den theoretischen Rahmen des ACT-Modells von ANDERSON (1983) zu integrieren, welches den Erwerb von Fertigkeiten als stufenweise Prozeduralisierung deklarativen Wissens beschreibt. Im folgenden wird dargestellt, welche beobachtbaren Sachverhalte Automatisierung und Automatismen zugeschrieben werden: 3.2 Operationalisierung und Design CROOKES (1991) kritisiert, daß einschlägige Forschungen weitgehend deskriptiv angelegt sind und eines theoretischen Rahmens entbehren. Die meisten Studien sind entweder Fallstudien oder Beispielanalysen (für den Zweitsprachenerwerb bei Kindern u.a. HATCH 1972, HAKUTA 1974, WONG-FILLMORE 1974, MÜLLER 2000 und für den Zweitsprachenerwerb erwachsener Lerner RAUPACH 1984 und 1987, REHBEIN 1987, SCHMIDT 1983), und ihre Verallgemeinerbarkeit muß deshalb als problematisch eingestuft werden. Obwohl TOWELLIHAWKINSIBAZERGUI (1996) die Sprechflüssigkeit einer Gruppe von 12 Probanden in einem longitudinalen Pretest/ Posttest-Design untersuchen, beschränken auch sie sich auf deskriptive Auswertungen. lFLIIJllL 32 (2003) 38 Jan Stevener Dennoch lassen sich eine Reihe beobachtbarer Sachverhalte dem Forschungsgegenstand zuschreiben. Da Automatisierung in der Literatur als Gegenpol zu Aufmerksamkeit beschrieben wird, ließe sich die Verwendung von Automatismen über die Variable - Aufmerksamkeit beeinflussen. Zu erwarten ist hier, daß der Einsatz hoher Aufmerksamkeitsressourcen in einem Bereich zur Verwendung von Automatismen, die ja als geringe kognitive Ressourcen beanspruchend gelten, in einem anderen Bereich führt. Dieser Ansatz wird zur Zeit im DFG-Projekt "Mündliche L2-Produktion" verfolgt. In einem experimentellen 2x3-Design wird einerseits die Interaktionsdimension durch den sozialen Status des Interaktionspartners (höhergestellter Muttersprachler, gleichrangiger Muttersprachler, gleichrangiger Lerner) manipuliert und andererseits die Aufmerksamkeit der Lerner auf bestimmte Aspekte ihrer Sprachproduktion (Inhalt und Korrektheit) gelenkt. Die Auswertung einer solchen kontrollierten Erhebung verspricht wertvolle Erkenntnisse, zumal eine Triangulation des Querschnittsexperiments mit verschiedenen longitudinalen Erhebungen erfolgen wird. Dennoch wird deutlich, daß es derzeit in der Praxis zu wenig Untersuchungen zur Rolle von Automatisierung im L2 Erwerb erwachsener Lerner gibt, in der die verschiedenen Lernfaktoren systematisch kontrolliert werden. Die Schnelligkeit der Ausführung läßt sich durch temporale Variablen erfassen. Geringe Varianz sollte sich in Gestalt gleicher syntaktischer oder lexikalischer Form der Automatismen identifizieren lassen. Hier ist auch anzunehmen, daß automatisierte Lexeme häufiger im mündlichen Output auftreten als nicht-automatisierte Lexeme (RICHARDS 1987). Problematisch hingegen erscheint die Feststellung der Mühelosigkeit von Automatismen. BÄRENFÄNGER (2001: 15) weist daraufhin, daß Automatismen sich der bewußten Kontrolle entziehen und so die naheliegende Erhebung mittels iritrospektiver Verfahren nicht möglich ist. Da Sprecher in stereotypen Situationen jedoch aus Gründen kognitiver Ökonomie bevorzugt automatisierte Routinen einsetzen sollten, könnte hier die Rekurrenz sprachlicher "Items" in spezifischen Situationen erhoben werden. Die Schwierigkeit der Kontrolle sollte sich als Invarianz und Korrekturresistenz widerspiegeln. Zusammenfassend ist jedoch festzustellen, daß derzeit noch zu wenige einschlägige Erhebungen zu Automatismen vorliegen. Im folgenden Abschnitt wird auf die in den bisherigen Erhebungen verwendeten Maße eingegangen. 3.3 Maße Für die Bestimmung von Sprechflüssigkeit verwenden TOWELLIHAWKINS/ BAZERGUI (1996) die bereits erläuterten temporalen Variablen Sprechrate, Artikulationsrate, phonation/ time ratio und mean lenght ofruns. Bei den genannten Maßen ist die Definition von Pausenlängen als ein Basismaß anzusehen; insofern greifen hier die bereits vorgebrachten Einwände zur Verwendung unterschiedlicher Pausenlängen. Obwohl mit der Sprechrate und der Artikulationsrate geeignete Maße für die Feststellung kreativer und automatisierter Sequenzen vorliegen, erscheint eine Anwendung auf größere Produktionssequenzen, bei denen automatisierte Sequenzen neben kreativen Sequenzen vorliegen können, problematisch. Ein hoher Wert bei der phonation/ time ratio kann darauf hindeuten, daß JFLUIL 32 (2003) Aufmerksamkeit, Automatisierung und Monitoring. Zur Forschungsmethodik 39 wenig Planungspausen stattgefunden haben und Automatismen eingesetzt wurden. Während TOWELUHAWKINSIBAZERGUI (1996: 93) erhöhte Werte bei der mean length of runs als Ausdruck zunehmender Prozeduralisierung formulativer Prozesse (d.h. von Automatisierung) sehen, identifiziert RAUPACH (1984) mit der MLR vorgefertigte, formelhafte sprachliche Einheiten (d.h. Automatismen). BÄRENFÄNGER (2002) schlägt des weiteren Verschleifungen als ein Maß vor, das Produktionsgeschwindigkeiten erfassen kann. Zur Zeit liegen noch keine longitudinalen Erhebungen zu Automatismen vor, die das power 0 law of practice für den Zweitsprachenerwerb empirisch bestätigen könnten. Voraussetzung ist die Erhebung longitudinaler Daten zu mehr als zwei Zeitpunkten. TOWELLIHAWKINS/ BAZERGUI (1996) führen jedoch nur einen Vergleich zweier Zeitpunkte durch. Das DFG-Projekt „Mündliche L2-Produktion" erhebt Daten zu drei verschiedenen Zeitpunkten; erste Auswertungen scheinen das power-law of practice zu bestätigen (BÄRENFÄNGER 2001). DieSpezifität von Automatisierungen hingegen sollte sich durch unterschiedliche Automatisierungsgrade in den verschiedenen Teilkompetenzen (Lexik, Syntax etc.) analytisch ermitteln lassen. Für die Erfassung von Automatismen können Formeln, stereotype Syntagmen, Kollokationen, lemertypische Idiome und ähnliche temporale Werte sowie ähnliche phonetische und prosodische Merkmale als Maß „geringer Varianz" gelten. Die Mühelosigkeit beim Einsatz von Automatismen kann einerseits durch die Rekurrenz sprachlicher Items erfaßt werden, andererseits auch durch die genannten temporalen Variablen. Die Nutzung geringer kognitiver Ressourcen bei der Verwendung von Automatismen legt nahe, daß kognitive Ressourcen gleichzeitig für andere planungsintensive Prozesse eingesetzt werden. So sollten auf Automatismen kreative Sprachsequenzen folgen ..Für die Identifizierung sollten z.B. gefüllte und ungefüllte Pausen,fillers, modifiers und organizers (RAUPACH 1984) als Anhaltspunkte gel- .ten. Die Schwierigkeit der Kontrolle automatisierter Prozesse äußert sich in der Invarianz des Ablaufs; auch entziehen sich automatisierte Prozesse der bewußten Kontrolle. Entsprechend sollten in automatisierten Sequenzen keine Abbrüche oder Selbstkorrekturen zu erwarten sein; da sich Sprecher möglicher Fehler nicht bewußt sein dürften. FOSTERI SKEHAN (1996) setzen so folgerichtig auch Neustarts, Ersetzungen, Fehlstarts und Wiederholungen als relevante Maße ein. Problematisch hingegen erscheinen Maße, welche die Korrektheit einer Sequenz erfassen sollen. MÜLLER (2000) schreibt automatisierten Sequenzen größere Korrektheit als kreativen Sequenzen zu. Obwohl dies beispielsweise im Falle von so genannten islands of reliability (DECHERT 1983) berechtigt erscheint, kann Korrektheit doch nicht als Indiz für Automatismen angesehen werden, da auch fehlerhafte Sequenzen automatisiert werden (Fossilisierungen). 4. Monitoring 4.1 Gegenstand Die Tatsache, daß Sprecher fehlerhafte Äußerungen selbstinitiiert abbrechen und reparieren können, belegt die Existenz eines Monitors, der den sprachlichen Output überwacht. Dieser Monitor kann selektiv verschiedene Teilbereiche der Sprachproduktion, z.B. FLuL 32 (2003) 40 Jan Stevener Form, Inhalt oder pragmatische Angemessenheit, überwachen und Reparaturen einleiten. Dementsprechend finden sich Modellierungen einer Monitorkomponente in den wichtigsten Theorien zur Sprachproduktion (z.B. LAVER 1980; LEVELT 1983, 1989; MACKAY 1987, SCHADE 1999). Während BERG (1986: 134) den Monitor als "mental eye" beschreibt, welches Planungs- und Verarbeitungsprozesse beobachtet und damit impliziert, daß der Monitor nicht aktiv in diese Prozesse eingreift, schreiben andere Theorien dem Monitor eine weitaus aktivere Rolle zu. So gehen „Editor-Theorien" des Monitors von einem Zusammenspiel von Filtern, welche die Verwendung bestimmter Elemente verhindern, und Editoren, welche die fehlerhaften Elemente ersetzen, aus. Fehlerhafte Äußerungen entstehen entweder auf Grund fehlerhafter Regeln im Monitor (GARNSEYIDELL 1984) oder weil diese Regeln variieren (MOTLEY [et al.] 1982). Auch bleibt unklar, ob eine Monitorkomponente den gesamten Produktionsprozeß überwacht oder ob es auf jeder Verarbeitungsebene einen Monitor gibt (siehe POSTMAIKOLK 1992). Spreadingactivation-Theorien des Monitors hingegen gehen von keiner gesonderten Monitorkomponente aus, sondern sehen Monitorprozesse als Nebenprodukt von Aktivationsverteilungen in einem Netzwerk. LEVELT (1992) kritisiert hier, daß eine solche Modellierung überhaupt keine Fehler zulasse. LEVELT (1989) postuliert im Rahmen der perceptual loop theory of monitoring, daß der Monitor den Output verschiedener Verarbeitungsebenen überprüfen kann. Hierfür nutzt der Monitor diejenigen Verarbeitungswege, die auch für die Sprachrezeption genutzt werden. Ein Problem dieser Theorie ist jedoch die Frage, warum einige Fehler unbemerkt oder unrepariert bleiben, obwohl die jeweiligen Ll- oder L2-Sprecher über das notwendige Regelwissen verfügen. Da der Monitor auf kontrollierte Prozesse zurückgreift (LEVELT 1989) und die dafür notwendigen Aufmerksamkeitsressourcen begrenzt sind (u.a. ROBIN- SON 1995), wird angenommen, daß diese Begrenzungen die Anzahl und Art entdeckter Fehler beeinflussen (KORMOS 1999). Darüber hinaus ist L2-Sprachproduktion nicht nur weit weniger automatisiert als Ll-Sprachproduktion; auch scheinen Monitorprozesse auf unterschiedlichen Verarbeitungsebenen (z.B. bei der syntaktischen oder phonologischen Enkodierung) nicht gleich stark automatisiert zu sein (KORMOS 2000b). L2-Monitorprozesse sind so in besonderem Maße von Aufmerksamkeitsverteilungen abhängig. Aus dieser Argumentationsfolge werden die wechselseitigen Interdependenzen zwischen Aufmerksamkeit, Automatisierung und Monitoring deutlich. Im folgenden Abschnitt wird so kritisch hinterfragt werden müssen, wie empirische Erhebungen diesen Wechselwirkungen Rechnung tragen. 4.2 Operationalisierung und Design Die Operationalisierung des Forschungsgegenstandes sollte in einer Angabe bestehen, wie Eigenschaften von Monitoring empirisch zu beobachten sind. Sowohl in der L 1als auch in der L2-Forschung werden selbstinitiierte Reparaturen als direkter Ausdruck von Monitortätigkeit interpretiert. Unklarheit besteht jedoch über die genaue Verortung des Monitors im Sprachproduktionsprozeß. So ist anzunehmen, daß sehr früh im Produktionsprozeß Monitortätigkeiten ablaufen und fehlerhafte Äußerungen noch vor ihrer IFJLlllL 32 (2003) Aufmerksamkeit, Automatisierung und Monitoring. Zur Forschungsmethodik 41 Artikulation repariert werden können. Diese Reparaturen werden als covert repairs bezeichnet. Problematisch ist hier, daß Uneinigkeit bezüglich beobachtbarer Eigenschaften besteht. POSTMA/ KOLK (1993) nennen hesitations und Pausen als Indizien für verborgene Reparaturen. Hinsichtlich ihrer Reliabilität muß diese Annahme jedoch als unbefriedigend eingeschätzt werden. KORMOS (2000a: 366) bemerkt zu Recht: "The unambiguous identification of a phenomenon is a precondition for any systematic analysis" und schließt deshalb die Erhebung von covert repairs aus ihren Daten aus. Darüber hinaus ist zu beachten, daß der Monitor zwar einen Fehler entdecken kann, der Sprecher sich aber aus pragmatischen Gründen gegen eine Reparatur entscheiden kann (beispielsweise wenn er die Äußerung trotzdem als verständlich einschätzt oder der Flüssigkeit Priorität einräumt). Demgegenüber gibt es overt repairs: offen artikulierte Abbrüche und Selbstreparaturen, die unproblematisch beobachtbare Sachverhalte darstellen. Obwohl offene Selbstreparaturen als einzigartige Manifestationen von Monitortätigkeiten gelten, werden sie auch aus anderen Perspektiven untersucht, u.a. im Rahmen von konversationellen Interaktionsstrukturen (SCHW ARTZ 1980, WHITE 1997) und Unterrichtsdiskursen (KASPER 1985) sowie von Bedeutungsaushandlungen (Überblick bei PICA 1994). Im Rahmen dieses Überblicks soll nicht erschöpfend auf die im Rahmen der LI- Forschung durchgeführten Erhebungen eingegangen werden (für einen Überblick empfiehlt sich V AN HEST! POULISSE/ BONGAERTS 1997). Methodisch übernimmt die L2- Forschung jedoch die von LEVELT (1983) für die L1 entwickelte Klassifikation von Selbstkorrekturen, die Rückschlüsse darüber erlaubt, welche Aspekte der Sprachproduktion (z.B. Inhalt, Angemessenheit oder Form) vom Monitor überwacht werden (eine Darstellung erfolgt unter „Maße"). Dieser "monitor bias" (LEVELT 1989) gilt als weiterer Beweis für die selektive Aufmerksamkeit des Monitors. Auch wurde bereits durch in der LI-Forschung erhobene Daten deutlich, daß unterschiedliche Aufgaben differierende Ergebnisse erzielen können. LEVELT (1983) erhob Daten in Laborstudien mittels einer einfachen Musterbeschreibungsaufgabe, bei der die Probanden angewiesen wurden, so deutlich, wie es ihnen möglich wäre, diese zu beschreiben; aufgrund einer solchen Anweisung könnte der Monitor vor allem auf die Eindeutigkeit und Kohärenz der Sprachproduktion gerichtet worden sein. BREDART (1991) hingegen nutzte Daten aus Fernsehprogrammen und alltäglichen Konversationen und ermittelte unterschiedliche Werte bei den Häufigkeiten und Verteilungen von Selbstkorrekturen. V AN HEST (1996) konnte in einer Erhebung mittels dreier unterschiedlicher Aufgabentypen weiter den Einfluß des Aufgabentyps auf Korrekturhäufigkeiten und -verteilungen belegen. Die Vergleichbarkeit von Studien, die so unterschiedliche Aufgaben wie Bildbeschreibungen (V AN HEST 1996), Musterbeschreibungen (LEVELT 1983, VERHOEVEN 1989), strukturierte und offene Interviews (FATHMAN 1980; KORMOS 2000a, 2000b, VANHEST 1996), Rollenspiele (KORMOS 2000a, 2000b) und Nacherzählungen (FATHMAN 1980, LENNON 1990, VAN HEST 1996, VERHOEVEN 1989) verwenden, scheint so ausgesprochen fragwürdig. Eine Möglichkeit, die Reliabilität dieser Erhebungen zu erhöhen, besteht darin, unmittelbar im Anschluß an die Aufgaben Retrospektionen durchzuführen. KORMOS (2000a) bat so ihre Probanden, eine Audioaufzeichnung ihrer Performanz bezüglich Selbstreparaturen und Abbrüche zu kommentieren. Obwohl sich auf diesem Wege wertvolle IFbllL 32 (2003) 42 Jan Stevener Informationen zu bewußten Monitortätigkeiten erheben lassen (z.B. warum Sprecher sich gegen eine Reparatur entscheiden), sind automatisierte Monitorprozesse diesem Verfahren möglicherweise nicht zugänglich. Weitere Aufschlüsse über den Automatisierungsgrad von Monitorprozessen könnten durch die Analyse temporaler Phänomene gewonnen werden. So sind Studien zu kritisieren, die aufgrund ihres Datenformats diese Möglichkeit nicht gestatten: NOOTEBOOM (1980) beispielsweise verwendet ebenso wie BERG (1986) einen schriftlichenDatenkorpus (die Versprechersammlung von MERINGER 1908). Querschnittstudien, die temporale Phänomene erhoben, konnten zeigen, daß L2-Sprecher deutlich mehr Verzögerungen und Selbstreparaturen produzieren als LI-Sprecher (TEMPLE 1992; WIESE 1982, 1984). KORMOS (2000b) konnte an Hand temporaler Analysen weiter zeigen, daß sich Ll- und L2-Sprecher hinsichtlich der Zeit unterscheiden, die vom Abbruch bis zur Reparatur ( cutoff-to-repair time) benötigt wird, nicht jedoch hinsichtlich der Zeit, die vom Fehler bis zum Abbruch (error-to-cut-off time) erforderlich ist. Weitere Klärung zur Rolle des Monitors im L2- Erwerbsprozeß versprechen jene Studien, die das Kompetenzniveau als Variable operationalisieren. LENNON (1990, 1994) konnte nachweisen, daß im Laufe des L2-Erwerbs zwar die Flüssigkeit zunimmt, die Anzahl von Selbstkorrekturen jedoch weitgehend stabil bleibt. KORMOS (2000a) konnte in einer Querschnittstudie mit Probanden unterschiedlicher Niveaus weiter belegen, daß mit zunehmender L2-Kompetenz zunehmend diskursspezifische Aspekte der Sprachproduktion vom Monitor überwacht werden. SELIGER (1980) hingegen stellte individuelle Unterschiede bezüglich des Selbstreparaturverhaltens seiner Probanden fest. Dies spricht aus methodischer Sicht für die Erhebung longitudinaler Daten der gleichen Sprecher. Das DFG-Projekt „Mündliche L2-Produktion" kombiniert eine Querschnittstudie mit einer Longitudinalstudie. Über die Erhebung von Sekundärdaten ermöglicht das hier verwendete Design die Berücksichtigung individueller Unterschiede. Die durch Interviews elizitierte Sprachproduktion der longitudinalen Erhebung verspricht weitere Erkenntnisse zum Zusammenhang zwischen L2-Kompetenz und Monitortätigkeit. Darüber hinaus wurden die Probanden in einer experimentellen Bedingung gebeten, besonders auf die Form ihrer Äußerungen zu achten. KORMOS (2000a: 335) sieht dies als ein probates Mittel, den Probanden dazu zu bewegen, nicht auf Reparaturen zu verzichten. Die Entscheidung, nicht zu korrigieren, gilt jedoch als Störvariable, die vor allem die Validität einer jeden Erhebung beeinflußt. Die vom oben genannten DFG-Projekt angestrebte Triangulation dieser Daten mit longitudinal gewonnenen Daten setzt jedoch Klarheit der verwendeten Maße voraus. Im folgenden sollen die bisher in diesem Kontext verwendeten Maße vorgestellt werden. 4.3 Maße Einerseits erlaubt die Klassifikation von Selbstreparaturen Aufschlüsse über Verteilungen und Häufigkeiten derselben und damit über die Sensibilität des Monitors für bestimmte Bereiche; andererseits lassen sich durch temporale Variablen Aufschlüsse über sich automatisierende Monitorprozesse gewinnen. lFLIIL 32 (2003) Aufmerksamkeit, Automatisierung und Monitoring. Zur Forschungsmethodik 43 Bei der Klassifikation sind vier Hauptkategorien nach LEVELT (1989) und BREDART (1991) zu unterscheiden (für eine ausführliche Diskussion dieser Kategorien siehe KORMOS 1998 und 1999): Eine D-Reparatur (difference-repair) wird durchgeführt, wenn der Sprecher sich entscheidet, andere Informationen zu enkodieren als jene, die er gerade enkodiert; diese Reparatur betrifft semantische Aspekte. Eine A-Reparatur (appropriacyrepair) beruht auf der Entscheidung, Informationen in einer modifizierten Weise auszudrücken (z.B. präziser, kohärenter oder pragmatisch angemessener). E-Reparaturen (error-repairs) werden durchgeführt, wenn zufällige Verarbeitungsfehler der Enkodierung korrigiert werden (z.B. Versprecher). R-Reparaturen (rephrasing-repairs) schließlich sind L2-spezifische Fehlerreparaturen, die nicht auf einem zufälligen Fehler beruhen, sondern auf dem Versuch, fehlende L2-Kompetenz durch eine Reformulierung auszugleichen. Je nach Fragestellung werden darüber hinaus weitere Feineinteilungen vorgenommen. So unterscheidet O'CONNOR (1988) zwischen antizipatorischen und korrektiven Reparaturen, während E-Reparaturen nach phonologischen, morphologischen, lexikalischen oder syntaktischen Reparaturen aufgeschlüsselt werden können (KORMOS 2000a; LENNON 1990, 1994; POULISSE 1993; POULISSE/ BONGAERTS 1994; TEMPLE 1992; VAN HEST 1996; WIESE 1982, 1984). Zu beachten ist jedoch, daß die Kategorien R-Reparatur und lexikalische E-Reparatur deckungsgleich sein können (KORMOS 2000a: 366). Obwohl die in diesem Bereich durchgeführten Studien zeigen, daß der Monitor besonders sensibel für lexikalische Fehler zu sein scheint (KORMOS 2000a), so muß doch ein weiteres Maß zur Feststellung von Häufigkeiten ergänzend hinzugezogen werden: die Korrekturrate von Fehlern. Diese errechnet sich aus der Anzahl von Fehlerkorrekturen pro 100 Wörter und gilt als globales Maß für die Sensibilität des Monitors. Insbesondere durch dieses Maß, welches auch separat für bestillllllte Fehler errechnet werden kann, lassen sich Veränderungen im L2-Erwerbsprozeß aufzeigen. Da sich die Korrekturrate auf kürzere Sequenzen bezieht, gilt sie als präziserer Indikator für Monitorprozesse als die Häufigkeit von Fehlern oder die Reparaturrate (die sich aus der Anzahl von Reparaturen dividiert durch die Anzahl gemachter Fehler errechnet). Einschränkend muß jedoch hinzugefügt werden, daß die Korrekturrate nur ein sehr indirektes Maß für Monitorprozesse ist und weder Aufschluß über covert repairs noch über bewußt nicht korrigierte Sequenzen geben kann. Po~TMA! KOLK (1992, 1993) nennen lange Pausen und Verzögerungsphänomene (also z.B. gefüllte Pausen, Dehnungen und Wiederholungen) als Indizien für covert repairs. Die Reliabilität dieser Maße ist aber als so gering einzustufen, daß z.B. KoRMOS (2000a) auf die Erhebung dieser Reparaturen verzichtet. Für die Erfassung temporaler Variablen finden sich unterschiedliche Maße. So berücksichtigen KORMOS (2000b), LENNON (1990) und TEMPLE (1992) die Sprechrate als Maß der Automatisierung. Eine fortgeschrittene Automatisierung scheint hier zusätzliche kognitive Ressourcen für Monitorprozesse freizugeben. Präzisere Maße für den zeitlichen Verlauf von Monitorprozessen wurden von VAN HEST (1996) und KORMOS (2000b) eingesetzt. V AN HEST (1996) untersuchte neben Verteilungen und Häufigkeiten auch das Intervall zwischen Fehler und Abbruch (error-to-cut-off time), das als Maß für die Geschwindigkeit des Fehlerentdeckens (error detection) durch den Monitor gilt, wie auch das Intervall vom Abbruch bis zur Reparatur (cut-off-to-repair time), das als Maß für die IFLwL 32 (2003) 44 Jan Stevener Geschwindigkeit der Neuplanung gilt. Eine hohe Geschwindigkeit dieser Werte gilt ihr als Maß für die Länge der jeweiligen Verarbeitungswege; ihre Ergebnisse bestätigen Levelts perceptual loop theory of monitoring. KORMOS (2000b) hingegen setzte diese Maße in Bezug zum L2-Niveau ihrer Probanden und_ konnte belegen, daß nur das Intervall zwischen Abbruch und Reparatur als Indikator für den Automatisierungsgrad von Enkodierungsprozessen, und damit als Indikator des L2-Erwerbs, gelten kann. Für eine präzise Beschreibung von Monitorprozessen im Rahmen des L2-Erwerbs scheint so eine Kombination solcher Maße vielversprechend, die Verteilungen, Häufigkeiten und temporale Variablen erfassen. 5. Fazit Im Rahmen des hier vorgestellten methodisch orientierten Überblicks zeigt sich, daß empirische Erhebungen zu den kognitiven Prozessen Aufmerksamkeit, Automatisierung und Monitoring den Interdependenzen zwischen diesen Prozessen nur ungenügend Rechnung tragen. Am deutlichsten zeigt sich dies bei den Eigenschaften, die den jeweiligen Untersuchungsgegenständen zugesprochen werden. So gilt Korrektheit einerseits als Eigenschaft der Automatisierung (MÜLLER 2000), andererseits auch als Indiz für auf die sprachliche Form gerichtete Aufmerksamkeit. SKEHANIFOSTER (1996) sehen wenige Selbstkorrekturen als Indiz für Flüssigkeit, während empirisch ein Zusammenhang zwischen steigender Flüssigkeit in der L2 und geringerer Korrekturrate nicht bestätigt werden konnte (LENNON 1990, 1994). Darüber hinaus scheint die Beschreibung des zeitlichen Verlaufs von Monitorprozessen über das Maß cut-off-to-repair time einen Indikator für die Automatisierung von Sprachproduktionsprozessen bereitzustellen (KORMOS 2000b: 159). Monitorprozesse sind andererseits von Aufmerksamkeitsressourcen abhängig, die über die Art und Anzahl entdeckter Fehler entscheiden. Obwohl LEVELT (1989) Monitorprozesse als kontrolliert bezeichnet, legen die empirischen Befunde von KORMOS (2000b) zumindest eine Automatisierung bestimmter Monitortätigkeiten (z.B. bei phonologischen Fehlern) nahe. Ebenso ist ungeklärt, inwieweit covert repairs kontrollierte oder automatisierte Prozesse darstellen. Wenn VAN HEST/ POULISSE/ BONGAERTS (1997: 86) an empirischen Erhebungen zu Selbstkorrekturen in der L2 bemängeln, diese entbehrten einer zugrunde liegenden Theorie, so spricht dies ein Manko auch der zu Aufmerksamkeitsverteilungen und Automatisierung in der L2-Erwerbsforschung durchgeführten Erhebungen an. Ein dringendes Desiderat ist darum die Schaffung eines theoretischen Rahmens, der überprüfbare bzw. falsifizierbare Annahmen über die Wechselwirkungen der kognitiven Prozesse Aufmerksamkeit, Automatisierung und Monitoring im L2-Erwerb gestattet. Auf dieser Grundlage könnte Einigkeit über die den Untersuchungsgegenständen zugesprochenen Eigenschaften und Maße erzielt werden. Ein zweites Desiderat ist die Schaffung vergleichbarer Operationalisierungen. Zum einen ist deutlich geworden, daß der Einfluß des Aufgabentyps insbesondere auf Aufmerksamkeitsverteilungen und Monitorprozesse die Vergleichbarkeit unterschiedlicher lFL1! 1L 32 (2003) Aufmerksamkeit, Automatisierung und Monitoring. Zur Forschungsmethodik 45 empirischer Studien erschwert. Zum anderen bestehen Diskrepanzen in der Festlegung der anzusetzenden Maße: Dies gilt vor allem für die Bestimmung von Pausen und die Segmentierung mündlicher Sprachproduktion. Dies erschwert zusätzlich die Vergleichbarkeit von Resultaten. Darüber hinaus verspricht der Einsatz von Retrospektionen weitere Aufschlüsse über die Rolle der Aufmerksamkeit und kontrollierter Monitorprozesse in der L2-Sprachproduktion. Die von KORMOS (2000a, 2000b) durchgeführten Erhebungen zeigen, daß Retrospektionen wertvolle Hinweise für die Interpretation von Ergebnissen liefern können. Um weitere Erkenntnisse zur Rolle von Aufmerksamkeit, Automatisierung und Monitoring im L2-Erwerbsprozeß zu gewinnen, empfehlen sich Longitudinalstudien, die im Vergleich mit Querschnittstudien stärker individuelle Erwerbsverläufe berücksichtigen. Auch scheinen Erwerbsprozesse sich anhand temporaler Variablen nachzeichnen zu lassen. Ein weiteres Desiderat ist deshalb die longitudinale Erhebung temporaler Variablen mittels präzisester Instrumente. Erst wenn empirische Erhebungen eine genaue Eingrenzung des Untersuchungsgegenstandes, seiner Eigenschaften sowie eine genaue Überprüfung der Angemessenheit von Datenerhebungsmethoden vorweisen können, genügen sie dem Ideal einer kritischen Wissenschaftlichkeit; in diesem Sinne ist die derzeitige empirische Forschungslage sowohl qualitativ als auch quantitativ als noch unbefriedigend einzuschätzen. Literatur AG FREMDSPRACHENERWERB BIELEFELD (2000): "Zur Effektivität verschiedener Instruktionstypen für die Vermittlung einer komplexen zielsprachlichen Struktur". In: Fremdsprachen Lehren und Lernen 29, 191-218. AGUADO, Karin (2000): "Empirische Fremdsprachenerwerbsforschung. Ein Plädoyer für mehr Transparenz". In: Id. (Hrsg.): Zur Methodologie in der empirischen Fremdsprachenerwerbsforschung. Baltmannsweiler: Schneider-Verlag Hohengehren, 119-131. AGUADO, Karin/ RIEMER, Claudia (2001): "Triangulation: Chancen und Grenzen mehrmethodischer empirischer Forschung". In: ID. (Hrsg.): Wege und Ziele. Zur Theorie, Empirie und Praxis des Deutschen als Fremdsprache (und anderer Fremdsprachen) Festschrift für Gert Henrici zum 60. Geburtstag. Baltmannsweiler: Schneider-Verlag Hohengehren, 245-257. ANDERSON, John R. (1983): The Architecture of cognition. Cambridge, MA: Harvard University Press. BÄRENFÄNGER, Olaf (2001): "Detecting automatised speech sequenzes in L2 speech production: Measures and instruments". Posterpräsentation auf der 11. EUROSLA, 26.-29.09.01 in Paderborn. BÄRENFÄNGER, Olaf (2002): "Automatisierung der mündlichen L2-Produktion: Methodische Überlegungen". In: BöRNER, Wolfgang/ VOGEL, Klaus (Hrsg.): Grammatik und Fremdsprachenunterricht. Kognitive, psycholinguistische und erwerbstheoretische Perspektiven. Tübingen: Narr, 119-140. BÄRENFÄNGER, Oiaf/ BEYER, Sabine (2001): "Forschungsprojekt: Zur Funktion der mündlichen L2- Produktion und zu den damit verbundenen kognitiven Prozessen für den Erwerb der fremdsprachlichen Fertigkeit". In: Zeitschrift für Fremdsprachenforschung 12.1, 131-137. BÄRENFÄNGER, Olaf/ STEVENER, Jan (2001): "Datenerhebungsverfahren und ihre Evaluation. Ein Kriterienkatalog". In: Fremdsprachen Lehren und Lernen 30, 13-27. BERG, Thomas (1986): "The prbblem of language control: Editing, monitoring, and feedback". In: Psychological Research 48, 133-144. lFlLl.llL 32 (2003) 46 Jan Stevener BREDART, Sorge (1991): "Word interruption in self-repairing". In: Journal of Psycholinguistic Research 20, 123-137. BYGATE, Martin (1999): "Quality oflanguage and purpose of task: Patterns of leamers'language on two oral communication tasks". In: Language Teaching Research, 3.3, 185-214. BYGATE, Martin (1996): "Effects of task repetition: Appraising the developing language oflearners". In: WILLIS, Jano/ WILLIS, Dave (eds.): Challenge and change in language teaching. London: Heinemann, 136-146. CADIERNO, Teresa (1995): "Formal instruction from a processing perspective: An investigation into the spanish past tense". In: Modern Language Journal 79, 179-193. COLEMAN, James A. / TOWELL, Richard (eds.): The Advanced Language Learner. London: CILTR. COOK, Vivian (1991): Second Language Learning and Language Teaching. London: Arnold. COOK, Vivian (1993): Linguistics and Second Language Acquisition. London: Macmillan. CROOKES, Graham (1989): "Planning and interlanguage variation". In: Studies in Second Language Acquisition 11, 367-383. CROOKES, Graham (1991 ): "Second language speech production research: A methodologically orientated review". In: Studies in Second Language Acquisition 13, 113-132. DECHERT, Hans W. (1983): "How a story is done in a second language". In: FJERCH, Claus/ KASPER, Gabriele (eds.): Strategies in Interlanguage Communication. London: Longman, 175-195. DECHERT, Hans W. / RAUPACH, Manfred (1980a) (eds.): Towards a Cross-linguistic Assessment of Language Production. Frankfurt: Lang. DECHERT, Hans / RAUPACH, Manfred (1980b) (eds. ): Tempora/ Variables in Speech. Den Haag: Mouton. DECHERT, Hans W./ RAUPACH, Manfred (1987) (eds.): Psycholinguistic Models of Production. Norwood, NJ: Ablex. DE GRAAFF, Rick (1997): "The 'experanto' experiment: Effects of explicit instruction on second language acquisition". In: Studies in Second Language Acquisiton 19, 249-276. DEKAYSER, Robert (1995): "Leaming second language grammar rules. An experiment with a miniature linguistic system". In: Studies in Second Language Acquisition 17, 379-410. ELLIS, Rod (1987): "Interlanguage variability in narrative discourse: Style shifting in the use of the past tense". In: Studies in Second Language Acquisition 9, l-20. FATHMAN, Ann K. (1980): "Repetition and correction as an indication of speech planning and execution processes among second language leamers". In: DECHERT/ RAUPACH (eds.) 1980a 77-86. POSTER, Pauline / SKEHAN, Peter (1996): "The influence of planning and task type on second language performance". In: Studies in Second Language Acquisition 18.3, 299-323. POSTER, Pauline / SKEHAN, Peter (1999): "The influence of source of planning and focus of planning on task-based performance". In: Language Teaching 3.3, 215-247. POSTER, Pauline/ TONKYN, Alan/ WIGGLESWORTH, Gillian (2000): "Measuring spoken Language: A unit for all reasons". In: Applied Linguistics 21.3, 354--375. GOLDMAN-ErSLER, Frieda (1968): Psycholinguistics: Experiments in Spontaneous Speech. London: Academic Press. GRIFFITHS, Roger (1991): "Pausological research in an L2 context: A rationale, and a review of selected studies". In: Applied Linguistics 12.4, 345-364. GROSJEAN, Fran1,ois (1980): "Linguistic structures and performance structures: Studies in pause distribution". In: DECHERT/ RAUPACH (eds.) (1980b), 91-105. HAKUTA, Kenji (1974): "Prefabricated pattems and the emergence of structure in second language acquisition". In: Language Learning 24, 287-297. HATCH, Evelyn (1972): "Some studies in language leaming". In: UCLA Workpapers in Teaching English as a Foreign Language 6, 29-36. KASPER, Gabriele (1985): "Repair in foreign language teaching". In: Studies in Second Language IFLIIIL 32 (2003) Aufmerksamkeit, Automatisierung und Monitoring. Zur Forschungsmethodik 47 Acquisition 14, 25-38. KORMOS, Judit (1998): "A new psycholinguistic taxonomy for self-repair in L2: A qualitative analysis with retrospection". In: Even Yearbook, ELTE SEAS Working Papers in Linguistics 3, 43-68. KORMOS, Judit (1999): "Monitoring and self-repair in L2". In: Language Leaming 49.2, 303-342. KORMOS, Judit (2000a): "The role of attention in monitoring second language speech production". In: Language Learning 50.2, 343-384. KORMOS, Judit (2000b): "The timing of self-repairs in second language speech production". In: Studies in Second Language Acquisition 22, 145-167. KRASHEN, Stephen D. (1981): Second language acquisition and second language learning. Oxford: Pergamon. LAVER, John (1980): "Monitoring systems in the neurolinguistic control of speech production". In: FROMKIN, Victoria A. (ed.): Errors in Linguistic Performance: Slips of the Tongue, Ear, Pen, and hand. New York: Academic Press, 287-305. LENNON, Paul (1990): "Investigating fluency in EFL: A quantitative approach". In: Language Learning 40, 387-417. LENNON, Paul (1994): "Self-correction and error in advanced learner spoken narrative". In: BARTELT, Guillermo (ed.): The Dynamics of Language Processes. Essays in Honor of Hans W. Dechert. Tübingen: Narr, 180-195. LEVELT, Willem J. M. (1983): "Monitoring and Self-repair in Speech". In: Cognition 33, 41-103. LEVELT, Willem J. M. (1989): Speaking: from intention to articulation. Cambridge, MA: MIT Press. LEVELT, Willem J.M. (1992): "The perceptual loop theory not disconfirmed: A reply to MacKay". In: Consciousness and Cognition 1, 226-230. LONG, Michael/ ROBINSON, Peter (1998): "Focus on form. Theory, research, and practice". In: DOUGHTY, Catherine/ WILLIAMS, Jessica (eds.): Focus on form in classroom second language acquisition. Cambridge: Cambridge University Press, 15-41. MACKAY, Donald G. (1987): The Organization of Perception and Action: A Theory for Language and other Cognitive Skills. New York; Springer. MEHNERT, Uta (1998): "The effects of different length oftime for planning on second language performance". In: Studies in Second Language Acquisition, 20.1, 83-107. MERINGER, Rudolf (1908): Aus dem Leben der Sprache. Berlin; Behr's Verlag. MöHLE, Dorothea / RAUPACH, Manfred (1987): ''The representation problem in interlanguage theory". In: LöRSCHER, Wolfgang/ SCHULZE, Rainer (eds.): Perspectives on Language in Performance. Tübingen: Narr, 1158-1173. MOTLEY, Michael T. / CAMDEN, Carl T. / BAARS, Bemard J. (1982): "Covert formulation and editing of anomalies in speech production: Evidence from experimentally elicited slips of the tongue". In: Journal of Verbal Leaming and Verbal Behaviour 21, 578-594. MÜLLER, Klaus (2000): Lernen im Dialog. Gestaltlinguistische Aspekte des Zweitsprachenerwerbs. Tübingen: Narr. NATTINGER, James R./ DE CARRICO, Jeanette S. (1992): Lexical Phrases and Language Teaching. Oxford: Oxford University Press. NOOTEBOOM, Sieb G. (1980): "Speaking and unspeaking: Detection and correction of phonological and lexical errors in spontaneous speech". In: FROMKIN, Victoria A. (ed.): Slips of the Tongue, Ear, Pen, and Hand. New York; Academic Press, 87-95. O'CONNOR, Nick (1988): "Repairs as indicative of interlanguage variation and change". In: WALSH, Thomas J. (ed.): Georgetown University Round Table in Languages and Linguistics 1988: Synchronie and Diachronie Approaches to Linguistic Variation and Change. Washington, DC: Georgetown University Press, 251-259. PICA, Teresa (1994): "Research on negotiation: What does it reveal about second language learning conditions, processes and outcomes? " In: Language Learning 44, 493-527. JFJLIIIL 32 (2003) 48 Jan Stevener POSTMA, Albert/ KOLK, Herman (1992): "The effects of noise masking and required accuracy on speech errors, disfluencies, and self-repairs". In: Journal of Speech and Hearing Research 35, 537-544. POSTMA, Albert/ KOLK, Herman (1993): "Tue covert repair hypothesis: Prearticulatory repair processes in normal and stuttered disfluencies". In: Journal of Speech and Hearing Research 36, 472--487. POULISSE, Nanda (1993): "Slips of the tongue and their correction in L2 learner speech: Metalinguistic awareness and second language acquisition". Paper presented at the 10 th World Congress of Applied Linguistics, Amsterdam. POULISSE, Nanda/ BONGAERTS, Theo (1994): "First language use in second language production". In: Applied Linguistics 15, 36-57. RAUPACH, Manfred (1980): "Temporal variables in first and second language speech production". In: DECHERT/ RAUPACH (eds.) (1980b), 263-270. RAUPACH, Manfred (1984): "Formulae in second language speech production". In: DECHERT, Hans W. / MÖHLE, Dorothea/ RAUPACH, Manfred (eds.): Second Language Productions. Tübingen: Narr, 114-137. RAUPACH, Manfred (1987): "Procedural leaming in advanced learners of a foreign language". In: COLE- MAN/ TOWELL (eds.), 123-155. REHBEIN, Jochen (1987): "Multiple Formulae. Aspects ofTurkish migrant workers Germanin intercultural communication". In: KNAPP, Karlfried / ENNINGER, Werner/ KNAPP-POTTHOFF, Annelie (eds.): Analysing intercultural communication. Berlin; Mouton de Gruyter, 215-248. RICHARDS, Brian (1987): "Type/ Token ratlos: What do the really tel1 us? " In: Journal of Child Language 14, 201-209. RIGGENBACH, Heidi (1991): "Towards an understanding of fluency: A microanalysis of nonnative speakers conversations". In: Discourse Analysis 14.4, 423--443. ROBINSON, Peter (1995): "Attention, memory and the 'noticing' hypothesis". In: Language learning 45, 283-331. ROBINSON, Peter (1996): "Learning simple and complex second language rules under irnplicit, incidental, rule-search, and instructed conditions". In: Studies in Second Language Acquisition 18, 27-67. SAJAVAARA, Kari (1987): "Second language speech production: Factors affecting fluency". In: DECHERT/ RAUPACH (eds.), 45--65. SCHADE, Ulrich (1999): Konnektionistische Sprachproduktion. Wiesbaden: Deutscher Universitätsverlag. SCHMIDT, Richard (1983): "Interaction, Acculturation and the acquisition of communicative competence: A case study of an adult". In: WOLFSON, Nessa/ JUDD, Elliot (eds.): Sociolinguistics and Language Acquisition. Rowley, MA: Newbury House, 137-174. SCHMIDT, Richard (1990): "Tue role of consciousness in second language learning". In: Applied Linguistics 11, 129-158. SCHMIDT, Richard (1994): "Deconstructing consciousness in search of useful definitions for applied linguistics". In: HULSTIJN, Jan H. / SCHMIDT, Richard (eds.): Consciousness in second language learning. (AIIA Review 11, Special issue), 11-26. SCHWARTZ, Joan (1980): "The negotiation for meaning: Repair in conversations between second language learners of English". In: LARSEN-FREEMAN, Diane (ed.): Discourse Analysis in Second Language Research. Rowley, MA: Newbury House, 237-326. SELIGER, Herbert (1980): "Utterance planning and correction behaviour: Its function in the grammar construction process for second language learners". In: DECHERT/ RAUPACH (eds.) (1980a), 87-99. SHARWOOD-SMITH, Michael (1991): "Consciousness raising and the second language learner". In: Applied Linguistics 2, 441--457. SKEHM-1, Peter (1996): "A framework for the implementation of task-based instruction". In: Applied Linguistics 17, 38-62. SKEHAN, Peter/ POSTER, Pauline (1997): "Task type and task processing conditions as influences on foreign language performance". In: Language Teaching Research 1.3, 185-211. lFLd 32 (2003) Aufmerksamkeit, Automatisierung und Monitoring. Zur Forschungsmethodik 49 SPADA, Nina/ LIGHTBOWN, Patsy (1993): "Instructions and the development of questions in L2 Classrooms". In: Studies in Second Language Acquisition 15.2, 205-224. TATEYAMA, Yumiko [et al.] (1997): "Explicit and implicit teaching ofpragmatic routines". In: BOUTON, Lawrence (ed.): Pragmatics and Language Learning. Vol 8. Urbany, Ill.: University oflllinois, 163- 177. TEMPLE, Liz (1992): "Disfluencies in learner speech". In: Australian Review of Applied Linguistics 15, 29-44. TOMLIN, Russels / VILLA, Victor (1994): "Attention in cognitive science and second language acquisition". In: Studies in Second Language Acquisition 16, 183-203. TOWELL, Richard (1987): "Approaches to the analyses ofthe oral language development ofthe advanced learner. In: COLEMAN/ TOWELL (eds.), 157-181. TOWELL, Richard/ HAWKINS, Roger/ BAZERGUI, Nives (1996): "The development of fluency in advanced learners of french". In: Applied Linguistics 17.1, 86-119. UNDERWOOD, Geoffrey / EVERATT, John (1996): "Automatische und gesteuerte Informationsverarbeitung: Die Rolle der Aufmerksamkeit bei der Verarbeitung des Neuen". In: NEUMANN, Odmar / SAN- DERS, Andries F. (Hrsg.): Enzyklopädie der Psychologie. Themenbereich C: Theorie und Forschung, Serie 2: Kognition, Band 2: Aufmerksamkeit. Göttingen: Hogrefe, 267-351. VAN HEST, Ema (1996): Self-repair in LI and L2 Production. Tilburg, Niederlande: Tilburg University Press. V AN HEST, Ema / POULISSE, Nanda / BONGAERTS, Theo (1997): "Self-repair in Ll and L2 production: An overview". In: / TL Review of Applied Linguistics 117/ 118, 85-115. V ANPATTEN, Bill (1990): "The acquisition of clitic pronouns in Spanish: Two case studies". In: V AN- PATTEN, Bill / LEE, James (eds.): Second Language Acquisition/ Foreign Language Learning. Clevedon: Multilingual Matters, 118-139. V ANPATTEN, Bill (1996): Input processing and grammar instruction. New York: Ablex. V ANPATTEN, Bill/ CADIERNO, Teresa (1993a): "Explicit instruction and input processing". In: Studies in Second Language Learning 15.2, 225-243. V ANPATTEN, Bill/ CADIERNO, Teresa (1993b ): "Input processing and Second Language Acquistion: The role of instruction". In: The Modem Language Journal 77.1, 45-57. VERHOEVEN, Ludo T. (1989): "Monitoring in children's second language speech". In: Second Language Research 5, 141-155. WHITE, Ron (1997): "Back channelling, repair, pausing and private speech". In: Applied Linguistics 18, 85-115. WHITE, Lydia/ SPADA, Nina/ LIGHTBOWN, Patsy / RANTA, Leila (1991): "Input enhancement and L2 question formation". In: Applied Linguistics 12, 416-432. WIESE, Richard (1982): Psycholinguistische Aspekte der Sprachproduktion: Sprechverhalten und Verbalisierungsprozesse. Düsseldorf (Dissertation Universität Bielefeld). WIESE, Richard (1984): "Language production in foreign and native languages: Same or different? " In: DECHERT, Hans W. / MöHLE, Dorothea/ RAUPACH, Manfred (eds.): Second Language Productions. Tübingen: Narr, 11-25 WIGGLESWORTH, Gillian (1997): "An investigation of planning time and proficiency level on oral test discourse". In: Language Testing 14.1, 85-106. WONG-FILLMORE, Lily (1976): The Second Time Around: Cognitive and Social Strategies in Second Language Acquisition. Ph.D. Dissertation, Stanford, CA. ZHOU, Yan-Ping (1991 ): "The effect of explicit instruction ofEnglish grammatical structures by Chinese learners". In: JAMES, Carl/ GARRETT, Peter (eds.): Language awareness in the classroom. London: Longman, 245-277. IFJLwL 32 (2003)