eBooks

Redeflüssigkeit und Dolmetschqualität

Wirkung und Bewertung

0128
2019
978-3-8233-9281-1
978-3-8233-8281-2
Gunter Narr Verlag 
Sylvi Rennert

Dolmetschqualität ist ein komplexes Thema, das sich im Spannungsfeld zwischen den Anforderungen und Erwartungen von Nutzer:innen wie Dolmetscher:innen und der subjektiven Einschätzung des Publikums bewegt. Eine Dolmetschung soll so gut verständlich sein wie das Original, in der Realität orientieren sich Nutzer:innen aber häufig am Höreindruck und beurteilen Dolmetschungen eher nach prosodischen als nach inhaltlichen Faktoren. Diese Studie untersucht den Einfluss von Redeflüssigkeit auf die zwei Qualitätsaspekte der kognitiven Wirkungsäquivalenz und der subjektiven Bewertung durch das Publikum. Aufbauend auf einer theoretischen Betrachtung verschiedener Qualitätsaspekte und deren Operationalisierung sowie der Komponenten von Redeflüssigkeit wird die Entwicklung des Versuchsdesigns und -materials eingehend beschrieben. Im Experiment zeigt sich, dass eine weniger flüssige Dolmetschung zwar gleich gut verstanden wird wie eine flüssige, das Publikum aber glaubt, sie schlechter verstanden zu haben.

TRANSLATIONSWISSENSCHAFT BAND 14 REDEFLÜSSIGKEIT UND DOLMETSCH- QUALITÄT Wirkung und Bewertung Sylvi Rennert Redeflüssigkeit und Dolmetschqualität TRANSLATIONSWISSENSCHAFT · BAND 1 herausgegeben von Klaus Kaindl und Franz Pöchhacker (Universität Wien) Gyde Hansen (Kopenhagen) Christiane Nord (Heidelberg) Hanna Risku (Wien) Christina Schäffner (Birmingham) Robin Setton (Paris) 4 Sylvi Rennert Redeflüssigkeit und Dolmetschqualität Wirkung und Bewertung © 2019 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Internet: www.narr.de E-Mail: info@narr.de CPI Books GmbH, Leck ISSN 1614-5909 ISBN 978-3-8233-8281-2 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http: / / dnb.dnb.de abrufbar. 1 9 2 13 2.1 13 2.1.1 14 2.1.2 17 2.1.3 24 2.2 27 2.2.1 27 2.2.2 29 3 37 3.1 38 3.1.1 38 3.1.2 39 3.1.3 41 3.1.4 42 3.1.5 44 3.2 47 3.2.1 47 3.2.2 57 3.2.3 64 3.3 66 3.3.1 68 3.3.2 70 3.3.3 71 Inhalt Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Begriffsbestimmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Qualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Qualität für wen? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zur Definition des Qualitätsbegriffes . . . . . . . . . . . . . . . Operationalisierung des Qualitätsbegriffs . . . . . . . . . . . Redeflüssigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Problematik der Definition . . . . . . . . . . . . . . . . . . . . . . . . Flüssigkeit als Funktion temporaler Variablen . . . . . . . Flüssigkeit in der Dolmetschwissenschaft: Ein Forschungsüberblick . . . . Flüssigkeitsmerkmale in Ausgangs- und Zieltext . . . . . . . . . . . Alexieva (1988) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pöchhacker (1997) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Cecot (2001) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tissi (2000) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ahrens (2004) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Flüssigkeit in der Qualitätsforschung: Erwartungen und Bewertungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Erwartungen und Bewertungen: Qualitätskriterien aus Sicht von DolmetscherInnen und NutzerInnen . . . . . . . Experimentelle Qualitätsstudien: Erhebung von Erwartungen und Bewertungen unter kontrollierten Bedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Methodische Überlegungen zu Bewertungen und Erwartungserhebungen . . . . . . . . . . . . . . . . . . . . . . . . . . Messung der kognitiven Wirkung: Die Verständlichkeit von Dolmetschleistungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Shlesinger (1994) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grübl (2010) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lenglet (2015) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 73 4.1 74 4.2 75 4.3 76 4.3.1 77 4.3.2 78 4.4 78 4.5 80 4.5.1 80 4.5.2 84 4.5.3 86 4.5.4 87 4.5.5 95 4.5.6 97 4.5.7 101 4.6 106 4.6.1 107 4.6.2 111 4.6.3 114 4.6.4 115 4.7 118 5 121 5.1 122 5.2 127 5.2.1 131 5.2.2 133 5.2.3 134 5.2.4 134 5.2.5 135 5.2.6 135 5.3 136 5.3.1 136 5.3.2 142 5.3.3 148 5.3.4 151 5.3.5 153 Versuch: Einfluss der Redeflüssigkeit auf die Dolmetschqualität . . . . . . . Forschungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Forschungsdesign . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Versuchspersonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Auswahl der Versuchspersonen . . . . . . . . . . . . . . . . . . . . Parallelisierung und Randomisierung . . . . . . . . . . . . . . . Ausgangstext . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Versuchsmaterial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vorüberlegungen zum Versuchsmaterial . . . . . . . . . . . . Erstellung und Beschreibung der Dolmetschung . . . . . Analyse und Annotation des Ausgangsmaterials . . . . . Bearbeitung des Materials . . . . . . . . . . . . . . . . . . . . . . . . Validierung des Versuchsmaterials . . . . . . . . . . . . . . . . . Erstellung der flüssigen Version D F . . . . . . . . . . . . . . . . . Erstellung der unflüssigen Version D U . . . . . . . . . . . . . . Fragebogen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fragebogendesign . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teil A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teil B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Scoring und Kodierung . . . . . . . . . . . . . . . . . . . . . . . . . . . Setting und Versuchsablauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Versuchspersonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gesamtscore (Hörverständnistest) . . . . . . . . . . . . . . . . . . . . . . . Einflussfaktor Muttersprache . . . . . . . . . . . . . . . . . . . . . Einflussfaktor Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . Einflussfaktor Alter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einflussfaktor Tag des Versuchs . . . . . . . . . . . . . . . . . . . Einflussfaktor Hintergrundwissen . . . . . . . . . . . . . . . . . Einflussfaktor Erfahrung mit Dolmetschungen . . . . . . Subjektive Bewertung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Redeflüssigkeit (Frage 14) . . . . . . . . . . . . . . . . . . . . . . . . Intonation (Frage 15) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wiedergabe des Inhalts (Frage 13) . . . . . . . . . . . . . . . . . Gesamtbeurteilungsscore . . . . . . . . . . . . . . . . . . . . . . . . . Subjektives Verständnis (Frage 12) . . . . . . . . . . . . . . . . . 6 Inhalt 6 161 6.1 162 6.2 166 6.2.1 167 6.2.2 167 6.3 168 6.3.1 168 6.3.2 169 6.3.3 170 172 183 183 187 198 198 199 200 201 Diskussion und Schlussfolgerungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Forschungsfragen und Antworten . . . . . . . . . . . . . . . . . . . . . . . Kritische Fragen zur Methode und Inferenzierbarkeit . . . . . . . Gedächtnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Versuchspersonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Schlussfolgerungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bedeutung von Flüssigkeit beim Dolmetschen in der Praxis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bedeutung für die Dolmetschdidaktik . . . . . . . . . . . . . . Bedeutung für die Wissenschaft . . . . . . . . . . . . . . . . . . . Bibliografie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anhang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Transkription Versuchsmaterial flüssig . . . . . . . . . . . . . . . . . . . . . . . . Transkription Versuchsmaterial unflüssig . . . . . . . . . . . . . . . . . . . . . . Instruktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teil 1 (vor Abspielen des Videos) . . . . . . . . . . . . . . . . . . . . . . . . Teil 2 (nach Abspielen des Videos) . . . . . . . . . . . . . . . . . . . . . . . Abbildungsverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabellenverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Inhalt 1 Einführung Wie in vielen anderen Bereichen auch ist das Schlagwort Qualität in der Dol‐ metschwissenschaft heute allgegenwärtig. Die Frage danach, was Qualität ist und wie man diese beeinflussen und garantieren bzw. womöglich sogar als Norm festhalten kann, beschäftigt diese Disziplin seit Jahrzehnten. Umso mehr ver‐ wundert es, dass viele der - oft sehr unterschiedlichen - Definitionen nicht näher darauf eingehen, wie diese Qualität zu messen sei. Trotz aller Heteroge‐ nität der Definitionen findet sich jedoch ein Grundsatz in der dolmetschwis‐ senschaftlichen Literatur immer wieder, den bereits die Pioniere des Konferenz‐ dolmetschens und der Dolmetschwissenschaft betonten: die Wichtigkeit des gleichen Inhalts bzw. der gleichen kognitiven Wirkung von Ausgangs- und Zieltext (AT, ZT) auf das Publikum. Diese Forderung, die oft auch als „Verständ‐ lichkeit“ der Dolmetschung ausgedrückt wird, findet sich sowohl in theoreti‐ schen als auch in praxisorientierten Werken zum Dolmetschen und ist wohl eines der wenigen Prinzipien, mit dem alle übereinstimmen; gleichzeitig wird sie aber selten als Qualitätsdefinition operationalisiert. Es ist zwar nicht mög‐ lich, den Verstehensprozess selbst zu beobachten, das kognitive Endergebnis (Verständnis der ZuhörerInnen) kann aber über Hörverständnistests gemessen werden, um so einen Einblick in die kognitive Wirkung bzw. Verständlichkeit als Eigenschaft der Dolmetschung zu erhalten. Hörverständnistests wurden bis‐ lang in der Untersuchung lautsprachlicher Dolmetschungen jedoch nur selten eingesetzt. Die vorliegende Studie soll einen Beitrag zur systematischen Erforschung von Qualitätsparametern in der Dolmetschwissenschaft leisten. Das hierin beschrie‐ bene Forschungsvorhaben wurde im Rahmen des vom Fonds zur Förderung der wissenschaftlichen Forschung (FWF) geförderten Projekts „Qualität beim Si‐ multandolmetschen (QuaSI)“ unter der Leitung von A.o. Univ.-Prof. Mag. Dr. Franz Pöchhacker am Zentrum für Translationswissenschaft (ZTW) der Uni‐ versität Wien umgesetzt. QuaSI wurde von 2008 bis 2010 am Zentrum für Trans‐ lationswissenschaft der Universität Wien durchgeführt und bestand aus vier Teilprojekten, die sich mit verschiedenen Aspekten der Dolmetschqualität be‐ schäftigten: einer Fragebogenstudie zum Qualitäts- und Rollenverständnis von KonferenzdolmetscherInnen (Zwischenberger 2013) sowie drei Experimenten, in denen die Verständlichkeit von Dolmetschen vs. Englisch als Lingua Franca (Reithofer 2014), der Einfluss von Intonation auf die kognitive Wirkung einer Dolmetschung (Holub 2010) sowie der Einfluss von Redeflüssigkeit auf die kog‐ nitive Wirkung (Rennert 2010, 2013, vorliegende Arbeit) untersucht wurden. Qualität als gleiche kognitive Wirkung, gemessen mittels Hörverständnis‐ tests, ist der zentrale Ansatz, der der vorliegenden Arbeit zu Grunde liegt; gleichzeitig wird aber auch die beim Dolmetschen - wie bei anderen Dienst‐ leistungen - so wichtige subjektive KundInnenperspektive nicht vernachlässigt. Diese beiden Perspektiven werden hier verbunden, indem untersucht wird, ob Redeflüssigkeit einen Einfluss auf die kognitive Wirkung einer Dolmetschung einerseits und die subjektive Wahrnehmung der Dolmetschqualität durch die Zuhörer andererseits hat. Dieser im Zuge des QuaSI-Projekts entwickelte For‐ schungsansatz liegt auch den anderen QuaSI-Experimenten (Holub 2010, Reit‐ hofer 2014) zu Grunde. In der vorliegenden Arbeit wird ein detailliertes Bild der Qualität aus Nutz‐ erInnensicht und der Qualität aus DolmetscherInnensicht gezeichnet. Daraus ergibt sich einerseits das obengenannte Verständnis von Qualität als gleicher kognitiver Wirkung, die sowohl von NutzerInnen als auch DolmetscherInnen und DolmetschwissenschaftlerInnen gefordert wird, und andererseits die sub‐ jektive Wahrnehmung der Dolmetschqualität durch die KundInnen, die indivi‐ duell variiert. Die Auswirkungen von Redeflüssigkeit sowohl auf die mittels Hörverständnistest gemessene kognitive Wirkung als auch die subjektive Be‐ wertung der Dolmetschung durch das Publikum werden empirisch untersucht. Dazu werden in Kapitel 2 zunächst die für die Arbeit zentralen Begriffe de‐ finiert: In 2.1 werden verschiedene Qualitätsbegriffe und -perspektiven bespro‐ chen und Qualität als Wirkungsäquivalenz definiert. In Abschnitt 2.2 wird nach einem Überblick über verschiedene Definitionen von Redeflüssigkeit diese als Funktion temporaler Variablen bestimmt und die konstituierenden Variablen werden im Detail beschrieben. Aufbauend darauf bietet Kapitel 3 einen Überblick über den Forschungsstand zur Redeflüssigkeit in der Dolmetschwissenschaft. Dabei wird ein Bogen von Untersuchungen und Experimenten, die sich mit der Verteilung von Flüssig‐ keitsmerkmalen in AT und ZT befassen, über Erhebungen von Qualitätserwar‐ tungen und Beurteilungsexperimente bis hin zur Erforschung der kognitiven Wirkung gespannt. Die in Kapitel 2 angesprochenen Unterschiede zwischen Qualitätserwartungen und Beurteilungen einerseits und Unterschiede in den Erwartungen und Beurteilungen verschiedener Zielgruppen andererseits werden hier anhand von Forschungsergebnissen illustriert und die verwendeten Forschungsmethoden werden kritisch beleuchtet. Diese Methodendiskussion bildet die Grundlage für den empirischen Teil, der ab Kapitel 4 im Detail beschrieben wird. Im Anschluss an die Forschungsfragen 10 1 Einführung in Abschnitt 4.1 wird in Abschnitt 4.2 das im Rahmen des QuaSI-Projekts ent‐ wickelte Forschungsdesign beschrieben. Beim Design wurde Wert darauf gelegt, so viele Faktoren wie möglich zu kontrollieren, gleichzeitig aber den Eindruck einer echten Dolmetschung zu erwecken. Daher wurde eine realistische Dol‐ metschsituation simuliert, indem am Versuchsort zwei mobile Dolmetschka‐ binen aufgestellt wurden und die ProbandInnen wie bei einer realen Simultan‐ dolmetschung Kopfhörer bekamen. Über diese wurden zwei verschiedene im Vorfeld manipulierte Versuchstexte eingespielt, was den ProbandInnen aber nicht bewusst war, da in jeder der Kabinen eine Dolmetscherin saß, die eine der Versionen nachsprach. Danach wurden die ProbandInnen gebeten, einen Fra‐ gebogen auszufüllen, der aus einem Hörverständnistest, einigen subjektiven Bewertungsfragen sowie Fragen zur Erfassung von Hintergrundvariablen be‐ stand. Die Wahl der Versuchspersonen und deren Randomisierung wird in Ab‐ schnitt 4.3 beschrieben, die Wahl des Ausgangstextes für den Versuch in Ab‐ schnitt 4.4. Um das oben erwähnte Versuchsmaterial zu erhalten, wurde eigens für dieses Projekt eine Methode zur apparativen Manipulation von Redeflüs‐ sigkeit entwickelt, die es ermöglicht, zwei bis auf die Redeflüssigkeit identische Versionen einer Dolmetschung zu erzeugen. Diese Methode und die Verände‐ rungen, die beim Erstellen des Versuchsmaterials vorgenommen wurden, werden in Abschnitt 4.5 ausführlich beschrieben. Der Fragebogen und dessen Erstellung werden in Abschnitt 4.6 besprochen. Abschnitt 4.7 schließlich be‐ schreibt das Setting und den Ablauf des Versuchs. Die Ergebnisse des Versuchs werden in Kapitel 5 vorgestellt. Nach einer de‐ taillierten Beschreibung der Versuchspersonen in Abschnitt 5.1 werden in Ab‐ schnitt 5.2 die Ergebnisse des Hörverständnistests beschrieben. Diese Ergeb‐ nisse werden anhand verschiedener unabhängiger Variablen analysiert, um festzustellen, ob der Grad der Redeflüssigkeit oder andere Faktoren einen Ein‐ fluss auf die kognitive Wirkung des Versuchsmaterials hatten. In 5.3 werden die Ergebnisse der subjektiven Beurteilungen im Detail ausgewertet und den Er‐ gebnissen des Hörverständnistests gegenübergestellt. So kann festgestellt werden, ob ein Zusammenhang zwischen den Ergebnissen des Hörverständnis‐ tests und der Einschätzung der Flüssigkeit und Intonation des Versuchsmate‐ rials, der subjektiven Bewertung der Leistung der Dolmetscherin bzw. der Ein‐ schätzung des eigenen Verständnisses besteht. In Kapitel 6 schließlich werden in 6.1 die gestellten Forschungsfragen beant‐ wortet. Nach einer Betrachtung der methodischen Einschränkungen des Ver‐ suchs in 6.2 werden in 6.3 aus den Ergebnissen Schlussfolgerungen für For‐ schung, Praxis und Lehre gezogen. 11 1 Einführung Insgesamt zielt diese Arbeit darauf ab, einen Beitrag zur Erforschung der Dolmetschqualität zu leisten und dabei erstmals unter Ausschluss aller Störva‐ riablen zu untersuchen, welche Rolle Redeflüssigkeit dabei tatsächlich spielt. 12 1 Einführung 2 Begriffsbestimmung In diesem Kapitel sollen die für die vorliegende Arbeit zentralen Begriffe Qua‐ lität und Redeflüssigkeit definiert werden, was bei Begriffen, die beide von ver‐ schiedenen ForscherInnen wiederholt als „elusive“ bezeichnet wurden, keine leichte Aufgabe ist. In den folgenden Abschnitten werden die Problematik der Definition sowie unterschiedliche Ansätze und Perspektiven beleuchtet und es wird dargelegt, wie die dieser Arbeit zugrundeliegenden Definitionen von Qualität als Wir‐ kungsäquivalenz und Flüssigkeit als Funktion temporaler Variablen zustande kommen. Als erstes wird in Abschnitt 2.1 der Begriff der Qualität definiert. Dazu wird zunächst in 2.1.1 besprochen, aus wessen Perspektive die Qualität von Dienstleistungen im Allgemeinen und Dolmetschleistungen im Besonderen zu definieren ist. Darauf folgt in 2.1.2 ein Überblick über Qualitätsdefinitionen und 2.1.3 schließlich widmet sich der Operationalisierung der Qualitätsbegriffe für die Forschung. Anschließend wird in Abschnitt 2.2 die Redeflüssigkeit definiert, wobei auch hier zunächst in 2.2.1 ein Überblick über Definitionen geboten wird. In 2.2.2 werden die wichtigsten temporalen Variablen, aus denen sich Redeflüs‐ sigkeit nach der gewählten Definition zusammensetzt, beschrieben: Pausen, Unflüssigkeiten und Sprechgeschwindigkeit ist jeweils ein eigener Abschnitt gewidmet. Aufbauend auf diesen Definitionen bietet Kapitel 3 einen Überblick über den Stand der Forschung zur Redeflüssigkeit beim Dolmetschen und die Qualitäts‐ forschung in der Dolmetschwissenschaft, wobei vor allem die Überscheidungen dieser beiden Gebiete beleuchtet werden. 2.1 Qualität Obwohl sich die Translationswissenschaft seit gut drei Jahrzehnten mit dem Thema Dolmetschqualität auseinandersetzt, gibt es dafür keine einheitliche De‐ finition - und wie Garzone (2003: 23) feststellt, hat sich diese Schwierigkeit im Laufe der Zeit durch das Hinzukommen neuer, ganzheitlicher Betrachtungs‐ weisen der Dolmetschsituation als Hypertext oder als Ergebnis der Interaktion vieler externer Faktoren sogar erhöht (vgl. Pöchhacker 1994a, Kalina 2009, Grbić 2015). Gerade in dieser erweiterten Betrachtungsweise liegt jedoch auch der m. E. vielversprechendste Ansatz zur Beantwortung der Frage nach Dolmetsch‐ qualität. Lange Zeit galt Qualität in der Dolmetschwissenschaft als „that elusive so‐ mething which everyone recognizes but no one can successfully define“ (AIIC 1982: 1), wobei sich in der Folge zeigen wird, dass der erste Teil dieses Zitates - dass jeder Qualität erkennen könne - nicht unbedingt für alle Beteiligten glei‐ chermaßen gilt. In einem im AIIC-Mitteilungsblatt Communicate! veröffent‐ lichten Artikel fasst Kahane (2000) unter Bezugnahme auf Shlesinger (1997: 123), die Qualität als „an elusive concept, if ever there was one“ bezeichnet hatte, die Problematik treffend zusammen: The amazing thing is that there is no such consensus. Granted, users and interpreters agree on certain quality criteria, but significant differences remain as to nuances, and especially as to the very essence of the elusive concept of quality; quality for whom, assessed in what manner? (Kahane 2000: 1) Pöchhacker (2013: 34) hält dagegen, dass Qualität weniger „elusive“ als vielmehr komplex und mehrdimensional sei und daher naturgemäß mehr als eine Defi‐ nition zulasse. Grbić bezeichnet Qualität als „fuzzy concept“, das aufgrund der zahlreichen unabhängigen Variablen nur schwer exakt zu definieren sei (Grbić 2008: 238). Die Sichtweise von Qualität als komplexes Zusammenspiel verschie‐ dener Faktoren wird u. a. auch von Collados Aís et al. (2007, 2011) und Kalina (2004, 2005, 2009) vertreten. Damit stellt sich die Frage nach den Kriterien und der Perspektive, die einer solchen Definition zugrunde liegen sollen, die bereits Shlesinger (1997: 123) stellt: „Quality according to what criteria? Quality for whom? “ Diese Frage ist allerdings nicht auf den Bereich der Dolmetschwissen‐ schaft beschränkt, sondern stellt sich auch im Zusammenhang mit anderen Dienstleistungen. Im nächsten Abschnitt wird daher zunächst besprochen, aus wessen Sicht Qualität definiert werden kann oder soll, bevor in 2.1.2 auf Defi‐ nitionen und Qualitätskriterien und in 2.1.3 auf deren Operationalisierung ein‐ gegangen wird. 2.1.1 Qualität für wen? DolmetscherInnen und DolmetschnutzerInnen haben oft unterschiedliche Vor‐ stellungen von Qualität (siehe 3.2.1), weshalb sich beim Versuch, diese zu defi‐ nieren, die Frage stellt, wer bestimmen soll, was Qualität ist. Sind es die Dol‐ metscherInnen als ExpertInnen, aber eben auch DienstleisterInnen? Oder sind es die RezipientInnen des Zieltextes (ZT) als NutzerInnen bzw. KundInnen, die RednerInnen, deren Ausgangstext (AT) verdolmetscht wird und die somit auch 14 2 Begriffsbestimmung KundInnen sind, oder gar KonferenzveranstalterInnen als eigentliche Auftrag‐ geberInnen? Darüber herrscht bei weitem keine Einigkeit. Chiaro & Nocella (2004) stellen fest: … there appears to be little harmony concerning which perspective to take when undertaking research: whether it is best to explore the success of an interpretation from the perspective of the interpreter or from that of the user is a debateable issue. Ideally, of course, both standpoints should be considered simultaneously … (Chiaro & Nocella 2004: 279) Wie einleitend erwähnt ist die Schwierigkeit der Definition des Qualitätsbe‐ griffes nicht auf die Translationswissenschaft beschränkt; auch in vielen an‐ deren Bereichen - vor allem im Dienstleistungssektor - gibt es kein allgemein akzeptiertes Qualitätsverständnis, wie Bruhn (2016: 29) feststellt. Bei Dienst‐ leistungen gibt es dabei laut Bruhn (2016: 29 f.) zwei zentrale Ansätze, nämlich den produkt- und den kundenbezogenen Qualitätsbegriff. Beim produktbezo‐ genen Qualitätsbegriff steht die Qualität als Summe oder Niveau vorhandener Eigenschaften im Vordergrund, wobei Bruhn diese Kriterien als objektiv be‐ zeichnet aber auch einräumt, dass diese Kriterien im Dienstleistungsbereich schwer beobachtbar sind. Der kundenbezogene Qualitätsbegriff hingegen be‐ zieht sich auf die „Wahrnehmung der Produkteigenschaften bzw. Leistungen durch den Kunden“ (Bruhn 2016: 29), was bedeutet, dass hier keine rein objek‐ tive, sondern vielmehr eine weitgehend subjektive Bewertung der aus KundIn‐ nenperspektive wichtigen Qualitätsmerkmale stattfindet. Die Anforderungen aus Kundensicht können sich dabei auf Potenzial, Prozess und Ergebnis der Dienstleistung beziehen. (Bruhn 2016: 30) Bei der Dienstleistung Dolmetschung könnten sich die Erwartungen beispielsweise auf verfügbare Sprachen und Dol‐ metschtechnik (Potenzial), angenehme und flüssige Vortragsweise, Akzent, in‐ haltlich korrekte und gut verständliche Dolmetschung (Prozess) sowie ge‐ glückte Kommunikation (Ergebnis) beziehen (für weitere Erwartungen von NutzerInnen siehe 3.2.1). Zu Problemen kommt es vor allem dann, wenn die beiden Perspektiven stark auseinandergehen (Bruhn 2016: 29 f.). Allerdings macht Bruhn (2016: 30) auch darauf aufmerksam, dass trotz der Bedeutung, die die KundInnenperspektive im Dienstleistungsbereich hat, die Qualitätskriterien nicht einseitig aus KundIn‐ nensicht festgelegt werden dürfen, sondern auch die Unternehmensperspektive berücksichtigt werden muss. Bruhn spricht sich daher für eine Kombination der beiden aus und definiert den Begriff der Dienstleistungsqualität wie folgt: 15 2.1 Qualität Dienstleistungsqualität ist die Fähigkeit eines Anbieters, die Beschaffenheit einer primär intangiblen und der Kundenbeteiligung bedürfenden Leistung gemäß den Kundenerwartungen auf einem bestimmten Anforderungsniveau zu erstellen. Sie be‐ stimmt sich aus der Summe der Eigenschaften bzw. Merkmale der Dienstleistung, bestimmten Anforderungen gerecht zu werden. (Bruhn 2016: 32) Ein absoluter Qualitätsbegriff, der Qualität als Maß der Güte einer Leistung an‐ gibt (Bruhn 2016: 30), sei im Dienstleistungssektor nicht zielführend, da die Er‐ wartungen an das Leistungsniveau aus Sicht des Leistungsempfängers, also der KundIn, festgelegt werden, womit subjektive und auch relative Einzelanforde‐ rungen ins Spiel kommen; vielmehr sei bei der Messung der Dienstleistungs‐ qualität die Verknüpfung der beiden Qualitätsperspektiven sinnvoll (Bruhn 2016: 32). Schließlich nützt es wenig, wenn die Dienstleistung aus Dienstleis‐ terInnensicht von hoher Qualität ist, wenn die KundInnen dies nicht so sehen. (Bruhn 2016: 30 ff.) Die wahrgenommene Dienstleistungsqualität wird durch die Erwartungen an die Dienstleistung einerseits und die gelieferte und wahrge‐ nommene Dienstleistung andererseits bestimmt, wobei die Wahrnehmung in‐ dividuell unterschiedlich sein kann (Bruhn 2016: 34). Auf die Dienstleistung Dolmetschen umgelegt würde dies bedeuten, dass bei der Bestimmung von Dolmetschqualität sowohl die Perspektive der Dienstleis‐ terInnen (der DolmetscherInnen) als auch jene der KundInnen (ZT-Rezipien‐ tInnen und andere obengenannte KundInnengruppen) berücksichtigt werden sollten. Diese klaffen aber nicht nur, wie erwähnt, häufig weit auseinander; auch innerhalb dieser beiden Gruppen herrscht keine Einigkeit über die zu verwend‐ enden Kriterien. Deshalb kann beim Dolmetschen auch bei der produktbezo‐ genen Perspektive (Bruhn 2016: 29) nicht von tatsächlich objektiven Kriterien die Rede sein. Gleichzeitig stellen DolmetscherInnen oft in Frage, ob KundInnen Dolmetschqualität (dabei meist im Sinne von inhaltlicher Richtigkeit und AT-Treue verstanden) überhaupt beurteilen könnten. Dies spiegelt sich auch in der etwas polemischen Frage von Shlesinger (1997: 126) wider: „Do our clients know what’s good for them? “ Grbić weist darauf hin, dass KundInnenorientie‐ rung wichtig sei, warnt aber davor, den KundInnen zu viel zuzumuten oder sich an einer idealen KundIn zu orientieren (Grbić 2008: 248). Déjean Le Féal hin‐ gegen ist der Meinung, dass neben Zielen wie dem gleichen Inhalt und der glei‐ chen kognitiven Wirkung (vgl. 2.1.2) auch solche NutzerInnenerwartungen, die DolmetscherInnen oft nicht so wichtig seien, erfüllt werden sollten, etwa eine angenehme Stimme oder das Vermeiden von Pausen in der Dolmetschung, die nicht im Original vorhanden sind und die von ZuhörerInnen als Informations‐ verlust interpretiert werden können: „Rightly or wrongly, they assume that any such silence reflects a loss of information.“ (Déjean Le Féal 1990: 155) Damit 16 2 Begriffsbestimmung führt sie die DolmetscherInnenperspektive mit jener der RezipientInnen zu‐ sammen und stellt fest: „Although we may not share their views on the last point, we should take their wishes into account insofar as possible. Indeed, our ultimate goal must obviously be to satisfy our audience.“ (Déjean Le Féal 1990: 155) Der produktbezogene Qualitätsbegriff soll auch in der vorliegenden Arbeit verwendet werden, wobei hier „Produkt“ nicht im Sinne einer Aufnahme oder Transkription der Dolmetschung verstanden wird, sondern im Sinne des Er‐ gebnisses, wie es weiter oben auch bei den KundInnenanforderungen dargestellt wurde. Für die vorliegende Arbeit wird „Verständlichkeit“ als Produkteigen‐ schaft aufgefasst, die sowohl aus NutzerInnensicht als auch aus dolmetschwis‐ senschaftlicher Sicht gefordert wird (vgl. 2.1.2). Verständlichkeit unterscheidet sich begrifflich vom Verstehensprozess als NutzerInnenleistung. Obwohl dieser produktbezogene Qualitätsbegriff nicht als objektiv angesehen werden kann, ist zumindest die Messung der kognitiven Wirkung möglich (vgl. 2.1.3). Die Pro‐ dukteigenschaft der Verständlichkeit und inhaltlichen Richtigkeit wird auch von KundInnen gefordert, weshalb in diesem Fall der produktbezogene Qualitäts‐ begriff DienstleisterInnen- und KundInnenerwartungen in sich vereint. Im Ge‐ gensatz zu anderen Dienstleistungen ist es KundInnen bei Dolmetschungen üb‐ licherweise nicht möglich, die gelieferte Leistung zu beurteilen, sondern es wird lediglich die wahrgenommene Leistung beurteilt. Daher soll hier statt des kund‐ Innenbezogenen Qualitätsbegriffs von der subjektiven Bewertung bzw. Wahr‐ nehmung durch die NutzerInnen gesprochen werden. Im nächsten Abschnitt soll nun die für diese Arbeit herangezogene produkt‐ bezogene Qualitätsdefinition erarbeitet werden, die dann im Experiment (ab Kapitel 4) gemeinsam mit der subjektiven Bewertung durch die KundInnen untersucht und mit ihr verglichen wird. 2.1.2 Zur Definition des Qualitätsbegriffes Trotz der obengenannten Einschränkungen haben verschiedene PraktikerInnen und ForscherInnen den Versuch unternommen, Dolmetschqualität zu defi‐ nieren. Einen Überblick über die verschiedenen Qualitätsansätze in Ausbildung, Praxis und Forschung bietet Grbić (2008). Alle hier zu besprechen würde den Rahmen dieser Arbeit sprengen, daher soll in diesem Abschnitt eine kleine Aus‐ wahl der Ansätze vorgestellt werden und gezeigt werden, wie die für die vor‐ liegende Arbeit verwendete Definition von Qualität als kognitive Wirkungsä‐ quivalenz zustande kommt. Für eine ausführliche Darstellung des Qualitätsbegriffs im Allgemeinen und von Qualitätskonzepten in der Dol‐ 17 2.1 Qualität metschwissenschaft im Speziellen sei an dieser Stelle auf Zwischenberger (2013) verwiesen. Geschichtlich hat sich die Qualitätsforschung im Bereich der Dolmetschwis‐ senschaft von der rein textuellen Ebene, bei der Transkriptionen von Dolmet‐ schungen auf von den ForscherInnen selbst bestimmte Fehlerkategorien hin untersucht wurden (Barik 1973, Gerver [1969]/ 2000), über die Erhebung von Erwartungen von DolmetscherInnen und NutzerInnen sowie Bewertungen von Dolmetschleistungen (z. B. Bühler 1986, Kurz 1989, 1993, Vuorikoski 1993, 1998; siehe 3.2.1) hin zu einer ganzheitlichen Betrachtung der Dolmetschung in ihrem jeweiligen situativen Kontext entwickelt (z. B. Kalina 2004, 2005, 2009, Pöchha‐ cker 1994a, 1994b, 2001, 2012, 2013, Viezzi 1996, 1999). Ein großer Teil der Qua‐ litätsstudien enthält dabei keine Definition von Qualität im engeren Sinne, son‐ dern versucht sich über eine Reihe von Qualitätskriterien an den Begriff der Qualität heranzuarbeiten (vgl. Mack & Cattaruzza 1995: 37). Dies ist, wie Gar‐ zone (2003: 23) feststellt, vor allem auf die Komplexität der Materie und die daraus resultierende Schwierigkeit einer eindeutigen Definition zurückzu‐ führen. Neben dem textbasierten Vergleich von AT und ZT wie bei Barik (1973) und Gerver ([1969]/ 2000) kommen in der Qualitätsforschung in der Dolmetschwis‐ senschaft vor allem Erwartungserhebungen, Beurteilungen von Dolmet‐ schungen durch verschiedene Zielgruppen sowie Messungen der Verständlich‐ keit des ZT zum Einsatz. Vor allem bei der Untersuchung lautsprachlicher Dolmetschungen sind Erwartungserhebungen und Bewertungen am häufigsten. Bei diesen wird meist eine Reihe von Qualitätskriterien verwendet. Dabei gibt es zwar Variationen in Umfang und Nomenklatur, allgemein herrscht aber Ei‐ nigkeit darüber, dass neben der inhaltlichen Korrektheit und Vollständigkeit (Treue zum Original) verschiedene sprachliche (z. B. Terminologie, Stil, Präzi‐ sion des Ausdrucks) und außersprachliche (z. B. Akzent, Intonation, Flüssigkeit) Faktoren eine Rolle spielen. (z. B. Bühler 1986, Kurz 1989, 1993, Moser 1995, Collados Aís et al. 2007, Zwischenberger 2013; für einen Forschungsüberblick siehe 3.2). Wie genau diese Kriterien zu definieren sind und wie sie zusammenwirken, wird allerdings selten näher ausgeführt. Häufig sind Studien zu finden, in denen Kriterien von verschiedenen NutzerInnengruppen oder auch DolmetscherInnen nach ihrer Wichtigkeit bewertet werden oder Dolmetschungen nach diesen Kriterien beurteilt werden. Grundsätzlich zeigt sich dabei, dass unterschiedliche Zielgruppen unterschiedliche Vorstellungen von Qualität haben. So sind Dol‐ metscherInnen andere Aspekte wichtig als NutzerInnen, und auch unterschied‐ liche NutzerInnengruppen legen auf unterschiedliche Merkmale Wert. Hinzu 18 2 Begriffsbestimmung kommt häufig eine Diskrepanz zwischen den Qualitätsmerkmalen, die bei a priori-Befragungen als wichtig bezeichnet werden, und jenen, die bei einer Be‐ wertung einer tatsächlichen Dolmetschung als relevant empfunden werden. Dies liegt zum Teil daran, dass zumindest NutzerInnen wohl oft nur eine recht abstrakte Vorstellung davon haben, was ihnen bei einer Dolmetschung wichtig ist, und bei der Bewertung einer konkreten Dolmetschung oft auf ganz andere Faktoren Wert legen, kann teilweise aber auch darauf zurückzuführen sein, dass in den Befragungsbögen abstrakte oder schwer greifbare Begriffe wie „Qualität“ oder „Redeflüssigkeit“ nicht definiert werden und daher nicht sichergestellt werden kann, dass tatsächlich alle Befragten bei der Beantwortung von der‐ selben Definition ausgehen (vgl. Collados Aís 2015: 337 f.). Schließlich kommen mögliche unterbewusste Einflussfaktoren hinzu, z. B. der erste Eindruck der NutzerInnen, der Auswirkungen auf die Bewertung der Dolmetschung haben kann (vgl. García Becerra 2011), sodass z. B. eine unflüssige Dolmetschung wo‐ möglich als inhaltlich schlechter eingeschätzt wird als eine inhaltlich identische flüssige Dolmetschung (vgl. Garzone 2003). Auf diese und andere methodische Schwierigkeiten wird in 3.2.3 näher eingegangen. Trotz all dieser Einschränkungen lässt sich allerdings feststellen, dass sowohl DolmetscherInnen als auch RezipientInnen die Übereinstimmung des ZT mit dem AT als wichtigstes Merkmal betrachten. Dieses Merkmal wird wahlweise als „accuracy“, „fidelity“ oder auch „sense consistency with the original“ be‐ zeichnet, grundsätzlich ist damit aber stets gemeint, dass der Zieltext den Aus‐ gangstext möglichst getreu wiedergeben soll. Ebenfalls häufig genannt wird „clarity“, was sich eher auf die Kohärenz und Nachvollziehbarkeit des ZT bezieht (Pöchhacker 2001: 413). Merkmale, die sich auf die sprachliche Form, prosodi‐ sche Elemente und außersprachliche Faktoren beziehen, werden im Vergleich zu den inhaltsbezogenen Merkmalen meist als weniger wichtig eingeordnet, unter diesen wird jedoch der Redeflüssigkeit meist die bei weitem höchste Wichtigkeit eingeräumt (vgl. Collados Aís 2015: 337, Pradas Macías 2015: 166). Neben der Literatur zu Qualitätsparametern gibt es auch eine Reihe von Qua‐ litätsmodellen und -definitionen, die von einem eher holistischen Ansatz aus‐ gehen, bei dem nicht nur Merkmale des Zieltextes, sondern auch Merkmale des Ausgangstextes sowie externe, kontextabhängige Faktoren wie Vorbereitung, Publikum oder Dolmetschsituation zur Qualität beitragen. So schlägt Kopczyński (1994: 189 f.) vor, bei Dolmetschungen zwischen sprachlicher und pragmatischer Qualität zu unterscheiden. Die sprachliche Qualität sieht er dabei als „a set of rigid standards of equivalence in content and form between the spoken messages in L1 and L2“ (Kopczyński 1994: 189), wäh‐ rend in der pragmatischen Sichtweise Qualität keine absolute Größe sein könne, 19 2.1 Qualität da sie durch kontextabhängige Variablen wie die RednerIn, die ZuhörerInnen, deren Intentionen und die Dolmetschsituation beeinflusst werde. Moser-Mercer (1996) prägt den Begriff „optimum quality“, den sie wie folgt definiert: Optimum quality in professional interpreting implies that an interpreter provides a complete and accurate rendition of the original that does not distort the original mes‐ sage and tries to capture any and all extralinguistic information that the speaker might have provided subject to the constraints imposed by certain external conditions. (…) Optimum quality is the quality an interpreter can provide if external conditions are appropriate. (Moser-Mercer 1996: 44) In beiden Fällen wird externen Faktoren ein Platz eingeräumt, weder Moser-Mercer (1996) noch Kopczyński (1994) definieren dabei allerdings, was eine vollständige, korrekte oder treue Dolmetschung im Detail ausmacht. Zudem sieht Moser-Mercer Fehlerkategorien für die Bewertung von Dolmetsch‐ qualität als unabdingbar an (1996: 51). Mack & Cattaruzza (1995) gehen von einer eher rezipientInnenorientierten Sichtweise aus, bei der Qualität als die Erfüllung von NutzerInnenerwartungen betrachtet wird: As is the case for many other products or services, quality of conference interpretation could be defined as the interpreter’s capability to perform the function offered or required. An important aspect of quality would thus be the degree to which customers’ needs are met. (Mack & Cattaruzza 1995: 38) Auch laut Kurz (2001) sollte für DolmetscherInnen als DienstleisterInnen die Erfüllung der KundInnenerwartungen im Vordergrund stehen, wobei sie aber auch betont, dass im Fall von falschen Vorstellungen der KundInnen die Dol‐ metscherInnen diese informieren können und sollen. Eine Kombination aus RezipientInnen- und RednerInnenorientierung wird bei Shlesinger (1997) als mögliches Qualitätsmaß besprochen, allerdings durchaus kritisch. So wird darauf hingewiesen, dass ZuhörerInnen allein die Qualität einer Dolmetschung nicht beurteilen könnten, da sie einerseits den AT nicht verstehen, andererseits (wie bereits oben erwähnt) keine homogenen Er‐ wartungen haben. Zudem merkt sie unter Bezugnahme auf Viezzi an: „quality is a feature of an interpreter’s performance even when nobody is listening“ (Shlesinger 1997: 127). Kalina (2004, 2005, 2009) wendet sich von der ausschließlich rezipientInnen‐ orientierten Perspektive ab, da Dolmetschqualität ihrer Ansicht nach „nicht al‐ lein das ist, was von Zuhörern als solche wahrgenommen wird“ (Kalina 2009: 172). Vielmehr gilt für sie ein prozessorientierter Ansatz, in dem Qualität „der 20 2 Begriffsbestimmung gelungene Einsatz von Dolmetschstrategien zur Lösung von Problemen im Ver‐ stehensvorgang, zur Erreichung translatorischer Lösungen und zur erfolgrei‐ chen Produktion des ZT“ ist (Kalina 2009: 171). Dabei ist für sie nicht die Dol‐ metscherIn allein für Qualität zuständig (Kalina 2004: 6). Vielmehr ist Qualität beim Dolmetschen ihrer Ansicht nach von einer Vielzahl von Faktoren wie Er‐ fordernissen und Präferenzen der KommunikationsteilnehmerInnen, der Situ‐ ation, der Qualität des AT und der Vortragsweise der RednerIn abhängig, sodass man nicht von einer festgelegten Qualitätsnorm sprechen könne, die immer erreichbar sei, sondern die Definition von Qualität stets an die Bedingungen der jeweiligen Dolmetschsituation geknüpft sei (Kalina 2009: 177). Ähnlich sehen es Chiaro & Nocella (2004), die zum Abschluss ihrer Erhebung von Qualitätskriterien unter DolmetscherInnen feststellen, dass sich zwar einige Kriterien festmachen ließen, die die Grundlage für eine Qualitätsdefinition dar‐ stellen könnten, diese Kriterien aber nicht allein von den DolmetscherInnen beeinflusst werden könnten: There appears to be an element of uncontrollability inherent to the interpretative process that is obviously linked to the ‘speaker-interpreter-environment’ triad. This triad, according to us, appears to generate both technical and personal difficulties as well as variables that are highly dependent on the context of the situation. None of these elements are easy to postulate a priori. In conclusion, the absence of quality standards that characterises the work of professional interpreters appears to be linked to the uniqueness of the interpreting process itself. (Chiaro & Nocella 2004: 291) Die Bedingungen, unter denen eine Dolmetschung entsteht, sind auch für Gar‐ zone (2003) für die Qualitätsdefinition von Bedeutung. Für sie muss die Beur‐ teilung von Qualität durch die ZT-ProduzentInnen und RezipientInnen stets ein Kompromiss zwischen der Vorstellung einer „idealen“ Dolmetschqualität und den realistischeren Erwartungen, die unter den tatsächlichen Bedingungen an‐ gemessen sind, bleiben (Garzone 2003: 24). Sie stellt fest: Of course, in professional practice interpreters try to live up to those ideal quality standards, but in general they work in a situation of continuous emergency due to severe time constraints, to cognitive overload (…). Thus, in order to meet the best possible quality standards the interpreter’s behaviour has to incorporate a whole range of emergency procedures: ultimately, the quality of a SI performance is the result of a compromise between abstract standards and the constraints imposed by the real conditions under which it is performed. (Garzone 2003: 24 f.) Eine produktorientierte Betrachtungsweise der Dolmetschung als „Text“, der sowohl akustische als auch visuelle Elemente enthält und als Ganzes eingebettet 21 2.1 Qualität in ein Verständnis der Konferenz als Hypertext betrachtet werden sollte, findet sich bei Pöchhacker (1994a, 1994b), der sich für eine sorgfältige Dokumentation nicht nur der Dolmetschung sondern auch der Begleitumstände zur Beurteilung einer „quality under the circumstances“ (Pöchhacker 1994b: 242) ausspricht. Wie Moser-Mercer (1996) und Kalina (2009) sieht er Qualität also nicht als absolute Größe, sondern als von den jeweiligen Bedingungen beeinflusst. Viezzi (1996, 1999) stellt ein Qualitätsmodell auf, in dem Qualität als der Er‐ füllungsgrad der vier Ziele equivalenza, accuratezza, adeguatezza und fruibilità definiert ist (Viezzi 1996: 79). Dabei betont er, dass unter equivalenza (Äquiva‐ lenz) nicht eine völlige Übereinstimmung zu verstehen sei, sondern vielmehr die Gleichwertigkeit zweier unterschiedlicher Elemente. Er verortet sie auch nicht auf der rein sprachlichen Ebene, sondern vielmehr im Bereich der kom‐ munikativen Funktion, der soziokommunikativen Werte und der globalen Be‐ deutung des Textes. Das Ziel der Äquivalenz ist demnach die Produktion eines ZT, der die gleiche kommunikative Wirkung hat wie der AT und der zur Kultur der Zielsprache im gleichen Verhältnis steht wie der AT zur Kultur der Aus‐ gangssprache. (Viezzi 1999: 146 f.) Das Ziel der Äquivalenz ist eng mit den an‐ deren drei verbunden: accuratezza (Präzision) bezieht sich auf die sprachliche Ebene, wobei auch hier keine absolute Übereinstimmung postuliert wird, ade‐ guatezza (Angemessenheit) bezieht sich auf notwendige Anpassungen an die Zielkultur sowie das Sprachregister, und fruibilità (Verwertbarkeit) zielt darauf ab, den Zieltext für die RezipientInnen so gut verwertbar bzw. verständlich zu machen wie möglich, wozu neben einer klaren Ausdrucksweise auch prosodi‐ sche Merkmale wie Intonation, Pausen, Stimmqualität, Häsitationen und Selbst‐ korrekturen zählen. (Viezzi 1999: 147-150) Déjean Le Féal (1990) ist der Meinung, dass eine professionelle Dolmetschung den gleichen kognitiven Inhalt und die gleiche Wirkung auf die ZuhörerInnen haben sollte wie der Ausgangstext: What our listeners receive through their earphones should produce the same effect on them as the original speech does on the speaker’s audience. It should have the same cognitive content and be presented with equal clarity and precision in the same type of language. Its language and oratory quality should be at least on the same level as that of the original speech, if not better, given that we are professional communicators, while many speakers are not, and sometimes even have to express themselves in languages other than their own. (Déjean Le Féal 1990: 155) Sowohl Déjean Le Féal (1990) als auch Kalina (2009) sprechen sich für den Ver‐ gleich der Wirkung auf AT- und ZT-RezipientInnen aus, was in 2.1.3 näher aus‐ geführt wird. 22 2 Begriffsbestimmung Bereits Jean Herbert (1952) legte großen Wert auf die gleiche Wirkung und den gleichen Inhalt von AT und ZT: Die zentrale und unmittelbare Aufgabe von DolmetscherInnen bestand für ihn darin, „to enable his audience to know ac‐ curately what the speaker intended to convey, and to make on the audience the impression which the speaker wishes to be made“ (Herbert 1952: 23). Ähnlich, wenn auch ohne Hinweis auf die Wirkung, formuliert es Selesko‐ vitch (1988), die schreibt: Ziel des Dolmetschers ist es, seinen Zuhörern die Aussage absolut getreulich weiter‐ zuvermitteln, das heisst, sie ihnen ebenso gut verständlich zu machen, wie sie von denen verstanden worden ist, die sich den Redner im Original anhören. (Seleskovitch 1988: 101) Auch Vuorikoski ist der Meinung, die Dolmetschung solle den ZuhörerInnen einen Eindruck der Rede vermitteln „which is equal to the one they would have created had they been listening to the original speech directly“ (Vuorikoski 2004: 71), analysiert dies aber über einen Vergleich des AT und ZT. Sie schlägt eine Neuformulierung der oben zitierten Qualitätserwartung von Déjean Le Féal vor: What the listeners receive through interpreters should convey the same arguments as expressed by the speaker. The genre, register, and illocutionary point should remain the same. In other words, the speaker’s logos, pathos and ethos should be conveyed to the listeners. (Vuorikoski 2004: 250) Das Prinzip der gleichen kommunikativen bzw. kognitiven Wirkung sieht auch Pöchhacker (2012: 23) als Qualitätsanspruch für Dolmetschungen. Bereits 1997 fordert Pöchhacker die Untersuchung des kognitiven Endergebnisses der Dol‐ metschung als Instrument der Qualitätsbeurteilung (Shlesinger 1997: 130). Ge‐ rade aufgrund der großen Bandbreite von Einsatzbereichen und Situationen spricht er sich gegen eine rein sprachliche Betrachtung von Qualität aus: (T)he concept of quality cannot be pinned down to some linguistic substrate but must be viewed also at the level of its communicative effect and impact on the interaction within particular situational and institutional constraints. (Pöchhacker 2001: 421) Kalina (2005: 774) stellt allerdings die kritische Frage, ob es zwischen den Zu‐ hörerInnen des AT und ZT nicht auch aus kulturellen oder anderen Gründen zu einer unterschiedlichen Wirkung kommen könne, die nicht unbedingt auf die Dolmetschung zurückzuführen sei. Wie Reithofer (2014: 30) anmerkt, stellt sie damit auch die Forderung nach Äquivalenz in Frage - ein Begriff, der, anders als in der Übersetzungswissenschaft, in der Dolmetschwissenschaft bisher kaum kritisch hinterfragt wurde. In Anbetracht der von DolmetscherInnen wie Nutz‐ 23 2.1 Qualität erInnen häufig gestellten Forderung nach „sense consistency“, die als „Forde‐ rung nach Aktivierung des gleichen kognitiven Inhalts bei AT- und ZT-Pub‐ likum“ (Reithofer 2014: 30) verstanden werden könne, sei die Verwendung des Äquivalenzbegriffs jedoch gerechtfertigt. Auch bei den im Rahmen des QuaSI-Projektes von Zwischenberger (2013) durchgeführten großangelegten Befragungen von Mitgliedern des internationalen Dolmetscherverbandes AIIC und des deutschen Verbands der Konferenzdolmetscher (VKD) ging „sense con‐ sistency with the original“ bzw. „Sinnübereinstimmung mit dem Original“ als wichtigstes Kriterium hervor (Zwischenberger 2013: 199 f.). Daher wird in der vorliegenden Arbeit der Begriff der kognitiven Wirkungsäquivalenz verwendet. Der Begriff kognitive Wirkung ist in der vorliegenden Arbeit der Wirkung der „Botschaft“ der Dolmetschung vorbehalten (vgl. Pöchhacker 2013: 41), während der allgemeinsprachliche Begriff Verständlichkeit in Fällen verwendet wird, in denen die zitierten AutorInnen nicht explizit von kognitiver Wirkung sprechen und somit nicht gesichert ist, dass in den entsprechenden Arbeiten diese Defi‐ nition angewandt wurde. Die kognitive Wirkung bzw. Verständlichkeit als Ei‐ genschaft der Dolmetschung muss auch vom Verstehen als kognitiver Leistung der RezipientInnen abgegegrenzt werden. Das kognitive Endergebnis bzw. Ver‐ ständnis wiederum ist das Resultat des Verstehensprozesses. Im in der vorlie‐ genden Arbeit beschriebenen Experiment wird das kognitive Endergebnis mit‐ tels Hörverständnistest gemessen und die ProbandInnen werden nach der subjektiven Einschätzung des eigenen Verständnisses gefragt, wofür in der Aus‐ wertung auch der Begriff subjektives Verständnis verwendet wird. Nachdem in diesem Abschnitt der Qualitätsbegriff für die vorliegende Arbeit herausgearbeitet und die dazugehörige Terminologie erklärt wurde, wird im nächsten Abschnitt dessen Operationalisierung besprochen. 2.1.3 Operationalisierung des Qualitätsbegriffs In der wissenschaftlichen Diskussion muss zwischen einem theoretischen Kon‐ strukt und dessen Operationalisierung unterschieden werden. In den vorher‐ gehenden Abschnitten wurde das Konstrukt der Qualität herausgearbeitet: In 2.1.1 wurde festgestellt, dass zur Bestimmung der Qualität der Dienstleistung Dolmetschung sowohl der produktbezogene Qualitätsbegriff als auch die sub‐ jektive Bewertung durch die KundInnen (ZT-RezipientInnen) berücksichtigt werden sollten. Aufbauend darauf wurde in 2.1.2 Dolmetschqualität für die Zwecke der vorliegenden Arbeit als kognitive Wirkungsäquivalenz definiert, die hier als produktbezogener Qualitätsbegriff betrachtet werden soll. Bis auf die stets als sehr wichtig eingestufte Sinnübereinstimmung mit dem Original, 24 2 Begriffsbestimmung die bereits im produktbezogenen Qualitätsbegriff enthalten ist, variieren Kund‐ Innenerwartungen, wie bereits erwähnt, unter verschiedenen Zielgruppen sehr stark (siehe auch 3.2.1). Man kann also nicht von einer allgemeingültigen, homogenen Definition von Qualität für DolmetschnutzerInnen ausgehen. Viel‐ mehr ist es sinnvoll, die wahrgenommene Dienstleistungsqualität für die jewei‐ ligen NutzerInnen individuell zu erheben. In diesem Abschnitt soll nun festge‐ legt werden, wie diese Aspekte messbar gemacht, also operationalisiert, werden sollen. Wie in 2.1.2 gezeigt wurde, postulieren verschiedene Dolmetschwissenschaft‐ lerInnen und PraktikerInnen (z. B. Herbert 1952, Seleskovitch 1988, Déjean Le Féal 1990), dass AT und Dolmetschung die gleiche Wirkung auf ihre jeweiligen RezipientInnen haben sollten; Methoden zur Messung der Erreichung dieses Ziels werden jedoch nicht immer besprochen. In der Skopostheorie (Vermeer 1978: 101) gilt eine Translation als erfolgreich, wenn vom Empfänger kein Pro‐ test eingelegt wird. Dies lässt sich jedoch schwer messen und Protest von Re‐ zipientInnen kommt in der Praxis zumindest in nicht-dialogischen Dolmetsch‐ settings wohl kaum vor. Déjean Le Féal merkt an, dass man bei Diskussionen auch das Funktionieren der Kommunikation als Zeichen einer geglückten Dol‐ metschung ansehen könne, was aber nicht mit der Erfüllung der Qualitätsstan‐ dards gleichgesetzt werden dürfe (Déjean Le Féal 1990: 156). Sie schlägt daher zur Beurteilung der Verständlichkeit einer Dolmetschung vor, das Verständnis einer „typischen“ DolmetschrezipientIn mit jenem einer vergleichbaren Rezip‐ entIn des AT zu vergleichen (Déjean Le Féal 1990: 159). Auch Kalina (2009) spricht sich für einen Vergleich von AT- und ZT-Wirkung aus, da Beurteilungen des ZT durch die RezipientInnen lediglich der Überprüfung der ZT-Rezeption dienen könnten (Kalina 2009: 172): Dieser Vergleich wäre jedoch eine wichtige Größe für die Bestimmung des Erfolgs der Wirkung des ZT, da die intendierte Wirkung des Originals auf die AT-Rezipienten für die mit der ZT-Produktion intendierte Wirkung eine Rolle spielt (…). Wenn die Rela‐ tion zwischen ZT und Rezipienten im Mittelpunkt steht, so sind die Verstehenspro‐ zesse der Rezipienten einzubeziehen. (Kalina 2009: 170) Eine tatsächliche Operationalisierung im Bereich des Lautsprachdolmetschens erfolgt zunächst allerdings nur durch Gerver (1972), der die Verständlichkeit verschiedener Dolmetschmodi mittels Hörverständnistests vergleicht, sowie über zwei Jahrzehnte später durch Shlesinger (1994). Sie setzt Hörverständnis‐ tests ein, um die Verständlichkeit von Dolmetschungen und vorgelesenen Trans‐ kripten derselben Dolmetschungen zu messen (siehe 3.3.1). 25 2.1 Qualität Im Bereich des Gebärdendolmetschens ist die Verwendung von Tests zur Be‐ urteilung der Verständlichkeit von Dolmetschungen jedoch wesentlich weiter verbreitet (siehe 3.3). Bereits seit den 1970er-Jahren wurden hier einerseits ver‐ schiedene Dolmetschmodi (z. B. Murphy & Fleischer 1977, Cokely 1990, Li‐ vingston et al. 1994) oder Dolmetschungen von muttersprachlichen vs. nicht‐ muttersprachlichen GebärdensprachdolmetscherInnen (z. B. Llewellyn-Jones [1981]/ 2015) untereinander verglichen, andererseits wurde auch untersucht, ob gehörlose Personen die gebärdete Dolmetschung gleich gut verstehen wie hö‐ rende Personen die in Lautsprache gesprochenen Inhalte (z. B. Marschark et al. 2004, Napier & Spencer 2008, Rodríguez Ortiz & Mora Roche 2008). Im Bereich des lautsprachlichen Dolmetschens wird die Messung der Ver‐ ständlichkeit der Dolmetschung erst 15 Jahre nach Shlesinger (1994) an der Universität Wien wieder aufgegriffen, wo Hörverständnistests als Teil des im Rahmen des QuaSI-Projekts entwickelten funktional-kognitiven Ansatzes zur Bewertung von Dolmetschqualität (vgl. Pöchhacker 2012) zum Einsatz kommen. In einem Pilotversuch untersucht Grübl (2010) den Einfluss der Stimmlage auf die Verständlichkeit von Dolmetschungen und vergleicht das Verständnis der Dolmetschungen mit dem des AT (siehe 3.3.2). Diese Methodik wird im QuaSI-Projekt weiterentwickelt und für die Studie zu Simultandolmetschen vs. Englisch als Lingua Franca (Reithofer 2014) sowie die Untersuchung des Ein‐ flusses der Parameter Intonation (Holub 2010) und Flüssigkeit (Rennert 2010, 2013, vorliegende Arbeit) auf die kognitive Wirkung der Dolmetschung ver‐ wendet. Wie besprochen soll zusätzlich zu diesem produktbezogenen Qualitätsbegriff auch die kundInnenseitig wahrgenommene Qualität erhoben werden. Beim im Rahmen der vorliegenden Arbeit durchgeführten Experiment ist ein Rating‐ format gut geeignet, um die subjektive Bewertung des Versuchsmaterials durch die ProbandInnen zu erheben. Die Ratingfragen können ebenso wie der Hör‐ verständnistest in schriftlicher Form administriert werden. Diese subjektiven Bewertungen können dann den Ergebnissen des Hörverständnistests gegen‐ übergestellt werden, um so ein mehrdimensionales Bild der Qualität zu erhalten und gleichzeitig festzustellen, ob und in welcher Weise die beiden Qualitäts‐ perspektiven auseinandergehen. Beispiele für die hier besprochenen und andere Methoden der Qualitätsfor‐ schung in der Dolmetschwissenschaft finden sich in Kapitel 3, in dem ausge‐ wählte Studien vorgestellt werden, die sich mit Redeflüssigkeit als Qualitäts‐ merkmal befassen. Der Begriff der Redeflüssigkeit wird nachfolgend definiert. 26 2 Begriffsbestimmung 2.2 Redeflüssigkeit Wie bei der Qualität ist auch die Definition von Redeflüssigkeit nicht einfach. Bei der Bewertung von Gesprochenem - seien es Dolmetschungen, öffentliche Ansprachen oder der Fremdsprachenunterricht - wird häufig die Flüssigkeit der Rede als wichtiges Kriterium genannt, das die Qualität der Darbietung mit aus‐ macht. Angesichts der großen Bedeutung, die der Flüssigkeit in vielen Bereichen beigemessen wird, erscheint es erstaunlich, dass eine eindeutige und allgemein anerkannte Definition des Begriffes bislang ausständig ist. Zwar wird der Begriff in der Fachliteratur vieler Disziplinen häufig verwendet, oft jedoch ohne nähere Definition. Auch wenn die meisten Menschen sagen können, ob sie etwas Geh‐ örtes als „flüssig“ oder „unflüssig“ empfinden, so sind diese Einschätzungen keinesfalls einheitlich, sodass der Begriff der Flüssigkeit nicht als allgemein ein‐ deutig definiert vorausgesetzt werden kann. Dieser Abschnitt widmet sich daher zunächst in 2.2.1 eingehend der Proble‐ matik der Begriffsbestimmung. Danach werden in 2.2.2 verschiedene Ansätze besprochen und es wird eine Definition von Flüssigkeit für den Bereich der Dolmetschwissenschaft aufgestellt, deren Komponenten anschließend näher beschrieben werden. Die Begriffe Flüssigkeit und Redeflüssigkeit werden in der vorliegenden Arbeit synonym verwendet. 2.2.1 Problematik der Definition Eine grundsätzliche Schwierigkeit liegt in den vielfältigen Bedeutungen und vor allem auch in der alltagssprachlichen Verwendung des Begriffs (vgl. Aguado Padilla 2002: 14, Guillot 1999: vii, Koponen & Riggenbach 2000: 19). Sowohl die deutschen Ausdrücke „Flüssigkeit der Rede“, „Sprechflüssigkeit“, „Redeflüssig‐ keit“ oder „fließend“ als auch das englische „fluency“ bzw. „fluent“ haben in unterschiedlichen Disziplinen verschiedene Bedeutungen. Zu den Disziplinen, die sich unter diversen Gesichtspunkten mit Flüssigkeit beschäftigen, zählen u. a. Psychologie, Psycholinguistik, Soziolinguistik, Sprach‐ pathologie und Fremdsprachendidaktik (vgl. Aguado Padilla 2002: 12 f.). Diese enorme Bandbreite an verschiedenen Perspektiven und unterschiedlichen Weisen, in denen „Flüssigkeit“ verstanden wird, erklärt zum Teil das Fehlen einer einheitlichen Definition. Doch auch innerhalb der einzelnen Fachgebiete hat sich bislang keine allgemein akzeptierte Definition herausgebildet, und es herrscht allenfalls Einigkeit darüber, dass es sich um ein komplexes Phänomen handelt, für das es keine einheitliche Definition gibt (vgl. Aguado Padilla 2002: 14, Freed 2000: 245, Guillot 1999: vii, Koponen & Riggenbach 2000: 19). Guillot 27 2.2 Redeflüssigkeit (1999: vii) stellt fest, dass der Begriff der Flüssigkeit trotz des Fehlens einer klaren Definition von ExpertInnen wie auch Laien mit einer Selbstverständlichkeit verwendet wird, die angesichts der intuitiven Herangehensweise kaum ge‐ rechtfertigt erscheint: Fluency is an elusive notion. It has a foot in almost every language-related discipline, without being the province of any one in particular, and crosses over boundaries in a way which has made it resistant to analysis and rationalisation, even within applied linguistics. Yet it is peculiarly available to all, language specialists and non-specialists, as a measure of oral performance, and is used with a confidence which hardly seems justified in view of the scarcity of accounts governed by anything other than intuition. (Guillot 1999: vii) Allgemeinsprachlich wird der Begriff der Flüssigkeit vor allem im Zusammen‐ hang mit der Beherrschung von Fremdsprachen verwendet, etwa in „fließend Französisch sprechen“. In diesem Sinne ist Flüssigkeit das höchste erreichbare Niveau auf einer Skala, die aus Abstufungen wie „Grundkenntnisse“, „gute Kenntnisse“ und „fließend in Wort und Schrift“ besteht. (vgl. Lennon 1990: 389) Flüssigkeit wird aber manchmal auch mit Eloquenz, geistreicher oder witziger Konversation oder auch Geschwätzigkeit gleichgesetzt (vgl. Fillmore 1979: 93). Andere wiederum sehen grammatikalische Korrektheit als Bestandteil flüssiger Rede an (vgl. Freed 2000: 254), während vor allem im englischen Sprachraum im Bereich der Fremdsprachendidaktik „fluency“ (im Sinne von „ohne Unterbre‐ chungen sprechen“) in Opposition zu „accuracy“ gestellt wird (vgl. Brumfit 2000, Freed 2000: 244). Neben dieser allgemeinen Ebene gibt es das engere Verständnis von Flüssig‐ keit als Komponente der mündlichen Sprachkompetenz. Dies ist vor allem im Fremdsprachunterricht der Fall, wo mündliche Leistungen nach Kriterien wie Aussprache, Grammatik, Wortschatz, idiomatischer Ausdruck und Flüssigkeit der Rede beurteilt werden. Hier gibt es oft auch verschiedene Abstufungen von „Flüssigkeit“. (vgl. Lennon 1990: 389) Der Gemeinsame Europäische Referenz‐ rahmen für Sprachen etwa beschreibt Flüssigkeit allgemein als „the ability to articulate, to keep going, and to cope when one lands in a dead end“ (COE 2000: 128). Flüssigkeit ist dort in eine 6-stufige Skala unterteilt, deren höchste Stufe lautet: „Can express him/ herself at length with a natural, effortless, unhesitating flow. Pauses only to reflect on precisely the right words to express his/ her thoughts or to find an appropriate example or explanation“ (COE 2000: 129). Neben diesen zwei Bedeutungen, die sich vor allem auf die Sprachbeherr‐ schung und die Ausdrucksweise beziehen, ist Flüssigkeit aber auch ein proso‐ disches Merkmal der gesprochenen Sprache, das wie Intonation, Lautstärke und 28 2 Begriffsbestimmung Rhythmus jede Äußerung begleitet und prägt (vgl. Ahrens 2004: 76 f.). In diesem Sinne, in dem sie vor allem in der Linguistik und in jüngerer Zeit auch in der Dolmetschwissenschaft behandelt wird, soll Flüssigkeit in der vorliegenden Ar‐ beit verstanden werden. 2.2.2 Flüssigkeit als Funktion temporaler Variablen Wie bereits einleitend erwähnt, ist Flüssigkeit aufgrund der Vielfalt an Bedeu‐ tungen ein schwer fassbarer Begriff. Problematisch ist dabei nicht nur, dass es sehr viele verschiedene Definitionen gibt, sondern auch, dass oft überhaupt auf eine nähere Definition verzichtet wird oder diese implizit vorausgesetzt wird, wie Guillot (1999) feststellt: [W]hile references to it in applied linguistics are frequent, attempts to circumscribe it and get to grips with what is involved are few, in a field otherwise so punctilious in defining its concepts.(…) Although the question of fluency is sometimes signalled as a problem area (…), its meaning on the whole tends to be simply assumed, taken for granted, or elusively defined - explicitly or implicitly - as something like ‘ease of communication’ or ‘smoothness of expression’, that is to say in ways reminiscent of general dictionary definitions. (Guillot 1999: 3) Nicht selten wird von einem intuitiven Gefühl für Flüssigkeit ausgegangen (vgl. Aguado Padilla 2002: 14), oder es werden „schwer zu operationalisierende, sub‐ jektive und intuitive Begriffe“ (Aguado Padilla 2002: 13) ins Treffen geführt, wie hier von Ejzenberg, die von „unnatürlichen“ Unterbrechungen des Redeflusses spricht: Oral fluency is here described as a component of overall language ability or profi‐ ciency that indicates the degree to which speech is articulated smoothly and conti‐ nuously without any ‘unnatural’ breakdowns in flow. (Ejzenberg 2000: 287) Andere hingegen gehen eher von einem Zusammenspiel von temporalen Varia‐ blen und anderen, weniger greifbaren, Faktoren wie Stimmqualität, Sicherheit beim Sprechen und Aussprache aus (vgl. Freed 2000: 261). Auf der Suche nach objektiven, quantifizierbaren Parametern, über die Flüs‐ sigkeit wissenschaftlich bestimmt werden kann, fällt die Wahl schließlich bei einem großen Teil der AutorInnen in Linguistik, Dolmetschwissenschaft und auch Zweitspracherwerb auf temporale Variablen wie Pausen, Sprechrate und Häsitationen. Zwar gibt es Unterschiede bei der Anzahl der berücksichtigten Teilparameter und deren Klassifizierung, doch gibt es auch einige zentrale Be‐ 29 2.2 Redeflüssigkeit griffe, die sich in zahlreichen Definitionen wiederfinden (vgl. Aguado Padilla 2002). Lennon (2000) unterscheidet zwischen „higher-order fluency“, der Sprach‐ beherrschung im weiteren Sinne, und „lower-order fluency“, die über temporale Variablen wie z. B. Sprechgeschwindigkeit, Pausen, Fehlstarts und Häsitationen gemessen werden kann: Lower-order fluency can be measured both impressionistically and instrumentally by speech rate and by such dysfluency markers as filled and unfilled pauses, false starts, hesitations, lengthened syllables, retraces, and repetitions. (Lennon 2000: 25) Bei Hedge (1993: 275) finden sich „frequent pauses, repetitions, and self-correc‐ tions“ als Merkmale unflüssiger Sprachproduktion bei Nicht-Muttersprachlern, während Chambers (1997) ihr Augenmerk vor allem auf Pausen und Häsitati‐ onen richtet. Nicht nur diese Phänomene selbst sind dabei allerdings von Be‐ deutung, sondern auch deren Dauer und Häufigkeit: The presence, length and frequency of silences and hesitations affect the listener’s perception of an interlocutor’s fluency. (Chambers 1997: 538) Für Laver (1994: 537) ist auch die Position der Pausen wichtig; er unterscheidet folglich zwischen „continuous, fluent speech“ ohne jegliche Pause und „non-continuous but fluent speech“, in der zwischen einzelnen Intonationsein‐ heiten durchaus ungefüllte Pausen vorkommen können, nicht aber innerhalb der Intonationseinheiten. Im Bereich der Dolmetschwissenschaft sehen Kurz & Pöchhacker (1995) Flüs‐ sigkeit ebenfalls als ein Zusammenwirken verschiedener temporaler Faktoren, wie Sprechgeschwindigkeit, Häsitationen, Pausen und Fehlstarts, merken aber auch an, dass nicht bekannt sei, welchen Beitrag die einzelnen Faktoren zum Eindruck der Flüssigkeit leisten: What is conveniently labeled fluency of delivery for the purpose of user expectation surveys is actually a highly complex paralinguistic criterion which relates to such interdependent features as speaking speed, pauses, voiced hesitation, and false starts. While the relative weight of these factors in shaping judgments on the fluency of a simultaneous interpretation is not clearly understood, these paraverbal and textual parameters are at least amenable to quantitative analysis. (Kurz & Pöchhacker 1995: 354, Hervorhebung im Original) Mead (2005: 45) berücksichtigt in seiner Bewertung der Flüssigkeit von Konse‐ kutivdolmetschungen die temporalen Variablen Sprechrate (Wörter bzw. Silben pro Minute), Pausendauer, Anteil der Sprachproduktion an der Gesamtredezeit, 30 2 Begriffsbestimmung Artikulationsrate (Wörter bzw. Silben pro Minute reiner Redezeit, abzüglich der Pausen) sowie die durchschnittliche Länge (in Wörtern oder Silben) von Rede‐ abschnitten zwischen zwei Pausen. Andere Unflüssigkeiten wie Fehlstarts oder Wiederholungen schließt er hingegen von der Beurteilung aus: Other disfluencies such as false starts and repetitions (…) are related as much to con‐ tent as to rhythm and will thus not be examined in this initial exploration of inter‐ preters’ fluency. (Mead 2005: 46) Tissi (2000) verwendet für ihre Untersuchung von ungefüllten Pausen und Un‐ flüssigkeiten beim Simultandolmetschen ein detailliertes Analyseschema, in dem die Oberkategorie „non-fluencies“ in „ungefüllte Pausen“ und „Unflüssig‐ keiten“ („disfluencies“) unterteilt wird, wobei letztere Kategorie in „gefüllte Pausen“ und „Unterbrechungen“ geteilt ist. Bei den ungefüllten Pausen wird zwischen Pausen mit grammatikalischer oder kommunikativer Funktion und ungrammatikalischen Pausen unterschieden. Gefüllte Pausen unterteilt sie in Häsitationen und Lautdehnungen, die Unterbrechungen wiederum in Wie‐ derholungen, Strukturänderungen und Fehlstarts (vgl. Tissi 2000: 112). Für die Zwecke der vorliegenden Arbeit soll Flüssigkeit als eine Funktion verschiedener temporaler Variablen definiert werden. Die komplexe Interaktion der Variablen Pausen, Häsitationen, Fehlstarts, Selbstkorrekturen und Sprechge‐ schwindigkeit erweckt den Eindruck einer flüssigen oder unflüssigen Rede. Die einzelnen Variablen sollen nun im Folgenden genauer beleuchtet werden. 2.2.2.1 Pausen Unter Pausen versteht man Unterbrechungen des Redeflusses bzw. „eine Un‐ terbrechung im akustischen Signal des geäußerten Lautkontinuums“ (Ahrens 2004: 102). Diese Unterbrechung kann aus einer ungefüllten (auch stille oder stumme Pause genannt) oder einer mit Häsitationslauten oder anderen Unflüs‐ sigkeiten wie Lautlängungen gefüllten Pause bestehen (siehe Abschnitt 2.2.2.2). Eine Definition rein über das akustische Signal ist allerdings problematisch, da Pausen von ZuhörerInnen auch an Stellen wahrgenommen werden können, an denen es gar nicht zu einer tatsächlichen Unterbrechung des akustischen Signals kommt, beispielsweise beim Reset der Grundfrequenz zu Beginn einer neuen Intonationseinheit (vgl. Ahrens 2004: 102) oder bei der Dehnung von Lauten vor oder als Ersatz für eine Pause (vgl. Pompino-Marschall 1995: 237). Diese sogenannte präpausale Längung ist laut Pompino-Marschall (1995: 237) eine „lokale Verlangsamung der Sprechgeschwindigkeit“, durch die sich die Dauer der betroffenen Lautsegmente erhöht und die zur auditiven Wahrneh‐ mung einer Pause führt, selbst wenn keine echten Signalpause vorliegt (vgl. 31 2.2 Redeflüssigkeit Pompino-Marschall 1995: 238). Andererseits kommt es wiederum bei be‐ stimmten Lauten (stimmlosen Verschlusslauten) zu einer Pause im akustischen Signal, die sogar länger sein kann als manche wahrgenommene Pausen, aber nicht als solche empfunden wird (vgl. Ahrens 2004: 102, Laver 1994: 536, Pom‐ pino-Marschall 1995: 174). Viele AutorInnen geben eine Mindestlänge für Pausen an, die allerdings stark variiert: Während Goldman-Eisler (1968: 12) 0,25 Sekunden als Minimalwert betrachtet um artikulationsbedingte Unterbrechungen (z. B. durch aufeinander treffende Verschlusslaute) auszuschließen, stellen Hieke et al. (1983) fest, dass viele Pausen im Bereich zwischen 0,13 und 0,25 Sekunden eine kognitive Funk‐ tion haben, weshalb sie eine Mindestlänge von knapp über 0,10 Sekunden vor‐ schlagen. Eine eindeutige Untergrenze für Pausen ist auch deshalb schwer fest‐ zulegen, weil die Länge, ab der eine Pause wahrgenommen wird, stark von ihrer Position abhängig ist. Butcher (1981) stellt fest, dass Pausen an syntaktischen Positionen von den meisten ZuhörerInnen erst ab einer Länge von 220 ms wahrgenommen werden, an nichtsyntaktischen Positionen aber bereits ab rund einem Drittel dieses Wertes: … whereas breaks between tone groups are not heard by 75 % of listeners until they are approximately 220 ms long, breaks within tone groups are heard by the same proportion of listeners when only 80 ms long. (Butcher 1981: 205) Obwohl Unterbrechungen des Sprachsignals mit moderner Audiobearbeitungs‐ software leichter identifiziert werden können, ist es nicht immer möglich, zwi‐ schen einer sehr kurzen Pause und einer kurzen physiologisch bedingten Un‐ terbrechung des Sprachsignals zwischen zwei Lauten zu unterscheiden (Pradas Macías 2015: 166). Pausen können nach ihrer Funktion oder Position unterschieden werden, wobei diese beiden Faktoren häufig zusammenhängen. So trifft etwa Laver (1994: 537) die funktionelle Unterscheidung zwischen „hesitation pauses“ und „juncture pauses“ danach, ob sie innerhalb oder zwischen Intonationseinheiten liegen. Eine ähnliche, auf der Position basierende Einteilung sind die „tentative and final pauses“ (Pike 1967: 31), also Pausen innerhalb oder am Ende von grammatikalischen Einheiten. Ihrer Funktion nach können Pausen physiolo‐ gisch, kognitiv oder semantisch bzw. grammatikalisch bedingt sein. So fallen etwa Atempausen und Artikulationspausen in die Kategorie der physiologi‐ schen Pausen, während kognitiv bedingte Pausen vornehmlich der Sprachpla‐ nung dienen (Goldman-Eisler (1968: 12) bezeichnet diese als „hesitation pauses“). Pausen semantischer bzw. grammatikalischer Natur treten beispiels‐ weise auf, wenn sie der Abgrenzung einzelner Redeteile voneinander bzw. der 32 2 Begriffsbestimmung Strukturierung der Rede dienen (vgl. Butcher 1981: 209 f., Goldman-Eisler 1968). Sowohl in spontaner als auch in gelesener Sprache stehen Atempausen häufig in syntaktischen Positionen (vgl. Ahrens 2004: 186-187, Butcher 1981: 112, Chambers 1997: 539, Schmitz 2008: 19), da in der normalen Sprechplanung phy‐ siologische und kognitive Prozesse aufeinander abgestimmt werden können. Da beim Dolmetschen aufgrund der Abhängigkeit von der ProduzentIn des Aus‐ gangstextes (AT) die Planung nicht immer autonom möglich ist, ist dies laut Ahrens (2004: 187) eine mögliche Erklärung für die manchmal nicht-syntakti‐ sche Positionierung von Pausen im ZT. Die Position entscheidet nicht nur darüber, ab welcher Länge eine Pause als solche wahrgenommen wird, sondern auch darüber, ob sie für die Verarbeitung durch die ZuhörerInnen hilfreich oder störend ist. Pausen können eine kom‐ munikative Wirkung haben, etwa wenn sie die Aufmerksamkeit auf das nach‐ folgende Wort lenken (vgl. Lindner 1969: 211), und auch rhetorisch wirkungsvoll eingesetzt werden. Pausen zwischen Intonationsbzw. Informationseinheiten grenzen diese voneinander ab und erfüllen somit eine wichtige Funktion bei der Segmentierung des Sprechflusses (vgl. Ahrens 2004: 104 f., Goldman-Eisler 1968: 13). Ahrens (2004) unterscheidet daher auch sinnunterstützende und störende Pausen nach ihrer Position: Sinnunterstützend sind Pausen, die zum Beispiel am Ende von Phrasen oder Sätzen auftreten. Pausen, die innerhalb einer grammatischen Struktur gemacht werden, in der üblicherweise keine Pausen vorkommen, können dagegen den Verstehensprozess der Zuhörer eher behindern. (Ahrens 2004: 159 f.) Auch Chambers (1997) weist auf die Bedeutung der Pausenpositionierung hin und stellt fest, dass Pausen zwischen Satzteilen oder nach semantischen Ein‐ heiten als natürliche Atempausen akzeptiert werden, während Pausen an an‐ deren Stellen als Zögern interpretiert werden: Although listeners accept pauses in their native language, not all pauses are accep‐ table, hence the differentiation between ‘natural’ and ‘unnatural pauses’. Natural pauses, allowing breathing space, usually occur at some clause junctures or after groups of words forming a semantic unit. Pauses appearing at places other than these are judged as hesitations, revealing either lexical or morphological uncertainty. (Chambers 1997: 539) Das Vorhandensein von Pausen allein verringert die Flüssigkeit also nicht; viel‐ mehr ist es die Position, die darüber bestimmt, ob eine Pause als störend und die Flüssigkeit behindernd oder als unterstützend empfunden wird. 33 2.2 Redeflüssigkeit 2.2.2.2 Unflüssigkeiten Als Unflüssigkeiten können alle Arten von Phänomenen bezeichnet werden, die den Redefluss unterbrechen (vgl. Fox Tree 2003: 983). Während manche Auto‐ rInnen auch ungefüllte Pausen zur Kategorie der Unflüssigkeiten zählen, er‐ scheint diese Einteilung für die Zwecke der vorliegenden Arbeit nicht konse‐ quent, da ungefüllte Pausen, wie in Abschnitt 2.2.2.1 beschrieben, verschiedene Funktionen erfüllen können und daher nicht immer als Unflüssigkeit emp‐ funden bzw. bisweilen überhaupt nicht wahrgenommen werden. Gefüllte Pausen hingegen fallen klar in die Kategorie der Unflüssigkeiten, da sie immer eine Unterbrechung des Redeflusses darstellen. Gefüllte Pausen sind meist mit Häsitationslauten („ääh“, „hmm“, „ähm“) oder in die Länge gezogenen Lauten gefüllt. Im Gegensatz zur im vorigen Abschnitt erwähnten präpausalen Längung, die als ungefüllte Pause wahrgenommen wird, sind diese Dehnungen als Unflüssigkeiten wahrnehmbar. Diese Phänomene sind typisch für spontane Rede und treten in vorgelesenen Texten kaum auf (vgl. Henderson et al. 1966), da sie ein Anzeichen für spontane Sprachplanungspro‐ zesse sind und meist eingesetzt werden, um Zeit für die Planung der Rede zu gewinnen (vgl. Arnold & Tanenhaus 2011; Clark & Wasow 1998; Hieke 1981). Es gibt Hinweise darauf, dass ZuhörerInnen nach Unflüssigkeiten eher einen neuen oder schwierigen Begriff erwarten als einen bereits genannten, was da‐ rauf hindeuten würde, dass wir auch beim Zuhören diese Planungsfunktion zu‐ mindest unbewusst erkennen (Arnold & Tanenhaus 2011; Brennan & Schober 2001). Ebenfalls zu den Unflüssigkeiten gehören verschiedene Arten von Unterbre‐ chungen. Dazu zählen Wiederholungen, Fehlstarts und Selbstkorrekturen. Zu den ersten gehört das Wiederholen von Wörtern, Silben oder Satzteilen, soweit dies keine rhetorische Funktion erfüllt (Tissi 2000: 114). Fehlstarts entstehen, wenn ein Satz abgebrochen und stattdessen ein neuer angefangen wird, ohne den vorherigen zu korrigieren. Zu den Selbstkorrekturen zählt sowohl die Kor‐ rektur von Versprechern als auch von grammatikalischen, strukturellen, inhalt‐ lichen oder stilistischen Fehlern. Manche Planänderungen, bei denen innerhalb eines Satzes die Struktur geändert wird, können ebenfalls zu den Selbstkorrek‐ turen gezählt werden (vgl. Pöchhacker 1994a: 135 f., Tissi 2000: 114). Im Gegen‐ satz zu Häsitationslauten und Lautdehnungen dienen diese Arten von Unflüs‐ sigkeiten meist nicht der Verzögerung und Sprachplanung, sondern der Korrektur von Fehlern (Selbstkorrekturen) bzw. sind das Ergebnis bewusster oder unbeabsichtigter Planänderungen oder Versprecher (Fehlstarts). Wortwie‐ derholungen können zwei verschiedene Funktionen erfüllen: Sie können einer‐ seits der Verzögerung und damit der Sprachplanung dienen, andererseits kann 34 2 Begriffsbestimmung die Wiederholung des letzten vor einer Pause geäußerten Wortes der Anknüp‐ fung an das zuvor Gesagte dienen. (vgl. Hieke 1981: 152 ff.) 2.2.2.3 Sprechgeschwindigkeit Auch bei der Sprechgeschwindigkeit herrscht keine Einigkeit darüber, wie sie zu messen sei. Sie wird häufig in Silben pro Zeiteinheit gemessen (vgl. Goldman-Eisler 1958: 61, Möhle 1984: 27), was gegenüber der Messung in Wör‐ tern pro Zeiteinheit vor allem bei sprachübergreifenden Untersuchungen den Vorteil hat, dass es den Vergleich verschiedener Sprachen unter Berücksichti‐ gung ihrer strukturellen und morphosyntaktischen Unterschiede ermöglicht und somit eine objektivere Messgröße darstellt (vgl. Ahrens 2004: 141, Pöchha‐ cker 1994a: 131 f.). Pfitzinger (2001) plädiert allerdings für eine differenziertere Messung und weist darauf hin, dass Wort-, Silben- und Phonrate sich vonein‐ ander unterscheiden (Pfitzinger 2001: 129): Zweifellos werden hohe Sprechgeschwindigkeiten vorwiegend von überdurch‐ schnittlichen Wort-, Silben- und Phonraten begleitet und niedrige Sprechgeschwin‐ digkeiten eher von unterdurchschnittlichen Raten. Diese oft beobachtete Kovariation führte in der phonetischen Forschung zu der weit verbreiteten Praxis, Sprechge‐ schwindigkeit durch eine beliebige dieser drei Raten zu kennzeichnen. (Pfitzinger 2001: 123) Unabhängig davon, welche sprachliche Einheit verwendet wird, wird in der Li‐ teratur häufig zwischen Sprechrate und Artikulationsrate unterschieden. Die Sprechrate ist die durchschnittliche Anzahl von Einheiten pro Minute (oder Se‐ kunde) der Gesamtzeit inklusive Pausen, während für die Artikulationsrate nur die reine Redezeit, also abzüglich der ungefüllten Pausen aber einschließlich Häsitationen und gefüllter Pausen, berücksichtigt wird (vgl. Ahrens 2004: 101, Goldman-Eisler 1958: 61, Laver 1994: 539, Möhle 1984: 27). Diese Unterschei‐ dung ist notwendig, weil in Reden mit vielen Pausen zwar die Sprechrate niedrig ist, die Abschnitte zwischen den Pausen aber dennoch sehr schnell artikuliert sein können (vgl. Ahrens 2004: 101). Dies macht die Artikulationsrate gerade auch in der Dolmetschforschung zu einem wichtigen Analysewerkzeug, da es bei Simultandolmetschungen durch das Warten auf den Ausgangstext zu län‐ geren Pausen, gefolgt von dichten, schnellen Redeabschnitten, kommen kann (vgl. Goldman-Eisler 1972: 128 f., Kurz & Pöchhacker 1995: 355). Für diese un‐ terschiedlichen Geschwindigkeiten eignet sich für die Analyse die Unterschei‐ dung in globale und lokale Sprechgeschwindigkeit: Die globale Sprechge‐ schwindigkeit (in Einheiten pro Sekunde) wird als Durchschnitt der gesamten Rede berechnet, während die lokale Sprechgeschwindigkeit in gleichmäßigen 35 2.2 Redeflüssigkeit Abständen über den ganzen Text gemessen wird, um so eine Sprechgeschwin‐ digkeitskurve zu ermitteln (vgl. Pfitzinger 2001: 13). Es sei allerdings darauf hingewiesen, dass die gemessene Geschwindigkeit nicht unbedingt mit der wahrgenommenen überstimmt. So stellte Pfitzinger (2001: 203 ff.) in einer Reihe von Experimenten fest, dass sowohl die lokale Silbenals auch Phonrate nur schlecht dazu geeignet sind, die wahrgenommene Sprechgeschwindigkeit vorherzusagen. Die genaue Kombination von akusti‐ schen Merkmalen, die die wahrgenommene Sprechgeschwindigkeit (perzibierte lokale Sprechgeschwindigkeit) bestimmen, ist noch unbekannt (vgl. Pfitzinger 2001: 218 ff.). Einige AutorInnen verwenden auch die Länge von Redeabschnitten (in Silben oder Wörtern) zwischen zwei Pausen als weitere Variable zur Bestimmung der Flüssigkeit (vgl. Lennon 1990: 404, Möhle 1984: 27). Für die vorliegende Arbeit erscheint dieser Parameter für sich genommen allerdings nicht sinnvoll, da der Eindruck von Flüssigkeit vermutlich weniger vom Abstand zwischen den ein‐ zelnen Pausen als von der Position und Länge der Pausen abhängt (vgl. Pfit‐ zinger 2001: 140 ff.). Wenngleich es in extremen Fällen (nur wenige Wörter zwi‐ schen den Pausen) durchaus aufschlussreich sein könnte, sei an dieser Stelle auf die Untersuchung von Goldman-Eisler (1968: 17) hingewiesen, bei der selbst beim höchsten Grad von Flüssigkeit (mehrfache Wiederholung der Aufgabe mit entsprechendem Lerneffekt) 65 % der (halb)spontanen Redeabschnitte aus höchstens fünf Wörtern bestanden. Eindeutige Rückschlüsse von der Länge von Redeabschnitten auf wahrgenommene Flüssigkeit lassen sich also nicht zwangs‐ läufig ziehen. Für die vorliegende Arbeit werden trotz der besprochenen Unzulänglich‐ keiten die globale Sprechrate in Silben bzw. anderen Lauten (z. B. Häsitationen) pro Sekunde der Gesamtzeit (einschließlich Pausen) und die globale Artikulati‐ onsrate in Silben bzw. anderen Lauten pro Sekunde der reinen Redezeit (Ge‐ samtzeit abzüglich Pausen) verwendet. Die Silbenzahl wird dabei nicht wie in der Phonetik und Dolmetschforschung meist üblich über die kanonische Form (also die Transkription) bestimmt, sondern es werden die tatsächlich artiku‐ lierten Silben gezählt. Verschmelzen zwei Silben zu einer, wird dies also nur als eine Silbe gezählt (vgl. Pfitzinger 2001: 140). 36 2 Begriffsbestimmung 3 Flüssigkeit in der Dolmetschwissenschaft: Ein Forschungsüberblick Qualitätsforschung und Redeflüssigkeit sind in der Dolmetschwissenschaft eng miteinander verknüpft. Gerade im Bereich des Simultandolmetschens haben zahlreiche Erwartungserhebungen und Beurteilungsstudien gezeigt, dass so‐ wohl DolmetscherInnen als auch ZuhörerInnen Flüssigkeit als wichtiges Qua‐ litätsmerkmal sehen. Neben diesen Studien gibt es auch verschiedene experi‐ mentelle Ansätze, die sich aus diversen Gesichtspunkten mit Flüssigkeit bzw. ihren Teilaspekten, etwa Pausen, beschäftigen. Auf den ersten Blick könnte man also vermuten, dass dies ein bereits gut untersuchtes Forschungsgebiet darstelle. Da es jedoch, wie in Kapitel 2 dargelegt wurde, weder für Qualität noch für Flüssigkeit eine einheitliche Definition gibt, ist bei vielen Forschungsarbeiten keine Vergleichbarkeit gegeben, da von unterschiedlichen Begriffen ausge‐ gangen wird. Dennoch soll in diesem Kapitel ein Überblick über den Stand der Forschung zum Thema Redeflüssigkeit sowie deren Überschneidungen mit der Qualitätsforschung geboten werden. In Abschnitt 3.1 wird der Blick auf Flüssigkeitsmerkmale in Ausgangs- und Zieltext gerichtet. Dabei geht es - im Gegensatz zu den darauffolgenden Ab‐ schnitten - weniger um den Aspekt der Qualitätsbeurteilung als um die Inzidenz von (Un)flüssigkeitsmerkmalen in AT und ZT sowie mögliche Zusammenhänge. In der Qualitätsforschung im Bereich der Dolmetschwissenschaft hat das Thema Flüssigkeit bisher hauptsächlich im Rahmen von Erwartungserhebungen und Qualitätsbeurteilungen Beachtung gefunden, weshalb Abschnitt 3.2 verschie‐ denen Ausprägungen dieser Art von Studien gewidmet ist. Zunächst werden in 3.2.1 Studien vorgestellt, in denen die Erwartungen verschiedener Zielgruppen erhoben oder Dolmetschungen in authentischen Situationen durch verschie‐ dene Zielgruppen beurteilt wurden. 3.2.2 ist experimentellen Qualitätsstudien gewidmet, bei denen Dolmetschungen unter kontrollierten Versuchsbedin‐ gungen bewertet werden, wobei hier im Gegensatz zum vorigen Abschnitt z. T. auch auf Teilparameter der Flüssigkeit, vornehmlich Pausen, eingegangen wird. Anschließend werden in Abschnitt 3.2.3 einige methodische Überlegungen zu den beschriebenen Studien angestellt. Abschnitt 3.3 schließlich widmet sich der Bewertung der kognitiven Wirkung, wobei sich in diesem Bereich keine Ar‐ beiten direkt mit dem Thema Flüssigkeit auseinandersetzen, weshalb ein kleiner Einblick in andere dolmetschwissenschaftliche Arbeiten zur kognitiven Wir‐ kung geboten wird, die für die vorliegende Arbeit relevant sind. 3.1 Flüssigkeitsmerkmale in Ausgangs- und Zieltext Die Frage nach der Bedeutung von Pausen im Ausgangstext (AT) für das Simul‐ tandolmetschen beschäftigte schon Goldman-Eisler (1968) und Barik (1973). Die Annahme Goldman-Eislers, DolmetscherInnen würden bewusst die Redepausen im Ausgangstext für die Zieltextproduktion nutzen, um die Belastung durch das gleichzeitige Hören und Sprechen zu minimieren (vgl. Goldman-Eisler 1968: 88) - eine Einschätzung, der sich auch Barik (1973: 267) anschloss - wurde inzwi‐ schen widerlegt (vgl. Ahrens 2004: 121). Dennoch bleiben Pausen - ebenso wie andere prosodische Merkmale - des AT nicht ohne Einfluss auf den Zieltext. Eine Reihe von Studien widmet sich daher eben diesem Verhältnis sowie der Beurteilung der Flüssigkeit von Dolmetschleistungen. 3.1.1 Alexieva (1988) Für die Analyse des Outputs von Simultandolmetschungen stellt Bistra Alexieva (1988) vier Kategorien von Parametern auf, die neben sprachlichen (Morpho‐ logie, Syntax, Lexik) auch temporale Phänomene, zielsprachenspezifische Sprechphänomene (Phonologie, Prosodie, extralinguistische und paraverbale Faktoren) und die Semantik größerer Einheiten (Sätze, Satzsegmente) mit ein‐ schließen. Pausen und ihr Bezug zu einigen der semantischen Parameter werden von ihr näher untersucht. Alexieva stellt die These auf, dass die Anzahl und Dauer von Pausen in Si‐ multandolmetschungen geringer sind als im jeweiligen Ausgangstext. Sie be‐ gründet dies damit, dass es „large amount of data confirming the hypothesis“ (Alexieva 1988: 485) gebe, nähere Angaben über diese Daten bleiben leider aus. Sie ist allerdings nicht, wie Goldman-Eisler (1968) und Barik (1973), der Auffas‐ sung, dies sei darauf zurückzuführen, dass DolmetscherInnen bewusst ver‐ suchten, die Pausen im AT für die ZT-Produktion zu nutzen, um das gleichzeitige Hören und Sprechen möglichst gering zu halten, sondern geht vielmehr davon aus, dass das Dolmetschen in den AT-Pausen an der Struktur und Art der Dol‐ metschtätigkeit selbst liege. Für Alexieva ist nicht lediglich die Anzahl, Länge und Position, sondern auch die Funktion von Pausen von Bedeutung, und sie unterscheidet daher in ihrer Analyse zwischen Pausen mit segmentierender Funktion, die das Ende einer 38 3 Forschungsüberblick Flüssigkeit Informationseinheit signalisieren, und Häsitationspausen. Sie führte ein Expe‐ riment mit DolmetschstudentInnen durch, die zwei Versionen eines Textes vom Englischen ins Bulgarische dolmetschen sollten, die sich in ihrer Pausenstruktur unterschieden. Dabei stellte sie fest, dass Pausen an semantisch sinnvollen Stellen für die Dolmetschung genutzt werden konnten, ist aber der Ansicht, dass dies nicht auf eine bewusste Strategie zurückzuführen sei, sondern vielmehr eine logische Folge dessen sei, dass solche Pausen das Ende einer Sinneinheit kennzeichnen. Es sei also nur natürlich, kurz vor oder zu Beginn einer solchen Pause mit der Dolmetschung zu beginnen. Die Anzahl und Länge der Pausen in den ZT war wesentlich geringer als im AT. In einem weiteren Schritt veränderte sie die Struktur des AT derart, dass bei der Dolmetschung ins Bulgarische kaum Umstrukturierungen notwendig waren. In diesem Fall glich die Anzahl und Dauer der Pausen im ZT jener des AT. Alexieva geht daher davon aus, dass die Pausenstruktur von Simultandol‐ metschungen von Inhalt und Struktur des ZT abhängt, also davon, wie viel in der Dolmetschung umformuliert oder explizit verbalisiert werden muss. Auch das Sprachenpaar könne aus diesem Grund einen Einfluss auf die Pausen haben. Sei eine große Anzahl von expliziten Verbalisierungen notwendig oder falle es der DolmetscherIn schwer, implizite und zeitsparende Formulierungen zu finden, komme es im ZT zu einer höheren Sprechrate und starken Schwan‐ kungen des Sprechrhythmus mit sehr schnellen Redeabschnitten. Gelinge es der DolmetscherIn hingegen, die Informationen zeitsparend und verständlich zu verdichten, werde Zeit gewonnen, um die Intonation und den Rhythmus ange‐ nehm und sinnunterstützend zu gestalten. (vgl. Alexieva 1988: 487) Die von Alexieva getroffene Unterscheidung der Pausenarten und die Ana‐ lyse ihrer Funktionen ist für die genauere, über die rein quantitativen Zählungen früherer ForscherInnen hinausgehende Untersuchung von Pausen in Simultan‐ dolmetschungen und den Einfluss von AT-Pausen auf den ZT von großer Be‐ deutung. Während die These, Simultandolmetschungen enthielten zahlenmäßig weniger und kürzere Pausen als die jeweiligen Ausgangstexte, beispielsweise von Ahrens (2004, siehe Abschnitt 3.1.5) nicht bestätigt werden konnte, mag dies auf die von Alexieva angesprochene Abhängigkeit vom Sprachenpaar zurück‐ zuführen sein. 3.1.2 Pöchhacker (1997) Eine Fallstudie zur Flüssigkeit findet sich in Pöchhacker (1997). Bezugnehmend auf die in Kurz (1989, 1993) sowie Kurz & Pöchhacker (1995) (siehe 3.2.1.2) er‐ hobenen sehr hohen Anforderungen an Dolmetschungen im Fernsehen im 39 3.1 Flüssigkeitsmerkmale in AT und ZT Bezug auf Stimme, Akzent und Flüssigkeit wird in dieser Studie eine authenti‐ sche Fernsehdolmetschung im Hinblick auf das Qualitätskriterium Flüssigkeit untersucht. Dazu wurde die Dolmetschung einer Rede des damaligen US-Prä‐ sidenten Bill Clinton in Berlin am 12. Juli 1993 aus dem Englischen ins Deutsche, die live im Österreichischen Rundfunk (ORF) übertragen wurde, analysiert und mit der Originalrede verglichen. Die verwendeten Parameter waren: Gesamtlänge, Silbenanzahl, Silben pro Sekunde (Durchschnitt), Zahl der Pausen (≥ 2 Sekunden), Gesamtlänge der Pausen, Sprechgeschwindigkeit (in Silben pro Minute, abzüglich der Pausen), Häsitationen und Fehlstarts. Die Silbenzahl pro Sekunde beträgt in der Originalrede 2,01 und in der Dol‐ metschung 2,65. Werden die Pausen von der Gesamtredezeit (jeweils ca. 9 Mi‐ nuten) abgezogen, ergibt sich eine Artikulationsrate von 154 Silben pro Minute im Original und 202 Silben pro Minute in der Dolmetschung. Die höhere Arti‐ kulationsrate und die um ca. 20 % höhere Silbenzahl ist zumindest teilweise durch die lexikalischen und strukturellen Unterschiede der beiden Sprachen er‐ klärbar. Durch die gleichzeitig um ein Drittel längere Pausenzeit in der Dolmet‐ schung ergeben sich sehr schnelle, dichte Redeabschnitte. (vgl. Pöchhacker 1997: 210) Ein Vergleich der Pausenmuster zeigt, dass 12 der 13 Pausen im Original, die eine Länge von ≥ 2 Sekunden aufweisen, eine Entsprechung in der Dolmet‐ schung haben, die meist ca. 0,5 Sekunden länger ist. Zu diesen 13 Pausen im Original kommen in der Dolmetschung 12 Pausen hinzu, die keine Entsprechung im Original haben. Diese Pausen haben eine Länge von 2-3,5 Sekunden und können größtenteils mit dem time lag erklärt werden. Nur etwa ein Drittel dieser Pausen ist eindeutig als Anzeichen von Zögern erkennbar. Allerdings kommen keine der Pausen innerhalb von syntaktischen Einheiten vor, sondern sind an Stellen angesiedelt, an denen üblicherweise Planungspausen vorkommen. In der gesamten Dolmetschung kommen keinerlei Fehlstarts und nur ein Häsitations‐ laut vor. (vgl. Pöchhacker 1997: 211) Auf Grundlage dieser Analyse wird die untersuchte Dolmetschung von Pöch‐ hacker als sehr flüssig eingestuft: „All things considered, the degree of fluency and smoothness of the interpretation under study seems to be as close to the ideal as it could possibly be.“ (Pöchhacker 1997: 212) An dieser Analyse einer authentischen Dolmetschung ist begrüßenswert, dass nicht nur die Länge, sondern auch die Position der Pausen berücksichtigt wird. Interessant ist auch das Ergebnis, dass sich scheinbar beinahe alle Pausen des Originals in der Dolmetschung wiederfinden. Leider stellt die Studie inso‐ fern eine Ausnahme unter den Flüssigkeitsstudien dar, als solche Untersu‐ 40 3 Forschungsüberblick Flüssigkeit chungen oft nicht nur unter Laborbedingungen stattfinden, sondern auch häufig mit DolmetschstudentInnen als Versuchspersonen durchgeführt werden. 3.1.3 Cecot (2001) Das Verhältnis von Pausen in AT und ZT ist auch das Thema der Studie von Michela Cecot (2001). Sie wählte für ihr Experiment elf professionelle Dolmet‐ scherInnen (sechs Frauen, fünf Männer) als Versuchspersonen, die zwei mit un‐ terschiedlicher Sprechgeschwindigkeit vorgetragene englische AT simultan ins Italienische dolmetschen sollten. Cecot verglich die Verteilung, Länge und Funk‐ tion von Pausen in den AT und ZT und analysierte auch das Vorkommen von Pausen in den Simultandolmetschungen in Abhängigkeit von der Sprechge‐ schwindigkeit. Abschließend wurden die Ergebnisse mit der subjektiven Ein‐ schätzung der DolmetscherInnen verglichen. Cecot untersucht dabei nicht nur ungefüllte Pausen, sondern alle Arten von Unflüssigkeiten, einschließlich Selbstkorrekturen, Fehlstarts, langgezogenen Lauten etc. Auch die ungefüllten Pausen unterteilt sie nach ihrer Position und ihrem kommunikativen Wert in verschiedene Kategorien (Segmentierungs‐ pausen, rhetorische Pausen und Häsitationspausen). Der erste Text wurde mit 263,3 Silben/ Minute vorgetragen, der zweite mit 204 Silben/ Minute. Im Anschluss an die Dolmetschungen erhielten die Dolmet‐ scherInnen einen Fragebogen, in dem sie nach ihrer Einschätzung der Bedeu‐ tung verschiedener Arten von Pausen in Dolmetschungen gefragt wurden. Fünf der elf Versuchspersonen waren der Meinung, dass Häsitationspausen vor allem quantitativ eine große Rolle spielten und ihre Anzahl mit steigendem Tempo wachse. Die meisten betrachteten rhetorische Pausen als wichtig, gaben aber an, diese bei hohem Redetempo seltener anzuwenden. Neun DolmetscherInnen erinnerten sich noch an einige der Pausen, die sie gemacht hatten. Häsitations‐ pausen schienen leichter in Erinnerung zu bleiben, da sie mit Problemen bei der Dolmetschung zusammenhingen. Die meisten gaben auch an, Pausen eher au‐ tomatisch zu verwenden. (vgl. Cecot 2001: 75) Der Vergleich der AT mit den ZT zeigte, dass es beim schnelleren AT weniger Pausen und Unflüssigkeiten gab. Cecot verglich auch die Pausenmuster in AT und ZT, indem sie die Zahl der ungefüllten Pausen in den ZT, die eine Entspre‐ chung im AT hatten, in Bezug zur Gesamtzahl der Pausen im jeweiligen ZT setzte. Beim schnelleren AT hatte ca. die Hälfte der Dolmetschungen mehr als 50 % Pausen mit Entsprechung im AT, die andere Hälfte weniger als 50 %. Beim langsameren Text hatten sieben von elf Dolmetschungen weniger als 50 % Pausen mit Entsprechung im AT. Da in den AT keine Häsitationen vorkamen, 41 3.1 Flüssigkeitsmerkmale in AT und ZT hatten die Häsitationen in den ZT keine Entsprechungen im AT. Bei beiden Texten kamen in den Dolmetschungen mehr Unflüssigkeiten als ungefüllte Pausen vor. Ein Vergleich nach Geschlechtern zeigte, dass Frauen mehr gefüllte und Männer mehr ungefüllte Pausen verwendeten. Bei den Männern gab es weiters eine längere Pausendauer, d. h. sie sprachen langsamer und machten mehr Pausen. Cecot sieht in dieser Studie einen wichtigen Beitrag zum Nachweis der Be‐ deutung von Pausen beim Simultandolmetschen und stellt fest, dass, obgleich die rhetorische Funktion von Pausen von den meisten Versuchspersonen betont wurde, die meisten ungefüllten Pausen nicht rhetorisch eingesetzt wurden, son‐ dern Segmentierungs- oder Häsitationspausen waren. Außerdem gab es viele Unflüssigkeiten, die die Zuhörer stören könnten. Durch die Analyse könnten DolmetscherInnen auf ihre Pausen aufmerksam gemacht werden und so ihre Leistung bewusst verbessern. (vgl. Cecot 2001: 80) Wenngleich die genaue Bestimmung des Pausentyps nicht immer möglich ist, wie auch Cecot (2001: 74) selbst anmerkt, so ist dennoch der Ansatz der Analyse der Funktionen der von DolmetscherInnen verwendeten Pausen nützlich. Auch der Vergleich mit der subjektiven Wahrnehmung der DolmetscherInnen ist vor allem aus didaktischer Perspektive interessant, zumal eine Sensibilisierung für störende Pausen zu einer Verbesserung der Dolmetschleistung führen könnte. 3.1.4 Tissi (2000) Von Benedetta Tissi (2000) stammt eine Untersuchung zum Einfluss von Pausen, Häsitationen und Unterbrechungen in einem Ausgangstext auf das Verständnis und die Leistung von zehn DolmetschstudentInnen. Zwei Ausschnitte aus einem frei gehaltenen Redebeitrag, die Pausen, Häsi‐ tationen und Unterbrechungen aufwiesen, wurden von den ProbandInnen si‐ multan aus dem Deutschen ins Italienische gedolmetscht. Tissi wählte bewusst StudentInnen, da sie davon ausging, dass deren Dolmetschungen näher am AT wären und sie somit von den Unflüssigkeiten stärker beeinflusst würden als professionelle DolmetscherInnen. Zum Vergleich wurde das Versuchsmaterial von einer weiteren Versuchsperson mit dreijähriger Berufserfahrung gedol‐ metscht. Anschließend wurden die Dolmetschungen transkribiert, die Sprechrate (in Silben/ Minute) und Pausenlängen gemessen sowie die Unflüssigkeiten (gefüllte Pausen, Unterbrechungen) gezählt und mit denen des AT verglichen. 42 3 Forschungsüberblick Flüssigkeit Beim Vergleich zeigte sich, dass die durchschnittliche Dauer der Dolmet‐ schungen etwa jener des jeweiligen AT entsprach, die Dolmetschungen aber eine niedrigere Sprechrate und eine längere Gesamtdauer der Pausen aufwiesen. Trotz der größeren Gesamtlänge der Pausen enthielten die Dolmetschungen aber weniger Pausen als die AT, die einzelnen Pausen waren also durchschnitt‐ lich länger. Der Unterschied in den Sprechraten könnte laut Tissi (2000: 115) zumindest teilweise auch auf die Unterschiede zwischen Ausgangs- und Ziel‐ sprache zurückzuführen sein. Die durchschnittliche Pausenrate (Pausen pro Minute) war in den Dolmetschungen beider Texte sehr ähnlich, während AT 2 wesentlich mehr Pausen enthielt als AT 1. Tissi (2000: 116) erklärt die hohe Pausenanzahl in den AT damit, dass es sich um spontane Reden mit entsprech‐ enden Planungspausen handelte. Die Pausenlänge schwankte zwischen den einzelnen Dolmetschungen sehr stark und erreichte Maximalwerte von bis zu 12,6 Sekunden. Diese stellten al‐ lerdings die Ausnahme dar; der Großteil der Pausen lag sowohl in den AT als auch in den Dolmetschungen zwischen 0,25 und 1,25 Sekunden. Tissi (2000: 117) schließt daraus, dass normale Pausen sowohl bei spontaner Rede als auch bei Simultandolmetschungen eine Dauer von 0,25-1 Sekunden haben. Die hohe Anzahl längerer Pausen in den Dolmetschungen führt sie auf die spezifischen Schwierigkeiten des Simultandolmetschens sowie die Tatsache zurück, dass es sich um StudentInnen handelte, die noch Schwierigkeiten mit der Aufmerk‐ samkeit und dem Verständnis hatten. Ein Vergleich der Pausenpositionen zeigte, dass der Anteil von Pausen in syntaktischen Positionen in den Dolmetschungen etwas, wenn auch nicht er‐ heblich, geringer war als in den AT, was Tissis Meinung nach auf die für Simul‐ tandolmetschungen typische geringere Kontrolle über die Textproduktion zu‐ rückzuführen sein könnte (vgl. Tissi 2000: 117). Bei Häsitationslauten und Lautlängungen gibt es starke individuelle Unter‐ schiede zwischen den DolmetscherInnen, wobei die einzelnen ProbandInnen in beiden Dolmetschungen ähnliche Trends aufwiesen. Es schien sich hier also um ein individuelles Phänomen zu handeln. Da es sich bei den AT um spontan ge‐ haltene Reden handelte, enthielten sie ebenfalls Häsitationslaute, allerdings kaum Lautlängungen. In einigen der Dolmetschungen kamen sogar weniger Häsitationslaute vor als im Original. (vgl. Tissi 2000: 118) Die Dolmetschungen wiesen erheblich weniger Wiederholungen auf als die Ausgangstexte, was Tissi auf Planungsprozesse im spontanen Diskurs bei der Produktion der AT zurückführt. Während die Dolmetschungen natürlich auch Planungsprozesse aufwiesen, könnten durch den time lag Wiederholungen im 43 3.1 Flüssigkeitsmerkmale in AT und ZT AT erkannt und deren Übernahme in den ZT vermieden werden. (vgl. Tissi 2000: 118) Selbstkorrekturen bzw. Planänderungen kamen sowohl in den AT als auch in den Dolmetschungen vor, wobei es keinen Zusammenhang zwischen ihrem Auftreten in den AT und in den ZT gab. Fehlstarts kamen am seltensten vor. In den AT gab es keine Fehlstarts, und in den ZT maximal zwei pro Dolmetschung, wobei nur drei ProbandInnen bei AT 1 und vier bei AT 2 überhaupt Fehlstarts aufwiesen. Nur eine der ProbandInnen hatte in beiden Dolmetschungen einen Fehlstart. Während grundsätzlich ein Zusammenhang zwischen dem Auftreten von Pausen und Unflüssigkeiten in AT und ZT beobachtet werden konnte, war dieser nicht so direkt wie von Tissi ursprünglich angenommen. Vor allem bei den Un‐ flüssigkeiten konnte kein systematischer Zusammenhang beobachtet werden. Es gab große individuelle Unterschiede und in vielen Fällen waren die Unflüs‐ sigkeiten und Pausen in den Dolmetschungen darauf zurückzuführen, dass es sich bei den ProbandInnen um StudentInnen handelte. Tissi fand auch Hinweise darauf, dass eine Art von Unflüssigkeit im AT sich in anderer Form im ZT nie‐ derschlagen könnte. (vgl. Tissi 2000: 121) Während Tissi ihre Wahl von StudentInnen als Versuchspersonen damit be‐ gründet, dass diese näher am AT wären und daher eher von Pausen und Un‐ flüssigkeiten beeinflusst werden könnten, ist anzumerken, dass dadurch keine Rückschlüsse auf professionelle DolmetscherInnen gezogen werden können. Die starken individuellen Unterschiede zwischen den ProbandInnen erlauben auch keine Verallgemeinerung der Daten für Studierende, da auf Grundlage des zur Verfügung stehenden Datenmaterials von erheblichen Unterschieden im Können der Versuchspersonen ausgegangen werden kann. Die erwähnte Ver‐ gleichsdolmetschung durch eine erfahrenere DolmetscherIn wird leider nicht analysiert oder mit den Ergebnissen der Studierenden verglichen. Die genaue Analyse der einzelnen Kategorien von Unflüssigkeiten und der Positionen von Pausen macht diese Arbeit dennoch aus methodischer Sicht interessant. 3.1.5 Ahrens (2004) Die bislang wohl ausführlichste quantitative Auswertung prosodischer Merk‐ male von Simultandolmetschungen stammt von Barbara Ahrens (2004), die drei Dolmetschungen desselben Ausgangstextes analysierte. Dabei untersuchte sie neben den prosodischen Phänomenen Intonation und finaler Tonhöhenverlauf auch die Position, Anzahl und Dauer der Pausen in Dolmetschungen im Ver‐ gleich zur Originalrede. 44 3 Forschungsüberblick Flüssigkeit Die Ergebnisse zum Teilbereich Pausen sollen hier näher besprochen werden, da sie zum umfangreichsten bisher erhobenen Datenmaterial zu Pausen in Si‐ multandolmetschungen gehören und somit für die vorliegende Arbeit einen so‐ liden Referenzrahmen bilden. Die quantitative Auswertung von drei Dolmetschungen professioneller Dol‐ metscherInnen vom Englischen ins Deutsche zeigte, dass es bei den ZT wesent‐ lich weniger, dafür aber längere Pausen gab, wodurch auch der Anteil der Pausen an der gesamten Textlänge signifikant höher war als im AT. Die Pausen der ZT waren im Durchschnitt um 0,2 bis 0,3 Sekunden länger als beim AT, wobei alle drei ZT sehr nahe beieinander liegen. (vgl. Ahrens 2004: 153) Eine Analyse der Pausenlängen und der Häufigkeit von Pausen unterschied‐ licher Dauer zeigte, dass sowohl im AT als auch in den drei ZT die meisten Pausenlängen im Bereich von 0,01-0,40 Sekunden lagen, ihr Anteil in den Dol‐ metschungen aber niedriger war als im AT (vgl. Ahrens 2004: 156). Die Dol‐ metschungen wiesen allerdings wesentlich mehr längere Pausen (1,91 bis über 4 Sekunden) auf als der AT. Die relative Häufigkeit zeigt also eine Verschiebung der Pausenanteile von kurzen zu längeren Pausen (vgl. Ahrens 2004: 159). Bezüglich der Position der Pausen stellte Ahrens die Hypothese auf, dass der AT-Produzent eher an Stellen pausiere, die eine abgeschlossene Informations‐ einheit signalisieren, da er den Inhalt seiner Äußerung selbst bestimme und so bemüht sei, die Pausen an „sinnvollen“ Stellen zu setzen, während die Dolmet‐ scherInnen zwar auch um „sinnvolle“ Pausensetzung bemüht seien, manchmal aber abwarten müssten, um weitere Informationen zu bekommen oder zu ver‐ arbeiten, und daher auch an unerwarteten Stellen pausieren müssten. Sie kate‐ gorisierte daher alle Pausen danach, ob sie am Ende oder innerhalb einer Infor‐ mationsbzw. Intonationseinheit lagen. (vgl. Ahrens 2004: 160) Dabei zeigte sich, dass im AT mehr als die Hälfte der Pausen am Ende einer Informations‐ einheit und am Ende einer Intonationseinheit lag, während es bei den Dolmet‐ schungen zwischen 40,52 % und 49,91 % waren. In zwei Kabinen war dies die häufigste Pausenkategorie, was zeigte, „dass die Dolmetscher die Informations‐ struktur des ZT auch prosodisch umsetzen und Pausen an Stellen machen, an denen sie inhaltlich passen“ (Ahrens 2004: 162). Gut ein Viertel der Pausen im AT lagen innerhalb von Informations- und Intonationseinheiten, waren also klassische Häsitationspausen, die entstehen „wenn der AT-Produzent zögert, nachdenkt oder eine bereits begonnene Struktur noch weiter plant“ (Ahrens 2004: 161). Bei den Dolmetschungen war der Anteil dieser Pausen erheblich niedriger, was nach Ahrens darauf hindeutet, dass DolmetscherInnen eher noch länger abwarten, bevor sie mit der Dolmetschung eines Segments beginnen, um solche Häsitationspausen zu vermeiden. Dies erkläre auch den höheren Anteil 45 3.1 Flüssigkeitsmerkmale in AT und ZT längerer Pausen in den ZT (vgl. Ahrens 2004: 162). 21 % der Pausen im AT lagen innerhalb von Informations-, aber am Ende von Intonationseinheiten, waren also prosodische Grenzsignale, die auf das Ende einer Intonationseinheit hin‐ weisen und entstehen, „wenn der AT-Produzent eine Informationseinheit in mehr als einer Intonationseinheit realisiert“ (Ahrens 2004: 161). Bei den drei Dolmetschungen hingegen war ihr Anteil mit 39,69 % bis 47,95 % wesentlich höher. Diese Kategorie von Pausen war in einer Kabine die häufigste und lag in den übrigen an zweiter Stelle. „Fast 50 % aller Pausen entstehen also, weil die Dolmetscher eine Informationseinheit prosodisch in mehrere Intonationsein‐ heiten segmentieren.“ (Ahrens 2004: 162) Weder im AT noch in den ZT kamen Pausen vor, die am Ende einer Informations-, aber innerhalb einer Intonations‐ einheit lagen. Ahrens stellt fest, „dass die Dolmetscher sich um eine sinnver‐ mittelnde ZT-Produktion bemühen und aus diesem Grunde Pausen an Stellen machen, an denen sie inhaltlich und prosodisch angemessen sind“ (Ahrens 2004: 162 f.). Sie untersuchte auch die Funktion der Pausen längerer Dauer und stellte durch eine Gegenüberstellung des AT und der ZT fest, dass die längeren Pausen in den ZT vor allem zum Zuhören und Abwarten neuer Informationen, aber auch zur Planung genutzt wurden (vgl. Ahrens 2004: 163-166). Teilweise waren die Pausen im ZT auch durch Pausen im AT bedingt, entstanden also, wenn die DolmetscherInnen abwarten mussten, bis der AT-Produzent weitersprach. (vgl. Ahrens 2004: 167) Durch die Analyse der einzelnen Pausen in den ZT kommt Ahrens zu folgendem Ergebnis: Aufgrund der besonderen Verarbeitungsbedingungen beim Simultandolmetschen sind Dolmetscher oft gezwungen, längere Pausen als in spontan konstituierter Sprache zu machen, um genügend AT-Inhalt für die weitere Verarbeitung zur Verfügung zu haben. (Ahrens 2004: 172) Hinsichtlich der häufigeren Aufspaltung von Informationseinheiten in mehrere Intonationseinheiten in den Dolmetschungen analysiert Ahrens die Segmentie‐ rungen und stellt fest, dass es physiologisch, syntaktisch, grammatisch, seman‐ tisch und kognitiv bedingte Segmentierungen gibt. Physiologisch bedingte Seg‐ mentierungen entstehen durch Atempausen, die aufgrund der durch den AT bestimmten ZT-Produktion an unerwarteten Positionen auftreten können. Syn‐ taktisch bedingte Segmentierungen fallen mit den Grenzen zwischen Haupt- und Nebensätzen bzw. bei Einschüben zusammen, grammatisch bedingte Seg‐ mentierungen entstehen durch Korrekturen, die durch Planänderungen oder Grammatikfehler notwendig werden. Semantisch bedingte Segmentierungen können eingesetzt werden, um die Argumentationsstruktur des Textes zu ver‐ 46 3 Forschungsüberblick Flüssigkeit deutlichen, inhaltliche Korrekturen vorzunehmen oder Zusätze und Explizie‐ rungen für das Publikum abzugrenzen. Kognitiv bedingte Segmentierungen schließlich können sowohl durch den AT (Abwarten von Informationen) oder die ZT-Produktion (Planung) bedingt sein. (vgl. Ahrens 2004: 186-193) Ahrens’ ausführliche Analyse der prosodischen Merkmale in diesem Korpus leistet einen wertvollen Beitrag zum Wissensstand über die Prosodie von Si‐ multandolmetschungen. Es zeigte sich, dass Pausen bis zu einem gewissen Grad dem Dolmetschprozess inhärent sind und die zeitliche Gebundenheit und in‐ haltliche Abhängigkeit der DolmetscherIn vom AT-Produzenten dazu führt, dass im ZT längere Pausen gemacht werden als im AT. Dennoch werden die Pausen häufig an inhaltlich und strukturell sinnvollen Stellen gesetzt. 3.2 Flüssigkeit in der Qualitätsforschung: Erwartungen und Bewertungen Neben dem Vergleich von Ausgangs- und Zieltext beschäftigt sich die Quali‐ tätsforschung in der Dolmetschwissenschaft vor allem mit Erhebungen von Er‐ wartungen, Beurteilungen von tatsächlichen Dolmetschungen und Messungen der Verständlichkeit von Dolmetschungen (siehe 3.3), wobei in einigen Arbeiten auch eine Kombination dieser Methoden zum Einsatz kommt. Vor allem Erwar‐ tungen und Beurteilungen durch Nutzer werden oft kombiniert, etwa bei Vuo‐ rikoski (1993, 1998, siehe 3.2.1.3) oder Collados Aís (1998 siehe 3.2.2.1). Daher sollen in diesem Abschnitt die vorgestellten Arbeiten nicht in Erwartungserhe‐ bungen und Bewertungsstudien unterteilt werden, sondern nach den Versuchs‐ bedingungen: Erwartungeserhebungen sowie Beurteilungen von Dolmet‐ schungen unter authentischen Konferenzbedingungen werden in 3.2.1 vorgestellt, während 3.2.2 Studien gewidmet ist, bei denen vorab erstellte bzw. manipulierte Dolmetschungen beurteilt werden, was eine größere Kontrolle der Versuchsbedingungen erlaubt. Den Abschluss dieses Abschnitts zu Erwartungs- und Beurteilungsstudien bildet 3.2.3 mit Methodenkritik und grundsätzlichen Überlegungen zu Methoden der Qualitätsforschung. 3.2.1 Erwartungen und Bewertungen: Qualitätskriterien aus Sicht von DolmetscherInnen und NutzerInnen Seit der Pionierarbeit von Hildegund Bühler (1986) sind Studien zu Qualitäts‐ erwartungen ein fester Bestandteil der Qualitätsforschung in der Dolmetsch‐ wissenschaft. Diese erste Befragung (siehe 3.2.1.1) erhob die Erwartungen von 47 3.2 Erwartungen und Bewertungen DolmetscherInnen, wobei Bühler davon ausging, dass diese auch die Erwar‐ tungen der NutzerInnen widerspiegelten. Dies wurde von Kurz (1989, 1993) in Frage gestellt, die einige von Bühlers Qualitätskriterien zur Erhebung der Er‐ wartungen von verschiedenen NutzerInnengruppen verwendete (siehe 3.2.1.2). Ein Unterschied zwischen den Erwartungen von DolmetscherInnen und Nutz‐ erInnen sowie zwischen verschiedenen NutzerInnengruppen zeigte sich auch in weiteren Befragungen von DolmetscherInnen (darunter Altman 1990, Chiaro & Nocella 2004, Zwischenberger & Pöchhacker 2010, Zwischenberger 2013) und NutzerInnen (Meak 1990, Marrone 1993, Kopczyński 1994, Moser 1995, Mack & Cattaruzza 1995, Mesa 2000, Andres 2000, Kadric 2000). Wie bereits in 2.1.2 angesprochen ergeben sich bei Studien, bei denen zuerst die Erwartungen erhoben werden und dann eine Dolmetschung beurteilt werden soll, immer wieder Diskrepanzen, die möglicherweise darauf zurück‐ zuführen sind, dass vor allem NutzerInnen nur eine abstrakte Vorstellung davon haben, was ihnen bei einer Dolmetschung wichtig ist, und bei der Bewertung einer tatsächlichen Dolmetschung dann andere Kriterien zum Tragen kommen. Wie die nächsten Abschnitte zeigen, ist dies aber nicht nur bei NutzerInnen der Fall: auch bei DolmetscherInnen werden Beurteilungen immer wieder von Faktoren beeinflusst, die bei der Erwartungserhebung als nachrangig betrachtet wurden. Diese und andere methodische Schwierigkeiten werden in Abschnitt 3.2.3 näher besprochen. Im Folgenden sollen ausgewählte Studien aus diesem Bereich besprochen werden, wobei bei der Beschreibung der Ergebnisse der Schwerpunkt auf den Parameter Flüssigkeit gelegt wird und andere Aspekte der Studien in den Hin‐ tergrund gestellt werden. 3.2.1.1 Bühler (1986) Eine der frühesten Untersuchungen zur Qualität beim Simultandolmetschen stammt von Hildegund Bühler (1986). In dieser Studie wurden erstmals Kriterien für die systematische Bewertung von Konferenzdolmetschungen aufgestellt, die später anderen ForscherInnen als Grundlage für ihre Qualitätsforschung dienen sollten. In ihrer Studie befragte Bühler Mitglieder des internationalen Dolmetscher‐ verbandes AIIC, von denen einige auch Mitglieder des Zulassungsgremiums der AIIC (Commission des admissions et du classement linguistique - CACL) waren, um festzustellen, welche Bedeutung sie einer Reihe von Kriterien beimaßen, wenn es darum ging, für ein neues Mitglied zu bürgen bzw. ein neues Mitglied aufzunehmen. 48 3 Forschungsüberblick Flüssigkeit Der Fragebogen wurde von 47 Personen ausgefüllt; davon waren 41 aus‐ schließlich AIIC-Mitglieder und 6 außerdem CACL-Mitglieder. Die insgesamt 16 Kriterien sollten auf einer vierstufigen Skala von „sehr wichtig“ bis „un‐ wichtig“ bewertet werden. Es wurden sowohl sprachliche (z. B. Akzentfreiheit, Vollständigkeit, grammatikalische Korrektheit, terminologische Korrektheit) als auch außersprachliche Kriterien (z. B. gute Vorbereitung, Verlässlichkeit, Team‐ fähigkeit, positives Feedback von den Delegierten) abgefragt. Fluency of delivery wird von Bühler nicht als rein sprachliches Kriterium betrachtet, sondern „… perhaps rather as a ‘subjective feeling’ noted by the listeners, client, as well as colleague“ (Bühler 1986: 232). Die Wichtigkeit der Redeflüssigkeit wurde, ebenso wie die meisten sprach‐ lichen Kriterien, von den Befragten recht hoch bewertet, allerdings wurde sie von den 6 CACL-Mitgliedern mit 100 % „sehr wichtig“ höher eingestuft als von den 41 übrigen AIIC-Mitgliedern. Da Bühler davon ausgeht, dass die CACL-Mit‐ glieder eher die Erwartungen der Zuhörer wiedergeben, fragt sie folglich: Could this rating by the CACL group be interpreted as reflecting user needs, since delegates may tire more easily and tend to feel uneasy if they have to listen to a halting interpretation, even if it is logically coherent and correct as to grammar and termi‐ nology? (Bühler 1986: 232) Die Studie von Bühler (1986) legte den Grundstein für die Qualitätsforschung beim Simultandolmetschen und stellte klare, relevante Kriterien auf, die heute noch weitgehend unverändert verwendet werden. Bedauernswert ist neben der geringen Stichprobengröße, dass es zur Stichprobenzusammensetzung kaum Informationen gibt. In einer Fußnote (Bühler 1986: 233 f.) wird erläutert, dass der Fragebogen auf einem AIIC-Vorstandstreffen und AIIC-Symposium im Jänner 1984 verteilt wurde und dass 41 Fragebögen ausgefüllt retourniert wurden, allerdings finden sich keine Angaben darüber, an wie viele Personen der Fragebogen ursprünglich verteilt wurde und ob diese Personen eine reprä‐ sentative Stichprobe der AIIC-Mitglieder darstellten oder ob beispielsweise überdurchschnittlich viele Vorstandsmitglieder vertreten waren. Auch ist die Annahme Bühlers, die Mitglieder der CACL würden in ihrer Beurteilung von den Bedürfnissen und Wünschen der NutzerInnen ausgehen, in Frage zu stellen. Sie stützt sich dabei lediglich auf die Tatsache, dass zur Aufnahme in die AIIC fünf Personen für die KandidatIn bürgen und sie in einer realen Arbeitssituation beobachten müssen „where a certain feedback from the user can be expected“ (Bühler 1986: 231). Problematisch ist auch die Annahme, dass BürgInnen an die Dolmetschung einer AIIC-KandidatIn dieselben Anforderungen stellen würden 49 3.2 Erwartungen und Bewertungen wie an eine erstklassige Dolmetschung, zumal in einer Fußnote ein Kommentar aus einem Fragebogen zitiert wird, der dem explizit widerspricht: ‘The order of these criteria (…) applies only to sponsorship for AIIC and not to my criteria for a really first class interpreter’. (Bühler 1986: 234, Hervorhebung im Ori‐ ginal) Trotz dieser methodischen Mängel und unbegründeten Annahmen stellt die Arbeit einen wichtigen Beitrag zur Dolmetschwissenschaft dar und bildete auch die Grundlage für eine Reihe von NutzerInnenbefragungen (siehe folgende Ab‐ schnitte), in denen teilweise auch die Bewertungen tatsächlicher Konferenzteil‐ nehmerInnen mit den Ergebnissen Bühlers verglichen wurden. 3.2.1.2 Kurz (1989, 1993) Aufbauend auf der Studie von Bühler (1986) führte Kurz (1989, 1993) eine Reihe von NutzerInnenbefragungen durch. Um festzustellen, ob die Wichtigkeit, die AIIC- und CACL-Mitglieder den einzelnen Kriterien beimaßen, tatsächlich die Wünsche und Bedürfnisse der NutzerInnen widerspiegelte, wie von Bühler an‐ genommen, wurden TeilnehmerInnen von drei gedolmetschten Konferenzen zu acht Kriterien befragt und die Ergebnisse den Resultaten Bühlers gegenüberge‐ stellt. Kurz verwendete dabei die acht sprachlichen Kriterien aus Bühlers Studie, also native accent, pleasant voice, fluency of delivery, logical cohesion of utterance, sense consistency with original message, completeness of interpretation, correct grammatical usage und use of correct terminology. Die erste Befragung wurde 1988 auf einem internationalen Medizinkongress durchgeführt, 47 Fragebögen wurden ausgefüllt. Die zweite Befragung fand 1989 bei einer internationalen Konferenz zu Qualitätskontrolle statt (29 Fragebögen), die dritte ebenfalls 1989 bei einer Tagung des Europarates (48 Fragebögen). Die Ergebnisse wurden sowohl mit den Resultaten Bühlers als auch unterei‐ nander verglichen, um festzustellen, ob es Unterschiede zwischen Dolmetscher‐ Innen und NutzerInnen sowie zwischen verschiedenen NutzerInnengruppen gäbe. Die DolmetscherInnen bewerteten die Wichtigkeit der Kriterien sowohl ins‐ gesamt mit durchschnittlich 3,44 (auf einer Skala von 1 (unwichtig) bis 4 (sehr wichtig)) als auch bei den meisten Einzelkriterien höher als die Konferenzteil‐ nehmerInnen. Allerdings gab es auch zwischen den einzelnen NutzerInnen‐ gruppen Unterschiede: in der Gesamtbewertung maßen die Delegierten des Eu‐ roparates den Kriterien insgesamt mit 3,06 die höchste Bedeutung bei, gefolgt 50 3 Forschungsüberblick Flüssigkeit von den MedizinerInnen mit 3,0 und den TeilnehmerInnen der technischen Konferenz mit 2,8. Im Durchschnitt aller vier befragten Gruppen - der drei NutzerInnengruppen sowie der von Bühler (1986) befragten DolmetscherInnen - wird sense consis‐ tency with original message als wichtigstes Kriterium eingestuft, gefolgt von logical cohesion of utterance, use of correct terminology und completeness of interpretation. Fluency of delivery liegt an fünfter Stelle. Beim Vergleich der Einzelergebnisse für die verschiedenen Gruppen zeigt sich für den Parameter fluency of delivery, dass dieser den DolmetscherInnen am wichtigsten ist (und in der DolmetscherInnengruppe an 3. Stelle nach sense consistency und use of correct terminology liegt), gefolgt von den Delegierten der Europaratstagung, bei denen er an 4. Stelle liegt, während die Teilnehme‐ rInnen der technischen Konferenz und die MedizinerInnen der Flüssigkeit we‐ niger Bedeutung beimaßen. Als mögliche Erklärung für die höhere Bedeutung dieses Kriteriums für die Delegierten der Europaratstagung führt Kurz an, dass diese eventuell stärker an einer lebendigen Diskussion interessiert gewesen sein könnten als die anderen NutzerInnengruppen: A halting interpretation with frequent hesitations, pauses, and an irregular, unnatural rhythm would probably have been regarded as an impairment to a spontaneous ex‐ change of information and experience. (Kurz 1993: 19) Im Gegensatz dazu schien den TeilnehmerInnen der medizinischen bzw. der technischen Konferenz die Flüssigkeit der Rede weniger wichtig zu sein, solange inhaltliche Kriterien wie Kohärenz, Sinntreue und terminologische Korrektheit erfüllt waren. Kurz nimmt an, dass der Flüssigkeit in anderen Situationen, bei‐ spielsweise bei Mediendolmetschungen, höhere Bedeutung beigemessen werden könnte. (vgl. Kurz 1993: 19) Um diese Annahme zu überprüfen, führte Kurz eine weitere NutzerInnenbe‐ fragung durch (Kurz & Pöchhacker 1995). Dabei wurden 19 VertreterInnen ös‐ terreichischer und deutscher Fernsehanstalten befragt und die Ergebnisse mit jenen der NutzerInnenstudien in Kurz (1989) und Kurz (1993) verglichen. Die in diesen Studien verwendeten acht Qualitätskriterien sollten wieder auf einer vierstufigen Skala von 1 (unwichtig) bis 4 (sehr wichtig) gereiht werden. Dabei zeigte sich, dass die befragten VertreterInnen der Fernsehanstalten insgesamt höhere Ansprüche an Dolmetschungen stellten als die in Kurz (1989) und Kurz (1993) befragten insgesamt 124 KonferenzteilnehmerInnen. Während die acht Kriterien insgesamt von den Rundfunkangehörigen mit 3,22 bewertet wurden, lag der Durchschnitt der KonferenzteilnehmerInnen bei 51 3.2 Erwartungen und Bewertungen 3,06. In beiden Gruppen war die Sinntreue das wichtigste Kriterium, wobei auch diese von den Rundfunkangehörigen höher bewertet wurde als von den Kon‐ ferenzteilnehmerInnen. An zweiter Stelle lag in beiden Gruppen die Kohärenz. Ansonsten unterschieden sich die Präferenzen der beiden NutzerInnengruppen jedoch erheblich: Bei den Rundfunkangehörigen lagen angenehme Stimme und Flüssigkeit an 3. und 4. Stelle, während diese Kriterien bei den Konferenzteil‐ nehmerInnen an 6. bzw. 5. Stelle zu liegen kamen. Auch Akzentfreiheit wurde für Mediendolmetschungen als wichtiger eingestuft als für Konferenzdolmet‐ schungen, wohingegen Rundfunkangehörige weniger Wert auf die Vollständig‐ keit der Dolmetschung legten. (vgl. Kurz & Pöchhacker 1995: 352) Mit den NutzerInnenbefragungen von Kurz (1989, 1993) bzw. Kurz & Pöch‐ hacker (1995) wurde der Ansatz Bühlers (1986) aufgegriffen und weiterentwi‐ ckelt. Durch den Vergleich verschiedener NutzerInnengruppen untereinander und mit den von Bühler (1986) befragten DolmetscherInnen konnten Unter‐ schiede in den Prioritäten verschiedener Gruppen festgestellt werden. Trotz der recht kleinen Stichproben in den einzelnen Befragungen zeichnen sich doch Präferenzen ab, die sich je nach Kommunikationssituation, Thematik oder Nutz‐ erInnengruppe unterscheiden. 3.2.1.3 Vuorikoski (1993, 1998) In die Kategorie der NutzerInnenbefragungen fügt sich auch die Untersuchung von Anna-Riitta Vuorikoski (1993, 1998) ein, die eine Befragung unter Teilneh‐ merInnen von fünf Seminaren in Finnland durchführte, um die Erfahrungen und Erwartungen von NutzerInnen von Simultandolmetschungen für die Sprach‐ richtung Englisch-Finnisch zu erheben. Der Ansatz unterscheidet sich etwas von den Qualitätsstudien von Bühler und Kurz, da auch die tatsächlich gehörte Dol‐ metschung beurteilt werden sollte und der eigentliche Gegenstand der Unter‐ suchung vor allem die Erhebung von Einstellungen zum Dolmetschen allgemein und zur Notwendigkeit von Simultandolmetschungen war. Die Beurteilung der gehörten Dolmetschung nach sechs Qualitätskriterien sowie die Reihung dieser Kriterien durch die TeilnehmerInnen stellte aber einen Teilbereich der Befra‐ gung dar. Für die Untersuchung wurde zu Beginn des jeweiligen Seminars ein zweisei‐ tiger Fragebogen an die TeilnehmerInnen verteilt. Auf dem Fragebogen konnten auch Kontaktdaten angegeben werden, wenn man sich für ein späteres Tele‐ foninterview zur Verfügung stellen wollte. Diese Interviews wurden eine Woche nach dem jeweiligen Seminar durchgeführt. 52 3 Forschungsüberblick Flüssigkeit 1 In ihrem Artikel von 1993 spricht Vuorikoski von 177 ausgefüllten Fragebögen (Vuo‐ rikoski 1993: 317). Die Seminare hatten jeweils ca. 100 TeilnehmerInnen und unterschieden sich sehr in ihrer thematischen Ausrichtung. Von den insgesamt 480 verteilten Fra‐ gebögen wurden 173 1 ausgefüllt. Von den sechs Qualitätskriterien informed, coherent, accurate, correct terms, pleasant rhythm und fluent wurde die Flüssigkeit mit 18,6 % an dritter Stelle nach well informed (22,7 %) und coherent, or easy to follow (19,7 %) gereiht, noch vor inhaltlicher Richtigkeit (16,9 %), korrekter Terminologie (13,5 %) und ange‐ nehmem Sprechrhythmus (8,6 %) (vgl. Vuorikoski 1993: 322). Obgleich Vuorikoski selbst anmerkt, dass für NutzerInnenstudien eine ge‐ naue Definition der untersuchten NutzerInnengruppen unerlässlich ist, da nicht angenommen werden kann, dass die Gruppen homogen seien und die Leser‐ Innen andernfalls darauf angewiesen seien, aus dem Thema der Konferenz Rückschlüsse auf die Gruppe zu ziehen (vgl. Vuorikoski 1998: 191), wird die Zusammensetzung der SeminarteilnehmerInnen in den veröffentlichten Arti‐ keln nicht näher beschrieben. Die Ergebnisse der Bewertung der Qualitätskri‐ terien werden in Vuorikoski (1993) auch nur insgesamt angegeben und nicht nach einzelnen Seminaren differenziert. Allerdings stellt Vuorikoski auch fest, dass die NutzerInnenerwartungen nicht notwendigerweise konferenz- oder gruppenspezifisch seien, und dass sich die individuellen Bedürfnisse im Laufe der Veranstaltung verändern könnten (vgl. Vuorikoski 1998: 190). 3.2.1.4 Kopczyński (1994) Andrzej Kopczyński (1994) führte eine Befragung unter polnischen NutzerInnen von Dolmetschdienstleistungen durch. Dabei konzentrierte er sich nicht aus‐ schließlich auf HörerInnen sondern befragte bewusst auch Personen, die auf Konferenzen als RednerInnen auftraten bzw. an internationalen Verhandlungen teilnahmen. Es wurden also zwei Versionen des Fragebogens verteilt, um fest‐ zustellen, ob es Unterschiede zwischen den Prioritäten von ZuhörerInnen und RednerInnen gab. Die 57 TeilnehmerInnen (19 RednerInnen, 38 ZuhörerInnen) wurden aus drei Berufsfeldern rekrutiert, wobei das erste Human-, Wirtschafts- und Rechtswissenschaften umfasste (20 Personen), das zweite Naturwissen‐ schaft, Technik und Medizin (23), und das dritte aus DiplomatInnen bestand (14). Es gibt keine Angaben über das Verhältnis von RednerInnen und HörerInnen in den einzelnen Gruppen, wobei davon ausgegangen werden kann, dass zumin‐ dest die meisten, wenn nicht alle, DiplomatInnen auch in der Rolle der RednerIn agieren. 53 3.2 Erwartungen und Bewertungen Die Fragen beschäftigten sich mit der wichtigsten Funktion von Dolmetschen bei Konferenzen, den schlimmsten Störfaktoren bei Konferenzdolmetschungen und dem erwünschten Grad von aktivem Eingreifen bzw. Sichtbarkeit der Dol‐ metscherIn. Die ersten beiden Fragen bestanden jeweils aus zwei Teilen: einer offenen Frage und einer Reihung von Prioritäten, bei der die TeilnehmerInnen die wichtigsten drei Punkte aus einer Liste von acht (bei der Funktion) bzw. elf Faktoren (bei den Störfaktoren) mit den Rängen 1, 2 und 3 bewerten sollten. Bei den Funktionen waren sich sowohl die Berufsgruppen als auch die Red‐ nerInnen und HörerInnen weitgehend einig: die detaillierte Wiedergabe des In‐ halts des Ausgangstextes (AT) wurde von allen Gruppen - wenn auch mit un‐ terschiedlichen Prozentsätzen - an erster Stelle gereiht, gefolgt von Terminologie. An dritter Stelle folgt bei den RednerInnen Flüssigkeit, bei den HörerInnen Stil und Flüssigkeit, bei der ersten NutzerInnengruppe Grammatik und Stil und bei den anderen beiden NutzerInnengruppen Flüssigkeit. Als größter Störfaktor wird von allen Gruppen falsche Terminologie genannt. Unterschiede gibt es allerdings bei Rang 2 und 3: für die RednerInnen sind hier sowohl eine zu allgemeine als auch eine zu detaillierte Wiedergabe des Inhalts die am meisten störenden Faktoren, während ZuhörerInnen sich an nicht ab‐ geschlossenen Sätzen und Grammatikfehlern stoßen. Nach Berufsgruppen be‐ trachtet erhielten nach falscher Terminologie an erster Stelle bei den Vertreter‐ Innen der Human-, Wirtschafts- und Rechtswissenschaften unabgeschlossene Sätze die meisten Nennungen sowohl bei Rang 2 als auch 3, während die Gruppe Naturwissenschaften, Technik und Medizin an zweiter Stelle ebenfalls Termi‐ nologie und an dritter Stelle fehlende Flüssigkeit nannte. Für die DiplomatInnen lagen unabgeschlossene Sätze an zweiter und Grammatikfehler an dritter Stelle. Interessant ist an dieser Studie die Gegenüberstellung von RednerInnen und ZuhörerInnen. Allerdings sind die durch diese Aufteilung entstandenen Gruppen recht klein. Auch gibt es keine Informationen über die Anzahl von RednerInnen und HörerInnen in den einzelnen NutzerInnengruppen. Kopc‐ zyński (1994: 193) merkt an, dass der Fragebogen nicht auf einer Konferenz ver‐ teilt sondern Personen gegeben wurde, die an internationalen Konferenzen oder Verhandlungen teilnahmen. Er macht allerdings keine näheren Angaben über das zugrundeliegende Auswahlverfahren. Interessant wäre es auch gewesen, die Reihung aller Faktoren zuzulassen und diese nicht nur auf die ersten drei zu beschränken. 3.2.1.5 Moser (1995) Im Auftrag des internationalen Dolmetscherverbandes AIIC führte Moser (1995) eine Studie zu NutzerInnenerwartungen im Bezug auf Qualitätskriterien durch, 54 3 Forschungsüberblick Flüssigkeit wobei auch Unterschiede zwischen einzelnen NutzerInnengruppen untersucht wurden. Die Untersuchung wurde als Interviewstudie durchgeführt, wobei 94 Dol‐ metscherInnen auf 84 Konferenzen und Tagungen weltweit insgesamt 201 Kon‐ ferenzteilnehmerInnen befragten. Davon hatten 9 % noch nie zuvor eine Simul‐ tandolmetschung genutzt, ca. 30 % hatten gelegentliche Erfahrung damit und etwa 60 % waren erfahrene NutzerInnen von Simultandolmetschleistungen. Etwa 20 % waren Frauen, von denen ca. 20 % noch nie eine Dolmetschung ge‐ nutzt hatten, 50 % allerdings zur Gruppe der erfahrenen NutzerInnen zählten. Beinahe die Hälfte der Befragten nahm sowohl als RednerIn als auch als Zuhö‐ rerIn an der jeweiligen Konferenz teil. Die Konferenzen unterschieden sich stark nach Thema und Größe. Beim Interview sollten die NutzerInnen sowohl offene Fragen zu Erwar‐ tungen an Dolmetschungen beantworten als auch die Bedeutung einzelner Qua‐ litätskriterien bzw. Störfaktoren beurteilen. Bei der offenen Frage nach den wichtigsten Eigenschaften einer Dolmetschung nannten 34 % der Befragten spontan Faktoren, die von Moser (1995) als „rhetorical skills“ zusammengefasst werden: „regular delivery, absence of hesitation, complete, grammatically cor‐ rect sentences, clarity of expression“ (Moser 1995: 8). Außerdem wurden zö‐ gernde Darbietung und Pausen mit jeweils 8,5 % bei der offenen Frage nach Störfaktoren an 3. Stelle genannt, nach mangelnder Mikrofondisziplin (13,9 %) und zu großem time lag (10,9 %). Bei der Bewertung ausgewählter Störfaktoren wurden lange Pausen, während die RednerIn spricht, als größter Störfaktor ge‐ wertet: ein Viertel der Befragten bezeichnete sie als störend, 35 % gar als sehr störend. Die erfahrenen TeilnehmerInnen empfanden lange Pausen als stör‐ ender als jene mit weniger Erfahrung. Häsitationslaute bzw. gefüllte Pausen wurden von 55 % der Frauen und 28 % der Männer als sehr störend empfunden, wobei unerfahrene NutzerInnen sich davon stärker gestört fühlten als erfahrene KonferenzteilnehmerInnen. Jene NutzerInnen, die bei den offenen Fragen rhe‐ torische Fähigkeiten genannt hatten, empfanden Häsitationen mit 46 % wesent‐ lich häufiger als sehr störend als andere TeilnehmerInnen (28 %). Der Fragebogen von Moser ist sehr ausführlich gestaltet und geht auch der Frage nach, wie NutzerInnen den KonferenzdolmetscherInnenberuf wahr‐ nehmen. Interessant ist die häufige spontane Nennung von mangelnder Flüs‐ sigkeit als Störfaktor. Allerdings können diese Ergebnisse nicht als repräsentativ angesehen werden, da pro Konferenz nur sehr wenige TeilnehmerInnen befragt wurden, die von den befragenden DolmetscherInnen selbst nach nicht näher genannten Kriterien ausgewählt wurden, und die Konferenzen sich stark von‐ 55 3.2 Erwartungen und Bewertungen einander unterschieden. Von einer repräsentativen Stichprobe kann daher nicht ausgegangen werden. 3.2.1.6 Zwischenberger (2013) Zwischenberger (2013) führte 2008 und 2009 zwei groß angelegte Fragebogen‐ studien zum Qualitätsverständnis und zu Rollenbildern von Konferenzdolmet‐ scherInnen durch. Die webbasierten Befragungen waren an alle Mitglieder des internationalen Konferenzdolmetscherverbandes (AIIC) und des deutschen Ver‐ bandes der Konferenzdolmetscher (VKD) gerichtet. Im ersten Teil des dreitei‐ ligen Fragebogens wurden soziodemographische Hintergrundvariablen sowie Informationen zu den Tätigkeitsbereichen und der Einsatzhäufigkeit der Dol‐ metscherInnen erfragt. Im zweiten Teil sollten neun der Kriterien Bühlers (1986) - Flüssigkeit der Dolmetschung, korrekte Terminologie, korrekte Grammatik, Sinn‐ übereinstimmung mit dem Original, muttersprachlicher Akzent, logischer Zusam‐ menhang, angenehme Stimme, angemessener Stil und Vollständigkeit der Dolmet‐ schung - ergänzt durch die von Moser (1995) verwendete Synchronität sowie das zusätzliche Kriterium lebendige Intonation auf einer vierstelligen Skala nach ihrer Wichtigkeit bewertet werden. Außerdem wurden die TeilnehmerInnen gefragt, ob die Bedeutung der einzelnen Kriterien bei verschiedenen Konfe‐ renztypen unterschiedlich hoch sei. Abschließend sollten sie einen Ausschnitt aus einer Simultandolmetschung bewerten, bei der der Parameter Intonation (AIIC) bzw. Flüssigkeit (VKD) manipuliert worden war (siehe 3.2.2.3). (vgl. Zwi‐ schenberger 2013: 150 ff.) Teil C des Fragebogens schließlich befasste sich mit dem Rollenverständnis der TeilnehmerInnen als KonferenzdolmetscherInnen. (vgl. Zwischenberger 2013: 158 ff.) Der AIIC-Fragebogen wurde von 704, der VKD-Fragebogen von 107 Personen ausgefüllt. Bei der Bewertung der Wichtigkeit der Qualitätskriterien ging in beiden Fällen „Sinnübereinstimmung mit dem Original“ als wichtigstes Krite‐ rium hervor: es wurde von 88,3 % der AIIC-TeilnehmerInnen und 90,6 % der VKD-TeilnehmerInnen als „sehr wichtig“ eingestuft. An zweiter Stelle folgt lo‐ gischer Zusammenhang (AIIC 74,8 %, VKD 76,4 %) und bereits an dritter die Flüssigkeit der Dolmetschung (AIIC 70,7 %, VKD 57 %), wobei sie in der VKD-Be‐ fragung nur 0,4 Prozentpunkte vor dem nächsten Kriterium, korrekte Termino‐ logie, liegt. (vgl. Zwischenberger 2013: 197-202) Bei der Frage nach der Bedeutung in unterschiedlichen Dolmetschsituationen wurde Redeflüssigkeit bei den Konferenztypen „Pressekonferenz & Präsenta‐ tion“, „Festakt“ und „Politik“ (hier nur von VKD-Mitgliedern) neben Faktoren wie lebendige Intonation, Synchronität oder angemessener Stil (VKD) als be‐ sonders wichtig bewertet. 56 3 Forschungsüberblick Flüssigkeit Diese Befragung stellt die bisher umfangreichste dieser Art dar und ist auch die erste, die sich mit dem Zusammenhang zwischen Qualitätsvorstellungen und Rollenbildern beschäftigt. 3.2.2 Experimentelle Qualitätsstudien: Erhebung von Erwartungen und Bewertungen unter kontrollierten Bedingungen Neben der reinen Erhebung von Qualitätskriterien und Beurteilung authenti‐ scher Dolmetschungen wie bei Vuorikoski (1993, 1998) wurden seit etwa Ende der 90er-Jahre auch experimentelle Ansätze zur Untersuchung von Qualitäts‐ kriterien verfolgt. Dabei geht es einerseits darum, Beurteilungskriterien auf den Prüfstein zu stellen oder Unterschiede zwischen a priori- und a posteriori-Be‐ wertungen zu erheben, andererseits um die Untersuchung einzelner Qualitäts‐ aspekte und deren Einfluss auf Qualitätsbewertungen. In die erste Gruppe fällt z. B. Sciannamé (2007/ 2008). Sie stellte fest, dass pa‐ ralinguistischen Kriterien wie Flüssigkeit, Intonation oder Stimmqualität in einer a priori-Erhebung wesentlich weniger Bedeutung beigemessen wurde als Sinntreue, Kohärenz und Grammatik. Nach Anhören von inhaltlich korrekten, aber paralinguistisch suboptimalen Dolmetschungen wurde Flüssigkeit als wichtigstes Kriterium gereiht, gefolgt von Intonation und angenehmer Stimme; erst danach kamen Kohärenz und Grammatik, während Sinntreue erst nach Stil, Diktion/ Artikulation und Terminologie an 9. Stelle kam. (vgl. Sciannamè 2007/ 2008: 182). Interessant ist in diesem Zusammenhang auch die Studie von Chevalier (Chevalier & Gile 2015), die in 3.2.2.4 zusammengefasst wird. Garzone (2003) liegt an der Schnittstelle der beiden Kategorien: Sie vergleicht a priori-Einstufungen der Wichtigkeit von Faktoren mit deren Einfluss auf die anschließende Bewertung zweier Dolmetschungen, die sich durch prosodische Merkmale unterscheiden, wodurch der Einfluss dieser Merkmale auf die Be‐ wertung des Inhalts sichtbar wird. In einem klein angelegten Experiment wurden Stimmqualität und Flüssigkeit von den Versuchspersonen zunächst als weniger wichtig bewertet als Kohärenz und Sinntreue. Als dieselben Versuchs‐ personen aber zwei Dolmetschungen bewerten sollten, die sich beinahe aus‐ schließlich durch Stimmqualität und Flüssigkeit unterschieden, wurden bei der Version mit Häsitationen und „somewhat erratic prosody“ (Garzone 2003: 27) auch Kohärenz und Sinntreue wesentlich schlechter bewertet als im flüssigen Text, obwohl die beiden Versionen inhaltlich beinahe gleich waren. Garzone führt dies teilweise auf mögliche vorgefasste Meinungen zurück, etwa, dass der Inhalt wichtiger sei als die Form, die aber in der Praxis nicht angewandt werden, andererseits auf das Zusammenspiel verschiedener Faktoren in der tatsächli‐ 57 3.2 Erwartungen und Bewertungen chen Bewertungssituation, in der die einzelnen Kriterien kaum isoliert be‐ trachtet werden können. Vor allem an der Universität Granada wird untersucht, wie einzelne verbale und nonverbale Faktoren die subjektive Qualitätsbewertung beeinflussen. Hier sollen aus der umfangreichen Forschungstätigkeit jene Arbeiten beschrieben werden, die sich mit dem Parameter Flüssigkeit befassen. Für den in der vorlie‐ genden Arbeit beschriebenen Versuch (siehe Kapitel 4) wurde dieser Ansatz weiterentwickelt und mit der Messung der kognitiven Wirkung kombiniert. Im Zuge dessen wurde auch eine Methode zur Manipulation von Flüssigkeit ent‐ wickelt, die auch bei einem in die Umfrage von Zwischenberger (2013; siehe auch 3.2.1.6) integrierten Audiosample angewandt wurde. Dem ist in 3.2.2.3 ein eigener Abschnitt gewidmet. 3.2.2.1 Collados Aís (1998) Die experimentelle Qualitätsforschung an der Universität Granada begann mit der Studie von Ángela Collados Aís (1998). Darin erhob sie zunächst die Erwar‐ tungen spanischer JuristInnen und RechtsexpertInnen (NutzerInnengruppe) ei‐ nerseits sowie DolmetscherInnen andererseits. Sie sollten auf einem Fragebogen angeben, welche Faktoren sie bei einer Dolmetschung am meisten stören. Der Fragebogen basierte auf den acht Kriterien von Bühler (1986), die später von Kurz (1989, 1993) und Kurz & Pöchhacker (1995) verwendet worden waren, sowie zwei weiteren Kriterien, nämlich Intonation und Aussprache. Flüssigkeit kam bei der NutzerInnengruppe an 5. Stelle, bei der DolmetscherInnengruppe ebenfalls an 5. Stelle, wenn es darum ging, die Dolmetschung einer KollegIn zu bewerten; bei der eigenen Dolmetschproduktion jedoch wurde die Flüssigkeit als weniger wichtig erachtet. Anschließend wurden die beiden Versuchsgruppen in je drei Untergruppen aufgeteilt. Sie sollten die Qualität einer Dolmetschung beurteilen, wobei eine Version monoton und inhaltlich richtig war, eine lebendig intoniert war aber inhaltliche Fehler aufwies und eine Version lebendig intoniert und inhaltlich richtig war. Dabei wurden sowohl die einzelnen Kriterien als auch die Gesamtqualität, Professionalität und Verlässlichkeit der Dolmetschung be‐ wertet. Ein signifikanter Unterschied zwischen den Bewertungen der Qualität der Dolmetschungen konnte zwar nur zwischen Version 3 (lebendige Intonation und fehlerfrei; höchste Bewertung) und Version 1 (monoton und fehlerfrei) ge‐ messen werden, als Tendenz wurde aber festgestellt, dass Version 2 (lebendige Intonation aber mit Fehlern) von der NutzerInnengruppe besser bewertet wurde als die monotone und fehlerfreie Dolmetschung. Von den DolmetscherInnen wurden die beiden lebendig intonierten Dolmetschungen gleich gut bewertet, während Version 1 signifikant schlechter beurteilt wurde. Sie wurde auch in 58 3 Forschungsüberblick Flüssigkeit einigen Teilbereichen (Stimmqualität, logischer Zusammenhalt, Sinntreue, Ter‐ minologie, Stil, Professionalität) schlechter bewertet als die anderen Dolmet‐ schungen. Beim Parameter Intonation wurde Version 1 von beiden Gruppen schlechter bewertet. Trotz des interessanten Ansatzes dieser Studie muss angemerkt werden, dass die Aussagekraft der Ergebnisse durch einige Faktoren stark eingeschränkt ist. Nicht nur waren die Versuchsgruppen sehr klein (42 in der NutzerInnengruppe, 15 in der DolmetscherInnengruppe), was zu noch kleineren Teilgruppen bei der Bewertung der Dolmetschleistungen führte, sondern die Einteilung in Teil‐ gruppen erfolgte alphabetisch nach Nachnamen und somit nicht randomisiert. Obgleich es sich bei allen NutzerInnen und den meisten DolmetscherInnen um Lehrpersonal an diversen Fakultäten der Universität Granada handelte, ist frag‐ lich, ob man tatsächlich von homogenen Gruppen sprechen kann, zumal bei den DolmetscherInnen die Berufserfahrung erheblich auseinanderging. Diese Studie war jedoch der Ausgangspunkt für eine detaillierte Untersu‐ chung der verschiedenen Qualitätskriterien Stimme, Intonation, Flüssigkeit, Dik‐ tion, Akzent, logische Kohäsion, Stil, Terminologie und korrekte und vollständige Sinnübertragung sowie des Einflusses der Eindrucksbildung auf die Bewertung von Dolmetschungen an der Universität Granada, die im nächsten Abschnitt kurz beschrieben wird (vgl. Collados Aís et al. 2007, 2011). 3.2.2.2 Pradas Macías (2003, 2007) In Anlehnung an die Studie von Collados Aís untersuchte Macarena Pradas Ma‐ cías (2003) in ihrer Dissertation das Qualitätskriterium Flüssigkeit anhand des Teilparameters ungefüllte Pausen. Dazu erhob sie zunächst, wie Collados Aís (1998), welche Faktoren die 43 Versuchspersonen bei Simultandolmetschungen am meisten störten. Anschließend wurden die Versuchspersonen in drei Gruppen eingeteilt und sollten eine von drei auf Video aufgezeichneten Dar‐ bietungen derselben Dolmetscherin bewerten. Die zwei manipulierten Auf‐ nahmen waren wörtlich identisch und unterschieden sich lediglich in der An‐ zahl der Pausen - Version 2 hatte um ca. 50 % mehr Pausen als Version 1. Als Kontrollvideo (Version 3) wurde das Kontrollvideo von Collados Aís (1998) ver‐ wendet, da dasselbe Ausgangsmaterial und dieselbe Dolmetscherin zur Produk‐ tion des Versuchsmaterials eingesetzt wurden. Das Kontrollvideo enthielt ähn‐ lich viele Pausen wie Version 1. Über die Verteilung der Pausen im Kontrollvideo gibt es keine näheren Angaben, da es sich aber um eine „ideale“ Dolmetschung handelt, ist anzunehmen, dass sich die Pausen an weniger auffälligen Positionen befinden als in Video 1. 59 3.2 Erwartungen und Bewertungen Es wurden keine statistisch signifikanten Ergebnisse erzielt, allerdings war als Tendenz festzustellen, dass das Kontrollvideo nicht nur hinsichtlich Flüssig‐ keit sondern u. a. auch hinsichtlich Professionalität, logischem Zusammenhalt, Vollständigkeit und Aussprache besser bewertet wurde als die anderen. Die ins‐ gesamt recht gute Bewertung aller drei Videos wird von Pradas Macías darauf zurückgeführt, dass alle drei Versionen auf einer „idealen“ Dolmetschung ba‐ sieren. Dennoch sieht sie ihre Hypothese, dass das Vorhandensein von relativ langen ungefüllten Pausen den Eindruck von Unflüssigkeit verstärke, durch die etwas schlechtere Bewertung der manipulierten Videos bestätigt. Auch bei dieser Studie ist leider die geringe Anzahl der Versuchspersonen zu bemängeln. Auch hier handelte es sich um Lehrpersonal der juristischen Fakul‐ täten der Universität Granada, ähnlich wie bei der NutzerInnengruppe von Col‐ lados Aís (1998), allerdings wurden die Versuchspersonen nach Institutszuge‐ hörigkeit in die einzelnen Versuchsgruppen aufgeteilt, sodass die Gruppen eine annähernd gleiche Zusammensetzung hatten. Zu begrüßen ist die Tatsache, dass die NutzerInnen nach ihrer Definition von Flüssigkeit gefragt wurden. Obschon es sich beim eigentlichen Versuchsmaterial nicht um authentische Dolmet‐ schungen sondern eine nachgesprochene, inhaltlich „ideale“ Dolmetschung handelt, wurde bei der Auswahl der Pausenpositionen doch auf authentische Dolmetschungen zurückgegriffen, um soweit wie möglich Pausen einzufügen, die für eine Dolmetschung realistisch wären. Aufbauend auf dieser ersten Studie setzte Pradas Macías die Untersuchung des Parameters Flüssigkeit im Rahmen einer umfangreich angelegten Studie zu Qualitätskriterien an der Universität Granada fort (Collados Aís et al. 2007). Mit dieser Studie leisteten die ForscherInnen um Collados Aís einen weiteren Bei‐ trag zur systematischen Untersuchung der einzelnen Qualitätskriterien von Si‐ multandolmetschungen. Die Studie gliederte sich in drei Phasen: Zunächst wurden wie bei Collados Aís (1998) die Erwartungen der NutzerInnen erhoben, indem gefragt wurde, welche von 11 Faktoren bei einer Dolmetschung am meisten störten. Die Versuchspersonen wurden in 12 Gruppen aufgeteilt und sollten nach Ansehen eines Videos (ein unverändertes Kontrollvideo und 11 nach den einzelnen Faktoren manipulierte Videos) die Dolmetschung nach den einzelnen Kriterien bewerten. Da Pradas Macías (2003) festgestellt hatte, dass nicht alle unter den einzelnen Kriterien zwangsläufig dasselbe verstanden, wurde ein dritter Fragebogen verteilt, in dem die TeilnehmerInnen gebeten wurden, die einzelnen Parameter spontan zu definieren, und außerdem gefragt wurden, inwieweit der jeweilige Parameter in der gehörten Dolmetschung ge‐ stört hätte. 60 3 Forschungsüberblick Flüssigkeit Bei den Nutzererwartungen reiht sich Flüssigkeit ähnlich wie bei den vorigen Studien mit 5 von 11 ins Mittelfeld ein (vgl. Pradas Macías 2007: 60). Bei der Definition der Kriterien zeigte sich, dass die TeilnehmerInnen unter „Flüssig‐ keit“ sehr unterschiedliche Dinge verstanden: u. a. natürlichen, durchgängigen Redefluss, die rasche Anpassungsfähigkeit der DolmetscherIn an die Rede, eine Rede ohne Unterbrechungen und mit gleichmäßigem Rhythmus, schnelle und klare Darbietung und die Leichtigkeit, mit der ein Text dargeboten wird (vgl. Pradas Macías 2007: 61). Auf die Frage, was sie an mangelnder Flüssigkeit am meisten störte, antworteten die meisten, dass die schwere Verständlichkeit und mangelnde Kohärenz sie am meisten störte; jeweils eine Versuchsperson em‐ pfand Probleme bei der Geschwindigkeit bzw. Pausen, die den Rhythmus un‐ terbrechen, als am stärksten störend. Die manipulierte Dolmetschung, bei der lange Pausen, Selbstkorrekturen und Fehlstarts eingefügt worden waren, wurde von den Versuchspersonen als sehr schlecht bewertet, allerdings nicht nur hinsichtlich der Flüssigkeit: auch die meisten anderen Parameter wurden im „nicht flüssigen“ Video schlechter be‐ wertet. Beim Vergleich der einzelnen Videos zeigte sich ein Zusammenhang mit dem Sprechstil, der ebenfalls schlechter bewertet wurde, wenn die Flüssigkeit sank, und umgekehrt. Zusammenhänge gab es auch mit angenehmer Stimme und Aussprache. Wie bei den vorherigen Studien ist auch hier die geringe Zahl der Versuchs‐ teilnehmerInnen (14) als Schwachpunkt zu nennen. Begrüßenswert ist zwar, dass die TeilnehmerInnen gebeten wurden, ihren Flüssigkeitsbegriff zu be‐ schreiben, allerdings geht aus den Antworten hervor, dass die meisten Ver‐ suchspersonen Flüssigkeit offenbar eher mit Verständlichkeit und Klarheit as‐ soziierten als mit Pausen oder Zögern. (vgl. Pradas Macías 2007: 61) Angesichts dieser Ergebnisse ist fraglich, ob ihre Antworten tatsächlich in eine Studie über das prosodische Merkmal Flüssigkeit einbezogen werden sollten. 3.2.2.3 Zwischenberger (2013) Im Rahmen ihrer großangelegten Qualitätsstudie (siehe 3.2.1.6) integrierte Zwi‐ schenberger (2013) jeweils ein kurzes Audiosample in ihre Fragebögen, die von den TeilnehmerInnen beurteilt werden sollten. Bei diesen Audiosamples war jeweils ein Faktor manipuliert worden: bei der AIIC-Befragung die Intonation, bei der VKD-Befragung die Flüssigkeit. Das bei der VKD-Studie verwendete Sample wurde im Rahmen des QuaSI-Experiments von mir mit der in 4.5 be‐ schriebenen Methode erstellt. Dabei wurden zwei Kopien eines etwa 1-minü‐ tigen Ausschnitts aus einer Dolmetschung manipuliert: eine wurde durch das 61 3.2 Erwartungen und Bewertungen Entfernen von Häsitationen und Kürzen von Pausen flüssiger gemacht, während bei der anderen durch das Hinzufügen von Häsitationen und Pausen der Grad der Flüssigkeit verringert wurde. Diese zwei Samples wurden dann in je eine ansonsten identische Version des Web-Fragebogens integriert und die Frage‐ bögen wurden randomisiert ausgeschickt, sodass die Hälfte der 322 E-Mail-Ad‐ ressen den Fragebogen mit der flüssigen Version und die andere Hälfte den mit der unflüssigen Version erhielten. (Zwischenberger 2013: 156 f.) Durch unter‐ schiedliche Rücklaufquoten wurde das flüssige Sample schließlich von 37 Teil‐ nehmerInnen, das unflüssige von 63 TeilnehmerInnen bewertet. Sie sollten den Höreindruck auf einer sechsstelligen Skala von 6 (sehr gut) bis 1 (sehr schlecht) bewerten. (Zwischenberger 2013: 253) Tatsächlich wurde das flüssige Sample signifikant besser beurteilt als das un‐ flüssige, sodass angenommen werden darf, dass eine flüssige Darbietung die Ergebnisse der allgemeinen Qualitätsbeurteilung auch bei Konferenzdolmet‐ scherInnen signifikant positiv beeinflusst. Nur eine Person verweigerte die Be‐ wertung mit dem Argument, dass dies ohne Kenntnis der Dolmetschbedin‐ gungen und des Originals nicht möglich sei. (Zwischenberger 2013: 253 f.) Eine deskriptive Betrachtung der Ergebnisse zeigt, dass freiberufliche Konferenzdol‐ metscherInnen beide Samples besser bewerteten als fest angestellte, Frauen auf die Manipulation stärker reagierten als Männer (d. h. das flüssige Sample über‐ durchschnittlich gut und das unflüssige relativ unterdurchschnittlich bewer‐ teten) und dass DolmetscherInnen mit einem translatorischen Hochschulab‐ schluss das flüssige Sample besser beurteilten als jene ohne einen solchen Hochschulabschluss. Allerdings sind die Gruppengrößen in allen Fällen zu klein, um daraus inferenzstatistische Schlüsse zu ziehen. (Zwischenberger 2013: 255- 261) In verschiedenen Replikationsstudien auf nationaler Ebene wurden ebenfalls Audiosamples mit manipulierter Flüssigkeit verwendet. Auch hier konnte teil‐ weise ein Einfluss der Flüssigkeit auf die Qualitätsbeurteilung festgestellt werden. (Pöchhacker & Zwischenberger 2015: 284 f.) Obwohl die Bewertung des manipulierten Samples nicht als eigentlicher Prä‐ test für den in der vorliegenden Arbeit beschriebenen Versuch betrachtet werden kann, da eine andere Dolmetschung als Ausgangsmaterial verwendet wurde, kann sie dennoch als proof-of-concept für die entwickelte Methode der Flüssigkeitsmanipulation gewertet werden. 3.2.2.4 Chevalier (2015) Um festzustellen, ob in der bisherigen Forschung, in der stets mit vorgegebenen Qualitätskriterien gearbeitet wurde, möglicherweise Kriterien übersehen 62 3 Forschungsüberblick Flüssigkeit wurden, erhob Chevalier (Chevalier & Gile 2015) spontane Reaktionen auf kurze Ausschnitte aus vier verschiedenen Englisch-Französisch-Dolmetschungen, die erst danach Kategorien zugeteilt wurden. 22 Versuchspersonen ohne Translationshintergrund wurden je vier kurze Ausschnitte aus verschiedenen Dolmetschungen vorgespielt (bis auf zwei Ver‐ suchspersonen, die fünf bzw. sechs Ausschnitte hörten). Die Ausschnitte hatten eine Dauer von 1’35’’ bis 3’40’’ und waren so ausgewählt worden, dass sie Schwierigkeiten und/ oder Dolmetschfehler enthielten. Nach jedem Ausschnitt wurden die TeilnehmerInnen um spontane Kommentare gebeten, die von der Forscherin mitnotiert wurden. Anschließend wurde derselbe Ausschnitt noch‐ mals vorgespielt, es wurden weitere Eindrücke gesammelt und die Versuchs‐ personen wurden gebeten, die Leistung der DolmetscherIn auf einer Skala von 0 bis 10 zu bewerten. Insgesamt wurden so 462 Kommentare gesammelt. Kom‐ mentare konnten positiv, negativ oder neutral sein und mehr als einer Kategorie zugeteilt werden. Bei der Auswertung der Kommentare zeigte sich, dass die meisten in übli‐ cherweise in der Qualitätsforschung verwendete Kategorien fielen: Von den Kommentaren, die nach dem ersten Anhören eines Ausschnitts gemacht wurden, bezogen sich 27,92 % auf Flüssigkeit, 22,92 % auf Intonation, 22,08 % auf den Gesamteindruck sowie 19,17 % auf den Inhalt. Weniger häufig (5-11 %) wurden Faktoren wie Sprachqualität („language quality“), Aussprache, Origi‐ nalrede, Verlässlichkeit, Persönlichkeit und Lautstärke der Dolmetschung im Vergleich zur Lautstärke des AT (der ebenfalls zu hören war) genannt. Nach dem zweiten Durchgang hatte sich die Reihenfolge der vier größten Kategorien um‐ gekehrt: 29,38 % der Kommentare bezogen sich auf den Inhalt, 22,6 % auf den Gesamteindruck, 22,6 % auf Intonation und 20,34 % auf Flüssigkeit. Außerdem wurden nach dem zweiten Durchgang Sprachqualität mit 19,77 % und listener’s comfort (eine Kategorie, die sowohl das Hörerlebnis als auch die Nachvollzieh‐ barkeit der Rede beinhaltet) mit 15,82 % relativ häufig genannt. Ein Vergleich der Kommentare zu den gleichen Ausschnitten zeigte, dass die Eindrücke sehr unterschiedlich und teilweise sogar gegensätzlich waren. So wurde ein Abschnitt beispielsweise von zwei Personen als flüssig bezeichnet und von zwei anderen als zögerlich (Chevalier & Gile 2015: 11-14). Es gab auch keinen klaren Zusammenhang zwischen positiven bzw. negativen Kommen‐ taren und der Bewertung des jeweiligen Segments (Chevalier & Gile 2015: 15). Die meisten Kommentare bezogen sich auf die Form und nicht auf den Inhalt. Dies deckt sich mit den Erfahrungen aus Granada, dass formbezogene Quali‐ tätskriterien die Bewertung einer Dolmetschung stark beeinflussen können, 63 3.2 Erwartungen und Bewertungen obwohl in Erwartungserhebungen mehr Wert auf inhaltliche Kriterien gelegt wird (vgl. Collados Aís et al. 2007). 3.2.3 Methodische Überlegungen zu Bewertungen und Erwartungserhebungen Beinahe allen hier beschriebenen Qualitätsstudien ist gemein, dass die Kriterien, die von den TeilnehmerInnen bewertet oder beurteilt werden sollten, nicht näher definiert werden. Während die jeweiligen Begriffe als eindeutig verständ‐ lich angesehen werden mögen, birgt eine unzureichende Definition die Gefahr, unscharfe Ergebnisse zu generieren, wie auch Vuorikoski (1998: 191) feststellt: Such phrases and concepts may seem self-explanatory to the experts discussing trans‐ lation and interpreting, and respondents filling in questionnaires may understand them more or less the way intended by the surveyor. (…) For the purposes of SI studies, however, it is necessary to lay a proper theoretical basis for the quality criteria that are explored. Bei terminologischer oder grammatikalischer Korrektheit mag es tatsächlich solch eine Übereinstimmung geben, doch wie in Kapitel 2.2 gezeigt wurde, herrscht zur Definition von Flüssigkeit selbst unter Experten bei Weitem keine Einigkeit. Es wäre also unzulässig, anzunehmen, dass die Versuchspersonen dasselbe unter Flüssigkeit verstünden wie die ForscherInnen. Dies gilt in ähn‐ lichem Maße auch für Kriterien wie Intonation und Stimmqualität, während Kriterien wie Vollständigkeit oder Übereinstimmung der Dolmetschung mit dem Original von den Versuchspersonen nur schwer beurteilt werden können - was allerdings nicht bedeutet, dass sie sich nicht trotzdem eine subjektive Meinung darüber bilden (vgl. Kurz 2001: 403 f.). Diese Unterschiede in der subjektiven Definition stellte auch Pradas Macías (2003: 386-394) in einer Vorstudie zu ihrer Untersuchung fest. Sie entschied sich daher dafür, von ihren StudienteilnehmerInnen eine spontane Definition von „Flüssigkeit“ zu erbitten. Dabei zeigte sich, dass es sehr große Unterschiede zwischen den subjektiven Flüssigkeitsbegriffen gab, wobei nur ca. 55 % Flüssig‐ keit mit Pausen oder Zögern in Verbindung brachten, während ca. 72 % Flüs‐ sigkeit im Sinne von Verständlichkeit, Kohärenz und effektiver Kommunikation verstanden. Die Schnittmenge dieser beiden Gruppen betrug knapp 42 % (vgl. Pradas Macías 2003: 495 ff.). Durch eine solche Kontrollfrage wird die Interpre‐ tation der Studienergebnisse erleichtert und es werden mögliche Fehlerquellen ausgeschlossen. Allerdings ist zu beachten, dass bei einer solchen Vorgehens‐ 64 3 Forschungsüberblick Flüssigkeit weise konsequenterweise nachträglich StudienteilnehmerInnen ausgeschlossen werden müssten, wenn abweichende Definitionen auftreten. Neben den Problemen für die interne Validität der Versuche bedeutet die nicht ausreichende Definition in Befragungsbögen, dass die Studien nur bedingt un‐ tereinander vergleichbar sind. Dies wird auch durch Unterschiede in der Fra‐ gestellung und im Versuchsdesign erschwert. (vgl. Moser-Mercer 2008: 144) Moser-Mercer empfiehlt, nach klarer erfassbaren Konzepten wie z. B. Ver‐ ständlichkeit anstatt direkt nach komplexen Konstrukten wie „Qualität“ zu fragen (Moser-Mercer 2008: 146). Neben dem Risiko von nicht vergleichbaren Antworten weist sie noch auf ein weiteres Risiko bei der Verwendung von Fachtermini hin: Using the terms enunciation and prosody runs the risk of a non-response as users may not know these technical terms. Using general language such as speaking clearly and speech rhythm will remedy this mistake. (2008: 149) Das Ersetzen von Fachbegriffen durch allgemeinsprachliche kann dann sinnvoll sein, wenn die verwendeten Begriffe klar definiert sind und kein Risiko unter‐ schiedlicher subjektiver Definitionen besteht. Weiters ist bei Befragungen dieser Art zu beachten, dass die abstrakte Be‐ wertung solcher Kriterien außerhalb einer Dolmetschsituation von der tatsäch‐ lichen Anwendung dieser Kriterien abweichen kann, wie Garzone (2003) fest‐ stellte. In mehreren Studien hat sich auch gezeigt, dass sich die Reihung von Qualitätskriterien a priori von der Reihung a posteriori mitunter erheblich un‐ terscheidet, etwa bei Sciannamè (2007/ 2008). (vgl. 3.2.2) Es erscheint daher unerlässlich, bei NutzerInnenbefragungen und Bewer‐ tungen von Dolmetschungen durch NutzerInnen - aber auch durch Dolmet‐ scherInnen - stets darauf zu achten, dass alle Beteiligten unter den verwendeten Begriffen dasselbe verstehen. Dies kann geschehen, indem man entweder den VersuchsteilnehmerInnen eine Definition vorlegt, oder sie bittet, den Begriff selbst zu definieren. Beides hat allerdings auch Nachteile: Während das Vor‐ geben einer Definition nicht garantiert, dass sich die TeilnehmerInnen in ihrer Bewertung tatsächlich daran halten, birgt die zweite Variante das Risiko, dass man unter Umständen nachträglich die Resultate einiger TeilnehmerInnen aus‐ schließen muss, wenn man feststellt, dass diese etwas anderes bewertet haben als im Versuchsaufbau vorgesehen. Des Weiteren wäre es zielführend, Befra‐ gungen nach Qualitätskriterien nicht nur auf theoretischer Ebene durchzu‐ führen, sondern stets auch die Gewichtung der Kriterien anhand einer kon‐ kreten Dolmetschsituation zu erheben, um so eventuelle Diskrepanzen feststellen zu können. 65 3.2 Erwartungen und Bewertungen 3.3 Messung der kognitiven Wirkung: Die Verständlichkeit von Dolmetschleistungen Die mögliche störende Wirkung von Pausen oder Unflüssigkeiten in Simultan‐ dolmetschungen auf den Verstehensprozess wird von mehreren AutorInnen an‐ gesprochen (vgl. Ahrens 2004: 159 f., Cecot 2001: 80), ist aber bislang im Rahmen der Dolmetschwissenschaft kaum untersucht worden. Während sich die Psy‐ cholinguistik schon seit längerem mit dem Einfluss von Pausen und Häsitati‐ onen auf das Verständnis beschäftigt, konzentrieren sich viele dieser Studien auf die Erkennung von Einzelwörtern und lassen daher nur bedingt Rückschlüsse auf die Verständlichkeit von Simultandolmetschungen mit ihren typischen Merkmalen zu. Lange Zeit war die einzige Studie zur Verständlichkeit von Si‐ multandolmetschungen in Abhängigkeit von prosodischen Merkmalen jene von Miriam Shlesinger (1994). Erst mit dem im Rahmen des QuaSI-Projektes entwi‐ ckelten funktional-kognitiven Ansatz kamen weitere Arbeiten dazu (Grübl 2010, Holub 2010). Wie bereits in 2.1.3 erwähnt gab es aber unabhängig von der Wir‐ kung prosodischer Merkmale einige Studien in diesem Bereich, wobei die früh‐ este (Gerver 1972) die Verständlichkeit von Simultan- und Konsekutivdolmet‐ schungen unter erschwerten Bedingungen (Störgeräusche) verglich. Im Rahmen des QuaSI-Projektes wurde von Reithofer (2013, 2014) die kog‐ nitive Wirkung einer Simultandolmetschung mit jener einer in nichtmutter‐ sprachlichem Englisch gehaltenen Originalrede verglichen, um so die oft be‐ hauptete Wirksamkeit von Englisch als Lingua Franca zu untersuchen. Dazu wurden ein Pilotversuch sowie zwei eigentliche Experimente (Hauptstudie und Zweitstudie) durchgeführt. Da der Versuchsaufbau und Fragebogen auch im in der vorliegenden Arbeit beschriebenen Experiment zum Einsatz kamen und daher in Kapitel 4 eingehend beschrieben werden, soll darauf hier nicht näher eingegangen werden, sondern es sollen nur die Ergebnisse kurz besprochen werden. Die ProbandInnen der Haupt- und Zweitstudie waren FH-Studierende aus dem Bereich Wirtschaft, die teilweise oder ganz auf Englisch unterrichtet wurden. Jeweils eine Versuchsgruppe hörte das Original, die andere eine deut‐ sche Dolmetschung. Anschließend war ein Hörverständnistest auszufüllen, wobei die Fragen jeweils in der gehörten Sprache gestellt wurden und in ihrer Formulierung an die Formulierung des Vortrags bzw. der Dolmetschung ange‐ passt wurden. Dabei stellte sich heraus, dass der nichtmuttersprachliche Origi‐ nalvortrag nicht gleich gut verstanden wurde wie die Dolmetschung ins Deut‐ sche. Die signifikant bessere kognitive Wirkung der Dolmetschung widerlegt die Behauptung, dass Englisch als Lingua Franca für Fachleute gleich gut oder 66 3 Forschungsüberblick Flüssigkeit besser verständlich sei als eine Dolmetschung in ihre Erstsprache. (vgl. Reithofer 2014: 248 f.) Im Bereich des Gebärdensprachdolmetschens ist die Verwendung von Tests zur Bewertung der Verständlichkeit von Dolmetschungen wesentlich weiter verbreitet (siehe 3.3). Bereits seit den 1970er-Jahren wurden hier verschiedene Dolmetschmodi (z. B. Murphy & Fleischer 1977, Cokely 1990, Livingston et al. 1994) oder Dolmetschungen von muttersprachlichen vs. nichtmuttersprachli‐ chen GebärdensprachdolmetscherInnen (z. B. Llewellyn-Jones [1981]/ 2015) un‐ tereinander verglichen. Weiters wurde auch untersucht, ob gehörlose Personen die gebärdete Dolmetschung genauso gut verstehen wie hörende Personen die gesprochenen Inhalte (z. B. Marschark et al. 2004, Napier & Spencer 2008, Rod‐ ríguez Ortiz & Mora Roche 2008). Exemplarisch soll hier eine Arbeit herausge‐ griffen werden: Napier & Spencer (2008) untersuchten in einem Experiment, ob gehörlose Personen als Geschworene in einem Gerichtsverfahren durch eine Dolmet‐ schung gleich viel verstehen können wie hörende Personen. Dazu wurden Aus‐ züge aus einer authentischen Zusammenfassung eines Richters aus einer Ver‐ handlung in die australische Gebärdensprache gedolmetscht und die Dolmetschung wurde gefilmt. Außerdem wurden diese Ausschnitte von einem Mitglied des Versuchsteams als „Richter“ in Lautsprache vorgetragen und auf Video aufgezeichnet. Den hörenden Versuchspersonen wurde dieses Video vor‐ gespielt, für die gehörlosen wurde ein Video erstellt, in dem sowohl der „Richter“ als auch die Dolmetschung zu sehen waren. Sowohl die DolmetscherInnen als auch die zwölf Versuchspersonen (sechs gehörlose und sechs hörende) hatten, wie bei einem echten Prozess, im Vorfeld Material zur Vorbereitung erhalten. Die Versuchspersonen sahen sich das Video einzeln an und sollten dann zwölf Fragen zum Inhalt beantworten, wobei die Fragen für die gehörlosen Versuchs‐ personen gebärdet und für die hörenden auf Englisch gestellt wurden und in beiden Fällen auch schriftlich vorlagen. Die Antworten (Englisch oder austra‐ lische Gebärdensprache) wurden auf Video aufgezeichnet. Die Ergebnisse des Versuchs zeigten, dass gehörlose Personen einer Gerichtsverhandlung beinahe gleich gut folgen können wie hörende: die gehörlosen ProbandInnen beantwor‐ teten 75 % der Fragen richtig, die hörenden 78 %. Aufgrund der kleinen Anzahl an Versuchspersonen kann dieser Unterschied nicht als statistisch signifikant bezeichnet werden. Bei einigen Fragen hatten beide Versuchsgruppen Schwie‐ rigkeiten, bei anderen Fragen gab es allerdings einige interessante Unterschiede: so wurde z. B. eine Frage von allen gehörlosen Versuchspersonen richtig beant‐ wortet, während zwei der hörenden Versuchspersonen sie falsch beantworteten. Außerdem waren die Antworten der gehörlosen Versuchspersonen bei dieser 67 3.3 Messung der kognitiven Wirkung Frage ausführlicher, während bei einer anderen die Antworten der hörenden Versuchspersonen ausführlicher ausfielen. (Napier & Spencer 2008: 100-104) Insgesamt zeigte die Studie, dass gehörlose Personen durchaus als Geschworene eingesetzt werden könnten, was bis dahin in Australien nicht der Fall war. Nach dieser Einleitung zur Verwendung von Verständlichkeitstests in der Dolmetschforschung sollen nun jene Arbeiten vorgestellt werden, die sich mit dem Einfluss prosodischer Merkmale auf die Verständlichkeit beschäftigen. Diese Arbeiten beziehen sich nicht direkt auf Flüssigkeit, da die vorliegende Studie die erste dieser Art ist. Da sie aber ähnlich gelagert sind und entweder als Inspiration für das vorliegende Projekt dienten (Shlesinger 1994), in direktem Zusammenhang damit stehen (Grübl 2010) oder davon inspiriert sind (Lenglet 2015), sollen sie hier näher beschrieben werden. Nach der Pionierarbeit von Shlesinger (1994) soll in 3.3.2 das im Rahmen einer Masterarbeit an der Univer‐ sität Wien durchgeführte Pilotprojekt zur Verständlichkeit von Simultandol‐ metschungen (Grübl 2010) vorgestellt werden, das sich auf die Stimmqualität bezieht. Abschließend wird in 3.3.3 eine belgische Studie zum Einfluss von Pro‐ sodie auf die Verständlichkeit (Lenglet 2015) besprochen, deren Versuchsaufbau auf den QuaSI-Experimenten beruht. 3.3.1 Shlesinger (1994) Miriam Shlesinger (1994) widmete sich in ihrer Untersuchung dem Einfluss von Intonation auf die Verständlichkeit. Pausen werden dabei als Teilaspekt der In‐ tonation behandelt, nämlich als tonality (Segmentierung in Intonationsein‐ heiten). Shlesinger verglich zehn Ausschnitte aus authentischen Dolmetschungen mit vorgelesenen Versionen der transkribierten Dolmetschungen, um so einerseits Charakteristika der „typischen Dolmetschintonation“ zu isolieren und anderer‐ seits mittels Hörverstehenstests deren Einfluss auf die Verständlichkeit zu un‐ tersuchen. Dazu wurden Ausschnitte von jeweils ca. 90 Sekunden aus zehn au‐ thentischen Dolmetschungen von acht verschiedenen DolmetscherInnen ausgewählt und transkribiert. Bei sechs davon handelte es sich um Dolmet‐ schungen aus dem Englischen ins Hebräische, bei vier um Dolmetschungen aus dem Hebräischen ins Englische. Die Dolmetschungen wurden analysiert, um Intonationsmuster zu identifi‐ zieren, die von der Intonation bei spontaner Rede abwichen. Um diese intuitive Bewertung zu unterstützen, wurden die DolmetscherInnen gebeten, die trans‐ kribierten Versionen ihrer jeweiligen Dolmetschungen vorzulesen. Zum Zeit‐ punkt des Experiments lagen alle Dolmetschungen mindestens drei Jahre zu‐ 68 3 Forschungsüberblick Flüssigkeit rück, und nur zwei der DolmetscherInnen erkannten den Text als eine von ihnen produzierte Dolmetschung. Die Intonation der Originaldolmetschungen wurde mit jener der vorgelesenen Texte verglichen. Um die Verständlichkeit der Dolmetschungen zu untersuchen und eventuell vorhandene Unterschiede aufzudecken, wurden 15 Versuchspersonen, aufge‐ teilt in zwei Gruppen, drei Textbeispiele vorgespielt, wobei Gruppe A (acht Ver‐ suchspersonen) die Dolmetschungen hörte, während Gruppe B (sieben Ver‐ suchspersonen) die vorgelesenen Versionen hörte. Im Anschluss an jede Aufnahme wurden den Versuchspersonen je drei schriftliche Verständnisfragen zum gehörten Text vorgelegt. Die insgesamt neun Fragen waren für beide Gruppen gleich. Beim Vergleich der Intonationsmuster zeigte sich im Bezug auf den Bereich tonality, dass Pausen innerhalb grammatischer Strukturen, also in nicht-syn‐ taktischen Positionen, das auffälligste Merkmal von tonality bei den Dolmet‐ schungen waren. Zudem waren Pausen am Satzende bzw. am Ende von Infor‐ mationseinheiten häufig von einer leicht steigenden oder gleichbleibenden Intonation begleitet. Shlesinger geht davon aus, dass das häufige Vorkommen von Pausen an nicht-syntaktischen Positionen sowie Pausen nach Einheiten mit steigender oder gleichbleibender Intonation (von Shlesinger 1994: 229 als „ten‐ tative pauses“ bezeichnet) an unüblichen Positionen das Verständnis beein‐ flussen könnte. (vgl. Shlesinger 1994: 229 f.) Unterschiede zeigten sich auch in den anderen Bereichen der Intonation, nämlich tonicity (Betonung) und tone (Tonhöhenverlauf). Bei den Hörverständnistests wurden von den acht Versuchspersonen in Gruppe A (Originaldolmetschungen) 21 % der Fragen richtig beantwortet, wäh‐ rend die sieben Versuchspersonen in Gruppe B, die die vorgelesenen Texte ge‐ hört hatten, 41 % der Fragen richtig beantworteten. Shlesinger kommt auf Grundlage dieser Ergebnisse zu dem Schluss, dass die besondere, vom natürlichen Diskurs abweichende, Intonation von Dolmet‐ schungen möglicherweise deren Verständlichkeit beeinflusse, dass die relative Bedeutung der einzelnen Charakteristika von Intonation auf die Verständlich‐ keit jedoch noch näher untersucht werden müsse. Die Studie von Shlesinger stellt einen ersten Schritt hin zur Untersuchung der Verständlichkeit von Dolmetschungen dar, ist allerdings durch die geringe Anzahl von Versuchspersonen in ihrer Aussagekraft stark eingeschränkt. Auch sind über die Auswahl der Versuchspersonen und ihre Einteilung in die zwei Gruppen leider keine Informationen vorhanden. Es sollte auch beachtet werden, dass bei den vorgelesenen Texten zwar doppelt so viele Fragen richtig beant‐ wortet wurden wie bei den Dolmetschungen, der Anteil mit ca. 40 % richtigen 69 3.3 Messung der kognitiven Wirkung Antworten jedoch immer noch sehr niedrig ist. Dies könnte auf die sehr kurzen Redeabschnitte (90 Sekunden) zurückzuführen sein, kann aber auch an der Fra‐ gestellung liegen, die möglicherweise weniger auf das Verständnis und eher auf die Gedächtnisleistung zugeschnitten war. Trotz dieser methodischen Einschränkungen stellt die Arbeit Shlesingers einen wichtigen methodischen Schritt hin zu einer objektiveren Art der Bewer‐ tung von Dolmetschleistungen dar. Während bei der Beurteilung der Qualität von Dolmetschungen stets die subjektive Perspektive der NutzerInnen im Auge behalten werden sollte, da sie als VerwenderInnen der Dienstleistung gewisse Erwartungen haben und die Qualität einer Dolmetschung danach beurteilen, wie diese Erwartungen erfüllt werden (vgl. Kurz 2001: 404), wird es authenti‐ schen NutzerInnen meist nicht möglich sein, die Qualität einer Dolmetschung hinsichtlich der Sinntreue objektiv zu beurteilen. Daher kommt es auch vor, dass Fehler oder Probleme der DolmetscherIn zugeschrieben werden, auch wenn sie bereits im AT vorhanden waren (vgl. Ng 1992: 37, Shlesinger 1997: 127). 3.3.2 Grübl (2010) Als Vorstudie für das QuaSI-Projekt wurde 2008 am Zentrum für Translations‐ wissenschaft (ZTW) der Universität Wien eine Studie zur Verständlichkeit von Dolmetschleistungen durchgeführt (Grübl 2010). Diese Studie diente vor allem der Erprobung der Methodik und der Erstellung von Hörverständnistests als Vorbereitung für die QuaSI-Versuche. Grübl untersuchte dabei den Einfluss der Stimmlage auf die Verständlichkeit und verglich auch, ob die Dolmetschung gleich gut verstanden wurde wie das Original - eine Forschungsfrage, der sich in weiterer Folge Reithofer (2013, 2014) im Rahmen des Projekts eingehend widmete. Für diesen Versuch wurde Versuchsmaterial verwendet, das bereits im Zuge einer früheren Studie erstellt worden war (Michalek-Kurucz 2007). Die Stimm‐ lage einer Dolmetschung war im Tonstudio nach oben verschoben worden, so‐ dass die Stimme heller und schriller klang (Grübl 2010: 55 f.). Außerdem wurden die unveränderte Dolmetschung sowie die Originalrede verwendet. 97 Studie‐ rende des ZTW wurden in drei Versuchsgruppen eingeteilt, hörten jeweils eine dieser Versionen und wurden danach gebeten, einen Fragebogen auszufüllen, der aus acht inhaltlichen Fragen (Hörverständnistest) sowie einigen Fragen zur subjektiven Einschätzung des Verständnisses und der Qualität der Dolmet‐ schung bestand. Die Auswertung zeigte, dass die hinsichtlich der Stimmlage veränderte und die unveränderte Dolmetschung - wie erwartet - gleich gut verstanden worden 70 3 Forschungsüberblick Flüssigkeit waren (Grübl 2010: 66). Auch bei der Selbstbeurteilung gab es keine signifi‐ kanten Unterschiede, allerdings war die Selbsteinschätzung besser als die tat‐ sächliche Leistung. Auch bei der Beurteilung der Dolmetschleistung insgesamt und der Intonation gab es keine signifikanten Unterschiede. Lediglich bei der Frage nach der Stimmqualität wurde die veränderte Dolmetschung signifikant schlechter beurteilt. (Grübl 2010: 71 ff.) Die Methodik dieser Arbeit diente als Grundlage für die QuaSI-Experimente, darunter den in der vorliegenden Arbeit besprochenen Versuch zur Bedeutung des Parameters Flüssigkeit, auf dessen Aufbau in Kapitel 4 im Detail einge‐ gangen wird. 3.3.3 Lenglet (2015) Auch die Studie von Lenglet (2015) befasst sich nicht direkt mit Flüssigkeit, soll hier aber erwähnt werden, da das Versuchsdesign auf dem im Rahmen der vor‐ liegenden Studie durchgeführten Experiment basiert. Lenglet führte auf Grund‐ lage des vom QuaSI-Team entwickelten Ansatzes eine Reihe von Experimenten zum Einfluss der Prosodie auf die Verständlichkeit durch. Im Gegensatz zu den im QuaSI-Projekt (Holub 2010, Rennert 2010, 2013, vorliegende Arbeit) durch‐ geführten Experimenten wurden hier nicht einzelne Parameter isoliert be‐ trachtet, sondern es wurde die für Simultandolmetschungen typische Prosodie mit der Prosodie von Vorlesen und Shadowing verglichen, womit auch eine teilweise Replikation von Shlesinger (1994) angestrebt wurde. Dabei wurde eine Rede zuerst gedolmetscht und unmittelbar danach vom gleichen Dolmetscher mittels Shadowing nachgesprochen. Sechs Monate später wurde der Dolmetscher gebeten, eine Transkription der Rede laut zu lesen und aufzunehmen, wobei hier Timestamps und Anweisungen für Pausen enthalten waren. (Lenglet 2015: 267 ff.) Die Aufnahmen wurden annotiert, analysiert und verglichen. Sie unterscheiden sich hauptsächlich hinsichtlich Unflüssigkeiten, wobei die ursprüngliche Dolmetschung wesentlich mehr (mit Häsitationen) ge‐ füllte Pausen, Fehlstarts und Wiederholungen enthält als die zwei danach pro‐ duzierten Versionen (Lenglet 2015: 314), aber weniger ungefüllte Pausen. Diese Versionen wurden dann in einer Reihe von Versuchen, deren Aufbau wesentlich an die QuaSI-Experimente angelehnt war (siehe 4.2), Versuchsgruppen vorge‐ spielt, die einerseits aus Dolmetsch-, andererseits aus Wirtschaftsstudierenden bestanden. Dabei wurden einerseits die Dolmetschung und die Shadowing-Ver‐ sion (im Pilotversuch), andererseits die Dolmetschung und die vorgelesene Transkription (in den Hauptversuchen) verglichen. 71 3.3 Messung der kognitiven Wirkung Die Auswertung der Ergebnisse zeigte, dass der Modus des Versuchsmaterials (Dolmetschung, Shadowing, Lesen) keinen Einfluss auf die kognitive Wirkung hatte. Bei der Bewertung der Prosodie schienen die Dolmetschstudierenden dieser tendenziell mehr Beachtung zu schenken, einen signifikanten Unter‐ schied gab es aber nur bei den Wirtschaftsstudierenden beim Vergleich der Dol‐ metschung mit der gelesenen Version. Auch auf die Glaubwürdigkeit der Dol‐ metschung hatte der Modus keinen signifikanten Effekt. Der Eindruck von l'aisance („Leichtigkeit“) und Glaubwürdigkeit der Dol‐ metschung korrelierten allerdings signifikant. Die Versuchspersonen waren nicht im Stande, ihr Verständnis realistisch einzuschätzen, es gab aber keine Korrelation zwischen Einschätzung des Verständnisses und der Beurteilung der Flüssigkeit oder Glaubwürdigkeit. 72 3 Forschungsüberblick Flüssigkeit 4 Versuch: Einfluss der Redeflüssigkeit auf die Dolmetschqualität Nachdem in den vorhergehenden Kapiteln die theoretischen Grundlagen dar‐ gelegt sowie der Stand der Forschung vorgestellt wurden, soll nun in den fol‐ genden Kapiteln der durchgeführte Versuch beschrieben werden, bei dem der Einfluss der Redeflüssigkeit einer DolmetscherIn auf verschiedene Qualitäts‐ aspekte (kognitive Wirkung und subjektive NutzerInnenbeurteilung, vgl. 2.1) untersucht wurde. Dazu wurden zwei Kopien der Aufnahme einer Dolmet‐ schung in zweifacher Weise apparativ so verändert, dass die Ergebnisse sich zwar hinsichtlich der Redeflüssigkeit unterschieden, ansonsten aber völlig iden‐ tisch waren. Als Versuchssetting wurde eine Dolmetschsituation simuliert, die den Versuchspersonen den Eindruck vermitteln sollte, sie würden live authen‐ tische Dolmetschungen hören. Die Versuchspersonen waren zuvor in zwei Gruppen geteilt worden, die nun jeweils eine der zwei bis auf die Flüssigkeit identischen Dolmetschungen hörten und anschließend einen Fragebogen mit Fragen zum Hörverständnis und zur subjektiven Bewertung relevanter Para‐ meter ausfüllten. Im Rahmen des FWF-geförderten Projektes „Quality in Simultaneous Inter‐ preting“ (QuaSI), das von 2008 bis 2010 am Zentrum für Translationswissen‐ schaft der Universität Wien durchgeführt wurde, wurden ausgehend von der Prämisse, dass die kognitive Wirkung der Dolmetschleistung, also das kognitive Endprodukt, als messbares Qualitätskriterium betrachtet werden kann, ver‐ schiedene Faktoren daraufhin untersucht, ob sie einen Einfluss auf die Ver‐ ständlichkeit und somit die Qualität einer Simultandolmetschung haben. Unter der Leitung von Prof. Franz Pöchhacker untersuchte das Projektteam verschiedene Aspekte der Qualität beim Simultandolmetschen. Cornelia Zwi‐ schenberger führte eine weltweite webbasierte Fragebogenstudie zu Qualität und Rollenbildern von DolmetscherInnen durch (Zwischenberger 2013), Karin Reithofer befasste sich mit Englisch als Lingua Franca und verglich die kognitive Wirkung eines englischsprachigen Vortrags und seiner deutschen Dolmet‐ schung für ein deutschsprachiges Publikum (Reithofer 2014), Elisabeth Holub untersuchte den Einfluss der Intonation auf die Qualität einer Dolmetschung (Holub 2010) und die Autorin der vorliegenden Arbeit befasste sich mit dem Einfluss von Redeflüssigkeit auf die Qualität. Eine zentrale Herausforderung bestand darin, ein Versuchsdesign zu entwi‐ ckeln, mit dem sowohl die kognitive Wirkung als auch die subjektive Wahr‐ nehmung der Dolmetschung durch das Publikum untersucht werden konnte. Daher wurde im QuaSI-Team ein Versuchsdesign entwickelt, bei dem sowohl die Situation, der Ablauf als auch der Input (Dolmetschung) kontrolliert werden konnten, um die abhängigen Variablen gezielt zu untersuchen. Das Forschungsdesign musste folgende Bedingungen erfüllen: • eine möglichst realistische Dolmetschsituation (Setting) • ein ausreichend großes und möglichst homogenes Publikum (Versuchs‐ personen) • ein geeigneter Ausgangstext • eine Dolmetschung, bei der möglichst alle Variablen kontrolliert werden (Versuchsmaterial) • ein Hörverständnistest, der das Verständnis und nicht das Hintergrund‐ wissen oder Gedächtnis testet, sowie Ratingfragen, die genau die Para‐ meter - im vorliegenden Fall die Redeflüssigkeit - messen, die sie messen sollen (Fragebogen) In diesem Kapitel soll der Entwicklungsprozess des Versuchsdesigns und -ma‐ terials dargestellt werden. Nachdem zunächst in 4.1. die Forschungsfragen, die mit dem vorliegenden Versuch beantwortet werden sollten, angeführt werden, wird in 4.2 das entwickelte Versuchsdesign beschrieben. Die Auswahl der Ver‐ suchspersonen wird in 4.3 besprochen. Auf die Beschreibung des Ausgangs‐ textes in 4.4 folgt in 4.5 eine eingehende Besprechung der Erstellung des Ver‐ suchsmaterials auf Grundlage dieses Ausgangstextes. Abschnitt 4.6 beschreibt den verwendeten Fragebogen sowie die Kodierung der Ergebnisse und Ab‐ schnitt 4.7 bildet mit einer Beschreibung des Settings und Versuchsablaufs den Abschluss dieses Kapitels zum Versuchsdesign. Die Ergebnisse werden in Ka‐ pitel 5 besprochen. 4.1 Forschungsfragen Anhand der Ergebnisse des Versuchs sollten die folgenden Forschungsfragen beantwortet werden: • Hat Redeflüssigkeit einen Einfluss auf die Verständlichkeit (kognitive Wirkung) einer Dolmetschung? • Hat Redeflüssigkeit einen Einfluss auf die (subjektive) Einschätzung der Verständlichkeit durch die ZuhörerInnen? 74 4 Versuch: Redeflüssigkeit und Dolmetschqualität • Können Versuchspersonen den Grad der Flüssigkeit einer Verdolmet‐ schung beurteilen? • Können Versuchspersonen den Grad ihres Verständnisses selbst beur‐ teilen? • Besteht ein Zusammenhang zwischen der subjektiven Bewertung des Verständnisses und der subjektiven Bewertung der Kompetenz bzw. Pro‐ fessionalität der DolmetscherIn? • Besteht ein Zusammenhang zwischen Flüssigkeit und der subjektiven Bewertung der Kompetenz bzw. Professionalität der DolmetscherIn? • Bewerten Personen, die bereits Verdolmetschungen gehört haben, die ge‐ hörte Dolmetschleistung anders als jene ohne Erfahrung? • Hat die Erstsprache der ZuhörerInnen Einfluss auf das Verstehen und die subjektive Bewertung des Verständnisses? • Haben demographische Faktoren (Alter, Geschlecht der Versuchsper‐ sonen) eine Auswirkung auf das Verstehen und die subjektive Bewertung des Verständnisses? 4.2 Forschungsdesign Für die vorliegende Studie wurde ein experimenteller Ansatz gewählt, da dieser im Gegensatz zur Feldforschung den Vorteil hat, dass der Versuchsplan optimal an die Fragestellung angepasst werden kann, indem Variablen exakt kontrolliert, willkürlich beeinflusst und Störfaktoren reduziert oder ganz ausgeschaltet werden können. Eine weitere Stärke liegt in der Wiederholbarkeit. Ein Nachteil von Laborexperimenten ist aber die mögliche Irrelevanz der Ergebnisse für die Praxis (D. Rost 2005: 55). Allerdings sollte das Setting des Versuchs so realistisch wie möglich sein, weshalb von einer Durchführung in einer offensichtlichen Laborsituation Abstand genommen wurde. Deshalb wurde eine Dolmetschsi‐ tuation simuliert, wie sie bei einer Konferenz oder bei einem Workshop statt‐ finden könnte (vgl. Pöchhacker 2001: 418 f.). Gegen die Durchführung einer Feldstudie in einer tatsächlichen Konferenz‐ situation sprachen sowohl berufsethische als auch praktische Überlegungen: Es wäre im Hinblick auf das Qualitätsbewusstsein und die Treue gegenüber Red‐ nerIn und Publikum nicht gerechtfertigt, bewusst eine möglicherweise schlechter verständliche Dolmetschung anzubieten. Außerdem gäbe es so viele unkontrollierbare Variablen, dass ein eindeutiger Rückschluss auf die Bedeu‐ tung eines einzelnen Faktors nicht möglich wäre: unterschiedliches Hinter‐ grundwissen der TeilnehmerInnen, unterschiedliche Aufmerksamkeit, sprach‐ 75 4.2 Forschungsdesign licher Hintergrund und eventuell Verständnis des Ausgangstextes wären nur einige der Störfaktoren. Hinzu käme, dass das Versuchsmaterial (die Dolmetschung) nicht hinsichtlich des zu untersuchenden Faktors bearbeitet werden könnte. Selbst wenn man ein DolmetscherInnenpaar auswählen könnte, deren typischer Dolmetschstil die zu untersuchenden Faktoren aufwiese (monotone bzw. lebendige Sprechweise, sehr flüssiger bzw. durch untypische Pausenmuster geprägter Dolmetschstil), würden diese in einer realen Situation nicht denselben Text dolmetschen. Zwei unterschiedliche Teile eines Vortrags wiederum wären inhaltlich bzw. kognitiv kaum miteinander vergleichbar, dazu kämen mögliche Ermüdungserschei‐ nungen und daraus resultierende Aufmerksamkeitsschwankungen bei den Zu‐ hörerInnen. Selbst wenn man diese Variable kontrollieren könnte (z. B. zwei Dolmetscherinnen in zwei Kabinen mit jeweils einem eigenen Kanal dolmet‐ schen denselben Teil der Rede), würden die Dolmetschungen dennoch unter‐ schiedlich ausfallen: Unterschiede bei Formulierungen, Wortwahl und prosodi‐ schen Merkmalen sowie unterschiedliche Dolmetschstrategien und Lösungen würden bedeuten, dass die Dolmetschungen nicht vergleichbar wären (mehr dazu in 4.5.1.1). 4.3 Versuchspersonen Bei der Auswahl von Versuchspersonen für Experimente sind bestimmte Krite‐ rien zu beachten. So müssen beispielsweise, um vergleichbare Ergebnisse zu erhalten, die Versuchsgruppen homogen sein und eine aussagekräftige Größe haben. Die Zahl der benötigten Versuchspersonen hängt dabei von der Art der Untersuchung und der erwünschten Teststärke ab. Im vorliegenden Fall wurden ca. 25-30 Personen pro Versuchsgruppe angestrebt. Während mehr Teilnehme‐ rInnen wünschenswert gewesen wären, war dies eine realistische Gruppen‐ größe für ein Experiment dieser Art (d. h. es war möglich, ausreichend Ver‐ suchspersonen zu finden), andererseits war sie auch groß genug, um bei den subjektiven Fragen (Teil B) aussagekräftige Ergebnisse zu erhalten. Die Teil‐ nehmerInnen des Experiments können nicht als repräsentativ für die Grundge‐ samtheit aller Marketingstudierenden angesehen werden, da sie keine Zufalls‐ stichprobe darstellen. Die Kontrolle von Störfaktoren, die das Ergebnis verfälschen könnten, ist durch Elimination, Konstanthaltung, Parallelisierung und Randomisierung möglich (Stein 2014: 140). Im vorliegenden Versuch wurde der Störfaktor Mut‐ 76 4 Versuch: Redeflüssigkeit und Dolmetschqualität tersprache mittels Parallelisierung und Randomisierung kontrolliert (siehe 4.3.2). In den folgenden Abschnitten werden die Auswahl der Versuchspersonen sowie deren Verteilung auf Versuchsgruppen beschrieben. 4.3.1 Auswahl der Versuchspersonen Als Versuchspersonen sollte eine möglichst homogene Gruppe von Semi-Ex‐ pertInnen gefunden werden, also Personen, die mit der allgemeinen Thematik zwar vertraut waren, aber kein Spezialwissen zum konkreten Thema des Ver‐ suchstextes hatten. Sie sollten potentielle Nutzerinnen von Dolmetschleis‐ tungen sein. Da das Verständnis des Gehörten bei diesem Versuch eine der wichtigsten abhängigen Variablen darstellte, musste bei der Auswahl der Versuchspersonen besonders darauf geachtet werden, die Störvariable des Vorwissens auszu‐ schließen. Das innovative Thema der Rede (siehe Abschnitt 4.4) und die Auswahl der Fragen (siehe Abschnitt 4.6) bedeuteten, dass es sehr unwahrscheinlich war, dass einzelne Versuchspersonen mit den konkreten Inhalten und Beispielen gut vertraut wären. Gleichzeitig mussten aber alle Versuchspersonen fachlich vor‐ gebildet sein und über Wissen im Bereich Marketing allgemein verfügen, um dieses spezialisierte Thema zu verstehen. Als Versuchspersonen konnten in Zusammenarbeit mit dem Institut für Be‐ triebswirtschaftslehre des Außenhandels der Wirtschaftsuniversität Wien Stu‐ dierende des Bachelor-Studiengangs gewonnen werden, die zwei Parallel‐ gruppen einer Lehrveranstaltung zum Thema internationales Marketing besuchten. Es konnte angenommen werden, dass sie im Zuge ihres bisherigen Studiums und durch den Besuch der Übung und der dazugehörigen Vorlesung einigermaßen homogenes Wissen erworben hatten, das auf diesen zum Thema der Lehrveranstaltung passenden Vortrag anwendbar wäre. Als Studierende waren sie auch potenzielle KonferenzteilnehmerInnen und NutzerInnen von Simultandolmetschungen. Insgesamt gab es 56 LehrveranstaltungsteilnehmerInnen; durch Nichter‐ scheinen einiger TeilnehmerInnen und den Ausschluss von drei nicht bzw. un‐ gültig ausgefüllten Fragebögen ergibt sich für die Versuchspersonen eine end‐ gültige Zahl von 47. Die resultierenden Gruppengrößen von n = 24 und n = 23 sind klein und daher nur bedingt statistisch aussagekräftig. Dies betrifft aller‐ dings nur die Ergebnisse des Hörverständnistests (vgl. 5.2), da die anderen Teile der Studie ein ordinales Datenniveau haben und daher nichtparametrische Tests 77 4.3 Versuchspersonen 1 www.randomizer.org/ zum Einsatz kommen, die gegenüber Ausreißern robuster sind und keine Nor‐ malverteilung erfordern. 4.3.2 Parallelisierung und Randomisierung Um den Einfluss von Sprachkenntnissen auf die Ergebnisse zu minimieren, wurden die Versuchspersonen nach sprachlichem Hintergrund parallelisiert. Dazu wurden vom Lehrveranstaltungsleiter in der ersten Stunde des Semesters ohne Verweis auf den Versuch die Muttersprachen der Studierenden erhoben. Auf Grundlage dieser Daten wurden die Versuchspersonen parallelisiert, um eine gleichmäßige Verteilung von Personen mit Deutsch als Muttersprache und Personen, die eine andere Muttersprache hatten, auf die zwei Versuchsgruppen zu gewährleisten, d. h. sicherzustellen, dass die Störvariable „Sprachkenntnisse“ in beiden Versuchsgruppen annähernd gleich ausgeprägt war. Die paralleli‐ sierten TeilnehmerInnen wurden dann mit Hilfe der Online-Anwendung Re‐ search Randomizer 1 nach dem Zufallsprinzip in zwei Gruppen eingeteilt: A (flüssig) und B (unflüssig). (vgl. Eifler 2014: 201, Bortz & Schuster 2010: 8) 4.4 Ausgangstext Die Ausgangsrede sollte ein Spezialthema behandeln, das Semi-ExpertInnen auf dem Gebiet zugänglich aber nicht konkret bekannt wäre. Wichtig war dabei, dass die Rede genug Items für mögliche Fragen enthielt, die nicht nur das Ge‐ dächtnis, sondern auch das Verständnis testeten, und dass die Verständnisfragen nicht aus dem Hintergrundwissen der ProbandInnen beantwortet werden könnten. Als Ausgangsmaterial für die Studie wurde ein Vortrag verwendet, der von einem Lektor des Department of Management der italienischen Università Com‐ merciale Luigi Bocconi in Mailand auf Englisch gehalten wurde. Der Vortrag wurde frei, ohne Zuhilfenahme von Notizen, gehalten und mit einer Videoka‐ mera aufgezeichnet. Das Thema war „Marketing und Postmoderne“, ein sehr innovativer Ansatz innerhalb des Bereichs Marketing. Die Rede wurde von Karin Reithofer (2014) für die Zwecke ihrer Studie zu Englisch als Lingua Franca im Rahmen des QuaSI-Projekts aufgezeichnet und in Beratungen im QuaSI-Forschungsteam und bei einem internationalen Work‐ shop des QuaSI-Projekts am Zentrum für Translationswissenschaft im April 78 4 Versuch: Redeflüssigkeit und Dolmetschqualität 2 Siehe http: / / quasi.univie.ac.at/ fileadmin/ user_upload/ proj_quasi/ FWF_Workshop- Programm.pdf 2009 2 aus einer Reihe von Aufnahmen für ihr Forschungsprojekt ausgewählt (Reithofer 2014: 112 f.). Eine eingehende Beschreibung der Aufnahmen an der Università Commerciale Luigi Bocconi, der Auswahl des Vortrags sowie des Red‐ ners findet sich in Reithofer 2014 (111 ff. und 122 f.). Dieselbe Ausgangsrede wurde auch für die beiden anderen experimentellen Studien im Rahmen des QuaSI-Projekts ausgewählt: die Untersuchung des Pa‐ rameters Intonation (Holub 2010) sowie die vorliegende Untersuchung des Pa‐ rameters Flüssigkeit. Für die Verwendung dieser Ausgangsrede sprach, dass die Rede einen inno‐ vativen Ansatz behandelte, der zwar in den allgemeinen Kontext von Marketing eingebettet und aus diesem heraus verständlich war, bei dem aber weitgehend ausgeschlossen werden konnte, dass die Probandinnen bereits Vorwissen zu diesem konkreten Thema hatten. Somit waren gute Voraussetzungen dafür ge‐ geben, dass diese die Verständnisfragen nicht aufgrund ihres Hintergrundwis‐ sens sondern tatsächlich aufgrund ihres Verständnisses der Rede beantworten würden. Der Vortrag wird von einem Experten vorgetragen und ist zusammen‐ hängend und sinnvoll, so dass er trotz des wenig bekannten Themas gut nach‐ vollziehbar und verständlich ist. (siehe Reithofer 2014: 122 f.) Ein weiteres Auswahlkriterium war, dass Reithofer (2014) den Vortrag und ihren Fragebogen bereits einem kognitiven Pretest mit neun Wirtschaftsexper‐ tInnen unterzogen hatte, bei dem sich herausstellte, dass ihnen die Themen zwar durchaus aus anderen Ansätzen bekannt waren, die Betrachtung unter dem As‐ pekt der Postmoderne ihnen aber völlig neu war, was ebenfalls vermuten ließ, dass die Fragen eher nicht aus dem Hintergrundwissen heraus beantwortet werden könnten (Reithofer 2014: 123). Auch bei ihrer Hauptstudie hatte sich gezeigt, dass die Verständnisfragen im Fragebogen aufgrund des Gehörten und nicht aufgrund von Hintergrundwissen beantwortet wurden. (Reithofer 2014) Obwohl für die Versuche zur Flüssigkeit und Intonation eine neue Dolmet‐ schung der Ausgangsrede verwendet und der Verständnisteil des Fragebogens entsprechend angepasst wurde (siehe 4.6), wurde es als sinnvoll und zielführend erachtet, bereits erfolgreich erprobtes Ausgangsmaterial und einen ebensolchen Fragebogen zu verwenden. Der Redner ist im Video sitzend und frontal aus der Nähe zu sehen. Es werden keine visuellen Hilfsmittel (z.B. PowerPoint-Folien) verwendet. Dank des Inhalts, der Struktur und der Tatsache, dass der Vortrag von einem Universitätslektor ge‐ 79 4.4 Ausgangstext halten wird, kann er durchaus als realistischer Gastvortrag für TeilnehmerInnen einer marketingbezogenen Lehrveranstaltung betrachtet werden. 4.5 Versuchsmaterial Bei der Erstellung des Versuchsmaterials (Dolmetschung der Ausgangsrede) war darauf zu achten, dass der zu untersuchende Faktor (in diesem Fall Flüssigkeit) die einzige variable Größe war. Dazu wurde eine neue Methode der apparativen Manipulation von Redeflüssigkeit entwickelt. Dieser Ansatz und die dazu führ‐ enden grundlegenden Überlegungen sollen hier im Detail dargelegt werden. 4.5.1 Vorüberlegungen zum Versuchsmaterial Bei Experimenten, in denen einzelne Elemente von Dolmetschungen bzw. deren Wirkung auf die ZuhörerInnen verglichen werden, werden für gewöhnlich mindestens zwei Versionen benötigt, die sich in der Ausprägung des Untersu‐ chungsgegenstandes unterscheiden. Dies gilt für einzelne Elemente wie Into‐ nation (Collados Aís 1998), Stimme, Sprechstil (Collados Aís et al. 2007) und Pausen (Pradas Macías 2003, 2007) ebenso wie für grundsätzliche Unterschiede zwischen gedolmetschten Reden und vorgelesenen Transkripten der Dolmet‐ schungen (Shlesinger 1994). Entscheidend für ein klares Ergebnis ist dabei, dass mögliche Störvariablen ausgeschlossen werden und nach Möglichkeit nur die zu untersuchende Variable verändert wird. Dies war allerdings in der bisherigen Forschung nicht immer der Fall. Um die für einen Versuch benötigten unterschiedlichen Versionen einer Dol‐ metschung zu erhalten, bieten sich grundsätzlich mehrere Möglichkeiten, die allerdings verschiedene Vor- und Nachteile mit sich bringen. Dazu zählen die Verwendung unterschiedlicher DolmetscherInnen, das Lesen oder Nachspre‐ chen des Textes sowie die apparative Bearbeitung einer Aufnahme. Im Fol‐ genden sollen die verschiedenen Methoden kurz dargestellt und ihre Vor- und Nachteile besprochen werden. Dabei werden die Methoden stets im Hinblick auf ihre Anwendung zur Produktion flüssiger bzw. unflüssiger Dolmetschungen betrachtet, die Aussagen lassen sich allerdings weitgehend auch auf die Unter‐ suchung anderer prosodischer Merkmale umlegen. 4.5.1.1 Versionen verschiedener DolmetscherInnen Da sich Dolmetschungen individueller DolmetscherInnen oft hinsichtlich ihrer Flüssigkeit unterscheiden (z. B. aufgrund von Erfahrung, Vertrautheit mit 80 4 Versuch: Redeflüssigkeit und Dolmetschqualität Thema oder RednerIn oder auch individuellen Pausenmustern beim Dolmet‐ schen), wäre es möglich, die Ausgangsrede von mehreren DolmetscherInnen dolmetschen zu lassen und aus den so erhaltenen Aufnahmen zwei auszu‐ wählen, die sich in ihrer Flüssigkeit im gewünschten Ausmaß unterscheiden. Da diese Versionen sich allerdings auch hinsichtlich der Stimme, der Intona‐ tion, anderer prosodischer Merkmale und nicht zuletzt der Wortwahl sowie möglicherweise auch des Inhalts unterscheiden würden, könnte in diesem Fall nicht mehr von einer reinen Untersuchung der Flüssigkeit gesprochen werden und mögliche Unterschiede bei den Ergebnissen könnten nicht eindeutig auf die Flüssigkeit zurückgeführt werden. Diese Methode ist daher für einen Versuch, bei dem alle Parameter genau kontrolliert werden sollen, nicht geeignet. 4.5.1.2 Vorlesen Eine in der experimentellen Forschung häufig verwendete Methode (vgl. Col‐ lados Aís 1998, Collados Aís et al. 2007, Pradas Macías 2003, Shlesinger 1994) ist die Erstellung verschiedener Versionen durch Vorlesen einer Transkription oder eines vorgefertigten Textes. Dabei kann beim Vorlesen beispielsweise die Into‐ nation verändert werden (vgl. Collados Aís 1998), es können Pausen oder andere Elemente an im Manuskript markierten Stellen eingefügt werden (vgl. Collados Aís et al. 2007, Pradas Macías 2003) oder es wird lediglich der Text ohne beson‐ dere Instruktionen vorgelesen, um die natürliche Leseintonation der betreff‐ enden Person festzuhalten (vgl. Shlesinger 1994). Beim Vorlesen eines Textes - selbst wenn er in einer Weise vorgetragen wird, die eine Dolmetschung imitieren soll - ist zusätzlich zu möglichen Unter‐ schieden bei Intonation und Geschwindigkeit nicht auszuschließen, dass das Ergebnis „vorgelesen“ klingt. Während sich Shlesinger (1994) genau dem Un‐ terschied zwischen Dolmetschintonation und Leseintonation widmete und diese Art der Materialproduktion daher für ihren Versuch gut geeignet war, ist dies bei Versuchsmaterial, mit dem ausschließlich verschiedene Aspekte von Dol‐ metschungen untersucht werden sollen, nicht immer empfehlenswert, da da‐ durch ein möglicher Störfaktor eingeführt werden kann. 4.5.1.3 Shadowing Eine weitere Möglichkeit ist das Shadowing, also das simultane Nachsprechen einer gehörten Aufnahme. Im Gegensatz zum Vorlesen kann dabei das Tempo der Originalaufnahme recht gut eingehalten werden. Somit wäre zwar eine an‐ nähernde Simultanität der beiden Versionen theoretisch erreichbar, es ist aber sehr schwer, wenn nicht gar unmöglich, alle Parameter zu kontrollieren. So kommt es durch das Einfügen von Pausen unweigerlich entweder zu einer lo‐ 81 4.5 Versuchsmaterial kalen Tempoerhöhung, um wieder „aufzuholen“, oder zu einem erhöhten time lag. Auch können sich dadurch Veränderungen bei der Intonation ergeben. Da sich weder beim Shadowing noch beim Vorlesen eines Textes die unbe‐ absichtigte Veränderung zusätzlicher Parameter völlig ausschließen lässt, ist diese Methode eher für Untersuchungen geeignet, bei denen sich die Versionen auch im Wortlaut unterscheiden sollen. Sie können auch eingesetzt werden, wenn das Ziel nicht ist, einzelne prosodische Merkmale isoliert zu betrachten, wie beispielsweise bei Lenglet (2015), dessen Zielsetzung die Untersuchung der für das Simultandolmetschen typischen Prosodie allgemein war. Für eine Studie wie die vorliegende ist dieses Verfahren hingegen nicht gut geeignet. 4.5.1.4 Audiobearbeitung Um lediglich einen Parameter zu verändern und gleichzeitig alle anderen As‐ pekte der Dolmetschung gleich zu belassen, lässt sich eine Methode, die in der Psycholinguistik und Sprachwissenschaft bereits seit vielen Jahrzehnten ange‐ wandt wird, adaptieren und mit neuen technischen Möglichkeiten erweitern: die gezielte technische Bearbeitung der Aufnahme selbst. Mussten früher Tonbänder manuell geschnitten und neu zusammengefügt werden und Veränderungen an der Grundfrequenz und Intensität sowie spekt‐ rale Inversion mit analogen Apparaten vorgenommen werden (vgl. Duez 1993), steht heute eine Vielfalt von Audiobearbeitungssoftware zur Verfügung, die es erlaubt, solche Veränderungen leichter und schneller vorzunehmen. Im Gegen‐ satz zu den klassischen psycholinguistischen Studien, bei denen meist einzelne Sätze, Satzsegmente oder Worte verwendet wurden, um gezielt isolierte Phä‐ nomene zu untersuchen, wird bei dolmetschwissenschaftlichen Studien meist die Dolmetschung eines ganzen Vortrags verwendet. Moderne Software bietet die Möglichkeit, auch Aufnahmen von längerer Dauer mit vertretbarem Zeit‐ aufwand zu verändern. Mit Audiobearbeitungssoftware lässt sich eine Aufnahme digital so manipu‐ lieren, dass nur ein einzelner Aspekt - in diesem Fall die Flüssigkeit - verändert wird. Dabei wird die Aufnahme einer Dolmetschung als Ausgangsversion D 0 gewählt und durch Hinzufügen bzw. Entfernen von Pausen und Unflüssigkeiten an geeigneten Stellen verändert, sodass das Ergebnis eine flüssigere manipu‐ lierte Dolmetschung D F bzw. eine unflüssigere manipulierte Dolmetschung D U ist, die dann entweder untereinander oder mit D 0 verglichen werden können. Allerdings muss angemerkt werden, dass sich durch das Einfügen und Entfernen von Pausen und Unflüssigkeiten die Länge der manipulierten Version D F oder D U ändern kann. Dies beeinflusst die Simultanität der beiden Versionen und könnte bei einem gleichzeitigen Abspielen von Originalvideo und manipulierter 82 4 Versuch: Redeflüssigkeit und Dolmetschqualität Tonspur für die Versuchspersonen wahrnehmbar sein. Durch sorgfältige Bear‐ beitung der Versionen D F und D U kann dies aber weitgehend verhindert werden. So können längere Pausen im zu bearbeitenden Material D 0 genutzt werden, um diesen Effekt auszugleichen, indem für die Erstellung von D U Pausen in syntak‐ tischen Positionen - also an Stellen, an denen sie die Flüssigkeit ohnehin eher fördern als beeinträchtigen - etwas verkürzt werden. Umgekehrt können bei der Erstellung von D F syntaktische Pausen etwas verlängert werden. Eine wei‐ tere Möglichkeit ist es, einzelne Stellen in D U etwas zu beschleunigen. Dies würde zwar einen Unterschied zu D F bzw. D 0 darstellen, da Tempo aber ein Teil‐ parameter von Flüssigkeit ist und es beim Simultandolmetschen häufig vor‐ kommt, dass die DolmetscherIn versucht, den time lag zu verkürzen, indem sie nach einer Pause oder problematischen Stelle schneller dolmetscht, könnte der Effekt sogar zur Natürlichkeit der manipulierten Dolmetschung D U beitragen. Hier ist allerdings zu beachten, dass es durch die Beschleunigung zu Artefakten oder einer wahrnehmbar höheren Stimmlage kommen kann. Artefakte - durch die Bearbeitung erzeugte unecht klingende Ergebnisse wie Verzerrungen oder Pfeifen - sind ein Problem, das bei den meisten Arten der Audiomanipulation (z. B. Veränderung der Geschwindigkeit, Tonhöhe oder In‐ tonation) auftreten kann. Mit der für diese Studie entwickelten Methode können sie aber bei sorgfältiger Bearbeitung vermieden werden. Durch das Ausschneiden und Einfügen von Pausen und Unflüssigkeiten ent‐ steht der Eindruck einer unflüssigeren oder flüssigeren Dolmetschung, während Intonation, Wortwahl und Lautstärke gleich bleiben. Die so produzierten Ver‐ sionen D F und D U sind bis auf die Flüssigkeit völlig vergleichbar, weshalb Un‐ terschiede bei der kognitiven Wirkung und Bewertung mit hoher Wahrschein‐ lichkeit auf den Parameter Flüssigkeit zurückgeführt werden können. Diese Methode eignet sich daher für die gezielte Untersuchung einzelner - vor allem prosodischer - Parameter einer Dolmetschung. Bei dieser Methode können grundsätzlich hinsichtlich der Auswahl der zu bearbeitenden Ausgangsversion D 0 verschiedene Vorgehensweisen gewählt werden. Einerseits kann als D 0 eine flüssige Dolmetschung gewählt werden, die durch Hinzufügen von Unflüssigkeiten und Einfügen bzw. Entfernen von Pausen an entsprechenden Stellen unflüssiger gemacht wird (D U ), wobei aller‐ dings zu beachten ist, dass besonders flüssig und schnell gesprochene Stellen häufig Lautverschmelzungen aufweisen, in die Pausen oder Häsitationen nicht eingefügt werden können, ohne den Redefluss abrupt zu unterbrechen. Eine Alternative zum Einfügen von Pausen und Unflüssigkeiten ist es, eine unflüssige Dolmetschung als D 0 zu wählen und aus dieser störende Pausen und Unflüssig‐ keiten zu entfernen, um so eine flüssige Dolmetschung D F zu erhalten. Technisch 83 4.5 Versuchsmaterial ist dies weitgehend möglich, allerdings stellen auch hier Lautverschmelzungen (z. B. direkter Übergang des Auslautes eines Wortes in ein „ääh“) ein Problem dar, da es in manchen Fällen nicht oder nur schwer möglich ist, Unflüssigkeiten zu entfernen, ohne dass Artefakte entstehen und das Ergebnis „abgeschnitten“ klingt. Des Weiteren ist zu beachten, dass eine unflüssige Dolmetschung als D 0 auch andere Probleme aufweisen kann, etwa eine zögerliche Intonation oder Selbstkorrekturen sowie Probleme bei der Wortwahl und inhaltliche Un‐ schärfen, die durch das Herausschneiden von Pausen und Häsitationen nicht korrigiert würden, in einer sehr flüssigen Dolmetschung D F allerdings unna‐ türlich wirken könnten oder aber die Flüssigkeit weiterhin so stark beeinträch‐ tigen könnten, dass die Verständlichkeit gleich bliebe oder sogar beeinträchtigt würde. Durch eine Kombination dieser beiden Vorgehensweisen können die Vorteile beider Varianten optimal genutzt und gleichzeitig die Nachteile vermindert werden. Dabei wird als Ausgangsversion D 0 eine flüssige aber dennoch nicht problemfreie Dolmetschung gewählt. Eine Kopie dieser D 0 wird durch das Ent‐ fernen vorhandener Häsitationen und Fehlstarts verbessert, um eine flüssige Version D F zu erhalten; einer zweiten Kopie werden zusätzliche Pausen, Häsi‐ tationen und andere Unflüssigkeiten hinzugefügt, um so eine unflüssige Version D F zu produzieren. Ausgehend von einer Ausgangsversion D 0 können so durch Veränderung in beide Richtungen zwei Dolmetschungen erstellt werden, die sich hinsichtlich ihrer Flüssigkeit merklich unterscheiden. In den nächsten Abschnitten soll die Umsetzung der hier besprochenen Me‐ thode für die vorliegende Studie beschrieben werden. Nachdem zunächst in 4.5.2 die Erstellung und in 4.5.3 die Analyse der Dolmetschung als Grundlage für die Manipulation beschrieben werden, widmen sich Abschnitt 4.5.4 bis 4.5.7 der detaillierten Beschreibung der Bearbeitung des Ausgangsmaterials D 0 und der einzelnen Veränderungen, mit denen zwei Versionen von unterschiedlichem Flüssigkeitsgrad erstellt werden konnten. 4.5.2 Erstellung und Beschreibung der Dolmetschung Aufbauend auf den in Abschnitt 4.5.1.4 dargestellten Überlegungen wurde in der vorliegenden Arbeit die Flüssigkeit einer Dolmetschung D 0 mittels Audio‐ bearbeitung manipuliert. Dafür wurde zunächst geeignetes Ausgangsmaterial benötigt, dessen Erstellung und Analyse in diesem Kapitel beschrieben werden soll. Für den vorliegenden Versuch wurde die in Abschnitt 4.5.1.4 beschriebene Kombinationsvariante gewählt. Als Grundlage wurde also eine Dolmetschung 84 4 Versuch: Redeflüssigkeit und Dolmetschqualität D 0 benötigt, die zwar recht flüssig war, aber trotzdem auch Unflüssigkeiten und nicht-syntaktische Pausen aufwies und somit hinsichtlich ihrer Flüssigkeit noch verbessert werden konnte, ohne dass dadurch eine unnatürlich flüssige Dol‐ metschung D F entstanden wäre. Um diese Dolmetschung D 0 sowie die für die Manipulation benötigten zu‐ sätzlichen Unflüssigkeiten zu erhalten, wurde der ca. 15-minütige Ausgangstext (siehe Abschnitt 4.4) von einer Konferenzdolmetscherin mit fünf Jahren Berufs‐ erfahrung mehrmals vom Englischen ins Deutsche gedolmetscht. Alle Versionen wurden mit einem DAT-Rekorder digital aufgezeichnet und anschließend in das Wave-Format konvertiert. Da der AT-Redner kein englischer Muttersprachler war und einen starken Akzent hatte, wies der AT einige sprachliche und pho‐ netische Probleme auf. Dies war von Vorteil, da der so erhöhte Schwierigkeits‐ grad bei den ersten Dolmetschdurchgängen nicht nur zu Häsitationen führte, die bei der Manipulation verwendet werden konnten, sondern auch Informa‐ tionen über die für die Dolmetscherin typischen Häsitations- und Pausenmuster lieferte. Die Dolmetscherin war über den Zweck der Dolmetschung informiert, wurde allerdings gebeten, nicht absichtlich unflüssig zu dolmetschen, da dies möglicherweise einen unnatürlichen Eindruck gemacht hätte. Die beim dritten Durchgang aufgenommene Dolmetschung wurde schließlich als Grundlage für das Versuchsmaterial (also D 0 ) gewählt, da sie zwar inhaltlich gut und flüssig war, aber dennoch ausreichend Unflüssigkeiten enthielt, um auch nach einer Verbesserung hin zu D F natürlich zu wirken. Um zusätzliche Häsitationen für die Bearbeitung zu erhalten, wurde die Dolmetscherin schließlich noch gebeten, ohne weitere Vorbereitung eine sehr schnelle und sprachlich schwierige Rede zu einem nicht in Zusammenhang mit dem Versuchstext stehenden Thema zu dolmetschen. Diese letzte Aufnahme diente ausschließlich der Erfassung von Unflüssigkeiten und Pausenmustern. Für diese Aufgabe wurde bewusst eine erfahrene Konferenzdolmetscherin gewählt, da eine unerfahrene DolmetscherIn oder DolmetschstudentIn zwar vermutlich weitaus unflüssigere Versionen mit einer höheren Anzahl von Hä‐ sitationen produziert hätte, es allerdings auch in der endgültigen Version zu inhaltlichen oder sprachlichen Problemen hätte kommen können. Da es das Ziel war, realistische flüssige und unflüssige Dolmetschversionen D F und D U zu pro‐ duzieren, die beide in dieser Form auch in der Praxis vorkommen könnten, wurde auf solche Extrembeispiele verzichtet. Stattdessen wurde ein inhaltlich und von der Aussprache her schwieriger AT gewählt, bei dem es auch bei einer erfahrenen Dolmetscherin bei mehreren Dolmetschdurchgängen zu einer Pro‐ gression von unflüssig zu flüssig kommen konnte, alle Versionen aber dennoch professionelles Niveau aufwiesen. 85 4.5 Versuchsmaterial Für die Materialproduktion wurden drei Dolmetschungen ausgewählt: zwei Dolmetschungen des Versuchstextes (D 0 und eine weitere) sowie die Dolmet‐ schung der zusätzlichen Rede. Im nächsten Bearbeitungsschritt wurden diese Dolmetschungen transkribiert und analysiert. Dies wird im nächsten Abschnitt näher beschrieben. 4.5.3 Analyse und Annotation des Ausgangsmaterials Für die Transkription wurde der EXMARaLDA Partitur-Editor verwendet. EX‐ MARaLDA ist ein System zur Transkription und Annotation gesprochener Sprache, das im Teilprojekt „Computergestützte Erfassungs- und Analyseme‐ thoden multilingualer Daten“ des Sonderforschungsbereichs „Mehrsprachig‐ keit“ der Universität Hamburg entwickelt wurde (EXMARaLDA 2017). Beim Partitur-Editor handelt es sich um ein Werkzeug zur Erstellung von Diskurs‐ transkriptionen, die grafisch als Partituren dargestellt werden. Der Editor bietet die Möglichkeit, die Transkription mit der dazugehörigen digitalen Audio- oder Videoaufnahme zu verknüpfen und einzelne Ereignisse (z. B. Äußerungen, Pausen, Häsitationen oder Gesten) bei der Transkription dem genauen Zeit‐ punkt in der Aufnahme zuzuweisen. (Schmidt i.V.: 10) Im Editor können einzelne frei wählbare Kategorien für diese Ereignisse fest‐ gelegt werden, die als Partiturzeilen dargestellt werden (siehe Abbildung 1). Aufgrund dieser Flexibilität eignete sich EXMARaLDA hervorragend für die Zwecke der vorliegenden Arbeit. Die Transkription ließ sich dadurch nicht nur grafisch übersichtlich darstellen, sondern war auch leichter durchzuführen, da die Dolmetschung von Anfang an in sinnvolle Segmente aufgeteilt und Pausen, Häsitationen und andere Unflüssigkeiten im ersten Transkriptionsdurchgang mitannotiert werden konnten. Für die Transkription wurden folgende Katego‐ rien festgelegt (siehe Abbildung 1): Dolmetschung, Häsitationen, Pausen, Atmen, Längungen und Anderes. In der ersten Partiturzeile wurde eine weitgehend orthografische Transkrip‐ tion vorgenommen, wobei Häsitationen im Textfluss durch das ə-Symbol re‐ präsentiert wurden. In der nächsten Zeile wurden die Häsitationen in ver‐ schriftlichter Form festgehalten. Diese genaue Beschreibung der Art der Häsitation diente vor allem als Vorbereitung für die Manipulationsphase, da so für eine bestimmte Stelle geeignete Häsitationen schneller und leichter ge‐ funden werden konnten. In der nächsten Partiturzeile wurden Pausen, mit P gekennzeichnet, eingetragen. Die Zeile „Atmen“ war für hörbare Atemlaute ge‐ dacht, wobei in der Transkription zwischen „ein“ für Einatmen und „aus“ für Ausatmen unterschieden wurde, gelegentlich genauer beschrieben als „kurz“, 86 4 Versuch: Redeflüssigkeit und Dolmetschqualität „lang“, „laut“, „leise“, „intensiv“ oder „ruhig“. Auch diese Unterscheidung wurde im Hinblick auf die Manipulationsphase gemacht, da so passende Atemlaute leichter gefunden werden konnten. Auch die genaue Beschreibung der Art der Lautlängung in der Zeile „Längungen“ war für die Manipulation hilfreich. Die Zeile „Anderes“ schließlich umfasste Störlaute, die in keine der obigen Katego‐ rien passten. Dazu gehörten sowohl von der Dolmetscherin produzierte Laute wie Zungenschnalzen oder Räuspern als auch Umgebungsgeräusche wie Knacks- oder Klicklaute, die durch die Technik oder Geräusche in der Kabine verursacht worden waren. In der Manipulationsphase wurden weitere Katego‐ rien angelegt, um die vorgenommenen Änderungen übersichtlich zu dokumen‐ tieren (siehe 4.5.4). Die Einträge in den einzelnen Kategorien können den gleichen Zeitraum ein‐ nehmen, wie ə und „ääh“ in Abbildung 1, oder teilweise überlappend sein, wie die Pause und das Einatmen nach „Produktmarketings“ oder die Lautlängung „vvvom“ und der Satzteil „vom traditionellen …“ in der Abbildung. Auf diese Weise wurden alle drei verwendeten Dolmetschungen als Vorbe‐ reitung für die Bearbeitungsphase transkribiert und analysiert. 4.5.4 Bearbeitung des Materials Nach Erstellung und Analyse des Ausgangsmaterials konnte mit der Bearbei‐ tung begonnen werden. Die Manipulation von Audioaufnahmen ist grundsätz‐ lich sowohl mit analogen als auch mit digitalen Mitteln möglich. Aufgrund der größeren Möglichkeiten, die die digitale Bearbeitung bietet, und der großen Verfügbarkeit von geeigneten Softwareprogrammen ist die digitale Bearbeitung zu empfehlen. Im Folgenden soll vor der näheren Beschreibung des Bearbei‐ tungsvorgangs kurz die Arbeit mit dem Programm Praat erklärt werden, das für die hier beschriebene Bearbeitungsmethode verwendet wurde. Es gibt allerdings eine Vielzahl anderer kostenfreier und auch -pflichtiger Programme, die für eine solche Bearbeitung verwendet werden können. Praat ist eine kostenlose Audioanalyse- und Bearbeitungssoftware, die von Dr. Paul Boersma und David Weenink vom Institut für Phonetik der Universität Amsterdam entwickelt wurde (Boersma & Weenink 2010). Obgleich vor allem für die phonetische Analyse entwickelt, eignet sich das Programm auch für die Veränderung von Sprachdateien. 4.5.4.1 Vorbereitung des Audiomaterials Für die Manipulation mit Praat müssen die Dateien in digitaler Form vorliegen. Bei der Arbeit mit Dolmetschungen bedeutet das, dass diese in einem digitalen 87 4.5 Versuchsmaterial Abbildung 1: EXMARaLDA Partitur-Editor mit Transkriptionskategorien (Basisversion D 0 ) Partitur in Tabellenformat: Dolm [v] e Forschungsan‐ sätze verfolgt, vom traditio‐ nellen Ansatz des Produktmarketings. Dieses Ə hatte seine Wur‐ zeln im Häsitationen [v] ääh Pausen [v] P P Atmen [v] Ein Ein Längungen [v] vvvom Anderes [v] Audioformat (z. B. WAV) aufgenommen und gespeichert oder, falls nur eine analoge Aufnahme vorhanden ist, digitalisiert werden müssen. Bei einer dop‐ pelspurigen Aufnahme (Stereoaufnahme) müssen anschließend die Spuren ge‐ 88 4 Versuch: Redeflüssigkeit und Dolmetschqualität trennt werden. Dazu können mit der Funktion „Read two Sounds from stereo file …“ zunächst beide Spuren getrennt eingelesen und danach die entsprechende Spur als .wav-Datei gespeichert werden. Die so erhaltene Dolmetschspur kann nun mit Praat als Sound-Datei bearbeitet werden. Eine Einschränkung bei der Arbeit mit Praat besteht darin, dass Objekte in den Arbeitsspeicher des Computers geladen werden und die maximal zulässige Länge der bearbeitbaren Dateien daher vom Arbeitsspeicher des jeweiligen Computers abhängig ist (Mayer 2017: 23, Praat 2008). Bei größeren Dateien oder rechenintensiven Manipulationen ist daher eine Segmentierung der Datei in mehrere Teile empfehlenswert oder sogar notwendig. Dazu wird die Datei zu‐ nächst mit „Open long sound file …“ eingelesen und dann die Funktion „Extract part“ gewählt. Hier lässt sich der Bereich des gewünschten Segments in Se‐ kunden eingeben. Das so entstandene Segment wird als Sound-Datei in die Ob‐ jektliste von Praat geladen und kann nun gespeichert bzw. bearbeitet werden. Es gibt auch von NutzerInnen geschriebene Skripte, mit deren Hilfe gewisse Arten von Aufnahmen weitgehend automatisch segmentiert werden können (z. B. Mayer 2018). Dies ist allerdings vor allem für Analysearbeiten geeignet, während bei einer Manipulation wie in der vorliegenden Arbeit die manuelle Segmentierung in inhaltlich zusammenhängende Einheiten sinnvoll ist. 4.5.4.2 Manipulation: Ausschneiden und Einfügen Die verschiedenen Arten der Manipulation sowie die Auswahl geeigneter Ele‐ mente und Zielstellen werden in 4.5.6 und 4.5.7 im Detail beschrieben. An dieser Stelle soll jedoch kurz die technische Durchführung erläutert werden. Sound-Dateien werden im Editor-Fenster als Signal dargestellt, das in seiner Größe an das Fenster angepasst ist. Durch Vergrößern können einzelne Ab‐ schnitte der Signaldarstellung betrachtet werden, was für die genaue Arbeit an den Dateien hilfreich ist (Praat gibt die Sekundenwerte mit sechs Dezimalstellen an, was ein sehr präzises Auswählen geeigneter Ausschnitte ermöglicht). Wählt man im Editor-Fenster den Menüpunkt „Play …“ oder klickt auf den Abspiel‐ balken mit der Zeitangabe unter der Signaldarstellung, wird der ausgewählte Abschnitt abgespielt. Es wird stets der ausgewählte Signalabschnitt (ab bzw. bis Cursorposition) oder, bei Klicken auf den unteren Abspielbalken, der gesamte aktuelle Fensterinhalt abgespielt. Mithilfe des Cursors lassen sich beliebig große Teile des Signals markieren. Sind die Zeitangaben der gewünschten Anfangs- und Endposition bekannt, kann die Auswahl auch mit „Select …“ getroffen werden. Eine so ausgewählte Stelle kann nun kopiert bzw. ausgeschnitten werden (siehe Abbildung 2). 89 4.5 Versuchsmaterial Abbildung 2: Auswahl einer Häsitation aus einer Quelldatei Das so ausgewählte Segment kann nun in die zu bearbeitende Datei eingefügt werden, indem dort der Cursor an die gewünschte Stelle gesetzt und das Element mit dem Menüpunkt „Paste after selection“ eingefügt wird (siehe Abbildung 3, Abbildung 4). Um die Bearbeitung zu erleichtern, lassen sich mehrere Dateien in separaten Editor-Fenstern gleichzeitig öffnen. 4.5.4.3 Bearbeitungsprozess Das vorhandene Material bestand aus zwei Kopien der ausgewählten Dolmet‐ schung, die verändert werden sollte (D 0 ), sowie aus zwei weiteren Dolmet‐ schungen, die vor allem als Quelle für Häsitationen und andere Unflüssigkeiten dienten („Quelldateien“). D 0 hatte eine Länge von 15 min 24 s. Das Material wurde wie oben beschrieben mit Praat manipuliert. Zunächst wurde auf Grundlage der annotierten Transkription und des Höreindrucks be‐ stimmt, welche Unflüssigkeiten gelöscht und welche Pausen verändert werden sollten, um aus Kopie 1 von D 0 eine flüssige Version D F zu machen. Ebenso wurden für die Produktion der unflüssigen Version D U bereits vor der eigentli‐ chen Bearbeitung in D 0 Stellen identifiziert, an denen Pausen oder Unflüssig‐ keiten eingefügt werden könnten. Durch einen technischen Fehler war bei der Aufnahme von D 0 der Ton für die Dauer von ca. 1,9 s ausgefallen. Dieser Fehler konnte durch Kopieren und Einfügen der entsprechenden Stelle aus einer der 90 4 Versuch: Redeflüssigkeit und Dolmetschqualität Abbildung 3: Einfügen der Häsitation an die ausgewählte Stelle der zu modifizierenden Datei Abbildung 4: Modifizierte Datei mit eingefügter Häsitation anderen Dolmetschungen korrigiert werden. Diese Veränderung sowie vier weitere Änderungen, die sowohl D F als auch D U betrafen, wurden vor Beginn 91 4.5 Versuchsmaterial der eigentlichen Bearbeitung und Erstellung der Kopien von D 0 vorgenommen. Dabei handelte es sich um externe Störgeräusche, die vermutlich vom Aufnah‐ megerät oder von Geräuschen in der Dolmetschkabine verursacht worden war und aus beiden Versionen entfernt wurden, um diesen nicht zum Untersu‐ chungsgegenstand gehörenden Faktor auszuschalten. So wurden in beiden Ver‐ sionen ein Klopflaut und ein Klicklaut entfernt. Zusätzlich wurde aus beiden Versionen an zwei Stellen störendes Räuspern entfernt, das keinen Einfluss auf die Flüssigkeit gehabt hätte, das Hörerlebnis aufgrund der höheren Lautstärke aber hätte beeinträchtigen können. Alle Veränderungen wurden genau protokolliert. Jeder Veränderung wurde eine Kennzahl zugewiesen und in einer Excel-Datei wurden die Versions‐ nummer der manipulierten Datei, die Art (z. B. Atmen, Häsitation) und die ge‐ naue Länge und Position der Veränderung festgehalten. Bei jedem hinzuge‐ fügten Element wurde auch die Quelldatei sowie die genaue Stelle, von der es kopiert worden war, notiert. Dadurch blieben die Veränderungen nachvoll‐ ziehbar und konnten bei Bedarf nachträglich wieder rückgängig gemacht werden, indem entweder die eingefügte Stelle gelöscht oder die gelöschte Stelle aus einer vorhergehenden Version wieder eingefügt wurde. Die genaue Annotation der Ausgangsdateien im Vorfeld (siehe 4.5.3) erlaubte es, die infrage kommenden Unflüssigkeiten mittels der Suchfunktion von EX‐ MARaLDA leicht zu finden und einzeln anzuhören, um festzustellen, ob sie zu einer bestimmten Stelle passten. Dies wurde aufgrund des Höreindrucks be‐ stimmt; dabei musste vor allem darauf geachtet werden, dass es natürlich klang und keine auffälligen Lautstärkenschwankungen oder Artefakte entstanden. Nachdem eine geeignete Unflüssigkeit gefunden wurde, konnte sie mit dem Bearbeitungsprogramm Praat aus dem entsprechenden Audiofile kopiert und an der gewünschten Stelle eingefügt werden. Jede Veränderung wurde außerdem in EXMARaLDA an der entsprechenden Stelle eingetragen. Dazu wurde für die flüssige (D F ) und die unflüssige Version (D U ) jeweils eine eigene Kopie der Transkription erstellt, in der neben den in 4.5.3 beschriebenen Kategorien auch Kategorien für die Kennzahl, eine Be‐ schreibung der Änderungen sowie die Nettodauer der Änderungen in Sekunden eingefügt wurden. Nach Fertigstellung der beiden Versionen wurden die Tran‐ skription und Annotation den Veränderungen angepasst, um diese übersichtlich darzustellen (siehe Abbildung 5, Abbildung 6). Nach der Manipulation des Versuchsmaterials, die weitgehend nach subjek‐ tivem Empfinden vorgenommen wurde, mussten die beiden erzeugten Versi‐ onen D F und D U validiert werden, um sicherzustellen, dass die Flüssigkeit der unflüssigen Version tatsächlich auch von einem größeren Publikum schlechter 92 4 Versuch: Redeflüssigkeit und Dolmetschqualität Abbildung 5: EXMARaLDA Partitur-Editor mit Veränderungen (flüssige Version D F ) Partitur in Tabellenformat: Dolm [v] sätze ver‐ folgt, vom traditionellen Ansatz des Produkt‐ marketings. Dieses hatte seine Wurzeln im Häsitationen [v] Pausen [v] p b p p Atmen [v] Längungen [v] vvvom Anderes [v] Änderungen [v] f209, f269, f270 f3, f204 f4 Änderungen konkret + Pause, -/ + Atmen (Aus‐ tausch) -Atmen, + Pause -Häsitation Dauer der Ände‐ rung [v] 0,897285 -0,8222268 -0,410522 93 4.5 Versuchsmaterial Abbildung 6: EXMARaLDA Partitur-Editor mit Veränderungen (unflüssige Version D U ) Partitur in Tabellenformat: Dolm [v] e ver‐ folgt, vom traditio‐ nellen Ansatz des Ə Produkt‐ marketings Dieses Ə hatte Häsitationen [v] ämm ääh Pausen [v] p b p Atmen [v] Längungen [v] vvvom mmm Anderes [v] Änderungen [v] u9, u10 u11 Änderungen konkret -Auslaut, - Störge‐ räusch. +mmm +Häsita‐ tion Dauer der Än‐ derung [v] +0,459129 +0,705953 94 4 Versuch: Redeflüssigkeit und Dolmetschqualität beurteilt würde als jene der flüssigen. Der Validierungsprozess und dessen Er‐ gebnisse werden im folgenden Abschnitt beschrieben. Darauf folgt eine detail‐ lierte Beschreibung der verschiedenen Arten von Veränderungen, die bei der Erstellung der flüssigen und unflüssigen Versionen vorgenommen wurden. Da dabei unterschiedliche Faktoren berücksichtigt werden mussten und teilweise verschiedene Vorgehensweisen notwendig waren, wird zunächst in 4.5.6 die Verbesserung der Flüssigkeit für D F beschrieben und danach in 4.5.7 die Erstel‐ lung der unflüssigen Version D U erläutert. Diese zwei Abschnitte erklären ei‐ nerseits die Vorgangsweise im Detail und stellen andererseits eine Beschreibung des Versuchsmaterials dar (für eine annotierte Transkription der beiden Versi‐ onen siehe Anhang). 4.5.5 Validierung des Versuchsmaterials Grundsätzlich war schon von der Fragebogenerhebung Zwischenbergers (2013; siehe 3.2.2.3) bekannt, dass mit der hier verwendeten Manipulationsmethode erfolgreich glaubwürdige Veränderungen der Redeflüssigkeit erzeugt werden können, die zu deutlich unterschiedlichen Bewertungen führen. Dennoch musste selbstverständlich das eigentliche Versuchsmaterial für den Versuch zur Flüssigkeit validiert werden. Für die erste Validierung wurden jeweils die ersten vier Minuten der flüssigen und unflüssigen Version verwendet. Als Versuchspersonen wurden nach Mut‐ tersprache parallelisierte und randomisierte Studierende des Zentrums für Translationswissenschaft verwendet, wobei je 11 die flüssige und 11 die un‐ flüssige Version hörten. Der Versuch wurde im Rahmen einer Dolmetschübung durchgeführt. Im Anschluss an diese Hörprobe wurden die Studierenden ge‐ beten, einen kurzen Fragebogen auszufüllen, in dem sie neben Hintergrundva‐ riablen wie Sprachkombination, Alter und Erfahrung mit dem Anhören echter Konferenzdolmetschungen nach ihrer subjektiven Meinung zur Dolmetschung gefragt wurden. Auf einer siebenstelligen Skala (wobei 1 die beste und 7 die schlechteste Be‐ wertung darstellte) sollten sie angeben, wie gut sie den Inhalt des Vortrags ver‐ standen hatten, sowie die Redeflüssigkeit und Intonation beurteilen. Jede dieser drei Beurteilungsfragen bot außerdem Platz für Anmerkungen. Eine nähere Be‐ schreibung dieser Fragen findet sich in 4.6.1.2 bzw. 4.6.3. Die Verständlichkeit wurde bei der flüssigen Version mit 1,81 besser einge‐ schätzt als bei der unflüssigen mit 2,36. Bei der Flüssigkeit wurde allerdings die flüssige Version mit 3,18 geringfügig schlechter beurteilt als die unflüssige mit 3,09. Diese Unterschiede sind nicht signifikant, es gibt aber einen signifikanten 95 4.5 Versuchsmaterial mittleren Zusammenhang zwischen der Bewertung des Verständnisses und der Flüssigkeit (Spearman-Rho r = 0,586, 2-seitige Sig.=0,004 < 0,05). Die Kommentare zur flüssigen Version waren für die Validierung sehr auf‐ schlussreich: „lange Pausen (-), deutliches Sprechen (+), angenehme Stimme (+)“, „zwar ganze Sätze, aber dazwischen längere Pausen“, „Pausen waren relativ lange, dafür waren die Sätze dann in sich korrekt und die Sprecherin hat sich nicht ausbessern müssen“. Es kann angenommen werden, dass die in der ersten flüssigen Version teils sehr langen Pausen zwischen einzelnen Sätzen selbst für ihre syntaktische Position als zu lang und daher störend empfunden werden. Dies könnte auch die subjektive Sprechgeschwindigkeit beeinflusst haben, was lediglich von einer Versuchsperson positiv gewertet wurde: „langsames Sprech‐ tempo, vollständige Sätze -> angenehm für das Verständnis“. Dies könnte mög‐ licherweise auch eine Erklärung für die schlechtere (allerdings nicht signifikant schlechtere) Bewertung der Intonation in der flüssigen Version sein: Obwohl die Intonation in diesen beiden Versionen nicht verändert worden war, wurde die unflüssige Version bei der Intonation mit 3,27 besser beurteilt als die flüssige (3,72). Einige Kommentare zur Intonation bei der flüssigen Version lassen ver‐ muten, dass die langen Pausen zum Eindruck der Monotonie beigetragen haben könnten: „sehr einschläfernd“, „eher eintönig“, „sehr ruhig, ein wenig monoton“. Bei der unflüssigen Version hingegen gab es nur einen negativen Kommentar zur Intonation: „vorgelesen, langweilig, man driftet ab“. Bei der unflüssigen Version gab es ebenfalls negative Kommentare zur Flüs‐ sigkeit, hier war dies allerdings der erwünschte Effekt. Einige der Kommentare lauteten: „logische Übergänge waren nicht klar; Zögerungen bei den wichtigsten Begriffen haben den Inhalt beeinträchtigt“, „Unterbrechung an ‚ungünstigen’ Stellen (Erwartungen - Leere)“. Eine Versuchsperson kommentierte bei der Frage nach der Verständlichkeit „sie stockte, Pausen“ und bei der Flüssigkeit „s.o., gewartet, gezögert“. Trotz dieser Kommentare war die numerische Be‐ wertung der Flüssigkeit relativ gut. Ausgehend von diesen Ergebnissen wurden beide Versionen einer weiteren Überarbeitung unterzogen. Dabei wurden in der flüssigen Version vor allem lange Pausen gekürzt bzw. durch hörbares Atmen unterbrochen und in der un‐ flüssigen Version noch mehr Häsitationen und besonders Mikrohäsitationen eingesetzt, um die Unflüssigkeit zu verstärken. Nach der weiteren Bearbeitung wurden beide Versionen in voller Länge dem QuaSI-Team vorgespielt, um den Höreindruck zu validieren. Die Teammitglieder empfanden die unflüssige Ver‐ sion D U als deutlich unflüssiger als die flüssige und kommentierten einzelne Stellen, bei denen daraufhin noch Nachbesserungen vorgenommen wurden. Die so validierten Versionen konnten nach der letzten Nachbesserung als Versuchs‐ 96 4 Versuch: Redeflüssigkeit und Dolmetschqualität material eingesetzt werden. Die erfolgreiche Manipulation der Flüssigkeit wird durch die Ergebnisse bestätigt (siehe 5.3.1). Sowohl das QuaSI-Team als auch der am Versuch beteiligte Dolmetschtech‐ niker waren der Meinung, dass sowohl die flüssige als auch die unflüssige Ver‐ sion so in der Praxis vorkommen könnten, also realistische Beispiele für pro‐ fessionelle Dolmetschungen darstellten. 4.5.6 Erstellung der flüssigen Version D F Wie oben erwähnt wurde zunächst aufgrund des subjektiven Höreindrucks und der annotierten Transkription bestimmt, welche Unflüssigkeiten gelöscht und welche Pausen gekürzt werden sollten, um aus der Basisversion D 0 eine flüs‐ sigere Version D F zu machen. Da die Gesamtlänge von 15 min 24 s beim ver‐ wendeten Versuchsaufbau beibehalten werden musste, da D F und D U gleichzeitig mit dem Video abgespielt werden sollten, wurden außerdem Stellen identifiziert, an denen Pausen eingefügt oder verlängert werden konnten, ohne dabei die Flüssigkeit zu beeinträchtigen. Dabei handelte es sich vor allem um syntaktische Pausen, etwa zwischen Sätzen, oder auch um Stellen, an denen eine syntaktische Pause fehlte, wo also durch Einfügen einer Pause die Flüssigkeit sogar verbessert werden konnte. Insgesamt wurden zur Erstellung der flüssigen Version D F 480 Änderungen an Kopie 1 der Basisversion D 0 vorgenommen. 351 dieser Änderungen wurden vor der Validierung, 129 danach vorgenommen. Oft wurden an einer Stelle mehrere Veränderungen vorgenommen, da entweder mehrere Elemente gleich‐ zeitig entfernt oder hinzugefügt wurden (z. B. eine Pause und ein hörbarer Atemzug) oder im Laufe des Veränderungsprozesses nachgebessert oder rück‐ gängig gemacht wurden. Dabei wurde in 233 Fällen etwas entfernt (davon 178 vor der Validierung), in 240 etwas hinzugefügt (davon 173 vor der Validierung) und in 7 Fällen wurde ein Element an eine andere Stelle verschoben. Im Fol‐ genden sollen die einzelnen Arten von Hinzufügungen und Löschungen näher beschrieben werden. 4.5.6.1 Pausen Insgesamt wurden bei der Erstellung der flüssigen Version D F 71 Pausen aus der Basisversion D 0 entfernt bzw. gekürzt und 141 eingefügt. Außerdem wurde in einem Fall die Position einer Pause geringfügig verändert. Der Großteil dieser Veränderungen (50 entfernte und 134 hinzugefügte Pausen) wurde vor der ersten Validierung vorgenommen. Nach der Validierung wurden an 6 Stellen Pausen korrigiert, indem eine Pause entfernt und eine andere eingefügt wurde 97 4.5 Versuchsmaterial (meist in Kombination mit Atemzügen), an 15 Stellen wurden Pausen entfernt (bzw. gekürzt) und an einer Stelle wurde eine Pause hinzugefügt. Die Positions‐ änderung einer Pause wurde ebenfalls nach der Validierung vorgenommen. Die Länge der eingefügten Pausen variiert zwischen 0,05 s und 1,5 s. Alle Pausen mit einer Länge von über 0,1 s - insgesamt etwa 82 % aller eingefügten Pausen - wurden ausschließlich in syntaktischen Positionen eingefügt. Pausen, die länger als 0,3 s waren, wurden mit drei Ausnahmen, die zwischen Teilsätzen eingefügt wurden, nur zwischen ganzen Sätzen eingefügt. Einige dieser Ver‐ änderungen verlängerten bereits vorhandene Pausen zwischen Sätzen, andere hingegen wurden verwendet, um bewusst eine Pause in einer syntaktischen Position zu schaffen, die vorher gefehlt hatte, um so einen ruhigeren und flüs‐ sigeren Höreindruck zu erwecken. Pausen von 0,1 s Länge und darunter wurden zum Teil auch an nicht-syntaktischen Stellen eingesetzt, beispielsweise zur Ab‐ trennung von ineinander übergehenden Wörtern oder an Stellen, an denen eine Häsitation, Selbstkorrektur oder andere Unflüssigkeit entfernt worden und da‐ durch ein bemerkbarer Unterschied zwischen der Tonhöhe oder Lautstärke des vorhergehenden und jener des folgenden Wortes entstanden war. Durch Ein‐ fügen einer sehr kurzen Pause konnten solche Sprünge in der Tonhöhe oder Lautstärke kaschiert werden, ohne eine störende Unterbrechung zu schaffen. Als Grundlage für eingefügte Pausen wurde sowohl in D F als auch in D U in beinahe allen Fällen eine gut zwei Sekunden lange Pause in einer der Quellver‐ sionen verwendet, aus der Stücke mit passender Länge kopiert wurden. So konnte sichergestellt werden, dass sich eingefügte Pausen nicht durch mögliche leise Hintergrundgeräusche oder die Lautstärke des Hintergrundsummens des Aufnahmegerätes voneinander unterschieden. Bei den 71 entfernten bzw. gekürzten Pausen handelte es sich vor allem um nicht-syntaktische Pausen, es wurden aber auch sehr lange Pausen in syntak‐ tischen Positionen etwas gekürzt. Die Länge der entfernten Pausen bzw. Pau‐ senteile variierte zwischen 0,008 s und 1,4 s, wobei die Mehrheit im Bereich von 0,1 bis 0,6 s lag. Durch das Entfernen von Pausen in nicht-syntaktischen und das Hinzufügen in syntaktischen Positionen sollte der Höreindruck dahin gehend verändert werden, dass Pausen von der Dolmetscherin scheinbar überlegt bzw. wie bei spontaner Sprache gesetzt wurden, anstatt den zögerlichen Eindruck zu erwe‐ cken, den nicht-syntaktische Pausen hervorrufen können. Durch die Bearbeitung der Pausen veränderte sich auch die globale Artiku‐ lationsrate: Betrug sie in der ersten Minute der Basisversion D 0 4,58 Silben/ s, so sank sie in der flüssigen Version D F auf 4,26 Silben/ s. Da die wahrgenommene lokale Sprechgeschwindigkeit aber vermutlich nicht nur von der Artikulations‐ 98 4 Versuch: Redeflüssigkeit und Dolmetschqualität rate und Pausendauer, sondern auch anderen Faktoren abhängig ist (Pfitzinger 2001; siehe 2.2.2.3), bislang aber unklar ist, welche Faktoren das genau sind, können aus diesen Zahlen allein keine Rückschlüsse darauf gezogen werden, ob und wie stark dies die von den Versuchspersonen wahrgenommene Geschwin‐ digkeit beeinflusste. Aus diesem Grund wurde auch auf den Versuch, die wahr‐ genommene Sprechgeschwindigkeit gezielt zu manipulieren, verzichtet. 4.5.6.2 Atmen In normalen Sprechsituationen werden Atempausen meist nicht als den Rede‐ fluss störend wahrgenommen. Bei der Untersuchung des Materials fielen aller‐ dings wiederholt Atemzüge auf, die einen Einfluss auf die subjektiv wahrge‐ nommene Flüssigkeit zu haben schienen. Je nach Intensität, Dauer und Position schienen sie den subjektiven Eindruck der Flüssigkeit manchmal zu verbessern, manchmal aber auch zu verschlechtern. Daher wurden zur Erstellung der flüs‐ sigen Version einerseits 99 hörbare Atemzüge dort entfernt, wo sie die Flüssig‐ keit störten (81 vor der Validierung), andererseits aber 67 Atemzüge an anderen Stellen eingefügt (39 vor der Validierung). An 18 Stellen wurde dabei ein im Original vorhandener hörbarer Atemzug durch einen anderen ersetzt und in 9 Fällen handelt es sich um Korrekturen bereits gemachter Änderungen, bei denen ein vorher eingefügter Atemzug durch einen anderen ersetzt wurde. Bei den Atemzügen machte sich der Nutzen der Validierung besonders be‐ merkbar: Nachdem bei der Validierung festgestellt wurde, dass ruhige Atemzüge an einigen Stellen den Eindruck von Flüssigkeit zu begünstigen schienen, wurden an 29 Stellen solche Atemzüge eingefügt sowie 9 bereits bearbeitete Atemzüge verlängert. An 11 weiteren Stellen wurde ein Atemzug durch einen anderen ersetzt, bei 6 wurde die Position verschoben und in 7 Fällen wurde ein hörbarer Atemzug entfernt. Bei der Bearbeitung der Atemzüge wurde nach subjektivem Empfinden vor‐ gegangen, es lassen sich aber einige Gesetzmäßigkeiten identifizieren. So han‐ delte es sich bei den entfernten Atemzügen vornehmlich um intensive, kurze Atemzüge am Anfang von nicht-syntaktischen Pausen oder in nicht-syntakti‐ schen Positionen ohne Pause. Auch leisere Atemzüge am Beginn oder in der Mitte einer Pause, denen eine lange Stille folgte, wurden häufig entfernt. Der subjektive Höreindruck bei intensiven, kurzen Atemzügen war der von Stress und Hektik, während leisere Atemzüge gefolgt von langen Pausen den Eindruck von Zögern erweckten. Nicht alle entfernten Atemzüge klangen für sich ge‐ nommen störend, manche wurden aber gleichzeitig mit neben ihnen liegenden Pausen oder Störgeräuschen entfernt, häufig aus nicht-syntaktischen Posi‐ tionen. 99 4.5 Versuchsmaterial Hinzugefügt wurden Atemzüge vor allem in syntaktischen Positionen, etwa zwischen zwei Sätzen, die zuvor zu eng aneinander lagen und daher hektisch wirkten, oder auch zwischen Teilsätzen und in vorhandenen Pausen. Dabei handelte es sich vor allem um ruhiges Luftholen am Ende einer Pause oder um ruhiges Ein- und Ausatmen während einer längeren Pause. Dadurch konnten längere syntaktische Pausen, die beibehalten oder eingefügt werden mussten, um die Gesamtlänge der Dolmetschung zu wahren, aufgelockert und subjektiv verkürzt werden, da mit der Unterbrechung der Pause durch ein ruhiges Ein- und Ausatmen der Eindruck erweckt werden sollte, die Dolmetscherin habe Zeit, ruhig zu atmen, während sich bei einer längeren ungefüllten Pause die Zuhö‐ rerInnen fragen könnten, ob die Dolmetschung unterbrochen wurde. Bei den 18 ausgetauschten Atemzügen handelte es sich vornehmlich um kurze, intensive Atemzüge, die durch ruhige ersetzt wurden. 4.5.6.3 Unflüssigkeiten Mithilfe der in den beiden vorhergehenden Abschnitten beschriebenen Ände‐ rungen bei der Positionierung von Pausen und der Art und Position hörbarer Atemzüge wurde aus der Basisversion D 0 eine subjektiv ruhigere, kontrollierter wirkende Dolmetschung D F gemacht. Da der Unterschied zur unflüssigen Ver‐ sion D U für den durchgeführten Versuch jedoch - innerhalb eines realistischen Rahmens - möglichst groß sein sollte, wurden auch andere Störfaktoren ent‐ fernt, um die Version noch flüssiger zu gestalten. So wurden 30 Häsitationen, 11 Fehlstarts, 2 Selbstkorrekturen und 7 verlän‐ gerte Auslaute entfernt. Weiters wurden Störlaute entfernt, bei denen es sich nicht immer um Unflüssigkeiten im engeren Sinne handelte, die aber sehr wohl die Flüssigkeit bzw. den Höreindruck störten. Dabei handelte es sich in zwei Fällen um Räuspern, viermal um hörbares Schlucken, in 26 Fällen um Schnalzen mit der Zunge, sieben Klicklaute, die nicht eindeutig als Schnalzen zu identifi‐ zieren waren, ein Zischen, und in fünf Fällen um andere Störlaute, etwa unbe‐ absichtigte Lautbildungen, die nicht zur Kategorie der Häsitationen gezählt wurden. Um trotz der Verbesserungen bei der flüssigen Version D F den Eindruck einer natürlichen Dolmetschung zu wahren, wurden nicht alle Unflüssigkeiten ent‐ fernt. Teils wäre dies auch technisch schwierig gewesen, etwa bei solchen, die direkt an ein Wort angrenzten, andere wiederum waren nicht sehr intensiv und wurden deshalb in der flüssigen Version beibehalten. So finden sich in der flüs‐ sigen Version des Versuchsmaterials noch 18 Lautlängungen - sowohl am An‐ fang oder Ende als auch in der Mitte von Wörtern -, vier kurze Häsitationen, die teilweise am Anfang oder Ende eines Wortes artikuliert wurden, ein Schluck‐ 100 4 Versuch: Redeflüssigkeit und Dolmetschqualität laut sowie drei Fehlartikulationen von Wörtern. Letztere wären auch technisch nicht korrigierbar gewesen, tragen aber außerdem zum natürlichen Charakter der Dolmetschung bei. 4.5.7 Erstellung der unflüssigen Version D U Nachdem in 4.5.6ff. beschrieben wurde, welche Faktoren bei der Produktion der flüssigen Version D F von Bedeutung waren, soll in diesem Abschnitt im Detail auf die Erstellung der unflüssigen Version D U des Versuchsmaterials ausgehend von der zweiten Kopie der Basisversion D 0 eingegangen werden. Wie bereits eingangs erwähnt wurden schon während der Transkription und Analyse Stellen markiert, an denen eine Pause oder Unflüssigkeit eingefügt werden könnte, um die Aufnahme unflüssiger zu machen. Die Auswahl von einzufügenden Elementen nahm hier eine wesentlich prominentere Rolle ein als beim Erstellen der flüssigen Version D F , da dort überwiegend Pausen und Atem‐ züge eingefügt wurden, bei denen keine bzw. nur wenig Auswahl getroffen werden musste. Obwohl mit insgesamt 228 Änderungen an 200 Stellen zahlen‐ mäßig weniger Änderungen vorgenommen wurden als bei der flüssigen Ver‐ sion, waren Bearbeitungsdauer und Aufwand bei der unflüssigen Version we‐ sentlich höher. Es wurden 180 Elemente hinzugefügt und 51 Elemente entfernt, wobei vier davon (zweimal Räuspern und je ein externer Klopf- und Klicklaut) wie in 4.5.4.3 erwähnt auch aus der flüssigen Version entfernt wurden. Der Großteil dieser Änderungen wurde vor der Validierung vorgenommen: 158 Ele‐ mente wurden hinzugefügt und 44 entfernt. Die meisten Änderungen nach der Validierung betrafen das Einfügen von Häsitationen. Im Folgenden werden die einzelnen Arten von Änderungen bei der Erstellung der unflüssigen Version D U näher beschrieben. 4.5.7.1 Pausen Im Gegensatz zur flüssigen Version wurden zur Erstellung der unflüssigen Dol‐ metschung D U Pausen vor allem in nicht-syntaktische Positionen hinzugefügt, aus syntaktischen hingegen entfernt. Von den 91 hinzugefügten Pausen wurden 55 in nicht-syntaktische Positionen eingefügt (siehe auch 4.5.7.2), 12 davon nach den ersten ein bis drei Wörtern eines Satzes, was einem von der Dolmetscherin in ihren Dolmetschungen ver‐ wendeten Pausenmuster entsprach. Drei Pausen wurden zwar in syntaktische Positionen innerhalb von Sätzen gelegt, zwei davon waren allerdings so lang, dass sie an diesen Stellen als störend eingeschätzt wurden, und eine war nötig, um eine eingefügte Häsitation besser in ihre Umgebung einzubetten. 101 4.5 Versuchsmaterial Außerdem wurden 33 sehr kurze Pausen innerhalb von Wörtern eingesetzt. Diese Pausen hatten eine Länge von 0,05 bis 0,2 s, die Mehrzahl war 0,1 s lang. Sie fallen subjektiv nicht zwangsläufig als Pausen auf, sondern erwecken viel‐ mehr den Eindruck, die Dolmetscherin stocke oder artikuliere unsauber. Auch dabei handelt es sich um ein Muster, das bei den Aufnahmen dieser Dolmet‐ scherin zu sehen war, weshalb es bei der Bearbeitung verstärkt angewandt wurde. Diese sehr kleine Veränderung ist trotz ihrer geringen Dauer sehr wir‐ kungsvoll und lässt die Dolmetscherin zögerlich und unsicher klingen. Diese Pausen wurden alle vor der Validierung eingefügt. Da die Gesamtdauer der Dolmetschung, wie in 4.5.6 erwähnt, bei dem hier angewandten Versuchsaufbau nicht verändert werden konnte, mussten zum Ausgleich der eingefügten Pausen und Unflüssigkeiten auch Pausen entfernt werden. Dafür wurden vorwiegend syntaktische Positionen zwischen Sätzen oder Teilsätzen gewählt, bei denen durch eine Kürzung oder Entfernung der Pause der hilfreiche strukturierende Effekt der syntaktischen Pausen wegfallen könnte oder, wenn dies nicht der Fall wäre, zumindest die Flüssigkeit dadurch unverändert bliebe. Von den 36 entfernten Pausen wurden 34 aus syntaktischen Positionen entfernt. Zwei Pausen wurden aus nicht-syntaktischen Positionen entfernt. Eine war mit 4,5 s sehr lang und musste um 2,37 s gekürzt werden, um die Gesamtdauer zu erhalten, obwohl die längere Dauer zur Unflüssigkeit bei‐ getragen hätte. Bei der anderen nicht-syntaktischen Pause handelte es sich um eine kurze Pause, durch deren Entfernen die betreffende Stelle subjektiv hekti‐ scher wirkte. Auch hier wurde der Großteil der Änderungen vor der Validierung vorgenommen: nach der Validierung wurden nur noch zwei bereits eingefügte und zwei bestehende Pausen gekürzt. Ein Vergleich der Artikulationsraten zeigt, dass die globale Artikulationsrate (siehe 2.2.2.3) in der ersten Minute zwar im Vergleich zur Basisversion D 0 von 4,58 auf 4,44 Silben/ s leicht sinkt, aber dennoch höher ist als bei der flüssigen Version D F (4,26 Silben/ s). Dies ist vermutlich darauf zurückzuführen, dass bei der Erstellung der unflüssigen Version weniger mit langen Pausen gearbeitet wurde, wie dies bei der flüssigen Version der Fall war, sondern stattdessen sehr kurze Pausen, Häsitationen und andere Unflüssigkeiten eingesetzt wurden (siehe folgende Abschnitte). 4.5.7.2 Atmen Wie bei der flüssigen Version spielt auch bei der unflüssigen Version hörbares Atmen eine wichtige Rolle. Allerdings konnten hier weitgehend die in der Ba‐ sisversion D 0 vorhandenen hörbaren Atemzüge beibehalten und teilweise durch den Einsatz von Pausen in ihrer unflüssigen Wirkung verstärkt werden. 102 4 Versuch: Redeflüssigkeit und Dolmetschqualität So wurden nur sechs hörbare Atemzüge hinzugefügt und vier gelöscht. Von den gelöschten befanden sich drei innerhalb gelöschter Pausen und einer wurde durch eine Häsitation ersetzt. Von den eingefügten Atemzügen ist einer ruhig und kurz und wurde in die Mitte eines Wortes in eine bestehende Mikropause (kürzer als 0,1 s) eingefügt, die übrigen fünf sind intensiv und kurz ohne an‐ grenzende Pause. Von diesen fünf intensiven Atemzügen wurde einer ebenfalls in eine Mikropause in einem Wort eingefügt, einer wurde nach einem künstlich erzeugten Fehlstart eingesetzt, um dessen Wirkung zu verstärken, ein dritter befindet sich vor einer eingefügten Lautlängung am Wortanfang, ein weiterer vor einer eingefügten Häsitation, und der letzte wurde an eine nicht-syntakti‐ sche Position gesetzt. Alle Veränderungen wurden vor der Validierung vorge‐ nommen. Insgesamt enthält die fertiggestellte unflüssige Version D U 178 hörbare Atem‐ züge. 145 davon konnten unverändert belassen werden. Bei den bereits in der Basisversion vorhandenen hörbaren Atemzügen, die in der unflüssigen Version beibehalten wurden, handelt es sich vor allem um intensive, kurze Atemzüge. Diese stellen mit 57 mehr als ein Drittel aller beibehaltenen Atemzüge. Außerdem gibt es jeweils 32 ruhige kurze und ruhige lange Atemzüge sowie 24 intensive lange Atemzüge. Alle diese Arten von Atemzügen treten am häu‐ figsten ohne angrenzende Pause auf, gefolgt von Positionen am Anfang und am Ende einer Pause. Atemzüge, die an beiden Seiten an Pausen angrenzen, sind selten. Durch das Hinzufügen oder Entfernen von Pausen konnten einige bereits in D 0 vorhandene Atemzüge verändert werden. So wurden etwa in 10 Fällen an‐ grenzende Pausen entfernt, um kurze Atemzüge zwischen zwei Wörtern zu er‐ halten, die unabhängig von ihrer Intensität einen subjektiven Eindruck von Stress erweckten. Ähnlich wurden auch Atemzüge am Beginn oder Ende einer Pause eingefügt. Insgesamt zeigte sich, dass hörbares Atmen einen sehr großen Einfluss auf die subjektive Flüssigkeit zu haben schien. Bereits eine durch Einfügen oder Entfernen einer Pause leicht veränderte Position eines Atemzugs konnte den subjektiven Eindruck der betreffenden Stelle deutlich verändern. 4.5.7.3 Häsitationen und weitere Unflüssigkeiten Bei der Gestaltung der unflüssigen Version D U spielten Häsitationen eine große Rolle. Die bereits in D 0 vorhandenen Häsitationen wurden allesamt beibehalten und es wurden außerdem 63 zusätzliche Häsitationen eingefügt. Dabei handelte es sich um 26 typische Häsitationen wie „öh“, „ähm“ oder „mmm“ und 37 sehr kurze Laute, die hier als Mikrohäsitationen bezeichnet werden sollen. Bei den 103 4.5 Versuchsmaterial Mikrohäsitationen handelt es sich teils um sehr kurz artikulierte „ä“-, „ö“- oder „m“-Laute, teilweise sind es aber auch gutturale Laute und glottale Klicks, die die Funktion einer Häsitation erfüllen. Die Mikrohäsitationen sind zwischen 0,043 und 0,265 s lang, wobei über 80 % eine Länge von maximal 0,186 s haben. Zwar gibt es im Material auch drei als Häsitationen klassifizierte Laute, die kürzer als die längste Mikrohäsitation sind, diese sind aber trotz ihrer geringen Länge eindeutig als „äh“bzw. „öh“-Laute identifizierbar und wurden daher zu den Häsitationen gezählt. In zwei Fällen wurde ein Schnalzen verwendet, das zwar keine Häsitation oder Mikrohäsitation ist, von der Dolmetscherin aber wiederholt bei Selbstkorrekturen eingesetzt wurde und daher als Marker für ZT-Produktionsprobleme gedeutet und bei der Erstellung der unflüssigen Ver‐ sion auch so eingesetzt wurde. Bei der ursprünglichen Bearbeitung waren nur 16 Mikrohäsitationen einge‐ fügt worden. Da diese sich bei der Validierung und Besprechung im QuaSI-Team aber als sehr wirkungsvoll herausstellten, wurden nach der Validierung noch 21 weitere Mikrohäsitationen hinzugefügt. Von den 26 eingefügten „normalen“ Häsitationen waren 25 vor der Validierung eingefügt worden, es wurde also nur noch an einer Stelle eine Häsitation eingefügt. In der Analysephase waren bereits einige potenzielle Positionen für Häsita‐ tionen identifiziert worden. Bei der eigentlichen Bearbeitung des Materials musste aber für jede Stelle eine Häsitation gefunden werden, die hinsichtlich der Lautstärke, Geschwindigkeit und Tonhöhe zu den umgebenden Lauten passte. Auch die Länge, die eine Häsitation haben konnte, variierte je nach Sprechgeschwindigkeit der Stelle, in die sie eingefügt werden sollte - sehr lange Häsitationen wirkten an Stellen, an denen die umgebenden Worte sehr schnell und mit wenig Pausen artikuliert wurden, unnatürlich. Aufgrund der durch ihre geringere Länge größeren Einsatzmöglichkeiten wurden daher vermehrt Mik‐ rohäsitationen eingesetzt. Diese konnten auch innerhalb sehr kurzer - bereits vorhandener - Pausen zwischen zwei Wortteilen eingefügt werden, um so den Eindruck einer unsauberen Artikulation oder Unsicherheit zu erwecken. Auch in längeren Pausen und an Stellen ohne Pausen wurden Mikrohäsitationen ver‐ wendet. So konnte sehr wirkungsvoll ein subjektiver Eindruck von Hektik oder Unsicherheit erweckt werden, ohne dabei die Dolmetschung so sehr zu verlän‐ gern, wie dies bei den eigentlichen Häsitationen mit ihren bis zu 2 s Länge der Fall gewesen wäre. Da aber in den aufgenommenen Dolmetschungen lange Häsitationen, auch in Kombination mit Pausen, wiederholt auftraten, wurde auf dieses auffällige Merkmal einer unflüssigen Dolmetschung nicht verzichtet, sondern es wurden wie besprochen 26 Häsitationen mit einer Länge von 0,13 bis 2,04 s eingesetzt 104 4 Versuch: Redeflüssigkeit und Dolmetschqualität und auch mit langen Pausen kombiniert, um den Eindruck zu erwecken, die Dolmetscherin zögere stark. 4.5.7.4 Lautlängungen und Fehlstarts Fehlstarts und Lautlängungen sollen in diesem Abschnitt gemeinsam behandelt werden, da sie hinsichtlich der Art, wie sie erstellt und in die unflüssige Version eingefügt wurden, viele Gemeinsamkeiten aufweisen. Beide greifen direkt in die phonetische Gestaltung eines Wortes ein, weshalb es schwieriger als bei anderen Unflüssigkeiten ist, passende Laute zu finden, die an einer bestimmten Stelle eingesetzt werden können, um einen künstlichen Fehlstart bzw. eine Lautlän‐ gung zu erzeugen. Selbst Pausen oder Mikrohäsitationen (siehe 4.5.7.3), die sich mitten in einem Wort befinden, stehen nicht in einer so starken Wechselwirkung mit dem umgebenden Wort, da sie für gewöhnlich in eine bereits vorhandene Mikropause eingesetzt werden können. Die Ausnahme bilden Mikrohäsitati‐ onen, die am Wortende oder -anfang so positioniert sind, dass sie eher einer Lautlängung ähneln. Da Fehlstarts beim Dolmetschen immer wieder vorkommen und auch in den Aufnahmen dieser Dolmetscherin vorhanden waren, und da sie subjektiv als Unflüssigkeitsmerkmal recht auffällig sind, wurde bei der Erstellung der un‐ flüssigen Version D U der Versuch unternommen, künstlich zusätzliche Fehlstarts zu schaffen. Dies war allerdings sehr schwierig, da dafür ein Wortteil doppelt verwendet werden musste, ohne dass beim Zuhören auffiel, dass Betonung, Aussprache und Geschwindigkeit identisch waren. Eine eindeutig zu identifi‐ zierende Dopplung eines Wortteils wäre von der Wirkung her für einen Fehlstart ungeeignet gewesen, daher konnten nur vier Fehlstarts produziert werden. In einem Fall gelang es, einen passenden Wortteil aus einer anderen Dolmetschung zu verwenden, da Lautstärke, Geschwindigkeit und Intonation dieses Wortteils zur betreffenden Stelle passten. So wurde aus „des Konsums“ durch Einfügen einer passenden Silbe sowie einer kurzen Häsitation zur Verstärkung der Wir‐ kung „des koə Konsums“. In den anderen Fällen konnte in den anderen Dolmetschungen keine passende Stelle gefunden werden, und so musste ein Wortteil - eine oder mehrere Silben - verdoppelt werden. In diesen Fällen erwies es sich als hilfreich, diesen ver‐ doppelten Wortteil durch ein dazwischenliegendes Element vom eigentlichen Wort zu trennen, da so die Ähnlichkeit der beiden Wortteile nicht mehr so of‐ fensichtlich war. So wurde einmal ein Schnalzlaut, der von der Dolmetscherin häufiger bei Fehlstarts und Selbstkorrekturen eingesetzt wurde, verwendet („epist- [Schnalzen] epistemologische Wende“), in einem Fall ein kurzes, inten‐ sives Einatmen eingefügt („der Spektak- [Atmen] Spektakularisierung“), und 105 4.5 Versuchsmaterial beim letzten Fehlstart der verdoppelte Wortteil an den Satzbeginn vor einen bereits vorhandenen Atemzug und ein anderes Wort gestellt („Beisp- [Atmen] Ein Beispiel ist auch …“). Dieser letzte Fehlstart ist besonders wirkungsvoll und könnte auch als Selbstkorrektur betrachtet werden, da der Eindruck entstehen könnte, die Dolmetscherin habe den Satz etwa mit „Beispielsweise“ beginnen wollen, dann aber eine Planänderung vorgenommen und den Satz mit „Ein Bei‐ spiel“ begonnen. Bei Lautlängungen ist die räumliche Trennung der Elemente nicht möglich, da ein Laut im Wort selbst verlängert wird. In einigen Fällen kann hier ein Teil des Originallautes verdoppelt werden, etwa ein „i“, um aus „die“ ein zögerlicher wirkendes „diiie“ zu machen, oder das „z“ von „Zukunft“. In der Mehrzahl der Fälle erwies es sich allerdings als leichter, Laute von anderen Stellen zu ver‐ wenden, etwa einen verlängerten „f “-Laut, der sowohl dem Wort „völlig“ als auch „Vergangenheit“ vorangestellt werden konnte, um so einen langgezogenen Anlaut zu schaffen, der zögerlich wirken sollte, oder ein unsicher klingender „mmm“-Laut, durch den die beiden Worte „Konsum muss“ miteinander ver‐ bunden wurden. Insgesamt wurden 11 Lautlängungen am Anfang, Ende oder innerhalb eines Wortes eingefügt. 4.6 Fragebogen Der Fragebogen sollte neben dem Hörverständnis der ProbandInnen auch deren subjektive Einschätzung ihres Verständnisses sowie der Dolmetschung erfassen, um so kognitive Wirkung und subjektive Qualitätseinschätzung vergleichen zu können. Der Fragebogen bestand daher aus zwei Teilen: In Teil A wird mittels halboffener und Multiple Choice-Fragen das Verständnis des Gehörten über‐ prüft, in Teil B werden die subjektive Wahrnehmung des eigenen Verständnisses und verschiedener Charakteristika der Dolmetschung bzw. der Dolmetscherin sowie einige statistische Basisinformationen erhoben. Der Fragebogen basiert auf dem von Reithofer (2014) im QuaSI-Team entwi‐ ckelten Fragebogen, der zum Zeitpunkt der Versuchsdurchführung bereits va‐ lidiert sowie im praktischen Versuch erprobt worden war. Für eine ausführliche Beschreibung der Entwicklung und Validierung des ursprünglichen Fragebo‐ gens sei auf Reithofer (2014: 130-155) verwiesen. Dennoch sollen hier kurz die wichtigsten Grundlagen und Designprinzipien dargestellt werden. 106 4 Versuch: Redeflüssigkeit und Dolmetschqualität 4.6.1 Fragebogendesign Beim Design eines Fragebogens ist darauf zu achten, dass die Gütekriterien für Fragebögen erfüllt werden. Dazu gehören neben Überlegungen zur Auswahl der Items und der Antwortformate auch optische Aspekte (klares und anspre‐ chendes Layout, nicht zu viel Text auf einer Seite), die Reihenfolge und die ein‐ deutige Formulierung der Fragen (vgl. Raab-Steiner & Benesch 2015: 55 f., D. Rost 2005: 125 f.). Beim Fragebogendesign ist auch die Einleitung zu beachten. Die Formulie‐ rung der Einleitung kann einen Einfluss auf die Motivation zur Bearbeitung des Fragebogens haben. (Raab-Steiner & Benesch 2015: 54) Im vorliegenden Fall wurden die wichtigsten mündlich erteilten Instruktionen (siehe 4.7) wiederholt, um die ProbandInnen nochmals daran zu erinnern, dass es nicht um eine Mes‐ sung ihrer Leistung sondern die Verständlichkeit der Dolmetschung ging, und dass sie die Fragen daher nicht mit Hilfe ihres Hintergrundwissens oder durch Raten beantworten, sondern sie im Zweifelsfall unbeantwortet lassen sollten (siehe Anhang). 4.6.1.1 Itemkonstruktion Teil A Fragebogenitems (allgemeinsprachlich meist als „Fragen“ bezeichnet) sind die kleinste Beobachtungseinheit in einem Test. Sie setzen sich aus dem Itemstamm (z. B. eine Frage, eine Aussage, eine Rechenaufgabe) und dem Antwortformat (z. B. anzukreuzende Antwortmöglichkeiten, eine leere Zeile, in die etwas ein‐ getragen werden soll, eine Antwortskala) zusammen. (vgl. J. Rost 1996: 60). Im vorliegenden Fall mussten also einerseits abzufragende Informationen ausge‐ wählt und als Frage (Itemstamm) formuliert werden, andererseits musste für jede Frage ein passendes Antwortformat gewählt werden. Wie bereits erwähnt sollten die Fragen in Teil A nicht aus dem Hintergrund‐ wissen der TeilnehmerInnen sondern ausschließlich aufgrund des gehörten Vortrags beantwortbar sein. Daher wurden sehr konkrete Informationen aus dem Text abgefragt, bei denen davon ausgegangen werden konnte, dass sie den TeilnehmerInnen zuvor nicht bekannt waren und die auch nicht logisch ab‐ leitbar waren (vgl. Reithofer 2014: 134). Bei der Formulierung der Items für den vorliegenden Fragebogen wurde eine Mischung aus halboffenen und Multiple Choice (MC)-Fragen verwendet, die je nach den Informationen, die abgefragt werden sollten, gewählt wurden (vgl. Reithofer 2014: 134-140). Bei Items mit halboffener Beantwortung wird die Formulierung der Ant‐ worten den TeilnehmerInnen überlassen, es gibt aber eine (oder mehrere) ein‐ deutig richtige Antwort(en). Dies kann bei der Auswertung zu Problemen 107 4.6 Fragebogen führen, da bei unklaren Formulierungen nicht immer eindeutig erkennbar ist, ob die Person die richtige Antwort meint. Dem kann bei der Bewertung durch eventuelle Abstufungen bei der Punktevergabe Rechnung getragen werden. (Bortz & Döring 2006: 213). Bortz & Döring (2006: 213) weisen darauf hin, dass UntersuchungsteilnehmerInnen halboffene Items üblicherweise als ange‐ nehmer empfinden als MC-Fragen, vor allem bei Verständnisfragen. Bei Multiple Choice-Fragen sind die Antwortmöglichkeiten vorgegeben und die TeilnehmerInnen müssen die richtige Antwort bzw. die richtigen Antworten auswählen. Bei der Testkonstruktion ist dabei besonders auf die Formulierung der Alternativantworten zu achten. Diese Distraktoren sollten für uninformierte TeilnehmerInnen gleich wahrscheinlich erscheinen wie die richtige Antwort. (vgl. Bortz & Döring 2006: 215) Daher wurden nicht nur die Fragen und richtigen Antworten sondern auch die Distraktoren der Dolmetschung entnommen. Als Beispiel dafür soll Frage 2 dienen: Was wird in der Rede als traditioneller Marketingansatz bezeichnet? • Servicemarketing • Produktmarketing (richtige Antwort) • Industriemarketing • Erfahrungsmarketing Die Grundlage für diese Frage war der folgende Abschnitt aus der Dolmet‐ schung: Einerseits wurden verschiedene Forschungsansätze verfolgt, vom traditionellen An‐ satz des Produktmarketings. Dieses hatte seine Wurzeln im Vereinigten Königreich, im angelsächsischen Raum. Und in den achtziger und neunziger Jahren kamen auch andere Marketingforschungsansätze dazu, zum Beispiel das Servicemarketing, aber auch Industriemarketing und vor kurzem auch das Erfahrungsmarketing. Alle Antwortmöglichkeiten waren also im Text vorgekommen. Für die richtige Beantwortung war zwar etwas mehr als bloß das Wiedererkennen eines ver‐ wendeten Begriffs notwendig, es ist allerdings keine sehr hohe kognitive Leis‐ tung notwendig. So sehen etwa auch Bortz & Döring MC-Fragen als Wiederer‐ kennungsleistung an, die „gegenüber der Reproduktionsleistung bei freiem Antwortformat als qualitativ mindere Fähigkeit anzusehen ist“ (2006: 215), was in diesem Fall aber durchaus gewünscht war. Neben der Auswahl sinnvoller und plausibler Fragen und Antwortmöglich‐ keiten ist es auch wichtig, Fragen möglichst kurz zu halten, nach Möglichkeit keine negativen Formulierungen oder allzu komplexen Sätze zu verwenden, sich bei der Formulierung an die Alltagssprache anzunähern und unbekannte Worte 108 4 Versuch: Redeflüssigkeit und Dolmetschqualität und Begriffe zu vermeiden (D. Rost 2005: 125). Im vorliegenden Fall wurden im Hörverständnistest zwar einige Fachbegriffe verwendet, diese waren aber alle bereits in der Dolmetschung vorgekommen und entstammten dem Fachbereich der ProbandInnen (Marketing). Auch bei gut gewählten Distraktoren haben MC-Items den Nachteil, dass die richtige Antwort erraten werden kann. Dem kann durch eine größere Anzahl von Antwortmöglichkeiten entgegenwirkt werden (so ist bei der obigen Frage, bei der nur eine Antwortmöglichkeit richtig ist, die Wahrscheinlichkeit, die richtige Antwort zu erraten, 25 %, während bei einer Ja/ Nein-Frage die Wahr‐ scheinlichkeit 50 % beträgt). Auch bei MC-Fragen mit Mehrfachantworten ist die Lösung schwerer zu erraten, vor allem wenn die genaue Anzahl der richtigen Lösungen nicht in der Aufgabenstellung angegeben wird. Letztlich kann auch bei der Auswertung eine Ratekorrektur vorgenommen werden (siehe dazu 4.6.4). Um das Raten (auch bei den halboffenen Fragen) zu minimieren, wurden die ProbandInnen sowohl mündlich vor Beginn des Versuchs als auch in den schrift‐ lichen Instruktionen auf dem Fragebogen darauf hingewiesen, dass es nicht um die Bewertung ihrer Leistung ging, und gebeten, nicht zu raten, sondern im Zweifelsfall die Frage unbeantwortet zu lassen. 4.6.1.2 Itemkonstruktion Teil B Für Teil B des Fragebogens wurde eine Mischung aus Ratingskalen (sog. Li‐ kert-Skalen), offenen Fragen und Items mit dichotomen Antwortmöglichkeiten (ja/ nein, weiblich/ männlich) gewählt. Die offenen Fragen wurden einerseits wie die dichotomen zur Erhebung von Hintergrundvariablen verwendet (Alter, Mut‐ tersprache), andererseits aber auch in Form eines Feldes für freie Anmerkungen als Ergänzung zu den Ratingskalen. Die Ratingskalen wurden neben der Erfassung der Hintergrundvariable „Be‐ kanntheit des Themas“ für die subjektive Einschätzung verschiedener Para‐ meter verwendet (Flüssigkeit, Intonation, Richtigkeit der Dolmetschung sowie Verständnis der Dolmetschung). Ratingskalen sind ein mehrkategorielles Antwortformat, das mehr als zwei Abstufungen hat, die für die Befragten eine Rangordnung darstellen. Die Be‐ nennung der Kategorien ist itemunspezifisch, gilt also für mehrere oder alle Items eines Fragebogens. (vgl. Rost 1996: 66) Durch die Abstufungen lassen sich mit Ratingskalen differenziertere Urteile ausdrücken als mit dichotomen Ant‐ wortmöglichkeiten. Beim Erstellen einer Ratingskala muss entschieden werden, wie groß die An‐ zahl der Abstufungen sein soll und ob diese gerade oder ungerade sein soll. Mit einer geradzahligen Skala werden die ProbandInnen dazu gezwungen, ein ten‐ 109 4.6 Fragebogen denzielles Urteil abzugeben, was vor allem dann sinnvoll ist, wenn zu erwarten ist, dass übermäßig viele TeilnehmerInnen die neutrale Mitte wählen. Da dies beim vorliegenden Versuch nicht zu erwarten war (vgl. Bortz & Döring 2006: 184) und den ProbandInnen die Möglichkeit zu einer neutralen Antwort geboten werden sollte, wurde eine ungeradzahlige Skala verwendet. (vgl. Bortz & Döring 2006: 180, J. Rost 1996: 68 f.) Es wurden 7 Stufen gewählt, da nach gängiger Lehrmeinung mehr als 7 Stufen ProbandInnen überfordern können (Raab-Steiner & Benesch 2015: 60). Die Stufen waren nummeriert und die Skalen wurden an beiden Enden verbal verankert (z. B. 1 = sehr gut, 7 = sehr schlecht oder 1 = sehr flüssig, 7 = sehr unflüssig). Wie bereits in 4.6.1.1 erwähnt sollte bei der Formulierung von Items auf Klar‐ heit geachtet werden. Dies ist auch notwendig, um sicherzustellen, dass sie von allen - ForscherInnen und ProbandInnen - gleich verstanden werden, denn nur so kann gewährleistet werden, dass die Antwort relevant ist. (Foddy 1993: 17). Es war also wichtig, klar zu definieren, was mit „Redeflüssigkeit“ gemeint war, um zumindest weitgehend ausschließen zu können, dass die ProbandInnen stattdessen eine der vielen verschiedenen alltagssprachlichen Definitionen (vgl. 2.2.1) anwandten. Daher wurde in die Frage eine kurze Definition eingefügt: 14) Wie beurteilen Sie die Redeflüssigkeit der Dolmetschung (Pausen, Zögern)? Aus diesem Grund wurde in Frage 13 auch nicht nach einer Einschätzung der Qualität der Dolmetschung gefragt, sondern konkret eingegrenzt: 13) Wie gut hat die Dolmetscherin Ihrer Meinung nach den Inhalt des Vortrags wie‐ dergegeben? Bei der Frage nach der Intonation (15) konnte auf den allgemeinsprachlichen Begriff „Sprechmelodie“ zurückgegriffen werden, was zusätzlich durch die Ver‐ ankerung der Skala mit den Bezeichnungen „sehr lebendig gesprochen“ und „gar nicht lebendig gesprochen“ unterstützt wurde. Bei Ratingskalen stellt sich die Frage nach dem Skalenniveau. Während manche ForscherInnen durchaus der Meinung sind, dass durch ausreichend de‐ taillierte Instruktionen sichergestellt werden kann, dass die Antworten inter‐ vallskaliert sind, d. h. „gleiche Zahlendifferenzen auch gleiche Merkmalsunter‐ schiede repräsentieren“ (Bortz & Döring 2006: 181), besteht immer noch Uneinigkeit darüber, ob es sich wirklich um intervallskalierte Daten handelt. (vgl. Bortz & Döring 2006: 181) Da es sich bei den Beurteilungen, die im vorliegenden Fragebogen abgefragt wurden, um eher unübliche Fragen handelte, die teilweise sogar definiert werden mussten, um die Wahrscheinlichkeit zu erhöhen, dass sie von allen Pro‐ 110 4 Versuch: Redeflüssigkeit und Dolmetschqualität bandInnen gleich verstanden würden, war hier nicht davon auszugehen, dass die TeilnehmerInnen die Eigenschaften der Dolmetschung intervallskaliert be‐ urteilen würden. Aus diesem Grund wurden die Skalen bei der Auswertung als Ordinalskalen behandelt und mit nichtparametrischen Verfahren ausgewertet. 4.6.2 Teil A Der Hörverständnistest bestand aus 11 Items: 8 Multiple Choice-Fragen und 3 halboffenen Items. Bei allen drei halboffenen Items handelt es sich um Fragen mit Reihenantworten (eine Frage und mehrere Antworten) (Bortz & Döring 2006: 214 f.). Alle drei bezogen sich auf konkrete Beispiele aus der Rede und in der Fragestellung wurde die Anzahl der korrekten Antworten angegeben: 6) Nennen Sie die drei in der Rede genannten konkreten Beispiele für KonsumentInnen mit einer fragmentierten Identität. 7) Nennen Sie die drei in der Rede genannten Beispiele für Produktmarketing, das sich auf Spektakularisierung und Konsumerfahrungen konzentriert. 9) Nennen Sie die drei Marken, die in der Rede in Zusammenhang mit Retromarketing erwähnt wurden. Bei zwei der Multiple Choice-Fragen waren Mehrfachantworten möglich, die übrigen sechs hatten jeweils nur eine korrekte Antwortmöglichkeit. Diese Fragen finden sich im Anhang. Da für den vorliegenden Versuch derselbe Ausgangstext als Grundlage ver‐ wendet wurde wie von Reithofer (2014), konnten die Items und Fragetypen von dort übernommen werden. Allerdings stammte die als eigentliches Versuchs‐ material verwendete Dolmetschung von einer anderen Dolmetscherin und war daher teilweise anders formuliert. Daher wurden die Formulierungen der Fragen und Antwortmöglichkeiten (einschließlich Distraktoren) an das Versuchsmate‐ rial angepasst. Insgesamt waren jedoch nur geringe Anpassungen notwendig. 4.6.2.1 Itemschwierigkeit Unter der Itemschwierigkeit versteht man die Lösungsrate eines Items. Sie wird als Schwierigkeitsindex pi angegeben, der anzeigt, welcher Anteil der Teilneh‐ merInnen eine Frage richtig beantwortet hat. So gibt ein Schwierigkeitsindex von 0,5 an, dass die Hälfte der TeilnehmerInnen die Aufgabe gelöst hat, während bei einem Schwierigkeitsindex von 0,1 nur 10 % die Frage richtig beantwortet haben (hohe Itemschwierigkeit). Eine hohe Itemschwierigkeit bezeichnet also Items, die nur von wenigen ProbandInnen richtig beantwortet werden, während Items mit einer sehr niedrigen Schwierigkeit von fast allen richtig beantwortet 111 4.6 Fragebogen werden. Beide Extreme sind nur schlecht dazu geeignet, Unterschiede zwischen ProbandInnen bzw. Versuchsgruppen sichtbar zu machen. Daher werden meist Itemschwierigkeiten zwischen 0,2 und 0,8 bevorzugt. Vor der Auswertung der Ergebnisse des Hörverständnistests wurde die Item‐ schwierigkeit berechnet. Dabei zeigte sich, dass bis auf Frage 10 alle im mittleren Schwierigkeitsbereich lagen (0,2-0,8), wobei Frage 3 die schwierigste und Frage 10 die leichteste war (siehe Tabelle 1). Das Ergebnis unterscheidet sich etwas von dem von Reithofer (2014: 140 ff.), ist in der Tendenz allerdings ähnlich. Item Schwierigkeitsindex 1 0,54 2 0,77 3 0,26 (schwierigstes) 4 0,47 5 0,60 6 0,61 7 0,52 8 0,77 9 0,60 10 0,85 (leichtestes) 11 0,69 Tabelle 1: Schwierigkeit der Items des Hörverständnistests 4.6.2.2 Trennschärfe der Items Neben der Itemschwierigkeit wird auch deren Trennschärfe berechnet. Diese gibt an, wie gut ein Item dazu geeignet ist, TeilnehmerInnen mit guten und schlechten Gesamtergebnissen voneinander zu trennen. Ein hoher positiver Trennschärfekoeffizient besagt, dass Personen mit einem guten Gesamtscore bei diesem Item ebenfalls ein gutes Ergebnis haben, während Personen mit einem niedrigen Gesamtergebnis bei einem Item mit hoher Trennschärfe ein schlechtes Ergebnis haben. (Bortz & Döring 2006: 219 f.) Der Wertebereich des Trennschärfekoeffizienten ist -1 bis +1, wobei positive Werte über 0,5 als hoch gelten, solche zwischen 0,3 und 0,5 als mittelmäßig. 112 4 Versuch: Redeflüssigkeit und Dolmetschqualität Die Trennschärfen, die sich bei diesem Versuch ergaben, unterscheiden sich erheblich von den von Reithofer (2014) in den Pretests und Versuchen errech‐ neten. Dies ist ein äußerst unerwartetes Ergebnis, da Trennschärfen von Items allgemein keine allzu großen interpersonellen Unterschiede aufweisen sollten. Der Fragebogen von Reithofer (2014) war gerade aufgrund der guten Trenn‐ schärfewerte übernommen worden. Da die Trennschärfe immer erst nach Vor‐ liegen der Ergebnisse berechnet werden kann - weshalb ihre Berechnung in Pretests wichtig ist -, war es im vorliegenden Fall nicht mehr möglich, den Fragebogen zu ändern, daher wurde nur, wie nachstehend beschrieben, Frage 11 ausgeschlossen. Item Trennschärfe 1 0,135 2 0,243 3 0,246 4 0,181 5 0,142 6 0,301 7 0,212 8 0,356 9 0,102 10 0,164 11 -0,123 Tabelle 2: Trennschärfe der Items des Hörverständnistests (korrigierter Trennschärfe‐ koeffizient) Die Berechnung der Trennschärfe (siehe Tabelle 2) zeigte, dass die meisten Items eine eher niedrige Trennschärfe (+0,1 bis < 0,3) aufwiesen, nur bei zwei lag die Trennschärfe über 0,3. Interessanterweise lagen die laut Itemschwierigkeit leichteste und schwierigste Frage beide im niedrigen Bereich. Alle positiven Werte wurden dennoch in die Auswertung einbezogen. Frage 11 wies allerdings eine Trennschärfe im negativen Bereich auf, was bedeutet, dass ProbandInnen mit geringerer Gesamtpunkteanzahl diese Frage tendenziell besser beantworteten als ProbandInnen mit einem hohen Gesamt‐ 113 4.6 Fragebogen ergebnis. Sie wurde daher von der Auswertung ausgeschlossen. (vgl. Lienert & Raatz 1994: 78) 4.6.3 Teil B Bei den ersten vier Fragen in Teil B handelte es sich um die bereits in 4.6.1.2 angesprochenen subjektiven Bewertungen des eigenen Verständnisses, der Richtigkeit der Dolmetschung sowie der Redeflüssigkeit und Intonation der Dolmetscherin. Dazu wurde eine Ratingskala mit Stufen von 1 bis 7 verwendet, die an beiden Extremen verbal verankert war (z. B. „1 = sehr gut, 7 = sehr schlecht“). Die Reihenfolge der Fragen wurde bewusst so gewählt, dass die Frage nach dem Verständnis an erster Stelle stand, gefolgt von der Leistung der Dolmet‐ scherin, da diese Fragen - wie in einer realen Dolmetschsituation, in der ein Urteil über die Dolmetschung oft „aus dem Bauch heraus“ gefällt wird - mög‐ lichst spontan beantwortet werden sollten. Bei einer anderen Reihenfolge hätte das Nachdenken über die Redeflüssigkeit und Intonation womöglich das Urteil beeinflussen können. Bei der Bewertung der Flüssigkeit und der Intonation ist ein sogenannter Haloeffekt nicht auszuschließen. Dabei handelt es sich um die Tendenz, bei der Bewertung mehrerer Merkmale eines Gegenstands nicht ausreichend zu diffe‐ renzieren bzw. von einem Globalurteil auszugehen. Dies ist nach Bortz & Döring (2006: 183) vor allem dann verstärkt der Fall, „wenn das einzuschätzende Merkmal ungewöhnlich, nur schwer zu beobachten oder schlecht definiert ist“. Dies wurde bei der Auswertung berücksichtigt. Mit den übrigen Fragen wurden Hintergrundinformationen erhoben (bishe‐ rige Erfahrung mit Simultandolmetschungen, Bekanntheit des Themas „Mar‐ keting und Postmoderne“, Geschlecht, Alter und Muttersprache). Am Ende war ein völlig freies Feld für „Weitere Anmerkungen“, das allerdings nur von einer Person genutzt wurde. 4.6.3.1 Itemschwierigkeit Der Begriff der Itemschwierigkeit wird auch auf Items angewandt, die keine Leistungsaufgabe darstellen, bei denen es also für die TeilnehmerInnen eigent‐ lich nicht schwierig ist, ein gutes Ergebnis (in diesem Fall z. B. eine gute Bewer‐ tung der Flüssigkeit) zu produzieren. Bei Ratingaufgaben und anderen subjek‐ tiven Fragen bezieht sich der Begriff vielmehr darauf, welcher Anteil der TeilnehmerInnen sie positiv beantworten wird. Eine sehr hohe oder sehr nied‐ rige Itemschwierigkeit bei einer Ratingfrage würde bedeuten, dass die Frage 114 4 Versuch: Redeflüssigkeit und Dolmetschqualität kaum dazu dient, Personenunterschiede sichtbar zu machen. (Bortz & Döring 2006: 219, Lienert & Raatz 1994: 73, J. Rost 1996: 95) Die Analyse der Ratingfragen 12-15 zeigte, dass sie alle im mittleren Schwie‐ rigkeitsbereich liegen, wobei Frage 13 (Wiedergabe des Inhalts) die „schwie‐ rigste“ ist, es bei ihr also die größten Unterschiede gab (siehe Tabelle 3). Item Schwierigkeitsindex 12 0,40 13 0,61 (schwierigstes) 14 0,42 15 0,32 Tabelle 3: Itemschwierigkeit der Ratingitems 4.6.4 Scoring und Kodierung Unter der Kodierung von Antworten versteht man die Verschlüsselung der Itemantworten in Zahlen, die in der Folge analysiert werden können. Dafür wird ein sogenanntes Codebuch angelegt, das jeder Merkmalsausprägung eine Zahl zuweist (vgl. Raab-Steiner & Benesch 2015: 70, J. Rost 1996: 83 ff.). Dieses Ko‐ dierungsschema wurde im QuaSI-Forschungsteam gemeinsam für alle QuaSI-Experimente, die den gleichen Ausgangstext verwendeten, beschlossen. Die Erstellung des Codebuchs für Teil B des Fragebogens war recht einfach: Dichotome Items („ja/ nein“ (16) bzw. „weiblich/ männlich“ (18)) wurden mit 1 und 2 kodiert (vgl. Raab-Steiner & Benesch 2015: 75), die offene Frage nach der Muttersprache wurde ebenfalls in ein dichotomes Item umkodiert, sodass 1 „Deutsch“ und 2 „andere“ war. Auch die Gruppenzugehörigkeit (flüssig/ unflüssig) und der Tag des Versuchs (Dienstag/ Donnerstag) wurden dichotom mit 1 und 2 kodiert. Bei den Fragen nach konkreten Zahlen (Alter (19) bzw. Anzahl der zuvor gehörten Dolmetschungen (16a)) wurden diese eingegeben und bei den subjektiven Beurteilungen (Items 12-15) wurden die Punkte auf der Ordinalskala eingegeben (d. h. 1-7). Um den Hörverständnistest (Teil A) kodieren zu können, war es zuerst not‐ wendig, zu bestimmen, welchen Score (also wie viele Punkte) man für die ein‐ zelnen Items erhalten sollte. Auch diese Wertigkeit wurde gemeinsam im QuaSI-Team beschlossen. (vgl. Reithofer 2014: 155 ff.) Um der unterschiedlichen Schwierigkeit bei der Beantwortung unterschied‐ licher Fragetypen Genüge zu tun, wurden diese unterschiedlich gewichtet: 115 4.6 Fragebogen Für einfache Multiple Choice-Items (Fragen 2, 3, 4, 5, 8 und 10) wurde bei richtiger Antwort ein Item-Score von 1 vergeben. Die halboffenen Mul‐ tiple-Choice-Items mit Mehrfachantworten (1, 11) erhielten einen Item-Score von maximal 2 und die halboffenen Items (6, 7, 9), die aufgrund der größeren Erinnerungsleistung als schwieriger eingeschätzt wurden, maximal 3. Insgesamt konnte ein Gesamtscore von 19 erreicht werden, durch Ausschluss von Item 11 aus der Auswertung (siehe 4.6.2.2) verringerte sich der maximale Gesamtscore im vorliegenden Versuch auf 17. Obwohl die ProbandInnen dazu angehalten worden waren, nicht zu raten sondern im Zweifelsfall Fragen unbeantwortet zu lassen, wurde eine Ratekor‐ rektur vorgenommen. Bei den einfachen MC-Fragen mit nur einer Antwort‐ möglichkeit wurden sowohl für fehlende als auch für falsche Antworten 0 Punkte vergeben. Vor allem bei Wissenstests kann es sinnvoll sein, für falsche Antworten Minuspunkte zu vergeben, hier wurde aber sowohl eine falsche Antwort als auch die Nichtbeantwortung der Frage als Anzeichen für Nicht‐ verstehen der Dolmetschung gedeutet. (vgl. Bortz & Döring 2016: 216 f., Reit‐ hofer 2014: 155 ff.) Bei den Multiple Choice-Fragen mit mehreren Antwortmöglichkeiten (1, 11) wurde bei der Kodierung der Antworten genau darauf geachtet, wie viele rich‐ tige und wie viele falsche Antwortmöglichkeiten angekreuzt worden waren. Da es bei beiden Fragen sieben Antwortmöglichkeiten gab, wurden für eine voll‐ ständig beantwortete Frage (2 richtige Antworten bei Frage 1, 3 richtige Ant‐ worten bei Frage 11, die allerdings letztlich aufgrund der negativen Trenn‐ schärfe (siehe 4.6.2.2) aus der Auswertung ausgeschlossen wurde) 7 Punkte vergeben, für jede falsche Antwort wurde aber ein Punkt abgezogen. So waren bei Frage 1 sowohl zwei richtige und eine falsche Antwort als auch eine richtige und keine falsche Antwort 6 Punkte wert. Diese Punkte wurden dann wie in Tabelle 4 gezeigt in den Score für die jeweilige Frage umgerechnet. (vgl. Reit‐ hofer 2014: 156) 116 4 Versuch: Redeflüssigkeit und Dolmetschqualität Antworten Codierung Punkte Score 2 R 7 Punkte 2 2 R, 1 F 6 Punkte 1,71 2 R, 2 F 5 Punkte 1,43 2 R, 3 F 4 Punkte 1,14 1 R 6 Punkte 1,71 1 R, 1 F 5 Punkte 1,43 1 R, 2 F 4 Punkte 1,14 1 R, 3 F 3 Punkte 0,86 Tabelle 4: Scoring Frage 1 (R = richtig, F = falsch angekreuzte Antwortoption) Bei den halboffenen Fragen (6, 7, 9) wurde ähnlich vorgegangen, wobei hier die Antworten zunächst Kategorien zugeordnet werden mussten („Signierung“), um eine Antwortvariable zu erhalten. Damit wird jeder Itemantwort genau ein Wert zugeordnet. ( J. Rost 1996: 83 f., Raab-Steiner & Benesch 2015: 57) Das Ziel ist die Signierobjektivität, d. h. zwei Personen, die die Items unabhängig vonei‐ nander auswerten, sollten die Antworten denselben Kategorien zuordnen. ( J. Rost 1996: 84 f.) Da es sich um halboffene Items handelte und die richtigen Ant‐ worten somit feststanden, war die Signierung in den meisten Fällen unproble‐ matisch. Einige Zweifelsfälle wurden aber im QuaSI-Team besprochen. In einigen Fällen wurden auch halbe Punkte vergeben, z. B. wenn bei Frage 6, wo berufstätige Frauen mit Familie als Beispiel für KonsumentInnen mit einer fragmentierten Identität genannt werden sollten, nur „Hausfrau“ oder bei der Antwort „VW Beetle“ nur „VW“ angegeben wurde („Beetle“ hingegen galt als richtige Antwort und erhielt einen Punkt). Das Schema für die Scoreverteilung dafür ist in Tabelle 5 zu sehen. 117 4.6 Fragebogen Antworten / Codierung Punkte Score 3R 6 Punkte 3 2,5 R 5,5 Punkte 2,75 2 R 5 Punkte 2,5 2,5 R, 1 F 4,5 Punkte 2,25 2 R, 1F 4 Punkte 2 1,5 R 4,5 Punkte 2,25 1 R 4 Punkte 2 1,5 R, 1F 3,5 Punkte 1,75 1 R, 1 F 3 Punkte 1,5 1 R, 2F 2 Punkte 1 0,5 R 2 Punkte 1 0,5 R, 1 F 1 Punkt 0,5 Tabelle 5: Scoring Fragen 6, 7, 9 (R = richtig, F = falsch eingetragene Antwort) Für ausschließlich falsche Antworten gab es bei allen Fragen unabhängig von der Anzahl der falschen Antworten einen Score von 0. Die so kodierten Antworten konnten anschließend in IBM SPSS Statistics 23 eingegeben und ausgewertet werden. 4.7 Setting und Versuchsablauf Der Versuch wurde im Rahmen zweier Parallelübungen einer Lehrveranstaltung zum Thema internationales Marketing an der Wirtschaftsuniversität Wien ab‐ gehalten und den Studierenden als Gastvortrag präsentiert. Die Situation wurde so realistisch wie möglich gestaltet. Die Versuchspersonen waren zuvor nicht darüber informiert worden. Vor Beginn des Versuchs erfuhren sie, dass es sich um einen Versuch handelte, erhielten aber keine näheren Informationen zur Art des Versuchs und wussten nicht, dass sie bearbeitete Dolmetschungen hören würden (siehe Abschnitt 4.5). Das Experiment wurde in den gleichen Räumen abgehalten, in denen die Lehrveranstaltung auch sonst stattfand, weshalb an den zwei Terminen jeweils 118 4 Versuch: Redeflüssigkeit und Dolmetschqualität ein anderer Raum verwendet wurde. In beiden Fällen handelte es sich um Se‐ minarräume an der Wirtschaftsuniversität Wien mit einer Kapazität von ca. 40 Plätzen. Das Video (siehe 4.4) wurde mit einem Projektor großformatig an die Wand projiziert. Die beiden Versionen des Versuchstextes (flüssig und unflüssig, siehe 4.5) wurden über eine mobile Dolmetschanlage direkt in verschiedene Ka‐ näle eingespeist. Um die Situation so realistisch wie möglich zu gestalten, waren außerdem zwei mobile Dolmetschkabinen im jeweiligen Seminarraum aufge‐ stellt worden, in denen je eine Dolmetscherin eine der beiden Dolmetschungen mitsprach („Lipsyncing“). Somit wurde den ProbandInnen bereits beim Betreten des Raumes und in weiterer Folge im Laufe des Experiments der Eindruck ver‐ mittelt, sie hörten tatsächlich eine Live-Dolmetschung. Beide Versuche wurden in der vierten Semesterwoche durchgeführt. Eine fand am Dienstag um 8: 00 Uhr statt, die andere am Donnerstag um 14: 00 Uhr. Um mögliche Störfaktoren durch die unterschiedliche Uhrzeit (und somit den möglicherweise unterschiedlichen Aufmerksamkeitsgrad der Versuchsper‐ sonen) möglichst zu minimieren, wurde bei der Einteilung der Versuchsgruppen auf ein ähnliches Verteilungsverhältnis auf A und B in beiden Lehrveranstal‐ tungen geachtet. In Gruppe A (flüssig) stammten 14 Teilnehmerinnen aus Lehr‐ veranstaltung 1 und 10 aus Lehrveranstaltung 2, während in Gruppe B (un‐ flüssig) 13 Personen aus Lehrveranstaltung 1 und 10 Personen aus Lehrveranstaltung 2 waren (vgl. Tabelle 6). Die Auswahl der Versuchspersonen wird in Abschnitt 4.3 beschrieben. Bei der Auswertung der Ergebnisse zeigte sich, dass die Tageszeit keine er‐ heblichen Auswirkungen auf die Leistung gehabt haben dürfte (vgl. 5.2.4). Di 8h Do 14h Gruppe A (flüssig) 14 10 Gruppe B (unflüssig) 13 10 Tabelle 6: Verteilung der Versuchsgruppen auf die zwei Durchführungstermine Der Ablauf des Versuchs war an beiden Tagen gleich: die Studierenden wurden beim Betreten des Raumes darüber informiert, dass im Rahmen ihrer wöchent‐ lichen Lehrveranstaltung diesmal ein Gastvortrag mit Simultandolmetschung stattfinden würde. Jede Versuchsperson erhielt ein Paar Kopfhörer mit Infra‐ rotempfänger und einen Fragebogen (dessen Erstellung und Kodierung in 4.6 beschrieben wird), auf dessen erster Seite der Gruppencode (1 für die flüssige bzw. 3 für die unflüssige Dolmetschung) sowie folgender Text standen: „Bitte öffnen Sie diesen Fragebogen erst, wenn Sie die Versuchsleiterin dazu auffordert. 119 4.7 Setting und Versuchsablauf Das frühzeitige Durchlesen des Fragebogens könnte die Studie verfälschen. Herzlichen Dank! ” Danach wurde der erste Teil der Instruktionen verlesen, die eine kurze Ein‐ führung in den Versuch sowie die Anweisungen zur Einstellung des richtigen Kanals (der Gruppe entsprechend 1 oder 3) enthielten. (siehe Anhang) Anschließend wurden das Video (siehe 4.4) und die beiden Tonspuren (flüs‐ sige und unflüssige manipulierte Dolmetschung, siehe 4.5) von einem professi‐ onellen Tontechniker, der die Dolmetschanlage betreute, abgespielt, während die beiden Dolmetscherinnen in ihren jeweiligen Kabinen je eine Version mit‐ sprachen. Nach Ende des Videos wurde der zweite Teil der Instruktionen verlesen, in denen auf die Anonymität des Fragebogens sowie darauf hingewiesen wurde, dass es sich um keinen Wissenstest handelte und die Ergebnisse keinerlei Aus‐ wirkungen auf die Note in der Lehrveranstaltung haben würden, die Teilneh‐ merInnen die Fragen also nicht aufgrund von etwaigem Hintergrundwissen sondern nur auf Basis dessen, was sie in der Rede gehört hatten, beantworten sollten. Die ausgefüllten Fragebögen wurden anschließend eingesammelt und nach dem in 4.6.4 beschriebenen Schema ausgewertet. Die Ergebnisse des Versuchs werden in Kapitel 5 im Detail beschrieben. 120 4 Versuch: Redeflüssigkeit und Dolmetschqualität 5 Ergebnisse Nach Durchführung beider Versuchsteile wurden die Fragebögen gesichtet, die ungültigen (unvollständig bzw. gar nicht ausgefüllten Fragebögen) ausge‐ schlossen und die Antworten kodiert (vgl. 4.6.4). Die kodierten Antworten wurden mit dem Statistikprogramm IBM SPSS Statistics 23 ausgewertet. Ziel der vorliegenden Studie war einerseits, den möglichen Einfluss der Re‐ deflüssigkeit der Dolmetschung auf deren tatsächliche Verständlichkeit zu ana‐ lysieren (messbare Qualität im Sinne der kognitiven Wirkung), andererseits aber auch festzustellen, ob die Redeflüssigkeit einen Einfluss darauf hat, wie Pro‐ bandInnen die Leistung der Dolmetscherin (von den NutzerInnen subjektiv empfundene Qualität) sowie ihr eigenes Verständnis der Dolmetschung ein‐ schätzen (für eine vollständige Auflistung der Forschungsfragen siehe 4.1). Der Einfluss auf die tatsächliche kognitive Wirkung wurde mit dem Gesamt‐ score des Hörverständnistests (Teil A des Fragebogens) gemessen. Bei den Er‐ gebnissen des Hörverständnistests handelt es sich um eine Intervallskala, wes‐ halb bei der Auswertung die statistischen Methoden des t-Tests und der Korrelation nach Pearson zur Anwendung kommen. Diese Methoden verglei‐ chen Mittelwerte, was nur bei einem metrischen Datenniveau zulässig ist. Bei den subjektiven Bewertungsfragen in Teil B des Fragebogens (Fragen 12- 15) wurde eine 7-stellige Skala angewandt. Hierbei handelt es sich um eine Or‐ dinalskala, da es sich um subjektive Einschätzungen handelt und nicht davon ausgegangen werden kann, dass der Abstand zwischen einer Bewertung mit 1 und mit 2 gleich ist wie der Abstand zwischen 3 und 4 (wie dies bei Intervalls‐ kalen der Fall ist). Daher sind nur Median-Vergleiche und Rangsummenver‐ gleiche zulässig und es kommen die für ein ordinales Datenniveau geeigneten Methoden des Mann-Whitney-U-Tests und der Korrelation nach Spearman zum Einsatz. In diesem Kapitel werden zunächst in 5.1 die Versuchspersonen beschrieben. Danach werden in 5.2 die Ergebnisse des Hörverständnistests nach Gruppen ausgewertet und der Einfluss verschiedener Variablen auf das Ergebnis unter‐ sucht. In 5.3 schließlich werden die Ergebnisse der subjektiven Bewertungs‐ fragen (Fragen 12-15) einzeln beschrieben und zueinander sowie zum Ergebnis des Hörverständnistests in Bezug gesetzt. Eine ausführliche Diskussion der Er‐ gebnisse erfolgt in Kapitel 6. 5.1 Versuchspersonen Von den 47 Versuchspersonen, die gültige Fragebögen abgaben, waren 18 weib‐ lich und 28 männlich, eine Person machte keine Angabe. Das Ungleichgewicht bei den Geschlechtern ist auf die Studierendenstruktur im betreffenden Lehr‐ gang zurückzuführen. Das Alter der ProbandInnen lag zwischen 20 und 30 Jahren, wobei der Mit‐ telwert bei 23,43 und der Median bei 23 Jahren lag. Das Durchschnittsalter der Frauen lag bei 23 und der Median bei 22, bei den männlichen Teilnehmern war das Durchschnittsalter 23,61 und der Median 23 (siehe Tabelle 7). Dieser Unter‐ schied ist nicht signifikant (t = -0,918, df = 44, p = 0,363 > 0,05). weiblich männlich Gesamt n 18 28 47 Mittelwert 23 23,61 23,43 Median 22 23 23 Standardabweichung 2,301 2,114 2,194 Minimum 21 20 20 Maximum 28 30 30 Tabelle 7: Alter der Versuchspersonen nach Geschlecht Hinsichtlich der Altersverteilung sind die beiden Versuchsgruppen A (flüssig) und B (unflüssig) homogen: In Gruppe A (n = 24) lag das Durchschnittsalter bei 23,17, in Gruppe B (n = 23) bei 23,7, der Median betrug in beiden Gruppen 23 Jahre (siehe Tabelle 8). Ein t-Test zeigt, dass dieser Unterschied nicht signifikant ist (t = -0,823, df = 45, p = 0,415 > 0,05). 122 5 Ergebnisse Gruppe A (flüssig) Gruppe B (unflüssig) n 24 23 Mittelwert 23,17 23,70 Median 23 23 Standardabweichung 2,014 2,382 Minimum 20 20 Maximum 27 30 Tabelle 8: Alter der Versuchspersonen nach Versuchsgruppe Auch bei der Geschlechtsverteilung unterscheiden sich die Versuchsgruppen nicht signifikant voneinander. In Versuchsgruppe A (n = 24) waren 8 Frauen, 15 Männer und eine Person ohne Angabe, während in Versuchsgruppe B (n = 23) 10 Versuchspersonen weiblich und 13 Versuchspersonen männlich waren (siehe Tabelle 9). Ein Chi 2 -Test zeigt, dass dieser Unterschied nicht signifikant ist (siehe Tabelle 10). Gruppe A (flüssig) Gruppe B (unflüssig) n 24 23 weiblich 8 10 männlich 15 13 keine Angabe 1 - Tabelle 9: Geschlechterverteilung nach Versuchsgruppe Wert Freiheitsgrade (df) Asymptotische Sig. (2-seitig) Chi-Quadrat nach Pearson 0,365 a 1 0,546 a. 0 Zellen (0,0 %) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 9,00. Tabelle 10: Chi-Quadrat-Test für die Geschlechterverteilung nach Versuchsgruppe 123 5.1 Versuchspersonen 36 Personen (76,6 %) gaben Deutsch als Muttersprache bzw. am besten be‐ herrschte Sprache an, 11 (23,4 %) Personen eine andere Sprache als Deutsch (siehe Tabelle 11). Dank der Parallelisierung war die Verteilung in beiden Gruppen ähnlich, da aber einige Personen am Versuchstag nicht erschienen bzw. aufgrund ungültiger Fragebögen ausgeschlossen werden mussten, ergab sich ein geringer Unterschied: in Versuchsgruppe A hatten 79,2 Prozent Deutsch und 20,8 Prozent eine andere Sprache als stärkste Sprache, in Versuchsgruppe B hingegen gaben 74 Prozent Deutsch und 26 Prozent eine andere Sprache als Muttersprache an. Ein Chi 2 -Test zeigt, dass dieser Unterschied nicht signifikant ist (siehe Tabelle 12). Muttersprache Deutsch Andere Muttersprache Gruppe A (flüssig) 19 5 Gruppe B (un‐ flüssig) 17 6 Gesamt 36 11 Tabelle 11: Muttersprachen nach Versuchsgruppe Wert Freiheitsgrade (df) Asymptotische Sig. (2-seitig) Chi-Quadrat nach Pearson 0,181 a 1 0,671 a. 0 Zellen (0,0 %) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 5,38. Tabelle 12: Chi-Quadrat-Test für die Verteilung der Muttersprachen nach Versuchs‐ gruppe Die Geschlechterverteilung nach Muttersprache war ausgeglichen: In Gruppe A hatten jeweils 2 weibliche und 2 männliche Versuchspersonen eine andere Muttersprache als Deutsch, in Gruppe B waren es jeweils 3 (siehe Tabelle 13). 124 5 Ergebnisse w m w m Gruppe A (flüssig) 6 13 2 2 Gruppe B (unflüssig) 7 10 3 3 Gesamt 13 23 5 5 Tabelle 13: Muttersprachen nach Geschlecht und Gruppe Die am häufigsten vertretenen Sprachen neben Deutsch waren Slowakisch (3 Personen), Schwedisch und Englisch (jeweils 2). An dieser Stelle ist jedoch an‐ zumerken, dass aufgrund der Anforderungen des weitgehend deutschsprachig durchgeführten Studiums die Deutschkenntnisse auch bei den Studierenden mit nicht deutscher Muttersprache für das Verständnis von Vorträgen dieser Art ausreichen dürften. Bei der Auswertung zeigten sich Unterschiede in einigen Ergebniskategorien, auf die in 5.2.1 und 5.3.5.1 näher eingegangen wird. Neben den obengenannten statistischen Basisinformationen wurden die Stu‐ dienteilnehmerInnen auch gefragt, ob sie Erfahrung als KundInnen von Simul‐ tandolmetschungen hatten sowie wie gut sie mit dem Thema des Vortrags ver‐ traut waren. Nur fünf Personen (10,6 %) gaben an, im Rahmen einer Konferenz oder Ta‐ gung bereits ein- oder mehrmals eine Simultandolmetschung gehört zu haben, wobei die Anzahl der Dolmetschungen zwischen 1 und 4 lag (siehe Abbildung 7). Von diesen fünf Personen waren vier in Gruppe A und eine in Gruppe B. ja 10,64% nein 89,36% Dolmetscherfahrung Abbildung 7: Erfahrung mit Simultandolmetschungen 125 5.1 Versuchspersonen Bei der Frage „Wie gut war Ihnen das Thema „Marketing und Postmoderne“ bekannt? “ gab der Großteil (83 %) auf einer 7-Punkte-Skala von 1 = sehr gut bekannt bis 7 = gar nicht bekannt Werte von 5-7 an, wobei der Median bei 6 lag. Nur 4 Personen (8,5 %) gaben Werte im positiven Bereich (1-3) an, 4 weitere (8,5 %) gaben auf der Skala 4 an (siehe Tabelle 14). Bewertung Häufigkeit Prozent Kumulierte Prozente 1 0 0 0 2 1 2,1 2,1 3 3 6,4 8,5 4 4 8,5 17 5 7 14,9 31,9 6 13 27,7 59,6 7 19 40,4 100 Gesamt 47 100 Tabelle 14: Bekanntheit des Themas „Marketing und Postmoderne“ (Gesamt) In Gruppe B (unflüssig) gab es geringfügig mehr TeilnehmerInnen die mit dem Thema besser vertraut waren als in Gruppe A (flüssig), der Median lag allerdings in beiden Gruppen bei 6 auf einer Skala von 1 = sehr gut bekannt bis 7 = gar nicht bekannt (siehe Tabelle 15 und Tabelle 16 sowie Abbildung 8). 126 5 Ergebnisse Bewertung Häufigkeit Prozent Kumulierte Prozente 1 0 0 0 2 0 0 0 3 1 4,2 4,2 4 2 8,3 12,5 5 5 20,8 33,3 6 5 20,8 54,2 7 11 45,8 100 Gesamt 24 100 Tabelle 15: Bekanntheit des Themas „Marketing und Postmoderne“ (Gruppe A) Bewertung Häufigkeit Prozent Kumulierte Prozente 1 0 0 0 2 1 4,3 4,3 3 2 8,7 13 4 2 8,7 21,7 5 2 8,7 30,4 6 8 34,8 65,2 7 8 34,8 100 Gesamt 23 100 Tabelle 16: Bekanntheit des Themas „Marketing und Postmoderne“ (Gruppe B) 5.2 Gesamtscore (Hörverständnistest) Zur Beantwortung der Hauptforschungsfrage, ob die Redeflüssigkeit der Dol‐ metschung die Verständlichkeit (also die kognitive Wirkung) derselben beein‐ flusst, wurde unter Verwendung des in 4.6.4 beschriebenen Scoring-Systems für jede ProbandIn das Ergebnis des Hörverständnistests errechnet (Gesamtscore). 127 5.2 Gesamtscore (Hörverständnistest) 4,17 8,33 20,83 20,83 45,83 4,35 8,7 8,7 8,7 34,78 34,78 0 5 10 15 20 25 30 35 40 45 50 1 = sehr gut bekannt 2 3 4 5 6 7 = gar nicht bekannt Bekanntheit des Themas (in Prozent) Gruppe A (flüssig) Gruppe B (unflüssig) Abbildung 8: Bekanntheit des Themas „Marketing und Postmoderne“ Es konnte (nach Ausschluss von Frage 11, siehe 4.6.2.2) ein Gesamtscore von maximal 17 erreicht werden. Die Ergebnisse sind normalverteilt. Ein Vergleich der beiden Gruppen zeigt, dass die Verständnisscores der beiden Gruppen in jeder Hinsicht annähernd identisch sind: Gruppe A (flüssig) hat einen Mittelwert von 10,11 und einen Median von 10,47 Punkten, während der Mittelwert von Gruppe B (unflüssig) mit 9,87 und der Median mit 9,93 nur knapp darunter liegen. Auch die in beiden Gruppen erzielte Minimal- und Maximal‐ punkteanzahl ist annähernd gleich und weist keine signifikanten Unterschiede auf (siehe Tabelle 17). 128 5 Ergebnisse Gruppe A flüssig Gruppe B unflüssig Gesamt n 24 23 47 Mittelwert 10,11 9,87 9,99 Median 10,47 9,93 10,25 Standardabweichung 3,17 3,05 3,08 Minimum 3 3 3 Maximum 14,50 14 14,50 Tabelle 17: Gesamtscore nach Gruppe Ein t-Test bestätigt, dass der geringfügige Mittelwertunterschied zwischen den beiden Gruppen nicht signifikant ist (t = 0,263, df = 45, p = 0,793 > 0,05). Diese Ergebnisse lassen den Schluss zu, dass die Flüssigkeit in diesem Versuch keinen Einfluss auf die kognitive Wirkung der Dolmetschung hatte, was auch durch das Histogramm illustriert wird (siehe Abbildung 9). 129 5.2 Gesamtscore (Hörverständnistest) Häufigkeit (ProbandInnen) 6,0 4,0 2,0 0,0 Häufigkeit (ProbandInnen) 6,0 4,0 2,0 0,0 Versuchsgruppe unflüssig flüssig Gesamtscore Verständnis 15,00 12,50 10,00 7,50 5,00 2,50 ,00 Gesamtscore Verständnis 15,00 12,50 10,00 7,50 5,00 2,50 ,00 Seite 1 Abbildung 9: Histogramm der Gesamtscores nach Versuchsgruppe Um eine Prädisposition zur Beantwortung der unterschiedlichen Fragetypen (z. B. größere Vertrautheit mit Multiple Choice-Fragen oder bessere Beantwor‐ tung halboffener Fragen aufgrund von besserem Merkvermögen bzw. Aus‐ drucksfähigkeit) als Störfaktoren auszuschließen, wurden auch die Scores der einzelnen Fragetypen miteinander verglichen. Auch hier zeigten sich kaum Un‐ terschiede: wie Tabelle 18 und Tabelle 19 zeigen, gab es keine signifikanten Gruppenunterschiede in der Beantwortung der beiden Fragetypen. 130 5 Ergebnisse Gruppe A flüssig Gruppe B unflüssig n 24 23 Mittelwert 5,28 5,13 Median 5,75 5 Standardabweichung 2,24 1,85 Minimum 0 2 Maximum 8 9 Tabelle 18: Score für halboffene Fragen (6, 7, 9) Gruppe A flüssig Gruppe B unflüssig n 24 23 Mittelwert 4,83 4,74 Median 4,72 5 Standardabweichung 1,62 1,64 Minimum 2,43 1 Maximum 8 7 Tabelle 19: Score für Multiple Choice-Fragen (1-5, 8, 10) 5.2.1 Einflussfaktor Muttersprache Obwohl die ProbandInnen zur Kontrolle der möglichen Störvariable Mutter‐ sprache im Vorfeld parallelisiert worden waren, wurde bei der Auswertung auch diese Variable untersucht, um festzustellen, ob z. B. gewisse Effekte nur bei Pro‐ bandInnen mit deutscher Muttersprache oder ProbandInnen mit einer anderen Muttersprache als Deutsch eintraten. Dabei zeigte sich, dass die ProbandInnen mit Deutsch als Muttersprache bes‐ sere Testscores erzielten als jene, deren Muttersprache nicht Deutsch war. So liegt der Gesamtscore bei den ProbandInnen mit Deutsch als Muttersprache (n = 36) im Durchschnitt bei 10,41, während jene mit einer anderen Muttersprache (n = 11) durchschnittlich nur 8,63 Punkte erzielten. Der Unterschied zwischen 131 5.2 Gesamtscore (Hörverständnistest) den Mittelwerten ist auf einem 5 %-Niveau allerdings nicht signifikant (t = 1,709, df = 45, p = 0,094 > 0,05) und es gibt eine schwache aber nicht signifikante Korrelation zwischen Muttersprache und Gesamtscore (r = -0,247, Sig. = 0,094). Die Mittelwertunterschiede dürften also nicht systematisch mit der Mutter‐ sprache in Verbindung stehen. Außerdem sei angemerkt, dass die schlechtesten Ergebnisse aus der Gruppe der Deutsch-MuttersprachlerInnen kamen. Beim Gruppenvergleich nach einer Aufteilung der Daten nach Muttersprache zeigt sich allerdings ein überraschend homogenes Bild: Werden nur die Per‐ sonen mit Deutsch als Muttersprache betrachtet, erzielt Gruppe A (flüssig) im Durchschnitt 10,45 Punkte, während der Gesamtscore in Gruppe B (unflüssig) bei 10,36 liegt. Auch bei Standardabweichung, Median, Minimum und Maximum gibt es keine signifikanten Unterschiede. (siehe Tabelle 20) Gruppe A flüssig Gruppe B unflüssig n 19 17 Mittelwert 10,45 10,36 Median 10,93 11,71 Standardabweichung 3,23 3,20 Minimum 3 3 Maximum 14,50 14 Tabelle 20: Gesamtscore nach Gruppe (nur Muttersprache Deutsch) Auch bei der Betrachtung der ProbandInnen, die eine andere Muttersprache haben, gibt es keine signifikanten Unterschiede zwischen den Gruppen (siehe Tabelle 21): der durchschnittliche Score liegt in Gruppe A (flüssig) bei 8,80, in Gruppe B (unflüssig) bei 8,45. Lediglich beim Minimum gibt es einen nennens‐ werten Unterschied (5,43 Punkte in Gruppe A, 6,50 in Gruppe B), doch auch das niedrigere Minimum liegt noch über den niedrigsten Ergebnissen der Deutsch-MuttersprachlerInnen (3 in beiden Gruppen). 132 5 Ergebnisse Gruppe A flüssig Gruppe B unflüssig n 5 6 Mittelwert 8,80 8,45 Median 8,93 8 Standardabweichung 2,85 2,23 Minimum 5,43 6,50 Maximum 13,21 12 Tabelle 21: Gesamtscore nach Gruppe (nur Muttersprache nicht Deutsch) Es zeigt sich also, dass durch die Parallelisierung der Einfluss der Muttersprache auf das Endergebnis ausgeglichen werden konnte. 5.2.2 Einflussfaktor Geschlecht Wie in 5.1 beschrieben gab es mehr männliche als weibliche ProbandInnen (sowie eine Person, die diese Frage nicht beantwortete und daher aus der fol‐ genden Analyse ausgeschlossen wurde). Bei den durchschnittlichen Gesamtscores gibt es nur einen geringfügigen Unterschied zwischen den Geschlechtern: 9,54 (weiblich) vs. 10,32 (männlich). Der Median liegt bei den männlichen Teilnehmern mit 10,47 über jenem der Teilnehmerinnen (9,47), bei den niedrigsten und höchsten Testscores gibt es kaum einen Unterschied (je 3 Punkte als Minimum und 14,21 bzw. 14,50 als Maximum). (siehe Tabelle 22) Ein t-Test bestätigt, dass der Unterschied zwischen den Geschlechtern nicht signifikant ist (t = -1,273, df = 44, p = 0,412 > 0,05) und es besteht auch keine Korrelation zwischen den Variablen Geschlecht und Gesamtscore (r = 0,124, Sig. = 0,412). 133 5.2 Gesamtscore (Hörverständnistest) weiblich männlich n 18 28 Mittelwert 9,54 10,32 Median 9,47 10,47 Standardabweichung 3,36 2,96 Minimum 3 3 Maximum 14,21 14,50 Tabelle 22: Gesamtscore nach Geschlecht 5.2.3 Einflussfaktor Alter Um festzustellen, ob das Alter einen Einfluss auf das Ergebnis hatte, wurde eine Korrelation nach Pearson durchgeführt. Dabei zeigte sich, dass es keinerlei Zu‐ sammenhang mit dem Alter der ProbandInnen gab (Gesamt: r = -0,046, Sig. = 0,759). Auch bei einer Messung der Korrelation nach Versuchsgruppe gab es keinen Einfluss des Faktors Alter, was aufgrund der Parallelisierung und der geringen Altersvarianz der Versuchsgruppe kaum verwunderlich ist (Gruppe A r = -0,062, Sig. 0,772; Gruppe B r = -0,023, Sig. 0,918). 5.2.4 Einflussfaktor Tag des Versuchs Wie in 4.7 beschrieben musste der Versuch aus logistischen Gründen an zwei Terminen durchgeführt werden. Ein Vergleich der Ergebnisse der beiden Ver‐ suchsteile zeigt, dass der Termin bzw. die Tageszeit keinerlei Einfluss auf die Ergebnisse des Hörverständnistests hatte: Die Gruppe, die den Test am Dienstag um 8h machte, erzielte durchschnittlich 9,73 Punkte, während die Gruppe am Donnerstag derselben Woche um 14h im Durchschnitt 10,35 Punkte erzielte (siehe Tabelle 23). Der Unterschied zwischen den Mittelwerten ist nicht signi‐ fikant (t = -0,682, df = 45, p. = 0,499 > 0,05), es gibt also keinerlei Korrelation zwischen Tag bzw. Uhrzeit des Versuchs und Gesamtscore (r = 0,101, Sig. = 0,499). 134 5 Ergebnisse Di 8h Do 14h n 27 20 Mittelwert 9,73 10,35 Median 10 10,38 Standardabweichung 3,25 2,87 Minimum 3 3 Maximum 14,50 14 Tabelle 23: Gesamtscore nach Durchführungstag 5.2.5 Einflussfaktor Hintergrundwissen Wie bei der Beschreibung der Versuchspersonen erwähnt gaben nur wenige bei der Frage nach Vertrautheit des Themas auf der 7-stelligen Skala einen Wert von 4 oder besser an. Eine Korrelation nach Pearson zeigt, dass kein signifikanter Zusammenhang zwischen Hintergrundwissen und Gesamtscore besteht (r = -0,056, Sig. = 0,708), was für die Validität des Versuchs ein erfreuliches Ergebnis ist, da davon ausgegangen werden kann, dass die Fragen aufgrund des tatsäch‐ lichen Verständnisses und nicht des Hintergrundwissens beantwortet wurden. 5.2.6 Einflussfaktor Erfahrung mit Dolmetschungen Nur fünf Personen gaben an, bereits Erfahrungen als DolmetschkundInnen ge‐ macht zu haben. Wie erwartet hatte dies keinen Einfluss auf das Ergebnis des Hörverständnistests: Der Mittelwert bei jenen, die bereits Dolmetschungen ge‐ hört hatten (n = 5), lag bei 9,87, bei den anderen (n = 42) bei 10,01. Das Minimum fällt in der Gruppe jener, die Erfahrung mit Dolmetschungen hatten, mit 7,50 erheblich besser aus als in der anderen Gruppe (3), aufgrund der geringen Grup‐ pengröße und anderer möglicher Einflussfaktoren kann aber nicht davon aus‐ gegangen werden, dass hier ein Zusammenhang besteht. Dies bestätigt auch die Korrelation nach Pearson (r = -0,014, Sig. = 0,927) sowie der t-Test (t = -0,092, df = 45, p = 0,927 > 0,05). Mit dieser Auswertung kann Forschungsfrage 1: Hat Flüssigkeit einen Einfluss auf die Verständlichkeit einer Dolmetschung? negativ beant‐ wortet werden: Die Flüssigkeit der Dolmetschung hat zumindest bei diesem Grad der Manipulation keinen Einfluss auf die Verständlichkeit. 135 5.2 Gesamtscore (Hörverständnistest) Zur Beantwortung der übrigen Fragen sollen nun in den nächsten Ab‐ schnitten die subjektiven Beurteilungen ausgewertet und beschrieben sowie in Bezug zum Gesamtscore gesetzt werden. 5.3 Subjektive Bewertung Die Fragen 12-15 beziehen sich auf die subjektive Wahrnehmung der Proban‐ dInnen und können daher nur als Ordinalskalen betrachtet werden. Bei allen vier Fragen kommt eine 7-stellige Skala zum Einsatz, wobei 1 jeweils die beste und 7 die schlechteste Bewertung darstellt. Diese Fragen sollen hier zunächst einzeln und dann zusammengefasst betrachtet werden. 5.3.1 Redeflüssigkeit (Frage 14) Bei der vorliegenden Versuchsanordnung stellt sich selbstverständlich auch die Frage, ob ZuhörerInnen ohne einen direkten Vergleich von zwei unterschiedli‐ chen Versionen die Flüssigkeit einer Dolmetschung beurteilen können. Bei dieser wie auch bei den anderen subjektiven Bewertungen ist zu be‐ denken, dass „Redeflüssigkeit“ ein allgemeinsprachlicher Begriff ist, den ver‐ schiedene Versuchspersonen möglicherweise unterschiedlich definieren. Ob‐ wohl bei der Formulierung der Frage durch den Hinweis „Pausen, Zögern“ der Begriff etwas eingeschränkt wurde, ist dennoch nicht auszuschließen, dass Pro‐ bandInnen bei der Beantwortung von unterschiedlichen Definitionen ausge‐ gangen sind. Allerdings lassen die freien Kommentare bei dieser Frage ver‐ muten, dass die in der Fragestellung als Hinweis enthaltene Definition von den Versuchspersonen tatsächlich angewandt wurde. 14) Wie beurteilen Sie die Redeflüssigkeit der Dolmetschung (Pausen, Zögern)? 1 2 3 4 5 6 7 sehr flüssig sehr unflüssig Bei der Auswertung dieser Frage zeigt sich, dass die Bewertung der Redeflüs‐ sigkeit auf einer Skala von 1 (sehr flüssig) bis 7 (sehr unflüssig) in Gruppe A, die die flüssigere Version hörte, wesentlich besser ausfiel als in Gruppe B (un‐ flüssig) (siehe Abbildung 10). 136 5 Ergebnisse 29,17 41,67 20,83 0 8,33 0 0 8,7 30,43 39,13 8,7 13,04 0 0 0 5 10 15 20 25 30 35 40 45 1 = sehr flüssig 2 3 4 5 6 7 = sehr unflüssig Bewertung der Flüssigkeit (in Prozent) Gruppe A (flüssig) Gruppe B (unflüssig) Abbildung 10: Bewertung der Flüssigkeit nach Versuchsgruppe Häufigkeit Prozent Kumulierte Prozente 1 7 29,2 29,2 2 10 41,7 70,8 3 5 20,8 91,7 4 - - - 5 2 8,3 100 6 - - - 7 - - - Gesamt 24 100 Tabelle 24: Flüssigkeitsbewertung von 1 = sehr flüssig bis 7 = sehr unflüssig (Gruppe A) 137 5.3 Subjektive Bewertung Häufigkeit Prozent Kumulierte Prozente 1 2 8,7 8,7 2 7 30,4 39,1 3 9 39,1 78,3 4 2 8,7 87 5 3 13 100 6 - - - 7 - - - Gesamt 23 100 Tabelle 25: Flüssigkeitsbewertung von 1 = sehr flüssig bis 7 = sehr unflüssig (Gruppe B) Wie aus Tabelle 24 und Tabelle 25 ersichtlich ist, bewerteten 91,7 % der Proban‐ dInnen in Gruppe A (flüssig) die Flüssigkeit der Dolmetschung positiv, d. h. im Bereich 1 (sehr flüssig) bis 3, während dies in Gruppe B (unflüssig) bei lediglich 78,3 % der Fall war. Obwohl die Bewertung auch in Gruppe B recht positiv aus‐ fällt, was auch mit der subjektiven Einschätzung der am Versuch beteiligten DolmetscherInnen und Dolmetschtechniker übereinstimmt (siehe 4.5.5), so be‐ steht dennoch ein deutlicher Unterschied zwischen den beiden Gruppen: In Gruppe A (flüssig) liegt der Median bei 2, in Gruppe B (unflüssig) bei 3 und sowohl die Rangsummen als auch die mittleren Ränge unterscheiden sich er‐ heblich (siehe Tabelle 26). Gruppe A (flüssig) Gruppe B (unflüssig) n 24 23 Median 2 3 Minimum 1 1 Maximum 5 5 Mittlerer Rang 19,69 28,50 Rangsumme 472,50 655,50 Tabelle 26: Bewertung der Flüssigkeit nach Versuchsgruppe 138 5 Ergebnisse 1 Die Versuchspersonen wurden mit f für flüssig (Gruppe A) und u für unflüssig (Gruppe B) sowie einer fortlaufenden Zahl gekennzeichnet. Der Mann-Whitney-U-Test (siehe Tabelle 27) zeigt, dass ein signifikanter Un‐ terschied in der Bewertung der Flüssigkeit durch die beiden Versuchsgruppen besteht. Die Berechnung der Korrelation nach Spearman (siehe Tabelle 28) ergibt eine zweiseitige Signifikanz von 0,020 bei einem Korrelationskoeffizienten von r = 0,339. Es gibt also eine schwache bis mittlere Korrelation zwischen der Ver‐ suchsgruppe und der Bewertung der Flüssigkeit. Bewertung d. Flüssigkeit Mann-Whitney-U 172,500 Wilcoxon-W 472,500 Z -2,298 Asymptotische Signifikanz (2-seitig) ,022 Tabelle 27: Mann-Whitney-U-Test für die Bewertung der Flüssigkeit in den beiden Ver‐ suchsgruppen Spearman-Rho Bewertung d. Flüssigkeit Versuchsgruppe Korrelationskoeffizient 0,339 Sig. (2-seitig) 0,20 n 47 Tabelle 28: Spearman-Korrelation der Versuchsgruppe mit Bewertung der Flüssigkeit Dies scheint zu bestätigen, dass durch die Manipulation des Ausgangsmaterials erfolgreich zwei Versionen mit unterschiedlichen Flüssigkeitsgraden produziert wurden. Auch die freien Kommentare zu dieser Frage deuten darauf hin. Während in Gruppe A (flüssig) die Kommentare die geringe Anzahl von Pausen hervorheben („nur wenige Pausen, nur einmal eine kleine Unsicherheit“ (f8 1 ), „nur wenige Pausen, nicht sehr störend“ (f17)) und nur eine Person anmerkte, die Dolmet‐ scherin habe „manchmal gezögert“ (f23), gab es in Gruppe B (unflüssig) Hinweise auf Zögern und Pausen: 139 5.3 Subjektive Bewertung Zu Beginn holprig, Verbesserung mit der Zeit, am Ende gut (u1) zu Beginn zögerlich, zum Schluss hin recht flüssig (u7) viele "ähm"-Pausen; sonst sehr flüssig (u12) teilweise sehr flüssig, aber oft waren Pausen und Zögern zu merken (u22) Allerdings waren nicht alle Kommentare in Gruppe B negativ. Eine Person kommentierte „bin zufrieden, hat deutlich geredet und auch nicht langweilig“ (u15) und eine weitere Person empfand die Pausen nicht als negativ: Pausen keineswegs störend ->im Gegenteil gut um sich über gerade gehörtes klar zu werden (u18) 5.3.1.1 Einflussfaktoren Um zu überprüfen, ob die Muttersprache einen Einfluss auf die Bewertung der Flüssigkeit hatte, wurden die ProbandInnen nach Muttersprache (Deutsch/ andere) getrennt analysiert. 16,67 38,89 27,78 5,56 11,11 27,27 27,27 26,26 9,09 05 10 15 20 25 30 35 40 45 1 = sehr flüssig 2 3 4 5 6 7 = sehr unflüssig Bewertung der Flüssigkeit (in Prozent) Deutsch andere Abbildung 11: Bewertung der Flüssigkeit nach Muttersprache Dabei stellte sich heraus, dass sich die Beurteilungen nur unwesentlich vonei‐ nander unterschieden (siehe Abbildung 11 und Tabelle 29). Im Rangsummentest und bei der Berechnung der Korrelation nach Spearman zeigten sich keine sig‐ nifikanten Unterschiede zwischen den beiden Gruppen sowie keine Korrelation der Flüssigkeitsbewertung mit der Muttersprache. 140 5 Ergebnisse Muttersprache Deutsch andere Muttersprache n 36 11 Median 2 2 Minimum 1 1 Maximum 5 5 Mittlerer Rang 24,44 22,55 Rangsumme 880,00 248,00 Tabelle 29: Bewertung der Flüssigkeit nach Muttersprache Die Bewertung der Redeflüssigkeit wurde auch nach anderen Variablen analy‐ siert. Dabei zeigte sich weder bei Geschlecht, Erfahrung mit Dolmetschungen, Bekanntheit des Themas noch Tag des Versuchs ein signifikanter Zusammen‐ hang. 5.3.1.2 Zusammenhang mit dem Hörverständnistest Schließlich wurde mittels Spearman-Rho-Korrelation überprüft, ob eine Korre‐ lation zwischen der Antwort der einzelnen ProbandInnen auf diese Frage und ihrem Gesamtscore im Hörverständnistest besteht. Dabei zeigte sich, dass es keinen Zusammenhang zwischen der subjektiv empfundenen Flüssigkeit der Dolmetschung und der Leistung beim Hörverständnistest gab (siehe Tabelle 30). Spearman-Rho Bewertung der Flüssigkeit Gesamtscore Hör‐ verständnis Korrelationskoeffizient -0,033 Sig. (2-seitig) 0,826 n 47 Tabelle 30: Spearman-Korrelation von Gesamtscore mit Bewertung der Flüssigkeit Zusätzlich zur Korrelation wurde ein Gruppenvergleich angestellt, indem die ProbandInnen nach ihrer Flüssigkeitsbewertung in zwei Kategorien eingeteilt wurden. Dabei wurden die Bewertungen von 1 bis 3 zu einer Gruppe zusam‐ mengefasst („eher flüssig“), die Bewertungen > 3 zur anderen („eher unflüssig“) Es sei allerdings angemerkt, dass aufgrund der erheblichen Größenunterschiede 141 5.3 Subjektive Bewertung zwischen den Gruppen (siehe Tabelle 31) diese Gruppenvergleiche nur bedingt aussagekräftig sind. Da es sich aber beim Gesamtscore um eine metrische Va‐ riable handelt, weshalb hier für Gruppenvergleiche der t-Test zulässig ist, sollen sie hier - sowie analog für andere Variablen in 5.3.2.2 und 5.3.4 - der Vollstän‐ digkeit wegen ebenfalls angeführt werden. Häufigkeit Prozent Kumulierte Prozente 1 9 19,1 19,1 2 17 36,2 55,3 3 14 29,8 85,1 4 2 4,3 89,4 5 5 10,6 100 6 - - - 7 - - - Gesamt 47 100 Tabelle 31: Flüssigkeitsbewertung von 1 = sehr flüssig bis 7 = sehr unflüssig (Gesamt) Wenn die ProbandInnen über beide Versuchsgruppen hinweg nach Flüssig‐ keitsbewertung in 2 Kategorien (Bewertung 1-3 bzw. 4-7) eingeteilt werden (siehe weiter oben), ergibt sich nur ein geringer Mittelwertunterschied: Bei jenen, die der Flüssigkeit eine Note von 1 bis 3 gegeben hatten (n = 40), lag der durchschnittliche Gesamtscore bei 10,10, bei denen, die sie mit 4 oder schlechter beurteilt hatten (n = 7), lag er bei 9,36. Dieser Unterschied ist nicht signifikant (t = 0,582, df = 45, p = 0,563 > 0,05). Zusammengefasst kann also festgestellt werden, dass die ProbandInnen die unterschiedliche Flüssigkeit der beiden Versuchstexte auch ohne einen direkten Vergleich erkannten, die subjektiv empfundene Flüssigkeit ihre Leistung beim Hörverständnistest aber ebenso wenig beeinflusste wie die tatsächliche Flüs‐ sigkeit (vgl. 5.2). 5.3.2 Intonation (Frage 15) Wie bei der Redeflüssigkeit (siehe vorheriger Abschnitt) kann auch bei der In‐ tonation nicht davon ausgegangen werden, dass Laien den Begriff einheitlich definieren. Daher wurde Frage 15 etwas allgemeinsprachlicher formuliert: 142 5 Ergebnisse 16,67 38,89 27,78 5,56 11,11 27,27 27,27 26,26 9,09 05 10 15 20 25 30 35 40 45 1 = sehr flüssig 2 3 4 5 6 7 = sehr unflüssig Bewertung der Flüssigkeit (in Prozent) Deutsch andere Die Auswertung zeigt bei dieser Frage keinen signifikanten Unterschied zwi‐ schen den Versuchsgruppen. Die Verteilung der Bewertungen nach Gruppen ist in Abbildung 12 sowie in Tabelle 32 und Tabelle 33 zu sehen. 20,83 8,33 45,83 8,33 12,5 3,17 0 13,04 30,43 26,09 21,73 8,7 0 0 05 10 15 20 25 30 35 40 45 50 1 = sehr lebendig gesprochen 2 3 4 5 6 7 = gar nicht lebendig gesprochen Bewertung der Intonation (in Prozent) Gruppe A (flüssig) Gruppe B (unflüssig) Abbildung 12: Bewertung der Intonation nach Versuchsgruppe 143 5.3 Subjektive Bewertung Häufigkeit Prozent Kumulierte Prozente 1 5 20,8 20,8 2 2 8,3 29,2 3 11 45,8 75 4 2 8,3 83,3 5 3 12,5 95,8 6 1 4,2 100 7 - - - Gesamt 24 100 Tabelle 32: Intonationsbewertung von 1 = sehr lebendig gesprochen bis 7 = gar nicht lebendig gesprochen (Gruppe A) Häufigkeit Prozent Kumulierte Prozente 1 3 13 13 2 7 30,4 43,5 3 6 26,1 69,6 4 5 21,7 91,3 5 2 8,7 100 6 - - - 7 - - - Gesamt 23 100 Tabelle 33: Intonationsbewertung von 1 = sehr lebendig gesprochen bis 7 = gar nicht lebendig gesprochen (Gruppe B) In Gruppe A (flüssig) wurde die Intonation von 75 Prozent mit den Noten 1-3 bewertet, in Gruppe B (unflüssig) waren es 69,6 Prozent, die schlechteste Be‐ wertung (6) findet sich aber in Gruppe A. Eine Betrachtung der Verteilung für alle ProbandInnen (siehe Tabelle 34) zeigt, dass die Intonation insgesamt recht gut bewertet wurde: 72,3 % bewerteten sie mit 1-3, weitere 14,9 % vergaben die 4, die in der Mitte der 7-stelligen Skala steht und damit als neutrale Antwort 144 5 Ergebnisse interpretiert werden kann. Nur 12,6 % der ProbandInnen beurteilten die Into‐ nation also als eher schlecht (5-7). Häufigkeit Prozent Kumulierte Prozente 1 8 17 17 2 9 19,1 36,2 3 17 36,2 72,3 4 7 14,9 87,2 5 5 10,6 97,9 6 1 2,1 100 7 - - - Gesamt 47 100 Tabelle 34: Intonationsbewertung von 1 = sehr lebendig gesprochen bis 7 = gar nicht lebendig gesprochen (Gesamt) Der Median liegt in beiden Gruppen bei 3 (siehe Tabelle 35) und auch beim Rangsummentest (Mann-Whitney-U 262,5, 2-seitige Sig. 0,767) und bei der Be‐ rechnung des Rangkorrelationskoeffizienten (r = -0,44, Sig. 0,770) ergeben sich keine signifikanten Unterschiede. Gruppe A (flüssig) Gruppe B (unflüssig) n 24 23 Median 3 3 Minimum 1 1 Maximum 6 5 Mittlerer Rang 24,56 23,41 Rangsumme 589,50 538,50 Tabelle 35: Bewertung der Intonation nach Versuchsgruppe 145 5.3 Subjektive Bewertung Bei den freien Kommentaren merkte in Gruppe B (unflüssig) eine Person (u20) an, die Dolmetschung sei sehr monoton gewesen, in Gruppe A gab es zwei Kommentare, die auf Monotonie hinwiesen: immer dieselbe Melodie - selber Ton, wirkt langweilig und nach der Zeit passte man nicht mehr auf. (f14) der Italiener auf der Leinwand hat lebendiger gewirkt (f24) Außerdem kommentierte eine Person bei Frage 13 (Wiedergabe des Inhalts) Folgendes: teilweise monoton, deswegen Probleme bei Konzentration, aber nicht dramatisch (siehe 15) (f17) 5.3.2.1 Zusammenhang mit der Flüssigkeitsbewertung Beim Vergleich der Bewertung von Intonation und Flüssigkeit zeigt sich keine signifikante Korrelation, allerdings liegt der Wert nur geringfügig über dem Signifikanzniveau (siehe Tabelle 36). Es ist also möglich, dass eine bessere Be‐ wertung der Flüssigkeit tendenziell auch mit einer besseren Bewertung der In‐ tonation einhergeht und umgekehrt. Es könnte allerdings auch ein Hinweis da‐ rauf sein, dass die ProbandInnen nicht imstande waren, eine genaue Trennung zwischen den beiden Kategorien vorzunehmen, und so einen allgemein schlechteren Eindruck sowohl der Flüssigkeit als auch der Intonation zuord‐ neten. (siehe Haloeffekt in 4.6.3) Spearman-Rho Bewertung der Flüssigkeit Bewertung Intonation Korrelationskoeffizient 0,283 Sig. (2-seitig) 0,054 n 47 Tabelle 36: Spearman-Korrelation von Bewertung der Intonation mit Bewertung der Flüssigkeit Für weitere Berechnungen wurde der Mittelwert dieser beiden paralinguisti‐ schen Variablen gebildet, um dem möglichen Haloeffekt entgegenzuwirken (Abbildung 13). Diese kombinierte Bewertung der paralinguistischen Variablen korreliert nicht mit der Versuchsgruppenzugehörigkeit (siehe Tabelle 37). 146 5 Ergebnisse 16,67 4,17 12,5 16,67 37,5 4,17 4,17 4,17 8,7 26,09 8,7 30,43 8,7 8,7 4,35 4,35 0 5 10 15 20 25 30 35 40 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 Mittelwert Intonation & Flüssigkeit (in Prozent) Gruppe A (flüssig) Gruppe B (unflüssig) Abbildung 13: Bewertung der paralinguistischen Variablen nach Versuchsgruppe Spearman-Rho Paraling. Variablen Versuchsgruppe Korrelationskoeffizient 0,134 Sig. (2-seitig) 0,371 n 47 Tabelle 37: Spearman-Korrelation von Bewertung der paralinguistischen Variablen mit der Versuchsgruppe 5.3.2.2 Zusammenhang mit dem Hörverständnistest Wie bei der Bewertung der Flüssigkeit gibt es auch bei der subjektiv empfun‐ denen Intonation keinen Zusammenhang mit der Leistung beim Hörverständ‐ nistest (vgl. Tabelle 38). Dasselbe gilt auch für die kombinierte Bewertung der paralinguistischen Variablen. 147 5.3 Subjektive Bewertung Spearman-Rho Bewertung Intona‐ tion Paraling. Variablen Gesamtscore Hör‐ verständnis Korrelationskoeffizient -,130 -,113 Sig. (2-seitig) ,386 ,450 n 47 47 Tabelle 38: Spearman-Korrelation von Gesamtscore mit Bewertung der Intonation bzw. der paralinguistischen Variablen Bei der Aufteilung in zwei Gruppen nach dem Durchschnitt der paralinguisti‐ schen Variablen Flüssigkeit und Intonation erreicht die Gruppe mit der besseren Bewertung (1-3; n = 38) einen durchschnittlichen Gesamtscore von 10,16, jene mit der schlechteren (> 3; n = 9) 9,27. Dieser Unterschied ist nicht signifikant (t = 0,783, df = 45, p = 0,438). Wie in 5.3.1.2 ist außerdem zu beachten, dass durch die Größenunterschiede der Vergleich nur bedingt aussagekräftig ist. Es scheint also keinerlei Zusammenhang zwischen der Bewertung der Into‐ nation und der tatsächlichen oder empfundenen Flüssigkeit bzw. der Leistung beim Hörverständnistest zu bestehen. 5.3.3 Wiedergabe des Inhalts (Frage 13) Wie in Abschnitt 4.6.1.2 erwähnt wurde bei dieser Frage bewusst darauf ver‐ zichtet, von „Qualität“ der Dolmetschung zu sprechen. Stattdessen wurde nach einem Teilaspekt, der Wiedergabe des Inhalts, gefragt: 15) Wie gut hat die Dolmetscherin Ihrer Meinung nach den Inhalt des Vortrags wiedergegeben? 1 2 3 4 5 6 7 sehr gut sehr schlecht Wie bereits in 2.1 besprochen wurde, sind DolmetschkundInnen ohne transla‐ torischen Hintergrund und ohne die Möglichkeit, Ausgangs- und Zieltext mit‐ einander zu vergleichen, nicht imstande, die Qualität oder Vollständigkeit einer Dolmetschung zu beurteilen, was sie allerdings in der Praxis nicht daran hindert, es dennoch zu tun. Daher wurde in diesem Fragebogen bewusst auch diese sehr subjektive Beurteilung gemessen. 148 5 Ergebnisse Tatsächlich gaben nur zwei Personen in Gruppe B (unflüssig) und zwei Per‐ sonen in Gruppe A (flüssig) an, dies nicht beurteilen zu können: glaube sehr gut -> zumindest hat es sich sinnvoll angehört, ABER: ich weiß ja nichts vom tatsächlichen Inhalt - also Fragestellung ist nicht sehr konkret (f4) schwer zu sagen, da ich den echten Inhalt nicht kenne (f11) da ich nicht weiß, was der Inhalt d. Vortrags war, da ich diesen nicht gehört habe, kann ich die nicht bewerten (u7) woher soll ich das wissen, kenn den original Text ja nicht (u20) Die beiden Personen in Gruppe A gaben dennoch eine Bewertung ab, während die beiden Versuchspersonen in Gruppe B sowie eine weitere Person in Gruppe A (f3), die als Kommentar nur „? ? ? “ geschrieben hatte, diese Frage unbeant‐ wortet ließen. Das Bewusstsein für die Schwierigkeit der inhaltlichen Beurtei‐ lung einer Dolmetschung wies nur einen geringen Zusammenhang mit der Er‐ fahrung als KonsumentIn von Dolmetschungen auf: nur eine Person mit Dolmetscherfahrung gab auch an, den Inhalt nicht beurteilen zu können (u20). Die Beurteilungen fallen in beiden Gruppen ähnlich aus: Sowohl Median als auch Modus sind in beiden Gruppen 2. In Gruppe B (unflüssig) ist das Maximum 5 und die Spannweite der Beurteilungen damit größer als in Gruppe A (flüssig), in der das Maximum 4 beträgt, allerdings ist dieser Unterschied nicht signifikant. Gruppe A flüssig Gruppe B unflüssig n 23 21 Median 2 2 Modus 2 2 Minimum 1 1 Maximum 4 5 Mittlerer Rang 20,13 25,10 Rangsumme 463,00 527,00 Tabelle 39: Bewertung der Leistung der Dolmetscherin nach Versuchsgruppe Eine Spearman-Rho-Korrelation zeigte keinen signifikanten Zusammenhang zwischen der Gruppenzugehörigkeit und der Bewertung der Dolmetschleistung (Sig. 2-seitig 0,173, r = 0,209). Ein Mann-Whitney-U-Test zeigte, dass der Unter‐ 149 5.3 Subjektive Bewertung schied zwischen den mittleren Rängen (Gruppe A: 20,13, Gruppe B: 25,10) nicht signifikant ist (2-seitige Signifikanz 0,170). 5.3.3.1 Zusammenhang mit Flüssigkeits- und Intonationsbewertung Analysiert man jedoch die bivariate Korrelation von subjektiv empfundener Flüssigkeit (siehe 5.3.1) und der Bewertung der Dolmetschleistung, so zeigt sich eine positive Korrelation: Die Spearman-Rho-Analyse ergibt hier bei einer 2-sei‐ tigen Signifikanz von 0,022 einen Korrelationskoeffizienten von 0,343. Dasselbe gilt auch bei Verwendung der gemeinsamen Variable für die paralinguistischen Merkmale (Korrelationskoeffizient r = 0,347, 2-seitige Sig.0,22). Beide Korrela‐ tionen sind auf dem 0,05-Niveau signifikant (siehe Tabelle 40). Bei schlechterer Bewertung der paralinguistischen Faktoren wird also die inhaltliche Leistung der Dolmetscherin schlechter beurteilt und umgekehrt. Spearman-Rho Bewertung d. Flüssigkeit Paraling. Variablen Bewertung Dol‐ metschung Korrelationskoeffizient 0,343 0,347 Sig. (2-seitig) 0,022 0,021 n 44 44 Tabelle 40: Spearman-Korrelation von Bewertung der Dolmetschleistung mit Bewertung der Flüssigkeit bzw. der paralinguistischen Variablen Um die Daten nicht nur nach dem durch die Versuchsgruppe vorgegebenen manipulierten Flüssigkeitsgrad sondern auch nach der subjektiv empfundenen Flüssigkeit auszuwerten, wurden die ProbandInnen außerdem über beide Ver‐ suchsgruppen hinweg nach Flüssigkeitsbewertung in 2 Kategorien (Bewertung 1-3 bzw. 4-7) eingeteilt (siehe 5.3.1). Auch dabei zeigt sich ein signifikanter Unterschied in der Bewertung der Leistung der Dolmetscherin (siehe Tabelle 41). Der U-Test nach Mann und Whitney ergibt eine 2-seitige asymptotische Signifikanz von 0,002. 150 5 Ergebnisse Flüssigkeit 1-3 Flüssigkeit 4-7 n 38 6 Median 2 3 Modus 2 3 Minimum 1 2 Maximum 4 5 Mittlerer Rang 20,33 36,25 Rangsumme 772,50 217,50 Tabelle 41: Bewertung der Leistung der Dolmetscherin nach Flüssigkeitsbeurteilung 5.3.3.2 Zusammenhang mit dem Hörverständnistest Wie Tabelle 42 zeigt, gab es keine Korrelation zwischen der Leistung der Pro‐ bandInnen beim Hörverständnistest und ihrer Bewertung der Dolmetschleis‐ tung. Spearman-Rho Bewertung Dolmetschung Gesamtscore Hörver‐ ständnis Korrelationskoeffizient -0,092 Sig. (2-seitig) 0,552 n 44 Tabelle 42: Spearman-Korrelation von Gesamtscore mit Bewertung der Dolmetschleis‐ tung 5.3.4 Gesamtbeurteilungsscore Analog zur kombinierten Bewertung der paralinguistischen Variablen Flüssig‐ keit und Intonation (siehe 5.3.2.1) wurde ein kombinierter Score aller drei sub‐ jektiven Bewertungen der Dolmetschung gebildet, indem aus den beiden para‐ linguistischen Variablen sowie der Bewertung der Dolmetschleistung (Fragen 13-15) der Mittelwert gebildet wurde. Diese ist in Tabelle 43 und Abbildung 14 dargestellt. Da bei Frage 13 drei ProbandInnen keine Angabe machten, ist hier n = 44. 151 5.3 Subjektive Bewertung 8,7 8,7 21,74 26,09 13,04 8,7 8,7 4,35 4,76 19,05 4,76 14,29 19,05 28,57 4,76 4,76 0 5 10 15 20 25 30 1 1,33 1,67 2 2,33 2,67 3 3,33 3,67 4 4,33 4,67 5 5,33 5,67 6 6,33 6,67 7 Gesamtbewertung (Ø Fragen 13-15, in %) Gruppe A (flüssig) Gruppe B (unflüssig) Abbildung 14: Durchschnittliche Bewertung der Dolmetschung nach Versuchsgruppe Gruppe A (flüssig) Gruppe B (unflüssig) n 23 21 Median 2,33 2,67 Minimum 1 1,33 Maximum 5 5 Mittlerer Rang 20,57 24,62 Rangsumme 473,00 517,00 Tabelle 43: Gesamtbewertung nach Versuchsgruppe (n = 44) Die Gesamtbewertung der Gruppe A (flüssig) fällt zwar geringfügig besser aus als jene von Gruppe B (unflüssig), dieser Unterschied ist aber nicht signifikant (Mann-Whitney-U 197,000, 2-seitige Sig. 0,290). Die Gesamtbewertung korre‐ liert weder mit der Versuchsgruppenzugehörigkeit noch mit der Leistung beim Hörverständnistest (siehe Tabelle 44). Auch bei einer Aufteilung in zwei Gruppen nach Gesamtbewertung (1-3 bzw. > 3) wie in 5.3.3.1 liegt der Mittelwert der Gruppe mit der besseren Bewertung (n = 39) mit 10,07 nur unwesentlich über dem Ergebnis von 9,65 der Gruppe, die die schlechteren Beurteilungen 152 5 Ergebnisse abgab (n = 5). Auch dieses Ergebnis ist nicht signifikant (t = 0,297, df = 42, p = 0,768 > 0,05). Spearman-Rho Versuchsgruppe Gesamtscore Hörverständnis Gesamtbewertung Korrelationskoeffizient 0,161 -0,120 Sig. (2-seitig) 0,296 0,439 n 44 44 Tabelle 44: Spearman-Korrelation von Gesamtbewertung der Dolmetschleistung mit Versuchsgruppe bzw. Gesamtscore Es gibt jedoch eine Korrelation mit der Antwort auf die Frage nach dem sub‐ jektiven Verständnis, die im nächsten Abschnitt behandelt werden soll. 5.3.5 Subjektives Verständnis (Frage 12) Um festzustellen, ob die ProbandInnen in der Lage waren, ihre kognitive Leis‐ tung einzuschätzen, wurde zusätzlich zu den Bewertungsfragen nach dem Ver‐ ständnis gefragt. 12) Wie gut haben Sie den Inhalt des Vortrags verstanden? 1 2 3 4 5 6 7 sehr gut sehr schlecht Diese Frage unterscheidet sich von den übrigen subjektiven Fragen insofern, als sie aus Sicht der ProbandInnen auf sie selbst bezogen ist, während sich die üb‐ rigen drei vermeintlich auf die Leistung der Dolmetscherinnen beziehen (in Wahrheit jedoch eine manipulierte Dolmetschung beurteilen). Zu dieser Frage gab es mehr freie Kommentare als zu den anderen Beurtei‐ lungsfragen. Die Kommentare befassten sich inhaltlich vor allem damit, die Verständnisschwierigkeiten zu begründen. So merkten zwei Versuchspersonen (f24 und u11) an, dass die Uhrzeit der Aufmerksamkeit und dem Erinnerungs‐ vermögen abträglich gewesen sei, allerdings lagen die Scores beider Versuchs‐ 153 5.3 Subjektive Bewertung personen über dem jeweiligen Gruppendurchschnitt. Einige Versuchspersonen gaben an, der Inhalt bzw. die Terminologie hätten die Rede schwierig gemacht: am Anfang teilweise Schwierigkeiten beim Verständnis aufgrund von komplizierten Sachverhalt / Termen (f15) Zu Beginn war es nicht einfach dem Inhalt zu folgen, dies verbesserte sich aber im Zeit‐ ablauf, am Ende war es einfach (u1) akustisch: sehr gut; inhaltlich: viel Info ohne Mitschrift (u7) Auch zwei dieser drei VersuchsteilnehmerInnen erzielten überdurchschnittlich gute Ergebnisse. Eine Person, deren Score ebenfalls über dem Durchschnitt lag, kommentierte die eher niedrige Bewertung des Verständnisses mit: „weil Deutsch für mich eine Fremdsprache ist. Aber sonst wäre es, glaube ich, gut ver‐ ständlich“ (f12). Die Frage „Wie gut haben Sie den Inhalt des Vortrags verstanden? “ sollte auf einer Skala von 1 = sehr gut bis 7 = sehr schlecht bewertet werden. Der Median war in Gruppe B (unflüssig) mit 3 schlechter als in Gruppe A (2), im Rangsum‐ mentest zeigt sich kein signifikanter Unterschied zwischen den beiden Ver‐ suchsgruppen (Mann-Whitney-U 274,500; 2-seitige Sig. 0,974) (siehe Tabelle 45). Gruppe A (flüssig) Gruppe B (unflüssig) n 24 23 Median 2 3 Minimum 1 1 Maximum 5 5 Mittlerer Rang 23,94 24,07 Rangsumme 574,50 553,50 Tabelle 45: Bewertung des subjektiven Verständnisses nach Versuchsgruppe 154 5 Ergebnisse 20,83 33,33 12,5 25 8,33 17,39 30,43 30,43 13,04 8,7 0 5 10 15 20 25 30 35 1 = sehr gut 2 3 4 5 6 7 = sehr schlecht Subjektives Verständnis (in Prozent) Gruppe A (flüssig) Gruppe B (unflüssig) Abbildung 15: Bewertung des subjektiven Verständnisses nach Versuchsgruppe Häufigkeit Prozent Kumulierte Prozente 1 5 20,8 20,8 2 8 33,3 54,2 3 3 12,5 66,7 4 6 25 91,7 5 2 8,3 100 6 - - - 7 - - - Gesamt 24 100 Tabelle 46: Bewertung des subjektiven Verständnisses von 1 = sehr gut bis 7 = sehr schlecht (Gruppe A) 155 5.3 Subjektive Bewertung Häufigkeit Prozent Kumulierte Prozente 1 4 17,4 17,4 2 7 30,4 47,8 3 7 30,4 78,3 4 3 13 91,3 5 2 8,7 100 6 - - - 7 - - - Gesamt 23 100 Tabelle 47: Bewertung des subjektiven Verständnisses von 1 = sehr gut bis 7 = sehr schlecht (Gruppe B) Häufigkeit Prozent Kumulierte Prozente 1 9 19,1 19,1 2 15 31,9 51,1 3 10 21,3 72,3 4 9 19,1 91,5 5 4 8,5 100 6 - - - 7 - - - Gesamt 47 100 Tabelle 48: Bewertung des subjektiven Verständnisses von 1 = sehr gut bis 7 = sehr schlecht (Gesamt) 5.3.5.1 Einflussfaktoren Die Versuchspersonen, deren Muttersprache nicht Deutsch war (n = 11), beur‐ teilten ihr eigenes Verständnis mit einem Median von 3 zwar schlechter als jene mit Deutsch als Muttersprache (n = 36), bei denen der Median bei 2 lag, der Mann-Whitney U-Test zeigt aber, dass der Unterschied zwischen den mittleren 156 5 Ergebnisse Rängen der beiden Gruppen (22,54 für die Deutsch-MuttersprachlerInnen, 28,77 für jene mit anderer Muttersprache) nicht signifikant ist (zweiseitige Sig. 0,174). Auch bei den anderen Einflussfaktoren gab es keinen signifikanten Unterschied: Für den Zusammenhang mit dem Geschlecht der TeilnehmerInnen betrug die zweiseitige Signifikanz für einen Rangsummentest nach Mann-Whitney 0,669, für den Tag des Versuchs (Dienstag oder Donnerstag) betrug sie 0,626 und für die Dolmetscherfahrung 0,220. Für die Bekanntheit des Themas wurde eine Spearman-Korrelation berechnet, die mit r = 0,144 und Sig. = 0,335 ebenfalls unter dem Signifikanzniveau liegt. Lediglich beim Alter ergab sich eine schwache negative Korrelation (r = -0,335, Sig. = 0,21). 5.3.5.2 Zusammenhang mit anderen Bewertungen Werden die ProbandInnen allerdings nicht nach Versuchsgruppen sondern wie in 5.3.3.1 nach subjektiv empfundener Flüssigkeit gruppiert, zeigt sich ein sig‐ nifikanter Unterschied (siehe Tabelle 49): Jene, die die Flüssigkeit eher positiv (1-3) bewertet hatten, schätzten ihre eigene Verstehensleistung signifikant besser ein als jene, die die Flüssigkeit eher negativ (4-7) bewertet hatten (Mann-Whitney-U 69,500, exakte 1-seitige Signifikanz 0,033). Aufgrund der ge‐ ringen Gruppengröße in der schlechteren Bewertungskategorie (n = 7) muss bei der Interpretation dieser Ergebnisse jedoch vorsichtig vorgegangen werden. Flüssigkeitsbewertung 1-3 Flüssigkeitsbewertung 4-7 n 40 7 Median 2 4 Minimum 1 2 Maximum 5 5 Mittlerer Rang 22,24 34,07 Rangsumme 889,50 238,50 Tabelle 49: Bewertung des subjektiven Verständnisses nach Flüssigkeitsbewertung Auch wenn ausgehend von der Gesamtbewertung zwei Gruppen gebildet werden (siehe 5.3.4), gibt es einen signifikanten Unterschied (Mann-Whitney-U 33,000, 2-seitige Sig. 0,014) zwischen ihnen (siehe Tabelle 50): Jene, deren Ge‐ samtbewertung für die Fragen 13-15 (Leistung der Dolmetscherin, Flüssigkeit und Intonation) eher positiv (1-3) ausfiel, schätzten ihr Verständnis der Dol‐ metschung signifikant besser ein als jene, deren Gesamtbewertung schlechter 157 5.3 Subjektive Bewertung 22,5 35 20 15 7,5 0 0 0 14,29 28,57 42,86 14,29 0 0 05 10 15 20 25 30 35 40 45 50 1 = sehr gut 2 3 4 5 6 7 = sehr schlecht Subjektives Verständnis (in Prozent) 1-3 eher flüssig 4-7 eher unflüssig Abbildung 16: Bewertung des subjektiven Verständnisses nach Flüssigkeitsbewertung als 3 war. Die obengenannte Einschränkung aufgrund der Gruppengröße gilt hier allerdings in noch größerem Maße, da nur 5 Versuchspersonen in der Gruppe waren, die die schlechtere Gesamtbewertung abgegeben hatte. Gesamtbewertung 1-3 Gesamtbewertung > 3 n 39 5 Median 2 4 Minimum 1 3 Maximum 5 5 Mittlerer Rang 20,85 35,40 Rangsumme 813,00 177,00 Tabelle 50: Bewertung des subjektiven Verständnisses nach Gesamtbewertung (2 Gruppen) Die Selbsteinschätzung des Verständnisses korreliert zwar nicht mit den ein‐ zelnen paralinguistischen Variablen, hat aber, wie aus Tabelle 51 ersichtlich, einen mittelstarken Zusammenhang mit der Gesamtbewertung (Sig. 0,008 > 0,05): 158 5 Ergebnisse Spearman-Rho Flüssigkeit Ø Intonation & Flüssigkeit Ø Fragen 13-15 Einschätzung Verständnis Korrelations‐ koeffizient 0,164 0,142 0,398 Sig. (2-seitig) 0,270 0,342 0,008 n 47 47 44 Tabelle 51: Spearman-Korrelation von Bewertung des subjektiven Verständnisses mit paralinguistischen Variablen bzw. Gesamtbeurteilung Interessant ist auch die hochsignifikante mittelstarke Korrelation des subjek‐ tiven Verständnisses und der subjektiven Einschätzung der Leistung der Dol‐ metscherin (siehe Tabelle 52): Spearman-Rho Bewertung Dolmetschung Einschätzung Verständnis Korrelationskoeffizient 0,533 Sig. (2-seitig) 0,000 n 44 Tabelle 52: Spearman-Korrelation von Bewertung des subjektiven Verständnisses mit Bewertung der Dolmetschleistung Trotz dieser signifikanten Korrelation lässt sich hier kein genauer kausaler Zu‐ sammenhang bestimmen. Es ist sowohl möglich, dass ein subjektiv schlechter empfundenes Verständnis der Dolmetschung zur Last gelegt wurde, als auch, dass ProbandInnen bei einer als eher nicht gut wiedergegeben empfundenen Dolmetschung das Gefühl hatten, sie schlechter verstanden zu haben. Diese subjektiv schlechtere Einschätzung der eigenen Verstehensleistung entspricht allerdings nicht dem tatsächlichen Verständnis, wie der nächste Ab‐ schnitt zeigt. 5.3.5.3 Zusammenhang mit dem Hörverständnistest Ein Vergleich der Bewertung des subjektiven Verständnisses mit dem Ergebnis des Hörverständnistests zeigte, dass zwischen diesen beiden Faktoren keine Korrelation besteht (siehe Tabelle 53). Dies bedeutet, dass die Versuchspersonen nicht in der Lage waren, ihre eigene Leistung realistisch einzuschätzen. 159 5.3 Subjektive Bewertung Spearman-Rho Gesamtscore Einschätzung Verständnis Korrelationskoeffizient -0,033 Sig. (2-seitig) 0,826 n 47 Tabelle 53: Spearman-Korrelation von Bewertung des subjektiven Verständnisses mit Gesamtscore Es bedeutet auch, dass die schlechtere Bewertung des eigenen Verständnisses durch jene ProbandInnen, die die Dolmetschung als eher unflüssig empfanden (siehe Tabelle 49), nicht der Realität entspricht. Weder die Redeflüssigkeit der Versuchsgruppen (siehe Tabelle 17) noch die subjektiv empfundene Redeflüs‐ sigkeit hatten also einen Einfluss auf die Leistung beim Hörverständnistest. 160 5 Ergebnisse 6 Diskussion und Schlussfolgerungen In der vorliegenden Arbeit wurde der Einfluss von Redeflüssigkeit auf zwei Qualitätsperspektiven untersucht: die von DolmetscherInnen wie auch von NutzerInnen oft geforderte kognitive Wirkungsäquivalenz sowie die subjektive Bewertung durch die NutzerInnen. Dazu wurden zunächst die Begriffe Dolmetschqualität und Redeflüssigkeit eingehend besprochen und für die Zwecke der Arbeit definiert. Darauf folgte ein Überblick über Untersuchungen zu Redeflüssigkeit in der Dolmetschwis‐ senschaft. Dabei wurde gezeigt, dass es in diesem Bereich einerseits Arbeiten gibt, die sich ausschließlich mit Redeflüssigkeit befassen, indem sie Flüssig‐ keitsmerkmale in Ausgangsbzw. Zieltext untersuchen, andererseits solche, bei denen Flüssigkeit als eines von mehreren Qualitätsmerkmalen in Erwartungs‐ erhebungen bzw. Beurteilungen von Dolmetschungen vorkommt, wobei es auch in dieser Kategorie Untersuchungen gibt, in denen dezidiert der Einfluss der Redeflüssigkeit auf die Bewertung einer Dolmetschung gemessen wird. Schließ‐ lich wurde eine kleine Auswahl von Studien zur Messung der Verständlichkeit von Dolmetschungen vorgestellt und alle genannten Methoden wurden kritisch hinterfragt. Aufbauend auf diesen Überlegungen wurde die Entwicklung des Versuchs‐ designs und -materials für das Experiment zur Untersuchung des Einflusses von Redeflüssigkeit auf die kognitive Wirkung und subjektive Bewertung be‐ schrieben. Ziel dieses Experiments war es, ausgehend von einem komplexen Qualitäts‐ verständnis, das sowohl die produktbezogene Qualität als auch die subjektive Bewertung durch die NutzerInnen berücksichtigt, festzustellen, ob der Grad der Flüssigkeit einer Dolmetschung die Verständlichkeit derselben einerseits und die subjektive Bewertung der Dolmetschung durch die RezipientInnen ande‐ rerseits beeinflusst. Dazu wurde im Rahmen des QuaSI-Projekts ein Versuchsdesign entwickelt, bei dem so viele Variablen wie möglich kontrolliert wurden, gleichzeitig aber der Eindruck einer echten Dolmetschung erweckt werden sollte. Mit einer ei‐ gens für das Projekt entwickelten Methode zur apparativen Manipulation von Redeflüssigkeit wurden zwei bis auf die Redeflüssigkeit identische Versionen einer Dolmetschung erzeugt, die zwei Gruppen von Versuchspersonen vorge‐ spielt wurden. Allerdings wurde darauf geachtet, dass den Versuchspersonen nicht klar war, dass es sich um ein Laborexperiment handelte. Dazu wurde eine echte Dolmetschsituation simuliert, indem an der Wirtschaftsuniversität Wien im Rahmen einer Lehrveranstaltung zum Thema internationales Marketing zwei mobile Dolmetschkabinen aufgestellt wurden. In diesen Kabinen saß je‐ weils eine Dolmetscherin, die eine der beiden manipulierten Versionen nach‐ sprach. Die ProbandInnen sollten also den Eindruck gewinnen, sie würden diesen Dolmetscherinnen live zuhören, hörten aber in Wirklichkeit eine der beiden manipulierten Versionen. Danach wurden die ProbandInnen gebeten, einen Fragebogen auszufüllen, der aus einem Hörverständnistest, einigen sub‐ jektiven Bewertungsfragen sowie Fragen zur Erfassung von Hintergrundvari‐ ablen bestand. Die Ergebnisse dieses Versuchs wurden in Kapitel 5 im Detail beschrieben und analysiert. In diesem Kapitel sollen nach einer kritischen Betrachtung der Methode und der sich daraus ergebenden Einschränkungen die in 4.1 gestellten Forschungsfragen beantwortet werden. Im Anschluss daran wird die Bedeutung dieser Ergebnisse für die Dolmetschpraxis, Lehre und Dolmetschwissenschaft besprochen und es wird ein Ausblick auf mögliche zukünftige Forschungsvor‐ haben geboten. 6.1 Forschungsfragen und Antworten Zu Beginn der in dieser Arbeit beschriebenen empirischen Untersuchung wurde eine Reihe von Versuchsfragen gestellt, die hier nun nochmals besprochen und beantwortet werden sollen. Die Auswirkung von Redeflüssigkeit auf zwei Qualitätsperspektiven - die objektive Messung von kognitiver Wirkung und die subjektive Bewertung durch die RezipientInnen - stand dabei im Mittelpunkt. An dieser Stelle sei ausdrücklich darauf hingewiesen, dass aus den Ergeb‐ nissen dieses Versuchs keine Schlüsse für Konferenzdolmetschungen allgemein oder auch nur Marketingstudierende gezogen werden können. Um tatsächlich Ergebnisse auf eine Gesamtpopulation umlegen zu können, muss aus dieser eine repräsentative Zufallsstichprobe in der angemessenen Größe gezogen werden. Außerdem müsste die Gesamtpopulation zuerst definiert werden: sollen es NutzerInnen von Dolmetschleistungen allgemein sein, müsste aus allen Ländern und Fachgebieten eine repräsentative Stichprobe gezogen werden, was kaum möglich erscheint. Sinnvoller erscheint es, für einzelne Fachgebiete und Dol‐ metschsituationen (Konferenzen am freien Markt, Internationale Organisati‐ onen usw.) eigene Studien durchzuführen. Außerdem gelten die Ergebnisse nur 162 6 Diskussion und Schlussfolgerungen für die deutsche Sprache. Bei anderen Sprachen könnten die Ergebnisse stärker oder schwächer ausfallen. Die Ergebnisse gelten also nur für die hier beschriebenen Versuchspersonen, das verwendete Versuchsmaterial und die Sprache Deutsch. 1 Hat Redeflüssigkeit einen Einfluss auf die Verständlichkeit einer Dol‐ metschung? Die Hauptfrage der Studie lässt sich mit einem klaren Nein beantworten: Weder die Manipulation des Flüssigkeitsgrades noch der subjektiv von den einzelnen TeilnehmerInnen wahrgenommene Flüssigkeitsgrad hatten einen signifikanten Einfluss auf die kognitive Wirkung der Dolmetschung. Zur Beantwortung dieser Frage wurden die Ergebnisse des Hörverständnis‐ tests nach Versuchsgruppen (flüssig und unflüssig) sowie nach subjektiver Bewertung der Flüssigkeit auf einer Skala von 1 (sehr flüssig) bis 7 (sehr un‐ flüssig) ausgewertet. Dabei zeigte sich weder zwischen den Versuchsgruppen noch bei einer Einteilung der ProbandInnen in zwei Gruppen nach Flüssig‐ keitsbewertung (siehe 5.3.1.2) ein signifikanter Unterschied. Es bestand auch keine signifikante Korrelation zwischen Flüssigkeitsbewertung und Leistung beim Hörverständnistest. Es lässt sich also feststellen, dass bei dem hier eingesetzten Grad der Flüssig‐ keitsmanipulation, der, wie bereits in 4.5.5 erwähnt, durchaus im Rahmen einer realistischen Leistung einer professionellen Konferenzdolmetscherin liegt, kein Einfluss auf die kognitive Wirkung (gemessen mittels Hörvers‐ tändnistest) besteht. Bei einer stärker veränderten Version wäre der Effekt sowohl in Bezug auf die kognitive Wirkung als auch die subjektive Bewertung womöglich stärker ausgefallen, davon wurde aber bewusst Abstand ge‐ nommen. 2 Hat Redeflüssigkeit einen Einfluss auf die Einschätzung der Verständ‐ lichkeit durch die ZuhörerInnen? Zur Beantwortung dieser Frage muss abermals auf den Unterschied zwischen Grad der Flüssigkeit im Sinne der Manipulation des Materials (Unterschei‐ dung nach Versuchsgruppen) und von den ProbandInnen subjektiv empfun‐ dener Flüssigkeit hingewiesen werden. Obwohl sich die allgemeine Flüssig‐ keitsbewertung der beiden Versionen des Versuchsmaterials signifikant unterscheidet und eine schwache bis mittlere Korrelation zwischen der Ver‐ suchsgruppe und der Bewertung der Flüssigkeit besteht, sodass gesagt werden kann, dass die Manipulation geglückt ist, scheint die Bewertung des Verständnisses eher mit der individuellen Einschätzung der Flüssigkeit als 163 6.1 Forschungsfragen und Antworten mit der Gruppenzugehörigkeit zusammenzuhängen. Da es bei der Redeflüs‐ sigkeit, wie sich in 5.3.1 zeigte, durchaus individuelle Präferenzen zu geben scheint (z. B. dass Pausen als hilfreich statt als störend angesehen werden können), ist dies nicht verwunderlich. Betrachten wir die Einschätzung des Verständnisses nach Flüssigkeitsbewer‐ tung, so kann festgestellt werden, dass es einen signifikanten Zusammenhang zwischen den beiden Faktoren gibt: Wer die Flüssigkeit als eher gut beurteilte, war auch der Meinung, die Dolmetschung gut verstanden zu haben, während jene, die die Dolmetschung als eher unflüssig beurteilten, auch der Meinung waren, die Dolmetschung nicht so gut verstanden zu haben (siehe 5.3.5.2). Dies entsprach allerdings nicht unbedingt der Realität (siehe Forschungsfrage 4). 3 Können Versuchspersonen den Grad der Flüssigkeit einer Verdolmet‐ schung beurteilen? Wie bei der vorherigen Frage bereits angesprochen gab es zwischen den Ver‐ suchsgruppen einen signifikanten Unterschied in der Bewertung der Flüs‐ sigkeit: Gruppe A, die die flüssigere Version gehört hatte, beurteilte diese wesentlich besser als Gruppe B die unflüssigere Version. In Gruppe A beur‐ teilten 91,7 % der ProbandInnen die Dolmetschung auf der 7-stelligen Skala (bei der 1 als sehr flüssig und 7 als sehr unflüssig verankert war) im positiven Bereich, also zwischen 1 und 3, während dies in Gruppe B nur bei 78,3 % der Fall war. Der Median ist in Gruppe A mit 2 auch besser als in Gruppe B (3). Die Signifikanz dieses Unterschieds wurde durch einen Rangsummentest und die Berechnung der Korrelation bestätigt. Es kann also gesagt werden, dass Versuchspersonen den Grad der Redeflüs‐ sigkeit auch ohne einen direkten Vergleich beurteilen können und die Mani‐ pulation der Redeflüssigkeit erfolgreich war. Es sei an dieser Stelle auch noch einmal darauf hingewiesen, dass auch in Gruppe B keine schlechtere Bewer‐ tung als 5 (auf einer Skala von 1 bis 7) abgegeben wurde, was mit der Ein‐ schätzung des QuaSI-Teams und des am Versuch beteiligten Dolmetschtech‐ nikers übereinstimmt, dass auch die unflüssigere Dolmetschung wie eine durchaus akzeptable professionelle Dolmetschleistung klang. 4 Können Versuchspersonen den Grad ihres Verständnisses selbst beur‐ teilen? Beim Vergleich der Ergebnisse des Hörverständnistests mit der subjektiven Bewertung des eigenen Verständnisses zeigte sich keine Korrelation. Die Versuchspersonen waren also nicht in der Lage, ihre eigene Leistung realis‐ 164 6 Diskussion und Schlussfolgerungen tisch einzuschätzen. Dies ist vor allem angesichts der Ergebnisse der For‐ schungsfragen 2 und 5 ein Resultat, das in der Dolmetschdidaktik und -praxis berücksichtigt werden sollte, da man annehmen kann, dass solche (Fehl)Ein‐ schätzungen dessen, wieviel man von einem gedolmetschten Vortrag ver‐ standen hat, auch in der Praxis vorkommen und sich somit eine eher unflüs‐ sige Dolmetschung negativ auf die Bewertung der Kompetenz der DolmetscherIn und der Verständlichkeit der Dolmetschung auswirken kann. 5 Besteht ein Zusammenhang zwischen der subjektiven Bewertung des Verständnisses und der subjektiven Bewertung der Kompetenz bzw. Professionalität der DolmetscherIn? Zwischen diesen Faktoren besteht eine mittlere Korrelation, die auf 0,01-Ni‐ veau signifikant ist. Dies bedeutet, dass ProbandInnen, die der Meinung waren, die Dolmetschung schlecht verstanden zu haben, auch die Kompetenz der Dolmetscherin schlechter bewerteten. Umgekehrt bewerteten Personen, die die Dolmetschung besser verstanden, auch die Leistung der Dolmet‐ scherin besser. Daraus lässt sich zwar nicht schließen, dass das subjektiv schlechtere Verständnis der Dolmetscherin zur Last gelegt wurde, es besteht aber auf jeden Fall ein hochsignifikanter Zusammenhang, der nur mit 0,01 % Wahrscheinlichkeit Zufall ist. 6 Besteht ein Zusammenhang zwischen Flüssigkeit und der subjektiven Bewertung der Kompetenz bzw. Professionalität der DolmetscherIn? Während es zwischen den Versuchsgruppen keinen Unterschied bei der Be‐ wertung der Leistung der Dolmetscherin gibt, ist dies bei der subjektiv emp‐ fundenen Flüssigkeit anders: Sowohl die subjektiv empfundene Flüssigkeit als auch der kombinierte Parameter der Bewertungen von Flüssigkeit und Intonation korrelieren schwach mit der Bewertung der Leistung der Dolmet‐ scherin. Personen, die die Rede als unflüssiger und/ oder eher monoton emp‐ fanden, bewerteten die Leistung der Dolmetscherin schlechter als jene, die die Rede als flüssig bzw. lebendig empfanden. Eine Kausalität lässt sich hie‐ raus allerdings nicht ableiten. 7 Bewerten Personen, die bereits Verdolmetschungen gehört haben, die gehörte Dolmetschleistung anders als jene ohne Erfahrung? Es gab keinen signifikanten Unterschied bei der Bewertung, allerdings han‐ delte es sich nur um fünf Personen, die zwischen 1 und 4 Dolmetschungen gehört hatten. 165 6.1 Forschungsfragen und Antworten 8 Hat die Erstsprache der ZuhörerInnen Einfluss auf das Verstehen und deren subjektive Bewertung des Verständnisses? Versuchspersonen, deren Muttersprache nicht Deutsch war, erzielten beim Hörverständnistest im Durchschnitt schlechtere Ergebnisse als jene mit Deutsch als Muttersprache. Dieser Unterschied war zwar nicht signifikant, es kann aber nicht ausgeschlossen werden, dass es hier einen Einfluss gab. Allerdings kamen die schlechtesten Ergebnisse aus der Gruppe der Deutsch-MuttersprachlerInnen. Die Versuchspersonen mit einer anderen Muttersprache als Deutsch bewer‐ teten ihr eigenes Verständnis tendenziell schlechter als die Deutsch-Mutter‐ sprachlerInnen, auch dieser Unterschied ist aber nicht signifikant. 9 Haben demographische Faktoren (Alter, Geschlecht der Versuchsper‐ sonen) eine Auswirkung auf das Verstehen und die subjektive Bewer‐ tung des Verständnisses? Das Alter der Versuchspersonen war relativ homogen. Es hatte keine Aus‐ wirkungen auf die Ergebnisse des Hörverständnistests. Bei der subjektiven Bewertung gab es eine geringfügige negative Korrelation, was bedeutet, dass ältere Versuchspersonen ihr eigenes Verständnis etwas schlechter einge‐ schätzt hatten als jüngere. Das Geschlecht hatte weder auf die kognitive Leistung noch auf deren sub‐ jektive Bewertung einen Einfluss. 6.2 Kritische Fragen zur Methode und Inferenzierbarkeit Die vorliegende Studie wurde im Rahmen des QuaSI-Projekts sorgfältig geplant und vorbereitet. Das Versuchsdesign wurde im QuaSI-Team gemeinsam entwi‐ ckelt und bereits vor diesem Versuch erfolgreich von Reithofer (2014) eingesetzt. Die Verwendung von Hörverständnistests war bereits in einem Pilotversuch (Grübl 2010) erprobt und ebenfalls von Reithofer (2014) weiterentwickelt worden. Besonders hervorzuheben ist hier der kognitive Prätest, dem der Fra‐ gebogen unterzogen wurde (Reithofer 2014: 149-155), was in der Dolmetsch‐ wissenschaft immer noch selten getan wird. Somit konnte für den vorliegenden Versuch ein Fragebogen verwendet werden, der bereits einem Prätest unter‐ zogen und auch im praktischen Versuch von Reithofer erprobt worden war. Umso erstaunlicher ist es, dass die Trennschärfe der Items sich im vorliegenden Versuch so stark von denen Reithofers unterscheidet (vgl. 4.6.2.2). Bei der Be‐ wertung der Ergebnisse des vorliegenden Versuchs muss berücksichtigt werden, 166 6 Diskussion und Schlussfolgerungen dass eine Frage aufgrund der negativen Trennschärfe vom Hörverständnistest ausgeschlossen werden musste. 6.2.1 Gedächtnis Eine weitere Einschränkung betrifft das Versuchsdesign selbst. Da die Ver‐ suchspersonen während des Vortrags keine Notizen machen durften, kann be‐ hauptet werden, dass der verwendete Test nicht nur das Hörverständnis sondern auch das Merkvermögen misst, da bei den Multiple Choice-Fragen die richtigen Antworten wiedererkannt und bei den halboffenen Fragen sogar selbst formu‐ liert werden müssen. Obwohl der Test unmittelbar auf den Vortrag folgte, ist nicht auszuschließen, dass Personen mit einem besseren auditiven Merkver‐ mögen im Vorteil waren. Durch die Verwendung einer Mischung verschiedener Fragetypen wurde versucht, die Auswirkungen interpersoneller Unterschiede zu minimieren. Die Ergebnisse des Hörverständnistests, die für beide Gruppen beinahe gleich ausfallen, lassen annehmen, dass dies gelungen ist. Auch die Tatsache, dass die halboffenen Fragen, die das meiste Erinnerungsvermögen erfordern, eine mittlere bis niedrige Itemschwierigkeit hatten und von mehr TeilnehmerInnen richtig beantwortet wurden als einige der Multiple Choice-Fragen, lässt den Schluss zu, dass unterschiedliches Merkvermögen im vorliegenden Fall die Ergebnisse nicht verfälschte. 6.2.2 Versuchspersonen Eine weitere Frage betrifft die Auswahl der Versuchspersonen. Die Proban‐ dInnen waren Studierende und somit keine FachexpertInnen im eigentlichen Sinn. Man könnte argumentieren, dass KonferenzteilnehmerInnen in der Regel über mehr Fachwissen auf ihrem Gebiet verfügen als Studierende. Dies ist zwar richtig, allerdings wäre es kaum möglich, eine ausreichend große Gruppe von ExpertInnen mit gleichem Hintergrundwissen für ein Experiment zu gewinnen. Die Versuchspersonen können in diesem Fall zwar nur als Semi-ExpertInnen bezeichnet werden, haben aber den großen Vorteil eines einigermaßen homo‐ genen Wissensstandes, sodass davon ausgegangen werden kann, dass das Hin‐ tergrundwissen die Ergebnisse des Hörverständnistests nicht beeinflusste. Da der Vortrag von einem Universitätslektor gehalten wurde, kann argumentiert werden, dass er für das Zielpublikum durchaus angemessen und realistisch war. Eine weitere mögliche Einschränkung betrifft die Sprachbeherrschung: da unter den Versuchspersonen mehrere waren, deren Muttersprache nicht Deutsch war, musste angenommen werden, dass diese womöglich weniger ver‐ 167 6.2 Kritische Fragen zur Methode und Inferenzierbarkeit stehen würden als jene mit Deutsch als Muttersprache. Die Auswertung bestä‐ tigte dies: die Versuchspersonen, die eine andere Muttersprache als Deutsch hatten, erzielten schlechtere Ergebnisse als jene, deren Muttersprache Deutsch war, allerdings war der Unterschied statistisch nicht signifikant. Dieses mög‐ liche Problem wurde von Anfang an berücksichtigt und durch die vorherge‐ hende Parallelisierung nach Muttersprache weitgehend neutralisiert. Die Aus‐ wertung der Ergebnisse nach Muttersprache zeigte, dass die Ergebnisse für die jeweiligen Sprachgruppen in beiden Versuchsgruppen vergleichbar waren. Wei‐ ters kamen die jeweils schlechtesten Ergebnisse in beiden Versuchsgruppen von Personen mit Deutsch als Muttersprache. Außerdem ist anzumerken, dass im fraglichen Studiengang die Unterrichtssprache Deutsch ist und daher davon auszugehen ist, dass auch die Studierenden mit einer anderen Muttersprache als Deutsch die deutsche Sprache gut genug beherrschten, um daran teilzunehmen. 6.3 Schlussfolgerungen Nachdem die Forschungsfragen beantwortet und mögliche methodische Ein‐ schränkungen diskutiert wurden, sollen hier die Implikationen der Ergebnisse für die Praxis von KonferenzdolmetscherInnen, die Dolmetschdidaktik sowie die Dolmetschforschung besprochen werden. Obwohl die Ergebnisse, wie in 6.1 besprochen, nicht verallgemeinert werden können, erlaubt es die realitätsnahe Versuchsanordnung zumindest, Hypo‐ thesen zu formulieren, die in Replikationen für andere Fachgebiete, NutzerIn‐ nengruppen und Sprachen überprüft werden können. 6.3.1 Bedeutung von Flüssigkeit beim Dolmetschen in der Praxis Die vorliegende Arbeit geht von einem komplexen Qualitätsbegriff aus, bei dem die subjektive KundInnenperspektive bei der Dienstleistung Dolmetschen ebenso einzubeziehen ist wie die produktbezogene Qualität, die hier als kogni‐ tive Wirkungsäquivalenz definiert wird. Daher müssen auch bei der Betrach‐ tung der Implikationen für die Praxis von KonferenzdolmetscherInnen beide Perspektiven berücksichtigt werden. Sollten sich die Ergebnisse der subjektiven NutzerInnenbewertung auch für andere Fachbereiche und Zielgruppen replizieren lassen - was aufgrund ähnlich gelagerter Ergebnisse z. B. von Garzone (2003) nicht unwahrscheinlich ist -, so wäre es im Eigeninteresse von DolmetscherInnen, sich um eine flüssige Dar‐ bietung zu bemühen, um zu vermeiden, dass KundInnen fälschlicherweise den 168 6 Diskussion und Schlussfolgerungen Eindruck gewinnen, die Dolmetscherin habe schlechte Arbeit geleistet, und glauben, weniger verstanden zu haben als tatsächlich der Fall ist. Andererseits können die Ergebnisse des Hörverständnistests aber auch zur KundInnenbildung verwendet werden. Für KollegInnen, die auf dem freien Dol‐ metschmarkt mit häufig wechselnden KundInnen, die nur gelegentlich an Kon‐ ferenzen teilnehmen, tätig sind, wird dies schwer zu bewerkstelligen sein, doch es ist zumindest vorstellbar, dass DolmetscherInnen in internationalen Institu‐ tionen Ergebnisse von Hörverständnistests, die belegen, dass die kognitive Wir‐ kung von der Redeflüssigkeit nicht negativ beeinflusst wird, als Argumente vorbringen können. Dafür wären selbstverständlich Replikationen im jewei‐ ligen institutionellen Kontext und idealerweise mit dem tatsächlichen Zielpub‐ likum sinnvoll und notwendig, um sicherzustellen, dass die hier für eine kleine Gruppe erzielten Ergebnisse auch auf die jeweilige Zielgruppe zutreffen. 6.3.2 Bedeutung für die Dolmetschdidaktik Für die Dolmetschdidaktik ist das Ergebnis dieser Studie von großem Interesse: Wenn bekannt ist, dass in der Praxis KundInnen die Leistung von Dolmetscher‐ Innen danach beurteilen, wie flüssig ihre Dolmetschung wirkt, dann sollte diese Erkenntnis selbstverständlich an die Studierenden weitergegeben werden und bei der Ausbildung nicht nur auf inhaltliche, sprachliche und terminologische Korrektheit, sondern auch auf Flüssigkeit und womöglich auch andere proso‐ dische Merkmale Wert gelegt werden. Auch wenn prosodische Merkmale der inhaltlichen und sprachlichen Korrektheit hintangestellt werden sollten, so ist es im Hinblick auf die zukünftige Karriere der Studierenden sinnvoll und not‐ wendig, ihnen zu vermitteln, welche Qualitätsvorstellungen KundInnen haben und aus welchen Gründen sie diese berücksichtigen sollten. Konsequenzen könnten die Ergebnisse auch für die Bewertung von Dol‐ metschleistungen haben: Dabei sollte klar zwischen inhaltlichen, sprachlichen und prosodischen Merkmalen unterschieden werden, um sicherzustellen, dass nicht auch hier der Gesamteindruck von der Redeflüssigkeit beeinflusst wird. Da Flüssigkeit aber, wie soeben festgestellt, auch in der Ausbildung berücksich‐ tigt werden sollte, kann und sollte sie dennoch einen Teil der Beurteilungskri‐ terien bilden. Dies ist in der Praxis allerdings z. B. an der Universität Wien oh‐ nehin bereits der Fall. Auch in den Beurteilungskriterien für Akkreditierungstests bei der EU ist Redeflüssigkeit ein Kriterium (EU 2013). 169 6.3 Schlussfolgerungen 6.3.3 Bedeutung für die Wissenschaft Aus wissenschaftlicher Sicht sind die Ergebnisse dieser Studie wie auch die Studie selbst von großem Interesse. Einerseits wurde damit, wie bereits von Reithofer (2014), eine gut anwendbare Methode zur Erforschung der kognitiven Wirkung von Dolmetschleistungen vorgestellt und im Detail erläutert. Es wurde auf wesentliche Kritikpunkte (z. B. von Moser-Mercer 2008) eingegangen, indem für den verwendeten Fragebogen Prätests durchgeführt wurden und bei der Auswertung klar nach parametrischen und nichtparametrischen Datenniveaus unterschieden wurde. Der vorliegende Versuch zeigt auch, dass es möglich ist, einzelne paralinguistische prosodische Merkmale isoliert zu betrachten und somit mehr über ihre Bedeutung für die subjektive Bewertung und die kognitive Wirkung von Dolmetschungen zu lernen. Die für die vorliegende Studie entwickelte Methode zur Manipulation der Flüssigkeit hat sich im Versuch bewährt. Mit dieser Methode ist es möglich, die Flüssigkeit so zu verändern, dass zwar ein signifikanter Unterschied in der Flüs‐ sigkeit der Versuchsversionen entsteht, diese aber dennoch glaubwürdig klingen und auch für eine professionelle Simultandolmetschung realistisch sind. Vor allem die Glaubwürdigkeit ist für Versuche dieser Art von größter Bedeutung und sollte auch bei Replikationen berücksichtigt werden. Damit ist gemeint, dass die ZuhörerInnen an keiner Stelle den Eindruck bekommen sollten, sie hörten eine manipulierte Tonspur. Diese Methode kann aus technischer Sicht auch zur Manipulation von Dolmetschungen in anderen Sprachen verwendet werden, die Wahl der (Un)flüssigkeitsmerkmale und deren Platzierung müssen allerdings an die Gegebenheiten der jeweiligen Sprache angepasst werden. Für die weitere Forschung eröffnet sich mit dieser isolierten Betrachtung des Faktors Redeflüssigkeit die Möglichkeit, auch andere oft genannte Qualitäts‐ merkmale isoliert zu betrachten, um so ihre tatsächliche Bedeutung sowohl für die kognitive Wirkung als auch für die subjektive Qualitätsbewertung zu un‐ tersuchen. Es ist anzunehmen, dass sich mit der fortschreitenden technischen Entwicklung neue Programme und Methoden ergeben werden, mit denen so‐ wohl prosodische Merkmale als auch sprachliche Merkmale wie Terminologie oder Stil isoliert untersucht werden können. Eine Untersuchung dieser Faktoren nach den hier vorgestellten rigorosen Kriterien sowohl einzeln als auch in verschiedenen Kombinationen wäre sehr wünschenswert. Außerdem wäre eine Replikation der Studie in verschiedenen Sprachen und für verschiedene Zielgruppen bzw. Nutzergruppen von größtem Interesse. Die Studie von Lenglet (2015), in der die Auswirkung einer Kombination prosodi‐ scher Faktoren im Französischen untersucht wurde, sowie die Flüssigkeitsma‐ 170 6 Diskussion und Schlussfolgerungen nipulation von Hörbeispielen in den verschiedenen nationalen Replikationsstu‐ dien des Experiments von Zwischenberger (Pöchhacker & Zwischenberger 2015) stellen erste Schritte in diese Richtung dar. So kann die hier entwickelte Methodik hoffentlich den Weg für eine systematische Untersuchung von Qua‐ litätsmerkmalen bereiten. 171 6.3 Schlussfolgerungen Bibliografie Aguado Padilla, Karin (2002) Imitation als Erwerbsstrategie. Interaktive und kognitive Di‐ mensionen des Fremdsprachenerwerbs. Habilitationsschrift, Universität Bielefeld. http: / / karin.aguado.de/ publikationen/ downloads/ imitationalserwerbsstrategie-pdf/ view (11.09.2018) Ahrens, Barbara (2004) Prosodie beim Simultandolmetschen. Frankfurt/ Main: Peter Lang. Ahrens, Barbara, Albl-Mikasa, Michaela, Sasse, Claudia (Hrsg.) (2012) Dolmetschqualität in Praxis, Lehre und Forschung. Festschrift für Sylvia Kalina. Tübingen: Narr Francke Attempto. AIIC (1982) Practical Guide for Professional Interpreters. Genf: Association Internationale des Interprètes de Conférence. Alexieva, Bistra (1988) „Analysis of the simultaneous interpreter’s output.“ In: P. Ne‐ keman (Hrsg.) Translation, Our Future. Proceedings, XIth World Congress of FIT. Maas‐ tricht: Euroterm, 484-488. Altman, Janet (1990) „What helps effective communication? Some interpreters’ views.“ The Interpreters’ Newsletter 3, 23-32. Andres, Dörte (2000) Konsekutivdolmetschen und Notizen. Empirische Untersuchungen mentaler Prozesse bei Anfängern in der Dolmetscherausbildung und professionellen Dol‐ metschern. Dissertation, Universität Wien. Arnold, Jennifer E. & Tanenhaus, Michael K. (2011). „Disfluency effects in comprehen‐ sion: how new information can become accessible.“ In: E. Gibson & N. Perlmutter (Hrsg.) The processing and acquisition of reference. Cambridge, MA: MIT Press, 197- 217. Barik, Henri C. (1973) „Simultaneous interpretation: Temporal and quantitative data.“ Language and Speech 16 (3), 237-270. Baur, Nina & Blasius, Jörg (Hrsg.) (2014) Handbuch Methoden der empirischen Sozialfor‐ schung. Wiesbaden: Springer VS. Boersma, Paul & Weenink, David (2010). Praat: doing phonetics by computer (Version 5.1.25) [Computerprogramm]. www.praat.org/ (26.06.2010) Bortz, Jürgen & Döring, Nicola (2006) Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler. 4. Auflage. Berlin / Heidelberg: Springer. Bortz, Jürgen & Schuster, Christof (2010) Statistik für Human- und Sozialwissenschaftler. 7. Auflage. Berlin / Heidelberg: Springer. Brennan, Susan E. & Schober, Michael F. (2001) How Listeners Compensate for Disflu‐ encies in Spontaneous Speech. Journal of Memory and Language 44, 274-296. Bruhn, Manfred (2016) Qualitätsmanagement für Dienstleistungen. Handbuch für ein er‐ folgreiches Qualitätsmanagement. Grundlagen - Konzepte - Methoden. 10. Auflage. Berlin / Heidelberg: Springer-Verlag. Brumfit, Christopher (2000) „Accuracy and Fluency: The Basic Polarity.“ In: Riggenbach (Hrsg.), 61-73. Bühler, Hildegund (1986) „Linguistic (semantic) and extra-linguistic (pragmatic) criteria for the evaluation of conference interpretation and interpreters.“ Multilingua 5 (4), 231-235. Butcher, Andrew (1981) Aspects of the speech pause. Phonetic correlates and communicative functions (Institut für Phonetik, Universität Kiel, Arbeitsberichte 15). Kiel: Institut für Phonetik. Cecot, Michela (2001) „Pauses in simultaneous interpretation: A contrastive analysis of professional interpreters’ performances.“ The Interpreters’ Newsletter 11, 63-85. Chambers, Francine (1997) „What do we mean by fluency? “ System 25 (4), 535-544. Chevalier, Lucille & Gile, Daniel (2015) „A Case Study of Spontaneous Reactions.“ Forum 13 (1), 1-26. Chiaro, Delia & Nocella, Giuseppe (2004) „Interpreters‘ perception of linguistic and non-linguistic factors affecting quality: a survey through the World Wide Web.“ Meta 49 (2), 278-293. Clark, Herbert H. & Wasow, Thomas (1998) „Repeating words in spontaneous speech.“ Cognitive Psychology 37, 201-242. Council of Europe - COE (2000) Common European Framework of Reference for Languages: Learning, Teaching, Assessment. https: / / rm.coe.int/ 1680459f97 (11.09.2018) Collados Aís, Angela (1998) La evaluación de la calidad en interpretación simultánea: La importancia de la comunicación no verbal. Granada: Comares. 173 Bibliografie Collados Aís, Angela, Pradas Macías, Macarena, Stévaux, Elisabeth & García Becerra, Olalla (Hrsg.) (2007) La evaluación de la calidad en interpretación simultánea: Pará‐ metros de incidencia. Granada: Comares. Collados Aís, Ángela, Iglesias Fernández, Emilia, Pradas Macías, E. Macarena & Stévaux, Elisabeth (Hrsg.) (2011) Qualitätsparameter beim Simultandolmetschen. Interdiszipli‐ näre Perspektiven. Tübingen: Narr Francke Attempto. Collados Aís, Ángela (2015) „Quality criteria.“ In: Pöchhacker (Hrsg.), 337-338. Déjean Le Féal, Karla (1990) „Some thoughts on the evaluation of interpretation.“ In: D. Bowen & M. Bowen (Hrsg.) Interpreting - Yesterday, Today and Tomorrow. (ATA Scho‐ larly Monograph Series IV) Binghampton, New York: SUNY, 154-160. Duez, Danielle (1993). „Acoustic Correlates of Subjective Pauses.“ Journal of Psycholin‐ guistic Research 22 (1), 21-39. Eifler, Stefanie (2014) „Experiment.“ In: Baur & Blasius (Hrsg.), 195-209. Ejzenberg, Roseli (2000) „The Juggling Act of Oral Fluency: A Psycho-Sociolinguistic Metaphor.“ In: Riggenbach (Hrsg.), 287-313. EXMARaLDA (2017) Über EXMARaLDA. http: / / exmaralda.org/ de/ ueber-exmaralda/ (11.09.2018) EU (2013) Marking criteria. http: / / ec.europa.eu/ dgs/ scic/ docs/ become_an_interpreter/ marking_criteria_final_2013_long_version.pdf (11.09.2018) Fillmore, Charles J. (1979) „On Fluency.“ In: C. J. Fillmore, D. Kempler & W. S-Y. Wang (Hrsg.) Individual Differences in Language Ability and Language Behavior. New York / San Francisco / London: Academic Press, 85-101. Foddy, William (1993) Constructing Questions for Interviews and Questionnaires: Theory and Practice in Social Research. Cambridge: Cambridge University Press. Fox Tree, Jean E. (2003) „Disfluencies in Spoken Language.“ In: L. Nadel (Hrsg.) Encyc‐ lopedia of cognitive science. 1 Academic achievement - Environmental psychology. London: Nature Publishing Group, 983-986. Freed, Barbara F. (2000) „Is Fluency, Like Beauty, in the Eyes (and Ears) of the Beholder? “ In: Riggenbach (Hrsg.), 243-265. García Becerra, Olalla (2011) „Eindrucksbildung.“ In: Collados Aìs et al. (Hrsg.), 15-32. 174 Bibliografie García Becerra, Olalla, Pradas Macías, E. Macarena & Barranco-Droege, Rafael (Hrsg.) (2013). Quality in interpreting: widening the scope. Volume 1. Granada: Editorial Co‐ mares. Garzone, Giuliana (2003) „Reliability of quality criteria evaluation in survey research.“ In: A. Collados Aís, M. M. Fernández Sánchez & D. Gile (Hrsg.) La evaluación de la calidad en interpretación: Investigación. Granada: Comares, 23-30. Gerver, David ([1969]/ 2002) „The effects of source language presentation rate on the performance of simultaneous conference interpreters.“ In: F. Pöchhacker & M. Shle‐ singer (Hrsg.) The Interpreting Studies Reader. London / New York: Routledge, 53-66. Gerver, David (1972) Simultaneous and consecutive interpretation and human information processing. Social Science Research Council Research Report, Grant no. HR 566/ 1. London: Social Science Research Council. http: / / files.eric.ed.gov/ fulltext/ ED084906.pdf (11.09.2018) Goldman-Eisler, Frieda (1958) „Speech analysis and mental processes.“ Language and Speech 1 (1), 59-75. Goldman-Eisler, Frieda (1968) Psycholinguistics. Experiments in Spontaneous Speech. London / New York: Academic Press. Goldman-Eisler, Frieda (1972) „Segmentation of Input in Simultaneous Translation.“ Journal of Psycholinguistic Research 1 (2), 127-140. Grbić, Nadja (2008) „Constructing interpreting quality.“ Interpreting 10 (2), 232-257. Grbić, Nadja (2015) „Quality.“ In: Pöchhacker (Hrsg.), 333-336. Grübl, Birgit (2010) Verständlichkeit von Dolmetschleistungen. Eine Pilotstudie. Masterar‐ beit, Universität Wien. Guillot, Marie-Noëlle (1999) Fluency and its teaching. Clevedon / Philadelphia / Toronto / Sydney: Multilingual Matters. Hedge, Tricia (1993) „Key concepts in ELT (Fluency).“ ELT Journal 47 (3), 275-276. Henderson, Alan, Goldman-Eisler, Frieda & Skarbek, Andrew (1966) „Sequential temporal patterns in spontaneous speech.“ Language and Speech 9 (4), 207-216. Herbert, Jean (1952) The Interpreter’s Handbook. How to become a conference interpreter. Genf: Librairie de l’Université Georg. Hieke, Adolf E. (1981) „A content-processing view of hesitation phenomena.“ Language and Speech 24 (2), 147-160. 175 Bibliografie Hieke, Adolf E., Kowal, Sabine & O’Connell, Daniel C. (1983) „The trouble with ‘articu‐ latoryʼ pauses.“ Language and Speech 26 (3), 203-214. Holub, Elisabeth (2010) „Does intonation matter? The impact of monotony on listener comprehension.“ The Interpreters’ Newsletter 15, 117-126. IBM Corp. (2013) IBM SPSS Statistics for Windows (Version 22.0) Armonk, NY: IBM Corp. [Computerprogramm] Kadrić, Mira (2000) Dolmetschen bei Gericht. Erwartungen, Anforderungen, Kompetenzen. Wien: WUV-Universitätsverlag. Kahane, Eduardo (2000) „Thoughts on the quality of interpretation.“ Communicate! Spring 2000. https: / / aiic.net/ page/ 197/ thoughts-on-the-quality-of-interpretation/ lang/ 1 (11.09.2018) Kalina, Sylvia (2004) „Zum Qualitätsbegriff beim Dolmetschen.“ Lebende Sprachen 49 (1), 2-8. Kalina, Sylvia (2005) „Quality Assurance for Interpreting Processes.“ Meta 50 (2), 768- 784. Kalina, Sylvia (2009) „Die Qualität von Dolmetschleistungen aus der Perspektive von Forschung und Kommunikationspartnern.“ In: B. Ahrens, L. Černý, M. Krein-Kühle & M. Schreiber (Hrsg.) Translationswissenschaftliches Kolloquium I. Frankfurt/ Main: Peter Lang, 167-188. Kopczyński, Andrzej (1994) „Quality in conference interpreting: Some pragmatic prob‐ lems.“ In: M. Snell Hornby, F. Pöchhacker & K. Kaindl (Hrsg.) Translation Studies: An interdiscipline. Amsterdam / Philadelphia: John Benjamins, 189-198. Koponen, Matti & Riggenbach, Heidi (2000) „Overview: Varying Perspectives on Fluency.“ In: Riggenbach (Hrsg.), 5-24. Kurz, Ingrid (1989) „Conference interpreting - user expectations.“ In: D. Hammond (Hrsg.) Coming of Age. Proceedings of the 30th Annual Conference of the American Translators Association. Medford, NJ: Learned Information, 143-148. Kurz, Ingrid (1993) „Conference interpretation: Expectations of different user groups.“ The Interpreters’ Newsletter 5, 13-21. Kurz, Ingrid (2001) „Conference Interpreting: Quality in the Ears of the User.“ Meta 46 (2), 394-409. Kurz, Ingrid & Pöchhacker, Franz (1995) „Quality in TV interpreting.“ Translatio - Nou‐ velles de la FIT - FIT Newsletter 15 (3/ 4), 350-358. 176 Bibliografie Laver, John (1994) Principles of phonetics. Cambridge: Cambridge University Press. Lenglet, Cédric (2015) Prosodie et qualité en interprétation simultanée: analyse et percep‐ tion. Dissertation, Université de Mons. Lennon, Paul (1990) „Investigating Fluency in EFL: A Quantitative Approach.“ Language Learning 40 (3), 387-417. Lennon, Paul (2000) „The Lexical Element in Spoken Second Language Fluency.“ In: Rig‐ genbach (Hrsg.), 25-42. Lienert, Gustav & Raatz, Ulrich (1994) Testaufbau und Testanalyse. 5. Auflage. Weinheim: Beltz, Psychologie-Verl.-Union. Lindner, Gerhart (1969) Einführung in die experimentelle Phonetik. München: Max Hueber Verlag. Livingston, Sue, Singer, Bonnie & Abramson, Ted (1994) „A study to determine the ef‐ fectiveness of two kinds of interpreting.“ In: E. Winston (Hrsg.) Mapping Our Course: A Collaborative Venture. Proceedings of the Tenth National Convention, Conference of Interpreter Trainers. Charlotte, North Carolina: Conference of Interpreter Trainers, 175-197. Llewellyn-Jones, Peter ([1981]/ 2015) „Target language styles and source language pro‐ cessing in conference sign language interpreting.“ In: C. B. Roy, J. Napier (Hrsg.) The Sign Language Interpreting Studies Reader. Amsterdam / Philadelphia: John Benjamins, 129-144. Mack, Gabriele & Cattaruzza, Lorella (1995) „User surveys in simultaneous interpretia‐ tion: a means of learning about quality and/ or raising some reasonable doubts.“ J. Tommola (Hrsg.) Topics in Interpreting Research. Turku: University of Turku, 37-49. Marrone, Stefano (1993) „Quality: a shared objective.“ The Interpreters’ Newsletter 5, 35- 41. Marschark, Marc, Sapere, Patricia, Convertino, Carol, Seewagen, Rose-Marie & Maltzen, Heather (2004) „Comprehension of sign language interpreting: deciphering a complex task situation.“ Sign Language Studies 4 (4), 345-368. Mayer, Jörg (2017) Phonetische Analysen mit Praat. Ein Handbuch für Ein- und Umsteiger. Handbuch-Version 2017/ 09. http: / / praatpfanne.lingphon.net/ downloads/ praat_manual.pdf (11.09.2018) Mayer, Jörg (2018) Die Praatpfanne [Webseite] http: / / praatpfanne.lingphon.net/ praat-ressourcen/ praat-skripte (11.09.2018) 177 Bibliografie Mead, Peter (2005) „Methodological issues in the study of interpreters’ fluency.“ The In‐ terpreters’ Newsletter 13, 39-63. Meak, Lidia (1990) „Interpretation simultanée et congrès médical: attentes et commen‐ taires.“ The Interpreters’ Newsletter 3, 8-13. Mesa, Anne-Marie (2000) „The cultural interpreter: An appreciated professional. Results of a study on interpreting services: client, health care worker and interpreter points of view.“ In: R. Roda, S. Carr, D. Abraham & A. Dufour (Hrsg.) The Critical Link 2: Interpreters in the Community. Amsterdam / Philadelphia: John Benjamins, 67-79. Michalek-Kurucz, Patricia (2007) Stimmqualität beim Dolmetschen. Diplomarbeit, Uni‐ versität Wien. Möhle, Dorothea (1984) „A Comparison of the Second Language Speech Production in Different Native Speakers.“ In: H.W. Dechert, D. Möhle & M. Raupach (Hrsg.) Second Language Productions (Tübinger Beiträge zur Linguistik 240). Tübingen: Gunter Narr, 26-49. Moser, Peter (1995) Simultanes Konferenzdolmetschen. Anforderungen und Erwartungen der Benutzer. Endbericht. Wien: Stadt + Regional Forschung GmbH Moser-Mercer, Barbara (1996) „Quality in interpreting: some methodological issues.“ The Interpreters’ Newsletter 7, 43-55. Moser-Mercer, Barbara (2008) „Construct-ing quality.“ In: G. Hansen, A. Chesterman & H. Gerzymisch-Arbogast (Hrsg.) Efforts and Models in Interpreting and Translation Research. Amsterdam / Philadelphia: John Benjamins, 143-156. Murphy, Harry J. & Fleischer, Lawrence R. (1977) „The effects of Ameslan versus Siglish upon test scores.“ Journal of Rehabilitation of the Deaf 11, 15-18. Napier, Jemina (2010) „An historical overview of signed language interpreting research: Featuring highlights of personal research.“ Cadernos de Traduç-o 26 (2), 63-97. Napier, Jemina & Spencer, David (2008) „Guilty or not guilty? An investigation of deaf jurors’ access to court proceedings via sign language interpreting.“ In: D. Russell & S. Hale (Hrsg.) Interpreting in Legal Settings. Washington, D.C: Gallaudet University Press, 72-122. Ng, Bee Chin (1992) „End-users’ subjective reaction to the performance of student in‐ terpreters.“ The Interpreters’ Newsletter, Special Issue 1, 35-41. 178 Bibliografie Pfitzinger, Hartmut R. (2011) „Phonetische Analyse der Sprechgeschwindigkeit.“ For‐ schungsberichte des Instituts für Phonetik und Sprachliche Kommunikation der Univer‐ sität München (FIPKM) 38, 117-264. Pike, Kenneth L. (1967) The Intonation of American English. (University of Michigan Pub‐ lications Linguistics 1). 11. Auflage. Ann Arbor: University of Michigan. Pöchhacker, Franz (1994a) Simultandolmetschen als komplexes Handeln (Language in Per‐ formance 10). Tübingen: Gunter Narr. Pöchhacker, Franz (1994b) „Quality assurance in simultaneous interpreting.“ In: C. Dol‐ lerup & A. Lindegaard (Hrsg.) Teaching translation and interpreting 2: Insights, aims and visions. Amsterdam / Philadelphia: John Benjamins, 233-242. Pöchhacker, Franz (1997) „‘Clinton speaks Germanʼ: A case study of live broadcast si‐ multaneous interpreting.“ In: M. Snell-Hornby, Z. Jettmarová & K. Kaindl (Hrsg.) Translation as Intercultural Communication. Selected papers from the EST Congress - Prague 1995. Amsterdam / Philadelphia: John Benjamins, 207-216. Pöchhacker, Franz (2001) „Quality Assessment in Conference and Community Interpre‐ ting.“ Meta 46 (2), 410-425. Pöchhacker, Franz (2012) „Qualität, die man versteht: ein funktional-kognitiver Ansatz.“ In: Ahrens et al. (Hrsg.), 19-31. Pöchhacker, Franz (2013) „Researching quality: a two-pronged approach.“ In: García Be‐ cerra et al. (Hrsg.), 42-55. Pöchhacker, Franz (Hrsg.) (2015) Routledge Encyclopedia of Interpreting Studies. London / New York: Routledge. Pöchhacker, Franz & Zwischenberger, Cornelia (2015) „Quality and Role in Conference Interpreting. View from the East and South of Europe.“ In: C. Zwischenberger & M. Behr (Hrsg.) Interpreting Quality: A Look Around and Ahead. Berlin: Frank & Timme, 269-296. Pompino-Marschall, Bernd (1995) Einführung in die Phonetik. Berlin / New York: de Gruyter. Praat (2008) Praat Manual. www.fon.hum.uva.nl/ praat/ manual/ Sound.html (11.09.2018) Pradas Macías, Esperanza Macarena (2003) Repercusión del intraparámetro pausas silen‐ ciosas en la fluidez: Influencia en las expectativas y en la evaluación de la calidad en interpretación simultánea. Dissertation, Universidad de Granada. 179 Bibliografie Pradas Macías, Esperanza Macarena (2007) „La incidencia del parámetro fluidez.“ In: Collados Aís et al. (Hrsg.), 53-70. Pradas Macías, Esperanza Macarena (2011) „Flüssigkeit.“ In: Collados Aìs et al. (Hrsg.), 93-117. Pradas Macías, Esperanza Macarena (2015) „Fluency.“ In: Pöchhacker (Hrsg.), 165-166. Raab-Steiner, Elisabeth & Benesch, Michael (2015) Der Fragebogen: von der Forschungsidee zur SPSS-Auswertung. 4. Auflage. Wien: Facultas. Reithofer, Karin (2013) „Qualität als Wirkungsäquivalenz: Simultandolmetschen vs. Eng‐ lisch als Lingua Franca.“ In: García Becerra et al. (Hrsg.), 101-128. Reithofer, Karin (2014) Englisch als Lingua Franca und Dolmetschen. Ein Vergleich zweier Kommunikationsmodi unter dem Aspekt der Wirkungsäquivalenz. Tübingen: Narr Francke Attempto. Rennert, Sylvi (2010). „The impact of fluency on the subjective assessment of interpreting quality.“ The Interpreters' Newsletter 15, 101-115. Rennert, Sylvi (2013). „The production of experimental material for fluency research.“ In: García Becerra et al. (Hrsg.), 175-200. Riggenbach, Heidi (Hrsg.) (2000) Perspectives on fluency. Ann Arbor: University of Mi‐ chigan Press. Rodríguez Ortiz, Isabel R. & Mora Roche, Joaquín (2008) „The efficiency of information transmission of sign and spoken language.“ American Annals of the Deaf 152 (5), 480- 494. Rost, Detlef H. (2005) Interpretation und Bewertung pädagogisch-psychologischer Studien. Eine Einführung. Weinheim und Basel: Beltz Verlag Rost, Jürgen (1996) Lehrbuch Testtheorie - Testkonstruktion. 1. Auflage. Bern u.a.: Verlag Hans Huber. Schmidt, Thomas (i.V.) „Grundzüge von EXMARaLDA - einem System zur computerge‐ stützten Erstellung und Auswertung von Korpora gesprochener Sprache.“ In: J. Reh‐ bein, & S. Kameyama (Hrsg.): Bausteine diskursanalytischen Wissens. Berlin: de Gruyter. Vorabversion bezogen von www.exmaralda.org/ files/ Backstein.pdf (11.09.2018) Schmidt, Thomas & Wörner, Kai (2009) EXMARaLDA Partitur Editor (Version 1.4.3) [Computerprogramm] http: / / exmaralda.org/ de/ partitur-editor-de/ (11.09.2018) 180 Bibliografie Schmitz, Michaela (2008) The Perception of Clauses in 6and 8-Month-Old German-Lear‐ ning Infants: Influence of Pause Duration and the Natural Pause Hierarchy. Dissertation, Universität Potsdam. Sciannamè, Maria Pia (2007/ 2008) La voce e la dizione dell’interprete: un contributo speri‐ mentale. Diplomarbeit, Libera Università degli Studi „S. Pio V“, Rom. Seleskovitch, Danica (1988) Der Konferenzdolmetscher. Sprache und Kommunikation. Hei‐ delberg: Julius Groos Verlag. Shlesinger, Miriam (1994) „Intonation in the production and perception of simultaneous interpretation.“ In: S. Lambert & B. Moser-Mercer (Hrsg.), Bridging the gap. Empirical research in simultaneous interpretation. Amsterdam / Philadelphia: John Benjamins, 225-236. Shlesinger, Miriam (1997) „Quality in Simultaneous Interpreting.“ In: Y. Gambier, D. Gile & C. Taylor (Hrsg.) Conference Interpreting: Current Trends in Research. Proceedings of the International Conference on Interpreting: What Do We Know and How? Amsterdam / Philadelphia: John Benjamins, 123-131. Stein, Petra (2014) „Forschungsdesigns für die quantitative Sozialforschung.“ In: Baur & Blasius (Hrsg.), 135-151. Tissi, Benedetta (2000) „Silent pauses and disfluencies in simultaneous interpretation: A descriptive analysis.“ The Interpreters’ Newsletter 10, 103-127. Vermeer, Hans (1978) „Ein Rahmen für eine allgemeine Translationstheorie.“ Lebende Sprachen 23 (3), 99-102. Viezzi, Maurizio (1996) Aspetti della qualitá in interpretazione. Triest: Università degli studi di Trieste. Viezzi, Maurizio (1999) „Aspetti della qualità nell’interpretazione.“ In: C. Falbo, M. Russo, F. Straniero Sergio (Hrsg.) Interpretazione simultanea e consecutiva. Problemi teorici e metodologie didattiche. Mailand: Editore Ulrico Hoepli, 140-151. Vuorikoski, Anna-Riitta (1993) „Simultaneous interpretation - user experience and ex‐ pectations.“ In: C. Picken (Hrsg.) Translation - the vital link. XIII FIT World Congress, Proceedings. Brighton: Institute of Translation and Interpreting, 317-327. Vuorikoski, Anna-Riitta (1998) „User Responses to Simultaneous Interpreting.“ In: L. Bowker, M. Cronin, D. Kenny & J. Pearson (Hrsg.) Unity in Diversity? Current Trends in Translation Studies. Manchester: St. Jerome Publishing, 185-194. 181 Bibliografie Vuorikoski, Anna-Riitta (2004) A Voice of its Citizens or Modern Tower of Babel? The Qua‐ lity of Interpreting as a Function of Political Rhetoric in the European Parliament. Tam‐ pere: Universität Tampere. Zwischenberger, Cornelia (2013) Qualität und Rollenbilder beim simultanen Konferenz‐ dolmetschen. Berlin: Frank & Timme. Zwischenberger, Cornelia & Pöchhacker, Franz (2010) „Survey on quality and role: con‐ ference interpreters‘ expectations and self-perceptions.“ Communicate! Spring 2010. https: / / aiic.net/ page/ 3405 (11.09.2018) 182 Bibliografie Anhang Transkription Versuchsmaterial flüssig Legende: ● Pause (kurze Pausen, Atmen, Lautlängungen in Sätzen) ●● längere Pause (meist zwischen Sätzen, oft auch mit Atmen) ●● Guten Morgen! ● Diese Präsentation wird sich auf das Thema der Postmo‐ derne und der Auswirkungen auf das Marketingmanagement konzentrieren. ●● Die Postmoderne ist eine Wende ● im Bezug auf die Theorie und die Methode ● die aus verschiedenen Disziplinen kommt. ●● Sie kommt nicht aus dem Marketing oder ● dem Konsumverhalten, sondern kommt von der Architektur oder der Philosophie. ●● Später wurde diese Theorie auch in der Marketingdisziplin angewandt. ●● Die Marketingdisziplin hat sich erst vor Kurzem entwickelt, denn erst 1959 wurde das ● Marketingkonzept ent‐ wickelt. Danach hat sich die Marketingdisziplin ● in zwei verschiedene Rich‐ tungen entwickelt. ●● Einerseits ● wurden verschiedene Forschungsansätze verfolgt, ● vom traditionellen Ansatz des Produktmarketings, ● dieses hatte seine Wurzeln im Vereinigten Königreich, im angelsächsischen Raum. ●● Und in den 80er und 90er Jahren kamen auch andere ● Marketingforschungsansätze dazu, zum Beispiel ● das Servicemarketing, aber auch Industriemarketing ● und vor kurzem auch das Erfahrungsmarketing. ●● In diesem Sinn hat die Marketing disziplin verschiedene Ansätze vereint, die sich ● parallel entwickelt hatten. ●● Die zweite Veränderung innerhalb der Marketingdisziplin ● bezieht sich auf die epistemologische Wende, die postmo‐ derne Wende. ●● 1981 hat die kulturelle Wende auch ● die Disziplin des Kon‐ sumverhaltens beeinflusst. Nach diesem Jahr haben sich immer mehr Marke‐ tingforscher auch auf ● das Konsumverhalten konzentriert, und zwar von einem anderen Blickpunkt aus. ●● Also statt Kaufprozesse und Nachkaufevaluie‐ rungen der Konsumenten ● zu untersuchen, das hat zu tun mit Kundenzufrie‐ denheit und Kundenbindung, ● hat man sich in der letzten Zeit vor allem auf das Verständnis der symbolischen, der Verhandlungswerte des Konsums kon‐ zentriert. ●● Und das ist eng verbunden mit der sogenannten postmodernen Wende. ●● Die Postmoderne hat verschiedene ● Veränderungen gebracht, ● in Bezug auf des - auf ddas, wie wir ● den Konsum sehen. ●● Ein sehr allgemeines Beispiel: ●● im traditionellen Marketingansatz sahen wir Märkte, ● den Konsum und die Welt allgemein ● von ● einem sehr objektiven Standpunkt aus. ●● Wir nahmen also an, dass die externe Welt objektiv sei ● und wir als Forscher oder Marketingmanager ● diese Welt auch ● sehr objektiv, fair ● untersuchen müssen, und objektives, umsetzbares Wissen erlangen sollten. ●● Vom postmodernen Standpunkt aus ist das völlig überholt, denn ● in der Postmoderne glauben wir nicht mehr an die Existenz einer objektiven Realität, objektiven Konsums. ●● Statt Objektivität suchen wir die subjektive Erfahrung der Welt und des Konsums. ●● Das bedeutet, dass die Rolle des Mar‐ ketings völlig neu überdacht werden muss, auch die Rolle der Forscher über‐ dacht werden muss. ●● Und das ist in der letzten Zeit immer stärker passiert. ●● Vor allem, wenn wir uns den postmodernen Konsumenten ansehen, ● dann wurde dieser definiert, präsentiert als befreiter Konsument. ●● Ein Konsument, der befreit ist von dem ● Bedürfnis, ● eine einzige Identität nur zu haben, ein einziges Konsumsystem nur aufzuweisen. ● In der Postmoderne ● sprechen wir auch von ● dem befreiten, von der befreiten Postmoderne. Die Identität des Konsumenten ist fragmentiert. ●● Jeder von uns kann ein ganzes System verschiedener Identitäten in sich ver‐ einen. ●● Und ● das ● ist ● etwas ganz Neues, das eng mit der Postmoderne verbunden ist. ●● Die Fragmentierung des Selbst, der Identität des Konsu‐ menten, hat große Auswirkungen auch auf das Marketing. Wenn Sie zum Bei‐ spiel ● an die traditionelle Marktsegmentierung denken. ●● Das ist ja eine sehr wichtige strategische Dimension des Marketings, aber diese ist in der Postmo‐ derne völlig überholt. ●● Denn eine der ● nicht ausgesprochenen Hypothesen der Marktsegmentierung, das liest man jetzt nicht in Büchern und findet auch nicht in der Praxis, ● ist aber doch, dass der Konsument zu einem einzigen Marktsegment gehört. ●● Was passiert aber, wenn der Konsument nicht mehr ● nur ein einziger ● Konsument ist, ● sondern verschiedene Identitäten in sich vereint? ●● In dieser Situation ● bewegt sich der Konsument von einem Segment in das nächste. ● Und die traditionelle Marktsegmentierung kann also nicht mehr so angewendet werden wie in der Vergangenheit. Die erste große Veränderung ● im Marketing bezieht sich eben darauf. ●● Ein paar konkrete Beispiele: ●● Denken Sie an Frauen mit einer Familie, ● die gleichzeitig auch einen Beruf ausüben. ●● In diesen Situationen ● sind die Rollen, die ein Mensch abdecken muss, so angelegt, dass es zu einer Fragmen‐ tierung des Selbst kommt. ●● Das Marketing kann ● das berücksichtigen und auch von der Fragmentierung des Konsumenten profitieren. Einige Unter‐ nehmen haben das ● in der Werbung angewendet. ●● 184 Anhang Sie haben den gleichen Konsumenten mit dem gleichen Produkt gezeigt ● der dieses Produkt in verschiedenen Situationen verschieden anwendet. Denken Sie zum Beispiel an Kosmetikprodukte oder ● Haarstylingprodukte. Es gibt Unter‐ nehmen, die den gleichen Mann zeigen, der ● eine sehr traditionelle Frisur hat, wenn er in der Bank arbeitet, also in ● seinem beruflichen Umfeld, und in der Freizeit hat er aber ● ein rockigeres Erscheinungsbild. Das gleiche Produkt ● hat also in verschiedenen Situationen ● verschiedene ● Anwendungsarten, die sich auf die verschiedenen Identitäten des Konsumenten beziehen. ● Das gleiche ist in der Vergangenheit schon passiert mit Produkten für Frauen ● mit Kindern. ●● Die Notwendigkeit, verschiedene Identitäten zu vereinen, nämlich die Mut‐ terschaftkomponente mit der Berufskomponente, ● hat dazu geführt, dass Un‐ ternehmen Produkte schaffen konnten, die gleichzeitig sehr gesund waren für die Kinder, ● das entsprach also dem Bedürfnis, eine gute Mutter zu sein,und gleichzeitig konnten sie auch sehr schnell zubereitet werden. ● Und das ent‐ sprach natürlich dem Berufsbild der Frau. ●● Aber auch in anderen Situationen gibt es diese Fragmentierung des Selbst. Und sie kann auch sehr klar gesehen werden. Denken sie an Minderheiten‐ gruppen wie zum Beispiel Migranten in einem Land. ●● Hier kann man oft beobachten, wie die kulturelle Identität dieser Individuen sehr fragmentiert ist. ●● Die Literatur in diesem Bereich, ● die sogenannten ethnischen Studien, ● haben ● schon ● seit Beginn der achtziger Jahre eines gezeigt, nämlich, dass ethnische Konsumenten ● eine fragmentierte Identität aufweisen können. Sie können gleichzeitig ● Konsummodelle und Werte ● haben, die ihrer ethnischen Herkunft entsprechen, und parallel dazu ● Kompetenzen und ein Zugehörig‐ keitsgefühl ● zur Gastkultur entwickeln, das heißt zur Kultur des Landes, ● in das sie eingewandert sind. ●● Ihre Konsum muster ● sind also in zwei ● Berei‐ chen polarisiert: ● ethnischer Konsum und lokaler Konsum. ●● Das kann aber auch kreativ miteinander vermischt werden. Wenn ich zum Beispiel ein ● tra‐ ditionelles Gericht zubereite und dafür lokale Zutaten verwende, dann kommt etwas ganz Neues dabei heraus. ●● Das ist dann ethnisches und ● lokales Essen gleichzeitig. ●● Diese Kombination ● der Identitäten kann also zu Konsumsi‐ tuationen führen, ● die überhaupt nicht verstanden werden können oder auch geschätzt werden können vom Marketingstandpunkt aus, ● wenn man ● den modernen Marketingansatz verwendet. ●● Ein anderes typisches Merkmal des postmodernen Konsumenten ist die Hyperrealität. ●● Die Idee, dass ● der Konsum heute ● sehr eng verbunden ist ● mit der Schaffung von ● ganzheitli‐ chen Konsumerfahrungen. ●● Die Spektakularisierung des Konsums ist ein Schlüsselwort im Marketing heute. ●● Statt ● ein Produkt oder Dienstleistungen zu verkaufen, ● die nur ● eine funktionelle Lösung für die funktionellen, tech‐ 185 Transkription Versuchsmaterial flüssig nischen Bedürfnisse der ● Konsumenten ● sind, wollen wir die Konsumenten in wirkliche Konsumerfahrungen einbinden. ●● Und diese Idee der Hyperrea‐ lität, der Spektakularisierung des Konsums, ● kann auf sehr verschiedene Arten ausgelegt werden. ●● Hier gibt es zum Beispiel das Thema des Eventmanage‐ ment, ● des Eventmarketings. ●● Hier ● werden die ● potentiellen Konsumenten in eine Konsumerfahrung eingebunden und ● verschiedene Sinne werden gleichzeitig stimuliert. ●● Aber es gibt auch sehr gute Fallbeispiele, erfolgreiche Fallbeispiele, in den Vereinigten Staaten zum Beispiel. ●● Beispielsweise das ● American-Girl-Pro‐ dukt, das ist eine Puppe für Mädchen. ●● Dieses Produkt war ● extrem erfolg‐ reich, da es in der Lage war, ● eine ganzheitliche, umfassende Konsumerfahrung schon im Geschäft ● zu schaffen. ●● Wenn die ● Kinder also ins Geschäft kommen und ihre Puppe kaufen, ● können sie gleichzeitig auch ein Kleid kaufen, ● das genau das gleiche ist wie das der Puppe. ●● Es gibt auch Frisöre für die Puppe und so weiter. Sie sind also wirklich voll eingebunden in diese Konsum‐ erfahrung. ●● Oder denken Sie an Disneyland oder andere ● solche Konsumer‐ fahrungen. ● Die sind alle eigentlich ● völlig gleich. ●● Ein Beispiel ist auch Monclaire. ●● Das ist ein Modeunternehmen, ● das vor allem ● dicke Bekleidung für den Winter ● verkauft. ● Dieses Unternehmen hat ein Geschäft eingerichtet mit Temperaturen unter null Grad, ● also es ist sehr kalt dort, und dort können die Konsumenten die Kleidung, die ● verkauft wird ● in der Situation anprobieren, in der sie sie dann auch verwenden werden. ●● Das alles sind Beispiele für diese Spektakularisierung. ●● Eine andere Idee der Postmoderne ist unsere Verbindung mit der Vergangen‐ heit und der Zukunft zur gleichen Zeit. ●● Im modernen Marketingansatz war es so, dass wir angenommen haben, dass die Zukunft ● uns eine Verbesserung ● der menschlichen Erfahrungen, der Konsumerfahrungen bringt. ●● Und das ist in der Postmoderne völlig überholt. ●● In der Postmoderne ● glauben wir nicht, dass die Zukunft auch gleichzeitig Verbesserung bedeutet und dass die Vergangenheit etwas ist, das wir hinter uns lassen ● müssen und vergessen sollen. ●● In der Postmoderne ● feiern wir ● die sogenannte ewige Gegenwart. ●● Das ist eine Situation, in der die Vergangenheit, die Gegenwart und die Zu‐ kunft ● miteinander ● verbunden, kombiniert sind. ●● Daher ● ist ● in der Postmoderne das Retromarketing ● auch so gut aufgenommen worden und wird so zelebriert. ●● Es gibt verschiedene Beispiele für Unternehmen, ● die sich mit dieser Idee beschäftigen, und die die vergangenen Traditionen ● in die Gegen‐ wart geholt haben. ●● Denken Sie ● an den Beetle von Volkswagen oder den Mini von BMW. ●● 186 Anhang Ja, das sind Beispiele für Unternehmen, ● die in der Lage waren, ● die Tra‐ dition in neuen Produkten aufzunehmen und diese den Konsumenten zu ver‐ kaufen. ●● Ein weiteres Beispiel ist Camper, ein spanisches Unternehmen, ● das vor allem Schuhe verkauft. ●● In diesem Fall hat das Unternehmen ● sich nicht an die Zukunft gewandt, an die Technologie, technologische Verbesserungen, ●● sondern konzentriert sich auf die mediterranen Werte der Vergangenheit, der Tradition, ● der Langsamkeit des Lebens. ●● Und darum herum wurde die Markenidentität ● des Unternehmens aufgebaut. ●● Der postmoderne Konsum ● ist sehr eng verbunden mit großen Verände‐ rungen ● unseres Verständnisses des ● Konsums. ●● Ich möchte nun noch ei‐ gentlich das Wichtigste unserer Interpretation des Konsums, der Konsumenten unterstreichen. ●● Statt ● von Konsumenten zu sprechen, sprechen wir post‐ moderne ● Forscher ● lieber ● von konsumierenden Menschen. ●● Wir glauben also, dass das Wort „Konsument“ ● den Konsum ● vom Leben, von der Lebens‐ erfahrung der Menschen ● trennt. ●● Statt zu sagen, dass wir Konsumenten untersuchen, ziehen wir es vor ● zu sagen, ● dass wir uns mit Menschen be‐ schäftigen, die konsumieren. ●● Konsumierenden Menschen. ●● Der Konsum muss verbunden sein mit dem Leben der Menschen. ● Wenn wir konsumieren, sind wir nicht Konsumenten, wir sind Menschen, die etwas konsumieren. ●● Diese Idee, ● das Leben mit einzubeziehen, verschiedene Dimensionen des Le‐ bens mit einzubeziehen, ● Geschlecht, Religion, Alter, ● Ethnie - ●● das sind alles Themen, ● die im postmodernen Ansatz zum Tragen kommen. Transkription Versuchsmaterial unflüssig Legende: ● Pause (kurze Pausen und Atmen, Lautlängungen in Sätzen, Mikrohäsitationen) ●● längere Pause (meist zwischen Sätzen, oft auch mit Atmen) [ä], [ömm] etc.: verschriftlichte Häsitation ●● Guten Morgen! ●● Diese Präsentation wird sich auf das Thema der [mmm] Postmoderne und der ● Auswirkungen auf das Marketingmanagement konzen‐ trieren. Die Postmoderne ist eine Wende im Bezug auf die Theorie und die Me‐ thode ● die aus verschiedenen [nnn] Disziplinen kommt. ●● Sie kommt nicht aus dem Marketing oder ● dem Konsumverhalten, sondern kommt von der Architek● tur oder der [ä] Philosophie. Später wurde diese Theorie auch in der Marketingdisziplin angewandt. ●● Die Marketingdisziplin hat sich erst vor Kurzem entwickelt, denn erst 1959 wurde das ● Marketing‐ konzept ● entwickelt. Danach hat sich die Marketingdisziplin ● in zwei ver‐ 187 Transkription Versuchsmaterial unflüssig schiedene Richtungen entwickelt. Einerseits ●● [ä] wurden verschiedene For‐ schungsansätze verfolgt, vom ● traditionellen Ansatz des [äm] Produktmarketings, ● dieses [ääh] hatte seine Wurzeln im Vereinigten König‐ reich, im angelsächsischen Raum. ●● Und in den 80er und 90er Jahren kamen auch andere ● Mark- Marketingforschungsansätze dazu, zum Beispiel ● das Servicemarketing, aber auch Industriemarketing ● und vor kurzem auch das Erfahrungsmarketing. ●● In diesem Sssinn ● hat die Marketing●disziplin verschiedene ● Ansätze [ä] vereint, die sich ● parallel entwickelt hatten. ●● Die zweite Veränderung in‐ nerhalb der Marketingdisziplin ● [äm] ● bezieht sich auf die epistepistemolo‐ gische Wende, [äm] die postmoderne Wende. ● 1981 ● hat die kulturelle Wende auch ● die Disziplin des Konsumverhaltens beeinflusst. Nach diesem Jahr haben sich immer mehr Marke-tingforscher auch auf ● [ääh] das Konsumverhalten konzentriert, und zwar von einem anderen Blickpunkt aus. Also statt ● Kauf‐ prozesse und Nachkaufevaluierungen der Konsumenten ● zu untersuchen, das hat zu tun mit Kundenzufriedenheit und Kundenbindung, ●● [äm] hat man sich ● in der letzten Zeit ● vor allem auf das Verständnis ● der sssymbolischen, der Verhandlungs●werte des Kon- [ä] Konsums konzentriert. Und das ist eng ver‐ bunden mit der sogenannten postmodernen Wende. ●● Die Postmoderne ● hat verschiedeneee ● Veränderungen gebracht, in Bezug auf des - auf ddas, wie wir ● den Konsum sehen. ● Ein ● sehr allgemeines Beispiel: ● im traditionellen Marketingannn●satz sahen wir Märkte, ● [äm] koden Konsum und die Welt allgemein ● von ● einem sehr objektiven Standpunkt aus. ●●Wir nahmen also an, dass die externe Welt objektiv sei ● und wir als Forscher oder Marketingmanager ● diese Welt ● auch ●● sehr ● objektiv, fair ● untersuchen müssen, und objektives, umsetzbares Wissen ● erlangen sollten. Vom postmodernen Standpunkt aus ist das völlig überholt, denn ● in der Postmoderne [sä] glauben wir nicht mehr an ● die Existenz [ä] einer objektiven Realität, objektiven Konsums. Statt Objektivität suchen wir die subjektive Erfahrung der Welt ● und des Konsums. Das bedeutet, dass die Rolle des Marketings völlig neu überdacht werden ● muss, auch die Rolle der Forscher überdacht werden muss. ● Und das ist in der letzten Zeit immer stärker passiert. ●● Vor allem, wenn wir uns den postmodernen Konsu‐ menten ansehen, ● dann wurde dieser definiert, präsentiert als ● befreiter Kon‐ sument. ●● Ein Konsument, der befreit ist von dem ● Bedürfnis, ●● eine einzige Identität ● nur zu haben, ein einziges ● Konsumsystem nur ● auf●zuweisen. In der ● Postmoderne [ääm] sprechen wir auch vonnn ● dem befreiten, von der pobefreiten Postmoderne. Die Identität des Konsumenten ist ● fragmen●tiert. ● 188 Anhang Jeder von uns kann ● ein ● ganzes System verschiedener Identitäten in sich vereinen. ● Und ● das ● ist etwas ganz Neues, das eng mit der Postmoderne verbunden ist. Die Fragmentierung des Selbst, der Identität des ● Konsumenten, hat ● große Auswirkungen auch auf das ● Marketing. Wenn Sie zum Beispiel ● an die ● traditionelle Markt●segmentierung denken. ●● Das ist ja ein- ● eine sehr wichtige strategische Dimension des Marketings, aber diese ist in der po- Postmoderne völlig überholt. Denn eine der ● nicht ausgesprochenen Hypo‐ thesen der ● [ömmm] Marktsegmentierung, das liest man jetzt nicht in den Büchern und [ö] findet auch nicht in der Praxis, ist aber doch, dass der Konsu‐ ment ●● zu einem einzigen Marktsegment gehört. ●● Was passiert aber, wenn der Konsument nicht mehr ● nur ein einziger ● Konsument ist, ●● sondern verschiedene Identitäten in sich vereint? ● In dieser Situation ● bewegt sich der Konsument von einem Segment in das nächste. ● Und ● die traditionelle Marktsegmentierung kann ● also nicht mehr so ange‐ wendet werden wie in der Vergangenheit. Die erste große Veränderung ● [ämm] ● im Marketing bezieht sich eben darauf. ●● Ein paar konkrete Beispiele: Denken Sie an Frauen mit einer Familie, ● die gleichzeitig auch einen Beruf ausüben. ● In diesen Situationen ● sind ● die Rollen, die ein Mensch abdecken muss, ● [äm] so angelegt, dass es zu einer Fragmentierung des Selbst [ä] kommt. ● Das Marketing [m] kann ● das be‐ rücksichtigen und auch von ● der Fragmentierung des Konsumenten ● profi‐ tieren. Einige Unternehmen haben das ● in der Werbung angewendet. ●● Sie haben ● den gleichen Konsumenten mit dem gleichen ● Produkt gezeigt ● [äm] ● der dieses Produkt in verschiedenen Situationen ● verschieden anw‐ endet. Denken Sie zum Beispiel an Kosmetikprodukte oder ● Haarstylingpro‐ dukte. Es gibt Unternehmen, die den gleichen ● Mann zeigen, der ● [äm] sehreine sehr traditionelle Frisur hat, wenn er in der [m] Bank arbeitet, also ● in ● seinem beruflichen Umfeld, und in der Freizeit hat er ●● aber ein ● rockigeres Erscheinungsbild. Das gleiche Produkt ● [ä] hat also in verschiedenen ]Situ‐ ationen ● verschiedene ● Anwendungsarten, die sich auf die verschiedenen Identitäten des Konsumenten beziehen. Das gleiche ist in der Vergangenheit schon passiert mit [ö] Produkten für Frauen ● mit Kindern. ● Die Notwendigkeit, verschiedene Identitäten zu vereinen, nämlich die Mutterschaft●komponente mit der ● [ääm] Berufskomponente, ● hat dazu geführt, dass Unternehmen Pro‐ dukte schaffen konnten, die ● gleichzeitig sehr gesund waren für die Kinder, ● [ä] das entsprach also dem Bedürfnis, eine gute Mutter zu sein, und gleichzeitig konnten sie auch sehr schnell ● zubereitet werden. Und das entsprach natürlich dem ● Berufsbild der Frau. ●● 189 Transkription Versuchsmaterial unflüssig Aber auch in anderen Situationen ● gibt es diese Fragmentierung des Selbst. Und sie kann auch sehr klar gesehen werden. Denken sie an [minmin-] an ● Minderheitengruppen wie zum Beispiel Migranten in einem Land. ● Hier kann man oft ● beobachten, wie die ● kulturelle Identität dieser Individuen ● sehr fragmentiert ist. ●● Die Literatur in diesem Bereich, ● die sogenannten ethni‐ schen sch- Studien, ● haben ● schonnn ● seit Beginn der achtziger Jahre eines ge●zeigt, nämlich, dass ethnische Konsumenten ● eine fragmentierte Identität [ä] aufweisen können. Sie können gleichzeitig ● Konsum●[ä] modelle und Werte [ömm] haben, die ihrer ethnischen Herkunft entsprechen, und parallel dazu ● Kompetenzen ● und ● ein Zugehörigkeitsgefühl ● zur Gastkultur entwickeln, das heißt zur Kultur des ● Landes, ● in das sie eingewandert sind. ● Ihre Konsum●muster sind also in zwei ● [ö] Bereichen polarisiert: ethnischer Konsum und lokaler k-Konsum. Das kann aber auch ● kreativ miteinander ver‐ mischt werden. Wenn ich zum Beispiel ein ● traditionelles Gericht zubereite und dafür lokale Zutaten verwende, dann kommt etwas ganz Neues dabei heraus. ● Das ist dann ethnisches und ● [ö] lokales ● Essen gleichzeitig. Diese Kombina‐ tion der Identitäten kann also zu Konsumsituationen führen, ●● die ● überhaupt nicht verstanden werden können oder auch ● geschätzt werden können vom Marketingstandpunkt aus, ● wenn man [ääm] den modernen Marketingansatz verwendet. ● Ein anderes typisches Merkmal des ● postmodernen Konsumenten ist die Hyperrealität. ● Die Idee, dass ●● der Konsum heute ●● [ähm] sehr eng verbunden ist ● mit der Schaffung [ö] von ● [ähm] ganzheitlichen Konsumer‐ fahrungen. ● Die Spektakularisierung des ● [ähm] Konsums ist ein Schlüssel‐ wort im Marke●ting heute. ● Statt ● ein Produkt oder Dienstleistungen zu ver‐ kaufen, ● die nur ● eine ● funktionelle ● Lösung für die funktionellen, technischen Bedürfnisse der ● Konsumenten ● sind, wollen wir die Konsu‐ menten in wirkliche Konsumerfahrungen einbinden. ● Und diese Idee der Hy‐ perrealität, der spekta- ● Spektakularisierung des Konsums, ● kann ● auf sehr verschiedene Arten ausge●legt werden. Hier gibt es zum Beispiel das ● Thema des Event●management, des Eventmarketings. ● Hier ● werden die ● poten‐ tiellen Konsu●menten in eine Konsumerfahrung eingebunden und ● verschie‐ dene ● Sinne werden gleichzeitig stimuliert. ●● Aber es gibt auch sehr gute fei- Fallbeispiele, erfolgreiche Fallbeispiele, in den Vereinigten Staaten zum Beispiel. ●● Beispielsweise das [ämm] American-Girl-Produkt, das ist eine Puppe für Mädchen. ● Dieses Produkt war ● extrem erfolgreich, da es ● in der Lage war, eine ● ganzheitliche, umfassende Konsumerfahrung schon im Geschäft ● zu schaffen. Wenn die ● [ämm] Kinder also ins Geschäft ● kommen und ihre Puppe ● kaufen, ● können sie gleichzeitig auch ● ein Kleid kaufen, ● das genau das gleiche ist wie das der Puppe. ● Es gibt 190 Anhang auch Frisöre für die ● Puppe und so weiter. Sie sind also wirklich voll einge●bunden in diese Konsumerfahrung. ● Oder denken Sie an Disneyland oder ● andere ● solche Konsumerfahrungen. Die sind alle eigentlich ● völlig gleich. ●● Beis- Ein Beispiel ist auch Monclaire. ●● Das ist ein ● Modeunternehmen, ● das vor allem ● [öm] dicke Bekleidung für den Winter ● verkauft. ● Dieses Unternehmen hat ein Geschäft eingerichtet ● mit Temperaturen unter null Grad, ● also es ist sehr kalt dort, und dort können die Konsumenten ● die Kleidung, ● die [öö] verkauft wird ● in der Situation anprobieren, ● in der sie sie dann auch verwenden werden. Das alles sind Beispiele ● für ● diese ● Spektakulari‐ sierung. Eine andere Idee der Postmoderne ist unsere Verbindung mit der Vvvergan‐ genheit und der Zu●kunft zur gleichen Zeit. ● In modern- ● Im modernen Mar‐ ketingansatz war es so, ● dass wir angenommen haben, dass die Zukunft ● [ähm] uns eine Verbesserung ● [ähm] der menschlichen Erfahrungen, der Konsumer‐ fahrungen ● bringt. ● Und das ist in der Postmoderne völlig überholt. ● In der Postmoderne ● glauben wir nicht, dass die ● Zukunft auch gleichzeitig ● Ver‐ besserung bedeutet und dass die Vergangenheit et● was ist, das wir hinter uns lassen ● müssen und vergessen sollen. In der Postmoderne ● feiern wir ● [ähm] die sogenannte ewige ● [ä] Gegenwart. Das ist eine Situation, ● [äää] in der die Vergangenheit, die Gegenwart und die Zukunft [ähm-mm] miteinander ver‐ bunden, kombiniert sind. Daher ● ist in der Postmoderne das Retromarketing ● auch ● so ● gut aufgenommen worden und ● wird so zelebriert. Es gibt ver‐ schiedene Beispiele für Unternehmen, ● die sich mit dieser Idee ● [ähm] be‐ schäftigen, und die die vergangenen Traditionen ● in die Gegenwart geholt haben. ●● Denken Sie an den Beetle von Volkswagen oder den Mini ●● von BMW. ●● Ja, das sind Beispiele für Unternehmen, ● die ● in der Lage waren, ● die Tradition ● in ● neuen Produkten [ä] aufzunehmen und diese den Konsumenten zu verkaufen. Ein ● weiteres Beispiel ist Camper, ein spanisches Unternehmen, ● das vor allem Schuhe verkauft. ● In diesem ● Fall hat ● das Unternehmen ● sich nicht an die Zukunft gewandt, an die Technologie, technologische Verbes‐ serungen, ● sondern konzentriert sich auf die mediterranen Werte der Vergan‐ genheit, der Tradition, ● der Langsamkeit des Lebens. Und darum herum wurde die Markenidentität ● des Unternehmens aufgebaut. ●● Die post- ● der postmoderne Konsum ●● ist ● sehr eng verbunden mit großen Veränderungen ● unseres Verständnisses des ● Konsums. ● Ich möchte nun noch eigentlich das Wichtigste [ähm] unserer Interpretation des ● Konsums, der Konsumenten unterstreichen. Statt ● von Konsumenten zu sprechen, ● sprechen 191 Transkription Versuchsmaterial unflüssig wir postmoderne ● Forscher ● lieber ● von konsumierenden Menschen. ● Wir glauben also, ● dass das Wort „Konsument“ ● den Konsum ● vom Leben, ● von der Lebenserfahrung der Menschen ● [äm] trennt. Statt zu sagen, dass wir Kon‐ sumenten untersuchen, ziehen wir es vor ● zu sagen, ● dass wir uns mit Men‐ schen ● beschäftigen, die konsssumieren. ● Konsumierenden Menschen. ● Der Konsum ● [mmm] muss verbunden sein mit dem Leben der Menschen. Wenn wir konsumieren, sind wir nicht Konsumenten, wir sind Menschen, die etwas konsumieren. ● Diese Idee, ● das Leben mit einzu●beziehen, verschiedene Di‐ mensionen des Lebens mit ● einzubeziehen, Geschlecht, Religion, Alter, ● [äh-m] Ethnie - ●● das sind alles ● [ämmm] Themen, ● die ● im postmodernen Ansatz zum Tragen kommen. 192 Anhang Fragebogen - Marketing und Postmoderne TEIL A - Verständnisfragen Bitte beantworten Sie die folgenden Fragen zu dem Vortrag, den Sie gerade gehört haben. Versuchen Sie die Fragen mittels der Information aus der Rede zu beantworten (und nicht mit Hilfe Ihres Hintergrundwissens). Bei diesem Fragebogen geht es nicht um eine Intelligenzmessung oder das Abfragen von Wissen, sondern um die Verständlichkeit des Vortrags. Falls Sie eine Frage nicht beantworten können, kreuzen Sie bitte nichts an. 1) In welchen der folgenden Disziplinen hatte die Postmoderne laut Vortrag ihre Ursprünge? (Mehrfachantworten sind möglich.)  Philologie  Architektur  Bildende Kunst  Philosophie  Schöne Künste  Soziologie  Darstellende Kunst 2) Was wird in der Rede als traditioneller Marketingansatz bezeichnet?  Servicemarketing  Produktmarketing  Industriemarketing  Erfahrungsmarketing 3) Wann begann sich die sogenannte kulturelle Wende auf die Forschung im Bereich des Konsumverhaltens auszuwirken?  1981  1985  1987  1989 1 193 Transkription Versuchsmaterial unflüssig 4) Auf welchen Aspekt des Konsumentenverhaltens begannen sich die ForscherInnen nach der kulturellen Wende zu konzentrieren?  Kaufprozesse  Nachkaufevaluierungen  Kundenzufriedenheit  symbolische Werte des Konsums 5) Laut dem Vortrag, an welche traditionelle Idee des Marketings glauben postmoderne ForscherInnen NICHT mehr?  die Existenz einer fragmentierten Identität  die Existenz einer objektiven Realität  die Existenz von subjektivem Konsum  die Existenz einer objektiven Identität 6) Nennen Sie die drei in der Rede genannten konkreten Beispiele für KonsumentInnen mit einer fragmentierten Identität. _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 7) Nennen Sie die drei in der Rede genannten Beispiele für Produktmarketing, das sich auf Spektakularisierung und Konsumerfahrungen konzentriert. _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 194 Anhang 8) Vom postmodernen Standpunkt aus ...  ... bringt die Zukunft eine Verbesserung.  ... ist die Vergangenheit etwas, das wir hinter uns lassen müssen.  ... sind die Vergangenheit, die Gegenwart und die Zukunft miteinander kombiniert.  ... bringt uns die Zukunft eine Verbesserung unserer Konsumerfahrungen. 9) Nennen Sie die drei Marken, die in der Rede in Zusammenhang mit Retromarketing erwähnt wurden. _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 10) Warum versuchen postmoderne ForscherInnen den Terminus „Konsument“ zu vermeiden?  Da er mit der Hyperrealität assoziiert wird.  Da er mit Technologie und technologischer Verbesserung verbunden ist.  Da er die Marktsegmentierung nicht berücksichtigt.  Da er den Konsum vom Leben der Menschen trennt. 11) Im postmodernen Marketingansatz werden mehrere Dimensionen des Lebens berücksichtigt. Welche der folgenden wurden gegen Ende des Vortrags aufgezählt? (Mehrfachantworten sind möglich.)  Status  Politische Einstellung  Alter  Ethnie  Beruf  Bildung  Geschlecht 195 Transkription Versuchsmaterial unflüssig TEIL B - Weitere Fragen 12) Wie gut haben Sie den Inhalt des Vortrags verstanden? 1 2 3 4 5 6 7 sehr gut sehr schlecht Anmerkungen: _________________________________________________________________ _____________________________________________________________________________ 13) Wie gut hat die Dolmetscherin Ihrer Meinung nach den Inhalt des Vortrags wiedergegeben? 1 2 3 4 5 6 7 sehr gut sehr schlecht Anmerkungen: _________________________________________________________________ _____________________________________________________________________________ 14) Wie beurteilen Sie die Redeflüssigkeit der Dolmetschung (Pausen, Zögern)? 1 2 3 4 5 6 7 sehr flüssig sehr unflüssig Anmerkungen: _________________________________________________________________ _____________________________________________________________________________ 15) Wie beurteilen Sie die Sprechmelodie der Dolmetscherin? 1 2 3 4 5 6 7 sehr lebendig gar nicht lebendig gesprochen gesprochen Anmerkungen: _________________________________________________________________ _____________________________________________________________________________ 196 Anhang 16) Haben Sie schon einmal eine Simultandolmetschung bei einer Konferenz oder Tagung gehört? ja nein Wenn ja, wie oft? ______ Mal 17) Wie gut war Ihnen das Thema „Marketing und Postmoderne“ bekannt? 1 2 3 4 5 6 7 sehr gut gar nicht bekannt bekannt Anmerkungen: _________________________________________________________________ _____________________________________________________________________________ 18) Geschlecht: weiblich männlich 19) Alter: ___________ Jahre 20) Was ist Ihre Muttersprache bzw. welche Sprache beherrschen Sie am besten? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 21) Weitere Anmerkungen: _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 197 Transkription Versuchsmaterial unflüssig Instruktionen Teil 1 (vor Abspielen des Videos) • Mein Name ist Sylvi Rennert, ich bin wissenschaftliche Mitarbeiterin am Zentrum für Translationswissenschaft der Universität Wien • im Rahmen eines FWF-Forschungsprojektes untersuchen wir die Ver‐ ständlichkeit und Effektivität von Simultandolmetschungen in der Fach‐ kommunikation • Wir freuen uns sehr, dass wir bei diesem Projekt mit dem Institut für Betriebswirtschaftslehre des Außenhandels zusammenarbeiten können und ich möchte mich schon jetzt für Ihre Teilnahme bedanken. • Sie werden nun einen Fachvortrag hören und werden im Anschluss ge‐ beten, die Fragen zum Vortrag zu beantworten. • Bitte sehen Sie sich den ausgeteilten Fragebogen NICHT vorher an, son‐ dern erst, wenn Sie nach dem Vortrag dazu aufgefordert werden. • Der Fragebogen ist völlig anonym, Sie wurden lediglich anhand der Teil‐ nehmerliste randomisiert in zwei verschiedene Gruppen eingeteilt. • Hat jeder einen Fragebogen und Kopfhörer? • Haben alle das Mobiltelefon ausgeschaltet? • Über die Kopfhörer hören Sie die Simultandolmetschungen. Schalten Sie den „on“ Knopf ein, am Display sollten Sie sehen, ob das Gerät an ist. • Sie hören zwei verschiedene Dolmetschungen des Vortrags. Auf dem Deckblatt des Fragebogens ist angegeben, welcher Gruppe Sie zugeteilt wurden und welchen Kanal Sie daher am Empfänger einstellen sollten. • Stellen Sie nun den Kanal ein - mit der längeren Taste an der Seite des Empfangsgeräts - entweder „1“ oder „3“, je nach der Gruppe, der Sie zu‐ geteilt wurden. • Die Lautstärke regeln Sie mit der kleineren Taste auf der anderen Seite; es ist ein Schieberegler auf der Seite, wo auch der Kopfhörer eingesteckt ist. • Falls Sie irrtümlich beim Regeln der Lautstärke den Kanal verstellen, schalten Sie bitte so rasch wie möglich wieder auf den richtigen um. • Die Einteilung ist von entscheidender Bedeutung, ändern Sie also den Kanal bitte nicht, da dies den Versuch beeinträchtigen könnte. • Ist die Technik allen klar? • Es folgt nun ein Vortrag eines Professors der Bocconi-Universität in Mai‐ land zum Thema „Postmoderne und Marketing“. Der Vortrag dauert ca. 15 Minuten. 198 Anhang • Bitte hören Sie zu wie in einer Konferenzsituation, • aber machen Sie sich bitte KEINE NOTIZEN. Teil 2 (nach Abspielen des Videos) • Ein paar Worte, bevor Sie den Fragebogen beantworten: • der Fragebogen ist anonym und kann somit KEINE Auswirkung auf Ihre Note in dieser Lehrveranstaltung haben. • Es ist KEIN Wissenstest, sondern eine Messung der Verständlichkeit der Dolmetschung • Beantworten Sie daher bitte die Fragen auf Basis dessen, was Sie gehört haben und nicht aufgrund von Hintergrundwissen, und raten Sie auch nicht. Wenn Sie eine Antwort nicht wissen, kreuzen Sie bitte nichts an. • Fragen mit Mehrfachantworten sind ausdrücklich als solche gekenn‐ zeichnet. Alle anderen Multiple-Choice-Fragen haben nur 1 richtige Ant‐ wort. • Wenn Sie fertig sind, legen Sie Fragebögen und Kopfhörer einfach auf den Tisch, ich werde sie dann einsammeln. • Ich bitte Sie nun, den Fragebogen auszufüllen 199 Instruktionen Abbildungsverzeichnis Abbildung 1: EXMARaLDA Partitur-Editor mit Transkriptionskategorien (Basisversion D 0 ) . . . . . . . . . . . . . 88 Abbildung 2: Auswahl einer Häsitation aus einer Quelldatei . . . . . . . . . . 90 Abbildung 3: Einfügen der Häsitation an die ausgewählte Stelle der zu modifizierenden Datei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Abbildung 4: Modifizierte Datei mit eingefügter Häsitation . . . . . . . . . . . 91 Abbildung 5: EXMARaLDA Partitur-Editor mit Veränderungen (flüssige Version D F ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 Abbildung 6: EXMARaLDA Partitur-Editor mit Veränderungen (unflüssige Version D U ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 Abbildung 7: Erfahrung mit Simultandolmetschungen . . . . . . . . . . . . . . . 125 Abbildung 8: Bekanntheit des Themas „Marketing und Postmoderne“ . . 128 Abbildung 9: Histogramm der Gesamtscores nach Versuchsgruppe . . . . . 130 Abbildung 10: Bewertung der Flüssigkeit nach Versuchsgruppe . . . . . . . . . 137 Abbildung 11: Bewertung der Flüssigkeit nach Muttersprache . . . . . . . . . . 140 Abbildung 12: Bewertung der Intonation nach Versuchsgruppe . . . . . . . . . 143 Abbildung 13: Bewertung der paralinguistischen Variablen nach Versuchsgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 Abbildung 14: Durchschnittliche Bewertung der Dolmetschung nach Versuchsgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 Abbildung 15: Bewertung des subjektiven Verständnisses nach Versuchsgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 Abbildung 16: Bewertung des subjektiven Verständnisses nach Flüssigkeitsbewertung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 Tabellenverzeichnis Tabelle 1: Schwierigkeit der Items des Hörverständnistests . . . . . . . . . . . 112 Tabelle 2: Trennschärfe der Items des Hörverständnistests (korrigierter Trennschärfekoeffizient) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 Tabelle 3: Itemschwierigkeit der Ratingitems . . . . . . . . . . . . . . . . . . . . . . . 115 Tabelle 4: Scoring Frage 1 (R = richtig, F = falsch angekreuzte Antwortoption) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Tabelle 5: Scoring Fragen 6, 7, 9 (R = richtig, F = falsch eingetragene Antwort) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 Tabelle 6: Verteilung der Versuchsgruppen auf die zwei Durchführungstermine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 Tabelle 7: Alter der Versuchspersonen nach Geschlecht . . . . . . . . . . . . . . 122 Tabelle 8: Alter der Versuchspersonen nach Versuchsgruppe . . . . . . . . . . 123 Tabelle 9: Geschlechterverteilung nach Versuchsgruppe . . . . . . . . . . . . . . 123 Tabelle 10: Chi-Quadrat-Test für die Geschlechterverteilung nach Versuchsgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Tabelle 11: Muttersprachen nach Versuchsgruppe . . . . . . . . . . . . . . . . . . . . 124 Tabelle 12: Chi-Quadrat-Test für die Verteilung der Muttersprachen nach Versuchsgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Tabelle 13: Muttersprachen nach Geschlecht und Gruppe . . . . . . . . . . . . . . 125 Tabelle 14: Bekanntheit des Themas „Marketing und Postmoderne“ (Gesamt) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 Tabelle 15: Bekanntheit des Themas „Marketing und Postmoderne“ (Gruppe A) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Tabelle 16: Bekanntheit des Themas „Marketing und Postmoderne“ (Gruppe B) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Tabelle 17: Gesamtscore nach Gruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 Tabelle 18: Score für halboffene Fragen (6, 7, 9) . . . . . . . . . . . . . . . . . . . . . . 131 Tabelle 19: Score für Multiple Choice-Fragen (1-5, 8, 10) . . . . . . . . . . . . . . 131 Tabelle 20: Gesamtscore nach Gruppe (nur Muttersprache Deutsch) . . . . . 132 Tabelle 21: Gesamtscore nach Gruppe (nur Muttersprache nicht Deutsch) 133 Tabelle 22: Gesamtscore nach Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 Tabelle 23: Gesamtscore nach Durchführungstag . . . . . . . . . . . . . . . . . . . . . 135 Tabelle 24: Flüssigkeitsbewertung von 1 = sehr flüssig bis 7 = sehr unflüssig (Gruppe A) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 Tabelle 25: Flüssigkeitsbewertung von 1 = sehr flüssig bis 7 = sehr unflüssig (Gruppe B) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 Tabelle 26: Bewertung der Flüssigkeit nach Versuchsgruppe . . . . . . . . . . . 138 Tabelle 27: Mann-Whitney-U-Test für die Bewertung der Flüssigkeit in den beiden Versuchsgruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 Tabelle 28: Spearman-Korrelation der Versuchsgruppe mit Bewertung der Flüssigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 Tabelle 29: Bewertung der Flüssigkeit nach Muttersprache . . . . . . . . . . . . . 141 Tabelle 30: Spearman-Korrelation von Gesamtscore mit Bewertung der Flüssigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 Tabelle 31: Flüssigkeitsbewertung von 1 = sehr flüssig bis 7 = sehr unflüssig (Gesamt) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 Tabelle 32: Intonationsbewertung von 1 = sehr lebendig gesprochen bis 7 = gar nicht lebendig gesprochen (Gruppe A) . . . . . . . . . . . . . . . . . 144 Tabelle 33: Intonationsbewertung von 1 = sehr lebendig gesprochen bis 7 = gar nicht lebendig gesprochen (Gruppe B) . . . . . . . . . . . . . . . . . 144 Tabelle 34: Intonationsbewertung von 1 = sehr lebendig gesprochen bis 7 = gar nicht lebendig gesprochen (Gesamt) . . . . . . . . . . . . . . . . . . . 145 Tabelle 35: Bewertung der Intonation nach Versuchsgruppe . . . . . . . . . . . 145 Tabelle 36: Spearman-Korrelation von Bewertung der Intonation mit Bewertung der Flüssigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 Tabelle 37: Spearman-Korrelation von Bewertung der paralinguistischen Variablen mit der Versuchsgruppe . . . . . . . . . . . . . . . . . . . . . . . . 147 Tabelle 38: Spearman-Korrelation von Gesamtscore mit Bewertung der Intonation bzw. der paralinguistischen Variablen . . . . . . . . . . . 148 Tabelle 39: Bewertung der Leistung der Dolmetscherin nach Versuchsgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Tabelle 40: Spearman-Korrelation von Bewertung der Dolmetschleistung mit Bewertung der Flüssigkeit bzw. der paralinguistischen Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 Tabelle 41: Bewertung der Leistung der Dolmetscherin nach Flüssigkeitsbeurteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 Tabelle 42: Spearman-Korrelation von Gesamtscore mit Bewertung der Dolmetschleistung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 Tabelle 43: Gesamtbewertung nach Versuchsgruppe (n = 44) . . . . . . . . . . . 152 Tabelle 44: Spearman-Korrelation von Gesamtbewertung der Dolmetschleistung mit Versuchsgruppe bzw. Gesamtscore . . . 153 Tabelle 45: Bewertung des subjektiven Verständnisses nach Versuchsgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 202 Tabellenverzeichnis Tabelle 46: Bewertung des subjektiven Verständnisses von 1 = sehr gut bis 7 = sehr schlecht (Gruppe A) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 Tabelle 47: Bewertung des subjektiven Verständnisses von 1 = sehr gut bis 7 = sehr schlecht (Gruppe B) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 Tabelle 48: Bewertung des subjektiven Verständnisses von 1 = sehr gut bis 7 = sehr schlecht (Gesamt) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 Tabelle 49: Bewertung des subjektiven Verständnisses nach Flüssigkeitsbewertung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 Tabelle 50: Bewertung des subjektiven Verständnisses nach Gesamtbewertung (2 Gruppen) . . . . . . . . . . . . . . . . . . . . . . . . . . 158 Tabelle 51: Spearman-Korrelation von Bewertung des subjektiven Verständnisses mit paralinguistischen Variablen bzw. Gesamtbeurteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Tabelle 52: Spearman-Korrelation von Bewertung des subjektiven Verständnisses mit Bewertung der Dolmetschleistung . . . . . . . 159 Tabelle 53: Spearman-Korrelation von Bewertung des subjektiven Verständnisses mit Gesamtscore . . . . . . . . . . . . . . . . . . . . . . . . . 160 203 Tabellenverzeichnis ISBN 978-3-8233-8281-2 Dolmetschqualität ist ein komplexes Thema, das sich im Spannungsfeld zwischen den Anforderungen und Erwartungen von NutzerInnen wie DolmetscherInnen und der subjektiven Einschätzung des Publikums bewegt. Eine Dolmetschung soll so gut verständlich sein wie das Original, in der Realität orientieren sich NutzerInnen aber häufig am Höreindruck und beurteilen Dolmetschungen eher nach prosodischen als nach inhaltlichen Faktoren. Diese Studie untersucht den Einfluss von Redeflüssigkeit auf die zwei Qualitätsaspekte der kognitiven Wirkungsäquivalenz und der subjektiven Bewertung durch das Publikum. Aufbauend auf einer theoretischen Betrachtung verschiedener Qualitätsaspekte und deren Operationalisierung sowie der Komponenten von Redeflüssigkeit wird die Entwicklung des Versuchsdesigns und -materials eingehend beschrieben. Im Experiment zeigt sich, dass eine weniger flüssige Dolmetschung zwar gleich gut verstanden wird wie eine flüssige, das Publikum aber glaubt, sie schlechter verstanden zu haben.