Pragmatik multimodal
1125
2024
978-3-8233-9582-9
978-3-8233-8582-0
Gunter Narr Verlag
Susanne Kabatnik
Lars Bülow
Marie-Luis Merten
Robert Mroczynski
10.24053/9783823395829
Sowohl Gespräche als auch Texte sind keinesfalls monomodale Kommunikationsanlässe und -angebote, sondern werden in Gestalt multimodaler Praktiken und Artefakte wahrnehmbar. Neben Sprache tragen Ausdrucksmodalitäten wie Gestik, Mimik, Körperhaltung und -bewegung, Stimme, also ganz grundsätzlich Körperlichkeit sowie Schriftbildlichkeit, Bilder, Emojis und mehr wesentlich zur Bedeutungsentfaltung im Kontext bei. Dieser Band nimmt sich der Bestimmung des Verhältnisses von Pragmatik- und Multimodalitätsforschung sowie einer multimodalen Pragmatik an. Die Zusammenführung von Studien zur multimodalen Pragmatik gibt einen Überblick über aktuelle und innovative Forschungsarbeiten, die sich aus einer pragmatischen Perspektive für multimodale Phänomene interessieren.
<?page no="0"?> Susanne Kabatnik / Lars Bülow / Marie-Luis Merten / Robert Mroczynski (Hrsg.) Pragmatik multimodal 7 <?page no="1"?> Pragmatik multimodal <?page no="2"?> Herausgegeben von Prof. Dr. Eva Eckkrammer (Mannheim) Prof. Dr. Claus Ehrhardt (Urbino/ Italien) Prof. Dr. Anita Fetzer (Augsburg) Prof. Dr. Rita Finkbeiner (Mainz) Prof. Dr. Frank Liedtke (Leipzig) Prof. Dr. Konstanze Marx (Greifswald) Prof. Dr. Sven Staffeldt (Halle) Prof. Dr. Verena Thaler (Innsbruck) Die Bände der Reihe werden einem single-blind Peer-Review-Verfahren unterzogen. Bd. 7 <?page no="3"?> Susanne Kabatnik / Lars Bülow / Marie-Luis Merten / Robert Mroczynski (Hrsg.) Pragmatik multimodal <?page no="4"?> DOI: https: / / doi.org/ 10.24053/ 9783823395829 © 2024 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Überset‐ zungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Alle Informationen in diesem Buch wurden mit großer Sorgfalt erstellt. Fehler können dennoch nicht völlig ausgeschlossen werden. Weder Verlag noch Autor: innen oder Herausgeber: innen übernehmen deshalb eine Gewährleistung für die Korrektheit des Inhaltes und haften nicht für fehlerhafte Angaben und deren Folgen. Diese Publikation enthält gegebenenfalls Links zu externen Inhalten Dritter, auf die weder Verlag noch Autor: innen oder Herausgeber: innen Einfluss haben. Für die Inhalte der verlinkten Seiten sind stets die jeweiligen Anbieter oder Betreibenden der Seiten verantwortlich. Internet: www.narr.de eMail: info@narr.de Druck: Elanders Waiblingen GmbH ISSN 2628-4308 ISBN 978-3-8233-8582-0 (Print) ISBN 978-3-8233-9582-9 (ePDF) ISBN 978-3-8233-0519-4 (ePub) Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http: / / dnb.dnb.de abrufbar. <?page no="5"?> 7 27 63 91 131 165 195 223 257 285 319 355 Inhalt Marie-Luis Merten, Lars Bülow, Susanne Kabatnik & Robert Mroczynski Pragmatik multimodal - Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ellen Fricke Negation multimodal. Rede und Geste, Schrift und Bild . . . . . . . . . . . . . . . . Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans Multimodale Intensivierung im Deutschen . . . . . . . . . . . . . . . . . . . . . . . . . . . Claudia Lehmann Zur multimodalen Markierung von Ironie. Eine quantitative Korpusstudie Susanne Kabatnik Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie. Eine multimodale Interaktionsanalyse . . . . . . . . . Clara Kindler-Mathôt eins zwei drei vor wusch - dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Simon Meier-Vieracker & Stefan Hauser Multimodal Ritual Chains. Medialitätstheoretische Beobachtungen zur Multimodalität der Fußballfankommunikation . . . . . . . . . . . . . . . . . . . . . . . . Marie-Luis Merten Körpersemantisierungen im #bodylove-Diskurs. Eine Korpusstudie zu Instagram-Posts als multimodales Positionierungsformat . . . . . . . . . . . . . . . Marcus Scheiber, Hagen Troschke & Jan Krasni Vom kommunikativen Phänomen zum gesellschaftlichen Problem. Wie Antisemitismus durch Memes viral wird . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Elisabeth Zima Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lisa Rhein & Sina Lautenschläger Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows Verzeichnis der Autorinnen und Autoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . <?page no="7"?> Pragmatik multimodal - Einführung Marie-Luis Merten, Lars Bülow, Susanne Kabatnik & Robert Mroczynski 1 Pragmatik multimodal: Umrisse und Perspektiven eines Forschungsfeldes Sprachhandeln begegnet uns stets in multimodalen Formen (Klug/ Stöckl 2016): Sowohl Gespräche als auch Texte sind keinesfalls monomodale Kommunika‐ tionsanlässe und -angebote; sie werden vielmehr in Gestalt multimodaler Performanzen und Artefakte wahrnehmbar (Stöckl 2020: 41). Neben Sprache tragen Ausdrucksmodalitäten wie Gestik, Mimik, Körperhaltung und -bewe‐ gung, Stimme, also ganz grundsätzlich Körperlichkeit (Deppermann 2015) sowie Schriftbildlichkeit, Layout, Bilder, Emojis und weitere visuelle Zeichen(typen) (Stöckl et al. 2020) wesentlich zur Bedeutungsentfaltung im Kontext bei (Wildfeuer et al. 2020). Zunehmend bestimmt die Untersuchung multimodaler Kommunikationspraktiken - auch infolge der visuellen Wende innerhalb der Linguistik (dazu Bubenhofer 2020: Kap. 9.4.1) - die sprachwissenschaftliche Forschungslandschaft. Mitunter wird von einer multimodalen Wende gespro‐ chen, die sich Bateman et al. (2017: 15) zufolge in dem Bedarf und der Bestrebung niederschlägt, die spezifischen Kombinationen von Ausdrucksmitteln explizit und systematisch zu untersuchen („to examine combinations of expressive resources explicitly and systematically“). In diesem Zusammenhang können wir in den letzten Jahren beobachten, wie sich (teilweise überlappende) Subdis‐ ziplinen herausbilden, deren theoretisch-methodologischer Apparat dezidiert auf multimodale Kommunikationsformate ausgerichtet ist: Dabei handelt es sich etwa um einen sozialsemiotischen Zugang zu Texten (Kress/ van Leeuwen 1996; Kress 2010), die multimodale Interaktionsanalyse (Norris 2004; Mondada 2013, 2018; Deppermann 2018; Stukenbrock 2021), die multimodale Text- und Diskursanalyse (Klug 2016; Meier 2016; im angloamerikanischen Raum auch O’Toole 1994; O’Halloran 2004), die multimodale Kognitionslinguistik (Zima/ Brône 2015; Spieß 2016; Forceville 2016) sowie die multimodale Grammatikfor‐ schung (Fricke 2012; Schoonjans 2018; konstruktionsgrammatisch auch Zima/ Bergs 2017; Bülow et al. 2018), die angesichts ihrer starken Fokussierung <?page no="8"?> auf Gesten interaktionslinguistischen Arbeiten verhältnismäßig nahe steht. Die genannten Subdisziplinen setzen unterschiedliche Schwerpunkte, was die untersuchten Kommunikationstypen, die gewählte Methodik wie auch die theoretische Fundierung betrifft: Während beispielsweise in der multimodalen Textanalyse schrift- und bildbasierte Artefakte in ihrer kompositionellen Gestalt eine zentrale Rolle spielen, konzentriert sich die multimodale Interaktions‐ analyse vordergründig auf gesprochensprachliche Kommunikation und eine stärker sequenzanalytische Betrachtungsweise. Insbesondere neuere mediale Kommunikationsformate - wie WhatsApp, Instagram und Co. - ermöglichen es zudem, Textkommunikation unter multimodal-interaktionsanalytischen Ge‐ sichtspunkten zu betrachten (Pappert 2017; König 2019; Albert 2020; Merten 2022) sowie die aus einer zunehmenden Medienkonvergenz resultierende Kom‐ bination von Audio-, Bild- und Schrift-Elementen in einem Posting (König 2021) zu erforschen (zu einer zunehmenden Bildzentriertheit kommunikativer Praktiken auch Stöckl et al. 2020). Aus Sicht der linguistischen Pragmatik stellt sich die Frage, welchen Platz pragmatische Themen, Theorien und Analysegegenstände innerhalb dieser Entwicklung einnehmen. Der vorliegende Band setzt sich daher zum Ziel, wesentliche Bestimmungsstücke einer multimodalen Pragmatik (O’Halloran et al. 2014; Huang 2022) zu identifizieren und die Vielfalt an aktuellen prag‐ matisch-fokussierten Forschungsarbeiten und -projekten mit einem Schwer‐ punkt auf multimodalen Kommunikationspraktiken aufzuzeigen. Beleuchtet wird mithin das Verhältnis von Pragmatik- und Multimodalitätsforschung, um auf dieser Grundlage für eine Pragmatikforschung zu argumentieren, die die multimodale Verfasstheit von Kommunikation mit Blick auf ihre Theoriebildung sowie methodologisch-methodische Fundierung berücksichtigt. Angesichts der Relevanzsetzung von Sprache im Gebrauch und der situativen Einbettung kommunikativer Handlungen im Rahmen pragmatischer Ansätze liegt eine ebensolche Fokussierung von multimodaler Bedeutungsentfaltung im Kontext nahe (O’Halloran et al. 2014: 239). Dem vorliegenden Band liegt ein weiter inkludierender, statt einschränk‐ ender Pragmatikbegriff zugrunde, wie er u. a. von Feilke (2015: 97) dargelegt wird. An eine gebrauchsbasierte Sprachkonzeption anschließend lässt sich Prag‐ matik auf diese Weise ganz grundlegend als eine funktionale Perspektive auf Sprache (im Gebrauch) beschreiben, die die Komplexität des kognitiven, sozialen und kulturellen Wirkens von sprachlicher Kommunikation in der menschlichen Lebenswelt berücksichtigt (O’Keeffe et al. 2011: 19). Eingeschlossen sind damit sowohl Phänomene, die klassischerweise stärker der Semantik zugeordnet werden (etwa der Bereich der Negation, wie in Fricke in diesem Band beleuchtet, 8 Marie-Luis Merten, Lars Bülow, Susanne Kabatnik & Robert Mroczynski <?page no="9"?> oder das Phänomen der Intensivierung, dazu Schoonjans et al. in diesem Band), als auch solche, die sich am Rande der Linguistik verorten lassen (etwa auch sprachliche Anteile integrierende Fan-Choreografien im Fußball-Stadion, wie sie Meier-Vieracker/ Hauser in diesem Band behandeln). So scheint die (diesem Band vorausgegangene) Tagungseinladung zur eingehenderen Beschäftigung mit Analysefeldern und -möglichkeiten einer multimodalen Pragmatik gerade als Anstoß genutzt worden zu sein, auch solche Phänomene und Kommunikati‐ onsbereiche linguistisch zu beleuchten, denen bislang nur wenig (wissenschaft‐ liche) Aufmerksamkeit zuteil geworden ist. Multimodalität bzw. multimodale Kommunikation wird in der aktuellen Forschungslandschaft unterschiedlich gefasst; diesen Umstand dokumentiert auch der vorliegende Band. Wir begegnen durchaus konkurrierenden Multimo‐ dalitätsbegriffen, die je nach Erkenntnisinteresse, Tradition, in der die jeweilige Forschung steht, und damit einhergehender theoretisch-methodologischer Fun‐ dierung, Phänomenbzw. Datentyp usw. divergieren. Text(sorten)linguistische Ansätze unterscheiden sich in nicht unerheblichem Maße von gesprächsanalytischen oder etwa medienlinguistischen Zugängen zu multimodalen Kommu‐ nikaten; nicht zuletzt nehmen hierbei verschiedentliche Zeichensysteme - in ihrer je spezifischen Verschränkung - eine wichtige Funktion ein (dazu auch Bateman/ Tseng 2023: Kap. 1). Eine Minimalbestimmung von multimodaler Kommunikation, wie sie als Klammer aller Beiträge dieses Bandes angesetzt werden kann, bezieht sich auf den gemeinsamen (d. h. zeitgleichen) Einsatz und die gewissen Musterhaftigkeiten folgende Integration von verschiedenen Zeichensystemen (als semiotischen Ressourcen) im kommunikativen Vollzug (Stöckl 2020: Kap. 2.1; auch Jewitt 2014a: 127). Da wir einer linguistischen Schwerpunktsetzung folgen, spielt Sprache, ob gesprochen- oder geschrieben‐ sprachlich, in allen Beiträgen eine tragende Rolle, sie fungiert gewissermaßen als Archimedium (Klug/ Stöckl 2016: VIII) bzw. als Archimodalität, die mit weiteren Zeichenmodalitäten in semantisch-funktionale Beziehungen tritt. Angesprochen sind jeweils der visuelle und/ oder auditive Sinneskanal, die beleuchtete Kommunikation materialisiert sich auf verschiedene Weise. Von besonderem Interesse sind die medial-modalen Affordanzen (als Angebots‐ strukturen) und Logiken, die sich auf Grundlage der jeweils beleuchteten multimodalen Performanzen und Artefakte nachzeichnen lassen; Fritz (2013: 127) spricht in diesem Zusammenhang auch von der „Leistungsfähigkeit von Darstellungsmodi“. Für den vorliegenden Band ist insbesondere die Abgrenzung von Modalität und Medium bzw. Medien zentral (wie auch herausfordernd). Wir konturieren Medien in Anlehnung an Bateman und Tseng (2023: 91) als einen „historisch stabilisierte[n] Ort für den Einsatz und die Verbreitung einer Pragmatik multimodal - Einführung 9 <?page no="10"?> 1 Den Terminus „Canvas“ fassen Wildfeuer et al. (2020: 103 f.) in Bezug auf die lokale Dimension folgendermaßen: „Ganz ähnlich verallgemeinern wir alle möglichen Träger von bedeutungsvollen Regelmäßigkeiten mit dem Begriff ‚Canvas‘ (und hier lehnen wir uns sehr stark an die englische Version dieser Einführung an, siehe Bateman et al. 2017). Mit Canvas beschreiben wir sowohl reelle als auch virtuelle Umgebungen, Orte oder Flächen (siehe auch die deutsche Übersetzung von ‚canvas‘ als Leinwand), in bzw. auf die die jeweiligen materiellen Regelmäßigkeiten ‚geschrieben‘ oder eingetragen sein können. Ganz gleich, ob der jeweilige Canvas real und unmittelbar greifbar oder virtuell (digital) ist, ob er händisch oder mit technologischer Unterstützung hergestellt wurde, physikalisch in der Zeit dargeboten wird oder aber Ergebnis eines anderen komplexen technologischen Prozesses ist: Die materiellen Regelmäßigkeiten werden über diesen Canvas wahrgenommen und interpretiert.“ gewissen Auswahl an Zeichenmodalitäten zur Erreichung eines sozial einge‐ schränkten und einschränkenden Spektrums an kommunikativen Zwecken“. Damit wird ein stärker (sozio-)technisches Verständnis in den Vordergrund gerückt; zudem setzen sich Medien - wie das Buch - aus verschiedenen Zeichenmodalitäten im gemeinsamen Gebrauch zusammen. Das Verhältnis von Medialität und Modalität wird eingehender im nachfolgenden Kap. 2.3 auf Grundlage einer Auswahl an Beiträgen zu diesem Band beleuchtet. Die Vielfalt an virulenten Beschreibungs- und Analysekategorien (Stöckl 2020: 44), was multimodale Kommunikationstypen betrifft, zeichnet sich auch für die in diesem Band zusammengefassten Beiträge ab. Als zentrale Größen bzw. Konstitutiva multimodaler Kommunikation setzen Wildfeuer et al. (2020: 133) den: die Produzent: in, den: die Rezipient: in, das Canvas 1 (als Träger bedeu‐ tungsvoller Regelmäßigkeiten) sowie das Zeitprofil des multimodalen Vollzugs an. Diese Bestimmungsstücke multimodaler Kommunikation werden auch in den Beiträgen dieses Bandes - mitunter divergierender Terminologie fol‐ gend - mehr oder weniger intensiv in den Blick genommen. Welche dieser Gesichtspunkte bzw. Eckpunkte von Kommunikation in actu in sich anschließ‐ enden Forschungsbeiträgen intensiver beleuchtet werden sollten, wird u. a. im Ausblick in Kap. 4 eingehender thematisiert. Grundsätzlich kennzeichnet den vorliegenden Band sein hoher empirischer Anteil. Auf Grundlage eines systematischen Umgangs mit multimodalen Daten verschiedenen Typs (zur empirischen Perspektive auch Jewitt 2016 sowie Norris 2019) schärfen die Beiträger: innen pragmatische Konzepte und Modelle - wie Ironie (Lehmann in diesem Band), Positionierung (Rhein/ Lautenschläger in diesem Band sowie Merten in diesem Band), Gruppenkonstitution (Kabatnik in diesem Band sowie Meier-Vieracker/ Hauser in diesem Band), Fremd- und Selbstwahl im Gespräch (Zima in diesem Band) usw. - mit Blick auf die multimodale Organisation von Kommunikation. Mithin versteht sich dieser Band als Dokumentation einer 10 Marie-Luis Merten, Lars Bülow, Susanne Kabatnik & Robert Mroczynski <?page no="11"?> pragmatischen Modellierung unseres heterogenen multimodalen Kommunika‐ tionsalltags. 2 Vielfalt des Phänomenbereichs Eine wesentliche Stärke des Bandes liegt in der Vielfalt der beleuchteten Phäno‐ mene wie auch der methodischen Herangehensweisen an diese Analysefelder. Trotz dieses hohen Grads an multimodal-kommunikativer Heterogenität lässt sich ebenso eine gewisse Stringenz konstatieren, insofern in allen durchweg empirischen Beiträgen eine (im weitesten Sinne) pragmatische Sichtweise auf multimodale Kommunikationsformen eingenommen und das Zusammenspiel verschiedener Zeichensysteme zur Herstellung von kommunikativem Sinn im Kontext reflektiert wird. In den sich anschließenden Abschnitten werden die drei Hauptthemenbereiche dieses Bandes, zu denen die Autor: innen jeweils einen Beitrag leisten, beleuchtet. Naheliegenderweise lassen sich einzelne Auf‐ sätze mehr als einem dieser drei Bereiche zuordnen, dennoch überwiegt im Großteil der Fälle eines der adressierten Anliegen. 2.1 Multimodale Perspektiven auf klassische linguistische Gegenstandsbereiche Indem die Multimodalität von Kommunikation berücksichtigt wird und mithin multimodale Daten als Forschungsgrundlage herangezogen werden, lässt sich ein neuer Blick auf klassische linguistische (bzw. pragmatische) Gegenstands‐ bereiche werfen. Wie bereits zu Beginn hervorgehoben: Zahlreiche kommu‐ nikative Phänomene werden keineswegs nur bzw. hauptsächlich sprachlich hervorgebracht, vielmehr sind Para- und Nonverbales bzw. grundsätzlich wei‐ tere semiotische Ressourcen an der jeweiligen Konstruktion - etwa von Sprech‐ akten, von Humor, von Fremd- und Eigenpositionierungen usw. - beteiligt. Ist dieser Umstand in allen Beiträgen dieses Bandes grundsätzlich von Relevanz, so sind es insbesondere die Beiträge von Fricke (in diesem Band) zur Negation und Verneinung, von Schoonjans et al. (in diesem Band) zur Intensivierung sowie von Lehmann (in diesem Band) zur Ironie, die diesen neuen multimodalen Blick auf klassische Gegenstandsbereiche der Linguistik in den Mittelpunkt ihrer Auseinandersetzungen rücken. Dabei sind speziell zwei Fragen - über alle diese Beiträge hinweg - von Interesse. Zum einen die Frage nach der möglichen Verfestigung von sprachlichen Elementen sowie Körper- und Blick‐ bewegungen ebenso wie Kopf- und Handgesten (dazu auch Stukenbrock 2021). Kookkurrieren im Falle dieser Phänomene (Negation, Intensivierung, Ironie) Pragmatik multimodal - Einführung 11 <?page no="12"?> bestimmte modedifferente semiotische Ressourcen zufällig miteinander, handelt es sich mithin um eine stark variable multimodale Begleitung von sprachlichen Mitteln, oder begegnen bestimmte multimodale Kombinationen wiederkeh‐ rend? Können wir demnach von verschiedenen Konventionalisierungsgraden der multimodalen Organisation sprechen (aus konstruktionsgrammatischer Perspektive auch Ziem 2017)? Zum anderen stellt sich die Frage nach der Reichweite und der grundsätzlichen Leistungsfähigkeit von linguistischen Ana‐ lysekategorien (wie etwa die Unterscheidung von Ironiemarker und Ironiesignal usw.) im Hinblick auf divergierende Zeichenmaterien und -systeme. Bedarf es stellenweise einer Anpassung, einer Weiterentwicklung, gar einer Neukonzep‐ tion des bewährten linguistischen Beschreibungsapparates? Fricke (in diesem Band) widmet sich diesen Fragen am Beispiel der Negation als einem klassischen Gegenstandsbereich an der Schnittstelle von Grammatik und Pragmatik. Ausgehend von den Fragen, wie im Falle der Negation sowohl gesprochene Sprache und Gesten als auch Schrift und Bild zusammenwirken, zeigt sie Gemeinsamkeiten und Unterschiede für diese beiden Relationstypen bzw. Typen des multimodalen Ensembles auf. Sie kann u. a. darlegen, dass eine multimodale Polynegation zur Grammatikalisierung von gestischen und bildlichen Zeichen im Hinblick auf eine sprachliche Negationsfunktion führen kann. Zudem hält sie als weitere instruktive Felder der pragmatischen Multimo‐ dalitätsforschung den Bereich von Negation und Deixis oder den von Negation und Interkulturalität - etwa mit Blick auf Gesten hochspannend - fest. Ein weiteres für rein sprachliche Mittel bereits gut erforschtes Feld beschreiten Schoonjans et al. (in diesem Band) mit dem Phänomen der Intensivierung, das sie unter multimodalen Gesichtspunkten beleuchten. Sie legen ihrer Arbeit ein graduelles Verständnis von Intensivierung zugrunde, das sowohl die Aus‐ drucksverstärkung als auch die Ausdrucksabschwächung integriert. Besondere Aufmerksamkeit kommt in ihrem Beitrag der Kookkurrenz von Kopf- und Handgesten, Blickverhalten und sprachlichen Intensivierern, also Partikeln wie total, echt, wahnsinnig, gar und voll zu. Trotz des explorativen Charakters ihrer Studie, die auf einer überschaubaren Belegzahl aufbaut, zeichnen sich etwa für Negationsverstärker andere multimodale Muster ab als für andere Fälle der Intensivierung mittels Partikeln. Die multimodale Hervorbringung von Ironie als einem (indirekten) expressiven Sprechakt (Schwarz-Friesel 2012; auch Kotthoff 2018: Kap. 30.3) erforscht Lehmann anhand eines multimodalen Fernsehkorpus eingehender. In den Blick gerät mithin ein umfangreiches, weitgehend natürlichsprachliches Datenset, das eine quantitative Herange‐ hensweise ermöglicht. Ihr Interesse gilt der Kookkurrenz von ausgewählten sprachlichen Ironie-Konstruktionen und akustischen Signalen (u. a. Pausen, 12 Marie-Luis Merten, Lars Bülow, Susanne Kabatnik & Robert Mroczynski <?page no="13"?> 2 Die Dingwelt kann „nicht nur als Sphäre von Gebrauchsobjekten […], sondern auch als konstitutive Voraussetzung für soziale Praktiken“ (Reckwitz 2014: 18) betrachtet werden. Tonhöhe, Sprechtempo) ebenso wie visuellen Ressourcen wie Blickverhalten, Kopf- und Körperbewegungen. Sie kann aufzeigen, dass ausgewählte akustische und gestische Ironiesignale mit bestimmten Konstruktionen wiederkehrend auftreten. In allen Beiträgen deutet sich demnach die Verfestigung multimo‐ daler Form-Funktionspaare an - ein Befund, der in Folgestudien eingehender beleuchtet werden sollte. 2.2 Kommunizierende Körper: Blicke, Bewegungen, Formationen Multimodale Kommunikation kann Deppermann (2018: 58) zufolge im Sinne leiblichen Handelns verstanden werden. Angesprochen sind damit körperbe‐ zogene Gesichtspunkte wie „Vokalität (einschließlich Sprache und Prosodie), Gestik, Blick, Mimik, die Einnahme von Körperposituren, die Bewegung im Raum und der Umgang mit Objekten“ (ebd.; zu einer ähnlichen Sichtweise Mondada 2016). Die Berücksichtigung dieser Aspekte kommt der bereits her‐ vorgehobenen Kontextsensibilität pragmatischer Analysen nach. So ist nach Rühlemann (2019: 6 f.) ein wesentlicher Bestandteil des Kontextes „the speaker’s bodily conduct into which the utterance is integrated“. Diesen Schwerpunkt auf kommunizierende Körper in Bewegung (Müller et al. 2013; aktuell auch Ortner 2023) setzt ebenfalls eine Reihe an Beiträgen dieses Bandes. Naheliegen‐ derweise geraten hierbei insbesondere Fälle der Face-to-Face-Kommunikation, also ko-präsente Formate des kommunikativen Austausches - wie die Gruppen‐ psychotherapie (Kabatnik in diesem Band) oder die gemeinsame Tanzstunde (Kindler in diesem Band) - in den Blick. Diese Form der multimodalen Kom‐ munikation „beruht auf der Anwesenheit der Kommunikationsteilnehmer, die durch Wahrnehmungswahrnehmungen in der Interaktion fortwährend herge‐ stellt und aufrechterhalten“ (Hausendorf et al. 2017: 27) wird. Grundlegende Konzepte der Gesprochenen-Sprache-Forschung gewinnen damit an Relevanz, was die multimodale Analyse betrifft: u. a. die Situativität, Interaktivität, Sequenzialität und Zeitlichkeit der Kommunikation. Auch der Einbezug der umgebenden Dingwelt 2 (Reckwitz 2014) kann für multimodale Kommunikation konstitutiv sein (vor allem Meier-Vieracker/ Hauser in diesem Band) und ist mithin im Rahmen einer körper- und raumbezogenen Analyse zu berücksich‐ tigen. Doch nicht nur in einem Großteil der Interaktionalen Linguistik bzw. Ge‐ sprochene-Sprache-Forschung wird der kommunizierende Körper in den Mittel‐ Pragmatik multimodal - Einführung 13 <?page no="14"?> punkt gerückt; mit dem Konzept des Embodiments spielen Körper und Körper‐ erfahrungen sowie deren Wahrnehmung ebenfalls in der Kognitiven Linguistik und Kognitionswissenschaft (u. a. Clark 2008) wie auch in der Soziolinguistik (u. a. Bucholtz/ Hall 2016) eine bedeutende Rolle. Im Vergleich zu den Beiträgen, die eingehender in Kap. 2.1 (Klassische linguistische Gegenstandsbereiche) be‐ handelt wurden, besteht ein wesentlicher Unterschied dieser Perspektivierung von multimodaler Kommunikation darin, dass nicht klassische linguistische Be‐ reiche, sondern die multimodale Kommunikationspraxis in ihrer Vielfältigkeit den Ausgangspunkt der Untersuchung bilden. Damit geraten unter Umständen auch Phänomene in den Blick, die stärker am Rande (typischer) linguistischer Untersuchungsfelder angeordnet werden können. Eingelassen in divergierende soziokulturelle (kommunikative) Praktiken (ähnlich Meyer 2013) kennzeichnet den Bereich kommunizierender Körper (in Bewegung) auch ein großes multi‐ modal-variationspragmatisches Potenzial, insofern gewisse Körperbewegungen in unterschiedlichen Ko- und Kontexten ebenso verschiedentliche Funktionen aufweisen sowie Bestandteil divergierender multimodaler Verfestigungen sein können. Hier zeigt sich das kontextualisierende Potenzial von sowohl Sprache als auch kookkurrierender Körperbewegung, Gestik, Mimik, Prosodie usw. Zentrale empirische Anliegen bestehen in der Systematisierung von Bedeutung mitkonstituierenden Körperhaltungen und -bewegungen wie auch in der Be‐ schäftigung mit der Frage, welche Körperbewegungen (wie bspw. bestimmte Gesten) als alleiniger Zeichenträger fungieren können. Dass insbesondere die Kopplung von Sprache und Körperbewegung mit ihren verschiedenen Graden der Konventionalisierung derzeit intensiv erforscht wird, ist bereits in Kap. 2.1 thematisiert worden. Die Körperlichkeit von Kommunikation spielt auch in weiteren Beiträgen dieses Bandes eine mehr oder weniger große Rolle (u. a. Rhein/ Lautenschläger in diesem Band sowie Merten in diesem Band); sie steht insbesondere in drei Aufsätzen im Zentrum der Auseinandersetzung. Indem Kabatnik (in diesem Band) ihren Untersuchungsfokus auf die kommunikative Gattung der Gruppen‐ psychotherapiesitzung richtet, rückt die helfende Interaktion von ko-präsenten Partizipant: innen in den Mittelpunkt. Ausgehend von einer Stuhlkreis-Sitzord‐ nung und den kommunikativen Beteiligungsrollen von Therapeut: in sowie Pa‐ tient: innen untersucht ihr Beitrag das sequenziell organisierte und multimodal musterhafte Erarbeiten von Formulierungsvorschlägen für die Messenger-ba‐ sierte Kommunikation. Sie kann zeigen, wie multimodale Routinen der sozi‐ alen Positionierung dienlich sind und Verhaltensveränderungen ko-konstruiert werden. Kindler (in diesem Band) widmet sich der onomatopoetischen Interjek‐ tion wusch in ihrer multimodal-musterhaften Verwendung im Tanz-Workshop. 14 Marie-Luis Merten, Lars Bülow, Susanne Kabatnik & Robert Mroczynski <?page no="15"?> Eingehendere Aufmerksamkeit wird demnach der dynamischen Bedeutungs‐ entfaltung im Kontext sich bewegender und kommunizierender Körper zuteil. Die onomatopoetische Interjektion wusch wird - eingebettet in eine körper‐ lich-gestische Performance - vom Tanzlehrer wiederholt zur Erklärung einer für den Walzertanz charakteristischen Dynamik einer Drehung verwendet; es zeichnet sich eine (kontextspezifische) Verfestigung als multimodale Bedeu‐ tungsgestalt infolge des wiederholten Gebrauchs des Tanzlehrers und des (anschließenden) Aufgreifens durch die Lernenden ab. In beiden Beiträgen (Kabatnik in diesem Band sowie Kindler in diesem Band) wird die Zeitlichkeit von multimodaler Bedeutungsentfaltung in ihrer Relevanz für den jeweiligen Kommunikationsausschnitt beleuchtet. Zwar sind auch raumbezogene Aspekte (Stuhlkreis, Smartphone, Bewegung im Raum etc.) in diesen Studien (bereits) von Bedeutung, allerdings nehmen die Konzepte des Raums sowie der Forma‐ tion von koordiniert handelnden Körpern im Beitrag von Meier-Vieracker und Hauser (in diesem Band) zur multimodalen Fußballfankommunikation eine besondere Stellung ein. Meier-Vieracker und Hauser widmen sich u. a. Fan-Cho‐ reografien im Fußballstadion. Im Zuge dieser zeitlich und räumlich aufeinander abgestimmten Ensemble-Aufführungen wird etwa das BVB-Wappen durch eine bestimmte Formation der Zuschauenden bzw. Fans sichtbar. Mithin avanciert der physische Raum angesichts dieser besonderen performativen Nutzung zur semiotischen Ressource, die sich in ihrer soziokulturellen Bedeutung erst durch ein entsprechendes multimodales Zeichenhandeln konstituiert. Darüber hinaus erforschen die beiden Autoren den digitalen multimodalen Fandiskurs, in dem an sich flüchtige, allerdings mittels Aufzeichnung dokumentierte Fan-Choreo‐ grafien dauerhaft verfügbar gehalten und - im Dienste der Gruppenkonstitution - anschlusskommunikativ verhandelt werden. 2.3 Vermittelte Kommunikation: Multimodalität, Medialität, Digitalität Wie bereits herausgestellt, dokumentieren die Beiträge dieses Bandes, dass der Fokus innerhalb der linguistischen Pragmatik nicht mehr nur auf rein sprachlicher Kommunikation liegt. Pragmatiker: innen sind sich spätestens seit der zuvor angesprochenen visuellen Wende innerhalb der Linguistik (dazu Bubenhofer 2020: Kap. 9.4.1) darüber im Klaren, dass andere Zeichenmodalitäten wie die bildliche Sehfläche oder Gesten oftmals den „notwendigen Ko- und Kontext“ (Stöckl 2016: 3) bilden, innerhalb dessen sich Bedeutung konstituiert. Das passt zu dem oben thematisierten Verständnis von Pragmatik als Disziplin, die sich ganz wesentlich mit der Hervorbringung und Interpretation von Pragmatik multimodal - Einführung 15 <?page no="16"?> Äußerungen im Ko- und Kontext beschäftigt (Kap. 1). Dennoch muss pragma‐ tischer Forschung zuweilen attestiert werden, dass die Integration anderer Zeichenmodalitäten als die der Sprache bei der Interpretation von Äußerungen nur unzureichend berücksichtigt wird. Entsprechend bezeichnet Stöckl (2016: 4) das Verständnis der „Prinzipien der intersemiotischen Sinnstiftung [als; LB] einen weitestgehend blinden Fleck“. Im Bereich der Multimodalitätsforschung, die sich grundsätzlich auf alle Formen der Kommunikation beziehen kann, wird vielfach darauf verwiesen, dass ein besseres Verständnis dieser Prinzipien inter‐ semiotischer Sinnstiftung nur dann möglich ist, wenn das Verhältnis zentraler Begrifflichkeiten zueinander geklärt ist (siehe z. B. Stöckl 2016; Klug/ Stöckl 2016; Bateman/ Tseng 2023). Im Kontext derjenigen Beiträge dieses Bandes, die pragmatische Phänomene in medial vermittelter Kommunikation adressieren, sind das unseres Erachtens insbesondere die Begrifflichkeiten Multimodalität, Medialität und Digitalität. Dass Kommunikation und die damit einhergehende Nutzung von Zeichen‐ ressourcen immer auch medial vermittelt sind, ist für alle Beiträge dieses Bandes wesentlich, wird von mehreren Beiträgen aber besonders deutlich betont. Rhein und Lautenschläger (in diesem Band) betrachten etwa multimodale Verortungs-, Positionierungs- und Grenzziehungspraktiken im Kontext von Polit-Talkshows, die - eingebunden in ihre spezifische Medialität - ein bestimmtes Genre darstellen. Herausfordernd und in den letzten Jahren häufig diskutiert ist die Einordnung digitaler Kommunikation (siehe z. B. Marx/ Weidacher 2020), die etwa in den Beiträgen von Merten (in diesem Band), Zima (in diesem Band) oder Scheiber et al. (in diesem Band) im Fokus steht. Mit Bateman und Tseng (2023: 91) fassen wir Medien als „historisch stabilisierte[n] Ort für den Einsatz und die Verbreitung einer gewissen Auswahl an Zeichenmodalitäten zur Erreichung eines sozial eingeschränkten und einschränkenden Spektrums an kommunikativen Zwecken“. Wir haben in Kap. 1 schon angedeutet, dass mit diesem Verständnis von Medium und Medialität ein stärker technisches Verständnis der Begriffe in den Vordergrund gerückt wird. In Anlehnung an Bateman und Tseng (2023: 93) stehen Medien dann „als potenzielle Realisie‐ rungen oder Ausdrucksstrategien für allgemeine kommunikative Zwecke, die als Genres bezeichnet werden“. Als solche Genres können beispielsweise die Polit-Talkshow im Fernsehen (siehe Rhein/ Lautenschläger in diesem Band) oder Image Macros in den Sozialen Medien (Scheiber et al. in diesem Band) verstanden werden. Auch Instagram-Posts im Kontext des #bodylove-Diskurses (Merten in diesem Band) oder Zoom-Videokonferenzen (Zima in diesem Band) lassen sich im weitesten Sinne als medial vermittelte Genres verstehen. 16 Marie-Luis Merten, Lars Bülow, Susanne Kabatnik & Robert Mroczynski <?page no="17"?> Diese Genres bzw. Formate zeichnen sich durch eine gewisse Musterhaf‐ tigkeit in der integrativen Anwendung von Modalitäten aus, die „in enge Berührung miteinander gebracht werden“ (Bateman/ Tseng 2023: 93). Im Genre Instagram-Post sind das vorrangig die Modalitäten Schrift und Bild, im Genre Zoom-Videokonferenzen sind das die gesprochene Sprache und Bewegt-Bild-Videoaufnahmen (siehe Tab. 1). Multimodalität, also die Kombina‐ tion verschiedener Zeichensysteme, ist ein wesentliches Charakteristikum von technisch-medial vermittelter Kommunikation (von Fernsehkommunikation bis hin zu Instagram- und Zoom-Kommunikation). Der Umgang mit multimodalen Genres setzt eine gewisse Literalität voraus, die im Kontext digitaler Kommu‐ nikation häufig als digital literacy - im Umgang mit Memes mitunter sogar als meme literacy - bezeichnet wird. Das Vorhandensein von digital literacy, die die Integration verschiedener Zeichensysteme einschließt, ist entscheidend bei der Interpretation von Äußerungen. Diese Aspekte werden insbesondere in den Beiträgen von Merten (in diesem Band) und Scheiber et al. (in diesem Band) deutlich herausgearbeitet. 3 Übersicht über die Beiträge des Bandes Nachfolgend geben wir eine tabellarische Übersicht über die Beiträge des vorliegenden Bandes. Aufgenommen in die Darstellung sind der untersuchte Gegenstand (G), der dazu herangezogene Datentyp (D), die gewählte Methodik (M) sowie zentrale Ergebnisse, die der jeweilige Beitrag bespricht. Die Übersicht ist als Angebot für Leser: innen zu verstehen, die sich einen auf wesentliche Gesichtspunkte konzentrierten Überblick über den Band verschaffen möchten. Beitrag: Gegenstand, Datentyp, Methodik Zentrale Ergebnisse (u.-a.) [1] E L L E N F RIC K E • Gemeinsame konzeptuelle Basis, die me‐ dial unterschiedlich ausdifferenziert wird mit den Schemata der multimodalen Ne‐ gationsabstufungen in Geste-Rede- und Schrift-Bild-Relationen • Spezifische Ausprägung und Grammati‐ kalisierung multimodaler Negation ist me‐ dienbzw. modalitätsbedingt • Grammatikalisierungsprozesse von gesti‐ schen sowie bildlichen Zeichen im Kon‐ text multimodaler Negationsensembles G: Negation und Verneinung D: Geste-Redesowie Schrift-Bild-Daten M: Qualitative mediensemiotische Analyse [2] S T E V E N S C H O O N J AN S , G E E R T B RÔN E , K U R T F E Y A E R T S & L IN E W INK E LMAN S • Negationsverstärker (wie gar und über‐ haupt) zeigen andere multimodale Muster Pragmatik multimodal - Einführung 17 <?page no="18"?> G: Intensivierung (multimodale Ein‐ bettung von Partikeln) als sonstige Intensivierer (u.-a. einfach, total) • Die Intensivierungsintensität beeinflusst die Art der Geste D: Semi-spontane Interaktionen (Eyetracking-Korpora) M: Kombination aus Annotation und qualitativer Analyse von Kookkur‐ renzen [3] C LAU DIA L E HMAN N • Para- und nonverbale Ironiesignale sind u.-a. abhängig von der gewählten Kon‐ struktion (gewisse Stabilisierung) • Einige der in der Literatur angeführten Ironiesignale werden auch mit nicht-iro‐ nischen Äußerungen gebraucht, sie sind daher nicht konstitutiv für Ironie G: Ironie im Gespräch D: Fernsehkorpus (NewsScape Library of International Television News) M: Annotation und Kombination qua‐ litativer und quantitativ-statistischer Analysen [4] S U S AN N E K A B AT NIK • Rekurrente (multimodale) Struktur von Formulierungsvorschlägen für das Ver‐ fassen einer Messenger-Nachricht (als Po‐ sitionierungspraxis) • Spezifische sequenzielle Abfolge rund um das Erarbeiten eines Formulierungsvor‐ schlags, damit Ko-Konstruktion von Ver‐ änderung auf verschiedenen Ebenen • Herausarbeiten von unterschiedlichen multimodalen Ressourcen zur Herstellung von Intersubjektivität in der Gruppenpsy‐ chotherapie G: Ko-Konstruktion von Veränderung in der Gruppenpsychotherapie D: Gruppentherapie-Videokorpus M: Multimodale Interaktionsanalyse [5] C LA R A K IN D L E R -M ATHÔT • Interjektion wusch als Teil einer multimo‐ dalen Verfestigung (Diskursmetapher) • Hervorhebung der Zeitlichkeit von Be‐ deutungsentfaltung im Kontext • Onomatopöie ist nicht nur die Nachah‐ mung eines Lautes, sondern Teil eines in‐ tersubjektiven Prozesses von Bedeutungs‐ herstellung und verkörpertem Verstehen G: Multimodale Einbettung der ono‐ matopoetischen Interjektion wusch D: (1) Videodaten eines Tanz-Works‐ hops samt (2) anschließenden Inter‐ views M: Qualitative Analyse auf Mikro- und Makroebene (Tanzstunde und Diskursraum) [6] S IM O N M E I E R -V I E R A C K E R & S T E F AN H AU S E R • Multimodale Stadien-Fanpraktiken greifen auf semiotisch vielfältige Zeichen‐ handlungen zurück, sie dienen der Grup‐ penkonstitution • Für diese Stadien-Inszenierungen ist die Materialität der körpergebundenen und räumlich wie zeitlich strukturierten Kom‐ munikation konstitutiv G: Fankommunikation im Fußball (Stadion & digitale Räume) D: (1) Foto- und Video-Dokumentati‐ onen von Fan-Choreografien; (2)-So‐ 18 Marie-Luis Merten, Lars Bülow, Susanne Kabatnik & Robert Mroczynski <?page no="19"?> cial-Media-Beiträge von Fans und Ver‐ einen • Im digitalen Raum wird ein vielstimmiger metapragmatischer Anschlussdiskurs ge‐ führt, der die multimodalen Aspekte der (Stadion-)Fankommunikation adressiert und problematisiert M: Digital-ethnografische Dokumen‐ tation und qualitative (medialitätsori‐ entierte) Untersuchung [7] M A RI E -L UI S M E R T E N • Herausarbeitung verschiedener seman‐ tisch-logischer und formal-struktureller Verknüpfungstypen von Schrift, Bild und Layout • Veranschaulichung multimodaler Kohä‐ renzbildung • Im Zuge multimodaler Stance-Akte tragen verschiedene Zeichenmodalitäten zum Entwerfen, Evaluieren und zur kommuni‐ kativ aneinander ausgerichteten Positio‐ nierung zu Stance-Objekten bei • Insbesondere Bilder dienen der Hervor‐ bringung von Stance-Objekten; Sprachbe‐ standteile übernehmen primär den eva‐ luativen Part G: Positionierungspraktiken im #bo‐ dylove-Diskurs auf Instagram D: Korpus bestehend aus Insta‐ gram-Posts als Schrift-Bild-Daten M: Mixed methods-Ansatz als Kombi‐ nation aus qualitativen und quantita‐ tiven Analyseschritten im Sinne der Korpuspragmatik [8] M A R C U S S C H E IB E R , H A G E N T R O S C HK E & J AN K R A S NI • Identifizierung von Verbreitungslogiken des antisemitischen Happy Mer‐ chant-Memes • Es wird aufgezeigt, wie das Happy Mer‐ chant-Meme re-semiotisiert und diskurs‐ regulierend verwendet wird • Es wird veranschaulicht, wie Re-Semio‐ tisierungspraktiken zur Diversifizierung des Memes beitragen G: Multimodale Re-Semiotisierungs‐ praktiken im Kontext von Image Macros D: Image Macros als (Schrift-)Bild-Daten M: Qualitative mediensemiotische Analysen [9] E LI S A B E TH Z IMA • Die Auswahl nächster Sprecher*innen erfolgt in Zoom-Interaktionen häufiger über Namensnennungen im Vergleich zu Face-to-Face-Interaktionen • Der Sprecherblick kann die Auswahlfunk‐ tion in Zoom-Interaktionen nicht erfüllen • Mittel der Anzeige zum Turnverzicht sind in Zoom-Interaktionen die gleichen, die für die ko-präsente Face-to-Face-Interak‐ tion beschrieben wurden G: Turn-Taking in Zoom-Videokonfe‐ renzen D: Audio-visuelle Zoom-Interakti‐ onen M: Qualitative interaktionale Ana‐ lysen [10] L I S A R H E IN & S INA L AU T E N ‐ S CHLÄG E R • Vereinnahmungs-, Instrumentalisie‐ rungs- und Abgrenzungsprozesse werden verbal, paraverbal und nonverbal voll‐ zogen • Haltungen, Aussagen und Interaktionen werden multimodal gestützt oder ver‐ stärkt G: Multimodale Vereinnahmungs-, Instrumentalisierungs- und Abgren‐ zungsprozesse zwischen Wissenschaft und Politik im Corona-Diskurs Pragmatik multimodal - Einführung 19 <?page no="20"?> D: Audio-visuelle Aufzeich‐ nung / Transkription einer Polit-Talk‐ show • Die Rolle der Kameraführung für Inszenie‐ rung wird herausgearbeitet M: Qualitative interaktionale Ana‐ lysen Tab. 1: Übersicht über die Beiträge des Bandes 4 Desiderata und Ausblick Die Beiträge dieses Bandes veranschaulichen für eine Vielzahl an Kommunika‐ tionsbereichen und Anwendungsfeldern sowie unter Nutzung verschiedener Forschungsmethoden, dass pragmatische Studien zur angemessenen Analyse von Kommunikation im Kontext über Sprache hinaus weitere Modalitäten (in ihrer kookkurrierenden Verwendung) zu berücksichtigen haben - ob in gesprochensprachlichen Zusammenhängen Prosodie, Gestik, Blickverhalten, Körperbewegung usw. oder im Kontext von Schriftverwendungen die Schrift‐ bildlichkeit, kookkurrierende Bilder, Layout etc. In Anbetracht dieser grund‐ sätzlich differenten Kommunikationsrahmen (insbesondere multimodale Kom‐ munikation in der Zeit vs. multimodale Kommunikation auf der Fläche) wird Multimodalität in den einzelnen Beiträgen unterschiedlich konturiert; gemein ist den jeweiligen Studien jedoch, dass sie die Integration verschiedener Zei‐ chensysteme zur Konstitution von kommunikativem Sinn in das Zentrum ihrer Auseinandersetzungen rücken. Vordergründig gerät dabei die Produktion von multimodaler Kommunikation in den Mittelpunkt; Fragen nach der Rezeption multimodaler Kommunikationsangebote scheinen uns - aus Sicht der linguis‐ tischen Pragmatik - noch weitgehend unbeantwortet. Studien, die multimodale Interaktion und damit stets auch Aufzeigeleistungen von Rezipierenden in den Blick nehmen, geben hierzu einen ersten Forschungsanstoß. Allerdings heben zahlreiche Beiträge ihren explorativen Charakter hervor; mithin lässt sich konstatieren, dass die pragmatische Forschung zu multimodaler Kommu‐ nikation noch an den Anfängen steht und ein vielfältiges und breites Feld an Phänomenen der eingehenderen Untersuchung bedarf. Dabei zeigen die Beiträge in diesem Band in ihrer größtenteils qualitativen Forschungsanlage, welche Konzepte und Modelle zu berücksichtigen sind, um vor allem dem De‐ siderat einer quantitativen Herangehensweise an multimodale Kommunikation nachzukommen. Die Gründe für diese Forschungslücke liegen auf der Hand: Sowohl die Zusammenstellung multimodaler und zur Untersuchung aufberei‐ teter (umfangreicher) Korpora als auch die nötige Mehrebenen-Annotation 20 Marie-Luis Merten, Lars Bülow, Susanne Kabatnik & Robert Mroczynski <?page no="21"?> sowie Mehrebenen-Analyse sind in zeitlicher wie auch personeller Hinsicht herausfordernde Aufgaben. Open Science-Bestrebungen und das Bereitstellen entsprechender Infrastrukturen und Daten-Pools sind hier in jedem Fall zu fördern. In inhaltlicher Sicht scheint uns insbesondere der Themenbereich von Mul‐ timodalität und Interkulturalität ein spannendes Feld für zukünftige pragmati‐ sche Forschungen aufzuspannen (z. B. sind Gesten in verschiedenen kulturellen Kreisen unterschiedlich semantisiert bzw. in Kopplung an divergierende sprach‐ liche Konstruktionen konventionalisiert). Eng daran geknüpft verspricht der Phänomenbereich von Multimodalität und Mehrsprachigkeit - als eine Form der Multikodalität - im Rahmen von Linguistic Landscape-Studien instruktive Einsichten in das (musterhafte) Miteinander-Vorkommen, Aufeinander-Bezug‐ nehmen und Voneinander-Abgrenzen von Zeichensystemen verschiedener Qualität im (urbanen) Raum. Dass den Konzepten Zeit(lichkeit) und Raum in der Analyse multimodaler Kommunikation eingehendere Berücksichtigung zukommen sollte, hat sich bereits in einigen Beiträgen dieses Bandes angedeutet. Literatur Albert, Georg (2020). Emojis und soziale Registrierung (enregisterment). Positionierungs‐ aktivitäten am Beispiel der psychosozialen Online-Beratung. In: Androutsopoulos, Jannis/ Busch, Florian (Hrsg.). Register des Graphischen. Variation, Interaktion und Reflexion in der digitalen Schriftlichkeit. Berlin/ Boston: De Gruyter, 183-213. Bateman, John/ Wildfeuer, Janina/ Hiippala, Tuomo (2017). Multimodality. Foundations, Research and Analysis. A Problem-Oriented Introduction. Berlin/ Boston: De Gruyter. Bateman, John/ Tseng, Chiao-I (2023). Linguistik und Multimodalität. Die Integration empirischer, semiotischer und hermeneutischer Methoden durch Triangulation. In: Meiler, Matthias/ Siefkes, Martin (Hrsg.). Linguistische Methodenreflexion im Auf‐ bruch. Beiträge zur aktuellen Diskussion im Schnittpunkt von Ethnographie und Digital Humanities, Multimodalität und Mixed Methods. Berlin/ Boston: De Gruyter, 79-115. Bubenhofer, Noah (2020). Visuelle Linguistik. Zur Genese, Funktion und Kategorisierung von Diagrammen in der Sprachwissenschaft. Berlin/ Boston: De Gruyter. Bucholtz, Mary/ Hall, Kira (2016). Embodied sociolinguistics. In: Coupland, Nikolas (Hrsg.). Sociolinguistics: Theoretical debates. Cambridge: Cambridge University Press, 173-197. Bülow, Lars/ Merten, Marie-Luis/ Johann, Michael (2018). Internet-Memes als Zugang zu multimodalen Konstruktionen. Zeitschrift für Angewandte Linguistik 69, 1-32. Pragmatik multimodal - Einführung 21 <?page no="22"?> Clark, Andy (2008). Supersizing the Mind: Embodiment, Action, and Cognitive Extension. Embodiment, Action, and Cognitive Extension. Oxford: Oxford University Press. Deppermann, Arnulf (2015). Pragmatik revisited. In: Eichinger, Ludwig M. (Hrsg.). Sprachwissenschaft im Fokus. Positionsbestimmungen und Perspektiven. Berlin/ Boston: De Gruyter, 323-352. Deppermann, Arnulf (2018). Sprache in der multimodalen Interaktion. In: Deppermann, Arnulf/ Reineke, Silke (Hrsg.). Sprache im kommunikativen, interaktiven und kultur‐ ellen Kontext. Berlin/ Boston: De Gruyter, 51-85. Feilke, Helmuth (2015). Sprachsystem und Sprachgebrauch. In: Felder, Ekkehard/ Gardt, Andreas (Hrsg.). Handbuch Sprache und Wissen. Berlin/ Boston: De Gruyter, 81-105. Forceville, Charles J. (2016). Pictorial and Multimodal Metaphor. In: Klug, Nina-Maria/ Stöckl, Hartmut (Hrsg.). Handbuch Sprache im multimodalen Kontext. Berlin/ Boston: De Gruyter, 241-260. Fricke, Ellen (2012). Grammatik multimodal: Wie Wörter und Gesten zusammenwirken. Berlin/ New York: De Gruyter. Fritz, Gerd (2013). Dynamische Texttheorie. Gießen: Gießener Elektronische Bibliothek. Hausendorf, Heiko/ Kesselheim, Wolfgang/ Kato, Hiloko/ Breitholz, Martina (2017). Text‐ kommunikation. Ein textlinguistischer Neuansatz zur Theorie und Empirie der Kom‐ munikation mit und durch Schrift. Berlin/ Boston: De Gruyter. Huang, Lihe (2022). Toward Multimodal Pragmatics. A Study of Illocutionary Force in Chinese Situated Discourse. London: Routledge. Jewitt, Carey (2014a). Multimodal approaches. In: Norris, Sigrid/ Maier, Carmen Daniela (Hrsg.). Interactions, Images and Texts. A Reader in Multimodality. Berlin/ Boston: De Gruyter, 127-136. Jewitt, Carey (Hrsg.) (2014b). The Routledge handbook of multimodal analysis. London/ New York: Routledge. Jewitt, Carey (2016). Multimodal analysis. In: Georgakopoulou, Alexandra/ Spilioti, Te‐ reza (Hrsg.). Handbook of language and digital communication. Abingdon: Routledge, 69-84. König, Katharina (2019). Stance taking with ‘laugh’ particles and emojis - Sequential and functional patterns of ‘laughter’ in a corpus of German WhatsApp chats. Journal of Pragmatics 142, 156-170. König, Katharina (2021). Text- und Audio-Postings in der mobilen Messenger-Kommu‐ nikation - Vergleichende Perspektiven auf transmodale Kommunikation. In: Tienken, Susanne/ Hauser, Stefan/ Lenk, Hartmut/ Luginbühl, Martin (Hrsg.). Methoden kon‐ trastiver Medienlinguistik. Bern: Peter Lang, 147-162. Kotthoff, Helga (2018). Humor in der Pragmatik. In: Liedtke, Frank/ Tuchen, Astrid (Hrsg.). Handbuch Pragmatik. Stuttgart: J.B. Metzler, 302-311. 22 Marie-Luis Merten, Lars Bülow, Susanne Kabatnik & Robert Mroczynski <?page no="23"?> Kress, Gunther (2010). Multimodality: A social semiotic approach to contemporary communication. London/ New York: Routledge. Kress, Gunther/ van Leeuwen, Theo (1996). Reading images: The grammar of visual design. London/ New York: Routledge. Klug, Nina-Maria (2016). Multimodale Text- und Diskurssemantik. In: Klug, Nina-Maria/ Stöckl, Hartmut (Hrsg.). Handbuch Sprache im multimodalen Kontext. Berlin/ Boston: De Gruyter, 165-189. Klug, Nina-Maria/ Stöckl, Hartmut (2016). Einleitung. In: Klug, Nina-Maria/ Stöckl, Hartmut (Hrsg.). Handbuch Sprache im multimodalen Kontext. Berlin/ Boston: De Gruyter, VII-XIII. Marx, Konstanze/ Weidacher, Georg (2020). Internetlinguistik. Ein Lehr- und Arbeitsbuch. 2. aktualisierte und durchgesehene Auflage. Tübingen: Narr. Meier, Stefan (2016). Websites als multimodale digitale Texte. In: Klug, Nina-Maria/ Stöckl, Hartmut (Hrsg.). Handbuch Sprache im multimodalen Kontext. Berlin/ Boston: De Gruyter, 410-436. Merten, Marie-Luis (2022). Ritualisierte Anschlusskommunikation auf Instagram. For‐ melhafte Komplimente und ihre Erwiderung als verdichtete Online-Interaktion. Deutsche Sprache 50 (4), 309-334. Meyer, Christian (2013). Ethnography: Body, communication, and cultural practices. In: Müller, Cornelia/ Cienki, Alan/ Fricke, Ellen/ Ladewig, Silva/ McNeill, David/ Tessen‐ dorf, Sedinha (Hrsg.). Body - Language - Communication. An International Hand‐ book on Multimodality in Human Interaction. Band-1. Berlin/ Boston: De Gruyter, 202-217. Mondada, Lorenza (2013). Multimodal interaction. In: Müller, Cornelia/ Cienki, Alan/ Fricke, Ellen/ Ladewig, Silva/ McNeill, David/ Teßendorf, Sedinha (Hrsg.). Body - lang‐ uage - communication: An international handbook on multimodality in human interaction. Berlin/ Boston: De Gruyter, 577-589. Mondada, Lorenza (2016). Challenges of multimodality: Language and the body in social interaction. Journal of Sociolinguistics 20 (2), 2-32. Mondada, Lorenza (2018). Multiple temporalities of language and body in interaction: Challenges for transcribing multimodality. Research on Language and Social Interac‐ tion 51 (1), 85-106. Müller, Cornelia/ Cienki, Alan/ Fricke, Ellen/ Ladewig, Silva/ McNeill, David/ Tessendorf, Sedinha (Hrsg.) (2013). Body - Language - Communication. An International Hand‐ book on Multimodality in Human Interaction. Band-1. Berlin/ Boston: De Gruyter. Norris, Sigrid (2004). Analyzing Multimodal Interaction: A Methodological Framework. London: Routledge. Norris, Sigrid (2019). Systematically Working with Multimodal Data: Research Methods in Multimodal Discourse Analysis. Hoboken/ Chichester: Wiley. Pragmatik multimodal - Einführung 23 <?page no="24"?> O’Halloran, Kay L. (Hrsg.) (2004). Multimodal Discourse Analysis. London: Continuum. O’Halloran, Kay L./ Tan, Sabine/ K. L. E, Marissa (2014). Multimodal pragmatics. In: Schneider, Klaus P./ Barron, Anne (Hrsg.). Pragmatics of Discourse. Berlin/ Boston: De Gruyter, 239-268. O’Keeffe, Anne/ Clancy, Brian/ Adolphs, Svenja (2011). Introducing Pragmatics in Use. Abingdon/ New York: Routledge. Ortner, Heike (2023). Sprache - Bewegung - Instruktion. Multimodales Anleiten in Texten, audiovisuellen Medien und direkter Interaktion. Berlin/ Boston: De Gruyter. O’Toole, Michael (1994). The Language of Displayed Art. London: Leicester University Press. Pappert, Steffen (2017). Zu kommunikativen Funktionen von Emojis in der Whats- App-Kommunikation. In: Beißwenger, Michael (Hrsg.). Empirische Erforschung in‐ ternetbasierter Kommunikation. Berlin/ Boston: De Gruyter, 175-211. Reckwitz, Andreas (2014). Die Materialisierung der Kultur. In: Elias, Friederike/ Franz, Albrecht/ Murmann, Henning/ Weiser, Ulrich Wilhelm (Hrsg.). Praxeologie. Beiträge zur interdisziplinären Reichweite praxistheoretischer Ansätze in den Geistes- und Sozialwissenschaften. Berlin/ Boston: De Gruyter, 13-25. Rühlemann, Christoph (2019). Corpus Linguistics for Pragmatics. London: Routledge. Schoonjans, Steven (2018). Modalpartikeln als multimodale Konstruktionen. Eine kor‐ pusbasierte Kookkurrenzanalyse von Modalpartikeln und Gestik im Deutschen. Berlin/ Boston: De Gruyter. Schwarz-Friesel, Monika (2012). Ironie als indirekter expressiver Sprechakt: Zur Funk‐ tion emotionsbasierter Implikaturen bei kognitiver Simulation. In: Bachmann-Stein, Andrea/ Merten, Stephan/ Roth, Christine (Hrsg.). Perspektiven auf Wort, Satz und Text. Trier: Wissenschaftlicher Verlag Trier, 223-232. Spieß, Constanze (2016). Metapher als multimodales kognitives Funktionsprinzip. In: Klug, Nina-Maria/ Stöckl, Hartmut (Hrsg.). Handbuch Sprache im multimodalen Kon‐ text. Berlin/ Boston: De Gruyter, 75-98. Stöckl, Hartmut (2016). Multimodalität - Semiotische und textlinguistische Grundlagen. In: Klug, Nina-Maria/ Stöckl, Hartmut (Hrsg.). Handbuch Sprache im multimodalen Kontext. Berlin/ Boston: De Gruyter, 3-35. Stöckl, Hartmut (2020). Linguistic Multimodality - Multimodal Linguistics: A State-of-the-Art Sketch. In: Wildfeuer, Janina/ Pflaeging, Jana/ Bateman, John/ Seizov, Ognyan/ Tseng, Chiao-I (Hrsg.). Multimodality. Disciplinary Thoughts and the Chal‐ lenge of Diversity. Berlin/ Boston: De Gruyter, 41-68. Stöckl, Hartmut/ Caple, Helen/ Pflaeging, Jana (Hrsg.) (2020). Shifts toward image-cent‐ ricity in contemporary multimodal practices. New York/ London: Routledge. Stukenbrock, Anja (2021). Mit Blick auf die Geste - multimodale Verfestigungen in der Interaktion. In: Weidner, Beate/ König, Katharina/ Imo, Wolfgang/ Wegner, Lars 24 Marie-Luis Merten, Lars Bülow, Susanne Kabatnik & Robert Mroczynski <?page no="25"?> (Hrsg.). Verfestigungen in der Interaktion. Konstruktionen, sequenzielle Muster, kommunikative Gattungen. Berlin/ Boston: De Gruyter, 231-261. Wildfeuer, Janina/ Bateman, John A./ Hiippala, Tuomo (2020). Multimodalität: Grund‐ lagen, Forschung und Analyse. Eine problemorientierte Einführung. Berlin/ Boston: De Gruyter. Ziem, Alexander (2017). Do we really need a Multimodal Construction Grammar? Linguistics Vanguard 3 (1), 1-9. Zima, Elisabeth/ Brône, Geert (2015). Cognitive Linguistics and interactional discourse. Time to enter into dialogue. Language and Cognition 7 (4), 485-498. Zima, Elisabeth/ Bergs, Alexander (2017). Multimodality and construction grammar. Linguistics Vanguard 3 (1), 1-9. Pragmatik multimodal - Einführung 25 <?page no="27"?> Negation multimodal Rede und Geste, Schrift und Bild Ellen Fricke Abstract: This article aims to illustrate how the classical linguistic domain of negation (Blühdorn 2012; Jacobs 1991; Jespersen 1917) can be connected with a comprehensive multimodal perspective (Fricke 2012, 2021a). It explores the interaction between gesture and speech, as well as text and image, within the realm of negation. The article addresses the following key questions: 1. How do gesture and speech, and writing and image, interact when expressing negation? 2. To what extent can gestures or pictorial signs function as independent negation markers? 3. Can we observe processes of multimodal grammaticalization in this context? 4. What similarities and differences can be identified between gesture-speech and text-image relations? Through the analysis of examples, five hypotheses are developed, providing a foundation for further investigations. In particular, this study argues that (1) both gestural and pictorial (proto-)negators can be derived from physical actions of removing objects, and (2) the specific manifestation and grammaticalization of multimodal negation are influenced by the medium or modality used. Keywords: negation, multimodality, grammaticalization, gesture, image, semiotics, pragmatics, multimodal grammar, mediality, language acquisition, Jespersen cycle, co-speech gestures, emblems, intentionality, intensional logic <?page no="28"?> 1 Gefördert durch die Deutsche Forschungsgemeinschaft (DFG) - Project ID 416228727 - SFB 1410. Gefördert durch die Fritz Thyssen Stiftung. Dieser Artikel basiert auf eingeladenen Vorträgen zum Workshop „Pragmatik der Negation im Deutschen“ (Uni‐ versität Bonn 20. bis 22.3.2019) und zum Kolloquium an der Ruhr-Universität Bochum (13.7.2021) sowie der gleichnamigen Keynote (22.2.2022) auf der ALP-Jahrestagung „Pragmatik multimodal“ an der Universität Tübingen. 2 Im Folgenden wird der Textbegriff sowohl im engeren als auch im weiteren Sinn verwendet: erstens als umfassender multimodaler Text unter Einschluss von bildlichen Elementen und zweitens im Sinne von geschriebener Sprache und schriftlichen Text‐ elementen in Kontrast zu bildlichen Elementen. 1 Einführung Ziel des vorliegenden Beitrags 1 ist es, exemplarisch zu zeigen, wie man einen klassischen linguistischen Gegenstandsbereich wie die Negation (z. B. Blühdorn 2012; Dahl 2010; Deppermann/ Blühdorn 2013; Jacobs 1991; Jespersen 1917) multimodal perspektivieren kann (Fricke 2012, 2021a). Im Zentrum stehen dabei die folgenden Fragen: 1. Wie wirken im Bereich der Negation Geste und Rede sowie Schrift 2 und Bild zusammen? 2. Inwieweit können gestische oder bildliche Zeichen allein als Negationsträger fungieren? 3. Inwieweit lassen sich Prozesse einer multimodalen Grammatikalisierung beobachten? 4. Welche Gemeinsam‐ keiten und Unterschiede lassen sich für Geste-Rede- und Schrift-Bild-Relationen herausarbeiten? Im Rahmen qualitativer Analysen von ausgewählten Einzelbei‐ spielen, die explorativ in einen Zusammenhang gebracht werden, wird eine Gruppierung von fünf Leithypothesen herausgearbeitet, die weiterführenden Untersuchungen zugrunde gelegt werden kann, beispielsweise in den Bereichen Deixis und Negation, Negation und Metonymie, Negation und interkultureller sowie technologischer Kontext (siehe die Ausführungen zum Forschungsaus‐ blick in Abschnitt 6). Untersucht man sprachliche Äußerungen an der Schnittstelle von Pragmatik und Grammatik unter dem Aspekt ihrer Medialität und Materialität (im Sinne von Zeichenmaterie nach Hjelmslev), dann stellt sich die grundlegende Frage nach der Reichweite und grundsätzlichen Leistungsfähigkeit von Analysekate‐ gorien im Hinblick auf die vorliegende Zeichenmaterie: Sind Konzepte wie z. B. Modifikation (Fricke 2012, 2021a) oder Determination (Hjelmslev 1969 [= 1943]) zeichenmaterieneutral, so der bereits von Hjelmslev formulierte Grundgedanke, dann sind sie grundsätzlich für beliebige Modalitäten adaptierbar und stellen ein potentielles tertium comparationis für die Analyse bereit. Im Falle der Negation und der damit verbundenen Negationsoperatoren scheint es sich auf den ersten Blick um solch ein zeichenmaterieneutrales Konzept zu handeln, welches überdies universal ist: „Wenn es irgendein semantisches Universal gibt, 28 Ellen Fricke <?page no="29"?> das heißt ein Phänomen, das in allen Sprachen auftritt, dann ist es die Nega‐ tion. Jede Sprache hat grammatische und/ oder lexikalische Mittel, um einen gegebenen Satz zu negieren.“ (Löbner 2003: 286). Wenn man im Hinblick auf die Analysekategorien jedoch zusätzlich spezifische mediale Eigenschaften der beteiligten Modalitäten berücksichtigt wie z. B. unterschiedliche Sinnesmodali‐ täten (auditiv vs. visuell) sowie ihre unterschiedlichen Konventionalisierungs- und Lexikalisierungsstufen (z. B. redebegleitende Gesten oder gewisse visuelle Durchstreichungen als zwar typisierte aber nur partiell konventionalisierte Ein‐ heiten), „dann stellt sich die Frage, welche Rolle solche spezifischen Kategorien im Kontext einer multimodalen Sprachbeschreibung spielen können und sollen und in welches Verhältnis sie zu zeichenmaterieneutralen abstrakten Kategorien zu setzen sind“ (Fricke/ Mittelberg 2019: 321). Beginnen wir zunächst mit den multimodalen Geste-Rede-Relationen: Warum ist die Beteiligung des Körpers, warum sind Hand- und Kopfbewe‐ gungen für das Thema Negation und Verneinung ( Jacobs 1991, zur terminologi‐ schen Abgrenzung siehe Abschnitt 3) relevant? Zwei bekannte Aspekte sind hier zentral (siehe z. B. Calbris 2011; Bressem/ Müller 2014; Fricke et al. 2014; Kendon 2004; Harrison 2009a, 2018): Erstens die Beobachtung, dass Körperbewegungen verbale Negationsträger in lautsprachlichen Äußerungen ersetzen können, und zweitens die Annahme, dass die Form von Negationsträgern aus körperlichen Handlungen abgeleitet werden kann. Wir gehen zunächst auf den ersten Aspekt ein. Auf die Frage: Hast du das Buch aus der Bibliothek abgeholt? können wir mit einem laut vernehmlichen verbalen nein antworten oder aber auch mit einem stummen verneinenden Kopfschütteln als Äquivalent zur Satznegation. Daraus folgt: Eine Untersuchung von Negation und Verneinung in der gesprochenen Sprache darf potentielle nonverbale Negatoren nicht von vornherein aus dem Gegenstandsbereich der Sprachwissenschaft ausschließen. Sollten der Sprecher oder die Sprecherin aus bestimmten Regionen des südeuropäischen Raums, wie Süditalien, Griechenland oder der Türkei kommen, wird ihre Kopfbewegung allerdings kein Kopfschütteln auf der horizontalen Links-Rechts-Achse sein, sondern ein Nachhintenwerfen des Kopfes in den Nacken auf der vertikalen Oben-Unten-Achse. Derjenigen Achse, die wir Zentraleuropäer für die Zustim‐ mung oder Bejahung verwenden (Morris et. al. 1979: 154 f.). Solche einzelsprach‐ übergreifenden Unterschiede bieten ein weites Feld für die Untersuchung potentieller interkultureller Missverständnisse im Bereich der multimodalen Negation und Verneinung. Eine ähnliche Beobachtung lässt sich auch für die geschriebene Sprache anstellen. Auch hier stellt sich die Frage (z.-B. Oversteegen/ Schilperoord 2014): Negation multimodal 29 <?page no="30"?> Warum sind bildliche Durchstreichungen für das Thema Negation und Vernei‐ nung relevant? Auch in diesem Fall sind wiederum die zwei bereits für Gesten genannten Aspekte zentral: Erstens die Beobachtung, dass Durchstreichungen funktional äquivalent zu verbalen Negationsträgern in lautsprachlichen Äuße‐ rungen sein können, und zweitens die Annahme, dass die Form von bildlichen Negationsträgern ebenfalls aus körperlichen Handlungen abgeleitet werden kann. Zum ersten Punkt ein Beispiel: DER SPIEGEL 38/ 2011 - DER SPIEGEL 14/ 2010 Abb. 1 und 2: Der lexikalische Negationsträger unohne und mit Durchstreichung: Der Unbelehrbare und Der Unfehlbare, Spiegeltitel vom 10.09.2011 und 03.04.2010 Abb. 1 und 2 zeigen zwei Titel des Magazin DER SPIEGEL mit dem damaligen Papst Benedikt. Beide Überschriften enthalten substantivierte Adjektive ((der) Unbelehrbare, (der) Unfehlbare), in denen durch das kategorienerhaltende Ne‐ gationspräfix undie jeweilige adjektivische Stammgruppe modifiziert wird. Auf dem Spiegeltitelbild rechts ist jedoch nicht nur der verbale lexikalische Negationsträger, das Präfix unan der Negation im engeren Sinn beteiligt, sondern auch die Durchstreichung, die hier als Äquivalent eines verbalen Ne‐ gationsoperators fungiert. Dem damaligen Papst Benedikt, der bis zur Taille mit ausgestreckten Armen auf dem Spiegeltitel abgebildet ist, wird die Eigenschaft der Unfehlbarkeit abgesprochen. Verbal wäre der Titel zu paraphrasieren als 30 Ellen Fricke <?page no="31"?> 3 Die Durchstreichung hat in diesem Beispiel außerdem eine Intensivierungsfunktion. Diese ist jedoch nicht beschränkt auf eine zusätzliche Verstärkung des bereits vorhan‐ denen verbalen Negators, sondern durch die multimodale doppelte Negierung erfolgt eine verstärkte Bejahung der Aussage, dass der Papst fehlbar sei. Zu den Spezifika medialer Negationseffekte siehe Abschnitt 4. Der nicht Unfehlbare. Die Durchstreichung, so meine These, fungiert in diesem Beispiel zumindest näherungsweise als Äquivalent eines verbalen Negationsoperators. 3 Die folgenden Beispiele sind einer arbeitswissenschaftlichen Studie des interdisziplinären Forschungsprojekts MANUACT entnommen (www.manuac t.org). Es geht um die Gestaltung von 3D-Schnittstellen mithilfe von Gesten‐ steuerung. Der jeweilige Proband hat die Aufgabe eine manuelle Geste zu wählen, die in der Lage ist zu signalisieren, dass der auf dem Bildschirm links dargebotenen Zustand mit einem abstrakten geometrischen Dreieck in den rechts dargebotenen Zustand eines leeren Bildschirms überführt werden soll. Es geht also um das Entfernen oder Löschen von Objekten. Der in den Abb. 3 und 4 gezeigte Proband ahmt mit seinen Händen spontan die Handlung eines pikto‐ rialen Durchstreichens nach. Weitere Gesten, die in diesem Zusammenhang für Löschen bzw. Entfernen aufgetreten sind, waren Wegwerfen und Wegschieben, die zu einer Gestenfamilie rekurrenter Gesten gehören, auf die in Abschnitt 4.1 unten noch eingegangen wird. Ihre Gemeinsamkeit ist, dass Objekte vom Körper wegbewegt oder weggehalten werden (Bressem/ Müller 2014; Fricke et al. 2014). - Abb. 3 a, b: MANUACT-Studie: Gestische Nachahmung der Handlung des Durchstrei‐ chens (Vorder- und Rückansicht in Phase 1) (www.manuact.org) Negation multimodal 31 <?page no="32"?> Abb. 4 a, b: MANUACT-Studie: Gestische Nachahmung der Handlung des Durchstrei‐ chens (Vorder- und Rückansicht in Phase 2) (www.manuact.org) Ein Durchstreichen tritt auch in anderen Kontexten auf wie etwa in konventionalisierter Form bei Verbotsschildern ohne zusätzlichen Begleittext. Dasjenige, was einem untersagt wird zu tun, wird metonymisch durch ein Objekt repräsen‐ tiert, welches durchgestrichen ist. Verbotsschilder können jedoch auch gänzlich ohne Objekt auftreten, und zwar mit einfacher oder doppelter Unterstreichung wie etwa bei den Schildern für Parkverbot und absolutes Halteverbot. Die doppelte Durchstreichung hat in diesem Fall eine zusätzliche Intensivierungs‐ funktion: Denn bei einem Parkverbot (eine Durchstreichung) ist ein Halten (hingegen doppelte Durchstreichung für Verbot) noch erlaubt. Allein wenn wir diese wenigen Beispiele betrachten, stoßen wir auf einige auffällige Parallelen bei Geste-Rede- und Schrift-Bild-Relationen. Es geht ers‐ tens in beiden Bereichen um das Entfernen eines Objekts, das aus einer körperlichen Basishandlung ableitbar ist. Bei den Schrift-Bild-Relationen ist es die Handlung des Durchstreichens oder Überschreibens. Zweitens können in beiden Bereichen verbale Negationsträger ersetzt werden: auf der gestischen Ebene z. B. durch das Kopfschütteln, auf der bildlichen Ebene durch eine Durchstreichung. Diese Parallelen führen in den folgenden Abschnitten zu der grundlegenden Frage, inwieweit für Geste-Rede- und Schrift-Bild-Relationen eine gemeinsame konzeptuelle Basis angenommen werden kann, die jeweils medial unterschiedlich ausdifferenziert wird. 2 Multimodalität: Definition und Beispiel Der entscheidende Grundgedanke der sprachwissenschaftlichen Multimodali‐ tätsforschung lässt sich mit dem folgenden Zitat von Kenneth Pike auf den Punkt bringen: „Verbal and nonverbal activity is a unified whole, and theory and methodology should be organized or created to treat it as such“ (Pike 1967: 26). Etwas technischer ist die folgende Definition aus Fricke (2012), die an 32 Ellen Fricke <?page no="33"?> Pike (1967), Hjelmslev (1969 [= 1943]) und Kendon (1980) anknüpft: „Sind zwei sprachliche Medien simultan in denselben Kode strukturell und/ oder funktional integriert oder manifestiert sich umgekehrt ein Kode in unterschiedlichen Medien, dann liegt Multimodalität vor.“ (Fricke 2012: 46) Beide Aspekte, Prozesse der Kodemanifestation und der Kodeintegration (Fricke 2012, 2021a) finden wir auch im Bereich der multimodalen Negation. Ich möchte zunächst mit einem konkreten Beispiel (siehe die Standbilder in Abb. 5 und 6) fortfahren, welches das Zusammenwirken von Lautsprache und Gestik im Bereich der Negation und Deixis illustriert (Fricke 2007: 270, 2021b: 135). (1) B: 1 [wenn HIER das Gewässer iss\ (.) {(.)} - A: {hm} (.) - B: 2 [und DA das Haus\ (.) - A: nein 3 [nein HIER iss das Gewässer 4 [und DA iss das Haus\ (..) - B: das verSTEH ich nich\ ] 4 ] 3 (..)] 2 ] 1 Abb. 5: Deixis und Negation in Beschrei‐ bung des Potsdamer Platzes (Gesten 1 (rh) und 2 (lh)) (Fricke 2007: 270) - Abb. 6: Deixis und Negation in Beschrei‐ bung des Potsdamer Platzes (zusätzlich Geste 3 (lh)) (Fricke 2007: 270) Es handelt sich um eine Wegbeschreibung eines Parcours am Potsdamer Platz, die in einem Büro der TU Berlin aufgezeichnet wurde. Person A ist zuvor mit der Versuchsleiterin einen festgelegten Weg am Potsdamer Platz in Berlin entlang gegangen und hatte die Aufgabe, diesen Weg einer Person aus Probandengruppe B so genau zu beschreiben, dass diese sich in die Lage versetzt sieht, diesen Weg wiederum einer Person aus Probandengruppe C so genau zu beschreiben, dass diese den Weg eigenständig finden und den gesamten Parcours vom Anfangspunkt bis Endpunkt erfolgreich begehen kann (siehe Fricke 2007). Nicht nur an der TU Berlin, sondern auch am Potsdamer Platz selbst wurden Wegbe‐ schreibungen aufgezeichnet und damit die Zugänglichkeit der beschriebenen Situation für die Probanden variiert. Um unter diesen veränderten Kontextbe‐ Negation multimodal 33 <?page no="34"?> dingungen den Potsdamer Platz zu veranschaulichen und zu vergegenwärtigen, werden in Abwesenheit der beschriebenen Situation durch die beteiligten Probanden multimodal - d. h. gestisch und lautsprachlich -, und zwar in der Interaktion selbst, flüchtige Modelle des abwesenden Potsdamer Platzes erzeugt, die einem dreidimensionalen Umraum, einem zweidimensionalen Bildschirm mit einer gewissen Tiefendimension oder einer primär zweidimensionalen Karte in Draufsicht gleichen können (Fricke 2007, 2022). Im vorliegenden Bei‐ spiel handelt es sich um eine zweidimensionale kartenähnliche Repräsentation. Interessant ist nun an diesem speziellen Beispiel, dass Sprecherin A und Adressatin B mittels Negation und Deixis zeitlich simultan zwei einander widersprechende räumliche Repräsentationen des Potsdamer Platzes erzeugen. In dem Raum von Adressatin B repräsentiert die rechte Hand von B das Hier des Gewässers, in dem anderen Raum von Sprecherin A wird das Hier durch die linke Hand von A repräsentiert. Beide Varianten schließen einander aus. Wie wirken Negation und Deixis in Beispiel (1) zusammen? Für eine eindeutige Lokalisierung der Entitäten Gewässer und Haus in den jeweiligen kartenähnlichen Repräsentationen ist das Vorliegen von Zeigegesten bzw. einer zeigenden Komponente in der verwendeten Geste eine notwendige Bedingung (Fricke 2014). Und nicht nur das: Zeigegesten können darüber hinaus auch eine notwendige Bedingung für den angemessenen Gebrauch von verbalen Negationsträgern darstellen. Nur unter der Voraussetzung, dass das vom jeweiligen Sprecher intendierte Referenzobjekt erfolgreich identifiziert wurde, kann dessen Aussage überhaupt mittels Negation bestritten werden, wie etwa in Beispiel (1) unter Verwendung des syntaktischen Negationsträgers nein. Die hinweisenden Gesten mit der flachen Hand, die in der vorliegenden Äußerung obligatorisch sind, repräsentieren und lokalisieren zugleich die Entitäten Haus und Gewässer und sind funktional in den vorliegenden Matrixkode des Deutschen integriert (Kodeintegration, Fricke 2012, 2021a). Gleichzeitig illustriert das Beispiel den Fall einer Kodemanifestation (Fricke 2012, 2021a, b): Durch die Verwendung von Negatoren wird der simultane Aufbau zweier unterschiedlicher mentaler Repräsentationen induziert (Kaup et al. 2006). Etwas ist der Fall in der einen Repräsentation und nicht der Fall in der anderen Repräsentation. Beide Repräsentationen widersprechen sich. Diese während des Sprechens aufgebauten mentalen Repräsentationen manifestieren sich in unserem Beispiel multimodal, d. h. sie werden zusätzlich gestisch verkörpert und visualisiert und dadurch intersubjektiv verfügbar gemacht (Fricke 2021a, b). Gesten mit eindeutiger Negationsfunktion wie z. B. das Kopfschütteln, auf die wir uns zunächst im Folgenden konzentrieren werden, sind folglich nur eine 34 Ellen Fricke <?page no="35"?> 4 Die Berücksichtigung deiktischer Referenzherstellung einschließlich der Zeigegesten in Untersuchungen zur multimodalen Negation wird Gegenstand weiterer Untersu‐ chungen zur semiotischen Komplexität im Rahmen des Teilprojekts D01 im DFG-Son‐ derforschungsbereich 1410 „Hybrid Societies“ sein. 5 Auch wenn sich McNeill (1992) mit seinem primär kognitionspsychologischen Fokus in vielen Aspekten stark von Kendons semiotisch-anthropologischem Ansatz unter‐ scheidet, lässt sich sein Konzept eines gemeinsamen Growth Point von Rede und Geste nicht von der vorgängigen These Kendons isolieren. Teilklasse der für den Phänomenbereich der multimodalen Negation relevanten Gesten. 4 Bei den Gesten, die wir in Beispiel (1) betrachtet haben, handelt es sich um redebegleitende Gesten. Sie sind auf dem sog. „Kendonschen Kontinuum der Gebärden“ (McNeill 1992) oder allgemein Gestenkontinuum ganz links an‐ geordnet und bilden den linken Pol mit der geringsten Ausprägung sprachlicher Eigenschaften. Den rechten Pol mit der maximalen Ausprägung sprachlicher Eigenschaften bilden hingegen die Gebärdensprachen der Gehörlosen. Letztere zeigen, dass Handbewegungen allein - auch unabhängig von der Lautsprache - als vollwertige sprachliche Artikulatoren fungieren können. Eine Mittelstellung nehmen die emblematischen Gesten ein, wie z. B. die sog. Victory-Geste oder die Geste für Stopp, die wir in Abschnitt 4.1 noch behandeln werden. Solche Gesten sind durch stabile Form-Inhaltsbeziehungen gekennzeichnet, ähneln also Wörtern und können daher auch in gestischen Lexika aufgeführt werden. Eine zentrale Annahme der Erforschung redebegleitender Gesten - also derjenigen Körperbewegungen, die man beobachten kann, wenn man spricht - ist: Geste und Rede sind Bestandteil desselben Äußerungsprozesses. Oder anders formuliert: Gesten sind wie die Rede sprachlich. Es gibt nur einen einzigen Kode, der sich in zwei unterschiedlichen Sinnesmodalitäten, der visuellen und der auditiven, manifestiert. Diese Annahme geht auf Adam Kendon (1980) zurück und wurde später von David McNeill (1985, 1992) übernommen, und zwar in expliziter Abgrenzung zur allgemeinen und undifferenzierten Zuordnung von Gesten in die Kategorie der nonverbalen Kommunikation. 5 Der in diesem Kontext verwendet Begriff der Multimodalität ist also an den Begriff der Sinnesmodalität gebunden. Demgegenüber geht die neuere bild- und textlinguistische Forschung davon aus, so z. B. Hartmut Stöckl (Stöckl 2004a, b; Klug/ Stöckl 2016; siehe auch Bateman et al. 2017; Bateman 2018; Kress 2014), dass an der Konstituierung von Texten unterschiedliche semiotische Ressourcen, wie sie von Kress und van Leeuwen (2001: 21) genannt werden, beteiligt sind. Der Begriff der Mul‐ timodalität ist also hier an einen kodebezogenen Medienbegriff gebunden. Multimodalität wird verstanden als das Zusammenwirken unterschiedlicher Negation multimodal 35 <?page no="36"?> Kodes - wie etwa der geschriebenen Sprache und des Bildes - die auch derselben Sinnesmodalität angehören können. Dementsprechend wird in Fricke (2012, 2015) zwischen Multimodalität im engeren und weiteren Sinn unterschieden: 1. Multimodalität im engeren Sinn liegt vor, wenn mindestens zwei unter‐ schiedliche Sinnesmodalitäten und Kodierungsmedien (z. B. Geste und Rede) vorhanden sind. 2. Multimodalität im weiteren Sinn liegt vor, wenn zwei (oder mehr) kodebezogene Medien derselben Sinnesmodalität (z. B. Schrift und Bild) angehören. Die Charakterisierung von Multimodalität, die ich meinen weiteren Ausführungen zugrunde lege, nimmt also Bezug auf beide Traditionen der Mul‐ timodalitätsforschung und hebt wie oben bereits erwähnt die Aspekte sowohl einer Kodemanifestation als auch einer strukturellen und/ oder funktionalen Integration in ein und denselben Matrixkode hervor. In dem folgenden Schaubild in Abb. 7 sind verschiedene sprachliche Ebenen in einer Übersicht zusammengefasst, für uns relevant sind insbesondere die ge‐ strichelt umrahmten Bereiche der Multimodalität in Bezug auf Geste-Rede-Re‐ lationen und Schrift-Bild-Relationen. S c h r i f t s p r a c h e (visuell) L a u t s p r a c h e (primär auditiv) Medienbegriff - kodebezogen Medienbegriff - kodebezogen - biologisch Medienbegriff - kodebezogen - biologisch Kodemanifestation/ Kodeintegration - strukturell - funktional MULTIMODALITÄT LAUTSPRACHE Einzelsprachen Sprache allgemein Verbale Ebene (auditiv) Gestische Ebene (visuell) (Simultanität von gestischer und verbaler Ebene) Sprache Gebärdensprache (visuell) Verbale Ebene (visuelle Schrift) Bildliche Ebene (visuell) (Kontiguität von verbaler und bildlicher Ebene) MULTIMODALITÄT SCHRIFTSPRACHE Medienbegriff - kodebezogen - biologisch Kodemanifestation/ Kodeintegration - strukturell - funktional Abb. 7: Sprachliche Medien und sprachliche Multimodalität (erweitertes Schema basie‐ rend auf Fricke 2012: 44) Durch eine multimodale Perspektive und die Einbeziehung von Gesten und Bildern stellen sich Fragen, was unter grundlegenden sprachwissenschaftlichen Kategorien wie der Negation und Verneinung zu verstehen ist, noch einmal neu (Fricke 2015: 73). 36 Ellen Fricke <?page no="37"?> 6 Jacobs (1991: 561) unterscheidet daher auch zwischen Negation und Verneinung: „Negation ist, wie wir sahen, eine Operation über Sprachinhalten. Das Verneinen ist eine Handlung, die man vollziehen kann, indem man Ausdrücke einer Sprache äußert, also eine mögliche sprachliche Handlung.“ Wir werden im Weiteren anders als Jacobs den Begriff der Negation weiterhin als allgemeinen Oberbegriff verwenden, der alle drei Bestimmungen nach Blühdorn umfasst und die Unterscheidung von Verneinung und spezifischen Negationsbestimmungen einschließt. 3 Linguistische Grundlagen der Negation Wenn wir Negation als spezifisch sprachwissenschaftlichen Gegenstand be‐ stimmen wollen, dann finden wir unterschiedliche Ansätze, die sich nach Blüh‐ dorn (2012: 24-30) unter drei wesentliche Begriffsbestimmungen subsumieren lassen: 1. die logisch-semantische Bestimmung als Operation über Wahrheits‐ werte, 2. die pragmalinguistische Bestimmung, die Negation als Handlung versteht und 3. die morphosyntaktische Bestimmung als Verwendung von Negationsausdrücken (z.-B. nicht oder un-). Die Phänomenbereiche dieser Bestimmungen stimmen zwar in weiten Teilen überein, sind aber nicht deckungsgleich. 6 Allen drei Bestimmungen ist jedoch gemeinsam, dass man grundlegend zwei Bereiche unterscheiden muss: einen Bereich, in dem etwas der Fall ist, und einen Bereich, in dem etwas nicht der Fall ist. Die kognitive Linguistik spricht von unterschiedlichen Mental Spaces (Fauconnier 1985, 1997; Sweetser 2006; Fauconnier/ Turner 2002), wobei negierte Sachverhalte immer auch das entsprechende Pendant aktivieren (für einen Überblick siehe Fricke 2021b). Diese Annahme wird unterstützt durch experimentelle Befunde aus der kognitiven Psychologie. Betrachten wir die folgenden Beispiele (Kaup et al. 2006: 1043): (2) Die Tür war nicht offen. (3) Die Tür war geschlossen. Obwohl beide Sätze dieselben Wahrheitsbedingungen aufweisen, werden sie beim Textverstehen dennoch unterschiedlich verarbeitet. Bei der negierten Variante in Beispiel (2) werden sowohl die offene als auch die geschlossene Tür mental repräsentiert, hingegen in Beispiel (3) ohne Negationsträger lediglich die geschlossene Tür (Kaup et al. 2006). Ein Beispiel für Schrift-Bild-Beziehungen in der bildenden Kunst ist Magrittes Ölbild „La trahison des images“ in Abb. 8 (siehe die Analyse zu ontologie- und zeichenbasierten Mental Spaces in Fricke 2021b: 128). Worin besteht nach Magritte der sog. „Verrat“ der Bilder? Die sehr realistisch wiedergegebene Pfeife in diesem Ölbild wird begleitet durch den französischen Schriftzug Ceci nʼest pas une pipe [Dies ist keine Pfeife], der längs am unteren Bildrand positioniert Negation multimodal 37 <?page no="38"?> ist. In welchem Verhältnis stehen nun der Text des Schriftzugs, die Abbildung einer Pfeife und die abgebildete Pfeife als intendiertes Referenzobjekt? Auch wenn die Pfeife sehr realistisch gemalt ist, wird durch die begleitende Äußerung dies ist keine Pfeife verdeutlicht, dass es sich nach Auffassung von Magritte auch bei sehr realistisch gemalten Bildern immer um Zeichen handelt, die als für etwas anderes stehend zu interpretieren sind. Abbildung und abgebildetes Objekt fallen niemals zusammen. Der Verrat der Bilder besteht darin, dass sie lediglich eine Illusion des Realen zu erzeugen vermögen. Magritte lenkt mit dem Schriftzug Ceci nʼest pas une pipe die Aufmerksamkeit des Betrachters auf genau diese Tatsache der genuinen Zeichenhaftigkeit von Bildern allgemein. Dieser Effekt wird durch den Negationsträger ne pas im Schriftzug erzeugt. Es werden kognitiv zwei Bereiche aktiviert: ein Bereich in dem der Satz Ceci nʼest pas une pipe wahr ist und ein Bereich, in dem er falsch ist. Bezogen auf die Abbildung einer Pfeife ist der Satz wahr, lediglich bezogen auf das bezeichnete Objekt wäre er falsch (Fricke 2021b: 128). Abb. 8: Magritte, La trahison des images, 1929. Courtesy of Centre Pompidou, Paris (siehe auch Fricke 2021b: 128) Wenn wir uns erneut dem Spiegeltitel mit Papst Benedict in Abb. 2 zuwenden, dann können wir ebenfalls konstatieren, dass bei der Rezeption - induziert durch die piktoriale Durchstreichung des Negationspräfixes un- - parallel zwei Mental Spaces aufgebaut werden: ein Mental Space (M1), in dem der Papst unfehlbar ist, und ein weiterer Mental Space (M2), in dem er nicht unfehlbar ist. Genau diese Form der doppelten Verneinung mit einem zusätzlichen nicht-verbalen Negationsoperator ist nun aber bei redebegleitenden Gesten nicht zu beobachten und führt zu der Frage nach den spezifischen medialen Effekten von gesprochener und geschriebener Sprache bezüglich der grammatischen Negation und pragmatischen Verneinung 38 Ellen Fricke <?page no="39"?> 7 Zu konkreten Analysen von Negationen als Mental-Space-Konfigurationen in der multimo‐ dalen Interaktion von Angesicht zu Angesicht siehe Fricke (2021b). (Jacobs 1991; siehe Abschnitt 4.2). Eine weitere Frage, der im vorliegenden Artikel allerdings nicht detaillierter nachgegangen wird, ist, ob man es hier nicht mit einer komplexeren Mental-Space-Konfiguration zu tun hat (zu Einbettungsrelationen bei Mental Spaces siehe Fricke (im Druck)). Im vorliegenden Fall wären mit dem Substantiv Unfehlbare über das Negationspräfix unbereits zwei kontrafaktische Mental Spaces aktiviert M1 ((der) Fehlbare) und M2 ((der) Unfehlbare). Über die Durchstreichung als bildlichen (Proto-)Negationsträger käme entweder eine Reak‐ tivierung (und dadurch Intensivierung) von M1 in Frage oder ein zu M1 und M2 hinzukommender dritter Mental Space M3 (der) (nicht) Unfehlbare) wird aktiviert, in welchem der Papst wiederum analog zu M1 die Eigenschaft besäße, fehlbar zu sein. 7 Im Bereich der verbalen Negationsträger wird allgemein zwischen den beiden großen Gruppen der impliziten und expliziten Negationsträger unterschieden. Neben den syntaktischen Negationsträgern wie nicht gibt es im Deutschen auch lexikalische Negationsträger, die an einen Stamm angefügt werden. Der wichtigste dieser Negationsträger ist das Präfix un-, das auch im Beispiel der von uns analysierten Spiegeltitel in Abb. 1 und 2 auftritt. Es wird in der Wortbildung zur Konstruktion von Gegensatzpaaren gebraucht (z. B. absichtlich vs. unab‐ sichtlich, fehlbar vs. unfehlbar). Die Negation kann etwa bei kontradiktorischen Antonymien wie tot vs. lebendig auch implizit bleiben. Man spricht in solchen Fällen von impliziten Negationsträgern (z.-B. Helbig/ Buscha 2001: 558). Abb. 9: Durchstreichung als Zerstörungshandlung, DIE ZEIT 19/ 2011, Illustration: Smetek, Foto: Laif Negation multimodal 39 <?page no="40"?> Abb. 10: Durchstreichung als Zerstörungshandlung, DER SPIEGEL 40/ 2010 Im Falle der Titel mit Osama Bin Laden in der Wochenzeitung Die Zeit und mit Marilyn Monroe auf dem Spiegeltitel wird auf der verbalen Ebene genau diese kontradiktorische Antonymie tot vs. lebendig aktiviert (siehe Abb. 9 und 10). Osama Bin Laden wurde kurz zuvor von den USA gezielt getötet, worauf im Text explizit hingewiesen wird (Osama bin Laden ist tot) und Marilyn Monroe hat mit einem Nagellackpinsel Negative ihrer Fotos unbrauchbar gemacht und damit zerstört. Eines dieser Negative ist auf dem Spiegeltitel abgebildet, in der Bildüberschrift steht Ich wünschte, ich wäre tot. Wir werden in Abschnitt 4.2 analysieren, wie sich die vorliegenden Durchstreichungen in Relation zu sol‐ chen verbalen impliziten Negationsträgern verhalten und in welcher Beziehung sie zu anderen Formen der Durchstreichung stehen. Ein interessantes Beispiel für den syntaktischen Negationsträger nicht ergibt der Vergleich der beiden Titelbilder des wöchentlich erscheinenden Magazins Der Spiegel (Nr. 52, 2018) und von Tichys Einblick (Nr. 2, 2019), das monatlich erscheint (siehe Abb. 11 und 12). Beide Titel erschienen im Kontext der Relotius-Affäre des Spiegel, wobei Tichys Einblick den Spiegeltitel inklusive Farbgestaltung und Typographie partiell zitiert, so dass der Titel als Zitat in der Auslage für jeden potentiellen Käufer kenntlich ist. Die relativ bekannte Aussage Sagen, was ist wird dem Gründer des Spiegel, Rudolf Augstein, zugeschrieben, der in diesem Satz sein journalistisches Programm für den Spiegel verdichtete. In den Zeilen darunter ist eine kurze Information zur Relotiusaffäre positioniert: 40 Ellen Fricke <?page no="41"?> In eigener Sache: Wie einer unserer Reporter seine Geschichten fälschte und warum er damit durchkam. Auf dem Titel von Tichys Einblick wird der Aussage des Spiegel widersprochen, indem der syntaktische Negationsträger nicht eingefügt wird. Damit werden zugleich zwei kontrafaktische Mental Spaces aktiviert (siehe die Beispiele mit Papst Benedikt in Abb. 1 und 2). In den beiden Zeilen darunter in geringer Schriftgröße wird kommentiert Warum der Fall Relotius nicht nur für den SPIEGEL symptomatisch ist. Interessant ist nun für unseren Kontext der multimodalen Schrift-Bild-Beziehungen, dass der Negationsträger nicht nicht einfach typographisch in die Aussage Sagen, was nicht ist eingefügt ist, sondern mit schwarzen Buchstaben auf einer weißen, rechteckigen, leicht schrägstehenden Fläche wirkt, als sei die Äußerung Sagen, was ist überklebt worden, wie dies beispielsweise auf Plakaten im öffentlichen Raum vielfach als Praxis anzutreffen ist. Grafisch wird hier eine Art Überschreibung oder Auslö‐ schung in Verbindung mit dem syntaktischen Negationsträger nicht angedeutet. DER SPIEGEL 52/ 2018 - TICHYS EINBLICK, Nr.-2, 2019 Abb. 11 und 12: Sagen, was, (nicht) ist: Der syntaktische Negationsträger nicht als Negator und zugleich überschreibendes Bildelement als Resultat einer Handlung Nachdem wir zum Einstieg neben ausgewählten Beispielen aus dem Bereiche der Geste-Rede-Relationen für die großen Gruppen der expliziten (sowohl syntaktisch als auch lexikalisch) und impliziten Negationsträger jeweils ein Beispiel des Zusammenwirkens von Schrift und Bild gebracht haben, wenden wir uns im nächsten Abschnitt beiden Bereichen der multimodalen Negation Negation multimodal 41 <?page no="42"?> gesondert zu, und zwar mit dem Schwerpunkt auf den Fragen, ob und inwieweit sich Gesten und bildliche Negationsoperatoren aus Handlungen ableiten lassen und inwieweit eine solche Ableitung ggf. systematisierbar wäre. 4 Multimodale Negation 4.1 Multimodale Negation I: von der Handlung zur Geste Die körperliche Basis von Gesten, die im Kontext von Negationen auftreten, lässt sich in der Regel auf eine einfache Handlung zurückführen (siehe z. B. Bressem/ Müller 2014; Calbris 1990: 201; Fricke et al. 2014; Bressem et al. 2017; Harrison 2009a, b, 2010, 2018; Kendon 2002, 2004). Die Annahme, dass Negation körperlich verankert ist und die Form von Negationsträgern aus körperlichen Handlungen abgeleitet werden kann, findet sich schon in Jakobsons Aufsatz „Motor signs for Yes and No“ (1972) sowie zuvor insbesondere in Jespersens berühmter Abhandlung „Negation in English and other Languages“ (1917): The starting point in all three languages is the old negative ne which I take to be […] a primitive interjection of disgust accompanied by the facial gesture of contracting the muscles of the nose […]. This natural origin will account for the fact that negatives beginning with nasals (n, m) are in many languages outside the Indo-European family. ( Jespersen 1917: 6) Allerdings bezieht sich Jespersen ausschließlich auf verbale Negationsträger. Er führt die Tatsache, dass in vielen Sprachen die Negationsträger mit Nasalen anlauten, auf eine Muskelkontraktion der Nase zurück, die mit primitiven Interjektionen der Ablehnung und des Ekels einhergehen. Die körperliche Basis von Gesten, die im Kontext von Negationen auftreten, lässt sich in der Regel auf eine einfache Handlung zurückführen. Wie aber entstehen Gesten aus Handlungen? In Abb. 13 sehen wir ein Verbotsschild mit einer Handgeste für Stopp und einer konventionalisierten Durchstreichung, die den Verbotsstatus anzeigt. Dass diese spezifische Geste auf einem Verbotsschild erscheint, ist ein starker Indikator für deren Konventionalisierung. 42 Ellen Fricke <?page no="43"?> Abb. 13: Verbotsschild mit Durchstreichung und Stoppgeste Im Folgenden wird der Entstehungsprozess dieser Gesten in wesentlichen Schritten vereinfacht dargestellt. Nehmen wir die folgende Basishandlung: Ein größeres Objekt wird mit den Händen aus dem direkten Umraum des Handelnden entfernt oder am Eindringen gehindert. In Abb. 14 wird eine Kiste durch die Krafteinwirkung der Hände am Runterfallen gehindert. Wir haben es hier mit einer eindeutigen Kausalbeziehung zu tun: Die Krafteinwirkung der Hände verursacht die Entfernung bzw. das Fernbleiben des Objekts. Abb. 14: Weghalten als Basishandlung - Abb. 15: Weghalten als Stopp-Geste Ganz anders verhält es sich mit dem Weghalten als Geste in Abb. 15. Ein Mensch wird mit einer Stopp-Geste aufgefordert, nicht näher zu kommen. Eine verbale Umschreibung als Äquivalent könnte beispielsweise lauten: Keinen Schritt Negation multimodal 43 <?page no="44"?> weiter! In diesem Fall wirkt keine Kausalbeziehung, sondern eine Zeichenbezie‐ hung. Durch die Geste und ihre Bedeutung wird dem Adressaten mitgeteilt, er solle sich fernhalten. Der Adressat versteht die Absicht des Senders und handelt gemäß dieser Absicht, indem er nicht näherkommt. Bei dieser Art von Gesten geht es im Gegensatz zur zugrundeliegenden Handlung nicht um das direkte Erreichen eines Zwecks, sondern der Zweck wird durch die Geste lediglich angezeigt. Sie ist oft eine verkürzte, abgeschwächte Form der Ausgangshand‐ lung. Solche Verkürzungen werden bei Posner (2001) oder Tomasello (2003: 32 f.) durch Prozesse der Ritualisierung erklärt. Betrachtet man den Aspekt der Intentionalität von Ausgangshandlung und Geste, dann sind diese auf unterschiedlichen formalen Abstraktionsstufen angesiedelt. Nach Posner (1993) handelt es sich bei Abb. 14 um eine einfache intendierte Handlung, mit einer eingebetteten Kausalbeziehung, deren Formalisierung in Abb. 16 basierend auf intensionaler Logik (Prädikatenlogik erster Stufe mit zwei Ereignisprädikatoren E(reignis) und T(un) sowie drei Satzoperatoren →, B(elieving) und I(ntending)) folgendermaßen dargestellt und paraphrasiert werden kann (siehe Fricke in Vorb.; Siefkes et al. im Druck): Paraphrase: Person b produces an event f (holding away) and intends the event to cause another event (vgl. Posner 1993: 228). Abb. 16: Weghalten (Abb. 14) als intendierte Handlung (Formalisierung nach Posner 1993) Bei der Stopp-Geste (Abb. 17) hingegen beruht die Reaktion des Adressaten nicht auf einer Krafteinwirkung der Hände, wie es beispielsweise bei einem Wegstoßen oder Weghalten der Fall wäre, sondern das Fernbleiben des Adressaten beruht auf dessen semiotischem Verständnis der Bedeutung des Zeichens und der Absicht des Sprechers, die darauf zielt, dass der Adressat seine Absicht versteht und gemäß dieser Absicht handelt und tatsächlich von ihm fernbleibt. Mit einer intendierten konventionalisierten Stopp-Geste ist somit ein höherer formaler Komplexitätsgrad als mit einer einfachen intendierten Handlung verbunden. 44 Ellen Fricke <?page no="45"?> Paraphrase: A person b produces f, intending the occurrence of f to make a person a do the reaction r of stopping, and b believes that if the occurrence of f will lead to a’s believe that b produced f with the intention for the occurrence of f to make a do r, then the occurrence of f really will make a do r (vgl. Posner 1993: 228 und 235). Verkürzt: The addressee understands that the sender b intends him or her to do r (stopping), and this understanding makes him or her actually do r. Verkürzt sender and actually actually Abb. 17: Weghalten (Abb. 15) als intendierte Geste (Formalisierung nach Posner 1993) Bei dem Weghalten in dem folgenden Beispiel aus der Fernsehsendung „Genial daneben! “ (ToGoG-Korpus) geht es nicht um eine emblematische Stopp-Geste, sondern um eine redebegleitende Geste im Kontext einer lautsprachlichen Negationsäußerung. (4) A (lh): 1 [Langsam (.) langsam […]] 1 […] - A (bh): 2 [daMIt ich jetzt | keinen Fehler mache …] Abb. 18: Weghalten (lh) als redebeglei‐ tende Geste zu langsam - Abb. 19: Weghalten als redebegleitende Geste zum Negationsartikel kein Negation multimodal 45 <?page no="46"?> Die redebegleitende Geste des Weghaltens zeigt uns, wie wir uns so etwas Abstraktes wie grammatische Negation als leiblich verankert vorstellen können. Zunächst werden begleitend zur verbalen Äußerung langsam die Äußerungen der anderen Diskussionsteilnehmer, die durcheinander auf den Sprecher ein‐ reden, mit der linken flachen Hand gleichsam abgewehrt und ferngehalten (Abb. 18). Die einhändige Geste hat hier eher die Funktion einer Stoppgeste wie in Abb. 15, da eine Abwehr von akustischen Signalen mit einer solchen Handbewegung als kausal einwirkende Handlung nicht möglich ist. Der Sprecher fährt fort mit der verbalen Äußerung damit ich jetzt keinen Fehler mache, die den Negationsartikel kein enthält. Begleitend zur verbalen Negation des Substantivs Fehler (keinen Fehler) wird ein imaginäres Objekt aus dem Gestenraum ferngehalten (Abb. 19). Wir haben es wieder mit einer Zeichenbeziehung zu tun, die in diesem Fall metaphorisch ist: Das Negierte (meist abstrakt) wird als ein konkretes Objekt konzeptualisiert, das entfernt werden kann (Bressem/ Müller 2014: 1592-1604). Redebegleitende Gesten sind also ein Fenster zur Kognition, wie McNeill (1992) es formuliert. Sie eröffnen uns einen beobachtbaren visuellen Zugang zu den bildlichen mentalen Reprä‐ sentationen, die der Sprecher während des Sprechens aufbaut. Genau dieser Aspekt macht die Untersuchung von Gesten für die Kognitionspsychologie und die kognitive Linguistik interessant (siehe dazu z. B. Fricke 2021a, 2022). Die Geste des Weghaltens ist Teil einer Gestenfamilie nach Bressem und Müller (2014), deren Einheiten einen gemeinsamen formbezogenen und semantischen Kern teilen. Abb. 20: Wegwischen - Abb. 21: Wegwerfen - Abb. 22: Wegfegen - Abb. 23: Weghalten Abb. 20-23: Die Gestenfamilie der Away Gestures nach Bressem und Müller (2014) 46 Ellen Fricke <?page no="47"?> Alle vier Gestentypen (Wegwischen, Wegwerfen, Wegfegen und Weghalten) teilen eine gemeinsame Handlungsbasis (Abb. 20-23): Objekte werden mit den Händen vom Körper wegbewegt oder weggehalten (Bressem/ Müller 2014). Es handelt sich um sog. rekurrente Gesten (z. B. Ladewig 2011, 2014), die zumindest partiell konventionalisiert sind und bei verschiedenen Sprechern und in verschiedenen Kontexten auftreten können. Wenn wir unsere bisherigen Überlegungen zusammenfassen, kommen wir insgesamt als Ausgangshypothese zu folgendem Schema der multimodalen Negationsabstufung (siehe Abb. 24): Entfernen von konkreten Objekten Nichtsprachlich Handlung: Entf er nung von Objekten Entf er nen von abstrakten Objekten aus Ge stenraum Weghalten + iterative Hin- und Her-Bew egung Be str eiten (der Wahrheit eine s Sachverhalts) Primär redebegleitend Redebegleitend und redeunabhängig (emblematisch) Verbale Negatoren Gestische Negatoren (z.B. Kopfs chütteln) Substitution Abb. 24: Multimodale Negationsabstufungen in der gesprochenen Sprache (Rede und Geste) Die beiden Pole bilden zum einen das Entfernen von konkreten Objekten als Vorstufe der sprachlichen Negation links auf der Folie und zum anderen das Bestreiten der Wahrheit eines Sachverhalts ganz rechts auf der Folie. Hier bei der Negation im engeren Sinn finden wir nicht nur verbale Negationsträger, sondern auch gestische Negationsträger wie das verneinende Kopfschütteln. Als Zwischenstufe können wir zum einen wie in der vorgestellten Gestenfa‐ milie der Away Gestures das redebegleitende Entfernen von vorgestellten Objekten aus dem Gestenraum ansetzen. Eine weitere Zwischenstufe ist das Verschmelzen der flachen Hand, wie etwa bei der Geste des Weghaltens, mit dem Bewegungsaspekt des Kopfschüttelns eines gestischen Negators, nämlich der Hin- und Herbewegung. Eine ebenfalls häufiger zu beobachtende Variante ist der erhobene Zeigefinger, der ähnlich iterativ hin und her bewegt wird. Beide Varianten treten sowohl redebegleitend als auch redeunabhängig auf und Negation multimodal 47 <?page no="48"?> können aufgrund ihres vergleichsweise hohen Konventionalisierungsgrades als emblematische Gesten im Sinne von Kendon (siehe McNeill 1992 zum Kendonschen Kontinuum) klassifiziert werden. 4.2 Multimodale Negation II: von der Handlung zum bildlichen Negationsoperator Auch bildliche Negationsoperatoren wie die Durchstreichung von unim Papst‐ beispiel Der Unfehlbare in Abb. 2 lassen sich auf eine körperliche Ausgangshand‐ lungen zurückführen. Auf dem Titelbild der Wochenzeitung Die Zeit (5.5.2011, Ausgabe 19, siehe Abb. 9) ist keine stilisierte Durchstreichung zu sehen, sondern ein zerkratztes Porträt von Bin Laden, das auf die Zerstörung der Abbildung mittels einer aggressiven körperlichen Handlung zielt. Ein weiteres Beispiel für Durchstreichung als Zerstörung ist ein Spiegeltitelbild (04.10.2010) mit Marilyn Monroe. Die Durchstreichung in Abb. 10 stammt interessanterweise von Monroe selbst, und zwar hat sie das Negativ des abgebildeten Fotos mit Nagellack unbrauchbar gemacht. In Abb. 25 unten, die an zweiter Position von links ebenfalls ein Titelbild mit einem Porträt von Bin Laden zeigt (20.05.2011, Time Magazine, special issue), ist die Durchstreichung mit zwei Strichen im rechten Winkel sehr viel stilisierter. Der Kopf steht pars pro toto für den getöteten Bin Laden, der Tötungsakt selbst ist durch die rote Farbe der Striche und angedeutete Blutstropfen repräsentiert. Es ist mit Osama Bin Laden das vierte Mal in der bisherigen Geschichte des Time Magazine - nach Adolf Hitler (1945), Saddam Hussein (2003) und Abu Musab al Zarqawi (2006) -, dass eine rote Durchstreichung das Gesicht eines Toten überdeckt. Dies ist ein klarer Hinweis darauf, dass die kognitive Aktivierung der Zerstörung als Handlungsbasis der stilisierten x-förmigen Durchstreichung redaktionell intendiert und für das Time Magazine selbst zumindest partiell konventionalisiert ist. Einen noch stärkeren Konventionalisierungsgrad weisen die typischen Ver‐ botsschilder mit Objekt in Abb. 25 auf, bei denen kein expliziter verbaler Negationsträger auftritt. Beide Schilder lassen sich paraphrasieren als „Nicht Rauchen! “ und „Nicht Telefonieren! “ Das durchgestrichene Objekt steht meto‐ nymisch für die untersagte Handlung. Eine weitere Abstraktionsstufe stellen Verbotsschilder ohne Objekt mit einfacher oder doppelter Unterstreichung dar (siehe Abb. 25), die als Verkehrszeichen an beliebigen Orten ein Parkverbot (einfache Durchstreichung) oder ein absolutes Halteverbot (doppelte Unter‐ streichung als Intensivierung des Parkverbots) anzeigen. Auf dem Plakat in Abb. 25 ist das durchstrichene Objekt ein Atomkraftwerk. Anders als bei den Verbotsschildern steht diese Durchstreichung in Relation zu einem Begleittext, 48 Ellen Fricke <?page no="49"?> genauer einer Nominalgruppe mit dem Kernsubstantiv Atomkraftwerk einge‐ leitet durch den Negationsartikel kein. Bei dem Spiegeltitelbild Der Unfehlbare haben wir insofern eine weitere, und zwar metasprachliche Abstraktionsstufe, als dass ein sprachliches Objekt, nämlich der lexikalische Negationsträger undurchgestrichen wird. Ein wichtiger Unterschied zu redebegleitenden Gesten ist, dass genau diese Form der doppelten Verneinung mit einem zusätzlichen nicht-verbalen Negationsoperator bei multimodalen Geste-Rede-Relationen nicht zu beobachten ist. Wie gestalten sich nun bei Schrift-Bild-Relationen die multimodalen Negationsabstufungen? In dem folgenden Schema in Abb. 25 werden die beiden Pole links und rechts zum einen durch das Entfernen bzw. Zerstören von konkreten Objekten (links) und zum anderen durch die Aufhebung der verbalen Negation mittels Durchstreichung des verbalen Negationsoperators gebildet. Entscheidend ist am rechten Pol, dass die Durchstreichung nicht nur über einem verbalen Ausdruck, sondern über einem verbalen Negationsausdruck operiert. Dies ist nur möglich, weil bildliche Durchstreichung und geschriebener Text derselben Sinnesmodalität angehören. Entfernen von konkreten Objekten Nichtsprachlich Handlung: Zerstörung von Abbildung en Durchstr eichen mit Objekt ohne Objekt Durchstr eichen (Objekt) mit verbaler Negation Bildlicher Negationsoperator („doppelte Negation“) Nichtsprachlich Textbegleitend und textunabhängig Verbale Negatoren Bildliche Negatoren (z.B. Durchstr eichen) Funktionale Äquivalenz Metaebene Abb. 25: Mulimodale Negationsabstufungen in der geschriebenen Sprache (Schrift und Bild) Negation multimodal 49 <?page no="50"?> Insofern können wir also einen gewissen Medialitätseffekt beobachten: Durchstreichungen und geschriebene Sprache gehören derselben Sinnesmoda‐ lität an. Nur unter dieser Bedingung sind eine Überschreibung und der Effekt einer doppelten (Proto-)Negation möglich. Visuelle Gesten hingegen können aufgrund ihrer medialen Verschiedenheit zur gesprochenen Sprache ein akus‐ tisches lautliches Signal nicht überlagern oder auslöschen. Sie können jedoch an bestimmten Positionen lautlicher Äußerungen verbale Negationswörter substituieren. So kann wie oben schon erwähnt beispielsweise ein Kopfschütteln ein nein als Satzäquivalent ersetzen. Diese Funktion der Substitution kann wiederum eine Durchstreichung in geschriebenen Texten nicht übernehmen, vermutlich auch aufgrund der konzeptionell geringer ausgeprägten Dialogizität in der geschriebenen Sprache. Von diesen ersten Beobachtungen ausgehend schließt sich die Frage an, in welche Strukturen und Funktionen gestische und bildliche (Proto-)Negatoren in multimodalen Negationsensembles aufgrund ihrer jeweiligen Medialität ein‐ treten können. Dies wäre als nächster Schritt in weiteren Folgeuntersuchungen zu systematisieren. 5 Multimodale Negation: Spracherwerb und Grammatikalisierung Interessant an unseren bisherigen Beobachtungen ist, dass sich in multimodalen Negationsensembles zumindest partiell Parallelen zum Spracherwerb und zu diachronen Grammatikalisierungsprozessen wiederfinden. Das gestische Entfernen eines vorgestellten Objekts wie in unserem Video‐ beispielen in Abb. 18 und 19 oder auch das bildliche Durchstreichen eines Objekts weisen eine Parallele zu frühen Stadien des Negationserwerbs auf, wie sie beispielsweise Dimroth (2010) beschreibt. Es lassen sich, so Dimroth (2010: 44), drei wesentliche Phasen unterscheiden, die aufeinander aufbauen. 1. Die Phase der Zurückweisung von Objekten, Handlungen oder Ereig‐ nissen, die im Äußerungskontext selbst präsent sind. Typisch ist für den Beginn dieser Phase, dass sich das Kind von Objekten abwendet, etwa den Kopf wegdreht, oder das Objekt aktiv entfernt. 2. Die zweite Phase bezieht sich auf das Verschwinden von Objekten oder unerfüllte Erwartungen. Das Kind stellt z. B. fest, dass etwas nicht am gewohnten Platz ist. Im Unterschied zur ersten Phase muss das Kind eine mentale Repräsentation des abwesenden Gegenstands oder Ereignisses aufbauen. Es muss also über so etwas wie Objektpermanenz verfügen. 50 Ellen Fricke <?page no="51"?> 3. In der dritten Phase geht es um das Bestreiten der Wahrheit einer Aussage oder eines Sachverhalts. Diese Phase setzt u. a. deshalb relativ spät ein, weil sie die gleichzeitige Repräsentation von zwei mentalen Modellen erfordert. In einem der Modelle ist der wahre Sachverhalt repräsentiert, im anderen Modell das falsche Gegenstück (siehe oben die Ausführungen zu Kaup 2006 in Abschnitt 3). Die auffälligen Parallelen zur ersten Phase des Zurückweisens führen zu der grundlegenden Frage: Inwieweit sind in gestischen und bildlichen Zeichen frühe Stadien des Negationserwerbs bzw. kognitiv einfachere Proto-Negationen bewahrt? Wir können in Äußerungen von Erwachsenen beobachten, dass si‐ multan zu logisch-semantischen Negationsoperatoren in den redebegleitenden Gesten das Entfernen von Objekten als körperliche Negationsbasis aktiviert wird. Ähnliches gilt für das Durchstreichen, das, wie wir oben gezeigt haben, gleichfalls eine körperliche Negationsbasis aufweist. Wenn wir nicht nur im Spracherwerb, sondern darüber hinaus auch sprach‐ geschichtlich zurückgehen (z. B. van der Auwera 2010), dann lässt sich ein interessanter Kreislauf beobachten, der als Jespersen-Zyklus bekannt ist. Die heutige Partikel nicht beispielsweise hat die althochdeutsche Negationskenn‐ zeichnung ni vollständig abgelöst (Szczepaniak 2009: 44). Etwas Ähnliches lässt sich auch im Französischen beobachten ( Jespersen 1917): Der ursprüngliche Negationsausdruck ne wird abgeschwächt und deshalb durch das zusätzliche Wort pas verstärkt. Dieses Wort wird dann im weiteren Verlauf als das eigent‐ liche Negationswort wahrgenommen, das ne fällt weg und das pas bleibt allein bestehen, bis der Kreislauf, der als Jespersen-Zyklus bekannt ist, von neuem beginnt. Jespersen (1917) charakterisiert in seinem Standardwerk zur Negation diesen Zyklus folgendermaßen: The history of negative expressions in various languages makes us witness the following curious fluctuation: the original negative adverb is first weakened, then found insufficient and therefore strengthened, generally through some additional word, and this in turn may be felt as the negative proper and may then in course of time be subject to the same development. ( Jespersen 1917: 4) Das folgende Schaubild nach Szczepaniak (2009: 44) in Abb. 26 fasst die charak‐ teristischen Phasen der Negationserneuerung für das Deutsche zusammen: Negation multimodal 51 <?page no="52"?> Entstehung eines neuen freien NegWortes ahd. ni (eo) wiht ‚nicht (irgend-)ein Ding‘ > ni(o)wiht > mhd. niht Schwund des klitisierten NegWortes Klitisierung/ Schwächung Freies NegWort Klitisches NegWort Kombination: klitisches + freies NegWort spätahd. ni/ ne mhd. ne … nicht frnhd. (ne) … nicht nhd. nicht ahd. ni Abb. 26: Der Jespersen-Zyklus zur Erneuerung der Negationskennzeichnungen im Deut‐ schen nach Szczepaniak (2009: 44) Szczepaniak (2009: 44) charakterisiert den Jespersen-Zyklus für die einzelnen Sprachstufen folgendermaßen: Die präverbale Negationspartikel ni trat in negierten Sätzen zunächst obligatorisch auf und war im Althochdeutschen der einzige Negationsträger des Satzes. Sie sei reduziert worden und dabei zunehmend mit dem folgenden finiten Verb verschmolzen. Gleichzeitig jedoch habe sich ein neuer Negationsausdruck entwickelt, und zwar aus der Univer‐ bierung von ni und wiht, wörtlich ‚nicht irgendein Ding‘, der ursprünglich zur Verstärkung eingesetzt wurde (Szczepaniak 2009: 44). Wir sind auch heute noch mit vergleichbaren Äußerungen vertraut: Das interes‐ siert mich nicht die Bohne! (Szczepaniak 2009: 44). Im Mittelhochdeutschen gibt es, so Szczepaniak, zunächst noch die Kombination von klitischem ne und dem freien Negationswort niht bis schließlich im Neuhochdeutschen (16./ 17. Jh.) das postver‐ bale nicht zum alleinigen Negationsträger wird (Szczepaniak 2009: 44). Betrachtet man die Grammatikalisierung des freien Wortes Ding zum negationsverstärkenden Funktionswort, dann ergibt sich eine beachtenswerte Parallele zur multimodalen Negation in Geste-Rede-Relationen: Die Geste des Weghaltens eines vorgestellten Objekts könnte analog zur Grammatikalisierung von Ding als negationsverstärk‐ ender Proto-Negator interpretiert werden, der wie z. B. das Kopfschütteln potentiell zunehmend Negationsfunktionen wird übernehmen können. Unabhängig davon, ob sich diese Parallele als Hypothese im Weiteren empirisch bestätigen wird, erlaubt uns die Betrachtung des Jespersen-Zyklus eine erweiterte Perspektive auf die Grammatikalisierung von Gesten, und zwar mit der Frage: Inwieweit können auch gestische Zeichen in den Jespersen-Zyklus eintreten und Negatorfunktionen übernehmen oder verstärken? 52 Ellen Fricke <?page no="53"?> 6 Zusammenfassung der Hypothesen und Forschungsausblick Für das eingangs formulierte Ziel dieses Beitrags, einen klassischen pragmatischen und grammatischen Gegenstandsbereich wie die Negation (unter Einschluss von Verneinung) mit einer umfassenden multimodalen Perspektive zu verbinden, die sowohl auf gesprochene als auch geschriebene Sprache rekurriert, haben sich fünf Leithypothesen herauskristallisiert, die wir explorativ in einen neuen gemeinsamen Zusammenhang gestellt haben. Einzelne Aspekte sind für sich genommen bereits bekannt und bereits vielfach untersucht (z.-B. die Ableitbarkeit von Gesten aus kör‐ perlichen Handlungen, die metaphorische Basis der Negation mit der Entfernung von konkreten Objekten als Quellbereich), jedoch entfalten diese Hypothesen als Grund‐ lage und Ausgangspunkt eines vertiefenden zukünftigen Forschungsprogramms ihre Wirkkraft erst in dieser spezifischen Zusammenstellung, indem erstens exemplarisch beide große Bereiche der Multimodalitätsforschung und die jeweiligen medienspe‐ zifischen Ausprägungen im Bereich der multimodalen Negation beleuchtet wurden und indem zweitens unter Berücksichtigung der Dimensionen des Spracherwerbs und der Sprachgeschichte des Deutschen - ausgehend von konkreten Handlungen - Ansatzpunkte zur Beschreibung von Grammatikalisierungsprozessen von sowohl gestischen als auch bildlichen Zeichen im Kontext multimodaler Negationsensembles herausgearbeitet wurden. Die fünf Leithypothesen sind mit Verweis auf die einzelnen relevanten Abschnitte des Artikels im Folgenden noch einmal zusammengefasst: 1. Embodiment (siehe Abschnitte 4.1 und 4.2): Gestische (Proto-)Negatoren sind aus körperlichen Handlungen des Entfernens oder Weghaltens von Objekten ableitbar. Gleiches gilt für den bildlichen (Proto-)Negator des Durchstreichens. 2. Metaphorische Basis der Negation (siehe Abschnitte 4.1 und 4.1): Es gibt eine gemeinsame konzeptuelle Basis, die medial unterschiedlich ausdifferenziert wird (siehe Abb. 24 und Abb. 25 mit den Schemata der multimodalen Negati‐ onsabstufungen in Geste-Rede- und Schrift-Bild-Relationen). Das Negierte wird als konkretes Objekt konzeptualisiert, das entfernt werden kann. Hinzu kommt eine potentiell metonymische Funktion der durchgestrichenen Objekte (siehe die Durchstreichungen bei Verbotsschildern in Abb. 25), so dass sich komplexere Zeichenprozesse (Semiosen) anschließen können. 3. Negation und Medialität (siehe Abschnitt 4): Die spezifische Ausprägung und Grammatikalisierung multimodaler Negation ist auch medienbzw. modalitätsbedingt und muss daher bei der Untersuchung von sprachlichen Äußerungen berücksichtig werden. Wir haben in Abschnitt 4 Folgendes gezeigt: Nur dadurch, dass Durchstreichungen und geschriebene Sprache Negation multimodal 53 <?page no="54"?> als visuelle Zeichen derselben Sinnesmodalität angehören, ist der Effekt einer doppelten (Proto-)Negation möglich, der in der Durchstreichung eines verbalen Negationsträgers wie z.B. unbesteht. Dieser Effekt ist bei visuellen redebegleitenden Gesten, die lautsprachliche Negatoren nicht überlagern oder auslöschen können, nicht möglich. Wohl aber können sie aufgrund ihrer Zeitlichkeit im Unterschied zu bildlichen Durchstrei‐ chungen verbale Negationsträger in einer lautlichen Äußerung ersetzen (z.-B. Kopfschütteln als Substitut für nein). 4. Spracherwerb (siehe Abschnitt 5): In multimodalen Negationsensembles manifestieren sich in den redebegleitenden Gesten und im bildlichen Durchstreichen auch bei Erwachsenen frühe Stadien des Spracherwerbs (z.-B. das Entfernen und Zurückweisen von Objekten). 5. Jespersen-Zyklus (siehe Abschnitt 5): Multimodale Polynegation kann zur Grammatikalisierung von gestischen Zeichen und bildlichen Zeichen im Hinblick auf eine sprachliche Negationsfunktion führen. Erweitert man die Perspektive in multimodalen Äußerungen über die einzelnen verbalen und bildlichen sowie gestischen (Proto-)Negationsträger hinaus, dann zeigen sich folgende Beobachtungen im Bereich der multimodalen Indexikalität (siehe Fricke/ Mittelberg 2019) sowie Komplexität und situativer Kontextbedin‐ gungen allgemein, die es lohnt weiterführend zu untersuchen: 1. Negation und Deixis: Im Bereich der Gesten sind es nicht nur die gesti‐ schen (Proto-)Negatoren, die zu einem multimodalen Negationsensemble beitragen, sondern darüber hinaus auch Zeigegesten (mit und ohne iko‐ nische Komponente), die auf das vom jeweiligen Sprecher intendierte Referenzobjekt Bezug nehmen. Erst über diese Referenzherstellung, für die in einigen Kontexten das Vorliegen einer Zeigegeste obligatorisch ist, kann die Wahrheit einer Aussage erfolgreich bestritten werden (siehe Beispiel (1) in Abschnitt 2). Zugleich erhöhen verbale und gestische Negatoren u. a. über die Aktivierung zweier einander entgegengesetzter Mental Spaces die Komplexität multimodaler deiktischen Äußerungen. 2. Negation und Metonymie: Vor allem im Bereich der Schrift-Bild-Relationen können metonymische Beziehungen der durchgestrichenen Objekte als zusätzliche Zeichenprozesse relevant werden. In Abb. 27 steht das durchge‐ strichene, aus unserer heutigen Perspektive altertümliche Mobiltelefon, für die Aufforderung, den Empfang des Mobiltelefons auszustellen (angedeutet durch die stilisierten Wellen) oder ein solches nicht mit sich zu führen, damit in dieser Weise dem Verbot des Telefonierens entsprochen werden 54 Ellen Fricke <?page no="55"?> kann. Das Mobiltelefon steht also als Objekt metonymisch für die Handlung des Telefonierens oder des Empfangs von Telefonanrufen. Abb. 27: Verbotsschild für Telefonieren mit einem durchgestrichenen altertümli‐ chen Handy, das als Objekt metonymisch für eine Handlung steht - Abb. 28: Interkulturelle Verschieden‐ heiten: Schwimmverbotsschild in Sydney für ein Becken mit einem Salzwasserkro‐ kodil 3. Negation und (inter-)kultureller Kontext: Es ist zu vermuten, dass sich nicht nur in den spezifischen Negationsträgern selbst, sondern insbesondere in durchgestrichenen Objekten und den damit potentiell verbundenen metonymischen Prozessen aufschlussreiche kulturhistorische und inter‐ kulturelle Differenzen aufzeigen lassen. In Abschnitt 1 sind wir bereits kurz auf Unterschiede in den negierenden Kopfbewegungen eingegangen, die in bestimmten Regionen des europäischen Raums einzelsprachübergreifend sind (Morris et. al. 1979: 154 f.). Betrachtet man nun auch Durchstrei‐ chungen wie in Abb. 27 und 28 unter kulturhistorischem und interkul‐ turellem Aspekt, dann lässt sich konstatieren, dass in Abb. 27 bei dem durchgestrichenen Objekt eine technologisch frühe Stufe des Mobiltelefons in dem Verbotsschild bewahrt ist. Dies ist ein häufig anzutreffendes Muster bei Verkehrsschildern, wenn man etwa an die Schilder für einen Bahnübergang denkt, die noch eine altertümliche Lokomotive zeigen. Das der Zeichnung in Abb. 28 zugrundeliegende Foto wurde von mir 2017 in einem Reptilienpark in der Nähe von Sydney aufgenommen. Das Schild stand unmittelbar neben einem Becken mit Salzwasserkroko‐ dilen, die eine Besonderheit Australiens sind und für Menschen sehr schnell lebensgefährlich werden können. Unter der durchgestrichenen Handlungsabbildung des Schwimmens ist der Kopf eines Salzwasserkro‐ kodils abgebildet, das den Grund des Verbots explizit macht. Bedingt durch Negation multimodal 55 <?page no="56"?> 8 Fricke, Ellen: Wie entstehen Gesten? Und was kann das in Bezug auf die Interaktion mit fahrerlosen Autos in der Zukunft bedeuten? Mercedes-Benz Future Talk „Robotics“. Berlin, 30. Juni bis 2. Juli 2014. Online unter www.youtube.com/ watch? v=rUQmeQ0cg Qs&; t=134s (13.03.2019). unterschiedlich ausdifferenzierte Lebenswelten unterscheiden sich die in Schildern durchgestrichenen Objekte in unterschiedlichen Regionen und Kulturen. Für weiterführende vergleichende Untersuchungen stellen sie aus diesem Grund einen überaus interessanten Untersuchungsgegenstand dar. 4. Negation und technologischer Kontext: Viele Bereiche des Lebens werden zukünftig stärker von Robotern und anderen Maschinen wie etwa fahrer‐ losen Autos bestimmt, die eigenständig handeln (siehe Abb. 29 und 30). Beispielweise geht es für Verkehrs- und Mobilitätskonzepte der Zukunft nicht nur um die Frage, wie ein fahrerloses Auto unfallfrei von einem Ort A zu einem anderen Ort B kommt, sondern auch um die Frage, mit welchen Zeichen Menschen mit fahrerlosen Autos im öffentlichen Raum zukünftig kommunizieren können und wollen (Fricke 2019: 78-82). Abb. 29: Stoppgeste zur Steuerung eines KUKA-Roboterarms (Foto: To‐ bias Naumann, TU Chemnitz) - Abb. 30: Mercedes-Benz-Studie zur gestischen Interaktion von Fußgängern mit selbstfahr‐ enden Autos (Fricke 2019: 80) (© Mercedes- Benz, Mercedes-Benz Advanced UXDesign, Mercedes-Benz Future Talk 2014) Die (Proto-)Negation als grundlegendes Mittel aller natürlichen Sprachen (siehe Löbner 2003 in Abschnitt 1) wird in diesem Bereich eine nicht zu unterschät‐ zende Rolle spielen. Denn auf welche Akzeptanz solche autonomen Roboter bei ihren unmittelbaren Nutzern, aber auch bei anderen Verkehrsteilnehmern wie Radfahrern und Fußgängern stoßen, wird ebenfalls entscheidend sein. In Abb. 30 ist ein Ausschnitt einer Mercedes-Benz-Studie zur Roboter-Fußgänger-Kom‐ munikation zu sehen. 8 56 Ellen Fricke <?page no="57"?> 9 Diesen Hinweis verdanke ich meinem Chemnitzer Kollegen Josef Krems, der in seinem verkehrspsychologischen Vortrag auf der CIVEMSA 2023 ein Beispiel für diese Form der Interaktion vorgestellt hat. Wenn man Gesten zum Ausgangspunkt für die weitere Forschung und Entwicklung nimmt, dann ist es sinnvoll bei Gesten des menschlichen Alltags‐ gebrauchs anzusetzen, um zu umsetzbaren Lösungen zu kommen. Konventio‐ nalisierte Gesten wie die von uns betrachtete Stoppgeste haben den Vorteil, dass sie bereits etabliert sind und daher mit kleinen Modifikationen für die Kommu‐ nikation mit fahrerlosen Autos und anderen Verkehrsteilnehmern eingesetzt werden können. Neuere technologische Entwicklungen setzen zusätzlich bei der Projektion von Bild und Schrift auf den Windschutzscheiben der fahrerlosen Autos an (Ackermann et al. 2019), die sich für eine Interaktion mit menschli‐ chen Verkehrsteilnehmern nicht nur bei konventionalisierten Verkehrszeichen, sondern insbesondere auch des reichhaltigen und bereits etablierten Zeichen‐ repertoires Sozialer Medien (z. B. Emojis) bedient. 9 Damit würden Fußgänger auf der visuellen Ebene mittels Gesten und Autos mittels Licht, Emojis und andere visuellen Zeichen kommunizieren. Für eine multimodale Pragmatik, die sich ergänzenden semiotischen Analysen nicht verschließt, entsteht derzeit im öffentlichen Raum ein neues und interessantes Forschungsfeld, das im Sonderforschungsbereich 1410 „Hybrid Societies“ an der TU Chemnitz inter‐ disziplinär in unterschiedlichen Settings untersucht wird. Mit den oben ange‐ führten explorativ entwickelten Hypothesen und den weiter aufgefächerten Perspektiven ergibt sich der Umriss eines Forschungsprogramms, das eine allgemeine und vergleichende Multimodalitätsforschung (siehe Fricke 2021a) von typologischen über einzelsprachlichen bis hin zu allgemein semiotischen und kulturwissenschaftlichen Fragestellungen interdisziplinär begründen kann. Literatur Ackermann, Claudia/ Beggiato, Matthias/ Schubert, Sarah/ Krems, Josef F. (2019). An ex‐ perimental study to investigate design and assessment criteria: what is important for communication between pedestrians and automated vehicles? Applied Ergonomics 75, 272-282.- Bateman, John A./ Wildfeuer, Janina/ Hiippala, Tuomo (Hrsg.) (2017). Multimodality. Foundations, Research, and Analysis. A Problem-Oriented Introduction. Berlin/ Boston: De Gruyter. Bateman, John A. (2018). Peircean semiotics and multimodality: Towards a new synthesis. Multimodal Communication 7 (1), 36-74. Negation multimodal 57 <?page no="58"?> Blühdorn, Hardarik (2012). Negation im Deutschen. Syntax, Informationsstruktur, Se‐ mantik. Tübingen: Narr. Bressem, Jana/ Müller, Cornelia (2014). The family of AWAY gestures: Negation, refusal, and negative assessment. In: Müller, Cornelia et al. (Hrsg.). Body - Language - Communication. An International Handbook on Multimodality in Human Interaction (HSK 38.2). Berlin/ Boston: De Gruyter, 1592-1604. Bressem, Jana/ Stein, Nicole/ Wegener, Claudia (2017). Multimodal language use in Savo‐ savo: Refusing, excluding and negating with speech and gesture. Pragmatics 27 (2), 173-206. Calbris, Geneviève (1990). The Semiotics of French Gestures. Bloomington: Indiana University Press. Calbris, Geneviève (2011). Elements of Meaning in Gesture. Amsterdam: John Benjamins. Dahl, Östen (2010). Typology of negation. In: Horn, Laurence R. (Hrsg.). The Expression of Negation. Berlin/ New York: De Gruyter, 9-38. Deppermann, Arnulf/ Blühdorn, Hardarik (2013). Negation als Verfahren des Adres‐ satenzuschnitts: Verstehenssteuerung durch Interpretationsrestriktionen. Deutsche Sprache 13 (1), 6-30. Dimroth, Christine (2010). The acquisition of negation. In: Horn, Laurence R. (Hrsg.). The Expression of Negation. Berlin/ New York: De Gruyter Mouton, 39-71. Fauconnier, Gilles (1985). Mental Spaces: Aspects of Meaning Construction in Natural Language. Cambridge/ London: Bradford. Fauconnier, Gilles (1997). Mappings in Thought and Language. Cambridge: Cambridge University Press. Fauconnier, Gilles/ Turner, Mark (2002). The Way We Think. Conceptual Blending and the Mind’s Hidden Complexities. New York: Basic Books. Fricke, Ellen (2007). Origo, Geste und Raum: Lokaldeixis im Deutschen. Berlin/ New York: De Gruyter. Fricke, Ellen (2012). Grammatik multimodal: Wie Wörter und Gesten zusammenwirken. Berlin/ New York: De Gruyter. Fricke, Ellen (2014). Deixis, gesture, and embodiment from a linguistic point of view. In: Müller, Cornelia et al. (Hrsg.). Body - Language - Communication. An International Handbook on Multimodality in Human Interaction (= Handbooks of Linguistics and Communication Science 38.2). Berlin/ Boston: De Gruyter, 1803-1823. Fricke, Ellen (2015). Grammatik und Multimodalität. In: Dürscheid, Christa/ Schneider, Jan Georg (Hrsg.). Handbuch Satz, Äußerung, Schema. Berlin/ Boston: De Gruyter, 48-76. Fricke, Ellen (2019). Von der Kugel zu Google Earth: Wie handhabe ich einen virtuellen Globus? In: Fricke, Ellen/ Bressem, Jana (Hrsg.). Gesten - gestern, heute, übermorgen. Chemnitz: Universitätsverlag Chemnitz, 78-85. 58 Ellen Fricke <?page no="59"?> Fricke, Ellen (2021a). Multimodality and semiotic complexity from a linguistic point of view: Processes of code integration and code manifestation. OBST 99 (= Osnabrücker Beiträge zur Sprachtheorie 99, Special Issue Linguistik und Multimodalität / Linguis‐ tics and Multimodality), 57-86. Fricke, Ellen (2021b). Mental Spaces, Blending und komplexe Semioseprozesse in der multimodalen Interaktion: zeichenbasierte und ontologiebasierte Mental Spaces. Zeitschrift für Semiotik 43 (1-2), 113-144. Fricke, Ellen (2022). The pragmatics of gesture and space. In: Jucker, Andreas H./ Hau‐ sendorf, Heiko (Hrsg.). Pragmatics of Space. Handbook of Pragmatics, Vol. 14. Berlin/ Boston: De Gruyter, 363-397. Fricke, Ellen (im Druck). Berliner Palimpsesträume als Blended Mental Spaces: Der Selenskyj-Platz 1 „Unter den Linden“ als Fallbeispiel einer prospektiven Umbenen‐ nung. In: Nebelin, Marian/ Sanchez-Stockhammer, Christina/ Sandten, Cecile (Hrsg.). Palimpsest und Raum. Über ein neues Konzept der Kulturwissenschaften. Bielefeld: Transcript. Fricke, Ellen (in Vorb.). Anthropomorphism and intentional complexity in hybrid inter‐ action scenarios (working title). Zeitschrift für Semiotik 47 (1-2), 2025. Fricke, Ellen/ Mittelberg, Irene (2019). Gesten. In: Liedtke, Frank/ Tuchen, Astrid (Hrsg.). Handbuch Pragmatik. Stuttgart: Metzler, 312-324. Fricke, Ellen/ Bressem, Jana/ Müller, Cornelia (2014). Gesture families and gestural fields. In: Müller, Cornelia et al. (Hrsg.). Body - Language - Communication. An Internati‐ onal Handbook on Multimodality in Human Interaction (HSK 38.2). Berlin/ Boston: De Gruyter, 1630-1640. Harrison, Simon (2009a). The expression of negation through grammar and gesture. In: Zlatev, Jordan et al. (Hrsg.). Studies in Language and Cognition. Cambridge: Cambridge Scholars Press. Harrison, Simon (2009b). Grammar and gesture: The case of negation in English. PhD thesis, University of Bordeaux III, September 2009. Unpublished manuscript. Harrison, Simon (2010). Evidence for node and scope of negation in coverbal gesture. Gesture 10 (1), 29-51. Harrison, Simon (2018). The Impulse to Gesture: Where Language, Minds, and Bodies Intersect. Cambridge: Cambridge University Press. Helbig, Gerharrd/ Buscha, Joachim (2001). Deutsche Grammatik. Ein Handbuch für den Ausländerunterricht. Berlin/ München: Langenscheidt. Hjelmslev, Louis (1969 [=-1943]). Prolegomena to a Theory of Language. Madison: University of Wisconsin Press. Negation multimodal 59 <?page no="60"?> Jacobs, Joachim (1991). Negation. In: von Stechow, Arnim/ Wunderlich, Dieter (Hrsg.). Semantics / Semantik. An International Handbook of Contemporary Research / Ein internationales Handbuch zeitgenössischer Forschung. Berlin/ New York: De Gruyter, 560-596. Jakobson, Roman (1972). Motor signs for ‘Yes’ and ‘No’. Language and Society 1, 91-96. Jespersen, Otto (1917). Negation in English and other languages. Wiederabgedruckt in Selected Writings of Otto Jespersen (1962). London: Allen and Unwin. Kaup, Barbara/ Lüdke, Jana/ Zwaan, Rolf A. (2006). Processing negated sentences with contradictory predicates: Is a door that is not open mentally closed? Journal of Pragmatics 38, 1033-1050. Kendon, Adam (1980). Gesticulation and speech: Two aspects of the process of utterance. In: Key, Mary E. (Hrsg.). The Relationship of Verbal and Nonverbal Communication. Den Haag: Mouton, 207-227. Kendon, Adam (2002). Some uses of the head shake. Gesture 2, 147-183. Kendon, Adam (2004). Gesture: Visible Action as Utterance. Cambridge: Cambridge University Press. Klug, Nina-Maria/ Stöckl, Hartmut (Hrsg.) (2016). Handbuch Sprache im multimodalen Kontext. Berlin/ Boston: De Gruyter. Kress, Gunter/ van Leeuwen, Theo (2001). Multimodal Discourse: The Modes and Media of Contemporary Communication. London: Edward Arnold. Kress, Gunter (2014). What is mode? In: Jewitt, Carey (Hrsg.). The Routledge Handbook of Multimodal Analysis. London: Routledge, 60-75. Ladewig, Silva H. (2011). Beschreiben, suchen und auffordern - Varianten einer rekur‐ renten Geste. Sprache und Literatur 42 (1), 89-111. Ladewig, Silva H. (2014). Recurrent gestures. In: Müller, Cornelia et al. (Hrsg.). Body - Language - Communication. An International Handbook on Multimodality in Human Interaction (HSK 38.2). Berlin/ Boston: De Gruyter, 1558-1574. Löbner, Sebastian (2003). Semantik. Eine Einführung. Berlin/ New York: De Gruyter. McNeill, David (1985). So you think gestures are nonverbal? Psychological Review 92 (3), 350-371. McNeill, David (1992). Hand and Mind: What Gestures Reveal about Thought. Chicago: Chicago University Press. Morris, Desmond/ Collett, Peter/ Marsh, Peter/ O’Shaughnessy, Marie (1979). Gestures. Their Origins and Distributions. London: Jonathan Cape. Pike, Kenneth L. (1967). Language in Relation to a Unified Theory of the Structure of Human Behavior. Den Haag: Mouton. 60 Ellen Fricke <?page no="61"?> Posner, Roland (1993). Believing, causing, intending. The basis for a hierarchy of sign concepts in the reconstruction of communication. In: Jorna, René J./ van Heusden, Barend/ Posner, Roland (Hrsg.). Signs, Search and Communication. Semiotic Aspects of Artificial Intelligence. Berlin/ New York: De Gruyter, 215-270. Posner, Roland (2001). Alltagsgesten als Ergebnis von Ritualisierung. Forschungsberichte des Instituts für Phonetik und Sprachliche Kommunikation der Universität München (FIPKM) 37, 5-27. Oversteegen, Eleonore/ Schilperoord, Joost (2014). Can Pictures say no or not? Negation and denial in the visual mode. Journal of Pragmatics 67, 89-106. Siefkes, Martin/ Fricke, Ellen/ Bressem, Jana/ Charoensit, Akira (im Druck). Modelling intentional complexity in hybrid interaction scenarios beyond explicit and implicit communication. In: Meyer, Bertolt/ Thomas, Ulrike/ Kanoun, Olfa (Hrsg.). Hybrid Societies - Humans Interacting with Embodied Technologies, Vol. 1. Berlin: Springer. Stöckl, Hartmut (2004a). In between modes: Language and image in printed media. In: Ventola, Eija et al. (Hrsg.). Perspectives on Multimodality. Amsterdam: Benjamins, 9-30. Stöckl, Hartmut (2004b). Die Sprache im Bild - Das Bild in der Sprache. Zur Verknüpfung von Sprache und Bild im massenmedialen Text - Konzepte, Theorien, Analyseme‐ thoden. Berlin/ New York: De Gruyter. Sweetser, Eve (2006). Negative spaces: levels of negation and kinds of spaces. In: Bonnefille, Stéphanie/ Salbayre, Sébastien (Hrsg.). La négation: formes, figures, con‐ ceptualisation. Tours: Presse Universitaires François Rabelais, 313-332. Szczepaniak, Renata (2009). Grammatikalisierung im Deutschen. Eine Einführung. Tü‐ bingen: Narr. Tomasello, Michael (2003). Constructing a Language. A Usage-Based Theory of Language Acquisition. Cambridge: Harvard University Press. Van der Auwera, Johann (2010). On the diachrony of negation. In: Horn, Laurence B. (Hrsg.). The Expression of Negation. Berlin/ New York: De Gruyter, 73-109. Abbildungsverzeichnis Ein besonderer Dank geht an meine Mitarbeiterin Magdalena Müller für ihre Unterstützung bei der Formatierung und der Erstellung der Grafiken. Bildnachweise: René Magritte. La trahison des images. 21 sept. 2016 - 23. janv. 2017 au Centre Pompidou à Paris, France. Online-Publikation 24.11.2017: https: / / wsimag.com/ fr/ art/ 21963-rene -magritte-la-trahison-des-images (Letzter Zugriff 29. Mai 2021, siehe Abb. 8). Negation multimodal 61 <?page no="62"?> Zeichnungen: Mathias Roloff (Abb. 3-6 und 13-19, 24-25, 27-2, unbegrenzte Nutzungs‐ rechte Ellen Fricke, Technische Universität Chemnitz), (Abb. 20-23, Nutzungsrechte Cornelia Müller, Europa-Universität Viadrina Frankfurt (Oder)). Mit Dank an Cornelia Müller für die Erlaubnis, die Zeichnungen für Abb. 20-23 im vorliegenden Beitrag verwenden zu dürfen. Grafik in Abb. 26 (neu erstellt von M. Müller): Mit Dank an Renata Szczepaniak und den Narr-Verlag. Foto in Abb. 29: Tobias Naumann, unbegrenzte Nutzungsrechte Ellen Fricke, Technische Universität Chemnitz. Abb. 30: © Mercedes-Benz, Mercedes-Benz Advanced UXDesign, Mercedes-Benz Future Talk 2014. Mit Dank an Mercedes-Benz, diese Abbildung in meinen Veröffentlich‐ ungen nutzen zu dürfen. Anhang In den angeführten Beispielen verwendete Notationskonventionen (siehe McNeill 1992; Fricke 2007, 2012) 1. Lautsprachliche Ebene: Pausen unterschiedlicher Länge: (.), (..), (3sec) Intonation: ansteigend / , fallend \, schwebend - Großbuchstaben kennzeichnen auffällige Betonungen: [nein HIER …] 2. Gestische Ebene: Eckige Klammern kennzeichnen Anfangs- und Endpunkt einer Gesteneinheit (gesture unit). Sie werden in Relation zur lautsprachlichen Äußerung eingefügt. Treten in einer Beispielsequenz mehrere Gesten auf, können diese durch Indizes voneinander unterschieden werden: [links] 1 [und rechts] 2 [riesen Hochhäuser] 3 Bei gestischen Überlappungen der Kommunikationspartner werden die An‐ fangspunkte der jeweiligen Gesteneinheiten durch hochgestellte, die Endpunkte durch tiefgestellte Indizes markiert: 1 [… 2 […] 1 …] 2 Gestische Einbettung: 1 [… 2 […] 2 …] 1 Fettdruck markiert den Höhepunkt einer Geste (gestural stroke): [links] 1 [und rechts] 2 [riesen Hochhäuser] 3 Unterstreichungen zeigen eine Haltephase nach dem Stroke (post-stroke hold) oder vor dem Stroke (pre-stroke hold) an: [links] 1 [und rechts] 2 [riesen Hochhäuser] 3 Händigkeit: linke Hand (lh), rechte Hand (rh), beide Hände (bh) 62 Ellen Fricke <?page no="63"?> Multimodale Intensivierung im Deutschen Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans Abstract: This paper presents an exploratory study of the multimodal facets of intensification in German, focusing on head gestures and gaze behavior cooccurring with a selection of 17 verbal intensifiers in semi-spontaneous interactions. We show that elements such as gar and überhaupt, which mainly intensify negations (gar/ überhaupt nicht = not at all), have to be dealt with separately because their multimodal behavior is influenced more by the ne‐ gation than by the intensification. For the other intensifiers, two interrelated factors are taken into account, viz. intensity level and expressivity. While these factors do not influence the amount of gestures used, the intensity level seems to influence the types of gestures and the gaze behavior. Finally, looking at the case of einfach ‘simply, just’, we address the issue of affinity between intensifiers and modal particles, showing that this affinity is also reflected in similarities in gesture and gaze behavior. Keywords: intensification, particles, gesture, gaze, German 1 Einführung: Intensivierung Intensivierung ist ein Konzept, das in der einschlägigen Literatur unterschied‐ lich benannt und abgegrenzt wird (Mendez-Naya 2003: 373). Zu den geläufigen Bezeichnungen gehören, neben ‚Intensivierung‘, u. a. ‚Graduierung‘, ‚Verstär‐ kung‘ und ‚Steigerung‘. Im Anschluss an u. a. van Os (1989) gehen wir von einem weiten Intensivierungsbegriff aus, der nicht nur das Phänomen der Verstärkung im vollen Sinne umfasst, sondern allgemein als Ausdruck des Ausprägungsgrades einer bestimmten Eigenschaft zu verstehen ist und damit „alle Erscheinungsformen der Ausdrucksverstärkung und -abschwächung“ (van Os 1989: 1) mit einschließt. Wenn wir zum Beispiel sagen wollen, wie interessant ein wissenschaftlicher Aufsatz ist, dann können wir ihn einfach als interessant qualifizieren, aber auch als ziemlich interessant, sehr interessant oder gar äußerst <?page no="64"?> 1 Die approximative Ebene bleibt außer Betracht, weil sie keine so klare Amplifikation der Intensität markiert wie die absolute, die höchste und die hohe Stufe. Dass van Os (1989) und Klein (1998) sie trotzdem direkt unter der absoluten Ebene situieren, hat wohl mit der Ursprungssemantik dieser Intensivierer zu tun (‚nahezu‘ im Sinne von ‚gerade nicht ganz/ völlig‘). interessant - oder ganz im Gegenteil als kaum interessant oder überhaupt nicht interessant. All diese und ähnliche Ausdrücke des Interessantheitsgrads, von äußerst bis überhaupt nicht, betrachten wir also als Intensivierungen. Intensivierung ist demnach ein breites Feld, das verschiedene Intensitäts‐ grade umfasst. Genauso wie bei der Bezeichnung und Abgrenzung des Phäno‐ mens besteht allerdings bislang kein Einverständnis darüber, wie viele und welche Intensivierungsbzw. Intensitätsstufen auszumachen sind. Eine in der Germanistik geläufige Einteilung ist jene nach van Os (1989), der von acht Intensivierungsstufen ausgeht. Eine Variante dieser Einteilung findet sich bei Klein (1998), der ebenfalls acht Stufen unterscheidet, diese jedoch teilweise anders bezeichnet. Tabelle 1 bietet eine Übersicht der beiden Einteilungen. van Os (1989) Klein (1998) Beispiele absolut absolut total, komplett approximativ approximativ fast, nahezu höchst extrem hoch äußerst, brutal hoch hoch sehr, arg gemäßigt gemäßigt ziemlich, relativ schwach minimal etwas, eher minimal quasinegativ kaum, wenig negativ negativ nicht, keineswegs Tab. 1: Intensivierungsstufen nach Charles van Os und Henny Klein Wir fokussieren im Folgenden den oberen Bereich der Tabelle, genauer gesagt die absolute, die höchste (bzw. extrem hohe) und die hohe Intensivierungsstufe. 1 Die Grenzen zwischen den Stufen sind allerdings nicht als hermetisch zu betrachten. Einerseits können Intensivierer im Laufe der Zeit an Intensität verlieren und damit auf eine niedrigere Stufe wechseln (siehe Claudi 2006; Rinas 2011). Andererseits, und das ist eine Folge davon, können manche Intensivierer - je nach Kontext, Intensifikat und Betonung - auf unterschiedlichen Intensi‐ 64 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="65"?> 2 Für die folgende Analyse wurden diese Belege entsprechend differenziert annotiert und die Belege der gemäßigten Stufe wurden nicht in die Analyse einbezogen. vierungsstufen agieren. Ein prominentes Beispiel dafür ist ganz, das (bis auf die approximative Stufe) das ganze Spektrum von der absoluten bis zur gemäßigten Stufe abdecken kann (Pusch 1981; van Os 1989: 136-162). 2 Besonders von dieser Entwicklung betroffen sind die sogenannten expres‐ siven Intensivierer (i.S.v. Foolen 2015; Gutzmann 2019). Gemeint sind Intensi‐ vierer, die zusätzlich zu ihrer Steigerungsfunktion auch eine emotional-subjek‐ tive Bedeutungskomponente enthalten. Wenn wir einen Aufsatz als wahnsinnig interessant bezeichnen, dann bringen wir nicht nur zum Ausdruck, dass er ‚mehr als nur sehr interessant‘ ist, sondern wir zeigen uns auch involviert, indem wir eine (in diesem Fall, trotz der eigentlich negativen Semantik von wahnsinnig, positive) Einstellung zur Interessantheit des Aufsatzes zum Ausdruck bringen. Expressivität hängt insofern mit Intensität zusammen, als expressive Intensi‐ vierer immer im oberen Bereich der Skala (auf der absoluten oder der höchsten Stufe) anzusiedeln sind, wobei umgekehrt nicht jeder Intensivierer auf diesen Stufen tatsächlich auch expressiv ist (äußerst und komplett können zum Beispiel nur bedingt als expressiv betrachtet werden). Wichtig ist aber, dass expressive Intensivierer im Laufe der Zeit oft an Expressivität verlieren, was vielfach auch mit einem Verlust an Intensität bzw. einem Wechsel auf eine niedrigere Intensivierungsstufe einhergeht. Das sehen wir zum Beispiel aktuell bei voll. Dieser Intensivierer gehört laut van Os (1989) der absoluten Stufe an und wird von Gutzmann (2019) noch als expressiv betrachtet, was in Fällen wie voll cool und voll krass auch stimmen mag. Allerdings sind mittlerweile auch Prädikate wie voll okay geläufig, und in dem Fall ist voll (ähnlich wie ganz in ganz okay) wohl eher auf der gemäßigten Stufe zu situieren und nur mehr bedingt als expressiv zu betrachten (typische expressive Intensiverer wie wahnsinnig oder Multimodale Intensivierung im Deutschen 65 <?page no="66"?> 3 Schmidt (2022) hinterfragt die Annahme, dass expressive Intensivierer im Laufe der Zeit an Expressivität verlieren. Tatsächlich gibt es Intensivierer wie wahnsinnig und schrecklich, die über längere Zeit ihren expressiven Charakter behalten. Problematisch an Schmidts Analyse ist allerdings, dass sie Expressivität mit Frequenz verknüpft. Ein Expressivitätsverlust führt jedoch, entgegen Schmidts Annahme, nicht unbedingt eine Abnahme der Tokenfrequenz herbei, wie gerade das Beispiel voll zeigt: Voll verliert an Expressivität (und an Intensität), aber ein klarer Rückgang in der Frequenz von voll lässt sich (vorerst) nicht erkennen. Ähnlich weist Schmidt (2022: 85) selber darauf hin, dass die Frequenz von sehr zunimmt, scheint dabei aber zu übersehen, dass sehr ursprünglich auch ein expressiver Intensivierer war (Blank 1997: 185; Claudi 2006: 365; Stratton 2020: 191), bei dem also die Expressivität, nicht jedoch die Frequenz abgenommen hat. Zum problematischen Verhältnis von Expressivität und Frequenz: siehe auch ten Buuren et al. (2018). In einem anonymen Gutachten wird die Frage aufgeworfen, inwiefern es eine Rolle spielt, dass es sich bei Kombinationen wie voll okay, anders als bei wahnsinnig okay oder unheimlich okay, mittlerweile um usuelle Verbindungen von Intensivierer und Adjektiv handelt. Dieser Unterschied in Usualität hat allerdings wohl zumindest zum Teil auch mit der Tatsache zu tun, dass gemäßigte Prädikate wie lauwarm, gemäßigt oder eben okay zwar mit Intensivierern unterschiedlicher Intensität vorkommen können (äußerst gemäßigt, sehr gemäßigt), aber tatsächlich kaum mit expressiven Intensivierern ( ? wahnsinnig gemäßigt, ? brutal gemäßigt). unheimlich lassen sich kaum mit einem Prädikat kombinieren, das wie okay keine herausragende Eigenschaft markiert). 3 2 Multimodale Intensivierung im Deutschen: Ziele und Methodisches In unserer Besprechung von Intensivierung haben wir bislang nur Beispiele aus dem verbalen Bereich gegeben: Steigerungspartikeln (auch Intensitätspartikeln genannt) wie ganz und sehr sowie Adjektive und Adverbien, die eine steige‐ rungspartikelähnliche Verwendung haben, wie schrecklich und wahnsinnig. Das ist allerdings nur eine von vielen Möglichkeiten der Intensivierung im Deutschen. Auf der verbalen Ebene sind zum Beispiel noch Präfixoide (etwa sau in saucool oder blitz in blitzschnell und blitzsauber) und die elativische Verwendung des Superlativs zu nennen (siehe Breindl 2007 für eine Übersicht), und auch Modalpartikeln können teilweise intensivierend gebraucht werden (ausführlicher dazu Abschnitt 5). Intensivierung ist aber kein rein verbales Phänomen. Auf der paraverbalen Ebene ist auf die Rolle der Prosodie hinzuweisen (z. B. Cosentino 2017), und dass auch nonverbale Größen wie Gestik und Körperhaltung für Intensivierung eine Rolle spielen können, haben u. a. Graf (2016) und Schoonjans (2018) bereits angedeutet. Die Interaktion der drei Ebenen (verbal, para- und nonverbal) wurde bislang allerdings nur ansatzweise untersucht (u. a. Féry 2012; Fricke 2012; 66 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="67"?> Schoonjans 2018; van Os 1989). Wie die drei Ebenen zusammenwirken und welche Formen gemeinsam vorkommen können, ist also noch weitestgehend ungeklärt, genauso wie die Frage, inwiefern auch weitere, bislang in diesem Kontext noch nicht erforschte nonverbale Ausdrucksebenen wie Blickverhalten für Intensivierung relevant sind. Mit dem vorliegenden Beitrag wollen wir diesen Bereich sondieren und ver‐ suchen, einen ersten Ansatz zur Schließung dieser Forschungslücke zu bieten. Dazu analysieren wir die Intensivierung in zwei Eyetracking-Korpora, dem Frei‐ burg-Leuven-Korpus und dem MIDIbk-Korpus. Es handelt sich um eine Reihe von semi-spontanen dyadischen und triadischen Face-to-Face-Interaktionen (siehe Brône/ Oben 2015), die im Jahr 2017 an der Albert-Ludwigs-Universität Freiburg im Breisgau bzw. im Jahr 2018 an der Leopold-Franzens-Universität Innsbruck gesammelt wurden. In beiden Korpora haben sich jeweils zwei oder drei Personen je zweimal 10 bis 20 Minuten unterhalten, wobei in Innsbruck für beide Gespräche das Thema vorgegeben war (ein aktuelles gesellschaftliches Thema und eine Brainstormfrage), während es sich in Freiburg um eine Brain‐ stormrunde und eine freie Unterhaltung handelte. Alle Teilnehmer: innen waren deutschsprachige Studierende oder Mitarbeiter: innen der jeweiligen Universität und trugen während der Interaktionen mobile Eyetracking-Geräte, die das Blickverhalten detailliert registrieren (siehe Abb. 5 in Abschnitt 3). Beide Korpora haben eine Gesamtdauer von je ca. 2,5 Stunden. Für die vor‐ liegende Studie wurden insgesamt knapp unter 4 Stunden Material ausgewählt (3: 52: 49) und im Hinblick auf die Intensivierung analysiert. Insbesondere wurde für die im Datensatz belegten Steigerungspartikeln und steigerungspartikelähn‐ lichen Adjektive bzw. Adverbien geschaut, mit welchen Kopf- und Handgesten sie einhergehen und ob in unmittelbarer Nähe des Intensivierers ein bestimmtes Muster im Blickverhalten zu erkennen ist. Für die Gestik schauen wir uns jeweils die gesamte Intonationsphrase an, die den Intensivierer enthält; für das Blickverhalten beschränken wir uns auf ein Zeitfenster zwischen 500ms vor und 500ms nach dem verbalen Intensivierer. Dieses Zeitfenster hat sich auch in anderen Studien zur Korrelation zwischen semantisch-pragmatischen Phänomenen und Blickverhalten als sinnvoll erwiesen (z. B. Jehoul et al. 2016 zu Blickverschiebungen bei Sprecherhäsitationen) und berücksichtigt die Mul‐ tifunktionalität von Blickverhalten in der Interaktion (d. h. eine Erweiterung des Zeitfensters würde die Gefahr einer potentiellen Verquickung der interaktiven Funktionen von Blickverhalten innerhalb dieses Fensters wesentlich erhöhen und damit die Analyse erheblich erschweren). Was die Gestik betrifft, werden wir im Folgenden hauptsächlich auf die Kopfgesten eingehen, da - zumindest in unseren Daten - nur selten relevante (d. h. mit der Intensivierung zusammen‐ Multimodale Intensivierung im Deutschen 67 <?page no="68"?> 4 Die Zuordnung der Intensivierer zu den einzelnen Stufen spiegelt jene bei van Os (1989), außer im Fall von voll(e), das nicht mehr eindeutig als absoluter Intensivierer zu betrachten ist. Bei der Analyse wird nicht zwischen der standardnäheren Variante voll und der umgangssprachlicheren Variante volle unterschieden, weil sich hier keine klaren Tendenzen erkennen lassen. Gleiches gilt für den Unterschied brutal/ brutalst. 5 Für die Gestikanalyse wurden alle in der Tabelle aufgelisteten Belege herangezogen. Für die Analyse des Blickverhaltens mussten neun Belege ausgeschlossen werden, weil aufgrund einer technischen Störung an einer der Eyetracking-Brillen keine verlässlichen Aussagen möglich sind. Es handelt sich um vier Belege von ganz, drei Belege von voll, zwei von komplett und jeweils einen von gar und sehr. 6 In einem anonymen Gutachten wird nahegelegt, dass auch der unterschiedliche Umfang des Datensatzes (Stratton (2020) hat mit 919 Belegen fast 2,5 Mal so viele wie wir) eine Rolle spielen dürfte. Obwohl wir einen solchen Einfluss nicht ausschließen können, ist er doch eher unwahrscheinlich, denn die Unterschiede in der Distribution sind signifikant (ein Chi-Quadrat-Test für die zehn Intensivierer, die sowohl in Strattons Liste als auch in unserer Analyse vorkommen, ergibt einen X²-Wert von 192,82 bzw. mit Yates-Korrektur 186,28 und einen p-Wert von jeweils deutlich unter 0,001). hängende) Handgesten realisiert werden und sich in den wenigen Fällen, wo eine relevante Handgeste vorliegt, keine klaren Tendenzen ergeben. Insgesamt konnten im Datensatz 391 Belege verbaler Intensivierer ausge‐ macht werden, die für die Analyse in Frage kommen (ausgeschlossen wurden Belege, bei denen sich nicht erkennen lässt, ob und (wenn ja) welche Geste realisiert wird). Dabei unterscheiden wir - anders als van Os (1989) und And‐ routsopoulos (1998) - nicht zwischen Intensivierung im engeren Sinne durch Steigerungspartikeln und Aussagebekräftigung durch Modalwörter, zumal (wie beide Autoren auch einräumen) beide Systeme des Öfteren „zusammenfallen“ und eine Grenzziehung nicht ohne Weiteres möglich ist. Tabelle 2 bietet eine Übersicht der analysierten Intensivierer, geordnet nach Intensitätsstufe, 4 mit Angabe der Belegzahl. 5 Diese Tabelle spiegelt weitestgehend die Liste der häufigsten Adjektivintensivierer bei Stratton (2020: 198), auch wenn sich die Frequenzverhältnisse deutlich unterscheiden - zum Beispiel ist in unserem Datensatz voll(e) mit Vorsprung der am häufigsten eingesetzte Intensivierer, während es bei Stratton erst an sechster Stelle rangiert, was wohl hauptsäch‐ lich auf zwei Faktoren zurückzuführen ist: einerseits auf die unterschiedliche Zusammensetzung der Korpora, andererseits darauf, dass wir uns (anders als Stratton) nicht auf die Intensivierung von Adjektiven beschränken, sondern auch u.-a. Adverbien als Intensifikate berücksichtigen. 6 68 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="69"?> 7 Bei so und dermaßen wurden nur die Belege analysiert, die die emphatische und nicht die gradal-konsekutive Konstruktion nach Auer (2006) instanziieren, d. h. in denen kein konsekutiver dass-Satz folgt und so bzw. dermaßen also das einzige intensivierende Element auf verbaler Ebene darstellt. absolut höchst hoch (variabel) total: 9 überhaupt: 6 komplett: 4 völlig: 3 echt: 47 richtig: 31 wahnsinnig: 6 brutal(st): 5 dermaßen: 4 extrem: 3 zu: 1 sehr: 24 wirklich: 15 so 7 : 8 - voll(e): 91 ganz: 69 gar: 64 Tab. 2: Übersicht der Intensivierer im Datensatz Angesichts der relativ niedrigen Belegzahlen einzelner Intensivierer ist der vorliegende Beitrag primär als explorative Studie zu betrachten, in der es darum geht, das Feld zu sondieren und das Forschungspotenzial aufzuzeigen sowie einzelne konkrete Forschungspisten anzudeuten. Dementsprechend sind die Beobachtungen im Folgenden nicht immer als aussagekräftige Ergebnisse zu sehen, sondern teilweise als Tendenzen und weiter zu verifizierende Hypo‐ thesen. Zunächst werden im Abschnitt 3 einige Beispiele besprochen, die einen besseren Eindruck der relevanten Phänomene gewähren sollten. Im Anschluss wird im Abschnitt 4 auf einige allgemeine Tendenzen in den Daten eingegangen. Schließlich wird im Abschnitt 5 auf die Modalpartikel einfach eingegangen, die funktional den Intensivierern recht nahe steht, um darzulegen, inwiefern sich diese funktionale Nähe auch in der Gestik und im Blickverhalten spiegelt. 3 Gestik und Blickverhalten: Beispiele In diesem Abschnitt sollen anhand von Beispielen die wichtigsten multimodalen Phänomene in Intensivierungskontexten im Datensatz kurz vorgestellt werden. Zunächst wird auf die Gestik eingegangen, im Anschluss wird auch das Blick‐ verhalten angesprochen. In einer Besprechung der Gesten mit ganz und sehr in Fernsehgesprächen und Parlamentsreden hat Schoonjans (2018: 126 f.) gezeigt, dass mit diesen beiden Intensivierern unterschiedliche Gesten einhergehen können. Konkret beschreibt er die Kombination mit Kopfschütteln, Kopfnicken und Taktstock‐ gesten. Auch in unseren Daten sind Kopfschütteln und Nicken wiederholt belegt, daneben auch der Kopfschwenk (eine große seitliche Ausholbewegung Multimodale Intensivierung im Deutschen 69 <?page no="70"?> 8 Die Beispiele wurden nach den GAT2-Konventionen (Selting et al. 2009) transkribiert. Die relevanten Stellen (die Wörter, mit denen die Geste oder das Blickphänomen auftritt) sind unterstrichen; der genaue Zeitpunkt, zu dem die Standbilder gemacht wurden, wird durch Rautezeichen unterhalb der jeweiligen Transkriptzeile markiert. mit dem Kopf) und (deutlich seltener) der Kopftilt (d. h. der Kopf wird kurz schräg zur Seite gehalten). Handgesten (darunter auch Taktstockgesten) spielen in der vorliegenden Studie keine wesentliche Rolle. Der Unterschied bei den Taktstockgesten dürfte darauf zurückzuführen sein, dass Schoonjans (2018) für seine Analyse auch Parlamentsreden berücksichtigt hat, in denen Taktstock‐ gesten generell sehr oft vorkommen (McNeill 1992: 16). Möglicherweise ist ihr häufiges Auftreten in Schoonjans’ Daten also eher dem Parlamentssetting geschuldet als einer typischen Verwendung in Intensivierungskontexten. Das erste Beispiel illustriert das Kopfschütteln in Intensivierungskontexten. Der Sprecher erzählt hier vom Kontakt mit Sinti und Roma bei einem Rumä‐ nienurlaub. Dabei schüttelt er zweimal den Kopf, einmal zusammen mit der Intensiviererkombination echt richtig und einmal beim Intensivierer voll. In Abb. 1 sehen wir die Perspektive des Sprechers (B) bei echt richtig bzw. beim Anfang des Kopfschüttelns. Den Sprecher selber sehen wir hier also nicht, aber aus der Verschiebung des Bildes zwischen den drei Standbildern lässt sich klar erkennen, wie er den Kopf seitlich bewegt bzw. schüttelt. In vielen Fällen sind die Kopfbewegungen zu den Intensivierern im Datensatz dermaßen subtil, dass sie auf Standbildern der anderen Kameraperspektiven teilweise nur schwer zu erkennen sind, während die eigene Perspektive dadurch, dass sich die Eyetracking-Brille mit dem Kopf bewegt und also zu einer Verschiebung des Bildes führt, einen besseren Eindruck der Bewegung ermöglicht. (Gezeigt wird hier nur der Anfang der Geste, d. h. die erste Rechts-links-rechts-Bewegung; insgesamt wird der Kopf viermal hin und her bewegt.) (1) Rumänien (ET1a) 8 - B aber wir warn auch irgendwie: (-) viel DA - - wo die halt gelebt habn. - C [ja oke - B [(so) irgendwie irgendwelche touRIStischen - - sachen- - - transsilvAnien schloss DRAcul oder wie - - des heißt- - - (1.3) da warn echt (.) richtig VIEle; - - # # # - - aber voll auch voll interesSANT, 70 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="71"?> Abb. 1: Kopfschütteln zu echt richtig Im zweiten Beispiel ist von der „voll lustigen“ Tatsache die Rede, dass Raucher teilweise selber das Rauchverbot in der Gastronomie befürworten. In diesem Fall wird zum Intensivierer voll in der vorletzten Transkriptzeile von der Sprecherin ein Kopfnicken realisiert. Auch in diesem Fall zeigt die Abbildung (Abb. 2) den Anfang der Geste aus der Sicht der Sprecherin (C); hier lässt sich also die mit dem Nicken verknüpfte senkrechte Verschiebung des Eyetracking-Bildes erkennen. (2) Rauchverbot (inn_1_1) - A dann wär I jetzt als NICHTraucher dafür- - - Eher dass man RAUchern sachen raubt, - - weil I (.) bin jetzt zwar RAUcher,= - - =aber I wär jetzt eher dafür dass ma s - - VOLle verbietet. - C des isch Oft voll LUSCHtig ge, - - ### - A <<lacht>JA; > Abb. 2: Kopfnicken zu voll Das dritte Beispiel illustriert gleich zwei Gesten. Die Rede ist von den Innsbru‐ cker Parkanlagen. Während zu brutal am Anfang des Beispiels keine Geste re‐ alisiert wird, sehen wir bei volle einen Kopftilt und bei echt einen Kopfschwenk. Abb. 3 zeigt, erneut aus der Perspektive der Sprecherin (B), den Kopftilt zu volle: Links, zu Beginn der Intonationseinheit, hält sie den Kopf noch mehr oder weniger aufrecht, während sich rechts, bei volle, am Stand des Schrankes im Hintergrund erkennen lässt, dass sie den Kopf leicht schräg hält. Abb. 4 zeigt Multimodale Intensivierung im Deutschen 71 <?page no="72"?> den Kopfschwenk zu echt, auch diesmal aus der Perspektive der Sprecherin (A), sodass sich auch hier die mit der seitlichen Ausholbewegung des Kopfes ein‐ hergehende laterale Verschiebung des Eyetracker-Bildes erkennen lässt. Nicht wirklich zu erkennen in den Standbildern ist der Unterschied zwischen dem Kopfschwenk und dem Kopfschütteln aus Beispiel (1). Der Unterschied besteht darin, dass der Kopfschwenk aus einer prominenten seitlichen Ausholbewegung des Kopfes besteht, bei der eindeutig die typischen Gestenphasen Vorbereitung, ‚Stroke‘ und Rückzug zu erkennen sind, während das Kopfschütteln eine (im Allgemeinen iterierte) fließende Bewegung mit kleinerer Amplitude und ohne klar abgrenzbare Strokes ist - die Bewegungen von links nach rechts und von rechts nach links sind also beim Kopfschütteln gleich ausgeprägt, während beim Schwenk eine Bewegung als Stroke prominenter ist. (3) Rapoldipark (inn_3_2) - A was a brutAl schön isch des san halt die - - PARKS, - - HOFgarten- - - oder A- - - a wenns verSCHRIEN isch in der nAcht? = - - =aber [(-) raPOLdipArk, - B - [raPOLdipark- - A also [( ) - B - [da is VOLle schÖn; - - - # # - A da is E: CHT fEIn, - - - # # # Abb. 3: Kopftilt zu volle 72 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="73"?> 9 Bei den triadischen Interaktionen ist auch ein Blickwechsel zwischen den beiden Adressat: innen möglich, während diese Möglichkeit bei den dyadischen Interakti‐ onen nicht gegeben ist. Zu klären wäre noch, ob solche Blickwechsel zwischen Adressat: innen eher dem dauerhaften Anschauen der dyadischen Interaktionen ähneln (weil immerhin ständig ein: e Adressat: in angeschaut wird) oder doch vielmehr mit den Fällen gleichzusetzen sind, bei denen ein vorher abgewandter Blick zum/ zur Adressat: in hin orientiert wird. Abb. 4: Kopfschwenk zu echt Bei der Analyse des Blickverhaltens betrachten wir (ähnlich wie bei der Gestik) nur den Blick der Person, die den Intensivierer äußert; das Blickverhalten der Adressat: innen bleibt weitestgehend außer Betracht. Für diese erste explorative Studie wurde für eine grobkörnige Zweiteilung der Belege optiert: Wird beim Intensivierer der/ die (bzw. ein: e) Gesprächspartner: in mit dem Blick fixiert oder nicht? Dabei spielt es für die folgende Analyse keine Rolle, ob ein kontinuierliches Anschauen vorliegt oder ob der Blick nur beim Intensivierer kurz auf das Gegenüber gerichtet ist. Wichtig ist allerdings, dass tatsächlich eine Blickfixierung vorliegt und nicht einfach ein schweifender Blick zufällig in dem Moment auf einer Person ist. Dies lässt sich in den Eyetracking-Daten daran erkennen, dass Fixierungen durch einen deutlich sichtbaren gaze cursor (der rote Kreis in den Abbildungen) zu erkennen sind, der den Punkt im Blickfeld anzeigt, der gerade fokussiert wird, Schweifungen dagegen nur durch Linien, die der Augenbewegung folgen. In Abb. 4 ist zum Beispiel links und rechts eine Fixierung gegeben, in der Mitte jedoch nur ein schweifender Blick. Uns ist durchaus bewusst, dass diese grobe binäre Einteilung suboptimal ist und dass zum Beispiel auch der Unterschied zwischen einem punktuellen und einem dauerhaften Anschauen relevant sein könnte. Eine dermaßen feinkörnige Analyse würde für diese explorative Studie zu weit führen, zumal in dem Fall auch die dyadischen und die triadischen Interaktionen separat zu analysieren wären, 9 bleibt aber auf jeden Fall ein Forschungsdesiderat. Dass ein Zusammenhang zwischen Intensivierung und Blickverhalten be‐ stehen könnte, suggerieren Fälle wie Beispiel (4). In dieser Sequenz erzählt A über seine Erfahrungen als Student in einer WG. In den ersten zwei Into‐ nationseinheiten zeigt sich ein typisches Blickmuster für Sprecher: innen, das Multimodale Intensivierung im Deutschen 73 <?page no="74"?> in der Forschungsliteratur bereits ausführlich beschrieben wurde (Goodwin 1981; Hirvenkari et al. 2013; Brône et al. 2017): Bei der Produktion einer Into‐ nationseinheit wechselt Sprecher A den Blick zwischen den beiden Adressaten (B und C), während bei den Adressaten ein kontinuierliches Anschauen der sprechenden Person beobachtbar ist. In der vierten Zeile aber, in der der betonte Intensivierer so verwendet wird, wechselt der Sprecher den Blick nicht, sondern schaut kontinuierlich auf B (Abb. 5 oben rechts). (4) WG (ET1b) - A so war_s bei meiner we ge in WÜRZburg. - - da hat die verMIEterin drunter gewohnt, - B ouh. - A und_s war SO schrecklich, - - # Abb. 5: Kontinuierliches Anschauen zu so 4 Ergebnisse Wie die Beispiele im vorigen Abschnitt suggerieren, lassen sich Schoonjans’ (2018) Beobachtungen für ganz und sehr auch auf andere Intensivierer aus‐ weiten: Es gibt unterschiedliche Gesten, die in Intensivierungskontexten häu‐ figer vorkommen, aber es lässt sich keine Geste als die typische Intensivierungs‐ geste im Deutschen bestimmen. Auch gibt es keine Eins-zu-eins-Korrespondenz zwischen spezifischen Intensivierern und spezifischen Gesten: Die analysierten 74 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="75"?> 10 Von expliziter Negation ist die Rede, wenn das Kopfschütteln mit einer verbal geäu‐ ßerten Negation einhergeht bzw. selber eindeutig die negierende Bedeutung vermittelt. Dem stehen Verwendungen gegenüber, in denen das Kopfschütteln nicht in einem eindeutig negativen Kontext realisiert wird, sondern vielmehr zu abtönenden oder intensivierenden Zwecken eingesetzt wird, wie etwa in Beispiel (1) oder auch in den Abschnitten 4.2, 4.3 und 5. Oft kann diesen Verwendungen eine Art implizierte Negation zugrunde gelegt werden, aber die jeweilige Äußerung selber wird nicht negiert, auch nicht durch die Geste. Ausführlicher zu expliziter versus impliziter Negation beim Kopfschütteln u.-a. Kendon (2002) und Schoonjans (2018). Intensivierer können im Allgemeinen mit mehreren Gesten kombiniert werden und jede der beschriebenen Gesten kommt mit mehreren Intensivierern vor. Ähnlich lässt sich auch beim Blickverhalten nicht ein bestimmtes Phänomen als das typische Blickverhalten bei Intensivierung ausmachen. Trotzdem lassen sich in den Daten einige Tendenzen erkennen, die im Folgenden ausführlicher besprochen werden. 4.1 Multimodale Realisierungen von gar und überhaupt Unter den in dieser Studie analysierten Intensivierern gibt es zwei, die sich bereits auf der verbalen Ebene deutlich anders verhalten als die anderen: gar und überhaupt. Diese werden hauptsächlich (bzw. in unseren Daten nur) zur Intensivierung von Negationen verwendet (gar nicht, gar kein usw.), während die anderen Intensivierer hauptsächlich mit Adjektiven und Adverbien kombi‐ niert werden. Dieser unterschiedliche Verwendungsbereich zeigt sich auch auf nonverbaler Ebene, sodass wir gar und überhaupt separat besprechen. Auf gestischer Ebene fällt auf, dass gar und überhaupt nicht mit typischen Intensivierungsgesten kombiniert werden, sondern nur mit explizit negierenden Gesten (das allerdings auch nur in 18 von 70 Belegen). In unseren Daten handelt es sich immer um ein explizit negierendes Kopfschütteln, 10 auch wenn zusätzlich zweimal eine negierende Handgeste vorliegt, nämlich die von Harrison (2010) als PDAcross bezeichnete Geste, bei der die flache Hand, mit der Handfläche nach unten gerichtet, einmal lateral zur Seite bewegt wird. Die Geste scheint also eher durch die Negation als durch die Intensivierung ausgelöst zu werden. Allerdings wäre es interessant, der Frage nachzugehen, inwiefern hier vielleicht eine zweifache Intensivierung der verbalen Negation vorliegt, einmal verbal durch den Intensivierer (gar oder überhaupt) und einmal nonverbal durch die Geste, und inwiefern die verbale Intensivierung die Realisierung der Negationsgeste wahrscheinlicher macht. Dann wäre nämlich davon auszugehen, dass der verbale Intensivierer durchaus eine gestische Intensivierung herbeiführt, die sich dann allerdings nicht als gestisches Pendant des Intensivierers betrachten Multimodale Intensivierung im Deutschen 75 <?page no="76"?> 11 Ähnliche Belege finden sich im Datensatz vereinzelt auch mit anderen Intensivierern und Intensifikaten, wenn zum Beispiel bei voll gut zu gut die typische Ringgeste realisiert wird. Auch hier wäre eine Interpretation möglich, nach der das Prädikat gut sowohl verbal (durch voll) als auch gestisch intensiviert würde. 12 Obwohl die vorhandene Literatur zu Gesten wie Nicken und Kopfschütteln (u. a. Kendon 2002; Schoonjans 2018) nahelegt, dass sie tatsächlich eine verstärkende Wir‐ kung aufweisen, lässt sich nicht immer eindeutig sagen, inwiefern sie mit der verbalen Intensivierung zusammenhängen bzw. ob sie durch die verbale Intensivierung oder durch andere Elemente im Gesprächsablauf ausgelöst werden. Ziel des vorliegenden Beitrags ist allerdings auch nicht, Intensivierungsgesten zu beschreiben, sondern vielmehr herauszufinden, welche Gesten typisch sind für Intensivierungskontexten, unabhängig davon, ob diese Gesten auch selber intensivieren oder nicht. 13 Dass zwischen Negation und Wegschauen ein Zusammenhang bestehen könnte, legt auch die Studie von Kendrick und Holler (2017) nahe, denen zufolge Sprecher: innen in ihrer Antwort auf eine Entscheidungsfrage häufiger wegschauen, wenn die Antwort eine negative ist. lässt, sondern sich direkt auf das Intensivierte bezieht. 11 Ob tatsächlich ein solcher Zusammenhang besteht und der Intensivierer tatsächlich die Geste zum Intensifikat (mit) auslösen kann, lässt sich jedoch anhand unseres Datensatzes nicht eindeutig sagen und muss noch weiter untersucht werden. Für die weitere Besprechung der anderen Intensivierer werden wir deshalb solche Gesten, die als gestisches Pendant des lexikalischen Intensifikats zu betrachten sind (z. B. die Ring-Geste zu gut), nicht weiter berücksichtigen und uns auf diejenigen Gesten beschränken, die mit dem Kontext bzw. der Intensivierung zu verknüpfen sind. 12 Auch was das Blickverhalten betrifft, verhalten sich gar und überhaupt anders als die anderen Intensivierer in unserem Datensatz, und zwar dahingehend, dass bei diesen beiden Intensivierern das Gegenüber weniger oft angeschaut wird. Im Schnitt wird bei etwa jedem dritten Beleg (33,42 %) kein: e Adressat: in ange‐ schaut, bei gar und überhaupt sind wir aber insgesamt bei 39,13 % (insgesamt 27 von 69 Belegen), wobei vor allem bei gar eine solche Tendenz zu beobachten ist (25 von 63 Belegen bzw. 39,68 %). Diese Tendenz ist allerdings nicht signifikant (X² = 1,45; p = 0,69). Unklar ist zudem noch, ob es sich bei dem häufigeren Wegschauen um ein besonderes Merkmal dieser beiden Intensivierer handelt oder ob das häufigere Wegschauen vielmehr eine typische Eigenschaft der durch gar bzw. überhaupt verstärkten Negation ist, die bereits beim Intensivierer einsetzt. 13 Beispiel (5) zeigt das Wegschauen für gar in unserem Datensatz. In den ersten Zeilen sehen wir wieder das prototypische Sprecherblickverhalten, das wir oben bereits bei Beispiel (4) beschrieben haben: Die Sprecherin (B) wechselt den Blick zwischen den beiden Adressat: innen. In Zeile 4 aber bleibt ihr Blick während 76 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="77"?> der Produktion der gesamten Intonationseinheit abgewandt (in Abb. 6 unten links). (5) Wuppertal (ET4a) - B WUPperta: l- - - (0.5) - - echt da GEHT das? - - <<p>WUSST ich gar nicht; > - - # Abb. 6: Kontinuierliches Wegschauen zu gar 4.2 Rolle der Intensivierungsstufe Gar und überhaupt sind in zweierlei Hinsicht Außenseiter in unserem Datensatz: Einerseits intensivieren sie hauptsächlich Negationen, andererseits kommen sie nur mit Gesten vor, die sich auf das Intensifikat beziehen. Inwiefern ein Zusammenhang zwischen diesen beiden Beobachtungen besteht, muss dahin‐ gestellt bleiben; jedenfalls sind bei den anderen Intensivierern, die eben keine Negation als Intensifikat haben können, sehr wohl Gesten zu finden, die nicht direkt mit dem Intensifikat zusammenhängen. Daher wollen wir diese anderen Intensivierer im Folgenden etwas ausführlicher besprechen und dabei zwei Dimensionen berücksichtigen: die Intensivierungsstufe bzw. die Intensität der Intensivierung in diesem Abschnitt und die Expressivität der Intensivierung im nächsten Abschnitt. Multimodale Intensivierung im Deutschen 77 <?page no="78"?> Wie vorhin angesprochen, wurden für diese Studie die absolute, die höchste (bzw. extrem hohe) und die hohe Intensivierungsstufe berücksichtigt. Was die Gestikfrequenz insgesamt betrifft, scheint die Intensivierungsstufe jedoch keinen wesentlichen Unterschied auszumachen: Über die Intensitätsgrade hinweg wird ca. jeder dritte Intensivierer durch eine Geste begleitet. Für die Intensivierer mit mindestens fünf Belegen variiert der Anteil der Belege, die eine Geste bei sich haben, im Allgemeinen zwischen 25 % und 35 %, mit zwei Ausreißern nach oben: total mit 44,44 % und richtig mit 48,39 %. Dass diese beiden Ausreißer auf der absoluten bzw. der höchsten Stufe anzusiedeln sind, könnte vermuten lassen, dass die Gestenfrequenz mit der Intensivierungsstufe ansteigt. Allerdings stellt sich diese Tendenz als statistisch nicht signifikant heraus (und mit wahnsinnig ist auch der Intensivierer mit der niedrigsten Gestenquote (16,67 %) auf der höchsten Stufe anzusiedeln). Obwohl das Bild einigermaßen dadurch verzerrt wird, dass die Tokenfrequenzen der einzelnen Intensivierer stark auseinandergehen, dürfte es sich hier also eher um eine schwache Tendenz handeln. Eine zwar ebenfalls nicht signifikante, aber trotzdem deutlichere Tendenz zeichnet sich ab bei der Frage, welche Gesten mit den Intensivierern einher‐ gehen. Während bei den meisten Intensivierern die Geste in nahezu der Hälfte der Fälle ein Kopfschütteln ist (bei den Intensivierern mit mindestens fünf Belegen variieren die Anteile zwischen 42,59% und 53,66 % der Belege mit einer Geste), dominiert das Kopfschütteln bei total eindeutig (75,00 %), und auch bei komplett, völlig und wahnsinnig ist nur Kopfschütteln belegt. Zwar sind diese Beobachtungen aufgrund der niedrigen Belegzahl insbesondere der drei letztgenannten Intensivierer mit Vorsicht zu genießen, aber trotzdem könnten sie eine Tendenz andeuten insofern, als es sich bei total, komplett und völlig um die drei Intensivierer der absoluten Stufe handelt und wahnsinnig zumindest noch der höchsten Stufe zuzurechnen ist. Demnach würde das Kopfschütteln vor allem auf den höheren Intensivierungsstufen dominieren. Dieser Eindruck wird noch dadurch verstärkt, dass aus einer Stichprobe für die Intensivierer der gemäßigten Stufe (in unseren Daten vor allem recht) hervorgeht, dass in dem Fall das Kopfschütteln seltener vorkommt und stattdessen das Nicken dominiert. Ein gewisser Zusammenhang zwischen dem Kopfschütteln und den höheren Intensivierungsstufen wäre insofern nicht verwunderlich, als Foolen et al. (2016) nahegelegt haben, dass vor allem auf den höheren Stufen Intensivierer mit einer negativen Ursprungssemantik zu finden sind. Zwar zeigt sich das in unserem Datensatz auf verbaler Ebene nicht so deutlich (allenfalls wäre bei wahnsinnig noch von einer ursprünglich negativen Konnotation auszugehen), aber es wäre nicht auszuschließen, dass diese von Foolen et al. angedeutete Tendenz auch für 78 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="79"?> 14 Damit ist nicht gemeint, dass das Kopfschütteln und der Kopfschwenk als explizite Ne‐ gationsgesten in jedem Kontext einfach austauschbar wären. Aufgrund unserer Daten würden wir vermuten, dass der Kopfschwenk durch seine energischere Bewegung mit klarem Stroke stärker bzw. kategorischer negiert als das Kopfschütteln (vgl. keinesfalls vs. nicht); weitere Forschung ist hier jedoch nötig. nonverbale Intensivierung gilt. Tatsächlich ist das Kopfschütteln, das mit diesen Intensivierern einhergeht, nicht das explizit negierende (siehe Fußnote 10), aber auch diesem implizit negativen Kopfschütteln in Kontexten der Intensivierung liegt eine ursprünglich negative Bedeutung zugrunde (Kendon 2004: 259). Interessant ist in diesem Kontext auch die Beobachtung, dass auch der Kopf‐ schwenk im Datensatz nur mit Intensivierern der absoluten und der höchsten Stufe (extrem, total, echt, richtig) belegt ist sowie bei Belegen von ganz und voll, bei denen aufgrund der Betonung und angesichts der Semantik des Intensifikats (voll übertrieben, ganz krass u. dgl.) auch eher von einer höheren Intensivierungs‐ stufe auszugehen ist. In der Gestikliteratur ist der Kopfschwenk noch nicht so umfassend untersucht worden wie das Kopfschütteln, aber vor dem Hintergrund bisheriger Studien zum Ursprung des Kopfschüttelns (insbesondere Bross 2020) liegt die Vermutung nahe, dass dem Kopfschwenk eine ähnliche, auf Ablehnung zurückgehende Negationsbedeutung zugrunde liegt, zumal der Kopfschwenk teilweise anstelle 14 des Kopfschüttelns als Negationsgeste verwendet werden kann und auch eine formale Ähnlichkeit zur bereits angesprochenen manuellen Negationsgeste PDAcross besteht. Beim Blickverhalten zeigt sich eine eindeutige Tendenz insofern, als bei den absoluten Intensivierern insgesamt in 93,33 % der Fälle der Blick auf den/ die (bzw. eine: n) Gesprächspartner: in gerichtet ist (14 von 15 Belegen). Dies ist ein eindeutig überdurchschnittlicher Wert (der Schnitt liegt bei 66,58 %) und trotz der insgesamt niedrigen Belegzahl für die absolute Stufe ist diese Tendenz auch signifikant (X² = 19,16; p = 0,00007). Auffällig ist vor allem, dass sich die absolute Stufe damit auch eindeutig von den anderen Stufen abhebt, denn sowohl die höchste als auch die hohe Stufe weisen mit 63,39 % und 65,22 % ein relativ durchschnittliches Verhalten auf. Es zeigt sich also auch kein Gefälle, nach dem das Gegenüber häufiger angeschaut wird, je höher die Intensivierungsstufe ist: Nur die absolute Stufe unterscheidet sich deutlich von den anderen, während zwischen höchster und hoher Stufe kein deutlicher Unterschied zu erkennen ist. Auffällig ist insbesondere auch das Blickverhalten mit voll(e). In 60 von 88 Belegen von voll(e) (68,18 %) wird ein: e Gesprächspartner: in angeschaut. Damit liegt voll(e) nur knapp über dem Durchschnitt und ist weit von den 93,33 % der absoluten Stufe entfernt, was als weiterer Hinweis dafür zu betrachten ist, dass voll(e) nicht mehr nur auf der absoluten Stufe agieren kann und somit, anders als Multimodale Intensivierung im Deutschen 79 <?page no="80"?> noch bei van Os (1989) und Gutzmann (2019), nicht mehr als klarer expressiver Intensivierer der absoluten Stufe zu betrachten ist. 4.3 Rolle der Expressivität Wie im Abschnitt 1 angedeutet, ist eine relevante Dimension der Intensivierung jene der Expressivität. Da die expressiven Intensivierer vor allem auf den hö‐ heren Intensivierungsstufen zu situieren sind, scheint an dieser Stelle die Frage gerechtfertigt, ob die gerade beschriebenen Tendenzen (mehr Kopfschütteln bzw. Kopfschwenk und häufigeres Anschauen auf den höheren Intensivierungs‐ stufen) tatsächlich nur mit der Intensivierungsstufe zusammenhängen oder doch vielmehr auf die Expressivität des verbalen Intensivierers zurückzuführen sind. Jedenfalls wurde auch für die Dimension der Expressivität bereits auf einen sogenannten Negativitätsbias hingewiesen (Foolen et al. 2016; Jing-Schmidt 2007), nach dem expressive Intensivierer häufiger als nicht-expressive eine ur‐ sprünglich negative Semantik haben. Insofern wäre die Hypothese naheliegend, dass vom Ursprung her negative Gesten wie Kopfschütteln und Kopfschwenk eher mit der expressiven Intensivierung zu verknüpfen wären. Einfach zu beantworten ist diese Frage jedoch nicht, da sich nicht immer eindeutig bestimmen lässt, ob bzw. inwiefern ein Intensivierer als expressiv zu betrachten ist. Klar ist jedenfalls, dass sich das Kopfschütteln und der Kopfschwenk nicht auf expressive Intensivierer beschränken, sind sie doch auch mit nicht-expressiven Intensivierern wie ganz und (zumindest für das Kopfschütteln) sehr belegt. Die Daten suggerieren zwar, dass bei expressiven Intensivierern wie wahnsinnig und brutal(st) vergleichsweise etwas mehr Ge‐ sten realisiert werden als bei weniger expressiven und dass dieser Unterschied vor allem auf eine höhere Frequenz von Kopfschütteln und (in geringerem Maße) Kopfschwenk zurückzuführen ist. Eine klare Tendenz lässt sich in dieser Hinsicht jedoch nicht ausmachen, zumal erneut auf die niedrige Frequenz einiger Intensivierer hinzuweisen ist. Die Frage, ob hier tatsächlich auch ein Effekt der Expressivität vorliegt oder ob nur die Intensivierungsstufe eine Rolle spielt, muss also weiterhin dahingestellt bleiben. Was das Blickverhalten betrifft, lässt sich hinsichtlich Expressivität keine klare Tendenz ausmachen. Zwar wird bei den expressiven Intensivierern im Allgemeinen etwas seltener weggeschaut als im Durchschnitt, aber dies scheint eher mit der Intensivierungsstufe als mit der Expressivität zusammenzuhängen. Tatsächlich ist etwa bei wahnsinnig, einem expressiven Intensivierer der höch‐ sten Stufe, der Blick in zwei von sechs Belegen abgewandt, womit wahnsinnig ähnliche Verhältnisse aufweist wie die anderen Intensivierer dieser Stufe auch, 80 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="81"?> unabhängig von der Expressivität. Aufgrund der insgesamt niedrigen Belegzahl expressiver Intensivierer im Datensatz sind diese Beobachtungen mit Vorsicht zu genießen und weitere Forschung ist definitiv erforderlich, aber zumindest suggerieren die Daten, dass beim Blickverhalten eher die Intensität und weniger die Expressivität eine Rolle spielt. 5 Modalpartikeln als Steigerungspartikeln? Wie aus der vorangehenden Besprechung hervorgeht, ist das Kopfschütteln eine Geste, die häufiger mit Intensivierern der höheren Stufen kombiniert wird. Das ist jedoch nicht der einzige Kontext, in dem das implizit negierende Kopfschütteln zum Einsatz kommt: Auch mit der Modalpartikel einfach geht öfters ein solches Kopfschütteln einher (Schoonjans 2018). Darüber, wie sich die Bedeutung von einfach am besten beschreiben lässt, besteht bislang in der Forschung kein Einverständnis (siehe Schoonjans 2018: 47 f.). Die meisten Analysen gehen aber in die Richtung, dass einfach den Sachverhalt als auf der Hand liegend, logisch, nicht hinterfragbar oder die einzige Möglichkeit markiert (Thurmair 1989: 132 spricht zum Beispiel von sprecherbezogener Evidentheit). Das illustriert auch Beispiel (6), übernommen aus Schoonjans (2018: 113). Das Beispiel entstammt einem Sportbericht, in dem von Christoph Stephans erstem Biathlonweltcupsieg die Rede ist. Dieser Auszug enthält viermal das Wort einfach, davon dreimal eindeutig als Modalpartikel, und alle drei werden tatsächlich mit einem Kopfschütteln kombiniert; lediglich das einfach in der vorletzten Zeile geht nicht mit einem Kopfschütteln einher, was insofern nicht wirklich verwunderlich ist, als hier eine etwas andere Verwendung von einfach vorliegt (in einem Infinitivsatz und mit einer Bedeutung, die dem Adverb einfach noch näher steht). (6) Weltcupsieg - also ich gÖnn=s dem jungen so SEHR, - und äh christoph stephan hAt das einfach nur - verDIENT und; - °h einfach KLASse. - mir fällt=s jetzt wirklich SCHWER da gefasst - zu sein und einfach zu analysIEren. - also (.) wAr (.) war einfach PHÄnomenal. Auch im Datensatz für die vorliegende Studie wird in zwei von acht einfach-Be‐ legen ein Kopfschütteln realisiert. Damit ist das Kopfschütteln tatsächlich die einzige mehrfach belegte Kopfgeste mit einfach, und ein Anteil von 25 % Multimodale Intensivierung im Deutschen 81 <?page no="82"?> 15 Auch Charles van Os (1989) listet einfach als Intensivierer auf, wobei unklar ist, ob er sich dabei auch auf diese Verwendung bezieht und welcher Wortart er einfach zuschlägt. 16 Im einzigen Beleg in COSMAS-II (Stand 26.09.2022) liegt eindeutig ein Zögern vor: „Er ist einfach, einfach…“ - ihr fehlen die Worte. (U21) entspricht auch dem von Schoonjans (2018) beschriebenen (23,70 %). Hier stellt sich also die Frage, ob das Vorkommen von Kopfschütteln sowohl mit einfach als auch mit Intensivierern auf eine gewisse Affinität zwischen einfach und Intensivierung hinweist bzw. ob einfach vielleicht eher als Steigerungspartikel denn als Modalpartikel zu betrachten sein könnte. Insbesondere in prädikativen Strukturen wie war einfach phänomenal in Beispiel (6) scheint tatsächlich eine gewisse Affinität zu den Steigerungspartikeln zu bestehen insofern, als einfach hier auch verstärkend interpretiert werden könnte - Thurmair (1989: 128) und Autenrieth (2002: 81) denken in solchen prädikativen Sätzen tatsächlich eine Einteilung von einfach als Steigerungspartikel an. 15 (Wohlgemerkt ist das Kopfschütteln mit einfach nicht auf solche prädikativen Strukturen beschränkt, sondern kommt im Beispiel auch etwa mit Christoph Stephan hat das einfach nur verdient vor.) Eine typische Steigerungspartikel ist einfach jedenfalls nicht. Dagegen spricht u. a., dass Steigerungspartikeln (und Intensivierer im Allgemeinen) grundsätz‐ lich betont sein können, was bei einfach, wenn überhaupt, nur schwer möglich ist. Auch können Intensivierer zur weiteren Verstärkung grundsätzlich iteriert werden (in COSMAS-II sind u. a. das war wirklich, wirklich, wirklich gut (T03) und ich bin ganz, ganz froh (NON08) belegt), was mit einfach ebenfalls kaum möglich scheint. 16 Für eine Einstufung als Steigerungspartikel spricht allerdings, dass einfach in solchen Prädikativstrukturen gemeinsam mit dem Adjektiv ins Vorfeld verschoben werden kann, wie in (7), was wiederum mit einer Modalpartikel normalerweise nicht möglich ist. (7) Einfach himmlisch ist die Luftnummer der russischen Truppe Borzovi. (COSMAS-II HAZ08) Anhand der Form lässt sich also nicht eindeutig bestimmen, ob einfach hier als Modalpartikel oder als Steigerungspartikel zu betrachten ist. Ähnlich schaut es auf der Bedeutungsebene aus. Als Argument gegen Intensiviererstatus von einfach könnte angedacht werden, dass in allen Belegen von einfach, denen eine intensivierende Wirkung zugeschrieben werden kann, auch immer die Modalpartikelbedeutung erkennbar ist insofern, als durch einfach ausgedrückt wird, dass die angeführte Kategorisierung durch das Prädikativ als nahelie‐ gend gilt und jegliche andere Einstufung damit implizit ausgeschlossen wird (weil eben nicht naheliegend). Das ist auch eine Fortführung einer älteren, 82 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="83"?> 17 Autenrieth (2002: 185) geht von Bedeutung ‚nicht komplex‘ als semantischer Basis für die intensivierende Verwendung aus, aber im Anschluss an Beltrama (2018) erscheint der Weg über die fokuspartikelähnliche Verwendung u. E. logischer. 18 Zu beachten ist auch, dass einfach generell (auch in nicht-prädikativen Kontexten) vorerst nicht als typische Modalpartikel gelten kann, weil es noch nicht so stark grammatikalisiert ist wie andere Modalpartikeln (siehe die Einstufung als peripheres Mitglied der Klasse der Modalpartikeln bei Diewald 2007: 118). fokuspartikelähnlichen Verwendung des Adverbs einfach, die den aktuellen Fokuspartikeln bloß und nur nahesteht (Autenrieth 2002: 183). Gerade diese Bedeutung ist es wohl auch, die die intensivierende Wirkung herbeiführt: Wenn man etwas als einzige Möglichkeit markiert, so wirkt die Aussage fast per definitionem stärker, als wenn man diese Markierung nicht hinzugefügt hätte (siehe Beltrama 2018 zu einer ähnlichen Analyse von englisch simply und just). Es scheint also so zu sein, dass sowohl die intensivierende Wirkung als auch die Modalpartikelbedeutung aus der fokuspartikelähnlichen Verwendung hervorgegangen sind. 17 Jedoch ist bislang nicht eindeutig geklärt, wie sich die intensivierende Wirkung und die Modalpartikelbedeutung historisch zuei‐ nander verhalten. Autenrieth (2002: 185 ff.) gibt zwar an, dass die von ihr als Steigerungspartikel eingestufte Verwendung älter sei als die Verwendung als Modalpartikel, was jedoch nicht unbedingt impliziert, dass die Modalpartikel aus der Steigerungspartikel hervorgegangen wäre. In Anbetracht von Coniglios (2022) Überlegungen erscheint vielmehr die Hypothese plausibel, dass beide Verwendungen direkt aus dem fokuspartikelähnlichen Adverb hervorgegangen sind und sich bislang vor allem in prädikativen Kontexten nur noch nicht klar auseinanderentwickelt haben, weshalb einfach in dem Fall Eigenschaften einer Modalpartikel und einer Steigerungspartikel aufweist. 18 Auch wenn die genauen diachronen Verhältnisse noch weiter zu klären sind, kann also auf jeden Fall von einer Affinität von einfach zu den Intensivierern ausgegangen werden. Eine solche Affinität zwischen Modalpartikeln und Inten‐ sivierern scheint ohnehin öfter gegeben zu sein: Schoonjans (2018: 121 f.) hat auch für wirklich eine gewisse Nähe zur Modalpartikel einfach nachgewiesen, echt wies bis ins Mittelhochdeutsche eine Verwendung als Modalpartikel auf (Autenrieth 2002) und Partikeln wie nur und bloß wirken auch als Modalpartikel (zumindest auf illokutiver Ebene) verstärkend. Vor diesem Hintergrund ist es auch nicht verwunderlich, dass Gesten wie das Kopfschütteln, die bereits als typische Gesten in Modalpartikelkontexten beschrieben wurden, auch mit Intensivierern zum Einsatz kommen können. Außerdem kann im Fall von einfach sowohl bei der Intensivierung als auch als Modalpartikel von einer impliziten Negation ausgegangen werden, die in beiden Fällen auf die fokuspar‐ Multimodale Intensivierung im Deutschen 83 <?page no="84"?> 19 Eine weitere Parallele dürfte das Kopfnicken betreffen. Oben wurde bereits darauf hingewiesen, dass das Nicken zwar auch bei Intensivierern der höheren Stufen vor‐ kommt, aber seltener als das Kopfschütteln, während es auf der gemäßigten Stufe zu dominieren scheint. Ähnlich schaut es bei den Modalpartikeln aus: Bei illokutiv-rheto‐ risch stärkeren Partikeln wie halt und einfach dominiert das Kopfschütteln, während bei schwächeren Partikeln wie ja und schon das Nicken eine stärkere Position einnimmt (siehe Schoonjans 2018). 20 Erneut mussten durch die bereits angesprochene technische Störung an einer der Eyetracking-Brillen zwei Belege von der Analyse ausgeschlossen werden. tikelähnliche Verwendung zurückzuführen sein dürfte (‚nur‘ impliziert ‚und nichts anderes‘) und die also die Verwendung des Kopfschüttelns sowohl mit eindeutigen, nur bedingt als intensivierend zu betrachtenden Modalpartikelbe‐ legen als auch mit intensivierenden Verwendungen erklären kann. 19 Auch beim Blickverhalten weist einfach eine gewisse Affinität zu den hö‐ heren Intensivierungsstufen auf, obwohl sich bei nur sechs 20 Belegen schwer Generalisierungen formulieren lassen. Tatsächlich wird nur in einem von sechs Belegen weggeschaut; in den anderen Belegen (83,33 %) ist der Blick auf eine: n Gesprächspartner: in gerichtet. Eine signifikante Tendenz lässt sich zwar, bedingt durch die niedrige Belegzahl, nicht ausmachen und es bleibt auch noch zu klären, inwiefern ein solches Blickverhalten typisch ist für einfach oder ob andere Modalpartikeln ähnliche Tendenzen im Blickverhalten zeigen, aber auf jeden Fall legt auch das Blickverhalten eine gewisse Affinität von einfach zu den Steigerungspartikeln (insbesondere zu jenen der oberen Intensivierungsstufen) nahe, die erklären dürfte, warum die Einstufung von einfach als Modal- oder Steigerungspartikel so kontrovers ist. 6 Fazit und Ausblick Im vorliegenden Beitrag wurde eine explorative Studie zur Rolle von Gestik und Blickverhalten in Kombination mit Steigerungspartikeln im Deutschen vorge‐ stellt, mit Fokus auf die absolute, die höchste und die hohe Intensivierungsstufe nach van Os (1989). Obwohl insgesamt 391 Belege analysiert wurden, sind einige Intensivierer dermaßen spärlich im Datensatz vertreten, dass weitere Verifizierung anhand eines umfangreicheren Datensatzes nötig ist. Trotzdem deuten die Daten einige Tendenzen an, bei denen es wertvoll erscheint, sie in Folgestudien weiterzuverfolgen. Diese fassen wir im Folgenden zusammen. Es hat sich gezeigt, dass sich Intensivierer, die hauptsächlich Negationen verstärken (gar, überhaupt), anders verhalten als die anderen: Sie werden nur mit Gesten kombiniert, die sich auf die Negation beziehen und nicht auf die Intensivierung, und mit diesen Intensivierern wird tendenziell häufiger vom 84 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="85"?> Gegenüber weggeschaut als mit anderen Intensivierern. Bei den anderen Inten‐ sivierern wurde auf zwei Eigenschaften geachtet: die Intensität bzw. Intensivie‐ rungsstufe und die Expressivität. Was die Gestik angeht, scheint die Intensität weniger zu beeinflussen, wie oft eine Geste realisiert wird, sondern vor allem auf die Art der Geste Einfluss zu nehmen: Je höher auf der Intensivierungsskala, umso häufiger ist die Geste zum Intensivierer ein Kopfschütteln oder ein Kopfschwenk. Inwiefern dies tatsächlich nur auf die Intensität zurückzuführen ist bzw. inwiefern auch eine Korrelation mit der Expressivität besteht, konnte aus dem verwendeten Datensatz nicht eindeutig abgeleitet werden. Tatsächlich sind die beiden Dimensionen nicht immer leicht voneinander zu trennen, da die expressiven Intensivierer vor allem auf den höheren Intensivierungsstufen anzusiedeln sind. Für das Blickverhalten suggerieren die Daten jedoch, dass dieses eher mit der Intensität als mit der Expressivität korreliert. Konkret konnte für das Blickverhalten gezeigt werden, dass bei den Intensivierern der absoluten Stufe überdurchschnittlich oft der/ die (bzw. ein: e) Adressat: in angeschaut wird. Im Anschluss wurde anhand einer Analyse von einfach, dessen Einstufung als Modal- oder Steigerungspartikel in der Literatur nicht einheitlich geschieht, auf die ohnehin gegebene Affinität zwischen Steigerungs- und Modalpartikeln eingegangen und dargelegt, dass sich diese auch auf nonverbaler Ebene zeigt. Konkret für die Partikel einfach konnte gezeigt werden, dass sie auf nonver‐ baler Ebene den oberen Intensivierungsstufen recht nahe steht insofern, als tendenziell das Gegenüber angeschaut wird und die am häufigsten mit einfach einhergehende Geste ein Kopfschütteln ist, zwei Beobachtungen, die auch für den oberen Bereich der Intensivierungsskala gemacht wurden. Wichtig ist allerdings, nochmals darauf hinzuweisen, dass die Datengrund‐ lage für einige der analysierten Intensivierer (sowie für die Partikel einfach) recht beschränkt war und dass bei einigen Tendenzen noch weitere Forschung mit einem umfangreicheren Korpus vonnöten ist, um dem genauen Verhältnis zwischen verbaler Intensivierung und Gestik bzw. Blickverhalten näher auf den Grund zu gehen. Außerdem ist das im vorliegenden Beitrag skizzierte Bild noch insofern unvollständig, als mehrere potenziell relevante Einflussfaktoren nicht berücksichtigt werden konnten. Zum Beispiel beschränkt sich die Analyse auf Gestik und Blickverhalten, während nicht auszuschließen ist, dass auch andere para- und nonverbale Größen wie Prosodie, Mimik und Körperhaltung bei der Intensivierung eine Rolle spielen und mit den beschriebenen Ebenen interagieren. Im Bereich der Prosodie wurde auch nicht beachtet, ob der verbale Intensivierer betont ist oder nicht, obwohl Claudi (2006: 365) anhand von sehr bereits suggeriert hat, dass betonte Intensivierer teilweise auf einer höheren Intensitätsstufe agieren als ihr unbetontes Pendant. Eine weitere Frage, Multimodale Intensivierung im Deutschen 85 <?page no="86"?> die offen bleiben musste, ist jene nach der multimodalen Realisierung von Intensiviererkombinationen (wie echt richtig in Beispiel (1)) oder iterierten Intensivierern (ganz ganz toll). Bei nur vier Belegen dieser Art insgesamt im Datensatz war eine separate Behandlung dieser Fälle nicht möglich und es wurde einfach jeder Intensivierer einzeln betrachtet, sodass hier noch ein weiteres Forschungsdesiderat besteht. Des Weiteren wurde, abgesehen von der Negation (die zur separaten Behandlung von gar und überhaupt geführt hat), die Wortart des Intensifikats für die Analyse nicht berücksichtigt. In den allermeisten Fällen (268 von 321) handelt es sich um ein Adjektiv oder ein Adverb und in sieben weiteren Fällen um eine prädikative Nominal- oder Präpositionalphrase, die sich ähnlich wie ein prädikatives Adjektiv verhält (etwa ich bin voll das Stadtkind oder das ist voll in Ordnung). Teilweise kann sich die Intensivierung aber auch auf andere Wörter wie Verben (das nervt voll) oder Indefinitpronomina (voll viel) beziehen. Inwiefern sich damit Unterschiede in der multimodalen Realisierung der Intensivierung verknüpfen lassen, muss noch dahingestellt bleiben. Gleiches gilt für das Blickverhalten, das nur grob in Anschauen versus Wegschauen aufgeteilt wurde. Zu untersuchen wäre noch, ob sich bei den unterschiedlichen Arten von Anschauen (etwa kontinuierliches versus punktuelles Anschauen) Tendenzen im Hinblick auf die Intensivierung erkennen lassen, zumal im Abschnitt 3 darauf hingewiesen wurde, dass das typische Blickverhalten der sprechenden Person einen ständig wechselnden Blick impliziert und das kontinuierliche Anschauen eigentlich markierter ist als eine Verschiebung des Blicks zum Gegenüber hin. Gleichermaßen ist darauf hinzuweisen, dass weitere Faktoren, die das Blick‐ verhalten und die Gestik beeinflussen könnten, nicht beachtet wurden. Konkret für das Blickverhalten sind dies u. a. die Verteilung des Rederechts (insbesondere turn holding versus turn giving, siehe u. a. Kendon 1967; Stivers/ Rossano 2010) und der Einfluss anderer Handlungen und Ereignisse im Laufe des Gesprächs (dies betrifft aber meistens nur Personen, die gerade nicht sprechen, während in der vorliegenden Studie nur das Blickverhalten der gerade sprechenden Person analysiert wurde). Da es nicht möglich ist, diese unterschiedlichen Einflussfaktoren immer sauber voneinander sowie vom etwaigen Einfluss des Intensivierers zu trennen, lässt sich auch nur schwer sagen, inwiefern das beobachtete Blickverhalten tatsächlich (nur) von der Anwesenheit des Inten‐ sivierers abhängt. Dementsprechend konnten auch nur Vergleiche zwischen Intensivierern vorgenommen werden. Wenn es also heißt, dass bei einem be‐ stimmten Intensivierer das Gegenüber überdurchschnittlich häufig angeschaut wird, so ist dies zu interpretieren als ‚überdurchschnittlich im Vergleich zu den anderen untersuchten Intensivierern‘; ob dies auch impliziert, dass das 86 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="87"?> entsprechende Blickverhalten häufiger vorkommt als in Kontexten ohne Inten‐ sivierung, muss dahingestellt bleiben. Zwar liegt aufgrund der Tatsache, dass vor allem die absoluten Intensivierer ein abweichendes Blickverhalten zeigen, während die anderen Intensivierer ein ziemlich ausgewogenes Blickverhalten aufweisen, die Vermutung nahe, dass die Tendenz zu häufigerem Anschauen mit absoluter Intensivierung auch im Vergleich zu Kontexten ohne Intensivierung Gültigkeit hat, aber das gilt es noch weiter zu untersuchen. Es dürfte somit deutlich sein, dass die multimodale Analyse der Intensivie‐ rung im Deutschen mit dem vorliegenden Beitrag keinesfalls als abgeschlossen gelten kann. Vielmehr handelt es sich nur um eine explorative Studie, die einige Tendenzen und Forschungspisten angedeutet hat und damit einen ersten Schritt zur Schließung dieser Forschungslücke gemacht hat. Wir hoffen aber, gezeigt zu haben, dass dieser Bereich noch viel Forschungspotenzial in sich birgt und auch ein neues Licht auf schon länger kursierende Fragen (etwa zum Verhältnis von Modal- und Steigerungspartikeln) werfen kann. Literatur Androutsopoulos, Jannis K. (1998). Deutsche Jugendsprache: Untersuchungen zu ihren Strukturen und Funktionen. Frankfurt am Main: Peter Lang. Auer, Peter (2006). Construction Grammar meets Conversation: Einige Überlegungen am Beispiel von ‚so‘-Konstruktionen. In: Günthner, Susanne/ Imo, Wolfgang (Hrsg.). Konstruktionen in der Interaktion. Berlin: De Gruyter, 291-314. Autenrieth, Tanja (2002). Heterosemie und Grammatikalisierung bei Modalpartikeln. Tübingen: Max Niemeyer. Beltrama, Andrea (2018). Metalinguistic just and simply: exploring emphatic exclusives. Proceedings of SALT 28, 307-326. Blank, Andreas (1997). Prinzipien des lexikalischen Bedeutungswandels am Beispiel der romanischen Sprachen. Tübingen: Max Niemeyer. Breindl, Eva (2007). Intensitätspartikeln. In: Hoffmann, Ludger (Hrsg.). Handbuch der deutschen Wortarten. Berlin: De Gruyter, 397-422. Brône, Geert/ Oben, Bert (2015). InSight interaction: A multimodal and multifocal dia‐ logue corpus. Language Resources and Evaluation 49 (1), 195-214. Brône, Geert/ Oben, Bert/ Jehoul, Annelies/ Vranjes, Jelena/ Feyaerts, Kurt (2017). Eye gaze and viewpoint in multimodal interaction management. Cognitive Linguistics 28 (3), 449-483. Bross, Fabian (2020). Why do we shake our heads? On the origin of the headshake. Gesture 19 (2-3), 269-298. Multimodale Intensivierung im Deutschen 87 <?page no="88"?> Claudi, Ulrike (2006). Intensifiers of adjectives in German. Sprachtypologie und Univer‐ salienforschung 59 (4), 350-369. Coniglio, Marco (2022). On the adverbial origin of German modal particles. In: Artiagoitia, Xabier/ Elordieta, Arantzazu/ Monforte, Sergio (Hrsg.). Discourse Particles: Syntactic, Semantic, Pragmatic and Historical Aspects. Amsterdam/ Philadelphia: John Benja‐ mins, 13-39. Cosentino, Gianluca (2017). Stress and tones as intensifying operators in German. In: Napoli, Maria/ Ravetto, Miriam (Hrsg.). Exploring Intensification: Synchronic, Dia‐ chronic and Cross-Linguistic Perspectives. Amsterdam/ Philadelphia: John Benjamins, 193-206. Diewald, Gabriele (2007). Abtönungspartikel. In: Hoffmann, Ludger (Hrsg.). Handbuch der deutschen Wortarten. Berlin: De Gruyter, 117-141. Féry, Caroline (2012). Prosody and information structure of the German particles selbst, wieder and auch. In: Borowsky, Toni et al. (Hrsg.). Prosody Matters. London: Equinox, 441-468. Foolen, Ad (2015). Expressives. In: Riemer, Nick (Hrsg.). The Routledge Handbook of Semantics. London: Routledge, 473-490. Foolen, Ad/ Wottrich, Verena/ Zwets, Martine (2016). Gruwelijk interessant: Emotieve intensiveerders in het Nederlands. [unveröffentlichtes Manuskript]. Fricke, Ellen (2012). Grammatik multimodal: Wie Wörter und Gesten zusammenwirken. Berlin: De Gruyter. Goodwin, Charles (1981). Conversational Organization: Interaction between Speakers and Hearers. New York/ London: Academic Press. Graf, Marius (2016). Air Quotes im YouTube-Format ‚Shore, Stein, Papier‘ - Gesprächs‐ analytische Betrachtung einer redebegleitenden Geste. In: Arens, Katja/ Torres Cajo, Sarah (Hrsg.). Sprache und soziale Ordnung. Münster: Monsenstein & Vannerdat, 101-125. Gutzmann, Daniel (2019). The Grammar of Expressivity. Oxford: Oxford University Press. Harrison, Simon Mark (2010). Evidence for node and scope of negation in coverbal gesture. Gesture 10 (1), 29-51. Hirvenkari, Lotta/ Ruusuvuori, Johanna/ Saarinen, Veli-Matti/ Kivioja, Maari/ Peräkylä, Anssi/ Hari, Riitta (2013). Influence of turn-taking in a two-person conversation on the gaze of a viewer. PLoS ONE 8 (8), e71569. https: / / doi.org/ 10.1371/ journal.pone.00 71569 Jehoul, Annelies/ Brône, Geert/ Feyaerts, Kurt (2016). Gaze patterns and fillers. Empirical data on the difference between Dutch ‘euh’ and ‘euhm’. Proceedings of MMSYM 2016. Abrufbar unter: https: / / ep.liu.se/ ecp/ 141/ 007/ ecp17141007.pdf (Stand 04.04.2023). Jing-Schmidt, Zhou (2007). Negativity bias in language: A cognitive-affective model of emotive intensifiers. Cognitive Linguistics 18 (3), 417-443. 88 Steven Schoonjans, Geert Brône, Kurt Feyaerts & Line Winkelmans <?page no="89"?> Kendon, Adam (1967). Some functions of gaze-direction in social interaction. Acta Psychologica 26, 22-63. Kendon, Adam (2002). Some uses of the head shake. Gesture 2 (2), 147-182. Kendon, Adam (2004). Gesture: Visible Action as Utterance. Cambridge: Cambridge University Press. Kendrick, Kobin H./ Holler, Judith (2017). Gaze direction signals response preference in conversation. Research on Language and Social Interaction 50 (1), 12-32. Klein, Henny (1998). Adverbs of Degree in Dutch and Related Languages. Ams‐ terdam/ Philadelphia: John Benjamins. McNeill, David (1992). Hand and Mind: What gestures reveal about thought. Chicago: University of Chicago Press. Mendez-Naya, Belen (2003). On intensifiers and grammaticalization: the case of swīÞe. English Studies 84 (4), 372-391. Pusch, Luise F. (1981). Ganz. In: Weydt, Harald (Hrsg.). Partikeln und Deutschunterricht. Heidelberg: Julius Groos, 31-43. Rinas, Karsten (2011). Übersetzungskritik und Intuition im Rahmen korpusbasierter kontrastiv-lexikalischer Untersuchungen. In: Káňa, Tomáš/ Peloušková, Hana (Hrsg.). Deutsch und Tschechisch im Vergleich. Brno: Masarykova univerzita, 85-99. Schmidt, Jessica (2022). Do intensifiers lose their expressive force over time? A corpus linguistic study. In: Gergel, Remus/ Reich, Ingo/ Speyer, Augustin (Hrsg.). Particles in German, English, and Beyond. Amsterdam/ Philadelphia: John Benjamins, 69-94. Schoonjans, Steven (2018). Modalpartikeln als multimodale Konstruktionen: Eine kor‐ pusbasierte Kookkurrenzanalyse von Modalpartikeln und Gestik im Deutschen. Berlin: De Gruyter. Selting, Margret et al. (2009). Gesprächsanalytisches Transkriptionssystem 2 (GAT2). Gesprächsforschung 10, 353-402. Stivers, Tanya/ Rossano, Federico (2010). Mobilizing Response. Research on Language and Social Interaction 43 (1), 3-31. Stratton, James M. (2020). Adjective intensifiers in German. Journal of Germanic Lingu‐ istics 32 (2), 183-215. ten Buuren, Maaike/ van de Groep, Maria/ Collin, Sebastian/ Klatter, Jetske/ de Hoop, Helen (2018). Facking nice! Een onderzoek naar de intensiteit van intensiveerders. Nederlandse Taalkunde 23 (2), 223-250. Thurmair, Maria (1989). Modalpartikeln und ihre Kombinationen. Tübingen: Max Nie‐ meyer. van Os, Charles (1989). Aspekte der Intensivierung im Deutschen. Tübingen: Gunter Narr. Multimodale Intensivierung im Deutschen 89 <?page no="91"?> Zur multimodalen Markierung von Ironie Eine quantitative Korpusstudie Claudia Lehmann Abstract: The present paper is concerned with multimodal markers of irony in televised discourse. To this end, occurrences of three ironic constructions (i.e. Tell me about it, syntactically independent as if clauses and ironic similes of the form about as X as Y) and their non-ironic counterparts were retrieved from a television archive and analysed regarding their acoustic and visual features. The results show that the total duration of the utterance, missing pauses before and within the utterance and head shakes are significantly more often used with ironic than non-ironic constructions, albeit with low predictive power. The results also show that the predictive power of the features significant for the ironic constructions are higher when each of them is considered independently. This result suggests that the features used to mark irony depend on the construction. Furthermore, the paper argues that quantitative methods are useful assets to qualitative ones, which are still prevalent in traditional strands of pragmatics. Keywords: verbal irony, irony markers, multimodality, constructions, Const‐ ruction Grammar, quantitative analyses 1 Einleitung Seit Grices William James Lectures von 1967, die in Grice (1989) als Monografie veröffentlicht wurden, ist verbale Ironie ein zentraler Untersuchungsgegen‐ stand der Pragmatik. Seitdem beschäftigen sich Pragmatiker: innen auch damit, wie Sprecher: innen Ironie kontextualisieren. Um Ironie als pragmatische Kate‐ gorie von ihren Kontextualisierungshinweisen zu unterscheiden, spricht sich Attardo (2000a) für eine stringente Trennung der Begriffe ‚irony factors‘ (Iro‐ <?page no="92"?> 1 Teilergebnisse dieser Studie wurden bereits in ähnlicher Form an anderer Stelle in englischer Sprache veröffentlicht (Lehmann 2023a, 2023b, 2024). niefaktoren) und ‚irony markers‘ (Ironiesignale) aus. Während Ironiefaktoren notwendige und hinreichende Merkmale sind, um eine Äußerung der Kategorie ‚Ironie‘ zuordnen zu können, sind Ironiesignale solche Merkmale, die weder notwendig noch hinreichend für Ironie sind, den Rezipient: innen aber als Hin‐ weis auf eine ironische Bedeutung dienen. In der gesprochenen Sprache stehen dabei eine Reihe verschiedener Ausdrucksmittel als Ironiesignale zur Debatte: ein spezieller Tonfall (Cutler 1974; Wilson/ Sperber 2012), Augenrollen (Colston 2020), gehobene Augenbrauen (Tabacaru 2019, 2020; Tabacaru/ Lemmens 2014), das Schräghalten des Kopfes (Tabacaru 2019) oder sog. ‚Luftanführungszeichen‘ (Haiman 1990), um nur ein paar zu nennen. Doch bis heute gibt es keinen empirischen Konsens darüber, ob es solche Ironiesignale im engeren Sinne gibt. Der vorliegende Beitrag verfolgt zwei Ziele. Zum einen wird eine Studie vorgestellt, die einen Beitrag zur o. g. Debatte leistet. Der Forschungsüberblick zu Ironiesignalen wird zeigen, dass die bisherigen Studien vor allem auf ex‐ perimentell gewonnenen Ergebnissen beruhen oder auf einer (im Vergleich dazu) kleinen Menge natürlichsprachlicher Daten. An diese Ergebnisse anknüp‐ fend wird die hier vorgestellte Studie auf ein multimodales Fernsehkorpus zurückgreifen, was die Untersuchung großer, nicht unter Laborbedingungen entstandener Daten ermöglicht. Um das Korpus effizient zu nutzen, wurden drei Konstruktionen (im Sinne der Konstruktionsgrammatik, Goldberg 2006: 5 f.) mit ironischer Bedeutung sowie deren nicht ironische Gegenstücke für die Korpus‐ studie ausgewählt. 1 Zum anderen dient der vorliegende Beitrag als Beispiel für eine problem-orientierte Triangulation qualitativer und quantitativer Analysen. Darauf aufbauend wird ein Plädoyer für mehr quantitative Untersuchungen in sowohl der Pragmatik als auch der Multimodalitätsforschung verfasst. Neben diesen Zielen wirft der Beitrag wichtige Fragen für eine multimodale Pragmatik auf. In Anlehnung an Morris (1938) definiert Rühlemann (2019: 6) die Pragmatik als eine Disziplin, die sich mit der Interpretation von Äußerungen im Kontext beschäftigt. Ein wesentlicher Teil des Kontextes ist für Rühlemann (2019: 6 f.) der multimodale Kontext, d. h. „the speaker’s bodily conduct into which the utterance is integrated“. Damit stellt sich die Frage, welche Art von Wissen das Wissen um das körperliche Verhalten von Sprecher: innen ist und in welchem Zusammenhang dieses Wissen zum sprachlichen Wissen steht. Die vorgestellte Studie kann aufgrund ihres Umfangs keine umfassenden Antworten geben, lässt aber Anregungen zu diesen Fragen zu. 92 Claudia Lehmann <?page no="93"?> 2 Ironie und Ironiesignale 2.1 Ironie Der Untersuchungsgegenstand ‚Ironie‘ hat in der Pragmatik viel Aufmerksam‐ keit erfahren. Nicht zuletzt deswegen, sondern auch weil die Hauptargumente des vorliegenden Beitrags empirischer Natur sind, werden nur die zwei inter‐ national am häufigsten rezipierten und diskutierten Ironietheorien vorgestellt: die von Grice (1989) und die von Wilson und Sperber (Sperber/ Wilson 1981; Wilson/ Sperber 1992, 2012). Einen detaillierteren englischsprachigen Überblick zu den verschiedenen Ironietheorien in der Pragmatik bietet Garmendia (2018); zentrale deutschsprachige Referenzen sind beispielsweise Weinrich (1966) und Hartung (1998). Grice (1989) bettet seine Ironietheorie in die Theorie des Kooperationsprin‐ zips und die der Konversationellen Maximen ein. Aus seiner Sicht verletzt die ironische Äußerung das erste Theorem der Qualitätsmaxime („Do not say what you believe to be false“, Grice 1989: 27) und kommuniziert offenkundig eine Implikatur, die das Gegenteil des Gesagten beinhaltet. Später erweitert er diese Ansicht noch um die Bedingung, dass eine ironische Äußerung auch immer ein Gefühl, eine Einstellung oder eine Bewertung des Gesagten impliziert (Grice 1989: 53 f.). Grices Ironietheorie wurde in vielerlei Hinsicht kritisiert, unter anderem aufgrund der Existenz ironischer Äußerungen, die den Überzeugungen der Sprecher: innen entsprechen. Ein viel zitiertes Beispiel ist das folgende: (1) A mother enters her son’s messy room and says, “I love children who keep their rooms clean” (z.-B. Dynel 2017) Es kann angenommen werden, dass die Mutter in dem Beispiel tatsächlich Kinder liebt, die ihr Zimmer sauber halten. Nichtsdestoweniger ist die Aussage in diesem Kontext ironisch. Zwar gibt es durchaus sog. Neo-Gricean approaches (z. B. Attardo 2000b; Dynel 2017), die versuchen, Grices Ansätze einer Ironie‐ theorie auszubauen, durchgesetzt haben diese sich jedoch nicht. Stattdessen wurde die Theorie von Wilson und Sperber (Sperber/ Wilson 1981, Wilson/ Sperber 1992, 2012) positiv rezipiert und kann als die bislang ausgereifteste Ironietheorie angenommen werden. Wilson und Sperber gehen davon aus, dass die ironische Äußerung auf eine Proposition anspielt und die Sprecher: innen sich von dieser Proposition distanzieren. Damit gehört Ironie zum attributiven Sprachgebrauch, d. h. es handelt sich um einen Sprachge‐ brauch, bei dem sich die Sprecher: innen nicht als sie selbst äußern, sondern auf andere Sprecher: innen, Normen und Werte oder auf ein früheres Selbst verweisen. Damit können auch Beispiele wie (1) als ironisch klassifiziert werden: Zur multimodalen Markierung von Ironie 93 <?page no="94"?> Die Mutter verweist mit einer solchen Äußerung auf ihre eignen Werte und distanziert sich gleichzeitig davon, weil dieser Wert mit seiner Erfüllung im Äußerungskontext in Widerspruch steht. Der Hauptkritikpunkt an Wilson und Sperbers Ironietheorie bezieht sich auf die ungenauen Vorhersagen, die die Theorie macht. Wenn Ironie ein attributiver Sprachgebrauch ist, muss die Attribution als solche erkennbar sein und damit muss die ironische Äußerung Ähnlichkeit mit der Ursprungsäußerung haben. Vielfach wurde in diesem Zusammenhang kritisiert, dass alles allem ähnlich sein könnte (z. B. Stanley 2005). Für den vorliegenden Beitrag ist die Ironietheorie von Wilson und Sperber trotz dieser Kritik eine geeignete Theorie, weil er sich mit medial gesprochener Sprache beschäftigt und die Bedeutung (zumindest nicht geskrip‐ teter) gesprochener Sprache Aushandlungsprozessen unterworfen ist (siehe Grundannahmen der Interaktionalen Linguistik, Couper-Kuhlen/ Selting 2017). Damit ist das Erkennen der Ursprungsäußerung einer ironischen Äußerung nur einer unter vielen Aushandlungsprozessen. Das bedeutet auch, dass eine Äußerung nur dann von Außenstehenden als ironisch kategorisiert werden kann, wenn dies aus der Interaktion zwischen den Beteiligten deutlich wird. Dieser Abschnitt zu Ironietheorien erhebt keinerlei Anspruch auf Vollstän‐ digkeit. Er dient lediglich dazu, zu zeigen, dass Ironie ein komplexes Phänomen ist und dass die Theorie von Wilson und Sperber eine geeignete Arbeitsdefini‐ tion für Ironie in der gesprochenen Sprache bietet. Der vorliegende Beitrag ist vorwiegend empirisch und deshalb fällt der Theorieteil notgedrungen knapp aus. Eine detaillierte Einordnung der hier untersuchten Konstruktionen als ironisch finden sich in Lehmann und Bergs (2021) und Lehmann (2021). 2.2 Ironiesignale Wie eingangs erwähnt, muss zwischen Ironiefaktoren und Ironiesignalen un‐ terschieden werden. Ironiefaktoren sind diejenigen notwendigen und hinreich‐ enden Bedingungen, die eine sprachliche Äußerung ironisch machen. Fehlt ein Ironiefaktor, ist die Äußerung nicht ironisch (Attardo 2000a: 6 f.). In der Ironiedefinition von Wilson und Sperber (2012: 123-146) sind demnach der attributive Sprachgebrauch sowie die dissoziative Haltung der Sprecher: in zum Gesagten Ironiefaktoren. Ironiesignale wiederum sind optionale Merkmale einer ironischen Äußerung, die den Rezipient: innen verdeutlichen, dass es sich um eine solche handelt (Attardo 2000a: 6 f.). Ihr Fehlen führt aber nicht zwangs‐ läufig dazu, dass die Ironie nicht als solche erkannt wird. Burgers et al. (2012) fassen die Forschung zu Ironiesignalen in geschriebener Sprache zusammen und führen hierfür Tropen (z. B. Hyperbel), Schemata (z. B. Wiederholung), 94 Claudia Lehmann <?page no="95"?> morphosyntaktische (z. B. Topikalisierung) und typografische Ironiesignale (z. B. Anführungszeichen) an. In (2) findet sich dafür ein Beispiel, das einer Überschrift des Nachrichtensenders CBS News entnommen wurde (CBS News 2015). (2) Ellen DeGeneres hits back against "gay agenda" accusations. Ohne die Anführungszeichen könnte Beispiel (2) ironisch oder nicht ironisch gebraucht werden. Zentral für eine ironische Lesart ist, dass der: die Autor: in die Äußerung in einem Kontext benutzt, aus dem hervorgeht, dass sie attributiv und dissoziativ gebraucht wird. Beides wird aus dem auf die Überschrift folgenden Artikel deutlich: Der Text berichtet über die Reaktion der homosexuellen Mo‐ deratorin Ellen DeGeneres auf Anschuldigungen eines konservativen Pastors, sie würde in ihrer Sendung The Ellen DeGeneres Show eine homosexuelle Agenda verfolgen. Damit ist „gay agenda“ attributiv, da diese Aussage dem Pastor zuge‐ schrieben werden kann. Der Artikel befasst sich vorrangig mit der dissoziativen Reaktion der Moderatorin auf diese Anschuldigungen. Die in der Überschrift verwendeten Anführungszeichen sind für die Interpretation dieser als ironisch nicht zwingend notwendig, helfen dem Leser aber dabei, „gay agenda“ als nicht eigentliche Verwendung des Begriffs zu erkennen und ermöglichen so eine Rezeption der Überschrift selbst als (möglicherweise) ironisch. Da der vorliegende Beitrag sich mit gesprochener Sprache beschäftigt, wird in den folgenden Abschnitten der bisherige Erkenntnisstand zu akustischen und visuellen Merkmalen von Ironie zusammengefasst. 2.2.1 Akustische Ironiesignale Die Existenz eines spezifisch ironischen Tonfalls ist umstritten und die lingu‐ istisch informierte Diskussion dazu geht - genauso wie die pragmatische Erfassung des Begriffs ‚Ironie‘ selbst - auf Grice (1989) zurück. Grice (1989) bezweifelt, dass es einen spezifisch ironischen Tonfall gibt, und geht stattdessen davon aus, dass Ironie von verschiedenen optionalen Tonfällen begleitet werden kann. Diese würden dazu dienen, das Gefühl, die Einstellung oder die Bewer‐ tung, die aus Grices Sicht für Ironie konstitutiv sind, zum Ausdruck zu bringen. Wilson und Sperber (2012) hingegen gehen davon aus, dass es lediglich einen (optionalen) Tonfall gibt, der die dissoziative Einstellung der Sprecher: innen zum Gesagten zeigt. Beide Ansichten haben also gemeinsam, dass sie davon ausgehen, dass der Tonfall, der bei der ironischen Äußerung verwendet werden kann, die Haltung der Sprecher: innen anzeigt. Beide unterscheiden sich jedoch in der Annahme, ob es einen spezifisch ironischen Tonfall oder ob es verschie‐ dene haltungsspezifische Tonfälle gibt. Zur multimodalen Markierung von Ironie 95 <?page no="96"?> Es gibt eine Vielzahl empirischer Untersuchungen zum ironischen Tonfall, die jedoch kein einheitliches Bild zeichnen. Das scheint u. a. daran zu liegen, dass dieser, sofern es ihn gibt, sprachspezifisch ist (Cheang/ Pell 2009, 2011). Da sich die folgende Studie mit (amerikanischem) Englisch befasst, wird auch der weitere Forschungsüberblick nur Studien zusammenfassen, die Englisch als Objektsprache untersucht haben. Andere Sprachen, die bisher untersucht wurden, sind Deutsch (Nauke/ Braun 2011; Braun/ Schmiedel 2018), Italienisch (Anolli et al. 2000, 2002) und Kantonesisch (Cheang/ Pell 2009, 2011), diese können hier aber leider nicht berücksichtigt werden. Für die englische Sprache scheint sich ironisches von nicht ironischem Sprechen vor allem durch ein langsames Sprechtempo abzugrenzen (Rockwell 2000; Cheang/ Pell 2008; Bryant 2010; Chen/ Boves 2018; Mauchand et al. 2018). Andere Ergebnisse sind weniger eindeutig. Manche Studien berichten über eine tiefere Stimmlage (Cheang/ Pell 2008; Rockwell 2000; Mauchand et al. 2018), andere wiederum über eine höhere Stimmlage (Rockwell 2007; Bryant/ Fox Tree 2005; Castro et al. 2019). Ähnliches gilt für die Stimmvariation. Während einige Studien kaum Tonhöhenvariation feststellen (Cheang/ Pell 2008; Chen/ Boves 2018; Mauchand et al. 2018), findet Rockwell (2007) signifikant mehr Variation und einige Studien berichten sogar von gemischten Ergebnissen innerhalb derselben Studie (Cheang/ Pell 2008; Bryant 2010). Darüber hinaus gibt es weitere Einzelergebnisse. Diese legen nahe, dass die ironische Sprechweise lauter (Rockwell 2000) ist, aber nicht in der Lautstärke variiert (Bryant/ Fox Tree 2005) und weniger Pausen beinhaltet (Rockwell 2007). Die Gründe für die diffuse Ergebnislage innerhalb der englischen Sprache sind vielfältig. Einer davon ist die Funktion der Äußerung. Der Begriff ‚Ironie‘ ist ein Hyperonym, der (mindestens) zwei Unterarten kennt: (humorvolle) Ironie und (aggressiven) Sarkasmus (Gibbs 2000; Bryant/ Fox Tree 2005). Es gibt zahlreiche Studien, die zeigen, dass diese Unterarten auch akustisch anders realisiert werden (Anolli et al. 2002; Cheang/ Pell 2008; Mauchand et al. 2018). Darüber hinaus scheinen auch geschlechtsspezifische (Chen/ Boves 2018) und vom individuellen Sprecher abhängige Unterschiede (Gent 2019) eine Rolle zu spielen. Neben diesen externen Gründen gibt es vermutlich auch studien-in‐ terne Gründe, die mit der Datengrundlage zusammenhängen. Rockwell (2000) berichtet von Unterschieden zwischen geskripteten und nicht geskripteten Äußerungen. Diese Beobachtung könnte auch erklären, warum experimentell gewonnene Ergebnisse von anderen abweichen. 96 Claudia Lehmann <?page no="97"?> 2.2.2 Visuelle Ironiesignale Die Ergebnislage zu mimischen und gestischen Ironiesignalen ist ähnlich wi‐ dersprüchlich. Attardo et al. (2003) beispielsweise finden keine besonderen Signale bei der Untersuchung ihres TV Korpus, viele der Teilnehmer: innen an dieser Studie erwähnen jedoch ein ausdrucksloses Gesicht („blank face“) als Anzeichen für Ironie. Dies steht im Gegensatz zu vielen anderen Ergebnissen. So beobachtet Tabacaru (Tabacaru 2019, 2020; Tabacaru/ Lemmens 2014) gehobene Augenbrauen und Stirnrunzeln als Ironiesignal, sowohl in geskripteten als auch nicht geskripteten Daten. Darüber hinaus werden häufiges Blinzeln (Kreuz 2020), das Zusammenpressen der Lippen, Lächeln oder Lachen (Caucci/ Kreuz 2012) vereinzelt erwähnt. Auch das Blickverhalten im Zusammenhang mit Ironie ist bisher kontrovers diskutiert worden. Während Caucci und Kreuz (2012) Blicke zum Konversationspartner beobachten, weist Colston (2020) Blick‐ vermeidung nach. Außerdem scheinen Kopfbewegungen wie Nicken (Tabacaru 2019; Caucci/ Kreuz 2012) und Schräghalten (Tabacaru 2019) Ironie zu markieren. Was bei der Untersuchung von visuellen Ironiesignalen besonders deutlich wird, ist die qualitative Orientierung der Studien. Mit Ausnahme von Colston (2020) basieren die hier zusammengefassten Studien auf Korpusdaten, die die Markierung von Ironie mit den visuellen Signalen der vorangegangenen Äu‐ ßerung verglichen haben. Anhand dieser Veränderungen in der Kopf- und Ge‐ sichtspartie sowie im Blickverhalten wurden Rückschlüsse auf die Markierung von Ironie gezogen. Diese Herangehensweise ist intuitiv einleuchtend, da sie die Perspektive der Rezipient: in widerspiegelt. Trotzdem birgt sie die Gefahr der Übergeneralisierung. Denn wenn mithilfe dieser Methode ein visuelles Signal identifiziert werden kann, das häufig mit ironischen Äußerungen einhergeht, so kann noch nicht darauf geschlossen werden, dass es sich tatsächlich um ein Ironiesignal (im engeren Sinne) handelt, weil diese Methode nicht zeigt, welche nicht ironischen Äußerungen ebenfalls mit diesem Signal einhergehen. Mit anderen Worten: Es fehlt bislang die Möglichkeit festzustellen, welche der o. g. Signale exklusiv Ironie (bzw. Humor) markieren. Die im folgenden vorge‐ stellte Studie wird eine Möglichkeit zeigen, zur Erforschung dieses Desiderates beizutragen. 3 Die Studie Die oben zusammengefassten Studien beruhen entweder auf experimentellen Daten oder auf Korpusdaten. Die erste Art von Daten hat den Nachteil, dass sie unter Laborbedingungen entstanden sind, und zumeist mit von den Studi‐ enleiter: innen erdachten und manipulierten Stimuli arbeiten. Das ist insofern Zur multimodalen Markierung von Ironie 97 <?page no="98"?> problematisch, als dass die Studie von Rockwell (2000) nahelegt, dass sich zumindest die akustischen Ironiesignale von geskripteter Ironie von den akusti‐ schen Ironiesignalen nicht geskripteter Ironie unterscheiden könnte. Die zweite Art von Daten ist zwar unter weniger restriktiven Bedingungen entstanden, die Ergebnisse beruhen aber oft auf einer (vergleichsweise) kleinen Datenmenge. Die im folgenden vorgestellte Studie wird sich eines Korpus bedienen, das es erlaubt, multimodale Signale von Ironie in Fernsehdaten (verschiedener Genres) auf größerer Ebene zu untersuchen. Im Unterschied zu qualitativen Untersuchungen lässt eine quantitative Untersuchung von (vermeintlichen) Ironiesignalen Beobachtungen zur Häufigkeit dieser im Vergleich zu nicht ironischen Äußerungen zu. Darüber hinaus können mithilfe inferenzieller statistischer Verfahren Schlussfolgerungen gezogen werden, ab wann ein Signal überzufällig häufig mit ironischen Konstruktionen gebraucht wird, sodass dieses Signal als Ironiesignal im engeren Sinne angenommen werden kann. 3.1 Das Korpus Die Studie beruht auf dem Archiv und der Infrastruktur, die durch das Distri‐ buted Little Red Hen Lab, geleitet von Francis Steen und Mark Turner, zur Verfügung gestellt werden. Das genutzte Archiv ist die NewsScape Library of International Television News (Steen/ Turner 2013), das internationale Fern‐ sehdaten archiviert. Diese Fernsehdaten umfassen die Nachrichten, politische Debatten, Talk Shows, Werbespots sowie Ausschnitte aus Serien und Filmen. Der englischsprachige Anteil dieser Daten umfasst mittlerweile mehr als 3 Milliarden Wörter. Dank der mitarchivierten Transkriptionen dieser Daten ist es möglich, diese zu durchsuchen. 3.2 Die Konstruktionen und die Korpusrecherche Die NewsScape Library ist nicht nach pragmatischen Gesichtspunkten annotiert, sodass nicht direkt nach ironischen Äußerungen gesucht werden kann. Statt‐ dessen hat sich die Studie ironischer Konstruktionen bedient, d. h. linguistischer Formen, die für gewöhnlich eine ironische Bedeutung haben (siehe Lehmann 2021; Lehmann/ Bergs 2021). Die Konstruktionen wurden vor allem nach prag‐ matischen Gesichtspunkten gewählt: 1) Sie müssen hinreichend formal verfes‐ tigt sein, um relativ einfach im Korpus gesucht werden zu können, 2) sie müssen ein formal ähnliches, nicht ironisches Gegenstück haben, das zum Vergleich herangezogen werden kann und 3) beide, d. h. die ironische Konstruktion und ihr Gegenstück müssen hinreichend häufig im Korpus vorkommen, um die 98 Claudia Lehmann <?page no="99"?> 2 Die an dieser Stelle verwendeten Beispiele wurden orthografisch angepasst, um ihre syntaktischen und pragmatischen Eigenschaften beschreiben zu können. Da (Geschlechts-)Identität der Sprecher: innen in diesen Beispielen bekannt ist, wird dem auch sprachlich Rechnung getragen. quantitative Auswertung zu ermöglichen. Die verwendeten Konstruktionen und ihre Gegenstücke sind in den folgenden Beispielen aus der NewsScape Library veranschaulicht. 2 Die Beispiele (3a), (4a) und (5a) zeigen jeweils ein Beispiel für die nicht ironische Konstruktion, wohingegen die Beispiele (3b), (4b) und (5b) Beispiele für die ironischen Konstruktionen zeigen. (3) a A: Your book does take people behind the scenes. Tell me about it. B: Well, first of all, it’s not a memoir. - b A: You have to find a man who’s like a tennis ball. B: Tell me about it. (audience laughs). A: In the movie, Steve Carell’s character suffers a terrible attack. (4) a Justice Ginsburg’s not passed away less than 48 hours ago, but it seems as if this is moving very fast and we could have a nominee very soon. - b He said “Don’t let it dominate you”. As if that were a choice for a coronavirus patient. (5) a The heart is the engine of the human body, about as big as your fist. - b It’s about as exciting as watching paint dry. Beispiel (3a) wurde einem Interview entnommen. Der Interviewer (A) führt zunächst einen Referenten ein (your book) und fordert daraufhin den Adressaten mit den Worten Tell me about it dazu auf, mehr über dieses Buch zu erzählen. Diese Verwendung von Tell me about it ist nicht ironisch und wird auch als solches aufgefasst, da Sprecher B zu einem längeren Bericht über das Buch ausholt. In diesem Beispiel sowie in den meisten anderen untersuchten Fällen führt nicht ironisches Tell me about it zu einem Sprecherwechsel. In Beispiel (3b) hingegen gibt Sprecher A einen Rat (You have to find a man who’s like a tennis ball), der eine (offensichtlich generische) Kritik an Männern beinhaltet. Sprecherin B solidarisiert sich mit dieser Kritik mit den Worten Tell me about it. Dieser Gebrauch ist ironisch, da die Sprecherin (B) scheinbar als jemand spricht, der mehr Informationen zu diesem Thema möchte, dies streng genommen aber nicht tut. Stattdessen stimmt Sprecherin (B) der von Sprecher (A) geäußerten generischen Kritik zu und suggeriert, dass sie ebenfalls Wissen darüber ver‐ fügt. Das wird auch dadurch deutlich, dass die anwesenden Zuschauer: innen lachen und Sprecher A daraufhin das Interview in eine andere Richtung lenkt. Gleichzeitig wird eine dissoziative Haltung zum Ausdruck gebracht: Es ist nicht notwendig, mehr zu diesem Thema zu sagen, weil die Sprecherin mit Tell me Zur multimodalen Markierung von Ironie 99 <?page no="100"?> about it andeutet, bereits ausreichend eigene Erfahrungen gemacht zu haben. Da Tell me about it keine Variation des Verbs oder der Pronomen in den o. g. Kontexten zulässt, konnte ohne weiteres nach beiden Konstruktionen im o. g. Korpus gesucht werden. In Beispiel (4a) geht der Sprecher auf die Tatsache ein, dass eine Richterin des Obersten Gerichtshofes der USA, Ruth Bader Ginsburg, vor weniger als 48 Stunden gestorben ist und trotzdem ihre Neubesetzung am Obersten Ge‐ richtshof der USA schnell voranzugehen scheint. Diese Vermutung äußert er mit dem Matrixsatz it seems, gefolgt von einem Nebensatz eingeleitet durch as if. Diese Art von Nebensatz ist im Regelfall nicht ironisch und führt eine Möglichkeit ein. In Beispiel (4b) hingegen zitiert der Sprecher zunächst den zu dem Zeitpunkt amtierenden Präsidenten der USA, Donald Trump, zum Co‐ ronavirus (Don’t let it dominate you). Der Sprecher distanziert sich im Folgenden vom Inhalt dieses Zitats, indem er Donald Trump die Annahme zuschreibt, dass Patient: innen diesbezüglich eine Wahl hätten, und distanziert sich gleich‐ zeitig von einer solchen Annahme. Diese Distanzierung wird mithilfe eines syntaktisch unabhängigen, durch as if eingeleiteten, Nebensatzes realisiert, der die Annahme als (abwegige) Möglichkeit verwirft. Diese Art von as if Sätzen sind recht häufig im amerikanischen Englisch und haben signifikant häufig eine ironische Bedeutung (siehe Lehmann und Bergs 2021). Da die genutzte Suchmaschine in der NewsScape Library keine Interpunktion zulässt, musste die Suche auf as if this und as if that beschränkt werden, da Lehmann und Bergs (2021) zeigen konnten, dass syntaktisch abhängige as if Sätze mit dem proxi‐ malen Demonstrativpronomen assoziiert sind und syntaktisch unabhängige as if Sätze mit dem distalen Demonstrativpronomen. Diese Vorgehensweise hat es ermöglicht, zielgerichteter syntaktisch unabhängige as if Sätze im Korpus zu finden. Die dritte Konstruktion, die in der Studie verwendet wurde, ist about as X as Y. Beispiel (5a) zeigt ihre nicht ironische Verwendung. Der Sprecher beschreibt das menschliche Herz und vergleicht es in seiner Größe mit einer Faust. Beispiel (5b) verdeutlicht die ironische Verwendung. Hier vergleicht der Sprecher ein Ereignis in seiner Spannung damit, Farbe beim Trocknen zuzusehen. Das ist ironisch, da dieser Vorgang nicht spannend ist und der Sprecher sich von der Annahme, das Vergleichsereignis sei spannend, distanziert. Lehmann (2021) hat gezeigt, dass die Konstruktionen mit der Wahl des Adjektivs im X Slot assoziiert sind. Die nicht ironische Konstruktion bevorzugt Adjektive, die physische Eigenschaften beschreiben (wie close und big), und solche, die eine Bewertung geben, die eher auf dem Mittelpunkt der Skala zu finden ist (good und bad). Die ironische Konstruktion hingegen bevorzugt Adjektive, die eine stärkere und 100 Claudia Lehmann <?page no="101"?> präzisere Bewertung ausdrücken, z. B. useful, popular, likely und interesting. Da die genutzte Suchmaschine in der NewsScape Library keine Wildcards zulässt, wurden bei der Suche für die hier vorgestellte Studie die Adjektive aus Lehmann (2021) verwendet. Genauer gesagt wurden für die nicht ironische Konstruktion die fünf Adjektive close, easy, good, big und bad verwendet und für die ironische Konstruktion wurden eine Vielzahl von Adjektiven verwendet, darunter likely, exciting, useful, subtle und interesting. Neben den o. g. Einschränkungen wurde die Suche weiter verfeinert. So wurden alle Duplikate (v. a. Werbespots) entfernt. Darüber hinaus wurden Be‐ obachtungen ausgeschlossen, bei denen mehrere Sprecher: innen überlappend gesprochen haben oder laute Hintergrundgeräusche vorhanden waren, die eine saubere akustische Analyse unmöglich gemacht hätten. Außerdem wurden nur Beobachtungen ausgewählt, bei denen das Gesicht der Sprecher: innen deutlich zu sehen ist, um eine verlässliche Analyse visueller Signale zu gewährleisten. Da die bisherige Forschung zu Ironiesignalen händischen Gesten keine Bedeutung beimessen, wurde auf diese Analyse verzichtet, sodass auch Beobachtungen verwendet werden konnten, bei denen die Hände der Sprecher: innen nicht zu sehen waren. Zu guter Letzt wurden alle Beobachtungen, unabhängig von der Konstruktion, als ironisch oder nicht ironisch, basierend auf der Definition von Wilson und Sperber (2012), klassifiziert, um die Validität des Vorgehens zu überprüfen. Die von Wilson und Sperber genannten Ironiefaktoren der Attribution und Dissoziation wurden für die untersuchten Konstruktionen un‐ terschiedlich überprüft. Während bei about as X as Y die (fehlende) semantische Kongruenz zwischen dem Adjektiv und der Phrase im Y Slot in den meisten Fällen ausreichend war, so beruht die Kategorisierung bei Tell me about it und der as if Sätze weitestgehend auf dem sequenziellen Kontext. Wie bereits oben beschrieben, ist der sequenzielle Kontext von ironischem Tell me about it recht schematisch: Ein: e Sprecher: in A evaluiert eine Entität woraufhin Sprecher: in B mit Tell me about it diese Evaluation bekräftigt. Sprecher: in A oder auch Dritte reagieren darauf meist mit Lächeln oder Lachen. Entscheidend bei der Katego‐ risierung von Tell me about it sind also die vorangegangene und die folgenden (sprachlichen) Handlungen. Ähnliches gilt für die as if Sätze. Auch hier spielen die vorangegangenen Äußerungen eine zentrale Rolle bei der Klassifizierung als ironisch oder nicht ironisch. Um als ironisch klassifiziert zu werden, muss der as if Satz sich auf eine vorangegangene (sprachliche) Handlung eines Dritten beziehen und diese (meist negativ) bewerten. Die (negative) Bewertung wurde mithilfe semantischer und syntaktischer Kriterien (z. B. Tempus) vorgenommen. Um eine ungewollte Beeinflussung dieser Kategorisierung durch akustische und visuelle Signale zu vermeiden, wurde diese Kategorisierung ausschließlich Zur multimodalen Markierung von Ironie 101 <?page no="102"?> 3 Diese Zahl bezieht sich auf die Gesamtzahl der aus dem Korpus entnommenen Be‐ obachtungen. Manche der Beobachtungen ließen keine vollständige Analyse zu und fließen deshalb nicht in alle Untersuchungen ein. Wenn die Sprecher: in beispielsweise eine Sonnenbrille getragen hat, konnten weder Bewegungen in der Augenpartie noch das Blickverhalten analysiert werden. Diese Fälle wurden in Modellen, die das Blick‐ verhalten oder Bewegungen in der Augenpartie berücksichtigen, nicht aufgenommen, in anderen Modellen aber schon. Insofern kann es zu Abweichungen in der Zahl der untersuchten Fälle kommen. auf der Grundlage der durch die NewsScape Library zur Verfügung gestellten Transkripte vorgenommen. Fälle, die nicht eindeutig kategorisiert werden konnten, wurden aus dem Datensatz entfernt. Dies resultierte in einer Gesamtzahl von 1363 Beobachtungen, 3 die sich wie folgt verteilen: - Konstruktion - About as X as Y As if Tell me about it - Iro‐ nisch Nicht iro‐ nisch Iro‐ nisch Nicht iro‐ nisch Iro‐ nisch Nicht iro‐ nisch ge‐ samt Interpre‐ tation Ironisch 143 5 172 37 151 0 508 Nicht ironisch 52 189 8 375 0 231 855 gesamt 195 194 180 412 151 231 1363 Tab. 1: Frequenzen der gewählten Konstruktionen und ihrer Interpretation Tab. 1 zeigt, dass die formalen Auswahlkriterien für Tell me about it am erfolgreichsten waren, weil bei beiden Konstruktionen die mit der Konstruktion prototypisch assoziierte Bedeutung (Ironie) mit der Bedeutung im situativen Kontext in jedem Fall übereinstimmt. Das ist bei den anderen Konstruktionen nicht der Fall. Zwar ist die mit der Konstruktion assoziierte Funktion jeweils deutlich frequenter, trotzdem gibt es für jede Konstruktion Ausnahmen im jeweiligen Kontext. Wenn man jedoch davon ausgeht, dass Konstruktionen Prototypenstruktur aufweisen (Gries 2003), dann liegen die in Tab. 1 beobach‐ teten Verteilungen im Rahmen des Erwartbaren. 102 Claudia Lehmann <?page no="103"?> 3.3 Annotationen und akustische Analysen Neben der Konstruktion und Interpretation wurden auch eine Reihe weiterer kontextueller, akustischer und visueller Annotationen vorgenommen. Die akus‐ tischen Variablen wurden mit Praat (Boersma/ Weenink 2019) gemessen und die visuellen Variablen wurden mit ELAN (The Language Archive 2022) annotiert. Tab. 2 fasst die untersuchten Variablen und die verwendeten Kürzel zusammen. Konstruktionsäbhängige Variablen Variable (Abkürzung) Werte (Abkürzung) Konstruktion (CXN) About as X as Y - ironisch (about (iro‐ nisch)), about as X as Y - nicht ironisch (about (nicht ironisch)), ironische as if Sätze (as if (ironisch)), nicht ironische as if Sätze (as if (nicht ironisch)), ironisches Tell me about it (TMAI (ironisch)), nicht ironisches Tell me about it (TMAI (nicht ironisch)) Interpretation Ironisch (ironic), nicht ironisch (non‐ ironic) - Kontextuelle Variablen Variable Werte Interaktionstyp geskriptet, monologisch, Videoanruf, face-to-face Sprecher: in (SPEAKER) Adrian Arambulo, Alex Trebek, …, Will Cain - Akustische Variablen Variable Einheit Dauer (duration) Millisekunden (ms) Sprechtempo (rate) Silben pro Sekunde (σ/ s) Pause vor Äußerung (P1) Millisekunden (ms) Pause innerhalb der Äußerung (P2) Millisekunden (ms) Pause nach der Äußerung (P3) Millisekunden (ms) Tonhöhe (pitch) Hertz (Hz) Zur multimodalen Markierung von Ironie 103 <?page no="104"?> Standardabweichung (SD) Hertz (Hz) Tonumfang (range) Hertz (Hz) - - Visuelle Variablen - Variable Wert Blickverhalten (Gaze) zur Kamera, zum Rezipienten, zum Pub‐ likum, anderswo Kopfbewegung (Head) nicken, schütteln, Schräghalten, zur Seite drehen, andere, keine Bewegung der Augenbrauenpartie (Eye‐ brows) gehoben, runzeln, Kombination, andere, keine Bewegung der Augenpartie (Eyes) Wangen gehoben, geschlossen, oberes Lid gehoben, andere, keine Bewegung der Mundpartie (mouth) Lächeln, zusammengepresste Lippen, an‐ dere, keine blinzeln (blinking_rate) Blinzeln pro Sekunde Tab. 2: Überblick über die in der Studie annotierten Variablen und deren Werte Da der Forschungsüberblick zum ironischen Tonfall einen großen Einfluss des Interaktionstyps und der Sprecher: innen auf die Wahl und Ausprägung der Ironiemerkmale nahelegt, wurden diese zwei Variablen annotiert. Bei der Vari‐ able INTERAKTIONSTYP wurde zwischen geskripteten Interaktionen (Filme, Serien, Werbespots), Monologen (Nachrichten, Comedyprogramm), Videotele‐ fonaten (v. a. Interviews) und Face-to-Face Interaktionen (Interviews, Debatten, Diskussionen, Straßenumfragen) unterschieden. Für die Variable SPRECHER: IN wurden die jeweiligen Sprecher: innen identifiziert. Das verwendete Archiv liefert leider nur selten Sprecher: innenannotationen, weshalb der Großteil manuell identifiziert werden musste. Wenn eine Identifikation unmöglich war, wurde der Wert ‚anonymous‘ eingesetzt und durchgehend nummeriert. Für die akustische Messung wurden die Dauer der Äußerung, das Sprech‐ tempo, die mittlere Tonhöhe, die Standardabweichung von der mittleren Ton‐ höhe und der Tonumfang (maximale minus minimale Tonhöhe) der Äußerung gemessen. Da es sich bei den Daten um Äußerungen handelt, die zu Unterhal‐ tungs- und nicht zu Forschungszwecken produziert wurden, entspricht die Qualität dieser nicht denen, die unter Laborbedingungen entstanden sind. Des‐ halb wurde darauf verzichtet, Lautstärke und Lautstärkevariation zu messen, da 104 Claudia Lehmann <?page no="105"?> 4 Der Datensatz sowie das R-Skript sind über folgendes Repositorium zugänglich: https : / / osf.io/ 37pr5/ ? view_only=5b0d24f5e40d4fef9f7ded7888e1e783. diese nicht zuverlässig gemessen werden können. Darüber hinaus wurden bei Praat die Einstellungen zum Messen der Tonhöhe für jed: e Sprecher: in einzeln angepasst. Falls trotz dieser Anpassung noch ungewöhnliche Tonhöhensprünge gemessen wurden, aber nicht hörbar waren, wurde der Wert ‚NA‘ eingetragen. Zur Ermittlung des Sprechtempos wurde die Anzahl der Silben der Äußerung durch die Dauer der Äußerung geteilt. Bei den visuellen Variablen wurden die Blickrichtung, Kopfbewegung sowie Bewegungen der Augenbrauen-, Augen- und Mundpartie annotiert. Die Blick‐ richtung kann in einem solchen Setting nicht so zuverlässig wie bei Eyetra‐ cking-Studien annotiert werden. Stattdessen wurde die Perspektive der Fernseh‐ zuschauer: innen eingenommen und die (grobe) Blickrichtung der Sprecher: in als ‚zur Kamera‘, ‚zum Rezipienten‘, ‚zum Publikum‘ oder ‚anderswo‘ kategori‐ siert. Bei den anderen Variablen wurden die vorherigen Studien zu visuellen Signalen modellhaft herangezogen. Bei den Kopfbewegungen wurde ‚nicken‘, ‚schütteln‘, ‚Schräghalten‘, ‚zur Seite drehen‘, ‚andere‘ und ‚keine‘ annotiert. Bei den Bewegungen der Augenbrauenpartie wurde ‚gehoben‘, ‚runzeln‘, ‚Kombi‐ nation‘ (aus gehobenen Augenbrauen und Runzeln), ‚andere‘ und ‚keine‘ anno‐ tiert. Bei den Bewegungen der Augenpartie wurde annotiert, ob die ‚Wangen gehoben‘ wurden, um ein Duchenne-Lächeln (sog. „echtes“ Lächeln) von einem „falschen“ Lächeln zu unterscheiden. Außerdem wurden die Bewegungen der Augenpartie noch mit ‚geschlossen‘, ‚oberes Augenlid gehoben‘, ‚andere‘ und ‚keine‘ annotiert; die ersten beiden Kategorien, weil sie nach einer detaillierteren Pilotphase relativ häufig zu sein schienen. Die Bewegungen der Mundpartie wurden als ‚Lächeln‘ (oder Lachen), ‚zusammengepresste Lippen‘, ‚andere‘ oder ‚keine‘ annotiert. 3.4 Statistische Auswertung Die statistische Auswertung der Daten erfolgte mit dem Programm R, Version 4.2.1 (R Core Team 2022). 4 In Vorbereitung zur Auswertung wurden die akus‐ tischen Variablen DAUER und SPRECHTEMPO sowie die Pausen mithilfe der scale Funktion zentriert und skaliert. Die Variablen TONHÖHE, SPRECH‐ TEMPO und TONUMFANG wurden mithilfe der HzToSemitones Funktion aus dem soundgen Paket, Version 2.5.2 (Anikin 2022), in Halbtöne umgewandelt. Mithilfe der glmer Funktion aus dem lme4 Paket (Bates et al. 2015) wurde zunächst ein generalized linear mixed effects model angepasst, mit INTERPRE‐ Zur multimodalen Markierung von Ironie 105 <?page no="106"?> 5 Das Akaike Informations Kriterium (AIC) ist ein Maß für die Modellgüte. Je kleiner der Wert, desto besser das Modell. TATION als abhängiger Variable und KONSTRUKTION, SPRECHER: IN und INTERAKTIONSTYP als random effects, da alle drei Variablen signifikante Nullmodelle aufwiesen. Die anderen, akustischen und visuellen, Variablen wurden dann, eine nach der anderen, dem Modell als fixed effects hinzugefügt. Die hinzugefügten Variablen wurden nur dann im Modell behalten, wenn sie den AIC verbessern. 5 Da viele der komplexeren Modelle zu Konvergenzprob‐ lemen geführt haben, wurden die einfacheren Modelle genauer analysiert und daraufhin die Variablen BLICKVERHALTEN, KOPFBEWEGUNG, BEWEGUNG DER AUGENBRAUENPARTIE, BEWEGUNG DER AUGENPARTIE und BEWE‐ GUNG DER MUNDPARTIE in mehrere logische (true-false) Variablen rekodiert. Außerdem wurde für jede Konstruktion ein Modell mit gleicher Vorgehensweise angepasst. Die Modelle wurden anschließend mithilfe der summ Funktion aus dem jtools Paket (Long 2022) zusammengefasst und mit der plot_model Funktion aus dem sjPlot Paket (Lüdecke 2023) visualisiert. 4 Ergebnisse Das angepasste Modell für Ironie ist in Tab. 3 zusammengefasst. Model Info: Observations: 1136 Dependent variable: INTERPRETATION (ironic) Type: mixed effects generalized linear regression Error distribution: binomial Link function: logit - Model fit: AIC = 533.82, BIC = 574.10 Pseudo-R² (fixed effects) = 0.02 Pseudo-R² (total) = 0.90 - 106 Claudia Lehmann <?page no="107"?> Fixed effects: - Est. S.E. z val. p (intercept) -0.55 2.20 -0.25 0.80 DURATION 0.66 0.16 4.12 0.00* P1 -0.27 0.11 -2.45 0.01* P2 -0.37 0.13 -2.79 0.01* HEAD SHAKE 1.00 0.34 2.98 0.00* - Random effects group parameter Std. Dev. Variance SPEAKER (intercept) 0.66 0.43 CXN (intercept) 5.27 27.78 INTERACTION TYPE (intercept) 0.34 0.12 - Grouping variables Group # groups ICC SPEAKER 642 0.01 CXN 6 0.88 INTERACTION TYPE 4 0.00 Tab. 3: Zusammenfassung des Modells für Ironie vs Nicht-Ironie (signifikante Effekte (p-< 0.05) sind mit * gekennzeichnet) Zur multimodalen Markierung von Ironie 107 <?page no="108"?> Abb. 1 zeigt die Odds ratios und deren Konfidenzintervalle für das angepasste Modell. Abb. 1: Odds ratios und Konfidenzintervalle für die im Modell signifikanten Variablen Tab. 3 zeigt, dass Ironie, unabhängig von dem: r Sprecher: in, der Konstruktion und dem Interaktionstyp, durch die Dauer der Äußerung markiert wird. Ge‐ nauer gesagt, sind die untersuchten ironischen Äußerungen länger als die nicht ironischen Äußerungen, das Sprechtempo ist aber nicht signifikant anders. Darüber hinaus machen die Sprecher: innen ironischer Äußerungen seltener Pausen vor und während der ironischen Äußerung und tendieren zum Schütteln des Kopfes. Trotz dieser signifikanten Ergebnisse ist das Modell zwar insgesamt (mit einem Pseudo-R² von 0.90) aussagekräftig, aber die Ironiesignale (mit einem pseudo R² Wert von 0.02 für die fixed effects) spielen dabei nur eine geringe Rolle. Gleichzeitig zeigt die im Vergleich zu INTERAKTIONSTYP und SPRECHER: IN hohe Varianz für KONSTRUKTION an, dass die Wahl der Konstruktion einen hohen Einfluss auf die Wahl der Ironiesignale hat, weshalb eigene Modelle für diese berechnet wurden. 108 Claudia Lehmann <?page no="109"?> Die Ergebnisse für Tell me about it sind in Tab. 4 zusammengefasst. Model Info: Observations: 368 Dependent variable: INTERPRETATION (ironic) Type: mixed effects generalized linear regression Error distribution: binomial Link function: logit - Model fit: AIC = 295.32, BIC = 322.67 Pseudo-R² (fixed effects) = 0.27 Pseudo-R² (total) = 0.97 - Fixed effects: - Est. S.E. z val. p (intercept) 17.86 6.63 2.69 0.01* DURATION 19.19 5.85 3.28 0.00* GAZE (elsewhere) 5.35 1.49 3.58 0.00* EYEBROWS (raised) 7.81 2.09 3.74 0.00* MOUTH (smile) 4.11 1.37 3.00 0.00* - Random effects group parameter Std. Dev. Variance SPEAKER (intercept) 6.86 47.08 INTERACTION TYPE (intercept) 5.82 33.92 - Zur multimodalen Markierung von Ironie 109 <?page no="110"?> Grouping variables Group # groups ICC SPEAKER 214 0.56 INTERACTION TYPE 4 0.40 Tab. 4: Zusammenfassung des Modells für ironisches vs. nicht ironisches Tell me about it (signifikante Effekte (p-< 0.05) sind mit * gekennzeichnet) Die Odds ratios und deren Konfidenzintervalle für das Modell zu Tell me about it sind in Abb. 2 dargestellt. Abb. 2: Odds ratios und Konfidenzintervalle zu den Elementen des Modells für Tell me about it Tab. 4 zeigt, dass ironisches Tell me about it länger als nicht ironisches Tell me about it ist. Genau genommen waren beide Variablen, Länge der Äußerung (DURATION) und Sprechtempo (SPEAKING RATE) signifikant. Da Tell me about it jedoch aus einer festgelegten Anzahl von Silben besteht, korrelieren beide Variablen. Die Länge der Äußerung führt zu einem leicht besseren AIC-Wert, weshalb diese Variable für die weitere Modellierung gewählt wurde. Darüber hinaus wird ironisches Tell me about it durch Abwenden des Blicks, gehobenen 110 Claudia Lehmann <?page no="111"?> Augenbrauen und Lächeln markiert. Mit einem Pseudo-R² Wert von 0.27 ist dieses Modell wesentlich aussagekräftiger als das Modell für konstruktionsun‐ abhängige Ironie. Die Ergebnisse für as if sind in Tab. 5 zusammengefasst. Model Info: Observations: 478 Dependent variable: INTERPRETATION (ironic) Type: mixed effects generalized linear regression Error distribution: binomial Link function: logit - Model fit: AIC = 597.57, BIC = 635.10 Pseudo-R² (fixed effects) = 0.11 Pseudo-R² (total) = 0.33 - Fixed effects: - Est. S.E. z val. p (intercept) 1.06 0.58 1.83 0.07 PITCH -0.09 0.04 -2.37 0.02* RATE 0.51 0.20 2.47 0.01* P1 0.28 0.18 1.59 0.11 P3 0.46 0.18 2.47 0.01* HEAD tilt 0.46 0.34 1.33 0.18 EYEBROWS frown 0.22 0.32 0.69 0.49 - Random effects group parameter Std. Dev. Variance Zur multimodalen Markierung von Ironie 111 <?page no="112"?> SPEAKER (intercept) 0.99 0.98 INTERACTION TYPE (intercept) 0.36 0.13 - Grouping variables Group # groups ICC SPEAKER 310 0.22 INTERACTION TYPE 3 0.03 Tab. 5: Zusammenfassung des Modells für ironische vs. nicht ironische as if Sätze Abb. 3 zeigt die Odds ratios und deren Konfidenzintervalle für das Modell zu as if Sätzen. Abb. 3: Odds ratios und Konfidenzintervalle für die Elemente des Modells zu den as if Sätzen Tab. 5 zeigt, dass syntaktisch unabhängige as if Sätze akustisch durch eine tiefere Stimmlage, ein schnelleres Sprechtempo sowie Pausen vor und nach der Äußerung markiert sind. Visuelle Signale syntaktisch unabhängiger as if Sätze 112 Claudia Lehmann <?page no="113"?> sind das Schräghalten des Kopfes und das Zusammenziehen der Augenbrauen. Obwohl die Pause vor der Äußerung sowie beide visuellen Signale das Modell deutlich verbessert haben, sind diese drei Merkmale nicht signifikant. Mit einem Pseudo-R² Wert von 0.11 für die fixed Effects ist das Modell insgesamt nicht besonders aussagekräftig, trotzdem aber wesentlich besser als das erste Modell zu konstruktionsunabhängigen Ironiesignalen. Die Ergebnisse für die about as X as Y Konstruktionen sind in Tab. 6 zusammen‐ gefasst. Model Info: Observations: 268 Dependent variable: INTERPRETATION (ironic) Type: mixed effects generalized linear regression Error distribution: binomial Link function: logit - Model fit: AIC = 322.15, BIC = 354.47 Pseudo-R² (fixed effects) = 0.23 Pseudo-R² (total) = 0.43 - Fixed effects: - Est. S.E. z val. p (intercept) -3.32 1.62 -2.04 0.04 SD 0.03 0.02 1.24 0.22 DURATION 1.02 0.26 3.99 0.00* P1 -0.02 0.19 -0.10 0.92 P2 -0.26 0.22 -1.19 0.23 P3 0.27 0.15 1.82 0.07 GAZE to recipient -0.66 0.50 -1.31 0.19 Zur multimodalen Markierung von Ironie 113 <?page no="114"?> BLINKS -0.17 0.28 -0.61 0.54 - Random effects group parameter Std. Dev. Variance SPEAKER (intercept) 1.08 1.17 - Grouping variables Group # groups ICC SPEAKER 204 0.26 Tab. 6: Zusammenfassung des Modells für ironische und nicht ironische about as X as Y Vergleiche Abb. 4 zeigt die Odds ratios und deren Konfidenzintervalle für das Modell zu about as X as Y. Abb. 4: Odds ratios und Konfidenzintervalle für die Elemente des Modells zu about as X as Y Tab. 6 zeigt, dass außer der Länge der Äußerung (DURATION) keins der Signale signifikant ironisches about as X as Y von seinem nicht ironischem Gebrauch 114 Claudia Lehmann <?page no="115"?> unterscheiden kann. Ironisches about as X as Y ist demnach länger als nicht ironisches about as X as Y, aber nicht langsamer, da das Sprechtempo nicht signifikant ist. Tab. 6 zeigt außerdem, dass es weitere akustische Signale gibt, die jedoch kein signifikantes Niveau im Modell erreichen: die Standardabweichung von der Tonhöhe und die Pausen. Ironisches about as X as Y tendiert demnach dazu, mehr in der Tonhöhe zu variieren, weniger vor und während der Äußerung zu pausieren, dafür aber eine Pause nach der Äußerung zu machen. Visuelle Signale, die das Modell verbessert haben, aber nicht signifikant sind, sind das Blickverhalten und die Blinzelrate. Genauer gesagt tendieren Sprecher: innen des ironischen about as X as Y dazu, Blicke zu den Rezipient: innen zu vermeiden und blinzeln weniger häufig als Sprecher: innen des nicht ironischen about as X as Y. Trotz der Tatsache, dass es nur ein signifikantes Merkmal im Modell gibt, ist es mit einem Pseudo-R² Wert von 0.23 hinreichend aussagekräftig. 5 Diskussion Die Diskussion der Ergebnisse teilt sich in zwei Teildiskussionen auf. Zum einen werden die gewonnen Ergebnisse anhand eines Beispiels in Bezug auf ihre Interpretation diskutiert. Zum anderen wird die hier vorgestellte Methode hinsichtlich des Zusammenspiels qualitativer und quantitativer Analysen dis‐ kutiert. 5.1 Multimodale Signale von Ironie und ironischen Konstruktionen Beispiel (6) zeigt ein multimodales Transkript (nach Mondada 2018) eines syntaktisch abhängigen as if Satzes mit einer ironischen Interpretation. Das zugehörige Video zu Beispiel (6) sowie auch die aller folgenden Beispiele sind ebenfalls in dem o. g. Repositorium verfügbar: https: / / osf.io/ 37pr5/ ? view_only =5b0d24f5e40d4fef9f7ded7888e1e783 (6) As if this was just a bunch of anarchists - 1 speech helike the PREsident; (.) is dePICting it; - - head - *shake-------------* - 2 speech #as if # this was just a bunch of Anarchist; - - head - *shake-------------* *up* - - Abb. - #Abb.1 #Abb.2 - 3 speech running all over PORTland. °hh - - head - *shake-------* Zur multimodalen Markierung von Ironie 115 <?page no="116"?> Abb. 5: Der Kopf der Sprecherin ist leicht nach links gedreht Abb. 6: Der Kopf der Sprecherin ist leicht nach rechts gedreht In Beispiel (6) berichtet die Nachrichtensprecherin von einem männlichen Referenten („he“) und seiner Sicht auf eine politische Situation als „just a bunch of anarchists running all over Portland“. Dieser Bericht ist zum einen explizit attributiv, da der Matrixsatz mit dem Subjekt he und dem Verb depict (‚darstellen‘, ‚beschreiben‘) eingeleitet wird. Zum anderen ist er allerdings keineswegs neutral, sondern bringt die distanzierte Haltung der Sprecherin zum Gesagten zum Ausdruck, indem sie die aus ihrer Sicht abwertende und herunterspielende Sichtweise des Referenten mithilfe von „just“, „a bunch of “ und „anarchists“ auf die Spitze treibt. Darüber hinaus zeigt dieses Beispiel auch alle vom Modell identifizierten multimodalen Ironiesignale. Akustisch ist die Äußerung vergleichsweise lang, jedoch nicht langsamer im Sprechtempo, wird ohne Pause an das vorher Gesagte angeschlossen und weist keine äußerungsinternen Pausen auf. Die Länge (und damit die Dauer) von ironischen Äußerungen im Datenmaterial lässt sich mit der Wahl der Konstruktionen erklären. Mit Ausnahme von den beiden Tell me about it Konstruktionen, die immer eine festgelegte Anzahl von Silben haben, sind die anderen vier Konstruktionen nicht in der Silbenlänge festgelegt. Für die nicht ironischen Konstruktionen finden sich im Korpus viele Beobachtungen mit wenig Silben, wie z. B. as if this were true oder about as big as Texas. Diese Art von Vergleichen ist oft unkompliziert und bedarf daher wenig weiterer Ausschmückung. Die ironischen Konstruktionen sind hingegen meist etwas komplexer. In Beispiel (6) wird die Haltung eines anderen auf die Spitze getrieben und dies bedingt ein Mehr an Sprachmaterial. Die fehlenden Pausen vor und innerhalb der Äußerung können damit erklärt werden, dass die Sprecherin einen zusammenhängenden Gedanken äußert und dies auch akustisch so signalisiert. Außerdem schüttelt die Sprecherin vor und während des as if Satzes leicht den Kopf. Diese sehr subtile Bewegung ist im Transkript notiert und ist in den Abb. 5 und 6 angedeutet (für eine bessere Nachvollziehbarkeit muss auf 116 Claudia Lehmann <?page no="117"?> das Video verwiesen werden). Kopfschütteln wird im amerikanischen Englisch, wie in vielen anderen Sprachgemeinschaften auch, mit Negation assoziiert (siehe Fricke in diesem Band). In der Äußerung findet sich kein verbaler Negationsmarker, der einen Hinweis auf den Skopus des Negierten liefern könnte, sodass sich die Sprecherin scheinbar von der gesamten Haltung des Referenten distanziert. Obwohl das hier gezeigte Beispiel alle im Modell signifikanten Signale für Ironie aufweist, muss an dieser Stelle nochmals betont werden, dass dies ledig‐ lich auf einen Bruchteil der Beobachtungen zutrifft und das Modell insgesamt nicht aussagekräftig ist. Genauer gesagt gibt es nur 16 Beispiele (von insgesamt 508) auf die alles gleichzeitig zutrifft. Da das Modell auf den großen Einfluss der gewählten Konstruktionen hingedeutet hat, werden nun die ironischen Konstruktionen vorgestellt. Beispiel (7) zeigt ein multimodales Transkript eines Beispiels für ironisches Tell me about it. (7) Tell me about it - 1 01 speech we’re talking about how erm- NOT getting cancelled - - - - - is the new hit show; - 2 02 speech SEriously; # Tell me about it. - - - gaze - *elsewhere------------* - - - eyebrows - #raised---------------# - - - mouth - +smile--------------+ - - - Abb. - #Abb. 3 Abb. 7: Zu sehen sind hier Sprecher 01 (ganz links) und Sprecher 02 (ganz rechts) Zur multimodalen Markierung von Ironie 117 <?page no="118"?> Ironisches Tell me about it unterscheidet sich von nicht ironischem Tell me about it akustisch hinsichtlich der Dauer und, damit einhergehend, auch hin‐ sichtlich des Sprechtempos, da diese Konstruktionen fest in der Silbenzahl sind. Beispiel (7) ist mit einer Dauer von 977ms (was einem Sprechtempo von 5,11 Silben pro Sekunde entspricht) sehr langsam, da der Mittelwert für Tell me about it bei 634ms liegt (was einem Sprechtempo von 7,89 Silben pro Sekunde entspricht). Wie auch der Überblick zum Forschungsstand in Abschnitt 2 gezeigt hat, ist langsames Sprechtempo ein Merkmal des ironischen Tonfalls. Bryant (2010) vermutet, dass das langsame Sprechtempo dazu dient, den Hörer: innen mehr Zeit zur Verarbeitung der ironischen Äußerung zu gewähren. Da es sich bei Tell me about it um eine ironische Konstruktion, also um eine gelernte Form-Funktionsassoziation, handelt, scheint diese Erklärung für die vorliegenden Daten unwahrscheinlich, da die Konstruktion die Vorlage zur ironischen Interpretation liefert. Wahrscheinlicher scheint hingegen, dass der Sprecher mithilfe des langsamen Sprechtempos seine Distanzierung zum Gesagten zum Ausdruck bringt und damit die Äußerung als ironisch markiert. In diesem Zusammenhang liegt die Vermutung nahe, dass Tell me about it eine multimodale Konstruktion sein könnte, dessen Formseite aus syntaktischen (Tell me about it) und akustischen (langsames Sprechtempo) Merkmalen besteht. Die vorliegende Studie lässt allerdings keine deutlichen Rückschlüsse diesbezüglich zu. Beispiel (7) zeigt außerdem die visuellen Signale von ironischem Tell me about it. Der Sprecher von Tell me about it in Beispiel (7) wendet seinen Blick vom Adressaten ab, hebt seine Augenbrauen und lächelt. Die Vermeidung des Blickkontakts mit dem Gesprächspartner kann damit erklärt werden, dass nicht ironisches Tell me about it einen Sprecherwechsel initiiert und damit mit Blickkontakt einhergeht (siehe Lerner 2003). Ironisches Tell me about it initiiert nicht notwendigerweise einen Sprecher: innenwechel und ist daher - in direktem Vergleich mit nicht ironischem Tell me about it - seltener mit Blickkontakt zum Adressaten assoziiert. Lächeln und gehobene Augenbrauen hingegen wurden auch schon in anderen Studien mit Ironie in Verbindung gebracht und scheinen den humorvollen Aspekt von Ironie zu markieren (Tabacaru 2019; Tabacaru/ Lemmens 2014). Die multimodale Markierung von ironischen as if Sätzen ist in Beispiel (8) dargestellt. (8) As if that will solve the problem - 1 speech on saturday NIGHT; - - head *turn to right----* - 2 speech an arsonist (.) burned down the WENdys; 118 Claudia Lehmann <?page no="119"?> head *slow nods-------------- - 3 speech where # Brooks fell aSLEEP. (0.16) - - head ------------------------* - - Abb. - #Abb.4 - 4 speech as if THAT # will solve the answer. (0.24) the PROblem. - - head *tilt---------------------------* - - Abb. - #Abb.5 Abb. 8: Der Kopf des Sprechers ist zur Kamera gerichtet - Abb. 9: Der Kopf des Sprechers ist leicht nach rechts geneigt Abb. 10: Tonhöhenbewegung in Beispiel (8) Beispiel (8) zeigt das multimodale Transkript eines Sprechers, der einen syntak‐ tisch unabhängigen as if Satz äußert. Wie vom Modell vorhergesagt, wird dieser Satz vorher und nachher durch eine Pause von 160ms und 240 ms prosodisch vom Rest des Gesagten abgesetzt. Diese Art des Chunkings geht mit der Idee einher, dass eine prosodische Einheit auch einen Gedanken beinhaltet (Chafe 1994). Syntaktisch unabhängige as if Sätze sind dem Modell zufolge tiefer in der Tonlage als nicht ironische as if Sätze. Abb. 10 zeigt zudem die Tonhöhenbewe‐ Zur multimodalen Markierung von Ironie 119 <?page no="120"?> gung in Beispiel (8). Daraus geht hervor, dass auch bei dem Sprecher von Beispiel (8) die mittlere Tonhöhe sinkt. In den Äußerungen zuvor werden Tonhöhen von bis zu 300Hz erreicht, im as if Satz geht die Stimme nur kurz auf etwa 200Hz und bleibt ansonsten sehr niedrig bei etwa 100Hz. Darüber hinaus ist der Sprecher in Beispiel (8) vergleichsweise schnell mit 5,4 Silben/ Sekunde, wohingegen nicht ironische, syntaktisch abhängige as if Sätze im Durchschnitt mit 4,84 Silben/ Sekunde geäußert werden. Abb. 8 zeigt auch, dass der Sprecher schneller wird, wenn er den as if Satz äußert. Während er bei der Aussage „where Brooks fell asleep“ ein Sprechtempo von 4,03 Silben pro Sekunde hat, hat er beim Äußern des as if Satzes ein deutlich schnelleres Sprechtempo. Ward (2019) beschreibt eine prosodische Konstruktion, die er ‚indifference construction‘ nennt. Diese Konstruktion ist formal durch eine tiefere Stimmlage und ein schnelleres Sprechtempo gekennzeichnet und wird von Sprecher: innen verwendet, wenn sie Gleichgültigkeit zum Ausdruck bringen. Zudem wird eine tiefere Stimmlage mit Dominanz und Autorität assoziiert (Ohala 1983; Puts et al. 2007). Beide Merkmale, die tiefere Stimmlage und das schnellere Sprechtempo, scheinen die distanzierte Haltung des Sprechers zum Gesagten zu markieren. In diesem Fall scheint es also so zu sein, dass die syntaktisch unabhängige as if-Konstruktion mit einer (unabhängigen) prosodischen Konstruktion assoziiert ist. Das multimodale Transkript von Beispiel (8) zeigt außerdem ein visuelles Signal von syntaktisch unabhängigen as if Sätzen: das Schräghalten des Kopfes (Block 4, Abb. 5). Tabacaru (2019) hat bereits das Schräghalten des Kopfes im Zusammenhang mit Ironie beschrieben. Darüber hinaus gibt es Studien, die das Schräghalten des Kopfes allgemein mit Äußerungen in Verbindung bringen, die sich von der Einstellung nicht anwesender Personen abgrenzen (Debras 2017; Debras/ Cienki 2012). Dies scheint auf Beispiel (8) zuzutreffen. Der Sprecher schreibt den Brandstiftern die Idee zu, dass das Anzünden einer Wendy’s Filiale politische Auseinandersetzungen befrieden könnte, und distanziert sich gleichzeitig von diesem Gedanken. Auch für dieses Merkmal scheint es so zu sein, dass das Schräghalten des Kopfes eine unabhängige Konstruktion ist, die mit syntaktisch unabhängigen as if Sätzen assoziiert ist. Die Signale von ironischem about as X as Y sind in Beispiel (9) dargestellt. Da visuelle Aspekte bei about as X as Y dem Modell zufolge keine Rolle zu spielen scheinen, wurden hierfür nur die Tonhöhenbewegungen und Pausen dargestellt (siehe Abb. 11). (9) It’s about as likely as Mitch McConnell being on the cover of Men’s Health 120 Claudia Lehmann <?page no="121"?> Abb. 11: Tonhöhenbewegung in Beispiel (9) Abb. 11 zeigt, dass die ironische Äußerung selbst, aber auch der prosodische Chunk, mithilfe der sie geäußert wird, mit insgesamt 20 Silben relativ lang ist. Dadurch ist die Gesamtdauer der Äußerung lang, ohne dass das Sprechtempo langsamer ist. Gleichzeitig wird ironisches about as X as Y von einer 570ms langen Pause gefolgt. Die Dauer der Äußerung lässt sich durch die Funktion der Konstruktion erklären. Nicht ironisches about as X as Y stellt einen Vergleich her, der es den Rezipient: innen ermöglichen soll, ein bestimmtes Konzept besser zu verstehen (siehe Beispiel 5a, wo es um die Größe des menschlichen Herzens geht). Je kürzer und einprägsamer dieser Vergleich ist, desto besser erfüllt der nicht ironische Vergleich diese Funktion. Bei ironischem about as X as Y wird hingegen ein inkongruenter bis absurder Vergleich gezogen: Mitch McConnell ist ein 80-jähriger Senator, bei dem es sehr unwahrscheinlich ist, dass er auf dem Cover eines Magazins erscheint, in dem es um Fitness, Fashion und Lifestyle geht. Diese Inkongruenz unterstützt vor allem die humorvolle Seite von Ironie, da Inkongruenz ein wesentliches Merkmal von Humor ist (siehe z. B. die General Theory of Verbal Humour, Attardo 2017). Um einen solchen inkongruenten Vergleich herzustellen, können sowohl kurze als auch längere Äußerungen (wie es in Beispiel (9) der Fall ist) herangezogen werden. Da es sich bei den untersuchten Daten um Daten aus Fernsehsendungen handelt, könnte zudem vermutet werden, dass besonders kreative (und damit längere) Vergleiche besonders unterhaltsam sind und damit eine wichtige Erwartung der Zuschauer: innen erfüllen. Diese Erwartungshaltung trifft insbesondere auf Comedysendungen zu, aus der Beispiel 9 stammt. Das könnte auch erklären, warum auf den ironischen Vergleich in Beispiel (9) eine Pause folgt. Der Sprecher der Äußerung zielt auf die Unterhaltung seines Publikums ab und wird mutmaßlich pausieren, um seinen Zuschauer: innen die Gelegenheit zu geben, die Ironie zu verarbeiten und zu lachen. Beide Merkmale, d. h. Äußerungslänge Zur multimodalen Markierung von Ironie 121 <?page no="122"?> und die anschließende Pause, scheinen damit nicht direkt mit der Konstruktion assoziiert zu sein, sondern erfüllen andere Funktionen. 5.2 Zur Triangulation qualitativer und quantitativer Methoden in der Multimodalitätsforschung Es gibt bereits viele Arbeiten, die sich für eine sinnvolle Verwendung von qualitativen und quantitativen Methoden in der Pragmatik aussprechen, allen voran von Verfechtern der experimentellen Pragmatik (siehe z. B. Noveck 2018; Noveck/ Sperber 2004) und der Korpuspragmatik (siehe z. B. Aijmer/ Rühlemann 2015). Nichtsdestoweniger ist ein Großteil der Studien in der Multimodalitäts‐ forschung rein qualitativ. Grundsätzlich spricht nichts gegen rein qualitative Studien. Im Gegenteil: Die Pragmatik beschäftigt sich vorrangig mit qualitativen Daten und aus diesem Grund sind die meisten quantitativen Studien auch auf vorhergehende qualitative Untersuchungen angewiesen. Anhand der hier vorgestellten Studie soll allerdings auch gezeigt werden, dass ein darüber hinaus gehender quantitativer Vergleich hilfreich ist. Denn wie bereits in Abschnitt 2.2.2 erwähnt, reichen qualitative Studien mitunter nicht aus, um zu verallgemeinerbaren Ergebnissen zu kommen. Auch wenn hier ein Plädoyer für mehr quantitative Studien vertreten wird, so ist der qualitative Anteil der Studie nicht weniger wichtig. Die qualitativen Analysen zum Blickverhalten, zu Kopfbewegungen und zur Mimik müssen zuverlässig sein, damit auch ihre quantitative Auswertung zuverlässig ist. Was die Studie hier von den bisherigen Studien zu visuellen Ironiesignalen unterscheidet, ist das Heranziehen von Kontrolldaten; hier der nicht ironische Gebrauch formal ähnlicher Konstruktionen. Mithilfe dieser Methode lässt sich besser einschätzen, welche der identifizierten Signale tatsächlich ironiebzw. humorspezifisch sind und welche häufiger auch mit nicht ironischem Sprachgebrauch verwendet werden. Denn Ironiesignale sind nur dann wirklich generalisierbare Ironiesignale im engeren Sinne, wenn sie ausschließlich mit Ironie verwendet werden. Keines der in Abschnitt 2.2.2 genannten visuellen Ironiesignale konnte in der aktuellen Studie für alle ironischen Konstruktionen gefunden werden. Zum einen lässt diese Feststellung den Schluss zu, dass die (visuelle) Markierung von Ironie von der gewählten Konstruktion abhängt. Zum anderen scheint es so, als ob auch nicht ironische Äußerungen gleichsam durch multimodale Ausdrucksmöglichkeiten begleitet werden. Kopfbewegungen, die in der Literatur mit Ironie in Verbindung gebracht wurden, sind Nicken und Schräghalten des Kopfes (Tabacaru 2019). In der ak‐ tuellen Studie war Kopfnicken in keinem der statistischen Modelle vorhanden. 122 Claudia Lehmann <?page no="123"?> Das Schräghalten des Kopfes hingegen wird zwar oft bei ironischen as if Sätzen gebraucht, aber nicht hinreichend oft, um signifikant zu sein. Für die an‐ deren Konstruktionen spielte diese Kopfbewegung keine Rolle, genauso wenig wie für Ironie allgemein. Diese unterschiedlichen Ergebnisse könnten damit zusammenhängen, dass Tabacaru (2019) ausschließlich mit geskripteten Daten gearbeitet hat und die aktuelle Studie mit einer Vielzahl von unterschiedlichen Daten. Andererseits könnten die unterschiedlichen Ergebnisse auch damit zusammenhängen, dass die aktuelle Studie nicht nur Veränderungen der multi‐ modalen Signale von Ironie zur vorhergehenden Äußerung vergleicht, sondern eine formal ähnliche, nicht ironische Äußerung zum Vergleich heranzieht. Die aktuelle Studie legt damit nahe, dass nicht ironische Äußerungen genauso häufig mit Kopfnicken begleitet werden wie nicht ironische. Ähnliches gilt für das Schräghalten des Kopfes. Die aktuelle Studie deutet darauf hin, dass ironische as if Sätze oft mit schrägem Kopf geäußert werden, aber nicht ironi‐ sche as if Sätze ebenfalls oft genug, sodass dieses Ergebnis kein signifikantes Level erreicht hat. An dieser Stelle wird deutlich, dass sich eine quantitative Auswertung als nützlich erweisen kann. Hinsichtlich der anderen Ironiesignale ergibt sich ein differenzierteres Bild. In der aktuellen Studie konnten vereinzelt Ironiesignale identifiziert werden, die auch bereits in anderen Studien erwähnt wurden. Dazu gehören gehobene Augenbrauen sowie Stirnrunzeln, Lächeln oder Lachen und Vermeidung des Blickkontakts. Bis auf das Stirnrunzeln wurden alle diese Ironiesignale bei einer ironischen Konstruktion, Tell me about it, aber nicht bei den anderen nachgewiesen. Das zeigt zwar erneut, dass Ironiesignale konstruktionsabhängig zu sein scheinen, trotzdem kann hier von einem robusten Ergebnis gesprochen werden, da die Ergebnisse der aktuellen Studie mit den Ergebnissen vorange‐ gangener Studien übereinstimmen. Stirnrunzeln hingegen wird oft bei der Äußerung von ironischen as if Sätzen verwendet, allerdings wieder nicht oft genug, um signifikant zu sein. Beim Stirnrunzeln könnte es sich wieder um ein Merkmal handeln, dass scheinbar auch häufig mit nicht ironischen Äußerungen einhergeht. Ironiesignale, die in der Literatur erwähnt werden, aber in der aktuellen Studie unauffällig waren, sind das ausdruckslose Gesicht, Blinzeln und zusam‐ mengepresste Lippen. Das Fehlen der letzten beiden Signale lässt sich am besten damit erklären, dass sie mit gleicher Häufigkeit auch mit nicht ironischen Äußerungen verwendet werden. Mit anderen Worten: Zwar kann es sein, dass Sprecher: innen der hier untersuchten ironischen Konstruktionen den Eindruck erwecken, häufig zu blinzeln und die Lippen aufeinanderzupressen, genauso oft tun sie dies aber auch mit ihren nicht ironischen Pendants. Das Verhältnis Zur multimodalen Markierung von Ironie 123 <?page no="124"?> zwischen einem ausdruckslosen Gesicht und Ironie wurde in der aktuellen Studie nicht direkt untersucht. Trotzdem lassen sich diesbezüglich Beobach‐ tungen machen. Wäre es in der Tat so, dass Ironie mit einem ausdruckslosen Gesicht geäußert würde, hätten die statistischen Modelle negative Werte für die Bewegungen in der Augen-, Augenbrauen- und Mundpartie hervorbringen müssen. Das haben sie aber nicht und insofern muss davon ausgegangen werden, dass (Nicht-)Ironie gleich häufig mit (Nicht-)Bewegungen im Gesicht verbunden wird. Auch bei diesen (fehlenden) Ergebnissen zeigt sich, dass ein quantitativer Vergleich lohnend bis notwendig ist. 6 Schlussfolgerungen Der vorliegende Aufsatz bietet zwei wesentliche Schlussfolgerungen: Erstens hat die vorgestellte Studie gezeigt, dass Ironiesignale unter anderem auch von der gewählten Konstruktion abhängen. Zwar gab es einige Signale, die kon‐ struktionsübergreifend signifikant oft mit Ironie gebraucht werden, trotzdem waren die Ironiesignale für die einzelnen Konstruktionen wesentlich aussage‐ kräftiger in ihrer Vorhersage. Zweitens hat der Aufsatz deutlich gemacht, inwiefern quantitative Analysen für die Auswertung multimodaler Studien hilfreich sein können. Die aktuelle Studie konnte zeigen, dass manche der in der Literatur angeführten Ironiesignale auch mit nicht ironischen Äußerungen gebraucht werden, sodass sie genau genommen keine Ironiesignale sind. Auch wenn hier lediglich eine Studie vorgestellt wurde, lässt sich diese Erkenntnis auf andere Untersuchungsgegenstände der Pragmatik erweitern, denn die Analyse pragmatische Phänomene kann durch eine quantitative Perspektive nur gewinnen. Darüber hinaus wirft der vorliegende Beitrag, wie eingangs erwähnt, wich‐ tige Fragen für eine multimodale Pragmatik auf, ohne den Anspruch zu er‐ heben, diese umfangreich beantworten zu können. Der Beitrag hat gezeigt, dass viele der mit den ironischen Konstruktionen verwendeten multimodalen Merkmale auch mit nicht ironischen Äußerungen verwendet werden und z.T. als eigenständige Konstruktionen beschrieben werden können. Wenn diese akustischen und visuellen Merkmale auch gelernte Assoziationen von Form und Funktion sind, dann stellt sich die Frage, ob und inwiefern sie sich von syntaktischen Konstruktionen unterscheiden und ob sie Teil von Grammatik sind. Die Erforschung der Systematik von visuellen und akustischen Merkmalen scheint eine lohnende Aufgabe für Arbeiten im Bereich der Multimodalität zu sein. 124 Claudia Lehmann <?page no="125"?> Literatur Aijmer, Karin/ Rühlemann, Christoph (Hrsg.) (2015). Corpus pragmatics. Cambridge: Cambridge University Press. Anikin, Audrey (2022). soundgen. Sound Synthesis and Acoustic Analysis. Version Version 2.5.2. Abrufbar unter https: / / cran.r-project.org/ package=soundgen (Stand: 24.10.2022) Anolli, Luigi/ Ciceri, Rita/ Infantino, Maria Giaele (2000). Irony as a game of implicitness: Acoustic profiles of ironic communication. Journal of Psycholinguistic Research 29 (3), 275-311. Anolli, Luigi/ Ciceri, Rita/ Infantino, Maria Giaele (2002). From “blame by praise” to “praise by blame”: Analysis of vocal patterns in ironic communication. International Journal of Psychology 37 (5), 266-276. Attardo, Salvatore (2000a). Irony markers and functions. Towards a goal-oriented theory of irony and its processing. Rask 12 (1), 3-20. Attardo, Salvatore (2000b). Irony as relevant inappropriateness. Journal of pragmatics 32 (6), 793-826. Attardo, Salvatore (2017). The General Theory of Verbal Humor. In: Attardo, Salvatore (Hrsg.). The Routledge handbook of language and humor. New York: Taylor & Francis. Attardo, Salvatore/ Eisterhold, Jodi/ Hay, Jennifer/ Poggi, Isabella (2003). Multimodal mar‐ kers of irony and sarcasm. Humor 16 (2), 243-260. Bates, Douglas/ Mächler, Martin/ Bolker, Ben/ Walker, Steve (2015). Fitting linear mixed-effects models using lme4. Journal of Statistical Software 67 (1), 1-48. Boersma, Paul/ Weenink, David (2019). Praat. Doing phonetics by computer. Version Version 6.0.52. Amsterdam. Abrufbar unter https: / / www.praat.org (Stand: 24.10.2022) Braun, Angelika/ Schmiedel, Astrid (2018). The phonetics of ambiguity. A study on verbal irony. In: Winter-Froemel, Esme/ Thaler, Verena (Hrsg.). Cultures and traditions of wordplay and wordplay research. Berlin: De Gruyter, 111-136. Bryant, Gregory A. (2010). Prosodic contrasts in ironic speech. Discourse Processes 47 (7), 545-566. Bryant, Gregory A./ Fox Tree, Jean E. (2005). Is there an ironic tone of voice? Language and speech 48 (3), 257-277. Burgers, Christian/ van Mulken, Margot/ Schellens, Peter Jan (2012). Verbal irony: Diffe‐ rences in usage across written genres. Journal of Language and Social Psychology 31 (3), 290-310. Castro, Santiago/ Hazarika, Devamanyu/ Pérez-Rosas, Verónica/ Zimmermann, Roger/ Mi‐ halcea, Rada/ Poria, Soujanya (2019). Towards multimodal sarcasm detection (an obviously perfect paper). arXiv preprint arXiv: 1906.01815. DOI: https: / / doi.org/ 10.48 550/ arXiv.1906.01815. Zur multimodalen Markierung von Ironie 125 <?page no="126"?> Caucci, Gina M./ Kreuz, Roger J. (2012). Social and paralinguistic cues to sarcasm. Humor 25 (1), 1-22. CBS News (Hrsg.) (2015). Ellen DeGeneres hits back against "gay agenda" accusations. Abrufbar unter: https: / / www.cbsnews.com/ news/ ellen-degeneres-hits-back-against -gay-agenda-accusations/ (Stand: 29.04.2024) Chafe, Wallace L. (1994). Discourse, consciousness and time. The flow and displacement of conscious experience in speaking and writing. Chicago: University of Chicago Press. Cheang, Henry S./ Pell, Marc D. (2008). The sound of sarcasm. Speech communication 50 (5), 366-381. Cheang, Henry S./ Pell, Marc D. (2009). Acoustic markers of sarcasm in Cantonese and English. The Journal of the Acoustical Society of America 126 (3), 1394-1405. Cheang, Henry S./ Pell, Marc D. (2011). Recognizing sarcasm without language: A cross-linguistic study of English and Cantonese. Pragmatics & Cognition 19 (2), 203-223. Chen, Aoju/ Boves, Lou (2018). What’s in a word: Sounding sarcastic in British English. Journal of the International Phonetic Association 48 (1), 57-76. Colston, Herbert L. (2020). Eye-rolling, irony and embodiment. In: Athanasiadou, An‐ geliki/ Colston, Herbert L. (Hrsg.). The diversity of irony. Berlin/ Boston: De Gruyter, 211-235. Couper-Kuhlen, Elizabeth/ Selting, Margret (2017). Interactional linguistics: Studying language in social interaction. Cambridge: Cambridge University Press. Cutler, Anne (1974). On saying what you mean without meaning what you say. Papers from the Regional Meeting of the Chicago Linguistic Society 10, 117-127. Debras, Camille (2017). The shrug. Forms and meanings of a compound enactment. Gesture 16 (1), 1-34. Debras, Camille/ Cienki, Alan (2012). Some uses of head tilts and shoulder shrugs during human interaction, and their relation to stancetaking. 2012 International Conference on Privacy, Security, Risk and Trust; 2012 International Conference on Social Computing, 2012. DOI: http: / / dx.doi.org/ 10.1109/ SocialCom-PASSAT.2012.136 Dynel, Marta (2017). The irony of irony: Irony based on truthfulness. Corpus Pragmatics 1, 3-36. Garmendia, Joana (2018). Irony. Cambridge: Cambridge University Press. Gent, Helen (2019). F0 as a cue for irony in spontaneous speech. In: Calhoun, Sasha/ Escu‐ dero, Paolo/ Tabain, Marija/ Warren, Paul (Hrsg.). Proceedings of the 19th International Congress of Phonetic Sciences, Melbourne, Australia 2019, 711-715. Gibbs, Raymond W. (2000). Irony in talk among friends. Metaphor and symbol 15 (1-2), 5-27. 126 Claudia Lehmann <?page no="127"?> Goldberg, Adele E. (2006). Constructions at work. The nature of generalizations in language. New York: Oxford University Press. Grice, Herbert Paul (1989). Studies in the way of words. Cambridge, MA: Harvard University Press. Gries, Stefan T. (2003). Towards a corpus-based identification of prototypical instances of constructions. Annual Review of Cognitive Linguistics 1 (1), 1-27. Haiman, John (1990). Sarcasm as theater. Cognitive Linguistics 1 (2), 181-206. DOI: 10.1515/ cogl.1990.1.2.181. Hartung, Martin (1998). Ironie in der Alltagssprache. Eine gesprächsanalytische Unter‐ suchung. Opladen/ Wiesbaden: Westdeutscher Verlag. Kreuz, Roger J. (2020). Irony and sarcasm. Cambridge, MA: MIT Press. Lehmann, Claudia (2021). About as boring as flossing sharks. Cognitive accounts of irony and the family of approximate comparison constructions in American English. Cognitive Linguistics 32 (1), 133-158. Lehmann, Claudia (2023a). As if that wasn’t enough. English as if clauses as multimodal utterance constructions. English Language & Linguistics 27 (1), 175-202. Lehmann, Claudia (2023b). Multimodal markers of irony in televised discourse. A corpus-based approach. In: Brown, Lucien/ Hübscher, Iris/ Jucker, Andreas H. (Hrsg.). Multimodal im/ politeness. Signed, spoken, written. Amsterdam: John Benjamins, 251-272. Lehmann, Claudia (2024). The Prosody of Irony is Diverse and Sometimes Construc‐ tion-Specific. In: Schlechtweg, Marcel (Hrsg.). Interfaces of phonetics. Berlin: De Gruyter, 281-308. Lehmann, Claudia/ Bergs, Alexander (2021). As if irony was in stock. The case of constructional ironies. Constructions and Frames 13 (2), 309-339. Lerner, Gene H. (2003). Selecting next speaker. The context-sensitive operation of a context-free organization. Language in Society 32 (2), 177-201. Long, Jacob A. (2022). jtools. Analysis and Presentation of Social Scientific Data. Version 2.2.0. Abrufbar unter https: / / CRAN.R-project.org/ package=jtools (Stand: 24.10.2022) Lüdecke, Daniel (2023). sjPlot: Data Visualization for Statistics in Social Science. Version 2.8.14. Abrufbar unter https: / / CRAN.R-project.org/ package=sjPlot (Stand: 26.07.2023) Mauchand, Mael/ Vergis, Nikolaos/ Pell, Marc D. (2018). Ironic tones of voices. 9th International Conference on Speech Prosody. Poznan, Polen, 13.06.2018. Mondada, Lorenza (2018). Multiple temporalities of language and body in interaction. Challenges for transcribing multimodality. Research on Language and Social Interac‐ tion 51 (1), 85-106. Morris, Charles (1938). Foundations of the theory of signs. In: Neurath, Otto/ Carnap, Ru‐ dolf/ Morris, Charles (Hrsg.). International Encyclopedia of Unified Science. Chicago: The University of Chicago Press. Zur multimodalen Markierung von Ironie 127 <?page no="128"?> Nauke, Astrid/ Braun, Angelika (2011). The Production and Perception of Irony in Short Context-free Utterances. ICPhS. Hong Kong, 17-21 August, 2011. Noveck, Ira (2018). Experimental pragmatics: The making of a cognitive science. Cam‐ bridge: Cambridge University Press. Noveck, Ira A./ Sperber, Dan (Hrsg.) (2004). Experimental pragmatics. London: Palgrave Macmillan. Ohala, John J. (1983). Cross-language use of pitch. An ethological view. Phonetica 40 (1), 1-18. Puts, David Andrew/ Hodges, Carolyn R./ Cárdenas, Rodrigo A./ Gaulin, Steven J.C. (2007). Men’s voices as dominance signals. Vocal fundamental and formant frequencies influence dominance attributions among men. Evolution and Human Behavior 28 (5), 340-344. R Core Team (2022). R: A Language and Environment for Statistical Computing. Version 4.2.1: R Foundation for Statistical Computing. Abrufbar unter https: / / www.r-project. org/ (Stand: 24.10.2022) Rockwell, Patricia (2000). Lower, slower, louder: Vocal cues of sarcasm. Journal of Psycholinguistic Research 29 (5), 483-495. Rockwell, Patricia (2007). Vocal features of conversational sarcasm: A comparison of methods. Journal of Psycholinguistic Research 36 (5), 361-369. Rühlemann, Christoph (2019). Corpus Linguistics for Pragmatics. London: Routledge. Sperber, Dan/ Wilson, Deidre (1981). Irony and the use-mention distinction. Philosophy 3, 143-184. Stanley, Jason (2005). Review of Robyn Carston, Thoughts and Utterances. Mind & Language 20 (3), 364-368. Steen, Francis/ Turner, Mark B. (2013). Multimodal construction grammar. In: Borkent, Mike/ Dancygier, Barbara/ Hinnell, Jennifer (Hrsg.). Language and the creative mind. Stanford: CSLI Publications, 255-274. Tabacaru, Sabina (2019). A multimodal study of sarcasm in interactional humor. Berlin: De Gruyter. Tabacaru, Sabina (2020). Faces of sarcasm. Exploring raised eyebrows with sarcasm in French political debates. In: Athanasiadou, Angeliki/ Colston, Herbert L. (Hrsg.). The diversity of irony. Berlin/ Boston: De Gruyter, 256-277. Tabacaru, Sabina/ Lemmens, Maarten (2014). Raised eyebrows as gestural triggers in humour. The case of sarcasm and hyper-understanding. European Journal of Humour Research 2 (2), 11-31. The Language Archive (2022). ELAN. Version Version 6.3. Nijmegen: Max Planck Institute for Psycholinguistics. Abrufbar unter https: / / archive.mpi.nl/ tla/ elan (Stand: 24.10.2022) 128 Claudia Lehmann <?page no="129"?> Ward, Nigel G. (2019). The prosodic patterns of English conversation. Cambridge: Cambridge University Press. Weinrich, Harald (1966). Linguistik der Lüge. Heidelberg: Verlag Lambert Schneider. Wilson, Deidre/ Sperber, Dan (1992). On verbal irony. Lingua 87 (1), 53-76. Wilson, Deidre/ Sperber, Dan (2012). Meaning and relevance. Cambridge: Cambridge University Press. Zur multimodalen Markierung von Ironie 129 <?page no="131"?> Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie Eine multimodale Interaktionsanalyse Susanne Kabatnik Abstract: This study focuses on the co-construction of change in smart‐ phone-supported group psychotherapy. In this innovative approach, a conf‐ lict that has arisen via an e-mail or messenger service is enacted and a response to the corresponding person is formulated. Smartphone-supported group psychotherapy is a face-to-face psychotherapy format in which the use of smartphones is expressly encouraged. In this therapy, conflicts that have arisen via email or messenger services are discussed in the group session using the smartphone. A response is then formulated together with the group to the person concerned in order to address the conflict. Using the example of one group psychotherapy session, the study shows how the context-specific action task of formulating a message is mastered multimodally in this group psychotherapy. For this purpose, the patients make (formulation) suggestions that form the focus utterance in this paper. For the analysis of the co-const‐ ruction of change, the main focus is on the conversational phases and the multimodal and functional properties of (formulation) suggestions as well as their sequential organisation. This allows to show not only the successive and collaborative conceptualisation of a message, but also the multimodal handling of a conflict and the increase of agency. Keywords: Psychotherapeutic group conversations, multimodal interaction analysis, messenger-supported and e-mail communication, co-construction of change, (formulation) suggestions, agency <?page no="132"?> 1 Einführung 1.1 Veränderungskommunikation in helfenden Interaktionen Veränderung in unterschiedlichen privaten und beruflichen Bereichen ist das format-endemische Ziel jedweder Psychotherapie und wird in der Interaktion ko-konstruiert (Spranz-Fogasy et al. 2018; Peräkylä 2013: 573; Peräkylä 2019: 258). Die Interaktionsanalyse kann durch die Orientierung am Längsschnitt von sequenziell organisierten, zusammenhängenden Äußerungen zur Beschrei‐ bung von psychotherapeutischen Prozessen verwendet werden (Peräkylä 2019; Voutilainen et al. 2018). Verschiedene gesprächslinguistische Studien haben gezeigt, wie sich die Einstellung von Patienten im Verlauf der Therapie ändern kann. Zum Beispiel zeigen Voutilainen et al. (2011), wie sich die Haltung einer Patientin gegenüber dem Verhalten ihrer Mutter im Laufe des Therapie‐ prozesses verändert, von anfangs dispräferierten zu präferierten Antworten. In Einzelsitzungen kann sich das Wissen und die Einstellung eines Patienten verändern. Zum Beispiel kann ein zunächst unbewusster Berufswunsch durch lösungsorientierte Fragen interaktional erarbeitet und schließlich verbalisiert werden (Kabatnik et al. 2019). Die gemeinsame Suche nach Lösungen ermöglicht nicht nur die Gestaltung von Beziehungen (Kabatnik et al. 2022; Voutilainen/ Pe‐ räkylä 2020), sondern auch die Bearbeitung von Widerstand (Kabatnik et al. 2019; Läpple et al. 2021; Guxholli et al. 2021) und die Generierung von Wissen (Spranz-Fogasy et al. 2018). Dazu werden in der therapeutischen Praxis unterschiedliche Interventionen verwendet, die anschließend (gesprächs-)lin‐ guistisch untersucht werden können, wie z. B. Beispielnachfragen (Spranz-Fo‐ gasy et al. 2018) oder Lösungsorientierte Fragen (Kabatnik et al. 2019), aber auch die Körpersprache, wie die Haltung und Position des Oberkörpers, das Kopfschütteln oder das Nicken zur Anzeige von (Dis-)Präferenz (Voutilainen et al. 2019; Stivers 2008). Fokussiert wurde bislang in Bezug auf die Ko-Konstruktion von Veränderung die sprachlich-interaktionale Ebene. In diesem Beitrag wird ein innovatives gruppenpsychotherapeutisches Format zur Behandlung chronischer Depressionen untersucht, bei dem ein in einer Messenger- oder E-Mail-Kommunikation entstandener Konflikt in einer Sitzung aufgearbeitet wird (siehe Kap. 1.2). Dabei wird mit der Gruppe eine Nachricht an die betreffende Person verfasst. Innerhalb dieses Prozesses wird in einem stetigen Austausch aufeinanderfolgender Sequenzen Intersubjektivität hergestellt (siehe z. B. Spranz-Fogasy et al. 2018), d. h. auch im Austausch unterschiedlicher multimodaler Signale der Interaktant*innen. Wesentliche Bedeutungskomponenten werden erst in ihrem multimodalen Ensemble interpretierbar (Deppermann 2018; Stukenbrock 132 Susanne Kabatnik <?page no="133"?> 2021). Wie die kontextspezifische Handlungsaufgabe der Formulierung einer Nachricht in der Gruppenpsychotherapie multimodal bewältigt wird, blieb bislang unbeleuchtet. Dieses Desiderat soll mit der vorliegenden Untersuchung bearbeitet werden. Helfende Interaktionen finden sich naturgemäß in helfenden Berufen (Graf/ Spranz-Fogasy 2018: 419) wie im medizinischen Bereich, der Psychotherapie, dem Coaching, im weiteren Sinne auch Supervision, Mediation oder der Bera‐ tung. Dort dient die soziale Interaktion als primäres Mittel und Methode zur Un‐ terstützung und Herbeiführung von physischer und psychischer sowie intellek‐ tueller und/ oder emotionaler Veränderung bei Patient*innen und Klient*innen (Pick/ Scarvaglieri 2019). Helfen stellt eine grundlegende Praxis zwischenmen‐ schlicher Interaktion dar und wird von Interagierenden in und durch ihre soziale Interaktion ko-konstruiert. Die Ko-Konstruktion von Hilfe kann dabei sowohl in alltäglichen als auch in institutionellen und organisierten Kommunikations‐ situationen realisiert werden (Graf et al. 2022: 1). Die organisierte Form der Hilfeleistung zeichnet sich im Unterschied zur spontanen, ungesteuerten und oft symmetrischen Hilfe im Alltag jedoch durch eine gewisse Terminierung, Steuerung sowie einer asymmetrischen Rollenverteilung zwischen Hilfeleis‐ tenden und Hilfeempfangenden aus (Graf et al. 2022: 1). Organisiertes Helfen ist einerseits durch den spezifischen interaktionalen und/ oder institutionellen Kontext beeinflusst, prästrukturiert und begrenzt. Andererseits folgt das Helfen als konkrete, lokal entstehende Praxis einer spezifischen interaktionalen Logik, die seiner strukturierten Organisation zugrunde liegt (Böhringer et al. 2022: 16). Helfen in diesen Kontexten bedeutet immer auch „sprachliches Helfen“ als eine mentale Vorstrukturierung des Handelns (Pick/ Scarvaglieri 2019). Me‐ dizinisch-beratende sowie psychotherapeutische Formate werden demnach als Prototyp helfender Interaktionen definiert (Kallmeyer 2001; Pick 2017; Graf et al. 2019) und werden innerhalb der Angewandten Linguistik auf den Kernbereich helfenden Handelns untersucht, wie beispielsweise: 1. interaktionstypspezifische oder helfende, kommunikative Praktiken (Miller/ Considine 2009; Graf et al. 2014: 1), 2. Konstitution bzw. den Transfer von Wissen (Graf/ Spranz-Fogasy 2018: 431), 3. Gestaltung einer vertrauensvollen Beziehung (Graf/ Spranz-Fogasy 2018: 425) und 4. Ko-Konstruktion von Veränderung (Kabatnik et al. 2019: 148). In diese Forschungstradition reiht sich der vorliegende Beitrag ein. Die Ko-Konstruktion von Veränderung steht in helfenden Interaktionen, wie in Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 133 <?page no="134"?> Medizin, Psychotherapie, Beratung und dem Coaching im Zentrum. Denn die Klient*innen/ Patient*innen sollen von den Helfenden dabei unterstützt werden, „ihre physische, psychische, intellektuelle und/ oder emotionale Verfassung zu verändern, zu stärken oder Probleme im Zusammenhang damit zu lösen“ (Graf/ Spranz-Fogasy 2018: 423; siehe auch Miller/ Considine 2009). Demnach ist die Ko-Konstruktion von Veränderung in unterschiedlichen Lebensbereichen von Hilfesuchenden das übergeordnete Ziel helfender Interaktionen. Verände‐ rung als Ziel helfender Interaktionen strukturiert das helfende Gespräch im Wesentlichen vor und soll im begleitenden kommunikativen Prozess ursächlich hervorgebracht werden (Graf et al. 2019: 7). Kommunikative Veränderungspro‐ zesse in helfenden Interaktionen, wie z. B. der Psychotherapie, der Beratung und dem Coaching wurden (gesprächs-)linguistisch bereits adressiert (siehe z. B. Graf et al. 2019; Pick 2017; Graf/ Spranz-Fogasy 2018; Graf et al. 2014; Busch/ Spranz-Fogasy 2015). In Bezug auf die linguistische Untersuchung der Ko-Konstruktion von Veränderung im Kontext helfender Interaktionen wurden bereits konkrete Praktiken, Formate und Gesprächsmechanismen mehr oder weniger intensiv in den Blick genommen (z. B. MacMartin 2008; Weiste/ Peräkylä 2013; Voutilainen et al. 2011; Scarvaglieri 2013; Pawelczyk 2011). Lediglich vereinzelt wurde dabei das helfende Moment der Interaktionssequenzen mit dem Auslösen helfender Veränderungen und den Kernbereichen helfender Interaktionen, nämlich der Wissens- und Beziehungskonstitution, in Verbin‐ dung gesetzt (Voutilainen et al. 2011; Voutilainen et al. 2018; Graf et al. 2019). Der vorliegende Beitrag widmet sich der Forschungsfrage, wie die kontextspezifische Handlungsaufgabe der Formulierung einer Nachricht in der Gruppenpsychotherapie multimodal bewältigt wird. Fokussiert werden zum einen die Gesprächsphasen am Beispiel einer Gruppenpsychotherapiesitzung sowie die multimodalen, funktionalen und kontextuellen Charakteristika der (Formulierungs-)Vorschläge, die abschließend im Längsschnitt hinsichtlich der Ko-Konstruktion von Veränderung betrachtet werden. 1.2 Das Konzept der Smartphone-gestützten Gruppenpsychotherapie (eSA) Die Smartphone-gestützte Gruppenpsychotherapie ist ein Therapiekonzept an der LMU München, in der eine elektronische Situationsanalyse (eSA, Grosse-Wentrup et al. 2020) durchgeführt wird. Konkret geht es darum, das (sprachliche) Verhalten der Patient*innen anhand ihrer Messenger- oder E-Mail-Nachrichten zu analysieren. In der wöchentlichen Gruppentherapie werden dann insbesondere Konflikte besprochen, die mit Freund*innen, Be‐ 134 Susanne Kabatnik <?page no="135"?> kannten oder Verwandten über Messenger- oder E-Mail-Dienste entstanden sind. Die Therapie findet an der Münchener Klinik für Psychiatrie und Psycho‐ therapie statt, wo u. a. Patient*innen mit chronischen Depressionen behandelt werden. Diese leiden neben der depressiven Symptomatik häufig auch unter interpersonellen Schwierigkeiten (Schramm et al. 2011). Ziel ist es also, eine veränderte Kommunikation und damit auch ein verändertes Verhalten in Bezug auf die Mitmenschen der Patient*innen zu bewirken. Veränderung ist also wesentlicher Bestandteil des Konzepts der Smartphone-gestützten Gruppenpsy‐ chotherapie. Die eSA-Gruppenpsychotherapie gliedert sich in eine Analysephase, in der die Gruppe zunächst einen umgrenzten Ausschnitt aus einer Messenger- oder E-Mail-Nachricht genau untersucht. Die Patient*innen analysieren in diesem Teil der Sitzung die Nachricht und den entstandenen Konflikt, eruieren einen Ist-Zustand und stellen Sitzungsziele auf (siehe Kap. 4.1). In der anschließenden Lösungsphase wird mit der Gruppe eine veränderte Kommunikation erarbeitet. Dies erreicht die Gruppe, indem sie eine (re- oder neuformulierte) Antwort an die betreffende Person aus der Konflikt-Kommunikation verfasst. Für die Untersuchung von Ko-Konstruktion von Veränderung bietet sich diese Grup‐ pentherapiesituation geradezu an: Die Mitpatient*innen helfen einander bei der Analyse des Konflikts und der (Neu-)Formulierung einer Textnachricht, die von den Therapeut*innen aber moderiert, geleitet und gesteuert werden. Dabei nehmen (Formulierungs-)Vorschläge der Gruppe eine zentrale Rolle bei der Ko-Konstruktion von Veränderung ein, denn sie bieten eine verbale Unterstützung für die Patient*innen an und bilden deswegen die Fokusäußerung der vorliegenden Untersuchung. 2 Körperkommunikation in der Psychotherapie Der vorliegenden Arbeit wird der Multimodalitätsbegriff von Deppermann (2018) zugrunde gelegt, d. h. Multimodalität wird als leibliches Handeln und „Vokalität (einschließlich Sprache und Prosodie), Gestik, Blick, Mimik, die Einnahme von Körperposituren, die Bewegung im Raum und der Umgang mit Objekten“ (Deppermann 2018: 58) verstanden. Vor diesem Hintergrund möchte ich untersuchen, wie Therapeut*innen und Patient*innen leiblich und gesprochen-sprachlich miteinander interagieren, insbesondere mit Blick auf die Ko-Konstruktion von Veränderung im therapeutischen Format der eSA-Grup‐ penpsychotherapie und die damit verbundenen (Formulierungs-)Vorschläge. Untersuchungen zu Körperkommunikation in der Psychotherapie werden bereits seit den 60er Jahren des 20. Jahrhunderts durchgeführt. Psychothera‐ Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 135 <?page no="136"?> peutische Gespräche werden dabei detailliert mithilfe von Typoskripten von phonetischen wie paralinguistischen Transkriptionen - mit IPA-Symbolen und unter Angabe der Lautstärke der Stimme, der Tonhöhenbewegung, Seufzen, Lachen usw. - analysiert (Pittenger et al. 1960; Labov/ Fanshel 1977). Am Beispiel von Expansionen in psychotherapeutischen Gesprächsdaten zeigen Labov und Fanshel (1977) unter Berücksichtigung paralinguistischer Hinweise, d. h. z. B. Tempo, Lautstärke, Tonhöhenkontur und stimmlicher Qualifizierungs‐ merkmale (Atmung, Glottalisierung und Wimmern), auf welche Weise diese eine zentrale Rolle beim Ausdruck von Emotionen einnehmen. Sie verdeutlichen darüber hinaus, dass die Untersuchung paralinguistischer Signale Rückschlüsse auf die Frage ermöglicht, wie Interaktant*innen wesentliche Bedeutungskom‐ ponenten vermitteln und interpretieren, wie z. B. Anspannung oder Verschlim‐ merung durch Schweigen oder Zögern. Paralinguistische Signale, hier Pausen oder Lachen, wurden später auch zur Interpretation dispräferierter Antworten (zum Präferenz-Konzept siehe z. B. Pomerantz/ Heritage 2012: 210) in psychothe‐ rapeutischen Settings herangezogen: MacMartin (2008) zeigt die Resistenz ge‐ genüber optimistischen Fragen von Therapeut*innen bspw. anhand von Lachen auf. Läpple et al. (2021) analysieren den sich im Gesprächsverlauf verändernden Patient*innenwiderstand anhand von Antworten mit Dispräferenz hin zu Präferenz durch die Abnahme von Verzögerungssignalen und schließlich alig‐ nierenden Äußerungen. Weiter beschreiben Stukenbrock et al. (2021) anhand einer kurzen psychodynamischen Psychotherapie eine multimodale Praxis der Konstruktion von elaborierten therapeutischen Interpretationen, die (non- und para-)verbale Signale, wie bspw. die Blickvermeidung, perzeptive und kognitive Formen, epistemische Absicherungen, Klammern oder auch Selbstreparaturen beinhalten. Diese multimodalen Äußerungskomponenten dienen zur Anzeige von als vorläufig markierten Interpretationen, auf die Patient*innen zwar mit Widerstand reagieren können, sie jedoch zur Selbstexploration einladen. Stukenbrock (2021) legt darüber hinaus eine Untersuchung von Gesten in einem Selbstverteidigungstraining für junge Frauen vor - als nicht genuin psychothe‐ rapeutisches, aber helfendes Format (Pick/ Scarvaglieri 2022) -, in dem sich im Laufe der Interaktion die multimodalen Handlungen der Teilnehmerinnen verändern. Die Veränderungen betreffen formale und funktionale Aspekte der verwendeten Ressourcen, ihre multimodale Inszenierung sowie die Zeitlichkeit ihrer Ausführung. Dabei stellt Stukenbrock (2021) u. a. fest, dass Demonstrativa in ko-präsenten Interaktionen an verkörperte Praktiken gekoppelt sind und die Aufmerksamkeit der Adressat*innen auf den Körper der Sprecher*innen fordern sowie einer Transformation in Form von Reduktion durch Routinisierung unterliegen. 136 Susanne Kabatnik <?page no="137"?> 1 Eine Bemerkung zum inklusiven Sprachgebrauch im vorliegenden Beitrag: Ich ver‐ wende Interktantinnen, wenn es um das konkrete Fallbeispiel geht, weil dort nur weiblich gelesene Personen anwesend sind. Interaktant*innen und ähnliche Formen verwende ich dagegen in generischer, d. h. alle Geschlechter(identitäten) umfassender, Bedeutung. 2 Die Transkriptionskonventionen nach Mondada (2019) wurden im vorliegenden Bei‐ trag angepasst. Die Anpassungen betreffen das eingefügte Bildmaterial, das die in der Therapie anwesenden Personen zeigt. Diese mussten aus Datenschutzgründen anony‐ misiert und auf den Abbildungen unkenntlich gemacht werden, sodass Rückschlüsse auf die Personen ausgeschlossen sind. Die Verzerrung der Abbildungen hat zur Folge, dass die Körperkommunikation nur teilweise dargestellt werden kann, sodass die Bilder nicht klein im Transkript, sondern vergrößert darunter präsentiert werden. Die Untersuchungen zur Körperkommunikation in psychotherapeutischen Gesprächen machen die Relevanz weiterer multimodaler Analysen helfender Interaktionen deutlich. Denn non-, para- und verbale Signale, wie die Prosodie, Lautstärke, Körperhaltungen und Gesten, tragen wesentlich zur Bedeutungs‐ konstitution und damit auch zur Verständigung im psychotherapeutischen Gespräch bei - als Signale, die von den Interaktant*innen wahrgenommen und verstanden werden müssen, um Intersubjektivität herzustellen, die die Basis für die Ko-Konstruktion von Veränderung im therapeutischen Setting bildet. 3 Daten und Methode Die Ko-Konstruktion von Veränderung wird in der vorliegenden Studie als multimodale Praktik aufgefasst (Deppermann 2018; Stukenbrock 2021) und in der eSA-Gruppenpsychotherapie unter Anwendung der multimodalen Interak‐ tionsanalyse untersucht. Das Datenmaterial entstammt einem Videokorpus von 14 Videos, die im Zeitraum von Oktober 2021 bis Oktober 2022 an der Klinik für Psychiatrie und Psychotherapie (LMU München) aufgenommen wurden. Die Gruppenpsychotherapie findet wöchentlich statt und die Teilnahme an diesem Therapieformat ist freiwillig. An den Sitzungen nehmen etwa drei bis sechs Patient*innen 1 und ein bis zwei Therapeut*innen teil und insgesamt 30 verschiedene Patient*innen. Das Videomaterial umfasst eine Gesamtlänge von 14 h 43 Minuten. Die Datengrundlage für den vorliegenden Beitrag bildet eine Videoaufnahme einer Gruppenpsychotherapiesitzung, die multimodal transkribiert wurde (Sel‐ ting et al. 2009; Mondada 2019 2 ). Es wurde ein Feintranskript mit Informationen zur Prosodie sowie multimodalen Kommunikation angefertigt. Die Sitzung hat eine Gesamtlänge von 57,56 Minuten und es sind drei Patientinnen und eine Therapeutin anwesend sowie eine Praktikantin, die das Gespräch protokolliert. Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 137 <?page no="138"?> Eine der Patientinnen (P2) hat eine Migrationsgeschichte und spricht nicht akzentfrei Deutsch. In der folgenden Grafik ist die Sitzordnung abgebildet: Abb. 1: Sitzordnung und aufgestellte Kameras im Raum der eSA-Gruppenpsychotherapie Die Patient*innen und Therapeut*innen sitzen in einem Stuhlkreis. Die Ka‐ meras sind im Sitzungsraum vorne und hinten angebracht (in Abb. 1 oben und unten), sodass der gesamte Stuhlkreis gefilmt werden kann. Im Raum befindet sich außerdem ein Flipchart (in Abb. 1 rechts) und ein Poster von einem psychotherapeutischen Instrument, dem Kiesler-Kreis (in Abb. 1 links, siehe Abb. 1). Das Flipchart dient den Interaktant*innen zur Orientierung an den unterschiedlichen Gesprächsphasen sowie der Fixierung wichtiger Zwi‐ schenergebnisse der Gruppenpsychotherapiesitzung. Die folgende Abb. 2 zeigt den vom US-amerikanischen Psychologen Donald Kiesler 1983 entwickelten Kiesler-Kreis (siehe Guhn/ Brakemeier 2022). 138 Susanne Kabatnik <?page no="139"?> Abb. 2: Der Kiesler-Kreis Kiesler beschäftigte sich in seiner Forschung mit theoretischen, diagnostischen und therapeutischen Aspekten zwischenmenschlicher Probleme und Konflikte. Kiesler (1983) zufolge lassen sich Schwierigkeiten im Miteinander auf zwei Achsen beschreiben, nämlich erstens auf einer Achse mit den Gegenpolen domi‐ nant/ offen und unterwürfig/ geschlossen und zweitens auf einer Zugehörigkeitsbzw. Beziehungsachse mit den Gegenpolen freundlich/ nah und feindlich/ fern. Die weiteren vier abgebildeten Positionen stellen zu diesen ersten Hauptdimen‐ sionen Mischformen dar, wie beispielsweise freundlich-dominant oder freund‐ lich-unterwürfig. Kiesler vertritt die These der gegenseitigen Beeinflussung von Individuen in der Interaktion (Kiesler 1983: 186 f.). In diesem Schaubild können dann - v. a. kommunikative - Verhaltensweisen eingestuft werden, beispiels‐ weise als dominant, unterwürfig, freundlich usw. Das Kiesler-Kreis-Training zielt auf die Anpassung von tatsächlichem Verhalten auf das gewünschte je nach situationellen Gegebenheiten (Guhn/ Brakemeier 2022), d. h. ganz dezidiert auf Veränderung. Auf diese Weise nimmt der stets wahrnehmbare Kiesler-Kreis als psychotherapeutisches Instrument eine wesentliche Rolle in der eSA-Gruppenpsychotherapie ein. Denn an ihm wird das tatsächliche versus dem gewünschten kommunikativen Verhalten der Patient*innen sowie der über Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 139 <?page no="140"?> Messenger-Dienste Kommunizierenden „gemessen“ (siehe Brakemeier et al. 2021: 231 ff.), wodurch auch die Veränderung von Anfangs- und Endzustand der Sitzung eingestuft werden kann. (Formulierungs-)Vorschläge wurden in diesem Gespräch als Fokusäußerungen analysiert. Dazu wurde ein Korpus mit 31 identifizierten Vorschlägen erstellt, die auf ihren Kontext, ihre (multimodale) Ausgestaltung sowie ihre sequenzielle Organisa‐ tion ausgewertet wurden. Da es sich bei dem in diesem Beitrag präsentierten Daten‐ material um sehr sensible Aufnahmen handelt, wurden die Transkripte anonymisiert sowie die Abbildungen verzerrt, sodass keine Rückschlüsse auf die anwesenden Patient*innen und Therapeut*innen gezogen werden können. Vorbereitend auf die Analyse der Ko-Konstruktion von Veränderung im Längsschnitt sollen im Folgenden die Gesprächsphasen der eSA-Psychotherapie bestimmt werden. Im Anschluss daran gehe ich auf die (Formulierungs-)Vorschläge der Interaktant*innen und ihre turninternen sowie sequenziellen Spezifika ein. 4 Analyse 4.1 Gesprächsphasen der eSA-Gruppenpsychotherapie Um die Ko-Konstruktion von Veränderung zu untersuchen, wird die ausge‐ wählte gruppenpsychotherapeutische Sitzung zunächst in Gesprächsphasen eingeteilt. Gesprächsphasen lassen sich formal und funktional bestimmen und dienen der Strukturierung des Gesprächs (Spiegel/ Spranz-Fogasy 2001: 1247 ff.). Anhand identifizierter Gesprächsphasen können Rückschlüsse in Bezug auf die Veränderung gezogen werden, wenn bspw. anfängliche Äußerungen sich über die Phasen hinweg verändern. Die Gruppenpsychotherapiesitzung lässt sich in verschiedene, aber miteinander verbundene Gesprächsphasen einteilen (siehe Tab. 1). Nach der Begrüßung (Phase 1) werden Ziele für die Sitzung festgelegt und ein*e Patient*in für die elektronische Situationsanalyse ausgewählt (Phase 2). Anschließend wird in Phase 3 die Konflikt‐ situation beschrieben, zu der die Gedanken und Gefühle der Patient*innen abgefragt werden. Danach wird das eigene Verhalten in der beschriebenen Situation analysiert und im Kiesler-Kreis (siehe Abb. 2) eingeordnet (Phase 4). Anschließend wird das tatsächliche Ergebnis (Phase 5) mit dem Wunschergebnis verglichen sowie dieses im Kiesler-Kreis eingeordnet (Phase 6), d.-h. ein*e Patient*in möchte mit einer Antwort freundlich, dominant usw. wirken. In Phase 7 beginnt die Formulierungsphase, in der eine Textnachricht mit der Gruppe formuliert wird, gefolgt von einem Abgleich mit dem Wunschergebnis (Phase 8). Abschließend erfolgt in Phase 9 ein Rückblick auf die Sitzung in Bezug auf das Erreichen der Ziele und die Gesprächsbeendigung (Phase 10): 140 Susanne Kabatnik <?page no="141"?> Tab. 1: Gesprächsphasen der eSA-Gruppenpsychotherapie Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 141 <?page no="142"?> Die Gesprächsphasen werden dabei immer von einer Frage oder einer Auffor‐ derung der Therapeutin eingeleitet, d. h. die Phase der Festlegung von Sitzungs‐ zielen wird beispielsweise durch was nehmen sie sich für heute VOR (01: 44-01: 54) eröffnet, die Phase der Beschreibung und Interpretation der Situation durch um was für ne situation DREHT sichs? (02: 50-02: 51). Wesentlich für die vorliegende Untersuchung der Ko-Konstruktion von Veränderung sind v. a. die Phasen der Beschreibung der Situation (3) und die Formulierungsphase (7). Zwei Gesprächsphasen werden in diesem Beitrag für die Untersuchung der Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsy‐ chotherapie in den Blick genommen, nämlich die Phase der Beschreibung der Situation sowie die Formulierungsphase. Durch die Beschreibung der Situation wird die gesamte Gruppe auf einen Wissensstand gebracht, d. h. es wird ein common ground (Clark 1982) hergestellt, der für alle weiteren Phasen die Gesprächsgrundlage bildet. In dieser Phase geht die Patientin auf ihren Konflikt ein und beantwortet Rückfragen. Wie ich in Kap. 4.2 zeigen werde, ist die Beschreibung nicht rein deskriptiver Natur, sondern birgt eine Reihe an Positionierungen (Lucius-Hoene/ Deppermann 2004: 166), die die Gruppe bei der Einstufung der Situation unterstützen. Weiter wesentlich ist die For‐ mulierungsphase für die vorliegende Untersuchung, weil sich dort - wenig überraschend - die meisten (Formulierungs-)Vorschläge identifizieren lassen, mithilfe derer ein entsprechender Nachrichtenvorschlag an die Person aus der Messenger- oder E-Mail-Kommunikation konzipiert wird. So lassen sich diese Phasen betrachtend Anfangs- und Endzustand der Gruppenpsychotherapie miteinander vergleichen und Schlussfolgerungen über die Ko-Konstruktion von Veränderung ableiten. 4.2 Beschreibung der Situation Im Fallbeispiel der vorliegenden Untersuchung stellt Patientin 3 eine berufliche Konfliktsituation in der gruppenpsychotherapeutischen Situationsanalyse vor, die der Ausgangspunkt für die weitere Interaktion bildet. Die Patientin kontex‐ tualisiert zuerst für die Anwesenden die Situation und verliest anschließend die problematische Nachricht. Es handelt sich um einen Konflikt in ihrer beruflichen Funktion als Assistenz in der universitären Lehre. Die Patientin soll einem Gastprofessor assistieren, den sie über Monate zu erreichen versucht, dieser meldet sich aber erst spät und zudem inadäquat zurück: 142 Susanne Kabatnik <?page no="143"?> Ausschnitt 1 (02: 53-05: 22) 01 P3 ((kratzt sich am Hinterkopf)) h° ähm 02 - (.) es es geht um eine Email ähm (0.35 03 - ((durchsucht Smartphone, Abb. 3)) 04 - und zwar ne berufliche mail? ähm (.) 05 - die ich erHALten hab? ((richtet sich das Haar)) ähm von 06 - °h ähm einem der professoren mit denen ich sehr eng 07 - ähm (0.23) zusammenarbeiten musste EIgentlich ((schüttelt den Kopf)) [lachen] 08 - aber er war sehr schwer erreichbar war die ganze zeit? ((richtet sich das Haar)) ((schaut auf Smartphone)) 09 - UND äh so für den KONtext ich weiß nicht hmm also es geht halt (.) 10 - also der bereich wo ich ARbeite das ist 11 - halt der weiterbildungsbeREICH und wir haben so moDUle […] ((semiotische Handgesten)) - - […] - - da der HERR sehr beSCHÄFtigt ist ähm HAT er äh innerhalb von drei MOnaten ((schaut nach oben)) hh° auf nur zwei meiner mails geANTwortet? ((nickt)) und (.) ich brauchte die materialien unbeDINGT hab dem die mails immer wieder geSCHICKT [semiotische Handgesten] - - […] 12 P3 ja: ; = weil ich ((semiotische Handgeste)) 13 - ich brauchte das 14 - (.) aso es ist notwendig weil (0.28) ähm - - (1.21) JA ((schüttelt den Kopf)) ohne können wir hier nicht ARbeitn= aso wir sind ((streicht sich über das Knie)) ABhängig sozusagen; (.) 15 P3 ähm: ((schmatzt)) und (.) ähm er hat geANTwortet? ((senkt schnell die Hand)) 16 - (0.24) ((schmatzt)) °h mit äh liebe werauchIMMer? ((kratzt sich am Kopf)) 17 - 1.22) in der (.) eingang? 18 T aso SO hat er das auch geSCHRIEbn? 19 P1 [hahaha] ((lacht bebend)) Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 143 <?page no="144"?> 20 P3 [ja] ((nickt schnell)) 21 T okAY. °h […] Abb. 3: Körperhaltung von P3 beim Durchsuchen des Smartphones In Ausschnitt 1 schildert P3 den Konflikt aus ihrer Sicht: Es geht um eine berufliche Mail an einen Gastprofessor, mit dem sie zusammenarbeiten musste eigentlich und dieser nur schwer erreichbar war die ganze zeit? . Danach geht P3 zu Kontextualisierungszwecken auf die beruflichen Bedingungen ein (d. h. Weiterbildungsbereich mit Modulen, Materialien als Grundlage für ihre Arbeit). Die Formulierungsdynamik in dieser Kontextualisierung ist zögerlich, d. h. von vielen Pausen, Verzögerungssignalen (z. B. ähm), langem Ein- und Ausatmen sowie steigender Intonation in Deklarativsätzen, z. B. aber er war sehr schwer erreichbar war [sic] die ganze zeit? begleitet. Zudem richtet P3 ihren Blick mehrfach auf das Smartphone (siehe Abb. 3), obwohl sie lediglich am Ende der Beschreibung tatsächlich vorliest. Die Schultern sind nach oben gezogen und angespannt, sodass die Zögerlichkeit des Redebeitrags und die Körperhal‐ tung auf das Unbehagen und die immer noch starke Belastung der Patientin hindeuten (Labov/ Fanshel 1977). Diese paralinguistischen Hinweise nehmen also eine zentrale Rolle beim Ausdruck von Emotionen ein und helfen den Interaktantinnen dabei, wesentliche Bedeutungskomponenten zu vermitteln und zu interpretieren. Diese berufliche Situation bringt die Patientin zudem später im Gespräch explizit mit ihrer Erkrankung durch ab da war ich krank in Verbindung, was ebenfalls die subjektiv erlebte Schwere der beschriebenen Situation aufzeigt. 144 Susanne Kabatnik <?page no="145"?> Die Patientin erzählt, dass sie schließlich eine Woche vor Vorlesungsbeginn eine Antwort vom Gastprofessor bekommt, die den Ausgangspunkt für die in der aufgezeichneten Gruppenpsychotherapie stattfindende Interaktion bildet. Der Professor verwendet in seiner Antwort die Anrede WerAuchImmer, anstelle des Namens der Patientin, obwohl er diesen aus früheren E-Mails kennen müsste: und (.) ähm er hat geANTwortet? (0.24) ((schmatzt)) °h mit äh liebe werauchIMMer? (1.22) in der (.) eingang? Damit wird die problematische Antwort des Gastprofessors thematisiert. P3 leitet die Äußerung mit mehreren äh/ m, Pausen, Schmatzen und steigender Intonation (er hat geANTwortet? ) ein, was zusätzlich zu der zögerlichen Formu‐ lierungsdynamik der Kontextualisierung die Schwierigkeit der Situation und andauernde emotionale Befangenheit von P3 anzeigt. Besonders deutlich wird dies kurz vor der Verbalisierung der gebrauchten Anrede WerAuchImmer, die von einer längeren Pause, einem äh und einer weiteren nachfolgenden Pause von 1.22 begleitet wird. Die Reaktionen der anderen Interaktant*innen folgen direkt im Anschluss an das Verlesen der E-Mail des Professors. Die Therapeutin reagiert hier mit der Nachfrage aso SO hat er das auch geSCHRIEbn? , mit der sie einerseits ihr Verstehen dokumentiert und absichert (Schützeichel 2012: 255), andererseits aber auch bereits eine Positionierung ausdrückt. Die therapeutin‐ nenseitige Reaktion ist eine Deklarativsatzfrage, hier eingeleitet durch aso als turninitiale Partikel, die ihre Schlussfolgerung, dass bzw. ob der Professor die Anrede auf diese Weise gestaltet hat, ankündigt (Blühdorn et al. 2017: 24 f.). Die steigende Intonation zeigt jedoch die Unsicherheit gegenüber der eigenen Interpretation auf und die Therapeutin elizitiert mit ihrer Deklarativsatzfrage die Bestätigung ihres Verständnisses bzw. ggf. weitere Aufklärung. Durch die (non- und para-)verbalen Signale dient diese Äußerung der Therapeutin als epistemische Absicherung und als vorläufig markierte Interpretation der Vorgängeräußerung. Die Betonung auf SO und geSCHRIEbn und die damit einhergehende Erhöhung der Lautstärke lässt zusätzlich vermuten, dass diese Anrede auch von der Therapeutin als (mindestens) ungewöhnlich eingestuft wird. P3 bejaht die Richtigkeit des Sachverhalts, worauf die Therapeutin mit einem okAY. mit fallender Intonation reagiert. Dieses okAY. in 3. Position markiert den Sachverhalt als verstanden (Betz/ Deppermann 2021: 55). Zusätz‐ lich wird durch die fallende Intonation und die Betonung der zweiten Silbe die gewählte Anrede des Professors bewertet, wodurch sich die Therapeutin wiederholt positioniert. Patientin 1 reagiert mit lautem und bebendem Lachen, was die Absurdität dieser Anrede ebenfalls markiert (Klempa 2008: 58). Patientin 2 reagiert verzögert mit: Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 145 <?page no="146"?> Ausschnitt 2 (09: 23-09: 34) 01 P2 aso ich wurde keine lust mehr HAben 02 - (.) mit so einem mensch zusammen zu ARbeiten= ((schüttelt den Kopf)) 03 - oder für eine firma fü solche firma ((streckt Hand aus, Abb. 4)) 04 - die so: mit mit (.) arBEIter betrachtet; 05 - (.) wer auch immer; Patientin 2 drückt in ihrer Äußerung ihre Abneigung gegen den Arbeitgeber von Patientin 3 aus sowie ihre Unlust, für eine Firma tätig zu sein, die so: mit mit (.) ARbeiter betrachtet; (.) wer auch immer; . Sie schüttelt dabei ihren Kopf, ihr Oberkörper bewegt sich und sie streckt ihre rechte Hand abschließend aus (siehe Abb. 4), wodurch sie ihrer Positionierung Nachdruck verleiht (Bauer/ Auer 2012: 9 f.). Mit diesen Reaktionen solidarisieren sich die Interaktantinnen mit Patientin 3, was in dieser Gruppenpsychotherapie die Basis für die Ko-Konstruktion von Veränderung darstellt. Im späteren Gesprächsverlauf gibt Patientin 3 an, auf die Mail des Professors nicht schriftlich reagiert zu haben. Sie sei zum vorgeschlagenen Zoom-Meeting erschienen, habe damit feindselig unterwürfig reagiert (siehe Kap. 4.1: Einstu‐ fung im Kiesler-Kreis). Das Wunschergebnis bezieht sich auf das Setzen einer Grenze und das Aufzeigen eines nicht akzeptablen Verhaltens des Professors, was im Kiesler-Kreis (siehe Abb. 2) als dominant eingestuft wird. Die beschriebene Interaktionssituation wird von der Patientin para-, non- und verbal relevant gesetzt. Die Gruppe zeigt sich mit der Patientin solidarisch, was die Grundlage für die anstehende Handlungsaufgabe, nämlich die Formu‐ lierung der Antwort an den Professor, und somit auch für die Ko-Konstruktion von Veränderung darstellt. 4.3 (Formulierungs-)Vorschläge Zur Beantwortung der Forschungsfrage nach der Ko-Konstruktion von Ver‐ änderung in der eSA-Gruppenpsychotherapie wurden (Formulierungs-)Vor‐ schläge der Interaktantinnen untersucht. Wesentlich für die Ko-Konstruktion von Veränderung sind die Vorschläge in diesem psychotherapeutischen Setting, weil sie konkret darauf abzielen, die Handlungsaufgabe der Sitzung, nämlich die Formulierung einer Nachricht (hier an den Gastprofessor), zu erreichen. Im analysierten Fallbeispiel konnten 31 (Formulierungs-)Vorschläge identifiziert 146 Susanne Kabatnik <?page no="147"?> werden: 14 Vorschläge kommen von der betroffenen Patientin 3 selbst, drei von der Therapeutin, sechs von Patientin 1 und acht von Patientin 2. Kontext Die (Formulierungs-)Vorschläge sind kontextuell eingebettet in die Formulie‐ rungsphase, d. h. die Formulierungsvorschläge werden zumeist im letzten Drittel des Gesprächs realisiert. Da es sich bei (Formulierungs-)Vorschlägen um suggestions (Couper-Kuhlen 2014: 634) anderer handelt, müssen diese ein‐ gefordert werden (Couper-Kuhlen 2014: 634). Andernfalls können suggestions als unhöflich und grenzüberschreitend wahrgenommen werden (siehe Shaw 2013: 17; West 2021: 201). Dass es sich hierbei um suggestions (Couper-Kuhlen 2014: 633 f.) handelt, kann an den Beteiligungsrollen der Interaktant*innen festgemacht werden, denn sowohl beim Agens der zukünftigen Handlung als auch deren Benefizienten handelt es sich um eine andere Person, d. h. nicht den*die Vorschlagende*n (Couper-Kuhlen 2014: 634). Ausschnitt 3 (39: 14-39: 26) 01 P3 ((seitlich gesenkter Kopf, Abb. 5)) 02 - ech hhh° 03 - (2.1) da brauch ich HI: Lfe ((lacht)) °hhh ((Kopfbewegung ganz nach unten und wieder hoch)) 04 T deswegen sitzen wir zusammen 05 P3 ja (.) hhh° da brauch ich echt hilfe ((tiefe Kopfbewegung, Abb. 6)) Abb. 5: Seitlich gesenkter Kopf Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 147 <?page no="148"?> 3 Die Sequenzposition 0 beschreibt die Äußerung, die vor der Fokusäußerung realisiert wird. Abb. 6: Tiefe Kopfbewegung In Ausschnitt 3 verbalisiert P3 durch ech hhh° (2.1) da brauch ich HI: lfe […] ja (.) hhh° da brauch ich echt hilfe, dass sie auf die Unterstützung der Gruppe angewiesen ist. Durch den seitlich gesenkten Kopf (siehe Abb. 4), das ech und die Realisierung des Hilfe-Benötigens, begleitet von langem Ausatmen sowie einer Pause und der Betonung auf HI: lfe sowie einer tiefen Kopfbewegung (siehe Abb. 5), markiert Patientin 3 sehr niedrige Agency (Marciniak 2017). Auf diese Weise befähigt P3 die Gruppe, Vorschläge zu machen, und elizitiert diese. Die Anzeige der niedrigen Agency und das Elizitieren von Vorschlägen bildet aus sequenzieller Sicht Position 0 3 (siehe Kap. 4.4; siehe dazu weiter auch Kabatnik et al. 2019), auf die (Formulierungs-)Vorschläge der Interaktantinnen folgen und nachstehend bezüglich ihrer (multimodalen) Ausgestaltung beschrieben werden. (Multimodale) Ausgestaltung von (Formulierungs-)Vorschlägen Die 31 im Fallbeispiel identifizierten (Formulierungs-)Vorschläge lassen sich bezüglich ihrer inhaltlichen, (morpho-)syntaktischen, lexikalischen und mul‐ timodalen Ausgestaltung sowie Auffälligkeiten bezüglich ihrer Komplexität charakterisieren. Die Vorschläge der Gruppe beziehen sich zumeist auf kon‐ krete Formulierungen (siehe Bsp. 1; n = 28/ 31; 90,3 %), können aber auch Handlungen thematisieren (siehe Bsp. 2; n = 4/ 31; 12,9 %). Formal werden die Vorschläge als Deklarativsätze (siehe Bsp. 1 und 2; n = 24/ 31; 77,4 %), 148 Susanne Kabatnik <?page no="149"?> 4 Dieser (Formulierungs-)Vorschlag bezieht sich auf die Beendigung der formulierten Email an den Professor, nämlich die Nachricht mit dem Vornamen und Namen von Patientin 3 abzuschließen. Interrogativsätze (siehe Bsp. 3; n = 5/ 31; 16,1 %) oder Phrasen(formate) (siehe Bsp. 4; n = 3/ 31; 9,7-%) realisiert, vgl. die folgenden Beispiele: (1) P1 also ich würde auf jeden fall erstmal sehr geehrter herr blablabla jeden titel rein das so formell und (0.27) [ähm] [korrEKT] wie möglich machen als richtigen gegenpol, ((redebegleitende Handgesten mit gestischer Reduplikation)) (2.14) °h des schon des erste wo er schon eigentlich sehn kann hhh°(0.53) wie mans macht [ne] (2) P2 […] man könnte auch das ähm ja: (.) in diese zoom meeting äh beSPRECHen ((streckt die Finger aus)) das (0.35) könnte sogar besser ausgejen als schriftliche form °h (0.49) ähm weil es meh: pe: SÖNlich i: st; also (1.76) ähm (0.69) °h bei schriftliche FO: RM? er könnte gedanken haben dass du (0.54) ähm ((streckt die Hand aus)) das gegen ihm nutzt h° aso °hh (0.40) als beLEG; h° ((streicht sich über das Haar)) (3) P2 mmh wie wäre es mit äh ich finde es [REspektlo: : s] dass sie mich (0.48) wieauchimmer tituLIEren nennen ((schüttelt den Kopf)) (4) P2 VORname name; ((Lachansatz)) 4 Auffällig ist in Bezug auf die Form der Vorschläge der häufige Gebrauch des Konjunktivs (wäre in 3; n = 14/ 31; 45,2 %) und Modalverben (könnte in 2), und die ich-würde-Konstruktion (siehe Bsp. 1; n = 7/ 31; 22,6 %), die nicht nur die Tentativität der zu verhandelnden Sachverhalte kennzeichnet, sondern den Vorschlag auch als subjektiv markiert. Weiter auffällig ist die fast durchgängige zögerliche Formulierungsdynamik (n = 23/ 31; 74,2 %), die die Unsicherheit über die eigenen Vorschläge markiert. Bsp. 1 thematisiert einen Vorschlag von P1 zur Anrede in der Antwort an den Gastprofessor, die direkt auf die Verbalisierung niedriger Agency folgt (siehe Kap. 4.4). In Bsp. 2 schlägt P2 eine persönliche Zoom-Besprechung vor - als Gegenvorschlag zur schriftlichen Antwort. Der Formulierungsvorschlag in Bsp. 3 dient der Einstufung des Verhaltens des Professors und Bsp. 4 fokussiert den Abschluss der Nachricht, die den Vor- und Nachnamen von P3 beinhalten soll. Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 149 <?page no="150"?> Mit Blick auf die verwendete Lexik sind Hedges, Diskursmarker und -parti‐ keln auffällig, wie z. B. eigentlich (in 1), schon, einfach und vielleicht, durch die die Äußerungen abgeschwächt und relativiert werden und eine gewisse Reserviertheit bezüglich der eigenen Einordnung ausgedrückt wird (siehe Linke et al. 2004: 157). Dies kann mit der deontischen Autorität (Stevanovic 2023) der Sprecherinnen erklärt werden und unterstreicht den suggestion-Charakter der Formulierungsvorschläge, denn die Sprechenden machen Vorschläge für andere, d. h. sie handeln weder zukünftig aktiv, noch sind sie Nutznießer der zukünftigen Handlung (siehe Couper-Kuhlen 2014: 634). Auch finden sich Bewertungen einleitende Verben, wie z. B. finde (in 3), glaube, weiß in ich-weiß-nicht-ob-Konstruktionen, die dazu verwendet werden, einen Formulie‐ rungsvorschlag anzunehmen oder abzulehnen. Bewertungen gehen dann auch mit evaluierenden Adjektiven einher, wie z. B. unangemessen, respektlos (in 3), abwertend oder eklig, mit denen das Verhalten des Professors eingestuft wird. Zudem wird kommunikative Lexik verwendet (z. B. besprechen in 2 oder schreiben), was die Handlungsaufgabe der Gruppe, nämlich gemeinsam eine Nachricht zu formulieren, kennzeichnet. Bezüglich der multimodalen Ausgestaltung der (Formulierungs-)Vorschläge können wesentliche non- und paraverbale Signale zur Herstellung von Intersub‐ jektivität der Bedeutungskonstitution identifiziert werden. Beispiel (1) wird an‐ fänglich schnell und fast pausenlos vorgetragen. Die Betonung liegt auf korrEKT, wodurch das Lexem sowie das Konzept von korrektem Textsortenwissen samt gebräuchlicher Anredeformen als relevant markiert wird. Die Schnelligkeit der Äußerung lässt darauf schließen, dass P1 sich (relativ) sicher zu sein scheint mit ihrem Vorschlag. Dabei setzt sie durch starke redebegleitende Handgesten mit gestischer Reduplikation (siehe Bressem 2015: 433) das Setzen eines Gegenpols relevant. In Beispiel (2) liegt die Betonung auf dem Besprechen des Problems in einem Zoom-Meeting. Im Gegensatz zu Beispiel (1) hat die Betonung in (2) auf beSPRECHen eine gegenüberstellende Funktion, nämlich eine mündliche versus einer schriftlichen Reaktion. Die ausgestreckten Finger von Patientin 2 deuten auf eine Antizipation mehrerer Möglichkeiten hin, von denen eine andere als die bisher besprochene aufgezeigt werden. Patientin 2 verbalisiert anschließend einen möglichen Nachteil der schriftlichen Kommunikation. Die Zögerlichkeit ihrer Äußerung manifestiert sich dabei im Haarestreichen, den häufigen Pausen und der steigenden Intonation bspw. in FO: RM? und unterstreicht ihre Unsi‐ cherheit gegenüber ihrem Vorschlag. Wie in Beispiel (1) zeigt die Betonung in Beispiel (3) auf REspektlo: : s die Relevanz des Ausdrucks und eine evaluative Positionierung gegenüber dem Verhalten des Professors auf. Zudem verstärkt das abschließende Kopfschütteln von Patientin 2 ihre Fassungslosigkeit über 150 Susanne Kabatnik <?page no="151"?> diese Anrede und bildet im Zusammenspiel mit der Äußerung eine Bekräftigung der ausgedrückten Positionierung. Der Vorschlag in Beispiel (4) bezieht sich auf das Verschriftlichen des gesamten Namens von Patientin 3 am Ende der Nachricht. Die Betonung auf VORname und die fallende Intonation in name; dienen der Relevanzmarkierung des vollen Namens der betroffenen Patientin: Der vollständige Name der Patientin soll pointiert ans Ende der Nachricht gesetzt werden - als Gegenentwurf zur Anrede WerAuchImmer, als (eventuell) schelmischer Paukenschlag zum Anbahnen einer Korrektur des Verhaltens seitens des Professors, worauf auch der Lachansatz von P2 hindeutet. In Bezug auf die Komplexität der Äußerungen sind unterschiedliche Komple‐ xitätsgrade festzustellen, im Sinne von kurzen initiativen bis hin zu längeren Äußerungen, die mit Begründungen und insertierten oder nachgeschobenen Informationen einhergehen (siehe dazu auch Spranz-Fogasy et al. 2018). Die Vorschläge können mehr oder weniger komplex sein. Weniger komplex sind Phrasen(formen), wie z. B. VORname Name (siehe Bsp. 4). Komplexer sind Vorschläge mit Begründungen, Positionierungen zu vorherigen Formulierungs‐ vorschlägen sowie in Bezug auf das Verhalten des Professors, wie z. B. (2) weil es meh: pe: SÖNlich i: st; also (1.76) ähm (0.69) °h bei schriftliche FO: RM? oder weil der war eklig, wodurch sich die Teilnehmenden mit der Patientin solidarisieren und ihr Mitgefühl ausdrücken, was gruppenidentitätsstiftende Funktionen erfüllt (siehe Kreuz et al. 2017: 149). Durch die Anzahl an (Formulierungs-)Vorschlägen, die damit signalisierte konkrete Unterstützung, aber auch durch die darin enthaltenen Positionie‐ rungen und das Mitgefühl kann die Ko-Konstruktion von Veränderung vor‐ strukturiert werden: Die Gruppe ist an der Lösungsfindung für das angezeigte Problem beteiligt; die Patientin ist mit ihrem Problem somit nicht mehr allein, sondern kann aus den Vorschlägen ggf. das auswählen, was zu ihrem formu‐ lierten Ziel am besten passt. Die Ko-Konstruktion von Veränderung entfaltet sich jedoch erst mit der Annahme oder Ablehnung der Formulierungsvorschläge und der so geleisteten Hilfe, d. h. in der sequenziellen Abfolge in der interaktiven Dimension, die im Folgenden vorgestellt wird. 4.4 Sequenzielle Organisation von (Formulierungs-)Vorschlägen Für die Untersuchung der Ko-Konstruktion von Veränderung in der Interaktion der eSA-Gruppenpsychotherapie wurden die (Formulierungs-)Vorschläge der Gruppe auf ihre sequenzielle Organisation untersucht, wodurch der Mecha‐ nismus der Veränderung beschrieben werden kann (siehe dazu auch Spranz-Fo‐ gasy et al. 2018). Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 151 <?page no="152"?> 5 Die konditionelle Relevanz in der Gesprächsanalyse ist ein normativer Mechanismus, der auf sozialen Erwartungen basiert und nicht auf statistischen Regularitäten. Selbst wenn Erwartungen nicht erfüllt werden, wird dies durch verschiedene Handlungen der Gesprächs‐ teilnehmer angezeigt und oft gerechtfertigt. Dies zeigt, dass die Teilnehmer auch dann an den normativen Erwartungen orientiert sind, wenn sie nicht erfüllt werden. Die Schaffung von Rechenschaftspflicht für Handlungen erfolgt durch den Handlungsvollzug selbst, indem der Sprecher durch seine Äußerungen reflektiert, dass er sich bemüht, einen angemessenen und verständlichen Beitrag zur aktuellen Interaktion zu leisten (siehe z.-B. Deppermann 2014: 28). Nach der Signalisierung niedriger Agency durch P3 in Position 0 folgt der erste Vorschlag zu Formulierung von P1 in Position 1, was in der folgenden schematischen Darstellung zusammengefasst werden kann: Posi‐ tion Zeit Spre‐ cher*in Sequenz Sprachhand‐ lungstyp 0 39: 14- 39: 26 - P3 ech hhh° (2.1) da brauch ich HI: lfe ((Kopfbewegung ganz nach unten und wieder hoch)) […] ja (.) hhh° da brauch ich echt hilfe ((tiefe Kopfbewegung)) Anzeige nied‐ riger Agency (thematisch) 1 39: 26- 39: 36 - P1 also ich würde auf jeden fall erstmal sehr geehrter herr blablabla jeden titel rein das so formell und (0.27) [ähm] [korrEKT] wie möglich machen als richtigen gegenpol, ((starkes Gestikulieren)) (2.14) °h des schon des erste wo er schon eigentlich sehn kann hhh°(0.53) wie mans macht [ne] (Formulie‐ rungs-) Vor‐ schlag Tab. 2: Sequenzielle Organisation von Formulierungsvorschlägen - Position 0 und 1 Laut Formulierungsvorschlag von P1 in Position 1 solle die Anrede so korrekt und regelkonform wie möglich gestaltet werden - als richtigen gegenpol, damit der Professor sieht, wie mans macht, was impliziert, dass P1 die Anrede des Professors als falsch und inadäquat einstuft und P3 zu einer Korrektur durch ein Gegenbeispiel rät. (Formulierungs-)Vorschläge setzen Reaktionen in Form von Zustimmung oder Ablehnung oder ggf. Positionierungen konditionell relevant. 5 In der 2. Sequenzposition (siehe Tab. 3) wird also eine Reaktion der Interaktantinnen erforderlich, die formal und inhaltlich mit dem Vorschlag von P1 aligniert. P3 152 Susanne Kabatnik <?page no="153"?> reagiert mit dreifachem, vehementem Nicken zum Ausdruck völliger Konformität, die Therapeutin bejaht den Vorschlag mit einem kurzen mhm und P2 reagiert elaboriert mit genau und der Paraphrase sehr geehrte gegenau (0.29) hee professor soundso (.). Weil Vorschläge eine Zustimmung oder deren Ablehnung konditionell relevant setzen (siehe Couper-Kuhlen 2014: 634), können diese Reaktionen als second pair part der (Formulierungs-)Vorschläge bestimmt werden. Posi‐ tion Zeit Spre‐ cher*in Sequenz Sprachhand‐ lungstyp 0 39: 14- 39: 26 - P3 Notwendigkeit von Hilfe Anzeige nied‐ riger Agency (thematisch) 1 39: 26- 39: 36 - P1 Formulierungsvorschlag zur korrekten Anrede an Professor (Formulie‐ rungs-) Vor‐ schlag 2 39: 36- 39: 51 P3 TP2 a) ((nickt dreimal vehement)) b) mhm c) genau sehr geehrte gegenau (0.29) hee professor soundso (.) ((gestikuliert)) Zustimmung Tab. 3: Sequenzielle Organisation von Formulierungsvorschlägen - Position 2 mit Zu‐ stimmung Die Reaktionen von T, P3 und P2 in Position 2 können demnach als völlige Zustimmung und präferiert gewertet werden. P2 setzt dann zu einem neuen Vorschlag an, nämlich hmhm hhh° (1.31) man könnte auch das ähm ja: (.) in diese zoom meeting äh beSPRECHen […], worauf P3 mit bedeutsamem Schweigen zur Anzeige von Ablehnung des Vorschlags und Dispräferenz reagiert (siehe Bonacchi 2020; MacMartin 2008; Buchholz et al. 2022: 132). Auch P1 reagiert - hier durch eine lange Pause eingeleitet - dispräferiert durch (2.36) ja: ; aber ich finde des is so: (.) des löst direkt ne reaktion aus und da sollte auch direkt äh ne: (1.29) °h AB (.) grEnzUng ((Hand zeichnet eine Grenze)) erfolgen= […] und die Positionierung einfach direkt °h antwort hier freundchen hier so gehts nich [ähm] (1.51) stopp.. Durch freundchen degradiert P1 den Professor, setzt ihm durch die Handbewegung eine Grenze und solidarisiert sich so wiederholt mit P3. Durch die Grenzen setzende Handbewegung, bei der die Geste als „abstrakte Version einer realen Handlung [dient]“ (Streeck 2016: 72), avanciert dieses multimodale Zusammenspiel in situ zu einer Inszenierung des Konflikts mit dem Professor Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 153 <?page no="154"?> (Stukenbrock 2021). Der Vorschlag von P2 eines persönlichen Gesprächs wird demnach abgelehnt, hier zusammengefasst in der folgenden schematischen Darstellung der sequenziellen Organisation: Posi‐ tion Zeit Spre‐ cher*in Sequenz Sprachhand‐ lungstyp 0 39: 14- 39: 26 - P3 Notwendigkeit von Hilfe Anzeige nied‐ riger Agency (thematisch) 1 39: 51- 40: 19 P2 hmhm hhh° (1.31) man könnte auch das ähm ja: (.) in diese zoom meeting äh beSPRECHen ((streckt die Finger aus)) das (0.35) könnte sogar besser ausgejen als schriftliche form °h (0.49) ähm weil es meh: pe: SÖNlich i: st; also (1.76) ähm (0.69) °h bei schriftliche FO: RM? er könnte gedanken haben dass du (0.54) ähm ((streckt die Hand aus)) das gegen ihm nutzt h° aso °hh (0.40) als beLEG; h° ((streicht sich über das Haar)) (Formulie‐ rungs-) Vor‐ schlag 2 40: 19- 40: 42 - P3 P1 a) ((schweigt)) b) 2.36) ja: ; aber ich finde des is so: (.) des löst direkt ne reaktion aus ((Handbewegung)) und da sollte auch direkt äh ne: (1.29) °h AB (.) grEnzUng ((Handbewegung)) erfolgen= […]einfach direkt °h antwort hier freundchen hier so gehts nich [ähm] (1.51) stopp. Ablehnung 3 40: 44- 41: 06 - P3 (0.78) °h ja: also eigentlich vielleicht wäre auch tatsächlich ne gu: te Antwort auch sowas (.) ähm (0.55) einfach (.) äh (2.41) mmh h° (0.80) sehr geehrte herr punkt punkt punkt °hhh öh hhh° (7.71) (Formulie‐ rungs-) Vor‐ schlag 154 Susanne Kabatnik <?page no="155"?> 4 41: 20- 42: 05 P1 ((schreibt Vorschlag auf das Flipchart))) (implizite) Zu‐ stimmung Tab. 4: Sequenzielle Organisation von Formulierungsvorschlägen - Position 2 bis 4 Ablehnung Nach Zustimmung von P3 und Wiederaufgreifen des ersten Vorschlags (Position 3) gilt dieser als gesetzt und wird auf dem bereitstehenden Flipchart für alle sichtbar verschriftlicht (Position 4). In einem stetigen Prozess von Vorschlagen, Annehmen, Ablehnen, Begründen, Positionieren und Reformulieren, d. h. mit sich stetig verändernden Vorschlägen und (dis)präferierten Reaktionen darauf, wird sukzessive eine mit den Zielen von P3 alignierende Antwortmöglichkeit an den Professor konzeptualisiert, die wie folgt lautet: (5) „Sehr geehrter Herr Professor xy, die Art und Weise der Begrüßung empfinde ich als unangemessen und respektlos. Ich erwarte von Ihnen, dass sie mich mit meinem Namen ansprechen. In der Hoffnung auf ein konstruktives Zoom-Meeting. Bis dahin, beste Grüße, Vorname Name Signatur“ P3 liest die ko-konstruierte Nachricht für die Gruppe vor, wobei sie häufiger nickt. P3 gibt auf Nachfrage zu ihren Gefühlen an: (1.44) mmh (1.05) ja (1.46) gut; (1.16) ja: auf jeden fall äh wesentlich besser als äh (.) als schweigen ja; = un ich glaub auch das setzt au nochmal n anderes äh (1.61) äh hhh° ne ne andere f form von äh (2.59) ja: von äh grenze und äh (1.22) (52: 24-52: 48). P3 sieht in der Antwort das Aufzeigen einer Grenze, d. h. P3 hat nun einen Textvorschlag, der so abgeschickt werden kann. Nach der Einordnung der Nachricht im Kiesler-Kreis zu freundlich-dominant - das formulierte Ziel wurde also erreicht - geben die Patientinnen in der Endphase an, alle aus dieser Situationsanalyse gelernt zu haben. Die Gruppe hat durch die Formulierungsvorschläge eine E-Mail konzipiert, die einen Gegenentwurf zur tatsächlichen Reaktion von P3 darstellt. Die Gruppe stellt hier im geschützten Rahmen der Gruppenpsychotherapie die Situation nach, die Gruppe inszeniert eine Reaktion an den Professor. Beim Formulieren erhält die Patientin die volle Solidarität der Gruppe, was durch das Lachen und die Positionierungen gegenüber dem Professor und die Bewertungen seines Verhaltens angezeigt wird. Durch die Unterstützung der Gruppe und das Expe‐ rimentieren mit verschiedenen Formulierungen kann die belastende Situation Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 155 <?page no="156"?> aufgearbeitet werden, wodurch Veränderung ko-konstruiert wird. Auf diese Weise haben die Patientinnen nicht nur eine veränderte Reaktionsmöglichkeit, also eine erhöhte Agency, sondern können auch auf den Lösungsweg dieser Interaktionssituation zurückgreifen. 5 Zur Ko-Konstruktion von Veränderung durch (Formulierungs-)Vorschläge Im vorliegenden Beitrag wurde untersucht, wie die kontextspezifische Hand‐ lungsaufgabe der Formulierung einer Nachricht im spezifischen Konzept der eSA-Gruppenpsychotherapie multimodal bewältigt wird. Am Beispiel einer Gruppenpsychotherapiesitzung wurden dazu erstens die einzelnen Gesprächs‐ phasen identifiziert, die sich in 1. Begrüßung, 2. Festlegung von Sitzungszielen, 3. Beschreibung und Interpretation der Situation, 4. Analyse des eigenen Ver‐ haltens, 5. Tatsächliches Ergebnis, 6. Wunschergebnis, 7. Formulierungsphase, 8. Abgleich mit Wunschergebnis, 9. Reflexion über Sitzung und 10. Gesprächs‐ beendigung aufteilen lassen. Eingeleitet werden die Gesprächsphasen stets von der Therapeutin, die das Gespräch auf diese Weise lenkt und steuert. Genauer fokussiert wurden anschließend die Beschreibungs- und Formulierungsphase, die einen Abgleich von Anfangs- und Endzustand sowie die Ko-Konstruktion von Veränderung im Gespräch ermöglichen. Zweitens wurden die meist in der Formulierungsphase vorkommenden und sehr frequenten (Formulierungs-)Vorschläge auf ihre formalen, funktionalen und kontextuellen Charakteristika sowie ihre sequenzielle Organisation unter‐ sucht. Die identifizierten (Formulierungs-)Vorschläge folgen einer rekurrenten Struktur, in der die Tentativität der zu verhandelnden Sachverhalte non-verbal, para-verbal und verbal markiert wird, d. h. bspw. durch steigende Intonation, häufigen Gebrauch des Konjunktivs, unterschiedliche Hesitationssignale sowie die Kennzeichnung von Äußerungen als persönlich durch ich-würde-Konstruk‐ tionen. Die Vorschläge werden so als vorläufig statuiert, wodurch eine Reaktion in Form einer Annahme, Ablehnung und/ oder anderer Positionierung dazu konditionell relevant gesetzt wird. Positionierungen finden sich demzufolge sowohl in den Vorschlägen - bspw. durch evaluierende Adjektive - als auch in den Reaktionen auf Vorschläge und fungieren entweder zur Solidarisierung mit der Patientin oder zur Annahme oder Ablehnung von Vorschlägen. Zudem werden unterschiedliche multimodale Ressourcen zur Herstellung von Inter‐ subjektivität verwendet, wie z. B. (Hand-)Gesten, Kopfbewegungen, Betonung, Lautstärke (bebendes) Lachen, Pausen sowie (langes) Ein- und Ausatmen und darüber hinaus auch die Verschriftlichung von Nachrichtenabschnitten, um 156 Susanne Kabatnik <?page no="157"?> ihren Status als gesetzt zu markieren. Durch non- und paraverbale Signale werden die Äußerungen also zu Positionierungszwecken unterstützt. In ihrem multimodalen Ensemble lassen die Äußerungen auf relevante Inhalte sowie die Intensität der empfundenen Emotionen, wie z. B. Unbehagen, Wut oder Hilflosigkeit, schließen. Pausen und Schweigen sind beispielsweise wesentliche Signale in Begleitung dispräferierter Reaktionen bezüglich der formulierten Vorschläge und können Ablehnung einleiten oder ankündigen. Multimodale Äußerungskomponenten, wie epistemische Absicherungen mit steigender In‐ tonation, fungieren zur Anzeige von als vorläufig markierten Interpretationen, die Patient*innen zur Selbstexploration einladen. Durch Handgesten können darüber hinaus verbale Positionierungen bekräftigt und so authentische Solida‐ rität aufgezeigt werden. Anhand einer Handgeste, die eine Grenze zeichnet, kann außerdem der Inszenierungscharakter der nachgestellten Situation in der Gruppenpsychotherapie aufgezeigt werden. Weiter zu untersuchen wäre der spezifische Gebrauch der gelisteten multimodalen Ressourcen in der Interaktion sowie im Zusammenspiel mit anderen Ressourcen, wie z. B. Blickbewegung, die in diesem Beitrag lediglich punktuell Berücksichtigung fand. Dieser Beitrag bildet somit eine erste Bestandsaufnahme des Phänomenbereichs und setzt weitere Forschung von helfenden Interaktionen unter Berücksichtigung multi‐ modaler Ressourcen relevant. Bezüglich der sequenziellen Abfolge der (Formulierungs-)Vorschläge kann ein spezifisches Muster identifiziert werden, nämlich: Anzeige niedriger Agency - Formulierungsvorschlag - Annahme/ Ablehnung - (Korrektur durch weiteren Formulierungsvorschlag) - Verschriftlichung. Auf diese Weise wird nicht nur sukzessive eine kollaborative Nachricht konzipiert, sondern auch Veränderung auf unterschiedlichen Ebenen ko-konstruiert: Durch die Formulierungsvor‐ schläge und den stetigen Abgleich mit den formulierten Zielen der Patientin gelangt die Gruppe zu einem Antwortvorschlag auf die E-Mail des Professors, wodurch ein konkreter Lösungsvorschlag zum angezeigten Problem vorliegt. Durch die non-verbal, para-verbal und verbal signalisierte Solidarität in den Formulierungsvorschlägen zeigt sich die Gruppe empathisch und mitfühlend, was zur Gruppenidentität beiträgt und diese stärkt: Als geschlossene Gruppe stellen sich die Interaktantinnen gegen die Person aus der Konflikt-Kommuni‐ kation, hier gegen den Professor: Sie verurteilen sein Verhalten und entgegnen ihm mit einer (kollaborativ konzipierten) Antwort als Gegenentwurf zur er‐ lebten Ohnmacht in der konkreten Situation. Dazu werden Vorschläge anteilig oder insgesamt abgelehnt oder angenommen und anschließend verschriftlicht. Therapeut*innen unterstützen die Patient*innen dabei mit Interventionen, bei‐ spielsweise mit Fragen, eigenen Ideen, Hinweisen oder Reformulierungen, Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 157 <?page no="158"?> durch die die Patient*innen entweder korrigiert oder bekräftigt werden. Die betroffenen Patient*innen, aber auch ihre Mitpatient*innen, haben neben der Reaktionsmöglichkeit auch den zielführenden Lösungsweg für die Zukunft, wodurch sich die Agency nicht nur für die betroffenen Patient*innen erhöht, sondern für die gesamte Gruppe. Durch die Positionierungen zur Solidarisierung mit P3 wird neben der primären Handlungsaufgabe des Verfassens der Nachricht eine weitere Hilfe‐ stellung und Funktion der Gruppenpsychotherapie offengelegt, nämlich die kollaborative Aufarbeitung des Konflikts durch den gemeinsamen Nachrichten‐ entwurf in der Gruppenpsychotherapie: Das anfängliche Problem, das zunächst allein bearbeitet werden musste, gilt nun als bewältigbare Gruppenaufgabe, an der alle Interaktantinnen im Raum teilhaben, und wird somit handhabbar. Dies führt zum Anstieg der Agency im Sinne der Ko-Konstruktion von Veränderung. Literatur Bauer, Angelika/ Auer, Peter (2012). Gesten im Gespräch. Aphasie und verwandte Gebiete 32, 5-37. Betz, Emma/ Deppermann, Arnulf (2021). OKAY in responding and claiming understan‐ ding. In: Betz, Emma/ Deppermann, Arnulf/ Mondada, Lorenza/ Sorjonen, Marja-Leena (Hrsg.). OKAY across Languages: Toward a comparative approach to its use in talk-in-interaction. Amsterdam: Benjamins, 55-92. Blühdorn, Hardarik/ Foolen, Ad/ Loureda, Óscar (2017). Diskursmarker: Begriffsge‐ schichte -Theorie - Beschreibung. Ein bibliographischer Überblick. In: Blühdorn, Hardarik/ Deppermann, Arnulf/ Helmer, Henrike/ Spranz-Fogasy, Thomas (Hrsg.). Dis‐ kursmarker im Deutschen: Reflexionen und Analysen. Göttingen: Verlag für Ge‐ sprächsforschung, 4-47. Böhringer, Daniela/ Hitzler, Sarah/ Richter, Martina (2022). Helfen: Situative und organi‐ sationale Ausprägungen einer unterbestimmten Praxis. Bielefeld: transcript. Bonacchi, Silvia (2020). Forms and functions of silence and silencing: An approach from linguistics and conversation analysis with reference to psychotherapy. In: Dimitrijević, Aleksandar/ Buchholz, Michael B. (Hrsg.). Silence and Silencing in Psy‐ choanalysis. London: Routledge, 41-61. Brakemeier, Eva-Lotta/ Guhn, Anne/ Normann, Claus (2021). Praxisbuch CBASP. Be‐ handlung chronischer Depression und Modifikationen für weitere interpersonelle Störungen 2. neubearb. Aufl. Weinheim: Beltz. Bressem, Jana (2015). Repetition als Mittel der Musterbildung bei redebegleitenden Ge‐ sten. In: Dürscheid, Christa/ Schneider, Jan Georg (Hrsg.). Handbuch Satz, Äußerung, Schema (Vol. 4). Berlin/ Boston: De Gruyter, 422-444. 158 Susanne Kabatnik <?page no="159"?> Buchholz, Michael B./ Alder, Marie-Luise/ Dreyer, Florian/ Franzen, Michael M. (2022). Sprechen und Schweigen in der Psychotherapie. Psychotherapeut 67 (2), 129-134. Busch, Albert/ Spranz-Fogasy, Thomas (2015). Sprache in der Medizin. In: Felder, Ekke‐ hard/ Gardt, Andreas (Hrsg.). Handbuch Sprache und Wissen. Bd. 1. Berlin/ Boston: De Gruyter, 335-357. Clark, Herbert H. (1982). The relevance of common ground: comments on Sperber and Wilson’s paper. In: Smith, N. V. (Hrsg.). Mutual Knowledge. New York: Academic, 124-27. Couper-Kuhlen, Elizabeth (2014). What does grammar tell us about action? Pragmatics 24 (3), 623-647. Deppermann, Arnulf (2014). Konversationsanalyse. In: Staffeldt, Sven/ Hagemann, Jörg (Hrsg.). Pragmatiktheorien. Analysen im Vergleich. Tübingen: Stauffenburg, 19-47. Deppermann, Arnulf (2018). Sprache in der multimodalen Interaktion. In: Deppermann, Arnulf/ Reineke, Silke (Hrsg.). Sprache im kommunikativen, interaktiven und kultur‐ ellen Kontext. Berlin/ Boston: De Gruyter, 51-86. Graf, Eva-Maria/ Sator, Marlene/ Spranz-Fogasy, Thomas (2014). Discourses of helping professions. Concepts, contextualization and contributions. In: Graf, Eva-Maria/ Sator, Marlene/ Spranz-Fogasy, Thomas (Hrsg.). Discourses of Helping Professions. Ams‐ terdam: Benjamins, 1-12. Graf, Eva-Maria/ Scarvaglieri, Claudio/ Spranz-Fogasy, Thomas (2019). Pragmatik der Veränderung in helfenden Berufen. Einführung. In: Graf, Eva-Maria/ Scarvaglieri, Claudio/ Spranz-Fogasy, Thomas (Hrsg.). Pragmatik der Veränderung. Problem- und lösungsorientierte Kommunikation in helfenden Berufen (Studien zur Pragmatik, Band-2). Tübingen: Narr, 7-24. Graf, Eva-Maria/ Scarvaglieri, Claudio/ Spranz-Fogasy, Thomas (2022). Practices of Rela‐ tionship Management in Organized Helping. Introduction. In: Scarvaglieri, Claudio/ Graf, Eva-Maria/ Spranz-Fogasy, Thomas (Hrsg.). Relationships in Organized Helping. Analzying interaction in psychotherapy, medical encounters, coaching and in social media. Amsterdam: John Benjamins, 1-26. Graf Eva-Maria/ Spranz-Fogasy Thomas (2018). Helfende Berufe - Helfende Interak‐ tionen. In: Janich, Nina/ Birkner, Karin (Hrsg.). Handbuch Text und Gespräch. Berlin/ New York: De Gruyter, 418-442. Grosse-Wentrup, Fabienne/ Reinhard, Matthias A./ Padberg, Frank (2020). We have to talk about messaging! Online communication in subclinical depression and persistent depressive disorder. Poster Präsentation auf dem DGPPN Kongress, 2020, Berlin, Deutschland. Guhn, Anne/ Brakemeier, Eva-Lotta (2022). Situationsanalyse. In: Linden, Michael/ Haut‐ zinger, Martin (Hrsg.). Verhaltenstherapiemanual - Erwachsene. Psychotherapie: Praxis. Berlin: Springer, 225-230. Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 159 <?page no="160"?> Gülich, Elisabeth/ Mondada, Lorenza (2008). Konversationsanalyse. Eine Einführung am Beispiel des Französischen. Tübingen: Niemeyer. Guxholli, Aurora/ Voutilainen, Liisa/ Peräkylä, Anssi (2021). Safeguarding the Therapeutic Alliance: Managing Disaffiliation in the Course of Work with Psychotherapeutic Projects. Frontiers in Psychology 11, 596972. doi: 10.3389/ fpsyg.2020.596972 Kabatnik, Susanne/ Nikendei, Christoph/ Ehrenthal, Johannes C./ Spranz-Fogasy, Thomas (2019). The Power of LoF. Veränderung durch Lösungsorientierte Fragen im psycho‐ therapeutischen Gespräch. In: Graf, Eva-Maria/ Scarvaglieri, Claudio/ Spranz-Fogasy, Thomas (Hrsg.). Pragmatik der Veränderung. Problem- und lösungsorientierte Kom‐ munikation in helfenden Berufen. Tübingen: Narr, 147-175. Kabatnik, Susanne/ Nikendei, Christoph/ Ehrenthal, Johannes C./ Spranz-Fogasy, Thomas (2022). Relationship management by means of solution-oriented questions in German psychodiagnostic interviews. In: Scarvaglieri, Claudio/ Graf, Eva-Maria/ Spranz-Fo‐ gasy, Thomas (Hrsg.). Relationships in Organized Helping: Analyzing interaction in psychotherapy, medical encounters, coaching and in social media. Amsterdam: John Benjamins, 127-150. Kallmeyer, Werner (2001). Beraten und Betreuen. Zur gesprächsanalytischen Untersu‐ chung von helfenden Interaktionen. Zeitschrift für Qualitative Bildungs-, Beratungs- und Sozialforschung 2, 227-252. Kiesler, Donald J. (1983). The 1982 interpersonal circle: A taxonomy for complementarity in human transactions. Psychological Review 90, 185-214. Klempa, Isabel (2008). Funktionen von Lachen in Gesprächen: eine konversationsanaly‐ tische Studie. UWSpace. http: / / hdl.handle.net/ 10012/ 3912 Kreuz, Judith/ Munwiler, Vera/ Luginbühl, Martin (2017). Mündliches Argumentieren im Spannungsfeld zwischen Kollaboration und Abgrenzung. Zu lokalen Gruppenidenti‐ täten in schulischen Einigungsdiskussionen. Bulletin suisse de linguistique appliquée, numéro spécial 2 (2), 147-159. Labov, William/ Fanshel, David (1977). Therapeutic discourse: Psychotherapy as conver‐ sation. New York: Academic Press. Läpple, Sina/ Nikendei, Christoph/ Ehrenthal, Johannes C./ Kabatnik, Susanne/ Spranz-Fo‐ gasy, Thomas (2021). Therapeutische Reaktionen auf Patientenwiderstand in psy‐ chodiagnostischen Gesprächen am Beispiel Lösungsorientierter Fragen. Göttingen: Verlag für Gesprächsforschung. Linke, Angelika/ Nussbaumer, Markus/ Portmann, Paul R. (2004). Studienbuch Linguistik. 5. erw. Aufl. Tübingen: Max Niemeyer Verlag. Lucius-Hoene, Gabriele/ Deppermann, Arnulf (2004). Narrative Identität und Positionie‐ rung. Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 5 (1), 166- 183. 160 Susanne Kabatnik <?page no="161"?> Mack, Christina/ Nikendei, Christoph/ Ehrenthal, Johannes C./ Spranz-Fogasy, Thomas (2016). „[…] hab ich glaub ich die richtigen fragen gestellt“: Therapeutische Frage‐ handlungen in psychodiagnostischen Gesprächen. OPAL 7 (3), 1-98. MacMartin, Clare (2008). Resisting Optimistic Questions in Narrative and Solution-fo‐ cused Therapy. In: Peräkylä, Anssi/ Antaki, Charles/ Vehviläinen, Sanna/ Leudar, Ivan (Hrsg.). Conversation Analysis and Psychotherapy. Cambridge: Cambridge University Press, 80-99. Marciniak, Agnieszka (2017). Agency in Lösungsorientierten Fragen im Psychodiagnosti‐ schen Gespräch: Agency-Implikationen und Reaktionen in Wunschfrage-Sequenzen. Universität Mannheim, Masterarbeit. Miller, Katherine/ Considine, Jennifer (2009). Communication in the helping professions. In: Frey, Lawrence/ Cissna, Kenneth (Hrsg.). The Routledge Handbook of Applied Communication Research. New York: Routledge, 405-428. Mondada, Lorenza (2019). Conventions for transcribing multimodality. Abrufbar unter: https: / / www.lorenzamondada.net/ multimodal-transcription (Stand: 29.10.2021). Pawelczyk, Joanna (2011). Talk as therapy. Amsterdam: De Gruyter. Peräkylä, Anssi (2013). Conversation Analysis in Psychotherapy. In Sidnell, Jack/ Stivers, Tanya (Hrsg.). The Handbook of Conversation Analysis. Oxford: Wiley-Blackwell, 551-574. Peräkylä, Anssi (2019). Conversation Analysis and Psychotherapy: Identifying Transfor‐ mative sequences. Research on Language and Social Interaction 52 (3), 257-280. Pick, Ina (Hrsg.) (2017). Beraten Ist Sprechen. Eine linguistische Typologie zu Beratungs‐ gesprächen in verschiedenen Handlungsfeldern. Bern: Peter Lang. Pick, Ina/ Scarvaglieri, Claudio (2019). Helfendes Handeln: Zum Begriff Sprachlichen Helfens Und Seinen Implikationen Für Veränderung. In: Graf, Eva-Maria/ Scarvaglieri, Claudio/ Spranz-Fogasy, Thomas (Hrsg.). Pragmatik der Veränderung: Problem- und lösungsorientierte Kommunikation in helfenden Berufen. Vol. 2. Tübingen: Narr, 25-64. Pick, Ina/ Scarvaglieri, Claudio (2022). Helfen im Gespräch: Empirischer Vergleich der Hilfe in Rechtsberatung und Psychotherapie. In: Böhringer, Daniela/ Hitzler, Sarah/ Richter, Martina (Hrsg.). Helfen: Situative und organisationale Ausprägungen einer unterbestimmten Praxis. Bielefeld: transcript, 163-192. Pittenger, Robert E./ Hockett, Charles Francis/ Danehy, John J. (1960). The first five minutes: A sample of microscopic interview analysis. Ithaca: Paul Martineau. Pomerantz, Anita/ Heritage, John (2012). Preference. In: Sidnell, Jack/ Stivers, Tanya (Hrsg.). The Handbook of Conversation Analysis. Chichester: Wiley-Blackwell, 210- 228. Scarvaglieri, Claudio (2013). ›Nichts anderes als ein Austausch von Worten‹: Sprachliches Handeln in der Psychotherapie. Berlin: De Gruyter. Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 161 <?page no="162"?> Schramm, Elisabeth/ Zobel, Ingo/ Dykierek, Petra/ Kech, Sabine/ Brakemeier, Eva-Lotta/ Külz, Anne/ Berger, Mathias (2011). Cognitive behavioral analysis system of psycho‐ therapy versus interpersonal psychotherapy for early-onset chronic depression: a randomized pilot study. Journal of affective disorders 129 (1-3), 109-116. Schützeichel, Rainer (2012). Verstehen in professionalen Interaktionen. Historical Social Research/ Historische Sozialforschung (HSR) 37 (4), 249-263. Selting, Margaret/ Auer, Peter/ Barth-Weingarten, Dagmar (2009). Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). Gesprächsforschung - Online-Zeitschrift zur ver‐ balen Interaktion 10, 353-402. Shaw, Chloe (2013). Advice giving in telephone interactions between mothers and their young adult daughters. Ph.D. Thesis. Loughborough: Loughborough University. Spiegel, Carmen/ Spranz-Fogasy, Thomas (2001). Aufbau und Abfolge von Gesprächs‐ phasen. In: Brinker, Klaus/ Antos, Gerd/ Heinemann, Wolfgang/ Sager, Sven F. (Hrsg.). Text- und Gesprächslinguistik. Ein internationales Handbuch zeitgenössischer For‐ schung. 2. Halbband. Berlin/ New York: De Gruyter, 1241-1252. Spranz-Fogasy, Thomas/ Kabatnik, Susanne/ Nikendei, Christoph (2018). Wissenskonsti‐ tution durch Lösungsorientierte Fragen in psychodiagnostischen Gesprächen. Rhe‐ torik 37 (1), 111-133. Stevanovic, Melisa (2023). Deontic authority. In: Gubina, Alexandra/ Hoey, Elliott M./ Wesley Raymond, Chase (Hrsg.). Encyclopedia of Terminology for Conversation Ana‐ lysis and Interactional Linguistics. International Society for Conversation Analysis (ISCA). Stivers, Tanya (2008). Stance, alignment, and affiliation during storytelling: When nodding is a token of affiliation. Research on Language and Social Interaction 41 (1), 31-57. Streeck, Jürgen (2016). Gestische Praxis und sprachliche Form. In: Deppermann, Ar‐ nulf/ Feilke, Helmuth/ Linke, Angelika (Hrsg.) Sprachliche und kommunikative Prak‐ tiken. Berlin/ Boston: De Gruyter, 57-80. Stukenbrock, Anja (2021). Multimodal Gestalts and Their Change Over Time: Is Routinization Also Grammaticalization? Front. Commun. 6: 662240. doi: 10.3389/ fcomm.2021.662240- Stukenbrock, Anja/ Deppermann, Arnulf/ Scheidt, Carl Eduard (2021). The art of ten‐ tativity. Delivering interpretations in psychodynamic psychotherapy. Journal of Pragmatics 176, 76-96. Stukenbrock, Anja (2021). Mit Blick auf die Geste - multimodale Verfestigungen in der Interaktion. In: Weidner, Beate/ König, Katharina/ Imo, Wolfgang/ Wegner, Lars (Hrsg.). Verfestigungen in der Interaktion. Konstruktionen, sequenzielle Muster, kommunikative Gattungen. Berlin/ Boston: De Gruyter, 231-261. 162 Susanne Kabatnik <?page no="163"?> Voutilainen, Liisa/ Peräkylä, Anssi/ Ruusuvuori, Johanna (2011). Therapeutic Change in Interaction: Conversation Analysis of a Transforming Sequence. Psychotherapy Research 21 (3), 348-365. Voutilainen, Liisa/ Rossano, Federico/ Peräkylä, Anssi (2018). Conversation analysis and psychotherapeutic change. In: Pekarek Doehler, Simona/ Wagner, Johannes/ Gon‐ zález-Martínez, Esther (Hrsg.). Longitudinal Studies on the Organization of Social Interaction. London: Palgrave Macmillan, 225-254. Voutilainen, Liisa/ Henttonen, Pentti/ Stevanovic, Melisa/ Kahri, Mikko/ Peräkylä, Anssi (2019). Nods, vocal continuers, and the perception of empathy in storytelling. Dis‐ course Processes 56 (4), 310-330. Voutilainen, Liisa/ Peräkylä, Anssi (2020). ‘Open’ and ‘closed’ therapies: Psychothera‐ peutic relationship and variety of participants’ stances in different phases of therapies. Communication & Medicine 16 (2), 157-168. Weiste, Elina/ Peräkylä, Anssi (2013). A comparative conversation analytic study of formulations in psychoanalysis and cognitive psychotherapy. Research on Language and Social Interaction 46 (4), 299-321. West, Marion (2021). ‘I’m not going to tell you cos you need to think about this’: A Conversation Analysis Study of Managing Advice Resistance and Supporting Autonomy in Undergraduate Supervision. Postdigital Science and Education 3 (1), 198-222. Ko-Konstruktion von Veränderung in der Smartphone-gestützten Gruppenpsychotherapie 163 <?page no="165"?> eins zwei drei vor wusch - dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion Clara Kindler-Mathôt Abstract: While research of onomatopoeia as a phenomenon of language use is already rare (Sasamoto 2019; Schuppener 2009, 2010; Wissemann 1954), investigations in the context of multimodality research are close to non-existent (Dingemanse 2013; Dingemanse/ Akita 2017). The article takes this as a chance by taking a closer look on onomatopoeia as part of multimodal communication. The article presents a detailed analysis of the multimodal orchestration of the onomatopoeic interjection wusch. Taking gesture analysis as a framework (Ladewig 2020; Müller 2019), multimodality is presented as a dynamic interplay of verbal utterance, handand body-gestures that unfold meaning interactively on the local level of multimodal utterances as well as on the level of discourse of a Waltz dance lesson. Taking a dynamic perspective it is shown that wusch is a fully embedded part of a sequentially constructed multimodal utterance (Ladewig 2020) that, reviewed on a discourse level, turns out to be the substitution of an interactively developed multimodal discourse metaphor (Müller/ Ladewig 2013). Concludingly, wusch is not only an iconically motivated sign but a crucial part of a complex embodied meaning-making process as it forms a multimodal gestalt of hand gestures, body movement and utterance. Keywords: Onomatopoeia, multimodal utterance, dynamic language use, gesture analysis, multimodal metaphor <?page no="166"?> 1 Einleitung Sasamoto (2019: 39) richtet das Augenmerk auf die in diesem Artikel adressierte Forschungslücke: To my knowledge, little research has been done to investigate how and why humans use onomatopoeia. If research into onomatopoeia fails to address its role in commu‐ nication, and how the hearer interprets it, our understanding of the phenomenon will not be sufficiently wide-reaching or explanatory. Als Phänomene des Sprachgebrauchs sind Onomatopöien bisher kaum thema‐ tisiert worden, das trifft auch auf ihre potentiell multimodalen Realisierungen zu. Das mag mitunter daran liegen, dass Onomatopöien lange Zeit nicht als sprach‐ wissenschaftliches, sondern vordergründig literarisches Phänomen betrachtet wurden (Schuppener 2009: 111 f.), hier bspw. als lyrisches Stilmittel (siehe Kayser 1962). Gleichwohl sind sie mit Blick auf eine der zentralen Fragestellungen der linguistischen Multimodalitätsforschung, nämlich, inwiefern multimodale Phänomene in ihrem Zusammenspiel Bedeutung entfalten, durch ihre hohe Iko‐ nizität durchaus ein spannender und aufschlussreicher Forschungsgegenstand. Auf Basis von Videodaten aus einem Walzer-Workshop betrachtet der Artikel, wie sich Bedeutung multimodal entfaltet. Im Zentrum der Analyse steht die onomatopoetische Interjektion wusch, die - eingebettet in eine körperlich-ge‐ stische Performance - vom Tanzlehrer wiederholt zur Erklärung einer für den Walzertanz charakteristischen Dynamik einer Drehung verwendet wird. Die teilnehmenden Tänzer: innen arbeiten in der Tanzstunde mit dieser Erklärung und greifen sie zum Teil explizit in Interviews nach dem Workshop auf. Der Artikel fokussiert in Form einer Fallstudie die dynamische Entfaltung der multimodalen onomatopoetischen Interjektion und ihre daraus resultierende Stabilisierung als multimodale Bedeutungsgestalt im wiederholten Gebrauch des Tanzlehrers. Dabei wird zunächst skizziert, wie Multimodalität und Ono‐ matopöie als Phänomene des multimodalen Sprachgebrauchs theoretisch zu fassen sind. Nach der Vorstellung der Daten und der Methode werden zwei exemplarische Analysen zur spezifischen Ausprägung von Onomatopöien im multimodalen Sprachgebrauch vorgestellt: Eine „Analyse der multimodalen Realisierung von Onomatopöien im Kleinen“, die eine mikro-analytische Per‐ spektive auf Äußerungsebene einnimmt, und eine „Analyse der multimodalen Realisierung von Onomatopöien im Großen“, die sich am Beispiel onomatopo‐ etischer Ausdrucksformen der zeitlichen Entfaltung multimodaler Metaphorik widmet. Der Artikel schließt mit einer Zusammenfassung und der Schlussfol‐ gerung, dass sich die Onomatopöie wusch einerseits auf der Mikroebne einer einzelnen multimodalen Äußerung dynamisch entfaltet und sich zudem über 166 Clara Kindler-Mathôt <?page no="167"?> 1 Adam Kendon (1972) und David McNeill (1985) gelten als die Begründer der modernen Gestikforschung (siehe Ladewig 2018a: 292). 2 Die linguistische Multimodalitätsforschung kann grob in vier Richtungen unterteilt werden (welche sich durchaus überschneiden): Non-verbale Kommunikation (z. B. Burgoon et al. 2013), Semiotik (z. B. Kress/ van Leeuwen 2001), kognitive Ansätze (z. B. Pinar Sanz 2015) und multimodale Interaktionsanalyse (z.-B. Mondada/ Schmitt 2010). den Diskursraum der Tanzstunde hinweg - hier gefasst als Makroebene - d.-h. im Gebrauch als multimodale Bedeutungsgestalt stabilisiert. 2 Multimodalität und Onomatopöie im Sprachgebrauch Im Folgenden wird zunächst das zugrunde gelegte Verständnis von sprachlicher Multimodalität erläutert und ein dynamischer Ansatz vorgestellt, der vor allem auf Erkenntnissen der modernen Gestikforschung aufbaut. In einem zweiten Schritt werden dann Onomatopöien als Phänomene des Sprachgebrauchs vor‐ gestellt, die zwischen lexikalischer Semantik und interaktiver Bedeutungsaus‐ handlung oszillieren. 2.1 Bedeutungskonstitution im multimodalen Sprachgebrauch als dynamischer Prozess Mit dem Beginn der modernen Gestikforschung und der damit einhergehenden Überwindung der Dichotomie von verbal und nonverbal wird deutlich, dass Sprachgebrauch grundsätzlich multimodal orchestriert ist. 1 Gesten und Laut‐ sprache stehen nicht als einzelne Kanäle nebeneinander, wie es z. B. Ansätze der non-verbalen Kommunikation (z. B. Burgoon et al. 2013) beschreiben, sondern formen im engen Zusammenspiel komplexe Bedeutungsgestalten, die semantische, pragmatische und affektive Funktionen innehaben können. Dieses Zusammenspiel zu untersuchen ist die Aufgabe der Multimodalitätsforschung. Da sich die Forschungsbereiche und -fragen innerhalb der Multimodalitätsfor‐ schung zwar häufig ähneln, sich jedoch in ihrem Verständnis von Multimoda‐ lität deutlich unterscheiden, wird zunächst das in diesem Artikel vertretene Verständnis von Multimodalität kurz skizziert. 2 Im Folgenden wird von einem dynamisch-multimodalen Ansatz ausgegangen, der sowohl interaktive Prozesse als auch Formen von Verkörperung berück‐ sichtigt. Er bewegt sich deshalb an der Schnittstelle zwischen multimodaler Interaktionsanalyse und gebrauchsorientierter kognitiver Linguistik. Der An‐ satz wurde maßgeblich im Kontext der Gestikforschung (Kendon 2004; Ladewig 2020; Ladewig/ Hotze 2021; Müller 2010b, 2019; Müller/ Ladewig 2013) entwi‐ Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 167 <?page no="168"?> 3 Der Begriff wird in Anlehnung an Müller und Kappelhoffs Begriff der „multidimensi‐ onal experiential gestalt“ verwendet (Müller/ Kappelhoff 2018: 45-49). 4 Auf Grund noch nicht ausreichender Forschung zu allen Modalitäten konzentriert sich der Artikel auf jene, die bereits empirisch hinreichend untersucht wurden. Auch Ladewig hebt dies hervor wenn sie schreibt: „However, sure enough, by zooming in on one particular relation of both modalities, others are moved out of the attentional space, which is why the approach developed here should be treated as one puzzle piece for illuminating the multimodality of language“ (Ladewig 2020: 3). ckelt. Dabei wird Multimodalität als ein gleichberechtigtes Zusammenspiel mehrerer Modalitäten verstanden, die im zeitlichen Verlauf gemeinsam als multidimensionale Gestalten bedeutsam werden. 3 Für die hier vorgestellte Studie bezieht sich dies primär auf das Zusammenspiel von Lautsprache sowie Hand- und Körpergesten. 4 Vor diesem Hintergrund beschäftigt sich die aktuelle For‐ schung insbesondere mit Fragen gestischer Bedeutungsentfaltung (Ladewig 2020; Müller 2010a, 2013, 2024), multimodalen bzw. kinematischen Metaphern (Müller 2008, 2019; Müller/ Kappelhoff 2018; Müller/ Ladewig 2013; Müller/ Tag 2010) und (Inter-)Affektivität (Horst et al. 2014; Ladewig/ Hotze 2021; Müller/ Ladewig 2013). Der hier zugrunde gelegte Bedeutungsbegriff geht zunächst von folgenden vier Aspekten aus, die Deppermann (2020: 235) für Bedeutung in verbalen Interaktionen anführt: Bedeutung ist situiert, d. h. sie gilt lokal in einem Gesprächsmoment; sie ist sozial, d. h. sie wird interaktiv erarbeitet; sie ist öffentlich, d. h. gemeinte und verstandene Bedeutung wird i. d. R. angezeigt; sie wird konstituiert, d. h. sie wird kontextspezifisch hergestellt. Im Kontext des dynamisch-multimodalen Ansatzes wird Bedeutungskonstitution des Wei‐ teren als ein komplexer Entfaltungsprozess auf unterschiedlichen Ebenen ver‐ standen: Zum einen auf Äußerungsebene im multimodalen und dynamischen Zusammenspiel der einzelnen Modalitäten, zum anderen auf Diskursebene als Stabilisierungsprozess von Bedeutung. Vor diesem Hintergrund wird nicht von festen lexikalischen Bedeutungen ausgegangen, sondern, im Sinne von Linell (2009), von offenen Bedeutungspo‐ tentialen: Lexical items have open ‚meaning potentials‘. The determination of communicatively relevant meanings and concepts takes place in and through interaction between linguistic resources and contextual factors. (Linell 2009: 279; Herv. i. Orig.) In einer spezifischen Interaktionssituation werden diese Bedeutungspotenziale von Sprecher: innen interaktiv relevant gesetzt. Welche Bedeutungsaspekte be‐ sonders in den Vordergrund gerückt werden, ‚entscheiden‘ die Interagierenden in Form von kontextspezifischen und multimodalen Relevantsetzungen und 168 Clara Kindler-Mathôt <?page no="169"?> machen sie somit öffentlich. Auf diese Form interaktiver und multimodaler Aktivierung von Bedeutung wird im Rahmen der methodischen Herangehens‐ weisen genauer eingegangen (siehe foregrounding in 3.2.4; Müller/ Tag 2010). Müller (2024) demonstriert das Konzept der gestischen Erfahrungsgestalt anschaulich in ihrem an Kendon (1980, 2004) angelehnten Verständnis von der Geste als Zeitform. Dabei greift sie zusätzlich die Ansätze des Bewegungsbildes auf, die bereits Anfang des zwanzigsten Jahrhunderts in der Ausdruckstheorie entwickelt wurden (Buijtendijk/ Plessner 1925). Sie betont in diesem Zusammen‐ hang: The specific temporal relation of a gesture form with its context is vital to address ‘how gestures mean’. It is the synchronization of gestural forms with the flow of speech that is essential to disambiguate and specify the local meaning of gestures. (Müller 2024: 200) Die multimodalen Bedeutungspotenziale entfalten sich also in der Zeit zu ganzheitlichen Erfahrungsgestalten (siehe Müller 2019; Müller/ Kappelhoff 2018), die dennoch ständig weiter Teil des dynamischen Spiels sind. So können sie sich in einem Moment zu Konstruktionen stabilisieren und sich im nächsten Moment, z. B. durch die Veränderung eines Formparameters, zu neuer Bedeu‐ tung entfalten. Gemeinsam mit Kappelhoff (2004, 2018) denkt Müller dieses Konzept weiter und entwickelt damit einen genuin transdisziplinären Ansatz der sich sowohl auf multimodale face-to-face Kommunikation, als auch auf audiovisuelle Kom‐ positionen z.-B. im Film, beziehen lässt (Müller 2019; Müller/ Kappelhoff 2018): The method addresses the temporality of meaning-making as a specific mode of perceiving, sensing, and feeling, and offers different forms of visualizations of this temporal affectivity and the dynamics of metaphorical meaning. Our starting point is the temporality of experiencing which characterizes film-viewing as much as face-to-face interaction. (Müller/ Kappelhoff 2018: 227) Diese filmwissenschaftlich-linguistische Multimodalitätsforschung geht davon aus, dass multimodalen Erfahrungsgestalten als Bewegungsbilder unmittelbar körperlich verstanden werden. Bedeutungskonstitution vollzieht sich aus dieser Perspektive in der Bewegungserfahrung der Betrachter: in. Als Bewegungsver‐ stehen ist dieses Verstehen eine affektive Erfahrung, die sich in Bewegungsqua‐ litäten, in der zeitlichen Gestaltung von Bewegungsformationen und -figurati‐ onen vollzieht. Bedeutungskonstitution ist somit kein rein kognitiver Prozess des abstrakten Verstehens, sondern ist vielmehr in körperlichem Erfahren und Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 169 <?page no="170"?> 5 Aktuell ist eine Tendenz zur Bearbeitung dieses Desiderats zu beobachten, so z. B. Bücker (2023). Verstehen des Gegenübers verankert und ist somit interkorporal (siehe Müller 2019: 66). Für die face-to-face Kommunikation heißt das, dass Bedeutung sich als ein zeitlicher Entfaltungsprozess darstellt, wovon zwei Ebenen der Zeitlichkeit in diesem Artikel in den Blick genommen werden: 1. Die feinkörnige Entfaltung multimodaler Gestalten auf Äußerungsebene, die eine Orchestrierung von Lautsprache, Hand- und Körpergesten bein‐ haltet (Mikroebene). 2. Die Entfaltung (und Stabilisierung) multimodaler Bedeutung über den Verlauf des gesamten Diskurses „Walzer Workshop“ (Makroebene). Welche Bedeutungsaspekte werden hervorgehoben, aufgegriffen und weiterentwi‐ ckelt? Diese beiden Ebenen der dynamischen Entfaltung werden in der empirischen Analyse als Multimodale Analyse im Kleinen und Multimodale Analyse im Großen am Beispiel der Bedeutungskonstitution der onomatopoetischen Interjektion wusch vorgestellt. 2.2 Onomatopöie als Phänomen des (multimodalen) Sprachgebrauchs Die Betrachtung von Onomatopöien aus einer (multimodalen) Sprachgebrauch‐ sperspektive stellt bisher ein Desiderat dar (siehe Schuppener 2009). 5 Im Fol‐ genden wird zunächst ein kurzer Einblick in die deutlich produktorientierte Forschung von Onomatopöie gegeben. Dem werden zwei Ansätze gegenüber‐ gestellt, die sich in ihren Grundzügen Onomatopöie aus einer vergleichsweise prozessorientierten Perspektive des Sprachgebrauchs zuwenden: Die „Untersu‐ chungen zur Onomatopoiie“ von Heinz Wissemann (1954) und die Arbeiten von Dingemanse und Akita zu Ideophonen (Dingemanse 2011, 2017; Dinge‐ manse/ Akita 2017). Die Reflexion beider Ansätze und die daraus resultierende Definition von Onomatopöie dienen als analytischer Ausgangspunkt für die anschließende Fallstudie im nächsten Kapitel. Als produktorientiert werden die Ansätze verstanden, die Onomatopöie auf Ebene der langue und weniger der parole diskutieren (siehe De Saussure 1916). Konkret bedeutet das, dass nur bedingt mit tatsächlichen Sprachdaten und ohne deren situativen und/ oder kontextuellen Bezug aus einer theoretischen 170 Clara Kindler-Mathôt <?page no="171"?> 6 Für eine detaillierte Diskussion der theoretischen Konzeptualisierungen von Onoma‐ topöie aus semiotischer Perspektive siehe Bücker (2023). Perspektive heraus argumentiert wird. Aus einer solchen Perspektive wurden bisher insbesondere der lautnachahmende Charakter und die damit einherge‐ hende Ikonizität von Onomatopöie unter vielfältigen Blickwinkeln diskutiert. Beispielsweise wurde Onomatopöie als vermeintlicher Schlüssel zum Ursprung der Sprache behandelt (von Velics 1909; siehe auch die „Rau-Bau-Theorie“ von Müller 1865), als Phänomen innerhalb der Lautsymbolik diskutiert (Köhler 1933; Strehle 1956), im Rahmen komparativer Untersuchungen als Nachweis für die Arbitrarität sprachlicher Zeichen angeführt (siehe De Saussure 1916; Schuppener 2009, 2010) oder auf Grund ihrer deutlichen Motiviertheit als wichtiges Element des Erstspracherwerbs betrachtet (Stern/ Stern 1907). 6 Aus den bisherigen Ansätzen resultiert folgende Definition von Onomato‐ pöie: 1. Onomatopöie hat einen abstrahierten lautnachahmenden Charakter. 2. Onomatopöie weist einen hohen Grad an Ikonizität auf, was sie als sprachliche Zeichen weniger arbiträr macht als andere. 3. Onomatopöien treten meist in interjektioneller Form auf. Als solche sind sie nicht flektierbar und syntaktisch auffällig, da sie in der Regel außerhalb des Satzzusammenhangs stehen. Die produktorientierte Perspektive gibt jedoch wenig Auskunft über die kon‐ krete kontextuelle Verwendung. Anhand der Studien von Wissemann, Dinge‐ manse und Akita, die eine vergleichsweise dynamische Perspektive einnehmen, werden die Kriterien deshalb vor dem Hintergrund des Sprachgebrauchs über‐ prüft und im Hinblick auf eine zentrale Frage der Multimodalitätsforschung erweitert: Wie wird Bedeutung konstituiert? Welche Rolle spielt hierbei die hohe Ikonizität von Onomatopöie? Mit Blick auf Wissemanns Studie zur „Neubenennung von Onomatopöie im Deutschen“ (Wissemann 1954) deutet sich an, dass die hohe Ikonizität von Onomatopöien von Sprecher: innen nicht nur durch Form-Bedeutungs-Be‐ ziehungen hergestellt wird, sondern insbesondere durch sinnlich-körperliche Erfahrungsbereiche motiviert ist. Ziel seiner experimentellen Studie war es, sprachpsychologische Vorgänge hinter der Entstehung von Onomatopöie im Deutschen nachzuvollziehen. Die Proband: innen sollten gehörten Geräuschen „sinnlose […] Wörter“ (Wissemann 1954: 16) wie dom, bilbul, rakara, fefoli usw. zuordnen, oder, wenn keines dieser Wörter treffend erschien, Anpassungen oder eigene Vorschläge machen. Ein für Wissemann überraschendes Ergebnis war, Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 171 <?page no="172"?> 7 Als eine der ersten grundlegenden Arbeiten in Bezug auf Verkörperung gilt die kogni‐ tive Metapherntheorie von Lakoff und Johnson (1980), in der sprachliche Metaphern mit Körpererfahrungen verknüpft werden. 8 Der Begriff depictive gesture stammt aus der McNeillschen (1992) Gestentypologie, welcher weiter in ikonische und metaphorische Gesten unterscheidet. Dingemanse (2011: 346) betrachtet nur den ikonisch darstellenden Charakter der Gesten. dass Onomatopöien scheinbar eng mit sinnlichen und körperlichen Erfahrungen oder zumindest spezifischen Wirklichkeitsvorstellungen zusammenhängen. Die Proband: innen legten großen Wert darauf, zu rekonstruieren, wie das Geräusch erzeugt wurde, welches durch die Onomatopöie nachgeahmt werden sollte. Dies bezog sich sowohl auf reale Erfahrungsbereiche wie „Hammer und Metall“ (Wissemann 1954: 53), aber auch auf Phantasievorstellungen wie z. B. „Hab an eine Schmiede mit Zwergen gedacht“ (Wissemann 1954: 57). Aus diesen konkreten, plastischen Vorstellungen schließt Wissemann, dass Onomatopöien nicht nur eine einfache Form-Bedeutungsrelation darstellen, z. B. der tatsäch‐ liche Ruf eines Hahns und die Onomatopöie [kikəriˈki: ], sondern vielmehr eng in Verbindung zu sinnlich-körperlichem Erleben stehen. Die körperliche Erfahrungsdimension wird Teil der Onomatopöie und somit in ihrem Wortlaut nicht einfach verstanden, sondern vielmehr erlebt: [Die] Erfassung des onomatopoetischen Charakters ist unmittelbar. Der onomatopoe‐ tische Charakter wird erlebt, nicht verstanden, hat subjektive, nicht objektive Evidenz, und es scheint seinem Wissen zu gehören, daß er nur erlebbar, nicht in seinen Eigenschaften im Einzelnen begrifflich faßbar ist. (Wissemann 1954: 8) Wissemann verweist damit auf eine Ebene von Bedeutung, die in der Linguistik bis in die 80er Jahre 7 außer Betracht gelassen wurde: Prozesse des körperlichen bzw. verkörperten Bedeutens und Verstehens. Gut 70 Jahre nach Wissemann stellen Dingemanse und Akita in ihren Studien zu Ideophonen (Dingemanse 2011, 2017; Dingemanse/ Akita 2017) fest, dass Onomatopöien im Kontext multimodalen Sprachgebrauchs sehr häufig mit sogenannten depictive bzw. iconic gestures auftreten. 8 Dingemanse beobachtet dabei eine enge semantische Verbindung zwischen onomatopoetischen Wörtern und den vordergründig darstellenden Handgesten: DEPICTIVE GESTURES depict aspects of the same scene that speech also represents. […] The speaker depicts the ignition of the gunpowder with both hands moving symmetrically in a quick upward motion like flames flaring up. This depictive gesture is time-aligned with the first token of the ideophone, and repeated with the second. (Dingemanse 2011: 346, Herv. i. Orig.) 172 Clara Kindler-Mathôt <?page no="173"?> Geste und Äußerung zeigen sich also nicht als ein Nebeneinander, sondern stehen in einer deutlichen semantischen und syntaktischen Relation. Dinge‐ manse beschreibt diese Verbindung von Geste und Lautsprache als holistische, darstellende Gestalt, als „holistic (though selective) depictions of complex states of affairs; and both form integral parts of a single, richly multimodal performative act“ (Dingemanse 2011: 354). Die ausgewählten Studien verdeutlichen also, dass die Bedeutungsentfaltung von Onomatopöien nicht nur auf einer ikonischen Form-Bedeutungsbeziehung beruht, sondern sehr deutlich mit multimodalen und verkörperten Prozessen einhergeht. Im Sinne einer dynamischen Sprachgebrauchsperspektive kann die oben aufgestellte Definition damit neu formuliert werden: 1. Onomatopöien haben einen lautnachahmenden Charakter, der sowohl von konkreten als auch phantasievollen Vorstellungen motiviert sein kann. Diese Vorstellungen stehen in einem engen Verhältnis zu körperlichen Erfahrungen und sind somit als Abstraktionen verkörperten Erlebens beschreibbar. 2. Onomatopöien weisen einen hohen Grad an Ikonizität auf, was sie als sprachliche Zeichen weniger arbiträr macht als andere. In einem mul‐ timodalen Kontext sind sie dennoch dynamisch, da bspw. durch den individuellen und spontanen Gebrauch von depictive gestures bestimmte Bedeutungsaspekte betont werden, die der lautlichen Onomatopöie nicht unmittelbar inhärent sind. 3. Trotz ihrer meist interjektionellen Form und damit einhergehender syn‐ taktischer Auffälligkeit sind Onomatopöien semantisch und syntaktisch in multimodale, holistische Äußerungen integriert. Die folgende Fallstudie überprüft nun diese drei Kriterien anhand der exempla‐ rischen multimodalen Analyse der onomatopoetischen Interjektion wusch. Die Analyse schließt damit insbesondere an Akita und Dingemanses Arbeit an, geht jedoch einen Schritt weiter, da sie neben der semantischen und syntaktischen Einbettung von wusch in den lokalen Äußerungskontext ebenso die zeitliche Bedeutungsentfaltung der Interjektion innerhalb des Diskurses betrachtet. Dabei soll insbesondere die Ebene der Verkörperung berücksichtigt werden, die bei Wissemann in den Ausführungen der Proband: innen auf einer seman‐ tischen Ebene anklingt und bei Akita und Dingemanse ebenfalls thematisiert wird. Ausgehend von der grundsätzlichen Frage Was heißt eigentlich wusch? fokussiert die Analyse deshalb die folgenden drei spezifischen Aspekte: Wie ist wusch als onomatopoetische Interjektion (1) semantisch und (2) syntaktisch Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 173 <?page no="174"?> 9 Das Teilprojekt wurde im Rahmen des Forschungsprojektes ‚Body Language of Dance and Movement‘ unter der Leitung von Cornelia Müller (Frankfurt (Oder)) in Zusam‐ menarbeit mit Sabine Koch (Alfter/ Bonn, damals Heidelberg) und Thomas Fuchs (Heidelberg) als Teil des BMBF-Programms ‚Translation functions of the humanities‘ durchgeführt. Die Ergebnisse des Projekts sind im Sammelband von Koch et al. (2012) und im Artikel von Müller und Ladewig (2013) zusammengefasst. 10 ELAN (Version 6.4) [Computer software]. (2022). Nijmegen: Max Planck Institute for Psycholinguistics, The Language Archive. Online unter: https: / / archive.mpi.nl/ tla/ elan. 11 Der stroke gilt in der Gestikforschung als die bedeutungstragende Phase gestischer Einheiten, oder, wie Kendon schreibt, als „the phase when the expression of the gesture, whatever it may be, is accomplished“ (Kendon 2004: 112). in die multimodale Äußerung eingebettet? (3) Werden im Rahmen diskursiver Bedeutungskonstitution Aspekte von Verkörperung sichtbar? 3 Daten und Methode 3.1 Daten Ausgangspunkt der Untersuchung sind zwei Workshops zum Walzertanz, die im Rahmen des durch das Bundesministerium für Bildung und Forschung (BMBF) geförderten Teilprojekts „Bedeutungsemergenz in Sprache und Geste“ (Europa-Universität Viadrina, 2009-2012) aufgezeichnet wurden. 9 Abb. 1 zeigt die beiden Workshops als zwei Datensets in ihrem zeitlichen Verlauf. Neben Phasen des Unterrichts beinhalten die Daten zusätzlich Reflexionsphasen der Schüler: innen (TS) und des Tanzlehrers (TL) in Form von Einzel- und Grup‐ peninterviews. In einem Bottom-up-Verfahren wurde die onomatopoetische Interjektion wusch mit Hilfe eines Gesprächsinventars (Deppermann 2008) als wiederkehrende Form identifiziert. Insgesamt wurde sie sieben mal realisiert, in Abb. 1 markiert als Sternchen. Alle vorgestellten Beispiele kommen aus Da‐ tenset 2. Sie wurden mit der Annotationssoftware ELAN 10 annotiert und in GAT 2 (Selting et al. 2009) transkribiert. Die Transkription dient in erster Linie der Berücksichtigung prosodischer Aspekte und nicht der gesprächsanalytischen (Sequenz-) Analyse. Die Transkription berücksichtigt ebenfalls Handgesten. Geschweifte Klammern markieren Beginn und Ende von Gesteneinheiten, strokes werden fett hervorgehoben. 11 Die weitere, lineare Transkription von Gesten orientiert sich an den Konventionen von Müller (1998: Anhang). Sie wird an den entsprechenden Stellen im Text erläutert. 174 Clara Kindler-Mathôt <?page no="175"?> Abb. 1: Übersicht über die Daten mit den Vorkommen von wusch als ★ 3.2 Methodische Herangehensweise Das analytische Vorgehen basiert auf einem multi-methodischen Ansatz. Dabei steht immer die dynamische Dimension der Daten und Phänomene im Sinne zeitlicher Aushandlungs- und Entfaltungsprozesse im Vordergrund. Müller (2024) fasst dies in ihrem Artikel „A Toolbox of Methods for Gesture Analysis“ treffend zusammen: Temporality is relevant to analysis on multiple scales: on the micro-level of a single gesture or gesture sequence and on the macro-level of the unfolding of gesture(s) along the temporal dynamics of a discourse or conversational interaction (Müller 2024: 183). Der dynamische Ansatz zieht sich somit durch alle Ebenen der Analyse: Äuße‐ rungen, Gesten, Metaphorizität und deren Bedeutungskonstitution werden als sich zeitlich entfaltende Gestalten innerhalb interaktiver Prozesse verstanden. Die weiteren Analyseschritte schließen an diese dynamische Perspektive an und umfassen die formbasierte Gestenanalyse Methods for Linguistic Gesture Analysis (MGA; Müller 2010b, 2024; Müller/ Kappelhoff 2018), Timeline-Visua‐ lisierungen (Ladewig/ Hotze 2021; Müller/ Ladewig 2013; Müller/ Tag 2010) und eine vom Diskurs geleitete Analyse multimodaler Metaphern (Cameron 2007; Cameron et al. 2009; Müller 2008; Müller/ Ladewig 2013). 3.2.1 Gestenanalyse MGA Die Analyse der Handgesten erfolgt auf Grundlage des formbasierten Ansatzes der „Method of Linguistic Gesture Analysis“ (MGA, Müller et al. 2013). Es wird davon ausgegangen, dass die Form einer Geste Aufschluss über ihr kontextfreies Bedeutungspotenzial gibt. Insbesondere die Parameter der „articulation of shapes, movements, positions and orientations of hands, fingers and arms“ (Müller et al. 2013: 708) werden als bedeutungstragend betrachtet. Alle Formpa‐ Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 175 <?page no="176"?> 12 Siehe dazu Müllers (2010a) Artikel „Mimesis und Gestik“ und andere formbasierte Studien zu bspw. rekurrenten Gesten und Gestenfamilien (z. B. Bressem/ Müller 2014; Ladewig/ Hotze 2021). rameter können dabei entscheidende Bedeutungsaspekte beinhalten und „even minor changes in gestural forms might be significant of what is being depicted or being expressed“ (Müller 2024: 190). Es wird also von einer grundsätzlichen Motiviertheit gestischer Bedeutung ausgegangen (Ladewig 2018a: 292). 12 Die kontextbezogene Bedeutung ergibt sich erst aus der sequenziellen Einbettung in den lokalen Gebrauchskontext. Das bedeutet, dass auf Äußerungsebene durch die Analyse der Relationen von Gestik und Äußerung syntaktische, pragmatische und semantische Bedeutung und Funktionen bestimmt werden können (siehe Ladewig 2018b: 306). 3.2.2 Multimodale Äußerungen Die vollständige Bedeutung von Gesten kann erst über ihre Einbettung in‐ nerhalb multimodaler Äußerungen rekonstruiert werden. Multimodale Äuße‐ rungen sind holistische Gestalten, das heißt, die Modalitäten formen ein Mitei‐ nander in Form eines zeitlichen Zusammenspiels. In diesem Zusammenspiel treten die Modalitäten in Relationen. Diese müssen nicht simultan sein, sondern können temporale Distanz aufweisen (siehe Ladewig 2018b: 306). Semantische und syntaktische Relationen können als komplementär, modifizierend oder ersetzend beschrieben werden (Ladewig 2020). Ansätze der gesture grammar (Fricke 2012; Bressem et al. 2013; Ladewig 2018a, 2018b, 2020; Müller et al. 2013) zeigen, dass diese Relationen sprachliche, aber auch eigene Strukturen bilden. Handgesten können grammatische Funktionen von sowohl Wortarten als auch syntaktischen Strukturen, etwa ganzen Sätzen oder Phrasen, übernehmen (siehe Ladewig 2020; Müller 2010b). Um multimodale Äußerungen nicht in schriftsprachliche Strukturen zwängen zu müssen, spricht Ladewig nicht von syntaktisch korrekten Äußerungen, sondern von „sequentially constructed mul‐ timodal utterance[s]“ (Ladewig 2020: 65), in denen die Modalitäten zueinander ko-expressiv sind, sich also auf dasselbe Diskursobjekt beziehen (siehe Ladewig 2020: 47). 3.2.3 Gestentypologie: Singuläre Gesten Neben der Analyse der Funktion von Gesten im Rahmen multimodaler Äuße‐ rungen gibt auch die Analyse der Typologie nach Müller (2010b) Aufschluss über Bedeutungsaspekte. Müller unterscheidet Gesten nach dem Grad ihrer Konventionalisierung in drei Gruppen: (1) Hoch konventionalisierte Embleme, (2) zu einem gewissen Grad konventionalisierte rekurrente Gesten und (3) die 176 Clara Kindler-Mathôt <?page no="177"?> 13 Zur ausführlichen Ausarbeitung der Charakterisitika von Metaphern als „specific form of cognitive activity“, „triadic structure“, „modalitiy independent“ und abhängig von „the procedural character of language use“, siehe Müller (2008: Kap. 4). individuell und spontan realisierten singulären Gesten. Insbesondere für den Typ der singulären Geste spielt die Formbeschreibung eine entscheidende Rolle, da sie sich deutlich mimetisch auf abstrakte und konkrete Handlungen, Gegen‐ stände und Sachverhalte bezieht (Müller 2010b: 39). Ihre Form-Bedeutungsrela‐ tion ist jedoch nicht konventionalisiert. Das bedeutet, sie werden spontan im Sprechen gebildet und sind in ihrer Form situativ-individuell. So kann ein runder Bilderrahmen entweder dreidimensional modelliert, zweidimensional gezeichnet oder mit der ganzen Hand repräsentiert werden. Je nach Kontext können so etwa die Form, die Größe oder die Verortung des Rahmens im Raum relevant gesetzt werden. Auf Grund der unterschiedlichen Darstellungsweisen, die alle in Bezug auf Als-Ob Handlungen (as-if actions as modes of gestural mimesis; siehe Müller 2010b; 2024) beschreibt Müller singuläre Gesten als „verkörperte Konzeptualisierungen und leibliches Erleben“ (Müller 2010b: 39). 3.2.4 Multimodale Metaphern Der angeführte Metaphernbegriff geht von der Konzeptualisierung Lakoff und Johnsons als „understanding and experiencing one kind of thing in terms of another“ (Lakoff/ Johnson 1980: 5; Herv. i. Orig.) aus und denkt diesen vor dem Hintergrund multimodalen und dynamischen Sprachgebrauchs weiter. Als multimodale, verkörperte Prozesse sind Metaphern demnach keine abstrakten, kognitiven Gegenstände oder Referenzen, sondern vielmehr körperliche Als-Ob Erfahrungen (siehe Cienki/ Müller 2008: 496), die dynamisch und interaktiv in der Zeit entfaltet werden. 13 We propose that an analysis of the embodied dynamics of metaphor shows how metaphoricity dynamically unfolds over time in a conversational interaction (this is a pattern which extends linearly in time) and how at the same time it may be graded, i.e. showing different degrees of metaphor activation (these are simultaneous patterns realized at one given moment in time). (Müller/ Tag 2010: 85) Müller und Tag orientieren sich am Ansatz der metaphor-led discourse ana‐ lysis (Cameron 2007, 2011; Cameron et al. 2009). Cameron beschreibt darin Metaphern als kreative dynamische patterns, die in der Interaktion durch die Interaktionspartner: innen gemeinsam gestaltet und ausgehandelt werden, sogenannte systematic metaphors (siehe Cameron 2007: 201) oder multimodale discourse metaphors (Müller/ Ladewig 2013: 306): „We speak of discourse meta‐ phors because instantiations of these metaphors in speech and gesture were Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 177 <?page no="178"?> used along the workshop by teachers and students“ (Müller/ Ladewig 2013: 306). Metaphern werden so zu interaktivem Handeln. Um die Prozesshaftigkeit dessen zu betonen, spricht Müller bevorzugt von Metaphorizität: „The term metaphoricity captures this temporal, scalar, and dynamically embedded aspect of metaphor“ (Müller 2019: 64; Herv. i. Orig.). Müller betont weiter, dass es nicht nur darum geht, ob Metaphern verwendet werden, sondern vielmehr, ob diese interaktiv relevant gesetzt - aktiviert - werden. Müller und Tag formulieren verschiedene Strategien des foregroundings, durch welche die Aktivierung von Metaphorizität erfolgen kann. Diese sind nicht exklusiv für Metaphorizität, sondern für Bedeutung im Allgemeinen. Das Iconicity Principle folgt der Prämisse, mehr kommunikativer Aufwand sei mehr Bedeutung: „More metaphorical material foregrounds metaphoric meaning“ (Müller/ Tag 2010: 94). Das Interactive Principle unterteilt sich in internal und external strategies. Die internal strategies beziehen sich auf das Hervorheben von Gesten durch Größe und Platzierung im Gestenraum, „such that the listener cannot but see them“ (Müller/ Tag 2010: 95), und die Betonung durch prosodische Mittel. Zu den external strategies zählt z. B. der Blick auf die eigenen Gesten. Das dritte Prinzip, das Semantic and Syntactic Principle, bezieht sich auf die Relation von Sprache und Geste. Die Aktivierung von Bedeutung wird sowohl interaktiv als auch individuell von einer/ einem Sprecher: in aus gedacht, da diese individuell Aspekte für andere (und somit interaktiv) relevant setzen (siehe Müller/ Tag 2010: 85). 4 Analyse der multimodalen Realisierung von Onomatopöien im Kleinen Aufbauend auf sowohl dem dargelegten Forschungsstand zu Multimodalität und Onomatopöie als auch der ausgeführten methodischen Herangehensweise wird im Folgenden eine Analyse auf zwei Ebenen vorgestellt: 1. Die multimodale Entfaltung auf Äußerungsebene, die eine Orchestrierung von Lautsprache, sowie Hand- und Körpergesten beinhaltet. 2. Die prozesshafte Konstitution von Bedeutung auf Ebene des Diskurses. Die erste Ebene wird im Abschnitt Multimodale Analyse im Kleinen mit Blick auf die lokale Bedeutungsentfaltung von wusch innerhalb einer Äußerungssequenz adressiert. 4.1 Kontext und Rhythmus Im Rahmen des Workshops zu „Haltung und Bewegung“ übt die Tänzer: innen‐ gruppe Rechtsdrehungen. In einer Vorübung mit einer einfachen Schrittfolge 178 Clara Kindler-Mathôt <?page no="179"?> soll das Gefühl für den richtigen Schwung für die Drehung vermittelt werden. Dazu stellen sich die Schüler: innen in kleineren Gruppen hinter dem Lehrer auf, um die Übung nach einer kurzen Erklärung gemeinsam durchzuführen. Während der Ausführung spricht der Tanzlehrer die Schrittabfolge mit, zu sehen in Abbildung 2. In zwei Wiederholungen zeigt der Tanzlehrer einen aus zwei Takten bestehenden Bewegungsablauf: Mit jedem vor WUSCH: geht der linke Arm ausgestreckt mit einer werfenden Bewegung in einem Bogen seitlich des Körpers von Hüfthöhe bis über den Kopf in die linke obere Peripherie (siehe Pfeil in Abb. 2). Der Körper folgt dem Arm mit Schritten und einer halben Drehung im Uhrzeigersinn. Im zweiten Takt simultan mit lass sie LAUfen vollführt der Tanzlehrer eine weitere halbe Drehung, bis er wieder in der Ausgangsposition des ersten Taktes ist. Auch die Hand wandert dabei zurück in die Ausgangsposition. Äußerungsebene, Körperbewegungen und die strokes der Handgesten formen dabei ein rhythmisches multimodales Zusammenspiel, das sich, obwohl keine Musik gespielt wird, als ¾ Takt des Walzers entfaltet (im Transkript grau hinterlegt). In den Takten 6-8 (Zeile 02) bleibt der Tanzlehrer stehen und beobachtet die Tanzschüler: innen. Die Hände befinden sich in einer Ruheposition seitlich des Körpers. Sprachlich wird der Rhythmus jedoch weitergeführt, da sowohl Wortfolge als auch Intonation kontinuierlich bleiben. Abb. 2: Multimodale Äußerung vor WUSCH: mit spezifischem Rhythmus Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 179 <?page no="180"?> Der Rhythmus des betrachteten Ausschnitts wird zur zeitlichen Organisation der Übung (siehe Keevallik 2021: 2). Dies wird besonders deutlich, betrachtet man die syntaktische Struktur und Relation von Äußerung und Geste. Insge‐ samt sieben Intonationsphrasen reihen sich aneinander, die sich durch einen Intonationsanstieg zum Phrasenende hin voneinander abgrenzen. Der Anstieg suggeriert Unabgeschlossenheit und macht eine weitere Phrase erwartbar. So entfaltet sich ein kontinuierlicher Flow, mit dem jeweils zwei Gestenphrasen einhergehen. Die syntaktische Relation von Äußerung und Handgeste ist dabei simultan, da der stroke der Gesten auf die intonatorisch relevant gesetzten Teile der Äußerung, nämlich die Adverbien vor WUSCH: fällt. Die Gesten übernehmen damit ebenfalls eine adverbiale Funktion, die die Äußerungsebene durch den zusätzlichen Bedeutungsaspekt der Bewegungsqualität modifiziert. Es ergibt sich ein repetitives rhythmisches Muster, eine sequentially constructed multimodal utterance (Ladewig 2020), welche in ihrer Wiederholung und Gleich‐ mäßigkeit eine dynamische Bewegungsgestalt entfaltet. Durch die rhythmische Einbettung wird wusch integriert. Obwohl sie als onomatopoetische Interjektion syntaktisch ‚auffällig‘ ist, wirkt sie nicht wie etwas „Dazwischengeworfenes“ (Glück 2010: 300), sondern vielmehr als vollständig integrierter Bestandteil der multimodalen Syntax (Ladewig 2020: 46). Durch die Integration in die multimo‐ dale Phrase, simultan mit der Handgeste in adverbialer Funktion, wirkt auch die Onomatopöie adverbial und dadurch zusätzlich modifizierend. Die Handgeste verbindet die beiden Bedeutungsaspekte der Bewegungsrichtung und Bewe‐ gungsqualität und schafft so eine adverbiale multimodale Bedeutungsgestalt. Die semantische Beziehung wird im Folgenden mit Blick auf die Formanalyse der beiden Handgesten aufgegriffen. 4.2 Gestische Form und semantische Relation Die beiden Gestenphrasen weisen vergleichbare Form-Parameter auf. In beiden Fällen führt der Tanzlehrer eine schwungvolle, bogenförmige Bewegung seitlich des Körpers von hinten nach vorne mit dem ganzen Arm aus. Die Handform ist dabei zunächst geöffnet und flach, die Finger zeigen nach unten, formen dann aber im Schwung zum Ende hin einen nach vorne und oben deutenden ausgestreckten Zeigefinger. Abb. 3 zeigt den Bewegungsverlauf exemplarisch anhand der zweiten Phrase. 180 Clara Kindler-Mathôt <?page no="181"?> 14 DWDS - Digitales Wörterbuch der deutschen Sprache. Online unter: https: / / www.dw ds.de/ wb/ wusch. Abb. 3: Formanalyse der Handgeste vor WUSCH: Die Formanalyse der Handform und -bewegung verweist auf den Modus eines acting as-if (Müller 2010a): Die Hand agiert, als ob sie ein größeres Objekt schwungvoll wegschiebt und ihm schließlich hinterher zeigt. Handform und -bewegung heben also bereits zwei Bedeutungsaspekte hervor. Erstens eine spezifische Bewegungsqualität: Schwungvoll und bogenförmig. Und zweitens eine spezifische Bewegungsrichtung: Von hinten nach vorne. Die Bewegungs‐ richtung wird zusätzlich durch das pointing mit ausgestrecktem Zeigefinger betont. Es zeigt sich also eine semantische Ko-Expressivität zur lautsprachlichen Äußerungsebene. Beide beziehen sich auf dasselbe Diskursobjekt (siehe La‐ dewig 2018b: 306). Da Geste und Äußerung gemeinsame semantische Merkmale teilen, kann von einer komplementären semantischen Relation gesprochen werden: Die Vorwärtsbewegung (vor + Bewegungsrichtung der Geste) und die Bewegungsqualität (wusch als rasche, huschende Bewegung (siehe DWDS: wusch) 14 + Bewegungsqualität der Geste). Zusätzlich findet jedoch eine Modifikation statt. Aufgrund der Vagheit der Onomatopöie wird der Bedeutungsaspekt der Bewegungsqualität durch die Handgeste nicht nur hervorgehoben, sondern vor allem präzisiert: Statt rasch-huschend ist sie eher schwungvoll-rauschend. Des Weiteren modifiziert die singuläre Geste als ein acting-as if die Äußerung um den Bedeutungsaspekt des Wegwerfens oder -schiebens. Das Interplay der Modalitäten entfaltet folg‐ lich eine komplexe semantische Bedeutungsgestalt eines schwungvoll-rausch‐ enden Vorwärtswerfens oder -schiebens: „Gesten und Rede [sind] stark aufei‐ Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 181 <?page no="182"?> nander abgestimmt und [bilden] eine Einheit“ (Ladewig 2018a: 294; siehe auch gesture speech ensemble, Kendon 2004: 127). 4.3 Zwischenfazit: multimodale Äußerung Die multimodale Orchestrierung der Handgeste und Äußerung zeigt ein kom‐ plexes Zusammenspiel aus semantischen und syntaktischen Relationen. Ge‐ meinsam formen sie eine sequentially constructed multimodal utterance (Ladewig 2020), in die wusch vollständig integriert ist. Neben dieser vollständigen Integ‐ ration lassen sich außerdem Prozesse der Bedeutungsstabilisierung beobachten. Die Wiederholung der Äußerungsphrase in kontinuierlichem Rhythmus und stabiler Wort-Gesten-Abfolge etabliert die spezifische Bedeutungsgestalt einer schwungvoll-werfenden Vorwärtsbewegung. Durch diese situativ modulierte multimodale Konstruktion bleibt die komplexe Bedeutungsgestalt auch be‐ stehen, wenn die Handgeste in der dritten Wiederholung ausbleibt. Die Wieder‐ holung der multimodalen Phrasen wirkt zusätzlich als foregrounding Strategie, durch die Bewegungsrichtung und -qualität besonders salient gesetzt werden. Am Beispiel von Gesten beschreibt Ladewig dies als multimodal salience struc‐ tures: „Gestures […] can foreground different meaning facets conveyed in speech and if they do so multiple times during a discourse, a multimodal salience structure evolves“ (Ladewig 2020: 94). Die Handgesten innerhalb dieser multi‐ modal salience structure heben durch ihren acting as-if-Charakter zusätzlich den Bedeutungsaspekt einer körperlichen Handlung hervor. Die Handform und Bewegung erinnern an das schwungvolle Wegschieben oder das Werfen eines größeren Objektes. Dieses Ergebnis gleicht den Beobachtungen von Din‐ gemanse und Akita in Bezug auf Ideophone und depictive gestures. Somit stellen die singulären Gesten einen ersten Anhaltspunkt für Verkörperungsprozesse dar. 5 Analyse der multimodalen Realisierung von Onomatopöien im Großen Bisher wurde eine mikroanalytische Perspektive auf Bedeutungsentfaltung eingenommen. Damit wird vor allem die lokale Bedeutungsentfaltung auf der Ebene der multimodalen Äußerung berücksichtigt. Eine Perspektive des Sprachgebrauchs einzunehmen bedeutet jedoch auch, den tatsächlichen Ge‐ brauchskontext und die situative Einbettung der Äußerungen in die Analyse einzubeziehen. In der Entfaltung des Diskurses, im vorliegenden Fall der Walzertanzstunde, ist Bedeutung immer ein dynamischer Entfaltungsprozess. 182 Clara Kindler-Mathôt <?page no="183"?> 15 Diskursmetaphern werden durch Kapitälchen markiert. 16 Die Notation der Gesten unterhalb der Transkription orientiert sich an den Konventi‐ onen von Müller (1998). Zeile eins berücksichtigt die Gestenphasen im zeitlichen Verlauf nach Kendon (2004): Preperation, Stroke/ Stroke Hold (durchnummeriert nach neuen Formen), Retraction, restposition. Zeile zwei gibt eine grobe Formbeschreibung der Handgesten. Folglich geht damit eine zeitliche Dynamik einher, die durch die Interaktion geprägt ist: Bedeutungsgestalten etablieren sich, die so nur in einer spezifischen Situation und Sprecher: innengemeinschaft bestehen, jedoch genauso in ihr wieder aufgelöst oder verändert werden können. Um diese Prozesse sichtbar zu machen, wird im Folgenden die oben analysierte Sequenz im Kontext des Diskurses betrachtet. 5.1 Dynamische Bedeutungsentfaltung im Diskurs Das Konzept dynamisch multimodaler Diskursmetaphern wurde im Methoden‐ kapitel bereits vorgestellt. Betrachtet man den gesamten Verlauf der Tanzstunde, so zeigt sich, dass wusch als Teil der adverbialen Bedeutungsgestalt nicht nur die Substitution der multimodalen Äußerungssequenz darstellt, sondern vielmehr Teil einer komplexen multimodalen Diskursmetapher ist: D R E H E N IM W AL Z E R I S T B O WLIN G . 15 Die Metapher kann als Diskursmetapher bezeichnet werden, da sie sich über den gesamten Tanzunterricht und die Interviewsequenzen interaktiv entfaltet. Dreh- und Angelpunkt der Metapher ist dabei die Vermittlung eines gewissen Körpergefühls für den Schwung einer Drehung, welches durch die ‚Bowlingmetapher‘ konzeptualisiert wird. Der folgende Abschnitt widmet sich der Analyse dieser Metapher und beginnt mit der situativen Einbettung im Rahmen der Unterrichtsstunde. 5.2 Entfaltung einer Diskursmetapher Im Kontext des Themas der Tanzstunde „Haltung und Bewegung“ übt die Schüler: innengruppe Rechtsdrehungen. Der Tanzlehrer versucht in einer vor‐ bereitenden Übung einen bestimmten Schwung zu beschreiben, der schließlich in eine Drehung führen soll. Zunächst versucht er dies, durch das Zeigen mit ausgestrecktem Arm und Zeigefinger zu erklären und lässt die Schüler: innen die Schrittfolge tanzen. Die Übung hat nicht den gewünschten Effekt, worauf er die Zeigegeste als unpassend reflektiert und stattdessen multimodal die Metapher D R E H E N IM W AL Z E R I S T B O WLIN G etabliert. Die folgende orthografische Transkription berücksichtigt ebenfalls die gestische Entwicklung. 16 Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 183 <?page no="184"?> Transkript 1: Zeigen war blöd (Tanzlehrer, Datenset 2) Der Ausschnitt macht drei Aspekte deutlich: 1. Die Metapher D R E H E N IM W AL Z E R I S T B O WLIN G entsteht dynamisch aus der Interaktion heraus: In seiner Ausführung verdeutlicht der Tanzlehrer, dass die erste multimodale Erklärung mit der Zeigegeste nicht zielführend war. Aus der Interaktion mit den Tanzschüler: innen heraus entwickelt er deshalb eine Metapher, um den Bewegungsablauf verständlicher zu konzeptualisieren. 2. Die Metapher wird durch mehrere foregrounding Strategien aktiviert: Deutlich zeigt sich das Iconicity Principle im erhöhten kommunikativen Aufwand (Äußerung + Geste + Metapher + Wiederholung). Außerdem wirkt das Syntactic and Semantic Principle, da alle Gesten in Lücken der verbalen Äußerung eingefügt werden und dabei substituierend die Funktion der syntaktischen Phrasen übernehmen (Ladewig 2018b: 307). 3. Die Metapher basiert auf einer Körpererfahrung: Der Tanzlehrer verweist auf ‚Bowling‘ bzw. ‚Kegeln‘ als einen geteilten Erfahrungsbereich. Die Metapher der geworfenen Bowlingkugel, die er genau beschreibt, cha‐ rakterisiert die Bewegung mit dem Fokus auf die Bewegungsqualität: „Metaphors are used to understand ‘concrete’ sensorimotor experiences.“ (Müller/ Ladewig 2013: 297). Auch die Geste, die er dazu ausführt, hebt als singuläre, agierende Geste das Werfen einer Bowlingkugel mit spezifi‐ schem Bewegungsablauf und -qualität hervor. 184 Clara Kindler-Mathôt <?page no="185"?> Abb. 4: Interactive trajectory der Diskursmetapher D R E H E N I M W A L Z E R I S T B O W L I N G Mit Blick auf den weiteren Verlauf des Diskurses wird deutlich, dass es sich bei D R E H E N IM W AL Z E R I S T B O WLIN G um eine Diskursmetapher handelt. Eine deutliche interactive trajectory (Müller/ Ladewig 2013: 315 ff.), also eine Spur metaphorischer Äußerungen, zieht sich durch die gesamten 80 Minuten der Unterrichtseinheiten, welche auf die eben zitierte Metaphernfindung aufbaut und sie weiterentwickelt. Der Verlauf dieser interactive trajectory ist in Abb. 4 nachgezeichnet. Der Tanzlehrer greift immer wieder Aspekte der Metapher auf, z. B. durch die Verwendung bewegungsbeschreibender Verben (siehe Abb. 4, Zeile 2): da rauscht jetzt jemand mit der bowlingkugel vorbei oder wer vorwärts geht der schmeißt die bowlingkugel. An anderer Stelle verweist er auf die Metapher als Idee: das mit den kugeln wer vorwärts geht tanzt mit dieser idee. Bis auf einzelne Ausnahmen sind alle Äußerungen multimodal, da sie ko-expressiv mit weiteren vergleichbaren Gesten wie der beschriebenen Bowlinggeste sind (siehe Abb. 4, Spalte rechts). Dass die trajectory tatsächlich interaktiv ist, zeigt sich deutlich im ersten Gruppeninterview mit den Tanzschüler: innen. Eine Schüler: in erklärt, dass die Übung sehr hilfreich gewesen sei, da sich dadurch das Körpergefühl verändert hätte. Die folgende orthografische Transkription zeigt den multimodalen Äußerungskontext: Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 185 <?page no="186"?> Transkript 2: Ein anderer Schwung (Tanzschülerin, Datenset 2, Gruppeninter‐ view) Die Beschreibung der Tanzschülerin macht explizit deutlich, dass die Körperer‐ fahrung, auf die der Tanzlehrer durch die multimodale Metapher Bezug nimmt, auch intersubjektiv geteilt wird. Die Vorstellung, eine schwere Bowlingkugel in der Hand zu haben, verändert die Bewegungsdynamik der Drehung, da der Bezug zu einer tatsächlichen Körpererfahrung mit physikalischen Kräften her‐ gestellt wird. Die Metapher stellt demnach eine verkörperte Konzeptualisierung dieser Körpererfahrung dar, die insbesondere in den gestischen Realisierungen als Als-Ob Handlungen (acting as-if; siehe Müller 2010b, 2024) hervortreten: In the gestures we can see - that and how metaphors are embodied conceptualizations and we can see that metaphor construction is a process. The use of gestures with speech over the course of time reveals that this dynamic way of metaphoric meaning construction may structure entire workshops. (Müller/ Ladewig 2013: 301) Die Onomatopöie wusch steht in der Entfaltung der Metapher ganz am Schluss, wodurch sie einen substituierenden Charakter bekommt. Alle im Diskurs aktivierten und entfalteten Bedeutungsaspekte der raschen, werfenden Vor‐ wärtsbewegung vereinen sich in der multimodalen Realisierung von wusch. Als Abschluss der Diskursmetapher ist wusch nicht nur eine schwungvolle Vorwärtsbewegung, sondern das schwungvolle nach vorne Werfen einer Bow‐ lingkugel, die dem Schwung wichtige Aspekte wie ihr Gewicht und einen bestimmten schwungvollen Bewegungsablauf hinzufügt. Im multimodalen Ad‐ verb vor wusch vereinen sich alle Aspekte des spezifischen „Gefühls“ des Werfens einer Bowlingkugel. 186 Clara Kindler-Mathôt <?page no="187"?> 17 Vgl. hierzu auch die Metaphernentfaltungen im Tanzunterricht, z. B. im Ballettunter‐ richt: „Finding Balance is feeling a silk thread pulling the navel down towards the spine“ (Müller/ Ladewig 2013: 307). 5.3 Vom Bedeuten zum Verstehen Im Sprachgebrauchskontext einer Interaktion bleibt es nicht beim Bedeuten sprachlicher Zeichen. Bedeutung wird verstanden, wird also zum Verstehen. In jedem Gespräch, jeder Interaktion stellt das Herstellen eines geteilten Verstehens, also das Herstellen von Intersubjektivität, das zentrale Ziel dar. Insbesondere im Kontext des Unterrichts, in dem es ja spezifisch um Vermittlung geht, stehen Prozesse des Verstehens ganz besonders im Vordergrund (siehe Ehmer/ Brône 2021; Keevallik 2021; Müller/ Ladewig 2013). Gerade wenn es um die Vermittlung abstrakter Phänomene oder Konzepte wie Schwung, Haltung, Drehung oder Bewegung geht, nutzen Sprecher: innen häufig metaphorische Äußerungen, die meist ein Mapping von einem konkreten Erfahrungsbereich, z. B. Bowling, auf einen abstrakten Zielbereich, z. B. Schwung, vollziehen. 17 Metaphern stellen folglich dynamische Formen verkörperten Bedeutens und Verstehens dar. Müller fasst dies treffend zusammen: […] metaphoric meaning is meaning-making and an embodied form of understanding. Its prerequisites are twofold: mappings between two domains of embodied experience and interactions between them. Metaphoric gestures may present those experiential domains from the perspective of the speaker. They are designed for an attending co-participant, i.e. embedded in a particular interactive moment. Metaphors are thus dynamic forms of embodied understanding. (Müller 2017: 315, Herv. CK) Die vorgestellte Bowlingmetapher wird vom Tanzlehrer für die Tanz‐ schüler: innen designed. Sie wird speziell an die Gruppe angepasst, um so von einer geteilten Bedeutung zu einem geteilten Verstehen zu kommen. Verkörperung kommt in Bezug auf die Prozesse des Verstehens eine besondere Rolle zu, da sie deutlich macht, dass Verstehen kein abstrakter und kognitiver Gedankenvorgang ist, sondern als tatsächliches Körpererleben erfahrbar wird. In Phänomenen wie Metaphern, singulären Gesten, aber auch Onomatopöien wird dieser Zusammenhang zwischen Verstehen und Verkörperung besonders deutlich. Durch die Analyse konnte also gezeigt werden, dass sich die dynamische Bedeutungskonstitution der Onomatopöie wusch zum einen durch den mul‐ timodalen Kontext in seiner Ganzheit, zum anderen auch durch die Basis körperlicher Erfahrung etabliert. Im engen Zusammenspiel mit singulären Gesten und Metaphern wird deutlich, dass die Bereiche Bedeutungskonstitution Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 187 <?page no="188"?> - Körpererfahrung - Prozesse des Verstehens nicht voneinander trennbar sind, sondern in einem wechselseitigen Verhältnis stehen: Sie entfalten sich zu ganzheitlichen Erfahrungsgestalten. 6 Schlussfolgerung: Die dynamische Entfaltung multimodaler Bedeutung der onomatopoetischen Interjektion wusch Vor dem Hintergrund der detaillierten Untersuchung des multimodalen Ge‐ brauchs der onomatopoetischen Interjektion wusch in ihrer lokalen und diskur‐ siven Dynamik ergeben sich folgende Erweiterungen der oben herausgearbei‐ teten Charakteristika von Onomatopöien im multimodalen Sprachgebrauch: 1. Onomatopöien haben, vergleichbar mit singulären Gesten, ikonisch moti‐ vierte Bedeutungspotenziale, die erst in einer konkreten Kommunikations‐ situation von Sprecher: innen spontan und individuell aktiviert, etabliert oder verändert werden. Die Motivation der Bedeutung steht in engem Verhältnis zu körperlichen Erfahrungen. 2. Die Bedeutung von Onomatopöien entfaltet sich situativ, kontextabhängig und wird interaktiv relevant gesetzt. Bedeutungskonstitution wird deshalb als ein Prozess verstanden, der sich sowohl lokal innerhalb einer Äußerung als auch diskursiv über ein Gespräch, eine Unterrichtsstunde oder einen ganzen Workshop entfalten kann. 3. Die interjektionelle Form von Onomatopöie spielt im Kontext des Sprach‐ gebrauchs eine nachgestellte Rolle. Als Teil multimodaler Äußerungen entfalten sie produktive syntaktische und semantische Funktionen im Sinne multimodaler Muster und können so beispielsweise multimodale Bedeutungsgestalten formen. 4. Durch die Nähe zu Prozessen der Verkörperung zeigen sich in Onomato‐ pöien im Kontext multimodalen Sprachgebrauchs deutliche Prozesse des Verstehens. Vor diesem Hintergrund teilen Onomatopöien entscheidende Merkmale mit singulären Gesten und (multimodalen) Metaphern. 188 Clara Kindler-Mathôt <?page no="189"?> Abb. 5: wusch im Entfaltungsprozess zwischen kontextfreiem Bedeutungspotenzial, multimodaler Äußerung und Diskursmetapher Abb. 5 fasst den im Artikel skizzierten Verlauf der Analyse zusammen. Be‐ gonnen mit dem kontextfreien Bedeutungspotenzial von wusch als ikonisch motiviertes Zeichen auf Systemebene bringt die Einbettung in den multimo‐ dalen und lokalen Gebrauchskontext vielschichtige Bedeutungsebenen zu Tage. Die Integration von wusch in einen syntaktischen und semantischen Kontext zeigt Prozesse der Bedeutungsentfaltung und -stabilisierung, die multimodal in einem engen Zusammenspiel von Handgesten und verbaler Äußerung realisiert werden. Das endgültige Verlassen der Systemebene, hinein in den Diskurs, macht schließlich deutlich, dass Bedeutungsaushandlung mit komplexen und vielfältigen Prozessen einhergeht, etwa innerhalb der sich über 80 Minuten hinweg entwickelnden Diskursmetapher, die nicht nur Prozesse des Bedeutens, sondern auch des Verstehens sichtbar werden lässt. Die hier eingenommene dynamische Perspektive ist der Versuch, diese Prozesse und Phänomene auf‐ zudecken sowie analysierbar und nachvollziehbar zu machen. Die Analyse zeigt, dass Onomatopöie nicht nur die Nachahmung eines Lautes, sondern vielmehr Teil eines intersubjektiven Prozesses von Bedeutungsherstellung und verkörpertem Verstehen ist. Als Teil der multimodalen Bedeutungsgestalt und der sich rhythmisch entfaltenden Phrasen wird wusch semantisch und syntak‐ tisch vollständig in die Äußerung eingebettet. Bedeutung im Sprachgebrauch zeigt sich folgerichtig nicht als ein statisches Objekt, sondern deutlich als ein dynamischer, situierter und multimodaler Entfaltungsprozess - lokal in nur einer Äußerung, aber auch im Diskurs einer Tanzstunde oder eines mehrteiligen Workshops. Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 189 <?page no="190"?> Literatur Bressem, Jana/ Ladewig, Silva H./ Müller, Cornelia (2013). Linguistic annotation system for gestures (LASG). In: Müller, Cornelia/ Cienki, Alan/ Fricke, Ellen/ Ladewig, Silva H./ McNeill, David/ Teßendorf, Sedinha (Hrsg.). Body - Language - Communication. Handbücher zur Sprach- und Kommunikationswissenschaft, Bd.-38.1. Berlin/ New York: De Gruyter, 1098-1124. Bressem, Jana/ Müller, Cornelia (2014). The family of away gestures: Negation, refusal, and negative assessment. In: Müller, Cornelia/ Cienki, Alan/ Fricke, Ellen/ Ladewig, Silva H./ McNeill, David/ Bressem, Jana (Hrsg.). Body - Language - Communication. An international handbook on multimodality in interaction. Berlin: De Gruyter, 1592-1604. Bücker, Jörg (2023). Onomatopoesie aus semiotischer und gesprächslinguistischer Sicht. Überlegungen zu einer ikonischen Ausdrucksform fokussierter Interaktion. In: Ziem, Alexander (Hrsg.). Konstruktionsgrammatik VIII. Konstruktionen und Narration. Tübingen: Stauffenburg, 217-251. Buijtendijk, Frederik J.J./ Plessner, Helmuth (1925). Die Deutung des mimischen Aus‐ drucks. Ein Beitrag zur Lehre vom Bewusstsein des anderen Ichs. Philosophischer Anzeiger 11, 72-126. Burgoon, Judee K./ Guerro, Laura K./ White, Cindy H. (2013). The codes and functions of nonverbal communication. In: Müller, Cornelia/ Cienki, Alan/ Fricke, Ellen/ Ladewig, Silva H./ McNeill, David/ Teßendorf, Sedinha (Hrsg.). Body - Language - Communi‐ cation: An International Handbook on Multimodality in Human Interaction, Bd. 38.1. Berlin/ Boston: De Gruyter, 609-627. Cameron, Lynne (2007). Patterns of metaphor use in reconciliation talk. Discourse & Society 18 (2), 197-222. Cameron, Lynne (2011). Metaphor and reconciliation. The discourse dynamics of em‐ pathy in post-conflict conversations. New York: Routledge. Cameron, Lynne/ Maslen, Robert/ Todd, Zazie/ Maule, John/ Stratton, Peter/ Stanley, Neil (2009). The discourse dynamics approach to metaphor and metaphor-led discourse analysis. Metaphor and Symbol 24 (2), 63-89. Cienki, Alan/ Müller, Cornelia (2008). Metaphor, gesture and thought. In: Gibbs, Jr., Raymond W. (Hrsg.). The Cambridge handbook of metaphor and thought. Cambridge: Cambridge University Press, 484-501. De Saussure, Ferdinand (1916). Grundfragen der allgemeinen Sprachwissenschaft. 3. Aufl. Berlin/ New York: De Gruyter. Deppermann, Arnulf (2008). Gespräche analysieren. Eine Einführung. Wiesbaden: Verlag für Sozialwissenschaften. 190 Clara Kindler-Mathôt <?page no="191"?> Deppermann, Arnulf (2020). Interaktionale Semantik. In: Hagemann, Jörg/ Staffeldt, Sven (Hrsg.). Semantiktheorien II. Analysen von Wort- und Satzbedeutungen im Vergleich. Tübingen: Stauffenburg, 235-278. Dingemanse, Mark (2011). The meaning and use of ideophones in Siwu. Een wetenschap‐ pelijke proeve op het gebied van Letteren. Nijmegen: Radboud University. Dingemanse, Mark (2013). Ideophones and gesture in everyday speech. Gesture 13 (2), 143-165. Dingemanse, Mark (2017). Expressiveness and system integration. On the typology of ideophones, with special reference to Siwu. STUF - Language Typology and Universals 70 (2), 363-384. Dingemanse, Mark/ Akita, Kimi (2017). An inverse relation between expressiveness and grammatical integration. On the morphosyntactic typology of ideophones, with special references to Japanese. Journal of Linguistics 53 (3), 501-532. Ehmer, Oliver/ Brône, Geert (2021). Instructing Embodied Knowledge: Multimodal Ap‐ proaches to Interactive Practices for Knowledge Constitution. Linguistics Vanguard 7 (4), 20210012. https: / / doi.org/ 10.1515/ lingvan-2021-0012. Fricke, Ellen (2012). Grammatik multimodal. Wie Wörter und Gesten zusammenwirken. Berlin/ Boston: De Gruyter. Glück, Helmut (Hrsg.) (2010). Metzler Lexikon Sprache. 4. Aufl. Stuttgart/ Weimar: J.B. Metzler. Horst, Dorothea/ Boll, Franziska/ Schmitt, Christina/ Müller, Cornelia (2014). Gesture as interactive expressive movement: Inter-Affectivity in face-to-face-communication. In: Müller, Cornelia/ Cienki, Alan/ Fricke, Ellen/ Ladewig, Silva H./ McNeill, David/ Bressem, Jana (Hrsg.). Body - Language - Communication. Handbücher zur Sprach- und Kommunikationswissenschaft, Bd.-38.2. Berlin/ Boston: De Gruyter, 2112-2125. Kappelhoff, Hermann (2004). Matrix der Gefühle. Das Kino, das Melodram und das Theater der Empfindsamkeit. Berlin: Vorwerk 8. Kappelhoff, Hermann (2018). Kognition und Reflexion. Zur Theorie filmischen Denkens. Berlin/ Boston: De Gruyter. Kayser, Wolfgang (1962). Die Klangmalerei bei Harsdörfer. Göttingen: Vandenhoeck & Ruprecht. Keevallik, Leelo (2021). Vocalizations in Dance Classes Teach Body Knowledge. Linguis‐ tics Vanguard 7 (4), 20200098. https: / / doi.org/ 10.1515/ lingvan-2020-0098. Kendon, Adam (1980). Gesture and Speech: Two Aspects of the Process of Utterance. In: Key, Mary Ritchie (Hrsg.). Nonverbal Communication and Language. The Hague: Mouton, 207-227. Kendon, Adam (2004). Gesture. Visible action as utterance. Cambridge: Cambridge University Press. Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 191 <?page no="192"?> Koch, Sabine C./ Fuchs, Thomas/ Summa, Michela/ Müller, Cornelia (Hrsg.) (2012). Body Memory and the Genesis of Meaning. In: Body Memory, Metaphor and Movement. Amsterdam/ Philadelphia: John Benjamins Publishing Company, 23-41. Köhler, Wolfgang (1933). Psychologische Probleme. Berlin: Springer. Kress, Gunther/ van Leeuwen, Theo (2001). Multimodal Discourse: The Modes and Media of Contemporary Communication. London: Arnold. Ladewig, Silva H. (2018a). Gesten als Teil von Sprache - Die moderne Gestikforschung. In: Jessen, Moiken/ Bloomberg, Johan/ Roche, Jörg (Hrsg.). Kognitive Linguistik. Tü‐ bingen: Narr, 290-300. Ladewig, Silva H. (2018b). Gesten und ihre Bedeutung. In: Jessen, Moiken/ Bloomberg, Johan/ Roche, Jörg (Hrsg.). Kognitive Linguistik. Tübingen: Narr, 300-312. Ladewig, Silva H. (2020). Integrating gestures. The dimensions of multimodality in cognitive grammar. Berlin/ Boston: De Gruyter. Ladewig, Silva H./ Hotze, Lena (2021). The slapping movement as an embodied practice of dislike: Inter-affectivity in interactions among children. Gesture 20 (2), 285-312. https: / / doi.org/ 10.1075/ gest.21013.lad. Lakoff, George/ Johnson, Mark (1980). Metaphors we live by. Chicago: University of Chicago Press. Linell, Per (2009). Rethinking language, mind and world dialogically. Interactional and contextual theories of human sense-making. Charlotte: Information Age Publishing. McNeill, David (1992). Hand and Mind. What Gestures Reveal About Thought. Chicago: University of Chicago Press. Mondada, Lorenza/ Schmitt, Reinhold (2010). Zur Multimodalität von Situationseröff‐ nungen. In: Mondada, Lorenza/ Schmitt, Reinhold (Hrsg.). Situationseröffnungen. Zur multimodalen Herstellung fokussierter Interaktion. Berlin/ Boston: De Gruyter, 7-52. Müller, Cornelia (1998). Redebegleitende Gesten. Kulturgeschichte - Theorie - Sprach‐ vergleich. Berlin: Arno Spitz. Müller, Cornelia (2008). Metaphors dead and alive, sleeping and waking. A dynamic view. Chicago/ London: University of Chicago Press. Müller, Cornelia (2010a). Mimesis und Gestik. In: Koch, Gertrud/ Vöhler, Martin/ Voss, Christiane (Hrsg.). Die Mimesis und ihre Künste. Paderborn: Fink, 149-187. Müller, Cornelia (2010b). Wie Gesten bedeuten. Eine kognitiv-linguistische und sequenzanalytische Perspektive. In: Mittelberg, Irene (Hrsg.). Sprache und Gestik 41 (1), 37-68. Müller, Cornelia (2013). Gestures as a medium of expression: The linguistic potential of gestures. In: Cienki, Alan/ Müller, Cornelia/ Ladewig, Silva H./ Fricke, Ellen/ Teßendorf, Sedinha/ McNeill, David (Hrsg.). Body - Language - Communication. An International Handbook on Multimodality in Human Interaction, Bd.-38.1. Berlin/ Boston: De Gruyter, 202-217. 192 Clara Kindler-Mathôt <?page no="193"?> Müller, Cornelia (2017). Waking metaphors. Embodied cognition in multimodal dis‐ course. In: Hampe, Beate (Hrsg.). Metaphor. Embodied cognition in discourse. Cam‐ bridge: Cambridge University Press, 297-316. Müller, Cornelia (2019). Metaphorizing as embodied interactivity: What gesturing and film viewing can tell us about an ecological view on metaphor. Metaphor and Symbol 34 (1), 61-79. Müller, Cornelia (2024). A toolbox of methods for gesture analysis. In: Cienki, Alan (Hrsg.). Handbook of Gesture Studies. Cambridge: Cambridge University Press, 182- 216. Müller, Cornelia/ Bressem, Jana/ Ladewig, Silva H. (2013). Towards a grammar of gesture. A form-based view. In: Müller, Cornelia/ Cienki, Alan/ Fricke, Ellen/ Ladewig, Silva H./ McNeill, David/ Teßendorf, Sedinha (Hrsg.). Body - Language - Communication. An International Handbook on Multimodality in Human Interaction., Bd. 38.1. Berlin/ Boston: De Gruyter, 707-733. Müller, Cornelia/ Kappelhoff, Hermann (2018). Cinematic metaphor. Experience - Affec‐ tivity - Temporality. Berlin/ Boston: De Gruyter. Müller, Cornelia/ Ladewig, Silva H. (2013). Metaphors for sensorimotor experiences: Gestures as embodied and dynamic conceptualizations of balance in dance lessons. In: Borkent, Michael/ Dancygier, Barbara/ Hinell, Jennifer (Hrsg.). Language and the Creative Mind. Stanford: Stanford University, 295-324. Müller, Cornelia/ Tag, Susanne (2010). The Dynamics of metaphor: Foregrounding and activating metaphoricity in conversational interaction. Cognitive Semiotics Spring 6, 85-120. Pinar Sanz, María J. (Hrsg.) (2015). Multimodality and Cognitive Linguistics. Ams‐ terdam/ Philadelphia: John Benjamins Publishing Company. Sasamoto, Ryoko (2019). Onomatopoeia and relevance. Communication of impressions via sound. Dublin: Palgrave Macmillan. Schuppener, Georg (2009). Onomatopoetika - ein vernachlässigtes Gebiet der Sprach‐ wissenschaft und Sprachdidaktik. Aussiger Beiträge 3, 105-123. Schuppener, Georg (2010). Onomatopoetika im Deutschen und Tschechischen als emo‐ tionales Ausdrucksmittel. Studia Germanistica 6, 129-137. Selting, Margret/ Auer, Peter/ Barth-Weingarten, Dagmar/ Bergmann, Jörg/ Birkner, Karin/ Couper-Kuhlen, Elizabeth et al. (2009). Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). Gesprächsforschung 10, 353-410. Stern, Clara/ Stern, William (1907). Die Kindersprache: eine psychologische und sprach‐ theoretische Untersuchung. Leipzig: Johann Ambrosius Barth. Strehle, Herrmann (1956). Vom Geheimnis der Sprache. Sprachliche Ausdruckslehre - Sprachpsychologie. München/ Basel: Ernst Reinhardt. Dynamische Entfaltung multimodaler Bedeutung einer onomatopoetischen Interjektion 193 <?page no="194"?> von Velics, Anton (1909). Onomatopöie und Algebra. Eine Etymologische und Sprach‐ philosophische Studie. Budapest: Buchdruckerei Kol. Rózsa u. Frau. Wissemann, Heinz (1954). Untersuchungen zur Onomatopoiie. 1. Teil: Sprachwissen‐ schaftliche Versuche. Heidelberg: Universitätsverlag Carl Winter. 194 Clara Kindler-Mathôt <?page no="195"?> Multimodal Ritual Chains Medialitätstheoretische Beobachtungen zur Multimodalität der Fußballfankommunikation Simon Meier-Vieracker & Stefan Hauser Abstract: This paper deals with multimodal practices of football fans in stadiums as well as in digital spaces from a mediality-theoretic perspective. With reference to sociological concepts from audience studies as well as the sociology of rituals, we ask in which medial forms these practices occur, which semiotic resources they draw on and which function(s) different forms of performance have for the constitution of fan cultures. Based on pictures and videos from different stadiums, we argue that the materiality of bodily as well as spatially and temporally structured communication is constitutive for the fans’ collective and ritualized forms of communication and thus ensures their groupand identity-forming functions. Moreover, we analyze the fans’ digital follow-up communication which documents and disseminates the stadium events and metapragmatically reflects the fan practices. We show how under the changed medial conditions of digital communication, multimodal fan practices meet broader and more heterogeneous audiences and create occasions both for emotional involvement and for critique. Keywords: multimodality, football fans, ritual, performativity, digital com‐ munication 1 Einleitung In jüngerer Zeit macht sich auch im deutschsprachigen Raum in der medien- und kulturanalytisch orientierten Linguistik ein zunehmendes Interesse an Fans, Fanpraktiken und Fankulturen bemerkbar (siehe z. B. Klemm 2012; Michel 2018; <?page no="196"?> 1 Als Ultras bezeichnet man einen bestimmten Typus organisierter Fußballfans, der sich durch besonders bedingungslosen Support ihres Vereins und sowie eine erlebnisinten‐ sive Inszenierung des Fantums auszeichnet. Die ursprünglich aus Italien stammende Ultra-Bewegung hat sich in den 1990er Jahren auch im deutschsprachigen Raum etabliert und prägt seitdem das Erscheinungsbild der Fankurven (Winands 2015; Duttler/ Haigis 2016). Frick 2019; Hauser 2019; Meier 2019; Meer/ Staubach 2020; Meier-Vieracker 2021; Hauser/ Meier-Vieracker 2022). Mit Blick auf unterschiedliche Fancommu‐ nities wird dabei vermehrt dem Umstand Rechnung getragen, dass Fantum an vielfältige individuelle und kollektive Erlebnis- und Inszenierungsformen in un‐ terschiedlichen medialen Ausprägungen gebunden ist. An diese Beobachtungen anknüpfend wollen wir in diesem Beitrag aus einer pragmatisch-funktionalen Perspektive die multimodalen Fanpraktiken in Fußballstadien und ihre Fortset‐ zung im digitalen Raum betrachten. Wir gehen von der Beobachtung aus, dass Fußballstadien weit mehr als nur Orte sind, an denen vor Publikum Fußball gespielt wird. Vielmehr sind Fußball‐ stadien auch semiotische Räume (Burkhardt 2009: 176), die sich in besonderem Maße durch das multimodale Zeichenhandeln des anwesenden Publikums konstituieren. Von Sprechchören und Fangesängen über Spruchbänder und Zaunfahnen bis hin zu groß angelegten Fanchoreografien (Hauser 2019) reichen die semiotischen Ressourcen, mit denen in oftmals kollektiv koordinierter Weise das kommunikative Geschehen im Stadion hervorgebracht wird. Insbe‐ sondere die Ultras, die mit ihren spektakulären Inszenierungsformen seit den 1990er Jahren die Fankurven dominieren, prägen die Kulisse auf den Rängen und konstituieren das soziale Ereignis „Fußballspiel“ maßgeblich mit (Schwier/ Schauerte 2009: 429 f.; Duttler 2014). 1 Dabei tritt Fantum typischerweise im Verbund mit einer äußerlich manifesten emotionalen Involviertheit auf. Dies wirft die Frage auf, in welchen medialen Ausprägungen diese emotional aufge‐ ladenen Inszenierungspraktiken auftreten, auf welche semiotischen Ressourcen sie zurückgreifen und welche Funktion(en) unterschiedliche Performanzau‐ sprägungen für die Konstitution von Fankulturen haben. Da die analogen Fanpraktiken in den Stadien auch vielfach in digitalen Medien dokumentiert und reflektiert werden und diese Form der Begleit- und Anschlusskommunikation für die Fußballfankultur inzwischen eine wichtige Rolle spielt, müssen hierbei auch digitale Fandiskurse in ihrer engen Verzahnung mit dem Stadiongeschehen berücksichtigt werden. Zur Analyse der Fanpraktiken, verstanden als routinisierte, materiell und leiblich gebundene sowie an praktisches Handlungswissen geknüpfte Hand‐ lungsmuster (Reckwitz 2003; Deppermann et al. 2016) und ihrer Medialität 196 Simon Meier-Vieracker & Stefan Hauser <?page no="197"?> knüpfen wir neben publikumssoziologischen Theorien an ritual- und emotions‐ soziologische Überlegungen von Collins (2004) an, der kulturellen Symbolen eine entscheidende Rolle in gruppenidentitätsstiftenden Ritualen zuweist. Al‐ lerdings bleibt Collins Symbolbegriff an vielen Stellen vage. Wie wir anhand von konkreten Beispielen zeigen wollen, kann eine detaillierte multimodale Analyse von Fanpraktiken als hochgradig performativen Publikumspraktiken den Symbolbegriff von Collins in semiotischer und medialitätstheoretischer Hinsicht präzisieren. Außerdem wollen wir anhand von digitaler Anschluss‐ kommunikation zeigen, wie die Fanpraktiken gerade in ihren multimodalen Aspekten im Digitalen sowohl fortgeführt als auch reflektiert werden. Wir werden im Folgenden zunächst für unsere Fragestellung relevante theoretische Bezugspunkte vor allem aus der Soziologie umreißen und an medialitätstheoretische Fragen anschließen. Danach werden wir uns der kol‐ lektiv koordinierten Fankommunikation im Fußballstadion zuwenden und dabei die verschiedenen materialen, räumlichen und zeitlichen Bedingungen dieser Performanzen diskutieren. Anschließend werden wir zeigen, dass und wie das analoge Geschehen in den Stadien im digitalen Raum dokumentiert und fortgeschrieben wird. 2 Theoretische Bezugspunkte Für die theoretische Verortung unserer empirischen Beobachtungen möchten wir einerseits auf einen Ausschnitt aus der soziologischen Publikumsforschung Bezug nehmen, wobei für das vorliegende Erkenntnisinteresse insbesondere die Beschäftigung mit vor Ort anwesenden Großpublika bedeutsam ist. An‐ dererseits greifen wir mit Collins’ Konzept der Interactional Ritual Chains (2004) einen ritualtheoretischer Zugang auf, der für die Beschreibung und für das Verständnis der Multimodalität von Fankommunikation im Fußballstadion hilfreich ist, aber bislang in der deutschsprachigen Medien- und Kulturlinguistik kaum zur Kenntnis genommen wurde. 2.1 Präsenzpublika Wie Knoblauch (2016) ausführt, ist das „Publikum“ zwar durchaus Gegen‐ stand unterschiedlicher disziplinärer Forschung, aber der Überblick über die Publikumsforschung zeigt, „wie wenig bislang die realzeitliche Performanz von Präsenzpublika beachtet wurde, sofern es sich um Großpublika handelt“ Multimodal Ritual Chains 197 <?page no="198"?> 2 Der Begriff „Publikumsforschung“ umfasst vielfältige Erkenntnisinteressen und He‐ rangehensweisen, auf die hier nicht näher eingegangen wird (siehe u. a. Aberc‐ rombie/ Longhurst 1998). Einzelne Bereiche der Publikumsforschung sind denn auch gar nicht einem wissenschaftlichen Erkenntnisinteresse verpflichtet, sondern sind primär sozialstatistisch orientiert und dienen als Grundlage für die Erreichung ökonomischer Ziele (Glogner-Pilz/ Föhl 2016). (Knoblauch 2016: 550). 2 Auch im vorliegenden Fall gilt das Interesse einem Großpublikum, das live und vor Ort am sozialen Ereignis Fußballspiel teilnimmt. Dabei ist entscheidend, dass es sich um ein Großpublikum handelt, das aus mehreren Tausend Partizipierenden besteht. Des Weiteren ist wichtig, dass das körperlich kopräsente Publikum weniger in der Rolle der primär rezip‐ ierenden Masse von Interesse ist, sondern als kollektiv agierender Akteur, dessen realzeitliche Performanz einen erheblichen Anteil am Gesamtereignis des Fußballspiels hat: „Die Stadionbesucher, und insbesondere die ‚organisierten Fans‘ unter ihnen, sind dabei keineswegs nur ‚Zuschauer‘, sie sind Akteure, die das (kommunikative) Geschehen im Stadion bzw. die ‚soziale Veranstaltung‘ […] des Fußballspiels maßgeblich mitbestimmen“ (Spitzmüller 2013: 251). Hierbei spielen vielfältige semiotische Ressourcen und Formen - Pyrotechnik, Fahnen, Schals usw. - eine wichtige Rolle, die gerade in der kollektiven Performanz als Ausdrucksformen von Support und Identifikation mit dem eigenen Verein dienen. In der soziologischen und auch der linguistischen Forschung stoßen die vielfältigen Formen der Publikumsbeteiligung, wie sie in Fußballstadien und darüber hinaus beobachtbar sind, auf großes Interesse. Während - vor allem in der Linguistik - die Aufmerksamkeit zunächst den Fangesängen (Kopiez/ Brink 1999; Brunner 2009) und vereinzelt auch Fanbannern galt (Siebetcheu 2016), wird mittlerweile die gesamte Bandbreite der multimodalen Fanpraktiken zum Gegenstand von Studien gemacht, die sich für die performativen Aspekte von Großpublika in Sportstadien interessieren (Winands 2015; Hauser 2019; Thonhauser/ Wetzels 2019). Das Interesse richtet sich also auf das im Stadion anwesende Präsenzpublikum, das „sich leibhaftig an dem Ereignis beteiligt, das es durch die eigene Präsenz mit prägt“ (Knoblauch 2016: 552). Mit diesem Fokus auf die performative Dimension von Fanpraktiken geht einher, dass nicht nur das semiotische Formeninventar allein interessiert. Vielmehr rücken auch ihre situativen Einbettungen und sequentiellen Ordnungen (Thonhauser/ Wetzels 2019) in den Blick, die sich zu regelrechten Ritualen verfestigen können und als solche gruppenidentitätsstiftende Funktionen erfüllen (Schwier 2005; Winands 2015: 153-194). 198 Simon Meier-Vieracker & Stefan Hauser <?page no="199"?> 2.2 Interaktionsrituale und Efferveszenz Ein ritualtheoretisches Rahmenkonzept, das sich für die Beschreibung solcher ritueller Kollektivhandlungen eignet, ist Randall Collins’ (2004) an Émile Durk‐ heim und Erving Goffman angelehnte, aber emotionssoziologisch erweiterte Theorie der Interaktionsrituale. Nach Collins (2004: 48 f.) kommen Interaktions‐ rituale unter den folgenden Bedingungen zustande (siehe auch Greve 2013: 64): Menschen versammeln sich an einem gemeinsamen Ort, so dass sie sich durch ihre Kopräsenz wechselseitig beeinflussen. Dieses Kollektiv grenzt sich nach außen so ab, dass die Teilnehmenden ein Bewusstsein entwickeln, wer dazugehört und wer nicht. Weiterhin entwickeln die Teilnehmenden einen geteilten Aufmerksamkeitsfokus auf ein bestimmtes Objekt oder eine bestimmte Aktivität und werden sich auch dieses geteilten Fokus wechselseitig gewahr. Schließlich finden sich die Teilnehmenden in einer gemeinsamen Stimmung oder emotionalen Erfahrung. Indem sich diese letzten beiden Bedingungen, die des geteilten Aufmerksamkeitsfokus und der geteilten Stimmung wechselseitig verstärken, gerät das Kollektiv in einen Status der von Durkheim (2005: 297) so genannten kollektiven Efferveszenz, ein Zustand kollektiver emotionaler und bisweilen gar ekstatischer Erregung (siehe hierzu auch Yilmaz 2018). Derartige Interaktionsrituale haben nach Collins (2004: 49) dann die fol‐ genden „outcomes“: Es entstehen Gruppensolidarität und ein Gefühl der Zu‐ gehörigkeit sowie auf individueller Ebene gesteigerte emotionale Energie. Weiterhin entstehen auf diesem Wege Symbole, welche die Gruppe verkörpern, die von der Gruppe verehrt und gegen Angriffe von außen verteidigt werden. Schließlich können moralische Standards herausgebildet werden, deren Einhal‐ tung die Zugehörigkeit zur Gruppe reguliert. Collins selbst veranschaulicht seine Theorie am Beispiel von jubelnden Sportfans, die auch Leistner und Schmidt-Lux (2012) als Beispiel für kollektive Efferveszenz beschreiben. Tatsächlich lässt sich Collins’ Modell sehr gut auf Publikumsaktivitäten in Fußballstadien und hier besonders die Praktiken der Fans in den Kurven übertragen. Die sich im Fanblock versammelnden Fans treten als Gruppe auf, sie markieren ihr Territorium z. B. durch Zaunfahnen und teilen einen gemeinsamen Aufmerksamkeitsfokus auf das Spiel, aber auch auf sich selbst. Denn durch ihr sicht- und hörbares Kollektivhandeln erleben sie auch sich selbst als Kollektiv (Kolesch/ Knoblauch 2019: 259) und geraten so in eine gemeinsame emotionale Stimmung. Dies passt ebenso zu Collins’ Modell wie die in soziologischen Studien zu Fanszenen oft beschriebene Gruppensolidarität und die damit einhergehenden, oft in Vorstellungen von ‚Ehre‘ kondensierten Verhaltensstandards, nicht zuletzt in der gemeinsamen Verehrung der die Gruppe repräsentierenden Symbole (Claus/ Gabler 2017). Multimodal Ritual Chains 199 <?page no="200"?> Darüber hinaus betont Collins in direkter Fortführung von Goffman die Situ‐ ationalität von solchen Ritualen. Sie sind nicht nur räumlich, sondern auch zeitlich situiert, vollziehen sich in der Zeit und in bestimmten zeitlichen Ordnungen, und sie können sich, wenn auch mit Variationen, wiederholen und erhalten erst dadurch ihren Status als wiedererkennbare und tradierbare Rituale (Krieger/ Belliger 1998: 25 f.). Auch das ist an die charakteristischen zeitlichen Sequenzierungen und die Regelmäßigkeit von Fußballspielen und den sie begleitenden Fanpraktiken anschlussfähig (Bromberger 1998: 297). So finden Fanchoreografien typischerweise bei Heimspielen vor dem Anpfiff statt und gehören somit, auch wenn die einzelnen Choreografien jeweils Unikate sind, zu den erwartbaren Ritualen des Fansupports. Collins selbst erweitert seine Theorie der Interaktionsrituale sogar zu einer Theorie der Interaction Ritual Chains, die Sozialität darin begründet sieht, dass sich die einzelnen Instanziierungen von Ritualen über mehrere Situationen hinweg und mithin über die Zeit ‚verketten‘ und dadurch etwa soziale Arenen oder Institutionen konstituieren. Auch dies ist auf Fanpraktiken anwendbar, da sie institutionalisierte Form annehmen und tradiert werden können. Insbe‐ sondere an den organisierten Fans, die sich zu Gruppierungen mit internen Rollenstrukturen und definierten Beziehungen zu anderen Gruppierungen und des Vereins zusammenfinden, lässt sich dies sehen. Wir legen im Folgenden dennoch den primären Fokus auf einzelne Situationen, wobei zu bedenken ist, dass die in ihnen vollzogenen Handlungen - wir werden mit Winands (2015: 64) von Ensemble-Aufführungen sprechen - wegen des Planungs- und Koordi‐ nierungsaufwandes gewisse Institutionalisierungen voraussetzen und weiter verfestigen. Zudem möchten wir den Begriff der Ritual Chains dahingehend erweitern, dass wir sequentielle Verkettungen bis hin zu Anschlusskommuni‐ kationen im digitalen Diskurs in den Blick nehmen. Auch aus linguistisch-medialitätstheoretischer Perspektive halten wir Col‐ lins’ Theorie für ergänzungsbedürftig, insbesondere mit Blick auf den Begriff des Symbols, der bei Collins ausgesprochen vage bleibt. Im Wesentlichen orientiert sich Collins am Symbolbegriff des symbolischen Interaktionismus in Anknüpfung an Mead (1973) und hebt ab auf die situationsübergreifende Bedeutung signifikanter Symbole (Mead 1973: 111), welche die Gruppensoli‐ darität und die emotionale Gestimmtheit eines Kollektivs gewissermaßen in sich aufnehmen und wieder abrufbar machen (Collins 2004: 81). Prinzipiell kommt für Collins alles als Symbol in Betracht: bedeutende Personen, bestimmte sprachliche Formen etwa der Anrede, aber auch sehr konkrete Gegenstände, die als Embleme ein verehrtes Objekt repräsentieren. Dabei werden jedoch weder die spezifische Kodiertheit noch die materielle Medialität (Stöckl 2016: 7) 200 Simon Meier-Vieracker & Stefan Hauser <?page no="201"?> dieser Zeichen bzw. zeichenhaft gebrauchten Objekte differenziert betrachtet. In einer Fallstudie zu Symbolen im Kontext der Erinnerung an 9/ 11 präsentiert Collins (2004: 88-95) etwa berühmte Fotografien, versteht dabei aber die darauf abgebildeten Personen als Symbole und nicht die Fotografien selbst mit ihren materiell-medialen Eigenschaften und ihrer visuellen Modalität. Außerdem sind Symbole in Collins’ Modell lediglich auf der Seite der outcomes von Interaktions‐ ritualen zu finden. Dass und wie schon das Ritualhandeln selbst Zeichenhandeln ist und welche semiotischen Ressourcen etwa für die Abgrenzungshandlungen des Kollektivs zum Einsatz kommen, wird bei Collins zwar angedeutet, aber keiner detaillierten Analyse unterzogen. Hier, so möchten wir im Folgenden zeigen, kann eine linguistische und multimodalitätsorientierte Analyse von Fanpraktiken, welche gerade ihre Medialität in den Blick nimmt, präzisierend ansetzen. Unter Medialität verstehen wir dabei in Anschluss an einen prozessorien‐ tierten Medienbegriff (siehe dazu Schneider 2008, 2017; Jäger 2015; Linz 2016) die Gesamtheit des strukturellen und materiellen Bedingungsgefüges, die für die Zeichenprozessierung relevant ist: „Der Begriff der Medialität adressiert […] die performativen Verfahren, in denen Materialität und Sinn in der Kommuni‐ kation prozessiert werden“ (Linz 2016: 104). Im Rahmen unserer empirischen Beobachtungen wollen wir deshalb einerseits der Materialität körperbezogener Performanzen des Publikums gesonderte Beachtung schenken. Andererseits soll der Blick auf verschiedene Aspekte der räumlichen und zeitlichen Anord‐ nung von kollektiv koordinierter Fankommunikation gerichtet werden. Über die Dissemination und Kommentierung des Stadiongeschehens im digitalen Raum mit nochmals anderen medialen Bedingungen kommt es schließlich zu einer Kopplung analoger und digitaler Formen der Zuschauerbeteiligung (zur Anschlusskommunikation in sozialen Medien siehe auch Androutsopoulos 2016; Michel 2018). Unsere empirischen Ausführungen haben exemplarischen Charakter, d. h. wir präsentieren und analysieren einzelne Fälle, die sich zur Veranschauli‐ chung unseres theoretisch-methodologischen Zugriffs gut eignen. Wir erheben also keinen Anspruch auf Repräsentativität und haben keine systematische, etwa einen bestimmten Zeitraum umfassend abdeckende Datenerhebung vor‐ genommen. Aus unserem langjährigen Interesse an der Fankommunikation und Fankultur im Fußball können wir den hier präsentierten Fällen jedoch eine gewisse Prototypik zuschreiben. Multimodal Ritual Chains 201 <?page no="202"?> 3 Kollektiv koordinierte Kommunikation im Fußballstadion Für die realzeitliche Performanz von Fanpraktiken, die sich in koordinierten Formen von Kollektivhandeln vor Ort äußern, ist charakteristisch, dass es sich um analoge Verfahren der Publikumsbeteiligung handelt. Wie diese En‐ semble-Aufführungen semiotische Ressourcen kombinieren und sich dabei die räumlichen Affordanzen des Stadions und die Anwesenheit großer Publika zunutze machen, lässt sich am Beispiel einer Konfetti-Choreografie illustrieren, die anlässlich eines Champions-League-Spiels des BVB (Borussia Dortmund) gegen den FC Barcelona (am 17.9.2019) von BVB-Fans gezeigt wurde. Der kollektiv erzeugte, aber nur kurz sichtbare Effekt entstand dadurch, dass beim Einlaufen der Mannschaften, der Phase also, die typischerweise für die kollektive Performanz identitätsstiftender Praktiken wie etwa das Singen der Vereinshymne genutzt wird, auf der Südtribüne Dortmund auf Kommando gelbes und schwarzes Konfetti in die Höhe geworfen wurde, so dass sich für einen kurzen Moment ein BVB-Wappen ergab. Abb. 1: Konfetti-Choreografie des BVB. Bildquelle: https: / / www.youtube.com/ watch? v= k-NCH6RsEuM (Videostill) Durch eine räumlich genau arrangierte Anordnung der verschiedenfarbigen Konfetti und durch eine koordinierte Handlung der Beteiligten wird ein Kol‐ lektivzeichen zur Darstellung gebracht, das im Sinne von Collins als Gruppen‐ symbol fungiert. Es ist die Gebautheit des Raums, insbesondere die schräg ange‐ 202 Simon Meier-Vieracker & Stefan Hauser <?page no="203"?> 3 Zum Zusammenhang von Architektur, Raum und Gemeinschaft am Beispiel von Fußballstadien siehe Rohlwing (2015). 4 Siehe dazu auch Thonhauser und Wetzels (2019: 234): „Sharing a focus and being actively bound to the event and to each other, audiences are also defined by specific forms of spatiality and temporality. Through this feature, audiences can be identified as being located in certain forms of architecture and specific time settings.“ ordneten Ränge, die es ermöglicht, dass die aus den kollektiven Teilhandlungen - das synchronisierte Hochwerfen von Konfetti - resultierenden Grapheme überhaupt von anderen Anwesenden im Stadion wahrgenommen werden können. Bei dieser Choreo haben wir es also einerseits mit der koordinierten realzeitlichen Performanz (von Teilen) des Stadionpublikums zu tun, die im Übrigen ein hohes Maß an dramaturgischer Disziplin erfordert (Hauser 2019: 122), und andererseits mit der Nutzung bestimmter räumlicher Gegebenheiten. Bei einer medialitätsorientierten Analyse von Fanchoreografien, die besonders mit visuellen Mitteln arbeiten, gilt es also, auch den räumlichen Gegebenheiten als einer Dimension von Medialität Rechnung zu tragen. Es geht hier also um einen physischen Raum, der jedoch durch die besonderen performativen Nutzungen durch die aktiven Fans und die anderen Zuschauenden als semio‐ tische Ressource genutzt wird und der sich mithin in seiner soziokulturellen Bedeutung erst durch entsprechendes Zeichenhandeln konstituiert (Löw 2008). 3 Auf den besonders durch die Ultras initiierten Veränderungsprozess bei den Stilmitteln und auf die Bedeutung des Stadionraums weist auch Winands hin: „Stilmittel von Fußballfans sind also spezifische kulturelle Insignien oder Symboliken, die innerhalb des besonderen Raumes des Stadions Anwendung finden“ (Winands 2015: 90). 4 Erst im und durch den Raum des Stadions erhalten diese Insignien ihre Bedeutung und Funktion als Ausdrucksform von Support und Identifikation, so wie sich umgekehrt die Fans durch diese Insignien das Stadion als ‚ihren‘ Raum aneignen. Für das Zustandekommen des oben abgebildeten Kollektivzeichens ist über die räumlichen Verhältnisse hinaus auch eine genaue zeitliche Koordination der Handlungen von mehreren tausend Beteiligten erforderlich: Koordination bedeutet, dass die Handlungen Einzelner und ihre körperlichen Voll‐ züge aufeinander abgestimmt werden. Bestehen Präsenzpublika schon aus im Raum versammelten Körpern, so sind ihre Formen durch die Koordination dieser Körper erzeugt. (Knoblauch 2016: 558) Somit werden die Zeitlichkeit und auch Flüchtigkeit der Performanz des Kol‐ lektivzeichens - entgegen der für Schriftzeichen typischen Persistenz - als semiotische Ressource genutzt. Multimodal Ritual Chains 203 <?page no="204"?> 5 https: / / www.youtube.com/ watch? v=eComNTj85U Auch beim folgenden Beispiel einer auf YouTube als Video dokumentierten Fanchoreografie von Fans des HSV 5 gilt das Interesse den räumlichen Verhält‐ nissen des Stadions und ihrer Nutzung einerseits und einer zeitlichen Sequenzie‐ rung andererseits. Zwar spielt für das Zustandekommen dieser Choreografie die genaue Synchronisierung aller anwesenden Fans eine weniger entscheidende Rolle als bei der Konfetti-Choreografie, doch ist auch hier entscheidend, wie sie sich in der Zeit entfaltet. Abb. 2: HSV-Choreografie Teil 1 Es handelt sich um eine rund fünfminütige Fanchoreografie der HSV-Fans am ersten Spieltag nach dem Abstieg des HSV in die zweite Bundesliga. Das Video, aus dem wir hier Screenshots präsentieren, zeigt die Nordtribüne des Hamburger Volksparkstadions, den angestammten Platz der organisierten Fans. Es wurde also von der gegenüberliegenden Seite aus aufgenommen, aber auch von den Geraden aus ließ sich die Choreografie gut wahrnehmen. Zuerst wird ein blaues Transparent von links nach rechts gezogen (siehe Abb. 2, obere Bildhälfte), auf dem zu lesen ist: „Dies ist die Geschichte eines Vereins, der fällt“. Dazu wird Musik gespielt und die Zuschauer singen mit. Teile des Fansektors werden durch diese sich sequentiell aufbauende Inszenierung zur Bühne, das restliche Stadion wird zum Zuschauerraum. 204 Simon Meier-Vieracker & Stefan Hauser <?page no="205"?> 6 Eine ausführliche Kontextualisierung der Choreographie findet sich unter https: / / arch iv.faszination-fankurve.de/ index.php? head=Grosse-Choreo-amp-Pyroshow-beim-Nor dduell-zum-Zweitliga-Auftakt&folder=sites&site=news_detail&news_id=18644#: ~: tex t=%E2%80%9EDies%20ist%20die%20Geschichte%20eines,stammt%20aus%20dem%20gle ichen%20Film. Schließlich wird ein zweites Transparent mit verschiedenen Bildern in Form einer Filmrolle quer über die Zuschauerränge gezogen (Abb. 3). Diese Bilder zeigen verschiedene negative Ereignisse aus der jüngeren Geschichte des Vereins, die also - unterstrichen durch die Schwarz-Weiß-Optik - die Vergangenheit zeigen und wie in einem Film noch einmal in Erinnerung gerufen worden. Der Spruch ist ein abgewandeltes Zitat aus dem Film „La Haine“, dessen Protagonisten auf dem Banner rechts mit HSV-Fanutensilien zu sehen sind. 6 Abb. 3: HSV-Choreografie Teil 2 Das Banner wird dann in einem weiteren Schritt auf die unteren Ränge fallen gelassen. Im nächsten Bild (Abb. 4) sieht man das Transparent auf den unteren Rängen. Symbolisiert wird damit der Abstieg in die zweite Bundesliga. Die für das Stadion charakteristische räumliche Anordnung von „oben“ und „unten“ wird also metaphorisch genutzt, um den Abstieg in die zweite Bundesliga darzustellen. Multimodal Ritual Chains 205 <?page no="206"?> Abb. 4: HSV-Choreografie Teil 3 In der Folge wird das Transparent wieder hochgezogen, was den angestrebten Wiederaufstieg darstellen soll. Am Schluss der Choreo befindet sich das Trans‐ parent dann wieder auf den oberen Rängen und wird durch ein weiteres Transparent am Spielfeldrand ergänzt, auf dem es heißt: „… aber wichtig ist nicht der Fall, sondern die Landung - auf geht’s HSV! “ Abb. 5: HSV-Choreografie Teil 4 206 Simon Meier-Vieracker & Stefan Hauser <?page no="207"?> 7 Für solche Choreographien sind typischerweise mehrere Fangruppierungen verant‐ wortlich, die sich für die Vorbereitung und Durchführung zusammenschließen. Derartig materialintensive Aktionen müssen u. a. aus sicherheitstechnischen Gründen auch gegenüber dem Verein im Voraus angezeigt werden. Die konkreten Handlungsanweisen für die Einzelnen, die an der Aufführung aktiv beteiligt sind, werden auf verschiedenen Wegen kommuniziert, von Mailinglisten und Chatgruppen bis hin zu Handzetteln, die an den Eingängen verteilt werden. 8 Der Stadionsprecher wird jeweils vom gastgebenden Verein gestellt. Er gibt sich gerade in der Interaktion mit den eigenen Fans fannah, ist aber nicht Teil der Fangemeinschaft selbst, zumal auch Ordnungsrufe bei unerlaubten Aktionen wie etwa dem Abbrennen von Pyrotechnik durch den Stadionsprecher erfolgen. Innerhalb der Fanblöcke spielen die sogenannten Capos eine wichtige Rolle, die mit dem Rücken zum Spiel und mit Megaphonen ausgestattet z. B. die Sprechchöre und Gesänge der Fans während des Spiels koordinieren. Das Beispiel zeigt, wie die Affordanzen des Stadionraums für multimodale Fanpraktiken im komplexen Zusammenspiel sprachlicher und visueller Zeichen nutzbar gemacht werden - Fanpraktiken, die einer aufwändigen Vorbereitung und fein abgestimmter Koordination vor Ort bedürfen. 7 Wie schon beim Kon‐ fetti-Beispiel der BVB-Fans gilt auch hier, dass das Stadion als „site of engage‐ ment“ (Scollon 1998) den physischen mit dem symbolischen Raum verbindet. Das Stadion mit seinen räumlichen Gegebenheiten und seiner sozialsymboli‐ schen Bedeutung als besonderem Ort der Heimmannschaft und ihren Fans ist also nicht nur Voraussetzung für, sondern auch Bestandteil dieser Fanchoreo‐ grafie. Auch die zeitliche Situierung in der Phase unmittelbar vor Spielbeginn, in welcher das Banner mit der Aufschrift „Auf geht’s HSV“ geradezu als Startsignal und Anfeuerungsruf dient, ist für die Choreografie von Bedeutung. Erst diese räumlich und zeitlich verankerte Medialität, welche für die eingesetzten Zeichen und Darstellungsformen konstitutiv sind (Schneider 2008: 246), sichert den ritualisierten Fanpraktiken ihre identitätsstiftende Funktion. Wenn man verschiedene Ensemble-Aufführungen vergleicht, zeigt sich eine große Bandbreite unterschiedlicher Ausgestaltungen des multimodalen und ritualisierten Kollektivhandelns von Fans in Fußballstadien (z. B. primär akus‐ tische Formen, akustisch-visuelle Kombinationen, rein visuelle Formen, dialo‐ gische und monologische Verfahrensweisen usw.). Um eine dialogische Form der ausschließlich mündlichen Kollektivkommunikation handelt es sich, wenn ein Stadionsprecher vor dem Spiel bei der Vorstellung der Heimmannschaft die Rückennummer und den Vornamen der einlaufenden Spieler nennt und die Fans synchron den Nachnamen des Spielers rufen. Die Zusammengehörig‐ keit unter den Fans ergibt sich hierbei durch einen geteilten Wissensbestand und durch eine kollektiv ausgeführte Sprachhandlung. Es gibt weitere rituali‐ sierte Varianten des Zusammenspiels von Stadionsprecher 8 und Zuschauern: Multimodal Ritual Chains 207 <?page no="208"?> In manchen Stadien geben die Stadionsprecher nach einem (Führungs-)Tor der Heimmannschaft den neuen Spielstand bekannt, nennen dabei aber lediglich die Tore der eigenen Mannschaft, während die Zuschauer gemeinsam die Tore der gegnerischen Mannschaft rufen (und zwar vor allem dann, wenn die eigene Mannschaft mehr Tore erzielt hat und so ihre Überlegenheit lautstark untermalt wird). Eine sequentielle Erweiterung dieser dialogischen Interaktion lässt sich beobachten, wenn sich der Stadionsprecher nach der gemeinsamen Verkündigung des Spielstands mit einem „Danke! “ meldet und die Fans der Heimmannschaft dieses Ritual mit einem kollektiven „Bitte! “ abschließen. Gelegentlich sind auch koordinierte Aktionen beobachtbar, die von den An‐ hängern beider Mannschaften gemeinsam verantwortet werden: So klatschten am 19.4.2022 die Zuschauer des Spiels FC Liverpool vs FC Manchester United für Cristiano Ronaldo, nachdem dessen neugeborener Sohn am Ostermontag verstorben war. Die Liverpool-Fans applaudierten in der siebten Minute der Pre‐ mier-League-Partie gemeinsam mit United-Anhängern für rund 60 Sekunden und sangen die Hymne „You’ll Never Walk Alone“. Damit brachten sie ihre Unterstützung für Ronaldo und dessen Partnerin Georgina Rodriguez nach deren Schicksalsschlag zum Ausdruck. Die koordinierte symbolische Geste, die von den Fans beider Mannschaften in der siebten Minute gezeigt wurde, spielt darauf an, dass Christiano Ronaldo im Verein und in der Nationalmannschaft seit Jahren die Rückennummer 7 trägt. Wie dieses Beispiel zeigt, kombinieren Fanchoreografien häufig mehrere semiotische Ressourcen zu komplexen mul‐ timodalen Kommunikaten. Dazu gehören die Körper der Anwesenden und oft auch ihre räumliche Anordnung und Ausrichtung im Stadion, die Stimmen der Anwesenden sowie zahlreiche nicht-verbale Handlungen, etwa das kollektive Hochhalten von Gegenständen (z. B. Schals mit den Vereinsfarben), Klatschen, Hüpfen, Singen etc. Zum einen können die Körper von Fans als Oberflächen für die Darstellung von Vereinsinsignien oder Nationalemblemen fungieren, was etwa durch Bemalung von Teilen des Körpers möglich ist. Zum anderen ist aber auch verbreitet, dass die Kleidung als Träger von Symbolen fungiert und damit Zugehörigkeit zu einem Verein oder einer Nationalmannschaft zum Ausdruck bringt. 208 Simon Meier-Vieracker & Stefan Hauser <?page no="209"?> Abb. 6: Nationalsymbole auf Körpern und Kleidung. https: / / www.aargauerzeitung.ch / verschiedenes/ bei-den-em-fanartikeln-ist-die-schweiz-nicht-uberall-spitzenreiter-ld.15 64894 und https: / / peru21.pe/ deportes/ brasil-2014-estados-unidos-ghana-calientan-fech a-grupo-g-165155-noticia/ In den obigen beiden Abbildungen bilden die Körper über eine bestimmte Bemalung oder Bekleidung die materiale Grundlage für die Repräsentation von nationalen Symbolen. Aus solchen Beispielen geht hervor, dass gruppenkonsti‐ tuierende Symbole in ritualisierter Kommunikation nicht nur erzeugt werden, wie es Collins vorschlägt, sondern dass auch auf bestehende Zeichenkomplexe zurückgegriffen wird. Für das Zustandekommen von Efferveszenz im Sinne Collins’ spielen also ganz unterschiedliche semiotische Ressourcen und damit einhergehende Fanpraktiken eine entscheidende Rolle. Versteht man Fantum als „Strategie zur Intensivierung des emotionalen Erlebens“ (Roose et al. 2010: 31), gilt es der Gesamtheit der performativen Inszenierungspraktiken der Fans Rech‐ nung zu tragen. Indem sie einerseits auf bestehende Symbole zurückgreifen, andererseits aber auch neue symbolische Fanpraktiken entwickeln, suchen Fans „den Kontakt zu Gleichgesinnten, gehen emotionale Allianzen ein, kreieren affektive Formen der Vergemeinschaftung und schaffen eigene Sozialwelten“ (Winter 2010: 161 f.). In Erweiterung von Collins’ Konzept der Interaction Ritual Chains wollen wir im Folgenden auch die Verkettung der analogen Fanpraktiken in den Stadien mit der digitalen Anschlusskommunikation im Digitalen berücksichtigen. 4 Vom Stadion in den digitalen Raum Bei Fanchoreografien ist typischerweise von einer spezifischen Form der Mehr‐ fachadressierung auszugehen, die wir uns auch für die Datenerhebung zunutze machen: Zum einen richtet sich choreografierte Fankommunikation an die im Stadion Anwesenden, zum anderen aber in der Regel auch an ein disperses Multimodal Ritual Chains 209 <?page no="210"?> 9 Zur Fan-spezifischen Anschlusskommunikation in sozialen Medien, insbesondere zum breiten Spektrum des kommunikativen Handelns in Fanforen siehe auch Klemm (2012). 10 Interessant ist in diesem Zusammenhang, dass bei der Übertragung der sogenannten Geisterspiele in der Frühphase der COVID19-Pandemie häufig Stadiongeräusche, d. h. also Fangesänge und ähnliches, von Band eingespielt wurden. Einige Vereine platzierten auch Aufstellfiguren aus Pappe auf den Rängen, um diese in der Fernseh‐ übertragung nicht leer aussehen zu lassen. Publikum jenseits des Stadions, was nicht zuletzt an der Anschlusskommunika‐ tion unter den Fans erkennbar wird: „[D]er Ensemble-Wettbewerb endet nach dem Spiel nur vorläufig - er findet seine Fortsetzung in Internetforen und Szenemagazinen, in denen erinnerungswürdige Momente geschildert, Videos hochgeladen und Fotos bereitgestellt werden“ (Winands 2015: 185). 9 Das ritua‐ lisierte Geschehen auf den Rängen bleibt also nicht ausschließlich im Stadion. Schon die üblichen massenmedialen Distributionen von Fußballspielen etwa in Rundfunk oder Fernsehen inkludieren immer auch Fankommunikation, die eben Teil des Spiels ist. Die (Geräusch-)Kulisse, die in den Stadien gerade durch die anwesenden Fans erzeugt wird, wird z. B. durch Kameraschwenks über die Tribünen in die Darstellung der Spiele selbst eingebunden. 10 Nochmals erweitert wird die mediale Distribution der Fankommunikation durch die digitalen Dis‐ kurse der Fans selbst, denn das eigentlich flüchtige Stadiongeschehen wird auf verschiedensten Plattformen im Netz dokumentiert. Zu nennen wäre hier etwa das Portal faszination-fankurve.de, wo nicht nur über Fanaktionen berichtet wird, sondern wo Fans auch ihre Stadionfotos hochladen können (Abb. 7). 210 Simon Meier-Vieracker & Stefan Hauser <?page no="211"?> Abb. 7: https: / / www.faszination-fankurve.de/ Auch auf Instagram und TikTok finden sich zahlreiche Accounts wie etwa „ultraschön“ oder „ultrasvereint“, die insbesondere die visuell spektakulären Kollektivkommunikationen dokumentieren (Abb. 8 und 9). Multimodal Ritual Chains 211 <?page no="212"?> Abb. 8: Instagram-Account ultra.schoen (https: / / www.instagram.com/ p/ Boj2Upn8th/ ? h l=de) Abb. 9: TikTok-Account ultrasvereint (https: / / www.tiktok.com/ @ultrasvereint) 212 Simon Meier-Vieracker & Stefan Hauser <?page no="213"?> 11 https: / / www.tiktok.com/ @ultrasvereint/ video/ 7087192276924894469 Gerade bei den Ultras, so wird hier deutlich, ist nicht allein das Geschehen auf dem Rasen, wegen dessen sie zuallererst ins Stadion zu gehen scheinen, für sie als Fankollektiv identitätsstiftend. Auch ihre eigenen, auf Sichtbarkeit und Hörbarkeit abzielenden Selbstdarstellungsformen sind hierfür von zentraler Bedeutung (Schwier/ Schauerte 2009: 429) und werden dementsprechend in die fantypischen digitalen Medienformate weitergetragen, wo sie gegen die ursprüngliche Flüchtigkeit des Stadiongeschehens dauerhaft verfügbar gehalten werden. Der digitale Fandiskurs bezieht sich also einerseits auf die Multi‐ modalität der Fankommunkation, indem etwa die Schriftbildlichkeit auf den Fanbannern oder die kollektiv koordinierten, sichtbaren Zeichenhandlungen dokumentiert und diskutiert werden. Andererseits ist der digitale Fandiskurs selbst multimodal und nutzt vielfältige semiotische Ressourcen. Die bildlichen oder videografischen Darstellungen des Stadiongeschehens, häufig effektvoll durch dramatisierende Schnitte, durch Musikuntermalungen oder Schrifteinb‐ lendungen in Szene gesetzt, fungieren selbst als Zeichen mit emotionalisie‐ rendem und identitätsstiftenden Potenzial. Vergleichbar mit der Grafitti-Szene, die ihren Aktionsraum in das Internet hinein ausdehnt (Tophinke 2016: 412), erweitert sich auch der Aktionsraum der Fans von den Stadien in den digitalen Raum, wo indes den medialen Affordanzen der Plattformen entsprechend andere Beteiligungsformate und Wahrnehmungsbedingungen herrschen. Aktive Beteiligung am gemeinsamen Kollektivhandeln wie in den Stadien ist nicht möglich und auch die Selbst‐ wahrnehmung der Fans als Kollektiv nicht mit der von kopräsenten Fans vergleichbar. Dennoch wird auch der digitale Diskurs von den Fans als integraler Teil der Fankommunikation aufgefasst. Die genannten Plattformen dienen nicht der bloßen Dokumentation und Archivierung, sondern haben darüber hinaus vielfältige Funktionen, die für die Fans und ihr Zusammengehörigkeitsgefühl bedeutsam sind. Vor allem aus den Kommentaren zu den Bildern und Videos geht hervor, dass die Ereignisse im digitalen Raum kommunikativ weiterver‐ arbeitet werden und der Identitätsbildung dienen. „Meine Stadt mein Verein nur die SGE 🥰🥰 “, so kommentiert ein User ein TikTok-Video der Frankfurter Fankurve beim Auswärtsspiel gegen den FC Barcelona. 11 Selbst Fans anderer Vereine bringen ihre Anerkennung zum Ausdruck für eine Performance, die „[a]uch als nicht Frankfurt Fan absolute Gänsehaut“ verursache und alle „Fans des deutschen Fußballs stolz“ mache. Über die Dokumentation im Netz und die gerade auf TikTok, wo Videos in Loops abgespielt werden, mögliche Wiederhol‐ barkeit, können auch Fans, die womöglich selbst nicht anwesend waren, an der Multimodal Ritual Chains 213 <?page no="214"?> kollektiven Efferveszenz partizipieren. Die sich dabei einstellenden Emotionen dürften von anderer Qualität sein als die der vor Ort Anwesenden. Dennoch scheint der Wunsch nach Affizierung ein wichtiges Motiv für die Rezeption solcher Videos zu sein, die typischerweise in den Kurven mit Handykameras aufgenommen werden und somit einen besonders direkten visuellen und audi‐ tiven Eindruck des Geschehens vermitteln. In den Kommentaren des YouTube-Videos der oben diskutierten Choreografie der HSV-Fans finden sich ähnliche Emotionsausdrücke („Gänsehaut“) und Respektbekundungen („Gute fans hat hsv ja das muss man lassen“). Darüber hinaus finden sich aber auch Kommentare von Fans, die offenbar an der Performance selbst beteiligt waren und sie nun rückblickend kommentieren. Ein User berichtet von der „Angst, dass wir uns im Fernsehen blamiert haben“, da einige Fans offenbar Schwierigkeiten hatten, die Transparente wie geplant zu halten. Hieran wird deutlich, dass sich die Fans nicht nur am Geschehen im Stadion, sondern ebenso an der medialen Repräsentation ihrer Aktivitäten in den journalistischen und sozialen Medien ausrichten. Tatsächlich ist das Stadiongeschehen längst auf vielfache Weise mit digitaler Begleit- und Anschlusskommunikation verwoben. Zeigen lässt sich das etwa an den Fanprotesten gegen den Hoffenheim-Mäzen Dietmar Hopp von 2020 (siehe hierzu ausführlich Meier-Vieracker 2021; 2024). Der Unternehmer Hopp, der mit seinem finanziellen Engagement vielen Fans als Inbegriff der vielkri‐ tisierten Kommerzialisierung des Fußballs gilt, wird seit vielen Jahren mit Schmähgesängen und -plakaten beschimpft, wogegen er verschiedentlich juris‐ tisch vorgegangen ist. Besonders die Fanszene des selbsterklärten Traditions‐ vereins Borussia Dortmund hat sich lange gerichtliche und außergerichtliche Auseinandersetzungen mit Hopp geliefert. Der Konflikt erreichte schließlich im Februar 2020 einen Höhepunkt, nachdem der Deutsche Fußballbund gegen Dortmund-Fans wegen wiederholter Präsentation von Schmähplakaten, insbe‐ sondere mit dem Schimpfwort „Hurensohn“ sowie dem Konterfei Hopps in einem Fadenkreuz, ein dreijähriges Stadionverbot für Auswärtsspiele in Hof‐ fenheim verhängt hatte. Dies fassten Fangruppierungen in ganz Deutschland als Wortbruch des DFB auf, da dieser eigentlich angekündigt hatte, keine derartigen Kollektivstrafen mehr auszusprechen. Zum Zeichen des Protests, sowohl gegen den DFB als auch gegen Hopp, der mit seinen Klagen überhaupt erst Anlass zu diesen Strafen gegeben hatte, präsentierten Fangruppierungen in mehreren Stadien erneut eben jene Hurensohn- und Fadenkreuzplakate, die Gegenstand der in den Protesten kritisierten juristischen Schritte waren. Relevant für die hier diskutierten Verflechtungen zwischen dem analogen Stadiongeschehen und den digitalen Anschlusskommunikationen ist nun, dass 214 Simon Meier-Vieracker & Stefan Hauser <?page no="215"?> 12 https: / / www.hh04.de/ 2020/ 03/ freie-meinung-im-fadenkreuz/ die Protestaktionen selbst durch erläuternde Stellungnahmen im Netz flankiert wurden. Die für die Proteste bei Union Berlin verantwortliche Ultra-Gruppe Hammer Hearts hatte sogar einen entsprechenden Rezeptionshinweis in Form der Webadresse des eigenen Blogs („MEHR AUF HH04.DE“) bereits in das Banner integriert (Abb. 10): Abb. 10: Fanproteste gegen Dietmar Hopp (https: / / www.youtube.com/ watch? v=SqtFuw RPX0c&t=165s9) Auf diesem Blog war am Tag der Proteste ein Beitrag erschienen, der das gezeigte Fadenkreuzmotiv als Reaktion darauf rahmte, dass durch die juristi‐ schen Schritte gegen Fans nunmehr die „[f]reie Meinung im Fadenkreuz“ stehe und deshalb offensiv gegen Zensur der Fankultur verteidigt werden müsse. 12 Das Wissen, dass schon die Rezipierenden der Plakate im Stadion über ihre Mobilgeräte Zugang zu dieser Stellungnahme haben würden und dass Bilder der Aktion ihren Weg ins Netz finden und Teil des multimodalen digitalen Fandiskurses werden würden, floss also mit in die Gestaltung des Banners ein. Nun lässt sich gerade bei diesen Fanaktionen einschließlich ihrer digitalen Begleitkommunikation auch detailliert die erweiterte digitale Anschlusskom‐ Multimodal Ritual Chains 215 <?page no="216"?> 13 https: / / www.schwatzgelb.de/ artikel/ 2018/ unsa-senf/ das-kreuz-mit-dem-fadenkreuz 14 https: / / archiv.faszination-fankurve.de/ index.php? head=Kommentar-zu-beleidigenden -Plakaten-amp-eskalierter-Debatte&folder=sites&site=newsdetail&newsid=21509 15 https: / / www.textilvergehen.de/ 2020/ 03/ 02/ proteste-gegen-kollektivstrafen-und-unter schiedliche-meinungen-wir-lassen-uns-nicht-spalten/ 16 https: / / twitter.com/ DarthToKo/ status/ 1231287769764421632 munikation nachzeichnen, etwa auf Twitter oder in Kommentarbereichen von Fanzines. Dabei zeigt sich, dass das gezeigte Fadenkreuzmotiv sehr kontrovers diskutiert wird und dabei sein semiotischer Status zur Debatte steht. Während die Vereine und der DFB das Motiv als Gewalt- oder gar Mordaufruf deuteten und dementsprechend zu sanktionieren versuchten, verwiesen die verantwort‐ lichen Fans darauf, dass das Fadenkreuz ein „Selbstzitat aus der Fanszene heraus“ 13 ist - schließlich ist das Motiv von Dietmar Hopp im Fadenkreuz seit vielen Jahren in Gebrauch und steht gewissermaßen symbolisch für den Kampf der Fans gegen Zensur. Es ist - wenn auch nur für die Eingeweihten - ein Gruppensymbol der organisierten Fans. Es ist ein „Symbol des Widerstandes im Kampf gegen Auswüchse des modernen Fußballs“, wie es in einem Kommentar auf faszination-fankurve.de 14 heißt, das dementsprechend verteidigt wird. Al‐ lerdings bricht diese Selbstreferentialität in den erweiterten Öffentlichkeiten des Web 2.0 häufig auf, da viele User: innen nicht über das entsprechende Wissen um den Zitatcharakter verfügen, die referentielle Lesart einbringen und das Motiv eben doch als Aufruf zur Gewalt deuten. Gerade wenn es „als Bildmotiv genutzt wird“, so heißt es in einem Userkommentar auf den Union Berlin-Blog textilvergehen.de, könne es kaum anders verstanden werden und könne nur mit „krampfhaften Rhetorikversuchen“ zu einem Symbol umgedeutet werden. 15 Die Inanspruchnahme symbolischer, die referentielle Bedeutung des Fadenkreuzmotivs suspendierender Lesarten wird in anderen Fällen sogar zum Anlass genommen, den sich so positionierenden Fans den Fanstatus insgesamt abzusprechen. „[S]olche Spinner wollen wir in unserem Stadion nicht! Keiner teilt eurer Meinung geht woanders hin 👋 . […] Ihr seit keiner Borussen“ 16 (sic! ) - so twittert ein User in Antwort auf einen Tweet der Fanhilfe Mönchengladbach, die das durch Gladbach-Fans gezeigte Fadenkreuz-Banner als Symbol für Kritik gerechtfertigt hatten. Die von Collins vor allem für kopräsente Kollektive beschriebenen Ein- und Ausgrenzungshandlungen und entsprechende Aushandlungen von Zugehörigkeit zum Kollektiv der Fans können also auch bis in die digitalen Anschlussdiskurse verlängert werden, wo über die moralischen Standards diskutiert wird, welche die Zugehörigkeit zur Fangemeinschaft regulieren (Collins 2004: 49; siehe hierzu auch Klemm 2012: 10-18). 216 Simon Meier-Vieracker & Stefan Hauser <?page no="217"?> Das diskutierte Beispiel führt vor Augen, dass im digitalen Raum ein vielstimmiger metapragmatischer Diskurs geführt wird, der insbesondere die multimodalen Aspekte der Fankommunikation adressiert und auch problema‐ tisiert. Dabei sind die Medialitätsbedingungen der digitalen Kommunikation grundlegend andere als die der analogen Kommunikation in den Stadien. Neben der Verdauerung (Boyd 2014: 11; Evans et al. 2017: 41 f.) bzw. der Wiederholbar‐ keit des Geschehens in der visuellen Dokumentation ist die Möglichkeit zur unbegrenzten Weiterverbreitung und damit einhergehend die erhöhte Sichtbar‐ keit von Bedeutung. Indem im digitalen Diskurs die Publika gegenüber dem Präsenzpublikum in den Stadien entgrenzt sind, treffen die Fanpraktiken auf ungleich heterogenere Öffentlichkeiten, welche die semiotischen Ressourcen und Codes der Fans nochmals anders, und zwar deutlich kritischer reflektieren. 5 Fazit Gegenstand unseres Beitrags waren multimodale kollektive Fanpraktiken in Fußballstadien und ihre Begleit- und Anschlusskommunikation im digitalen Raum, die wir in ihrer für die Fankultur und einzelne Fankollektive konstitutiven Rolle betrachtet haben. Unser Interesse galt dabei den medialen Bedingungen und Prägungen dieser Praktiken, welche die charakteristischen Formen der Zeichenprozessierung erst ermöglichen und sich in sie einschreiben. Ihre Ana‐ lyse erlaubt es, sowohl die soziologischen Arbeiten zu Präsenzpublika als auch Collins’ ritualtheoretische Deutung von Kollektiven und der gruppenkonstitu‐ tiven Funktion von Interaktionsritualen zeichentheoretisch zu präzisieren. Wir konnten zeigen, dass multimodale Fanpraktiken in den Stadien auf semi‐ otisch vielfältige Zeichenhandlungen zurückgreifen, für die die Materialität der körpergebundenen und räumlich wie zeitlich strukturierten Kommunikation konstitutiv ist. Erst diese medialen Bedingungen ermöglichen das Ritualhandeln der Fans und sichern ihm jene gruppen- und identitätskonstitutive Funktion, die Collins in seiner Theorie der Interaktionsrituale vorsieht. Während bei Collins der Symbolbegriff zwar eine zentrale Rolle spielt, dabei jedoch ausgesprochen vage bleibt, konnte unsere semiotisch und medialitätstheoretisch fundierte Analyse zeigen, dass und wie das Ritualhandeln der Fans insgesamt zeichen‐ haft strukturiert ist. Es ist wesentlich um multimodale Inszenierungsformen - oft visuell wahrnehmbare Gruppensymbole - herum zentriert, die durch Kollektivhandeln effektvoll im Raum und in zeitlich strukturierten Interakti‐ onssequenzen platziert werden. Dies ermöglicht es den Fans, für sich selbst und andere „ihre Zugehörigkeit zu einer positiv bewerteten Gruppe vorzuführen“ (Schwier/ Schauerte 2009: 429) und eine durch Zeichengebrauch induzierte Multimodal Ritual Chains 217 <?page no="218"?> kollektive Efferveszenz zu erzeugen. Indem wir auch die - mit dem analogen Geschehen in den Stadien oft eng verzahnte - digitale Anschluss- und Begleit‐ kommunikation mit nochmals anderen medialen Bedingungen mitberücksich‐ tigt haben, konnten wir außerdem zeigen, wie sich die gruppenkonstitutive Funktion der Fanpraktiken noch in den digitalen metapragmatischen Diskursen fortschreibt. Einerseits können über die Verdauerung und Dissemination der flüchtigen Fanpraktiken erweiterte Publika an der kollektiven Efferveszenz partizipieren. Andererseits bieten die aus der Flüchtigkeit der Situation heraus‐ gehobenen und heterogeneren Öffentlichkeiten zugänglichen Repräsentationen und Inszenierungen der Fanpraktiken im Digitalen auch Anlass für kritische Reflexion. Selbstdarstellung und (affirmative wie auch kritische) Selbstvergewisserung sind mithin wesentliche Funktionen von Fanchoreografien und verwandten multimodalen Fanpraktiken, die noch in der digitalen Anschlusskommunika‐ tion fortwirken. Ohne den Einbezug der charakteristischen Medialität dieser Prozesse, welche ihre Funktionen für die Fankultur selbst grundiert, können sie nicht adäquat verstanden werden. Umgekehrt stellen analoge und digitale Fanpraktiken einen Anschauungsfall dar, um medialitäts- und multimodalitäts‐ theoretische Konzepte empirisch dicht auszuarbeiten und zu erproben. Literatur Abercrombie, Nicholas/ Longhurst, Brian (1998). Audiences. A Sociological Theory of Performance and Imagination. London: Sage. Androutsopoulos, Jannis K. (2016). Mediatisierte Praktiken. Zur Rekontextualisie‐ rung von Anschlusskommunikation in den sozialen Medien. In: Deppermann, Arnulf/ Feilke, Helmuth/ Linke, Angelika (Hrsg.). Sprachliche und kommunikative Praktiken. Berlin/ Boston: De Gruyter, 337-367. Boyd, Danah (2014). It’s complicated: the social lives of networked teens. New Haven: Yale University Press. Bromberger, Christian (1998). Fußball als Weltsicht und als Ritual. In: Belliger, Andréa/ Krieger, David J. (Hrsg.). Ritualtheorien. Wiesbaden: VS Verlag für Sozialwissen‐ schaften, 285-301. Brunner, Georg (2009). Fangesänge im Fußballstadion. In: Burkhardt, Armin/ Schlobinski, Peter (Hrsg.). Flickflack, Foul und Tsukahara: der Sport und seine Sprache. Mannheim: Dudenverlag, 194-210. Burkhardt, Armin (2009). Der zwölfte Mann. Fankommunikation im Fußballstadion. In: Burkhardt, Armin/ Schlobinski, Peter (Hrsg.). Flickflack, Foul und Tsukahara: der Sport und seine Sprache. Mannheim: Dudenverlag,175-193. 218 Simon Meier-Vieracker & Stefan Hauser <?page no="219"?> Claus, Robert/ Gabler, Jonas (2017). Sprache und Kommunikation in Fußballfangruppen. In: Neuland, Eva/ Schlobinski, Peter (Hrsg.). Handbuch Sprache in sozialen Gruppen. Berlin/ Boston: De Gruyter, 370-384. Collins, Randall (2004). Interaction Ritual Chains. Princeton: Princeton University Press. Deppermann, Arnulf/ Feilke, Helmuth/ Linke, Angelika (2016). Sprachliche und kommu‐ nikative Praktiken: Eine Annäherung aus linguistischer Sicht. In: Deppermann, Arnulf/ Feilke, Helmuth/ Linke, Angelika (Hrsg.). Sprachliche und kommunikative Praktiken. Berlin/ Boston: De Gruyter, 1-24. Durkheim, Emile (2005). Die elementaren Formen des religiösen Lebens. 4. Aufl. Frank‐ furt am Main: Suhrkamp. Duttler, Gabriel (2014). Ultras: Der kreative Protest aktiver Fans gegen Kommerzialisie‐ rungsprozesse im Fußball. In: Cuntz-Leng, Vera (Hrsg.). Creative Crowds. Perspek‐ tiven der Fanforschung im deutschsprachigen Raum. Darmstadt: Büchner, 364-382. Duttler, Gabriel/ Haigis, Boris (Hrsg.) (2016). Ultras: eine Fankultur im Spannungsfeld unterschiedlicher Subkulturen (= Kulturen der Gesellschaft 17). Bielefeld: Transcript. Evans, Sandra K./ Pearce, Katy E./ Vitak, Jessica/ Treem, Jeffrey W. (2017). Explicating af‐ fordances: A conceptual framework for understanding affordances in communication research. Journal of Computer-Mediated Communication 22 (1), 35-52. Frick, Karina (2019). #RIP - kollektive Fan-Trauer auf Twitter. In: Hauser, Stefan/ Lu‐ ginbühl, Martin/ Tienken, Susanne (Hrsg.). Mediale Emotionskulturen. Bern: Lang, 179-201. Glogner-Pilz, Patrick/ Föhl, Patrick S. (Hrsg.) (2016). Handbuch Kulturpublikum. For‐ schungsfragen und -befunde. Wiesbaden: Springer VS. Greve, Jens (2013). Randall Collins: Interaction Ritual Chains. In: Senge, Kon‐ stanze/ Schützeichel, Rainer (Hrsg.). Hauptwerke der Emotionssoziologie. Wiesbaden: Springer Fachmedien, 64-67. Hauser, Stefan (2019). Fanchoreografien als koordinierte Formen kommunikativen Kol‐ lektivhandelns. Beobachtungen aus semiotischer Perspektive. Zeitschrift für Semiotik 41 (1-2), 117-140. Hauser, Stefan/ Meier-Vieracker, Simon (Hrsg.) (2022). Fankulturen und Fankommunika‐ tion. Berlin: Lang. Jäger, Ludwig (2015). Medialität. In: Felder, Ekkehard/ Gardt, Andreas (Hrsg.). Handbuch Sprache und Wissen. Berlin: De Gruyter, 106-122. Klemm, Michael (2012). Doing being a fan im Web 2.0. Selbstdarstellung, soziale Stile und Aneignungspraktiken in Fanforen. Zeitschrift für Angewandte Linguistik 56 (1), 3-32. Kolesch, Doris/ Knoblauch, Hubert (2019). Audience emotions. In: Slaby, Jan/ von Scheve, Christian (Hrsg.). Affective Societies. London: Routledge, 252-263. Multimodal Ritual Chains 219 <?page no="220"?> Knoblauch, Hubert (2016). Publikumsemotionen: Kollektive Formen kommunikativen Handelns und die Affektivität bei Großpublika in Sport und Religion. LiLi. Zeitschrift für Literaturwissenschaft und Linguistik 46 (4), 547-565. Kopiez, Reinhard/ Brink, Guido (1999). Fussball-Fangesänge. Eine FANomenologie. Würzburg: Königshausen & Neumann. Krieger, David J./ Belliger, Andréa (1998). Einführung. In: Belliger, Andréa/ Krieger, David J. (Hrsg.). Ritualtheorien. Wiesbaden: VS Verlag für Sozialwissenschaften, 7-33. Leistner, Alexander/ Schmidt-Lux, Thomas (2012). Konzentriertes Fallenlassen. In: Schnabel, Annette/ Schützeichel, Rainer (Hrsg.). Emotionen, Sozialstruktur und Mo‐ derne. Wiesbaden: VS Verlag für Sozialwissenschaften, 317-333. Linz, Erika (2016). Sprache, Materialität, Medialität. In: Jäger, Ludwig/ Holly, Werner/ Krapp, Peter/ Weber, Samuel/ Heekeren, Simone (Hrsg.). Sprache - Kultur - Kommu‐ nikation. Ein internationales Handbuch zu Linguistik als Kulturwissenschaft (HSK 43). Berlin/ New York: De Gruyter, 94-105. Löw, Martina (2008). The Constitution of Space: The Structuration of Spaces Through the Simultaneity of Effect and Perception. European Journal of Social Theory 11 (1), 25-49. Mead, George Herbert (1973). Geist, Identität und Gesellschaft aus der Sicht des Sozial‐ behaviorismus. Frankfurt a.M.: Suhrkamp. Meer, Dorothee/ Staubach, Katharina (2020). Social media influencers’ advertising tar‐ geted at teenagers: The multimodal constitution of credibility. In: Thurlow, Cri‐ spin/ Dürscheid, Christa/ Diémoz, Federica (Hrsg.). Visualizing Digital Discourse. Berlin/ Boston: De Gruyter, 245-270. Meier, Simon (2019). mitfiebern - Mediatisierte emotionale Kommunikationspraktiken in Fußball-Livetickern und Livetweets. In: Hauser, Stefan/ Luginbühl, Martin/ Tienken, Susanne (Hrsg.). Mediale Emotionskulturen (= Sprache - Kommunikation - Medien). Bern: Lang, 155-178. Meier-Vieracker, Simon (2021). Im Fadenkreuz. Metapragmatik und semiotic ideologies im Fußballfandiskurs. Kodikas/ CODE 2018 (3-4), 245-259. Meier-Vieracker, Simon (2024). Mention and Use. Invective and Metainvective Discourse Among Football Fans. In: Meier-Vieracker, Simon/ Kämper, Heidrun/ Warnke, Ingo H. (Hrsg.). Invective Discourse. Berlin/ Boston: De Gruyter, 177-198. Michel, Sascha (2018). Die Echtzeitkommentierung von Fußballspielen im Social TV: Praktiken der Aneignung des Fernsehformats „Sport“ im Netz. In: Hauser, Stefan/ Meier, Simon (Hrsg.). Fußballkultur und Sprachkultur. aptum-Sonderheft, 119-137. Reckwitz, Andreas (2003). Grundelemente einer Theorie sozialer Praktiken. Eine sozial‐ theoretische Perspektive. Zeitschrift für Soziologie 32 (4), 282-301. Rohlwing, Christoph (2015). Fußballstadien als Hysterieschüsseln? Soziologische Studie zum Verhältnis von Architektur, Raum und Gemeinschaft. Marburg: Tectum. 220 Simon Meier-Vieracker & Stefan Hauser <?page no="221"?> Roose, Jochen/ Schäfer, Mike/ Schmidt-Lux, Thomas (2010). Fans in theoretischer Perspek‐ tive. In: Roose, Jochen/ Schäfer, Mike/ Schmidt-Lux, Thomas (Hrsg.). Fans. Soziologi‐ sche Perspektiven. Wiesbaden: VS Verlag, 27-45. Schneider, Jan Georg (2008). Spielräume der Medialität: linguistische Gegenstandskons‐ titution aus medientheoretischer und pragmatischer Perspektive. Berlin/ New York: De Gruyter. Schneider, Jan Georg (2017). Medien als Verfahren der Zeichenprozessierung. Grundsätz‐ liche Überlegungen zum Medienbegriff und ihre Relevanz für die Gesprächsforschung. Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 18, 34-55. Schwier, Jürgen (2005). Die Welt der Ultras. Eine neue Generation von Fußballfans. Sport und Gesellschaft - Sport and Society 2 (1), 21-38. Schwier, Jürgen/ Schauerte, Thorsten (2009). Die Theatralisierung des Sports. In: Willems, Herbert (Hrsg.). Theatralisierung der Gesellschaft: Band 1: Soziologische Theorie und Zeitdiagnose. Wiesbaden: VS Verlag für Sozialwissenschaften, 419-438. Scollon, Ron (1998). Social interaction. A study of news discourse. London/ New York: Longman. Siebetcheu, Raymond (2016). Semiotic and linguistic analysis of banners in three European countries’ football stadia: Italy, France and England. In: Blackwood, Robert/ Lanza, Elizabeth/ Woldemariam, Hirut (Hrsg.). Negotiating and Contesting Identities in Linguistic Landscapes. London: Bloomsbury, 181-194. Spitzmüller, Jürgen (2013). Graphische Variation als soziale Praxis. Eine soziolinguisti‐ sche Theorie skripturaler „Sichtbarkeit“. Berlin/ Boston: De Gruyter. Stöckl, Hartmut (2016). Multimodalität - Semiotische und textlinguistische Grundlagen. In: Klug, Nina-Maria/ Stöckl, Hartmut (Hrsg.). Handbuch Sprache im multimodalen Kontext (= Handbücher Sprachwissen 7). Berlin/ Boston: De Gruyter, 3-35. Thonhauser, Gerhard/ Wetzels, Michael (2019). Emotional sharing in football audiences. Journal of the Philosophy of Sport 46 (2), 224-243. Tophinke, Doris (2016). „In den tiefsten Winkeln unserer Betonwälder tanzten die Namen ein farbenfrohes Fest und wir tanzten mit bis in die Morgenstunden“ - Zur praktischen Kultur des Szene-Graffiti. In: Deppermann, Arnulf/ Feilke, Helmuth/ Linke, Angelika (Hrsg.). Sprachliche und kommunikative Praktiken. Berlin/ Boston: De Gruyter, 405- 430. Winands, Martin (2015). Interaktionen von Fußballfans. Das Spiel am Rande des Spiels. Wiesbaden: Springer Fachmedien. Winter, Rainer (2010). Fans und kulturelle Praxis. In: Roose, Jochen/ Schäfer, Mike S./ Schmidt-Lux, Thomas (Hrsg.). Fans. Soziologische Perspektiven. Wiesbaden: Verlag für Sozialwissenschaften, 161-182. Multimodal Ritual Chains 221 <?page no="222"?> Yilmaz, Yasemin (2018). Die affektive Seite des Interaktionsrituals. In: Pfaller, La‐ rissa/ Wiesse, Basil (Hrsg.). Stimmungen und Atmosphären: Zur Affektivität des Sozialen. Wiesbaden: Springer Fachmedien, 83-101. 222 Simon Meier-Vieracker & Stefan Hauser <?page no="223"?> Körpersemantisierungen im #bodylove-Diskurs Eine Korpusstudie zu Instagram-Posts als multimodales Positionierungsformat Marie-Luis Merten Abstract: Digital body discourses are still under-researched from a linguistic perspective. This article sheds light on body-reflective positioning in Insta‐ gram posts within the #bodylove discourse and thus focuses on a “key issue in pragmatics research into social media” (Zappavigna/ Ross 2021: 198). In doing so, it addresses a second major research desideratum: the systematic linguistic study of stance acts in multimodally organized contexts. The article explores the question of how body-related positioning is construed multimodally - that is, in the interplay of image(s) and written language - in Instagram posts. To answer this question, a multimodal corpus consisting of 400 body-reflective Instagram posts from 2020 to 2022 has been analyzed. The paper presents quantitative results as well as two (more qualitatively explored) multimodal positioning patterns. Logico-semantic as well as formal linking patterns of language and image are taken into account. In addition, the paper discusses multimodal techniques of contrasting and construing changes over time. Keywords: Body communication, multimodality, Instagram, social media, social positioning, stancetaking 1 Einführung: Anliegen und Forschungsfragen In einer dualistischen Perspektive ist der Körper sowohl Produkt als auch Produzent sozialer (Kommunikations-)Praxis (Bucholtz/ Hall 2016). Digitale Körperdiskurse - also solche, die sowohl den Körper thematisieren als auch im Zuge körperlich fundierter Praktiken mittels technischer Devices hervorge‐ <?page no="224"?> bracht werden - sind bislang nur wenig erforscht. Der vorliegende Beitrag beleuchtet vordergründig körperreflexive Positionierungen in Instagram-Posts und stellt mit dem Phänomen des multimodalen Stancetakings ein „key issue in pragmatics research into social media“ (Zappavigna/ Ross 2021: 198) in den Mittelpunkt. Damit wird zugleich ein zweites Forschungsdesiderat adressiert: Die systematische linguistische Beschäftigung mit Stance-Akten in multimodal organisierten Kontexten (als modal komplexe Verwendungssituationen) steht bislang noch aus. Bis anhin wurde eine verkürzende Sichtweise auf unsere modal diverse Positionierungspraxis eingenommen. Instagram reiht sich in die zahlreichen Kommunikationsangebote unseres digitalen Alltags ein, die „undeniably image-centric“ (Caple 2020: 153) sind und zudem „stance-rich environments“ (Barton/ Lee 2013: 31) darstellen. Als sozial wirksame und der Po‐ sitionierung dienliche Bedeutungsangebote sind multimodale Instagram-Posts ein für Fragestellungen der multimodalen Pragmatik instruktiver Gegenstand. Der Fokus auf Posts, die sich der körperwertschätzenden Bewegung auf Insta‐ gram zuordnen, ermöglicht ferner Einsichten in einen medial einflussreichen Körperdiskurs. Der Beitrag geht den folgenden Fragen nach: • Leitfrage: Wie werden körperbezogene Positionierungen multimodal - also im Zusammenspiel von Bild(ern), deren Layout und geschriebener Sprache - in Instagram-Posts entworfen? - Untergeordnete Frage 1: Welchen Beitrag zur Positionierung leisten bildliche und sprachliche Anteile des Posts? - Untergeordnete Frage 2: Wie ist das formale und semantisch-funktio‐ nale Zusammenspiel von Bild (samt Layout), Sprache und Metainfor‐ mation (etwa Hashtags) zu beschreiben? Entsprechend dieser Anliegen sind ein multimodales Gesamtkorpus bestehend aus 400 körperreflexiven Instagram-Posts (2020 bis 2022) sowie ein dazuge‐ höriges weitgehend sprachlich organisiertes Caption-Subkorpus (= Bildunter‐ schriften, die z.T. auch Emojis enthalten) annotiert und analysiert worden. So konnten verschiedene multimodale Muster des körperreflexiven Positionierens aufgedeckt werden. Zur Rahmung und Besprechung dieser Ergebnisse ist der Beitrag folgendermaßen aufgebaut: Zunächst werden Bestimmungsstücke der Kommunikationsplattform Instagram dargelegt (Kap. 2.1) sowie der For‐ schungsstand zur digitalen Körperkommunikation skizziert (Kap. 2.2). Im Zuge der theoretischen Fundierung wird zum einen der für diesen Beitrag zentrale Multimodalitätsbegriff (Kap. 3.1) diskutiert, zum anderen wird das pragmatische Phänomen des (multimodalen) Positionierens eingeführt (Kap. 3.2). Nach der Vorstellung des Korpus und der Methodik (Kap. 4) werden die empirischen 224 Marie-Luis Merten <?page no="225"?> Einsichten (Kap. 5) präsentiert, wobei der Fokus neben einem grundlegenden Einblick in die quantitativen Ergebnisse auf zwei (stärker qualitativ beleuchtete) multimodale Positionierungsmuster gerichtet wird. 2 Kontextualisierung: Körperkommunikation auf Instagram 2.1 Bestimmungsstücke der Kommunikationsplattform Instagram: Posts im Fokus Die bildzentrierte App Instagram, auf der eigens erstellte Fotografien und Videos bearbeitet, mit Bildbeschriftungen sowie -unterschriften versehen, mit den Follower: innen geteilt und von diesen kommentiert werden können, ist eines der am häufigsten genutzten Social Media-Angebote (Caple 2020: 153). In technologisch-funktionaler wie auch kommunikativ-situativer Hinsicht ist das Moment der share-ability eine zentrale mediale Affordanz, die Instagram mit weiteren Kommunikationsformaten der sozialen Medien teilt. Diese Af‐ fordanz des Miteinander-Teilens von Inhalten eröffnet ein großes Potenzial zur (Selbst-)Positionierung und Konstruktion von Identität (Locher/ Bolander 2017), insofern „each visual snippet comes as an index of who the sender is socio-culturally and media-aesthetically“ (Stöckl 2020a: 190). Einstellungen und Evaluationen zu verschiedenen Themen werden multimodal konstruiert und gemeinsam verhandelt (Zappavigna 2017; Merten 2022). Instagram und andere bildzentrierte Medien können als „potent engines for the manufacture and display of public opinion“ (Stöckl 2020a: 190) betrachtet werden. Die Untersuchung entsprechender Posts ermöglicht Einblicke in „multi-semiotic affiliative and distancing strategies“ (Caple 2019: 444). Praktiken des (zustimm‐ enden) Alignments (Du Bois 2007) vollziehen sich im Dienste einer „ambient affiliation“ (Zappavigna 2011; Zappavigna/ Ross 2021); geteilte Gruppenwerte und -wissensbestände werden ausgehandelt und einander bestätigt. Entsprechend der Relevantsetzung von Bildern, die als Artefakte einer social photography (Zhao/ Zappavigna 2018; Plewa 2021) auch zur Aushandlung eines intersubjektiven Verständnisses - etwa von Körpern als sozial-diskursiven Konstrukten - zum Einsatz kommen, stellt Instagram ein Medium dar, das auf Grundlage von „image-nuclear messages“ (Stöckl 2020a: 194) strukturiert ist (siehe Abb. 1). Captions, mit denen die entsprechenden Bilder (typischerweise Fotografien) bzw. kurzen Videos versehen werden, müssen für die Rezeption ab einer gewissen Länge ausgeklappt werden. Trotz der Layoutvorgabe von Instagram, die diesen Eindruck des (zumindest formal-strukturell) dominier‐ enden Bildes vermittelt, lässt sich ebenso beobachten, dass „it may after all be the little language there is that has the most semantic impact“ (Stöckl 2020a: Körpersemantisierungen im #bodylove-Diskurs 225 <?page no="226"?> 194). Grundsätzlich finden sich Instagram-Posts mit keiner bzw. kaum Sprache in der Caption, ebenso wie kurze Beschreibungen bzw. Kontextualisierungen des visuellen Inhalts bis hin zu „lengthy treatise on matters of import to the Instagrammer making the post“ (Caple 2020: 154). Postende überschreiben in diesen Fällen den visuellen Inhalt in semantischer Hinsicht, sie kreieren mithin neue Bedeutung. Durch Fragen und Aufforderungen in der Caption evozieren sie (digitale) Interaktionen mit ihren Follower: innen. Abhängig vom technischen Device, mit dem auf die App zugegriffen wird, lässt sich zwischen einer mobilen und einer Desktopansicht der Instagram-Posts unterscheiden. In der Desktopansicht, die für diesen Beitrag gewählt wurde, wird die Caption rechts neben dem Bild angezeigt. Bilder (im Sinne von Visuals) werden in diesem Beitrag so verstanden, dass es sich um den Content handelt, der im Layoutelement „Bildfläche“ erscheint, der jedoch nicht zwingend nur von der fotografischen Zeichenmodalität bespielt wird, sondern ebenso das Layout (u. a. Anordnungstypen) als modale Ressource integriert. Zudem kann Schrift mit bestimmten typografischen Merkmalen auf diesen Fotografien angebracht sein. Abgesehen von Videos (Reels), die aufgrund ihrer eigenen multimodalen Orchestrierung in diesem auf statische Bild-Sprache-Texte fokussierten Beitrag nicht berücksichtigt werden, finden sich in gegenwärtigen Instagram-Posts (1) einfache Bilder (Abb. 1), (2) sogenannte Collagen, die sich aus mehreren Bildern zusammensetzen, die auf einer Sehfläche nach bestimmten Layout-Mustern zusammengebracht werden, sowie (3) Karussell-Zusammenstellungen, also Bilderreihen, die sich durch Linkswischen durchswipen lassen. Abb. 1: Instagram-Post aus dem Korpus in der Desktopansicht (orchidea_luna_030122) 226 Marie-Luis Merten <?page no="227"?> 2.2 Digitale Körperkommunikation In sozial-konstruktivistischer Hinsicht stehen Körper und Sprache bzw. Kom‐ munikation in einem konstitutiven Wechselverhältnis: „[ J]ust as bodies produce language, so the converse also holds: Language produces bodies“ (Bucholtz/ Hall 2016: 173). Trotz ihrer Materialität sind Körper (auch) sozial-kommunikativ ge‐ schaffen und werden als kulturell-diskursiv geformte Entitäten lesbar gemacht (Butler 2021). Innerhalb der linguistischen Forschung erweitert die Fokussie‐ rung auf Körper und Embodiment das Verständnis von Konzepten wie Indexi‐ kalität, Agency und Positionierung bzw. Identitätskonstruktion (Bucholtz/ Hall 2016: 178). Im Sprechen und Schreiben über Körper greifen vielfach soziale, ethi‐ sche, medizinische und ästhetische Aspekte ineinander (Coupland/ Coupland 2009). In der digitalen Kommunikationspraxis, in der das Zusammenspiel semioti‐ scher Ressourcen angesichts technologischer Möglichkeiten z.T. neuen Muster‐ haftigkeiten folgt, kommt dem Körper ein besonderer Stellenwert zu: „[T]he body insistently reasserts itself in communicative practices in the spheres of technology and the media“ (Buchholtz/ Hall 2016: 173). In der gegenwär‐ tigen (digitalen) Bildergesellschaft (Frommeld 2022: 29) mit einer ausgeprägten Selfiekultur (Borkenhagen 2021: 144; Georgakopoulou 2016) wirken sich Filter‐ techniken auf die Wahrnehmung von und die Einstellung zu Körpern aus (Warfield et al. 2020). Schönheits- und Normvorstellungen unterliegen einem Wandel (Borkenhagen 2021: 145), auch infolge bearbeiteter Werbekörper (Ny‐ moen/ Schmitt 2021), wie sie wiederkehrend auf Instagram und Co. anzutreffen sind. Beobachten lässt sich eine Ästhetisierung unseres digital-kommunikativen Alltags (Zappavigna/ Ross 2021: 202), die auch mit Blick auf die intermodale Bedeutungsentfaltung maßgebend ist. Den Zusammenhang von multimodaler Kommunikation in den sozialen Medien, inszenierten Körper(-ideale)n und Körperwahrnehmung macht eine Reihe aktueller Arbeiten kommunikations- und medienwissenschaftlicher Provenienz zum Thema (u. a. Cohen et al. 2019; Evens et al. 2021; Barron et al. 2021). Linguistisch interessant ist, dass auch der Effekt von Captions auf die Körperwahrnehmung in den Blick gerät (Tiggemann et al. 2020; Davies et al. 2020). Auf verschiedenen Online-Plattformen tauschen sich User: innen über den Einfluss von Social Media-Beiträgen auf die eigene wie auch fremde Körperwahrnehmung aus und appellieren - zumeist unter der (kookkurrenten) Nutzung von Hashtags wie #bodylove, #bodyacceptance, #bodypositivity, #normalizenormalbodies, #körperliebe usw. - für ein Mehr an Körperakzeptanz. Zusammenfassen lassen sich diese keineswegs homogenen Bewegungen als ein körperreflexiver Diskursraum, dessen Polyvokalität und Körpersemantisierungen im #bodylove-Diskurs 227 <?page no="228"?> Dynamizität von den User: innen auch metareflexiv verhandelt werden (siehe Abb. 2). Abb. 2: Userin-Reflexion über die Bodypositivity- und Bodyneutrality-Bewegung (ninabotzen_300920) Abgesehen von wenigen Ausnahmen (Georgakopoulou 2016) stellt die linguis‐ tische Beschäftigung mit digitalen Körperdiskursen und multimodalen Körper‐ inszenierungen in den sozialen Medien ein Desiderat dar. Dies gilt sowohl in Bezug auf das digitale und multimodale user: innenseitige Schreiben über den eigenen wie auch fremden Körper als auch für die user: innenseitige Reflexion von Körpern in einer digitalisierten Welt. 3 Theoretischer Rahmen: Multimodales Positionieren 3.1 Multimodalitätsbegriff Der in diesem Beitrag relevant gemachte Multimodalitätsbegriff bezieht sich auf das Zusammenspiel der semiotischen Ressourcen Bild(er) (in Gestalt von Fotografien samt deren Layout und Emojis) und (geschriebene) Sprache, wie sie im Kontext der sozialen Medien, aber auch bspw. in Printzeitungen vielfach in Kombination miteinander auftreten (Caple 2020: Kap. 2; Jones/ Hafner 2021: Kap. 4). Die wachsende Bildzentriertheit digitaler Kommunikation (Stöckl 2020a, b; Stöckl et al. 2020; schon Kress 2003: 19) ist bereits in Kap. 2.1 thematisiert worden. Dabei treten Bilder keineswegs als isolierte Entitäten, sondern oft 228 Marie-Luis Merten <?page no="229"?> in Bild-Sprache-Ensembles (Kress 2010: 28) im Kontext verschiedener multimo‐ daler Texttypen auf. Zwar impliziert das Konzept der Bildzentriertheit eine „compositional and perceptual dominance of the image over text on the page or the screen“ (Stöckl 2020a: 189), die (formal betrachtet) aus einer entsprechenden Layoutstruktur von Bild(ern) und Sprachbestandteilen sowie der Bildgröße abgelesen werden kann. Doch auch wenn Bilder vielfach „as perceptual entry points to reading paths and cognitive points of departure for the construal of multimodal meaning“ (Stöckl 2020a: 189) dienen, sind sie nicht in jedem Fall semantisch zentral (Norris 2014: 90; Valeiras-Jurado/ Bernad-Mechó 2022). Ihr konzeptueller Beitrag zur Sinnstiftung, die sich aus der „mode integration within a functional discourse act“ (Stöckl 2020b: 19) ergibt, bleibt zum Teil deutlich hinter dem inhaltlichen Gehalt, den der Sprachbestandteil liefert, zurück. Mit Blick auf die Direktionalität der wechselseitigen Mode-Elaboration ist nach dem jeweiligen Startpunkt (der Rezeption) zu fragen. Angesichts der Layoutvorgaben Instagrams ist dieser Startpunkt vermutlich eher beim Bild anzusetzen. Dennoch kann die wechselseitige Bezogenheit (Stöckl 2016: 23) un‐ terschiedlich ausfallen. Bild(er) und (geschriebene) Sprache, die um eine schrift‐ bildliche Dimension angereichert ist, können verschiedene logisch-semantische Beziehungen eingehen. Die semantisch-funktionalen Hierarchie-Verhältnisse von Bild und Sprache macht bereits Barthes (1964/ 1977) zum Thema, wobei er zwischen drei Bild-Sprache-Relationen unterscheidet. In der aktuellen (me‐ dienlinguistischen) Multimodalitätsforschung wird wiederkehrend auf diese Differenzierung verwiesen: (1) Im Falle des anchorage unterstützt Sprache das dominante Bild; (2) bei der illustration illustriert das Bild den sprachlichen Bestandteil des multimodalen Texts bzw. einen Aspekt dessen, das Bild nimmt eine (semantisch) untergeordnete Stellung ein; (3) ein symmetrisches Verhältnis von Bild und Sprache wird als relay gefasst, in diesem Fall gilt: „[T]he words, in the same way as the images, are fragments of a more general syntagm and the unity of the message is realized at a higher level, that of the story“ (Barthes 1964/ 1977: 41). So werden im Fall (3) Informationen in ergänzender Weise präsentiert, sie treten in ein kohärentes Zusammenspiel ein (Caple 2020: 156). Diese Bild-Sprache-Verhältnisse können im Rahmen eines Textexemplars kookkurrieren (Stöckl 2020b: 23). Die in Abb. 3 angeführten Korpusbelege illustrieren zwei dieser Relations‐ typen: links ein anchorage-Beispiel, rechts ein illustration-Beispiel. Links bildet der piktorale Bestandteil die Freude über den gewölbten Bauch ab, der mit den Händen berührt und mit einem freudestrahlenden Gesicht bestaunt wird. Die auf der Fotografie angebrachte Schrift überschreibt dieses an ein pregnancy/ baby announcement erinnerndes Bild als „No Baby Announcement“, spielt also mit Körpersemantisierungen im #bodylove-Diskurs 229 <?page no="230"?> usuellen Mustern der visuellen (Instagram-)Kommunikation. Die Caption kon‐ textualisiert diese bereits multimodale Bedeutungsgestalt nur unwesentlich, verortet sie allerdings als Diskursbeitrag, der für einen wertschätzenden Um‐ gang mit dem eigenen Körper sensibilisiert wie auch appelliert. - Abb. 3: Anchorage (links: ninabotzen_101020) und illustration (rechts: talisaminoush_061020) Rechts tragen die Sprachbestandteile die Hauptinformation und -funktion (Reminder formulieren, eigene Positionierung). Die Fotografie, die einen Teil des bekleideten Rumpfs sowie der unbekleideten Beine einer allem Anschein nach weiblichen Person zeigt, hat veranschaulichenden Charakter. Im Falle eines anchorage-Verhältnisses gibt Sprache vielfach eine experiential orientation; diese Orientierung „functions to set the scene“ (Caple 2020: 155) durch ein „narrowing down the image’s semantic potential through direct reference“ (Pflaeging 2020: 101). Diese Bedeutungseingrenzung geschieht, indem auf abgebildete Partizipant: innen, Handlungen, deren Umstände und Eigenschaften (Caple 2013: 130, 2020: 155) verwiesen wird, also durch Praktiken der Zuschreibung und Identifikation. Zudem kann die Caption einen größeren Kontext zugänglich machen (Caple 2013: 130-137), was unter dem Phänomen der kontextuellen Extension (contextual extension) gefasst wird. Hier wird bspw. die Zuordnung zu einem bestimmten Diskurs vorgenommen. Grundsätzlich lässt sich die Verknüpfung von Zeichenmodalitäten „als eine spezifische Form von Kohäsion und Kohärenz verstehen, bei der Form- und Bedeutungszusammenhänge sowie Sinnkontinuitäten zwischen semiotisch un‐ terschiedlich konstituierten Textteilen hergestellt werden“ (Stöckl 2016: 27). Multimodale Kohärenz hängt letztlich (auch) von rezipientenseitigen Wissens‐ beständen und kognitiv verfestigten Mustern der Sinnstiftung ab. Das multimo‐ dale Ensemble „can be considered coherent if all modes contribute seamlessly to the communicative aim at hand (e.g. inform, educate, etc.), which normally implies following some genre conventions“ (Valeiras-Jurado/ Bernad-Mechó 230 Marie-Luis Merten <?page no="231"?> 2022: 3). Mit Blick auf das Hervorbringen multimodaler Kohäsion sind in der Struktur multimodaler Texte Kontaktstellen angelegt, „an denen sich Zeichen unterschiedlicher Modalitäten (z. B. Wörter oder Bildelemente etc.) explizit oder implizit aufeinander beziehen“ (Stöckl 2016: 28); in der Folge entstehen cohesive ties (Halliday/ Hasan 1994: 3; Stöckl/ Pflaeging 2022: 7 f.). 3.2 (Soziales) Positionieren multimodal Sich und andere zu positionieren, ist in sozialpraktischer Hinsicht ein elemen‐ tarer Bestandteil unserer Kommunikationspraxis (Lucius-Hoene/ Deppermann 2004; Spitzmüller et al. 2017). Soziale Positionen werden dabei keineswegs ausschließlich sprachlich, sondern in zahlreichen Fällen multimodal entworfen (zum multimodalen Positionieren auf WhatsApp König 2019). Insbesondere in digitalen Kommunikationsräumen wie Instagram, YouTube oder TikTok - allesamt „stance-rich environments“ (Barton/ Lee 2013: 31) - vollziehen sich Positionierungspraktiken, die in ihrer multimodalen Gestalt divergieren. Zap‐ pavigna (2017: 435) hält fest, dass sich die Kommunikationspraxis in den sozialen Medien mehrheitlich als Positionierungspraxis präsentiert, in der evaluative, affektive wie auch epistemische Stances eingenommen werden. Im Zuge lokaler Positionierungen orientieren sich die Kommunikationsakteur: innen an Makro‐ kategorien und -strukturen, wie sie in Form transsituativer sozialer Positionen als verfestigte und verselbstständigte kommunikative Erwartungen vorliegen (De Fina 2013). In der gegenwärtigen soziolinguistischen Forschung werden Phänomene des Positionierens als Stance-Akte behandelt. Dem Stance-Dreieck nach Du Bois (2007) folgend, handelt es sich beim Stancetaking um eine mehrdimensi‐ onale soziale Praxis. Stance ist damit kein „static mental or cognitive state encoded in a fixed linguistic arrangement, but rather involves a highly social and dynamic process emerging from the sequential unfolding of interaction“ (Siromaa/ Rauniomaa 2021: 98). Integrierte Mikropraktiken umfassen (1) das Evaluieren von sprachlich oder multimodal konstruierten Stance-Objekten, (2) das Selbstwie auch Fremdpositionieren der Stance-Akteur: innen in Bezug auf diese Stance-Objekte sowie (3) das Aneinander-Ausrichten im Zuge dieser Positionierungen, das begrifflich als Alignment gefasst wird. Grundsätzlich vollziehen sich Stance-Akte vor der Folie von zugleich im kommunikativen Ge‐ schehen relevant gesetzten „moral and social orders, systems of accountability, responsibility, and causality“ ( Jaffe 2009: 5). Damit lassen sich Positionierungen als „an index of coherent individual or community value systems“ ( Jaffe Körpersemantisierungen im #bodylove-Diskurs 231 <?page no="232"?> 2009: 5) lesen. Stance-Subjekte verorten sich mit Blick auf (geteilte) Werte, Wissensbestände, Erwartung(shaltung)en und Ordnungen. Trotz ihrer kommunikativen Relevanz sind Stance-Praktiken auf Instagram bislang nur wenig erforscht (allerdings Matley 2020; Zappavigna/ Ross 2021; Merten 2022). Hierbei sollten nicht nur Captions, sondern ebenso Bilder, Vi‐ deos wie auch relevant gemachte Metainformationen (z. B. Hashtags) sowie affordante Mitmach-Tools (Like-Button) mit Blick auf verhandelte Werte, (me‐ dien-)ästhetische Vorstellungen und Identitätsentwürfe in den Blick genommen werden. Im Zusammenspiel dieser Modes werden (komplexe) multimodale Stances hervorgebracht (Abb. 4), wobei das Ausdruckspotenzial von Bildern in ihrem Wirken mit sprachlich verfasster Caption und Hashtags einen medi‐ enwissenschaftlich informierten linguistischen Zugang erfordert (Müller/ Geise 2015). Bspw. können sprachliche Evaluationen (wie LIEBENSWERT) auf der Fotografie angebracht und selbstpositionierende Captions hinterlassen werden (Abb. 4 links). Auch bringen Ästhetisierungspraktiken wie das künstlerische Gestalten fotografierter Dehnungsstreifen - in den Hashtags findet sich der referenzielle Bezug: #stretchmarks, #dehnungsstreifen - einen positiv-evaluier‐ enden und wertschätzenden Stance zum Ausdruck (rechts). Die Caption unter‐ streicht und kontextualisiert diese Positionierung, damit liegt ein anchorage-Fall vor. - Abb. 4: Multimodales Stancetaking (links: dr.med.mareike.awe_070722; rechts: male.geers_260122) Instagram-Posts gewähren in ihrem Stance-Profil Einblicke in das digitale Storytelling (Caple 2020; Georgakopoulou et al. 2020). Stance wird vielfach mul‐ timodal erzählend entworfen, indem auf vergangene Ereignisse eingegangen und diese als Hintergrund für die aktuelle Positionierung herangezogen werden. Grundsätzlich lassen sich Storytelling-Praktiken verstehen als „an act of ,ma‐ king sense’ […] and as reconstructing some element of structure, selfhood and capacity to act by“ (Georgakopoulou et al. 2020: 33). Instagram in seiner 232 Marie-Luis Merten <?page no="233"?> 1 So wurden Accounts identifiziert, die sich mehrheitlich diesem Themenkomplex widmen. Weitere körperreflexive Posts dieser Accounts wurden - auch bei Fehlen eines entsprechenden Hashtags - in das Korpus integriert. Bildzentriertheit und spezifischen technologischen Infrastruktur „not only prioritizes a particular formal type of storytelling, based on visual, short and continuous narrative contributions, but also that it is more accessible for indi‐ viduals with particular communicative and technological competences“ (Geor‐ gakopoulou et al. 2020: 37). Um diese Positionierungspraktiken zu verstehen, bedarf es mithin einer gewissen digital literacy als ein Wissen um Routinen und Konventionen der digitalen Kommunikationspraxis ( Jones/ Hafner 2021). 4 Korpus und Methode 4.1 Korpus Das untersuchte Gesamtkorpus setzt sich aus 400 größtenteils deutschspra‐ chigen, zum Teil mehrsprachigen und in einzelnen Fällen englischsprachigen In‐ stagram-Posts aus den Jahren 2020 bis 2022 zusammen. Bei diesen Posts handelt es sich um i.w.S. körperreflexive User: innen-Beiträge des deutschsprachigen Raumes, die ihr Verständnis von sowie ihre Positionierung zu Körper(bilder)n multimodal entwerfen. Als Auswahlkriterium diente im Zuge der manuellen Korpuskompilierung die Verwendung eines Hashtags in der Caption, der den bzw. der körperwertschätzenden Bewegung(en) zugeordnet werden kann, also etwa #bodylove, #bodyacceptance, #normalizenormalbodies, #körperliebe wie auch #selflove. 1 In das mittels Metadaten strukturierte multimodale Korpus wurden Screenshots der Gesamtposts aufgenommen. Integriert sind mithin das/ die Bild(erreihe), die Caption sowie Metadaten wie der Zeitstempel, die Geolokalisierung, die verwendeten Hashtags und die Like-Anzahl. Die in Form ihrer Posts berücksichtigten 56 Accounts sind allesamt (app-)öffentlich einge‐ stellt. Daher wird im vorliegenden Beitrag auf eine Anonymisierung verzichtet; die Postenden sind vielfach darum bemüht, einen großen Rezipient: innenkreis zu adressieren und mit ihren (körperbezogenen) Anliegen sichtbar zu werden. Zudem ist auf Basis der Captions ein geschriebene Sprache und (wenige) Emojis enthaltendes Subkorpus erstellt worden. Dieses Caption-Subkorpus, das im txt-Format vorliegt, umfasst 53.905 Tokens (Wörter und Wortäquivalente wie Emojis). Die durchschnittliche Caption umfasst 135 Tokens, die längste im Korpus belegte Caption setzt sich aus 373 Tokens zusammen, die kürzeste aus 12 Tokens. Körpersemantisierungen im #bodylove-Diskurs 233 <?page no="234"?> 2 Getaggte Unterkategorien sind in eckigen Klammern notiert; sie lassen sich Oberkate‐ gorien zuordnen. Oberkategorien, denen keine Unterkategorien zugeordnet sind (z.-B. 2A Stance-Objekt), sind mittels Freitext getaggt. 4.2 Vorgehen Die zusammengestellten Instagram-Posts sind einem mixed methods-Ansatz folgend annotiert und analysiert worden. Kombiniert wurden automatisierte und manuelle wie auch quantitativ- und qualitativ-orientierte Untersuchungsschritte. Die 400 mul‐ timodalen Posts des Gesamtkorpus sind von zwei Annotierenden mittels MAXQDA annotiert worden. Begreift man den Annotationsprozess als eine „practice of adding interpretative, linguistic information to an electronic corpus of spoken and/ or written language data“ (Leech 1997: 2), wird deutlich, dass die Auszeichnung von Gebrauchsdaten stets als konstruktives Forscher: innenhandeln (Deppermann 2001) zu verstehen ist. Hervorgebracht werden Konstruktionen des Untersuchungsgegen‐ standes, die in ihrer interpretativen Situierung nie gänzlich objektiv sein können. Im Zuge der Annotation sind die 400 Instagram-Posts entsprechend der in Tab. 1 gelisteten Kategorien getaggt worden. Ebene 1: Bild(er) Ebene 2: Caption & Hash‐ tags Ebene 3: Multimodale Verknüpfung 1A Formaler Typ (Be‐ reich Layout) [Einfaches Bild, Collage, Karussell-Post] 2A (Sprachlich) konstruierte(s) Stance-Objekt(e) 3A Logisch-semantische Re‐ lation [anchorage/ Bild dominant, illust‐ ration/ Caption dominant, relay/ ausgewogen, konfligierend] 1B Abgebildetes (Person(en) [Einzel‐ person, Personen‐ gruppe, Nicht-Person], Spiegel-Selfie [ja, nein], Be‐ kleidung [unbekleidet, Un‐ terwäsche, kurz, lang]) 2B Storytelling persönlicher In‐ halte [nein, ja, sehr ausge‐ prägt] 3B Multimodale Kohärenz (Bild und Caption ergeben kohä‐ rentes Ensemble) [ja, nicht herzuleiten/ nein] 1C Sprache auf dem Bild [ja, nein] samt Notation des Phrasentyps 2C „Interak‐ tions-“Angebote [Aufforderung(en), Frage(n)] 3C Multimodale Kohäsion [keine kohäsiven Mittel, im‐ plizite/ explizite Mittel in Cap‐ tion, implizite/ explizite Mittel in Sprache auf dem Bild] 1D Wenn Sprache auf dem Bild: Stance des Sprachbestandteils [stan‐ celess, stance] 2D Verortung in Hashtags [nein, räumlich, zeit‐ lich, raum-zeitlich] Tab. 1: Ebenen und Oberwie auch (getaggte) Unterkategorien der Annotation 2 234 Marie-Luis Merten <?page no="235"?> 3 Die relativen Häufigkeiten beziehen sich auf das Gesamtkorpus, also auf 400 Posts; sie werden für Kategorien, die für den gesamten Datensatz relevant sind, angegeben. 4 Zehn dieser Collagen sind zugleich in Karussell-Posts eingelassen. 5 Nur in 83 Fällen wird längere Kleidung getragen; es finden sich 19 Posts gänzlich unbekleideter Körper. In Form von Mehrfachannotationen wurde ein gewisses Maß an Ambiguität und Unschärfe abgebildet, das insbesondere pragmatischen Phänomenen anhaftet (Archer/ Culpeper 2018: 499). In Annotationstagebüchern sind herausfordernde Annotationsentscheidungen festgehalten und begründet sowie interessante Beobachtungen notiert worden. Das Caption-Subkorpus ist im Zuge einer automatisierten Analyse mittels AntConc bearbeitet worden. Herausgearbeitet wurden insbesondere N-Gramme, also wiederkehrende Wortkombinationen, die auf sprachlich-musterhafte Praktiken des körperbezogenen Stancetakings in den Captions hinweisen. Hieran haben sich weitere „Tiefenbohrungen“ angeschlossen - etwa was die Analyse von kwic-Listen zu instruktiven Suchaus‐ drücken betrifft (wie früher und heute, siehe Kap. 5.3). In der kombinierten Ana‐ lyse von Annotationen und Ergebnissen des automatisierten Zugriffs konnten Instagram-Posts als Evaluationswie auch Storytelling-Format profiliert und verschiedene Muster des multimodalen Positionierens identifiziert werden. 5 Empirische Einsichten 5.1 Quantitative Ergebnisse: Bildbezogene und sprachliche Kategorien sowie Muster Körper sowie Körpererfahrungen und -werte i.w.S. stehen als Stance-Objekte, zu denen man sich explizit (siehe u. a. Abb. 7 und 9) wie auch vielfach implizit (etwa Abb. 5) positioniert, im Mittelpunkt der beleuchteten Instagram-Praxis. Die untersuchten Posts zeigen, was die bildliche Komponente(n) betrifft, fast ausnahmslos Körper einer Einzelperson in verschiedenen Umgebungen bzw. Ausschnitte des Körpers (n = 396) als Bildmotiv. Bereits die bildlichen Inszenie‐ rungstechniken des (eigenen) Körpers (z. B. Abb. 5 und 6) konstruieren die Einstellung zum eigenen Körper im Speziellen wie auch grundsätzlicher die (soziale) Positionierung im körperreflexiven Diskurs auf Instagram, zu dem man in Form des eigenen Postings beiträgt. In der Mehrheit (n = 234; 58,5 %) 3 liegen einfache Bilder vor. Es lassen sich zudem 102 Karussell-Posts (25,5 %) und 74 Collagen 4 (18,5 %) identifizieren. Die abgebildeten Körper(ausschnitte) tragen zum großen Teil lediglich Unterwäsche bzw. Bademode (n = 169; 42,25 %) sowie kurze Kleidung (n = 125; 31,25 %). 5 Die Instagramer: innen - Caption-Autor: in Körpersemantisierungen im #bodylove-Diskurs 235 <?page no="236"?> 6 Im Großteil ist in diesen anchorage-Fällen Sprache auf dem Bild angebracht; damit weist die um Sprache angereicherte Fotografie ein semantisch deutlich klareres Profil auf und kann die „Hauptinformation“ transportieren. und Abgebildete sind mehrheitlich identisch - präsentieren vielfach ihre kaum von Kleidung bedeckten Körper. Dies geht einher mit dem wiederkehrend artikulierten Anspruch, authentisch zu sein, sich in seiner natürlichen (körper‐ lichen) Beschaffenheit zu akzeptieren/ zu lieben und anderen (resp. der Commu‐ nity) Mut zu machen (zu Authentizitätsanmutungen, die mit der sinnlichen Unmittelbarkeit von Bildern einhergehen, auch Müller/ Geise 2015: Kap. 5.2). Da die Akzeptanz des eigenen Spiegelbilds sprachlich rekurrent thematisiert wird, ist es besonders interessant, dass in 32 Posts (8 %) ein gespiegeltes Selfie (Zhao/ Zappavigna 2018: 1746 f.), also eine mit dem Smartphone oder einem anderen Fotoapparat in der Hand gemachte Fotografie, in den Post integriert wird. Bild(er) und Caption (samt Hashtags) stehen überwiegend (n = 229; 57,25%) in einem Verhältnis der bildlichen Illustration; in diesen Fällen scheint die Caption in semantisch-logischer Hinsicht die gewichtigste kommunikative Funktion zu übernehmen (z. B. Abb. 2 sowie Abb. 6 rechts). In diesen Belegen vermittelt das Bild mehrheitlich den Eindruck, eine schmückende Funktion innezuhaben und nur wenige bis keine konkreten Bezüge - im Sinne kohäsi‐ onsstiftender Momente - zum Inhalt der Caption aufzuweisen. Dennoch trägt es zur Positionierung bei. Dieser Befund lässt Rückschlüsse auf die Praktik des Instagram-Posts bzw. dessen Produktion zu: Captions und Fotografien entstehen stärker losgelöst voneinander; den bildbezogenen Community-Kon‐ ventionen grundsätzlich entsprechende, aber in illokutiver Hinsicht wenig spezifische Bilder werden mit „aussagestarken“ und eindeutig positionierenden Captions versehen. Es lassen sich jedoch auch weitere Relationen ausmachen: Während in 110 Fällen (27,5 %) eine anchorage-Relation 6 mit logisch-semantisch dominierenden Bildern vorliegt (z. B. Abb. 4 links), zeigen sich ebenso 61 Fälle (15,25 %), in denen Bild(er) und Sprache verhältnismäßig gleichwertige Rollen mit Blick auf die Bedeutungskonstruktion übernehmen (z. B. Abb. 5). Mit Yus (2019: Kap. 4.5.7) können diese Fälle fast ausnahmslos als interdependente Bild-Sprache-Konstrukte eingestuft werden. Kohäsionsmittel organisieren das Zusammenspiel von Bild(ern) und Caption wesentlich mit: Grundsätzlich finden sich für 285 Posts (71,25 %) kohäsionsstiftende Mittel, die in ihrer Form und der Weise ihrer Bezugnahme divergieren. Zwei in dieser Hinsicht unterschied‐ liche, allerdings für wiederkehrend auftretende Typen der Kohäsionsstiftung repräsentative Belege sind in Abb. 5 angeführt. 236 Marie-Luis Merten <?page no="237"?> Abb. 5: Multimodale Kohäsion (links: dariadaria_040520; rechts: anjazeidler_260520) (1) What I’ll be doing for the rest of the summer 🧡 (dariadaria_040520) (2) …Ond do heds mer all mini onrasierte Beihoor ufgstellt 🌚❄ / Proud to call this home! 🇨🇭 (anjazeidler_260520) Das demonstrativ verwendete Pronomen what im ersten Beispiel (Abb. 5 links, Beleg 1) nimmt Bezug auf die abgebildete Tätigkeit (= den unangespannten Bauch sonnen), die die Instagramerin entsprechend der zukunftsgerichteten Adverbialphrase for the rest of the summer zu tun gedenkt. Das Subjektpro‐ nomen I kann auf die fotografierte Instagramerin bezogen werden, insofern in diesem Beleg Caption-Autorin und Abgebildete zusammenfallen (Caple 2020: 162; zur grammatischen Kohäsion Stöckl 2016: 28). Mittels des nachge‐ stellten Herz-Emojis wird ein positiv-evaluativer Stance eingenommen, der von dem zufriedenen Gesichtsausdruck auf der Fotografie unterstützt wird. Bild und Caption wirken demnach auf verschiedene Weise zusammen, um eine körperwertschätzende und für ihre weitgehend natürliche Beschaffenheit multimodal-argumentierende Positionierung zu konstruieren. Auch das zweite Beispiel (Abb. 5 rechts, Beleg 2) enthält mehrere cohesive ties: Das Adverb do (,da‘) rekurriert auf den in der Vergangenheit liegenden und nicht mit dem Schreibort der Caption identischen Kontext des Posens für die Fotografie. Das Demonstrativpronomen this nimmt Bezug auf den abgebildeten Ort, den die Instagramerin - Bezug durch das schweizerdeutsche Pronomen mer (,mir‘) - ihr Zuhause nennen kann. Die lokal verortenden Hashtags #switzerland und #schweiz wie auch das Emoji der Schweizer Nationalflagge legen die Interpre‐ tation nahe, dass die abgebildeten Schweizer Alpen - durch die Geolokalisierung und die Hashtags #gotthard und #gotthardpass identifiziert - metonymisch für die Schweiz als Heimatland stehen. Ein körperbezogener Stance wird einge‐ nommen, insofern mini onrasierte Beihorr (,meine unrasierten Beinhaare‘) zum beiläufigen und damit als selbstverständlich deklarierten Thema avancieren. Die Körpersemantisierungen im #bodylove-Diskurs 237 <?page no="238"?> affektive Positionierung der Instagramerin wird in Form verschiedener Moda‐ litäten auf kohärente Weise konstruiert: bildlich durch den freudestrahlenden Luftsprung, sprachlich in Form des stand-alone-Prädikativums proud to call this home in der Caption wie auch mittels des Hashtags #glücklich. Auch wenn Kohäsionsmittel kaum auftreten oder fehlen, versuchen Social Media-Nutzende, die Posts als multimodal kohärent zu lesen und damit Sprache und Bild(er) - vor dem Hintergrund von Welt- und Textsortenwissen - als aufeinander bezogen zu interpretieren: Die Nominalphrase Lockdown Mood 2021 (Abb. 6 links) ist als Caption zu einer 4-teiligen Collage hinzugefügt, in der die Instagramerin talisaminoush ihre Hose nicht (mehr) schließen kann. Mit einem Lachen reagiert die Abgebildete auf den Umstand des zu engen Kleidungsstückes, der entsprechend der Caption als Folge der Lockdown-Zeit verstanden werden kann. Sie begegnet diesen körperlichen Veränderungen ge‐ lassen (= ihre Mood); hierauf deutet ebenso der unterhalb dieser Nominalphrase angebrachte Hashtag #loveyourself hin. Im rechten Post (Abb. 6) kann das Bild als sich zumindest auf den körperlichen Aspekt beziehende Dokumenta‐ tion des referentiellen Inhalts von genauso wie ich bin gedeutet werden. Das Spiegel-Selfie zeigt die Instagramerin endlich_zufrieden in Unterwäsche; sie blickt lächelnd auf das Display ihres Smartphones. Ihre soziale Positionierung als körperwertschätzende Akteurin wird nicht nur bildlich (lächelndes Gesicht, sich ihrer Community in Unterwäsche präsentierend), sondern auch durch das affektiv aufgeladene ich liebe in der Caption konstruiert. Die Hashtags - u. a. #selflove, #summerbody, #lovemyself - unterstützen diesen Stance. - Abb. 6: Multimodale Kohärenz (links: talisaminoush_130121; rechts: endlich_zufrieden_180622) Der Zusammenhang von Stance und Storytelling ist bereits im theoretischen Abschnitt skizziert worden. Im untersuchten Datensatz treten wiederkehrend erzählende Captions, Collagen wie auch Bilderreihen auf, mittels derer Erleb‐ nisse wie auch Veränderungen rekontextualisiert werden und sich die Pos‐ tenden sozial positionieren. Die manuelle Annotation stützte sich auf einen 238 Marie-Luis Merten <?page no="239"?> weiten Begriff des Storytellings, der grundsätzlich die Gradualität des Phäno‐ mens als die Erzählung einer temporalen Sequenz i.w.S. berücksichtigt (dazu Kap. 5.3). Auf diese Weise können 137 Posts (34,25 %), in denen erzählende Passagen eingelassen sind, und 74 Posts (18,5 %), die in hohem Maße erzäh‐ lend entworfen sind, identifiziert werden; mithin wird in über der Hälfte der Korpuseinträge auf Verfahren des Storytellings zurückgegriffen. Die Cap‐ tion-Autor: innen treten mehrheitlich als Ich- oder Wir-Erzähler: innen auf; allerdings leiten mitunter Zitate aus dem Alltag bzw. Kommentare Dritter die Caption ein und werden zum Anlass der Erzählung genommen. Wiederkehrend werden diese Erzählungen zum Hintergrund für bestärkende und aus der eigenen Biographie implizierte du-Aussagen (fett hervorgehoben in Beleg 3), die dem Empowerment der lesenden Community dienen. (3) Freust du dich auf den Sommer oder hast du eher Angst dich zu zeigen, ganz ehrlich? Ich hatte jahrelang Angst, ganz ehrlich. Ich im Bikini oder sogar oben ohne - vor anderen Menschen - früher undenkbar. Ich war jahrelang nicht im Schwimmbad oder am See […]. Heute verstehe ich erst, wie schlimm ich zu mir selbst war, […]. Wann verstehen wir endlich, dass 90-60-90 eine Illusion ist? […] Girl, du bist gut so wie du bist! So wie du jetzt bist, kannst du deinen Bikini voller Stolz tragen und deinen Körper feiern! […] (milenka.emilia_190622) Die im Caption-Subkorpus am häufigsten auftretenden Bigramme (Tab. 2) deuten an, dass Fremdpositionierungen, die ein in der körperreflexiven Insta‐ gram-Praxis generalisiertes Du adressieren, wie auch auf die eigene Person bezogene ich- und stärker inkludierende wir-Selbstpositionierungen die Cap‐ tions bestimmen. Zudem treten sprachliche Marker eines zeitlichen und/ oder konditionalen Relationierens auf (wenn du, wenn ich, nicht mehr, jeden Tag; siehe Kap. 5.3). Die Analyse der kwic-Listen zu den grundsätzlich ambigen Bigrammen habe ich und ich habe deckt auf, dass diese mehrheitlich Teil analytisch gebildeter Perfektformen sind, also in Belegen des Besprechens von Welt (Weinrich 2001) - etwa in Form von Bekenntnissen - integriert sind (bspw. habe ich mich ausschließlich mit Filter gezeigt, Ich habe viel zu oft nach links und rechts geschaut). Die Relevanz von Techniken des Vergleichens wird durch Bigramme wie so wie, wie du und wie ich zumindest angedeutet (Kap. 5.2). Körpersemantisierungen im #bodylove-Diskurs 239 <?page no="240"?> Rank Freq. Type Rank Freq. Type Rank Freq. Type 1 96 du bist 11 52 dass ich 21 37 ist es 2 87 es ist 12 52 nicht mehr 22 37 nicht so 3 81 ich bin 13 52 so wie 23 37 wir uns 4 77 habe ich 14 52 ich habe 24 34 wie ich 5 74 ich mich 15 51 wie du 25 32 bist du 6 66 und das 16 51 zu sein 26 32 dir selbst 7 63 wenn du 17 46 für mich 27 32 ist das 8 61 in den 18 43 und ich 28 32 was ich 9 58 du dich 19 43 wenn ich 29 31 jeden Tag 10 57 das ist 20 39 in der 30 30 bin ich Tab. 2: Bigramme im Caption-Subkorpus (Rank 1 bis 30) Nimmt man die häufigsten Bigramme zu den Suchausdrücken ich, du und wir - also perspektivierende Personalpronomen - in den Blick, sind insbesondere die wiederkehrend auftretenden Kombinationen von Personalpronomen und Verb interessant. In den du- und wir-Fällen treten rekurrent Modalverben hinzu. Während du musst auf einen Raum der Notwendigkeit sowie Verpflichtung und du kannst auf einen Raum der Möglichkeiten verweist, sind die Bigramme wir sollten und wir müssen in die schreibenden Instagramer: innen einschließende Aufforderungen eingelassen (z. B. wir sollten uns nie von einer Kleidergröße definieren lassen, wir müssen uns wohl fühlen & uns selber lieben). Das Bigramm du siehst deutet auf die Auseinandersetzung mit dem Wahrnehmen und Perspek‐ tivieren des lesenden Gegenübers hin. Dass affektive Selbstpositionierungen wiederholt auftreten, zeigt ich liebe an. Das Bigramm wir denken gibt einen Hinweis darauf, dass Captions dazu genutzt werden, Denkmuster und Glau‐ benssätze auszuhandeln. Mit Nachdruck wird das Wir-Kollektiv angesprochen (wir alle), mit dem z.T. lediglich weibliche Akteurinnen adressiert werden (wir frauen). 240 Marie-Luis Merten <?page no="241"?> Rank Freq. Type Freq. Type Freq. Type 1 96 du bist 81 ich bin 37 wir uns 2 58 du dich 74 ich mich 27 wir sind 3 19 du es 51 ich habe 20 wir alle 4 16 du musst 30 ich mir 17 wir sollten 5 16 du nicht 25 ich das 10 wir haben 6 12 du das 23 ich es 7 wir nicht 7 12 du hast 23 ich nicht 6 wir müssen 8 12 du kannst 20 ich war 5 wir denken 9 11 du siehst 19 ich möchte 5 wir frauen 10 11 du wirst 18 ich liebe 5 wir selbst Tab. 3: Bigramme zu den Suchausdrücken du, ich und wir (Caption-Subkorpus) Nicht nur Captions sind vordergründig sprachlich organisiert; Sprache findet sich auch in bzw. auf dem Bild/ der Bilderreihe des Posts (n = 105; 26,25-%), entweder als Teil des Bildes (etwa auf einem im Foto hochgehaltenen und beschrifteten Poster) oder als nachträglich auf der Fotografie angebrachte Schrift. Von den 105 Fällen, in denen Sprache in/ auf dem Bild auftritt, kommt ihr in 64 Fällen die Funktion zu, einen evaluativen Stance zu einem bildlich oder multimodal entworfenen Stance-Objekt (Körperformen, Körperveränderungen usw.) zu konstruieren. In den übrigen Fällen dienen die Anbringungen von Schrift mehrheitlich der experiential orientation. Sie bringen demnach keine evaluative und sich damit sprachlich-explizit an den Werten der Community orientierende Positionierung als Akt des Alignments hervor. Unter diesen 105 Belegen von Beschriftungen des Bildes sind - mit einer gewissen Überschneidung, da einzelne Posts sowohl Collagenals auch Karussell-Post sind - 36 Karussell-Posts (von insgesamt 102) sowie 46 Collagen (von insgesamt 74). Das häufige Vorkommen von Sprache auf Collagen sticht ins Auge. Eine einge‐ hendere Beschäftigung mit dem Material zeigt zudem, dass in einer Vielzahl der Posts, die aus mehr als einem einfachen Bild samt „Beschriftung“ bestehen, ein semantisches Verhältnis des Kontrastes multimodal eröffnet wird. Nachfolgend wird diese semantische Figur, die sowohl als ein atemporales Verhältnis als auch als ein Ergebnis einer Zeit einnehmenden Veränderung konturiert wird, eingehender beleuchtet (Kap. 5.2 sowie 5.3). Insgesamt tritt Sprache in 43 Fällen kontrastierender Collagensowie Karussell-Posts auf (Tab. 4). Diese Fälle lassen sich vier Gruppen Körpersemantisierungen im #bodylove-Diskurs 241 <?page no="242"?> zuordnen: Erstens wird die Praktik der Post-Produktion (Posing, Bearbeitung, Auswahl der Bilder usw.) in ihrem Inszenierungspotenzial thematisiert; zweitens werden (Zeit-)Zustände gegenübergestellt und kontextualisiert; drittens werden gegenübergestellte Fotografien und damit gegenübergestellte Körperabbildungen evaluiert; viertens wird Wahrnehmung bzw. Sehen als stets selektiver und von den Fotoproduzent: innen mitperspektivierter Prozess behandelt. Sprache auf kontrastierenden Collagen und Karussell-Posts -A I N S TA G R AM -P R AXI S (n = 16) -Instagram / Realität (6); Posed / Relaxed (2); Same Body / Different Pose (2); Posted / De‐ leted (2); Social Media / Realität (1); Photoshop / Kein Photoshop (1); Bearbeitet / Unbe‐ arbeitet (1); Result / Preparation (1) - -B (Z E IT -)Z U S TÄN D E (n = 11) -Kein Vorher / Kein Nachher (2); Heute / Früher (1); 2022 / 2017 / 2016 / 2015 / 2015 / 2014 / 2014 / 2012 / 2008 (1); Woche 10 / Woche 20 / Woche 30 (1); Woche 7 / Woche 20 / Woche 33 (1); Woche 7 / Woche 10 / Woche 13 / Woche 15 / Woche 17 / Woche 20 / Woche 23 / Woche 26 (1); isst 600 kcal am Tag und hat abends Essanfälle / isst ca. 2300 kcal am Tag (1); 121,5 kg / 59,3 kg (1); 50er, Hol‐ lywood Age / 60er, Swinging Sixties / 80er, Supermodel Era / 90er, Heroin Chick / 2000er, Postmodern Beauty (1); Nicht schwanger / Nicht schwanger (1) - -C E VAL UATI O N (n = 10) -Worthy / (Still) Worthy (2); Liebenswert / Liebenswert (1); Beautiful / Still Beautiful (1); Still X / Still X (X = me, happy, loveable) (1); Unglücklich / Glücklich (1); Schön / Ok / Un‐ gesund! ! ! ! (1); Bikinifigur / Auch Bikinifigur (1); Not a whore / not a prude (1); Ein schlechtes Ergebnis / Ein schlechtes Ergebnis (1) - -D S E H E N AL S P E R S P E KTIVI E R T E S P HÄN O M E N (n = 6) -what you want to see / how it really looks like (1); Wie du wirklich aussiehst / wie du gerne aussehen würdest (1); Wie du wirklich aussiehst / was du im Spiegel siehst (1); Was du siehst / Was ich sehe (1); What you see / What you don’t see (1); Was du siehst / Was dein Hund sieht (1) - Tab. 4: Sprache auf kontrastierenden Collagen und Karussell-Posts (in Klammern Beleg‐ zahlen) 242 Marie-Luis Merten <?page no="243"?> Als (funktionale) Muster des multimodalen Positionierens im körperreflexiven Instagram-Diskurs sind das atemporale Kontrastieren (Kap. 5.2) und das Ent‐ werfen von Veränderungen unter der miteinander verzahnten Nutzung von Sprache und Bild (Kap. 5.3) besonders instruktiv. Auf diese Weise werden Stances zum eigenen Körper, zu geführten und antizipierten Körperdiskussi‐ onen, zu gesellschaftlichen, ethischen und (medien-)ästhetischen Ordnungen und Normen etabliert wie auch reflektiert. 5.2 „Instagram vs. Realität“: Multimodales (atemporales) Kontrastieren Instagramer: innen positionieren sich mittels kontrastiv organisierter Posts, in denen Bilder, die einem bestimmten Layout bzw. einer bestimmten Anordnung folgen, und/ oder Sprache eine atemporale, also nicht die Kategorie Zeit adres‐ sierende Gegenüberstellung von Perspektiven, Körperansichten und -inszenie‐ rungen etablieren. Die Postenden entwerfen sich dadurch als Akteur: innen, die die Instagram-Praxis in ihrer oftmals verzerrenden Konstruktion von Kör‐ pern und Selbst offenlegen und reflektieren. Insgesamt liegen damit komplexe Stance-Objekte vor. Die Postenden orientieren sich hierbei an medial-kom‐ munikativen Konventionen und dem Selbstverständnis der körperreflexiven Community. Ihre Posts lesen sich in dieser Hinsicht als Alignment-Beiträge. Zugleich dienen die User: innen-Beiträge vielfach der Abgrenzung von Kör‐ perinszenierungen in den sozialen Medien, die von Posing- und Bildbearbei‐ tungstechniken überformt sind. Durch das Gegenüberstellen von Bildern, die zum einen hinsichtlich gewisser Bildelemente identisch sind (z. B. abgebildete Person, abgebildetes Körperteil, Kleidung, Umgebung) und die zum anderen mit Blick auf ausgewählte Aspekte (etwa Einsatz von Filtern, Steh-/ Sitzposition des Körpers) divergieren, wird der Fokus - rein bildlich - auf die Relevanz dieser Unterschiede gelegt (z. B. Abb. 7 links, 8, 9, 10). Bedeutung entsteht hier mithin an der Schnittstelle von Layout und Bild. Beschriftungen des Bildes treten in kontextualisierender, mitunter evaluativer Funktion hinzu (evaluativ: insb. Abb. 9 unten rechts, 10); Sprache neben diesen Bildern übernimmt neben einer evaluativ-positionierenden Funktion zum Teil die Aufgabe, dem Post eine historisch-biographische Tiefe zu verleihen, mithin die eigene für die Gegenüberstellung relevante Geschichte zu erzählen (z. B. Abb. 7 links, 9 oben rechts). Wiederkehrend wird das Sehen bzw. Betrachten von Körpern in Social Media-/ Instagram-Posts (Abb. 7 links), aber auch grundsätzlicher das visuelle Wahrnehmen von (körperlichen) Oberflächen (Abb. 7 rechts) als nur selektives Körpersemantisierungen im #bodylove-Diskurs 243 <?page no="244"?> und perspektiviertes Phänomen thematisiert. Indem orchidea_luna zwei unter‐ schiedlich umfangreich bedeckte Ausschnitte ihres Bauches in Nahaufnahme mit dem sprachlichen Bestandteil what you want to see vs. how it really looks like kontrastiert und auf der unteren Fotografie - der multimodalen Konstruktion von „wirklichem Aussehen“ - Dehnungsstreifen sichtbar werden, macht sie auf den Umstand des Inszenierens von Körperausschnitten, die ein „gewolltes“ Bild zeichnen, aufmerksam. - Abb. 7: Sehen als perspektiviertes Phänomen (links: orchidea_luna_290121; rechts: corinna_fee_071220) Grundsätzlich ist der engl. Nebensatz what you want to see ambig. Deutungsoffen bleibt, ob hiermit ein nicht von Dehnungsstreifen gezeichneter Bauch angespro‐ chen ist, den (a) das generalisierte Du an sich selbst oder (b) Nutzer: innen im Instagram-Kontext im Sinne medienästhetischer Ansprüche sehen möchten. Auch in Posts, in die lediglich einfache Fotografien integriert sind, finden sich solche Metareflexionen des Perspektivierens von Seh-/ Betrachtbarem (etwa Abb. 1). So schreibt die Instagramerin in Caption-Beleg (4) den Rezipierenden in strukturell-parallelisierender Weise zu, lediglich einen Bauch voller Narben zu sehen; sie selbst sehe eine Kriegerin. Damit konstruiert sie ihre sichtbaren Dehnungsstreifen als Spuren eines in der Vergangenheit geführten und offen‐ sichtlich überstandenen Kampfes. (4) Tiger Baby 🐅 Realness am Montag: Du siehst einen Bauch voller Narben. Ich sehe eine Kriegerin 🤗 […] (orchidea_luna_030122) Indem wiederum identische Fotografien in einem Post gegenübergestellt werden (Abb. 7 rechts) und hinzutretende Sprache darauf hinweist, was ange‐ sichts der Fokussierung auf Oberflächigkeiten verborgen bleibt (z. B. körper‐ liche Beschwerden wie Skoliose, Schlafparalysen, Atemstörung), wird Sehen als Phänomen der selektiven Wahrnehmung konturiert. Zudem wird wiederkeh‐ rend verhandelt, dass auf Instagram lediglich (bearbeitete) Ausschnitte und 244 Marie-Luis Merten <?page no="245"?> 7 In die Abb. 8 sind aus Platzgründen insgesamt nur zwei der vier Fotografien aufge‐ nommen worden. Momentaufnahmen sichtbar gemacht werden. Mitunter wird der Plattform eine gewisse Agency zugeschrieben; die Postenden als Ausschnitt wählende und Inszenierungen entwerfende Akteur: innen treten dabei in den Hintergrund (Beleg 5). (5) […] alles was Instagram zeigt ist nur eine kleine Momentaufnahme - ein paar Sekunden eines ganzen Lebens […] (sarahuvm_150521) Der Kontrast von Instagram vs. Realität wird wiederkehrend zum Motiv des multimodalen Beitrags (siehe Tab. 4; Caption in Abb. 8), sowohl in der sprach‐ lichen als auch bildlichen Auseinandersetzung. - Abb. 8: Instagram vs. Realität in Bild und Caption (links und rechts: sarahuvm_120721) Der Karussell-Post in Abb. 8 kontrastiert ein Bilderpaar mit einem zweiten Bilderduo: 7 Auf zwei Fotografien wird eine grazil anmutende Sitzpose einge‐ nommen, auch Bildbearbeitungsmöglichkeiten wurden offensichtlich genutzt. Die anderen zwei Fotografien sind zur selben Zeit, am selben Ort und mit derselben Abgebildeten entstanden, es handelt sich bei ihnen allerdings um Momentaufnahmen, die aus einer Bewegung heraus - verhältnismäßig unge‐ post und in einem weniger kontrollierten Sitz - aufgenommen wurden. Der thematische Kontrast wird durch diese Bildzusammenstellung bereits deutlich nahegelegt und in der Caption als Realitätscheck ausbuchstabiert. Die unbearbei‐ teten Fotografien werden demnach als Dokumentation der adressierten Reality konstruiert, die hinzugefügten Hashtags wie #reallife verorten den Beitrag entsprechend: (6) […] Wieder mal ein kleiner Realitätscheck ✅ 2x Insta vs. 2x Reality […] (sara‐ huvm_120721) Körpersemantisierungen im #bodylove-Diskurs 245 <?page no="246"?> Techniken des Posens sind in ihrer Wirkung auf die Inszenierung des Kör‐ pers ein rekurrentes Thema (Abb. 9). Dabei folgt ein Großteil der Collagen einem Muster, was die Präsentation des Körpers anbelangt: Fotografien mit angewinkeltem und nach vorne geschobenem (rechten) Bein und ggf. nach hinten gestreckter Hüfte werden solchen mit geraden Beinen gegenübergestellt. Ebenso finden sich Fotografien in Sitzpositionen, in denen sich der Bauch (nicht) in Falten legt (Abb. 9 unten rechts, Abb. 10). - - Abb. 9: Posieren als Konstruieren (oben links: endlich_zufrieden_120322; oben rechts: milenka.emilia_210421; unten links: endlich_zufrieden_021120; unten rechts: nathalie.moves_081120) Sensibilisiert werden soll - allem Anschein nach - nicht nur für den Einfluss von Körperhaltung auf das fotografisch abgebildete Erscheinungsbild, womit zu‐ gleich vermeintliche Abnehm-Transformationen auf Instagram angesprochen sind. Auch wird mitunter in der Caption (etwa Beides ich, beides schön) oder in sprachlichen Bestandteilen auf dem Bild (z. B. still me, still happy, still loveable) eine positive Evaluation des eigenen Körpers als Stance-Objekt zum Ausdruck gebracht (zu letzterem Aspekt auch Abb. 10). Wiederkehrend treten evaluative Adjektive - wie worthy oder schön - wie auch um eine evaluative Dimension angereicherte Nomen wie Bikinifigur als lexikalische Stancemittel zu bildlich konstruierten Stance-Objekten (abgebildete Körper in verschiedenen Posen) hinzu. Dabei deuten Partikeln wie auch und engl. still auf den Umstand hin, dass die abgebildeten Körper als weniger wertvoll oder weniger einer Bikinifigur 246 Marie-Luis Merten <?page no="247"?> entsprechend angesehen werden könnten. In diesem Diskurs jedoch werden sie ungeachtet von society’s idea of beauty (Abb. 10 rechts oben) wertgeschätzt. - - Abb. 10: Sprachliche Evaluationen auf Collagen (oben links: rebeccachelbea_211120; oben rechts: nathalie.moves_241120; unten links: endlich_zufrieden_281221; unten rechts: dr.med.mareike.awe_100421) Mittels evaluativen Adjektiven können ebenso ästhetische und medizinisch-ge‐ sundheitliche Fremdzuschreibungen - von schön über ok bis hin zu dem in Form von Ausrufezeichen Nachdruck verliehenen ungesund - reflektiert werden (Abb. 10, unten links). In dem Fall dient die Caption der kontextuellen Extension. Sie klärt über eingegangene negative Kommentare auf und behandelt die aus ihnen ablesbaren Vorstellungen von schönen und (un)gesunden Körpern metadiskursiv. 5.3 „Früher vs. heute“: Veränderungen multimodal entwerfen Auch der Entwurf zeitlich verankerter Veränderungen folgt multimodalen Mus‐ tern. Postende präsentieren sich als Akteur: innen, die von einem körperlichen, aber auch mentalen Wandel gezeichnet sind. Collagen und Karussell-Posts dokumentieren u.-a. visuell zugängliche Veränderungen des Körpers (Abb. 11). Körpersemantisierungen im #bodylove-Diskurs 247 <?page no="248"?> Abb. 11: Körperliche Veränderung (links: jesswayoflife_231120; rechts: orchidea_luna_150322) Dabei werden verschiedene Phasen, die Einfluss auf die Gestalt des Körpers nehmen, in Form von gegenübergestellten Fotografien abgebildet und zum Stance-Objekt erhoben, etwa Schwangerschaft wie auch anders bedingte Ge‐ wichtsab/ -zunahmen. Frühere Zustände werden üblicherweise links, aktuellere rechts positioniert. Damit folgt die Darstellung einer gängigen Raum-Zeit-Me‐ tapher. Das Einnehmen von Fläche wird zur Erzählung von Zeit. Sprache kann in kontextualisierender Funktion auf dem Bild angebracht werden und bspw. den Schwangerschaftsfortschritt mittels Wochenangaben explizieren (Abb. 11 links). Ebenso tritt sie in einigen Fällen in evaluativer Funktion zum Abgebildeten als Stance-Objekt hinzu (Abb. 12). Dieses zweite Sprache-Bild-Muster ähnelt stark dem zuvor diskutierten Verknüpfungstyp (Kap. 5.2, Abb. 10). Allerdings erfolgt keine reflektierende Auseinandersetzung mit der Instagram-Praxis auf Metaebene. Vielmehr kommt der eigenen Entwicklung, die durch die Bildgegen‐ überstellung für die Rezipierenden sichtbar wird, größere Aufmerksamkeit zu. In der Caption treten vielfach längere Darlegungen des eigenen Werdeganges auf. Der Fokus richtet sich dabei wiederkehrend auf einen Einstellungswandel. - Abb. 12: Wandel körperlich und mental (links: endlich_zufrieden_100522; rechts: endlich_zufrieden_211020) 248 Marie-Luis Merten <?page no="249"?> Wird bildlich die körperliche Veränderung relevant gesetzt, so widmet sich die Sprache auf und neben dem Bild der mentalen Entwicklung. Bspw. wird mittels Beschriftungen des Bildes verdeutlicht, dass auch ein mehrgewichtiger Körper still beautiful ist (Abb. 11 rechts) und man nun im Gegensatz zu früher glücklich (Abb. 11 links) sei; hier findet eine Positionierung im Rückgriff auf explizite (adjektivische) Evaluationsmittel statt. In der Caption wird betont, dass man nun nicht mehr ganz so schlank sei, dafür aber - in der Folge eines Umdenkens - sehr zufrieden (endlich_zufrieden_211020). Entgegen einer vermeintlich erfolgrei‐ chen Selbstdisziplinierung, die in bestimmten körperzentrierten Diskursen „als Schlüssel für die Arbeit am Körper“ (Frommeld 2022: 31) betrachtet wird, werden demnach vielmehr die Arbeit an und der Fortschritt bzgl. der Perspektivierung und Akzeptanz des (eigenen) Körpers sowie körperlicher Veränderungen her‐ vorgehoben. Damit sind wesentliche Anliegen der #bodylove-Bewegung(en) adressiert. Die gemeinsame Haltung gegenüber dem eigenen wie auch fremden Körper wird als eine geteilte Position relevant gemacht. Mitunter illustrieren lediglich aktuelle Fotos einen solchen Wandel der Perspektive auf den eigenen Körper (Abb. 13). Die Instagramer: innen zeigen sich in der Jetzt-Situation, die bereits vom Erkennen des Selbstwertes geprägt ist. Es werden Bilder ausgewählt, in denen - dem subjektiven Eindruck der Postenden nach - bestimmte Körpermerkmale besonders anschaulich zur Geltung kommen (Abb. 13 rechts). - Abb. 13: Dokumentation der veränderten Einstellung zum eigenen Körper (beides: morenadiaz_060920) In Posts, die Körper- und Einstellungsveränderungen konstruieren, stehen Cap‐ tions vielfach im Dienste eines „früher vs. heute“-Storytellings (zu lexikalischen Mustern Tab. 5). Bilder, die einen Kontrast zwischen zeitlich unterschiedlich zu verortenden (Körper-)Zuständen konstruieren, können hinzutreten. In diesen Fällen lassen sich verschiedene Mittel der multimodalen Kohäsionsstiftung ausmachen (etwa auf dem linken/ rechten Foto, diese beiden Versionen von mir, Körpersemantisierungen im #bodylove-Diskurs 249 <?page no="250"?> hier seht ihr mich); sie sind allerdings nicht obligatorischer Bestandteil dieses multimodalen Positionierungsmusters. Lexikalische Marker: Vergangenheit früher (29), damals (14), jahrelang (9), vor A N Z A H L Z E I T E I N H E I T (z.-B. A N Z A H L Jahren (7)), lange Zeit (5) u.a. - transition point Lexikalische Marker: Gegenwart heute (92), jetzt (84), endlich (67), mittlerweile (7) u.a. Verben: anhören, ändern, aus‐ bremsen, belasten, bestrafen, schlecht denken, einreden, kaschieren, (Gedanken) ma‐ chen, protestieren, runtermachen, schämen, (nach Liebe) schreien, verändern, verdecken, verhüllen, vermeiden, verstecken, verwehren, weinen, zerbrechen -Nomen: Abnehmwahn, Angst, Cellulite-Creme, Diät, Druck, Fehler, Feinde, Filter, Kampf, knurrender Magen, Schwächen, Selbstzweifel, blöde Sprüche -Adjektive/ Partizipien: dünn genug, perfekt, undenkbar, un‐ wohl, verletzend -Ich verstand … -Mein halbes Leben habe ich gebraucht, um zu verstehen, dass …. -Heute verstehe ich erst, … -Aber das hat geholfen … - Verben: akzeptieren, aufhören, ermöglichen, feiern, genießen, (daran) glauben, lieben, (daraus Content) machen, tanzen, ver‐ dienen, wohlfühlen, wünschen, ze‐ lebrieren -Nomen: (knallige) Farben, Freunde, Liebe, (alte) Muster, Selbstbewusstsein, Visionen, Zu‐ kunft -Adjektive/ Partizipien: befreit, dankbar für, erleichtert, gesund, glücklich, (wunder-)schön, selbst‐ bewusst, sexy, stolz (auf mich), nicht mehr traurig - Tab. 5: Lexikalische Muster im „früher vs. heute“-Storytelling Eine Analyse und Gegenüberstellung sprachlich wiederkehrenden Materials in Erzählabschnitten, die Vergangenes konstruieren, sowie solchen, die Ge‐ genwärtiges thematisieren, legt offen, dass zurückliegende Erfahrungen mit dem eigenen Körper als stärker negativ behaftet entworfen werden (Tab. 5). Verben, Nomen sowie Adjektive, die in einem close reading der erzählenden Captions identifiziert werden konnten, deuten auf wesentliche Unterschiede des Früher- und Heute-Abschnittes hinsichtlich der Wahrnehmung von und des Umgangs mit dem eigenen Körper hin. Aus diesen lexikalischen Mustern lässt sich ein entsprechender Einstellungswandel sowie die (Konstruktion einer) empowernde(n) Versöhnung mit dem eigenen Körper ablesen, wie sie auch im Beleg (7) in den Vordergrund treten. (7) Früher haben sich [sic! ] solche Worte sehr getroffen, heute mache ich Content daraus (endlich_zufrieden_131120) 250 Marie-Luis Merten <?page no="251"?> Die Wahl der lexikalischen Mittel indiziert wesentliche retrospektiv konstru‐ ierte Unterschiede hinsichtlich der Wahrnehmung von und des Umgangs mit dem eigenen Körper im Früher und Heute. Den Übergangspunkt (transition point) mit Blick auf diesen Wandel der Perspektive markieren vielfach teilsche‐ matische Syntagmen, in denen das Erkenntnisverb verstehen eingelassen ist. Erst das Erkennen und Durchdringen des Zusammenhangs von Körperakzeptanz und (mentalem) Wohlbefinden ermöglichen eine entsprechende Neuperspekti‐ vierung und -positionierung zum eigenen Körper und Selbstwert. 6 Zusammenfassung Instagram-Posts stellen digitale Artefakte einer bildzentrierten Medienpraktik dar. Dennoch kommt auch Sprache auf dem Bild, das stets gewissen Layout-Mustern als modale Ressource folgt, sowie Sprache in Form von Cap‐ tions eine (bedeutende) Funktion im Zusammenspiel der verschiedenen semio‐ tischen Ressourcen zu. Die mit den Follower: innen geteilten Posts lesen sich als multimodal orchestrierte Hinweise darauf, als wen sich die Instagramer: innen in sozio-kultureller und medien-ästhetischer Hinsicht inszenieren. Die Posts lassen sich verschiedenen Typen der semantisch-logischen und formal-struk‐ turellen Verknüpfung zuordnen. Sowohl Bilder als auch Sprachbestandteile können in semantisch-logischer Hinsicht dominant sein. Ebenso finden sich Posts, in denen diese beiden Ressourcen ein stärker symmetrisches Verhältnis eingehen. Dass im Zusammenspiel von Bild(ern), Sprache auf dem Bild, Caption und Hashtags ein gewisses Maß an Redundanz entsteht, trägt der multimodalen Kohärenzbildung bei und verleiht Positionierungen mitunter Nachdruck. Der Fokus wurde entsprechend der pragmatischen Schwerpunktsetzung des Beitrags auf Instagram-Posts als Positionierungsformat gerichtet, dies ins‐ besondere im thematischen Zusammenhang digitaler Körperkommunikation. Hierbei stehen die Reflexion von sowie das Positionieren zu Stance-Objekten wie Körpern, körperlichen Veränderungen und Körperwahrnehmung im Mit‐ telpunkt. Kommunikative Anliegen, die multimodal verfolgt werden, sind u. a. das Sensibilisieren für die Wirkung von Bearbeitungs- und Posing-Techniken auf die Inszenierung von Körpern sowie das Rekontextualisieren und Erzählen der eigenen Entwicklung hin zu einer körperwertschätzenden Position. Genutzt werden hierzu u. a. Collage- und Karussell-Posts, in denen ein bildlich entwor‐ fener Kontrast von sprachlichen Bestandteilen kotextuell erweitert wird. Als zentrales Ergebnis des multimodal-pragmatischen Zugangs ist nicht nur deut‐ lich geworden, dass im Zuge multimodaler Stance-Akte verschiedene semioti‐ sche Zeichenmodalitäten zum Entwerfen, Evaluieren und zur kommunikativ an‐ Körpersemantisierungen im #bodylove-Diskurs 251 <?page no="252"?> einander ausgerichteten Positionierung zu Stance-Objekten beitragen, sondern ebenso, dass Bilder vor allem dem Hervorbringen von Stance-Objekten dienlich sind und Sprachbestandteile primär den evaluativen Part übernehmen. Zudem - eine weitere wesentliche Beobachtung - trägt das funktionale Miteinander der verschiedenen Modes zu einer Komplexisierung des Stance-Aktes bei: Vielfach lassen sich mehrere Stance-Objekte ausmachen, der Gegenstand/ Sachverhalt, zu dem sich die Postenden positionieren, scheint komplex und multiperspektivisch entworfen. Eine Pragmatik, die konsequent die Multimodalität des kommuni‐ kativen Alltags berücksichtigt, hat sich nicht nur einem vielfach musterhaft orchestrierten Mehr an Modalitäten, sondern ebenso einer Vielschichtigkeit und potenziellen Mehrdeutigkeit bzw. Polyfunktionalität im Kontext pragmati‐ scher Phänomene zu widmen. Insgesamt trägt der Beitrag zu einem besseren Verständnis von multimodalen Positionierungsformaten in den sozialen Medien bei. Literatur Archer, Dawn/ Culpeper, Jonathan (2018). Corpus annotation. In: Jucker, Andreas H./ Schneider, Klaus P./ Bublitz, Wolfram (Hrsg.). Methods in Pragmatics. Berlin/ New York: De Gruyter, 495-525. Barron, Ashley M./ Krumrei-Mancuso, Elizabeth J./ Harriger, Jennifer A. (2021). The effects of fitspiration and self-compassion Instagram posts on body image and self-compassion in men and women. Body Image 37, 14-27. Barton, David/ Lee, Carmen (2013). Language online. Investigating Digital Texts and Practices. London/ New York: Routledge. Barthes, Roland (1964/ 1977). The rhetoric of the image. In: Barthes, Roland (Hrsg.). Image - Music - Text. London: Fontana, 32-51. Borkenhagen, Ada (2021). Snapchatdysmorphophobie - Wie digitale Medien die Wahr‐ nehmung unseres Körpers verändern. In: Treiber, Angela/ Wenrich, Rainer (Hrsg.). Körperkreativitäten. Gesellschaftliche Aushandlungen mit dem menschlichen Körper. Bielefeld: Transcript, 143-149. Bucholtz, Mary/ Hall, Kira (2016). Embodied sociolinguistics. In: Coupland, Nikolas (Hrsg.). Sociolinguistics: Theoretical debates. Cambridge: Cambridge University Press, 173-197. Butler, Judith (2021). Körper von Gewicht. 11. Auflage. Frankfurt a.M.: Suhrkamp. Caple, Helen (2013). Photojournalism: A social semiotic approach. Basingstoke: Palgrave Macmillan. Caple, Helen (2019). “Lucy says she is a Labradoodle”: How the dogs-of-Instagram reveal voter preferences. Social Semiotics 29 (4), 427-447. 252 Marie-Luis Merten <?page no="253"?> Caple, Helen (2020). Image-Centric Practices on Instagram. Subtle Shifts in ‘Footing’. In: Stöckl, Hartmut/ Caple, Helen/ Pflaeging, Jana (Hrsg.). Shifts toward Image-Centricity in Contemporary Multimodal Practices. New York/ London: Routledge, 153-176. Cohen, Rachel/ Fardouly, Jasmine/ Newton-John, Toby/ Slater, Amy (2019). #BoPo on Instagram: An experimental investigation of the effects of viewing body positive content on young women’s mood and body image. New Media & Society 21 (7), 1546-1564. Coupland, Justine/ Coupland, Nikolas (2009). Attributing Stance in Discourses of Body Shape and Weight Loss. In: Jaffe, Alexandra (Hrsg.). Stance. Sociolinguistic Perspec‐ tives. Oxford: Oxford University Press, 227-249. Davies, Bryony/ Turner, Mark/ Udell, Julie (2020). Add a comment … how fitspiration and body positive captions attached to social media images influence the mood and body esteem of young female Instagram users. Body Image 33, 101-105. De Fina, Anna (2013). Positioning level 3: Connecting local identity displays to macro social processes. Narrative inquiry 23 (1), 40-61. Deppermann, Arnulf (2001). Gesprächsanalyse als explikative Konstruktion - Ein Plä‐ doyer für eine reflexive ethnomethodologische Konversationsanalyse. In: Iványi, Zsuzsanna/ Kertész, András (Hrsg.). Gesprächsforschung. Tendenzen und Perspek‐ tiven. Frankfurt a.-M. u.a.: Lang, 43-73. Du Bois, John W. (2007). The stance triangle. In: Englebretson, Robert (Hrsg.). Stance‐ taking in Discourse. Subjectivity, evaluation, interaction. Amsterdam/ Philadelphia: John Benjamins, 139-182. Evens, Ornella/ Sutterheim, Sarah E./ Alleva, Jessica M. (2021). Protective filtering: A qualitative study on the cognitive strategies young women use to promote positive body image in the face of beauty-ideal imagery on Instagram. Body Image 39, 40-52. Frommeld, Debora (2022). Vom guten Leben in einer Bildergesellschaft. Selbstoptimie‐ rung und Selbstvermessung als Kennzeichen moderner Gesellschaften. In: Dalski, Loreen/ Flöter, Kirsten/ Keil, Lisa/ Lohse, Kathrin/ Sand, Lucas/ Schülein, Annabelle (Hrsg.). Optimierung des Selbst. Konzepte, Darstellungen und Praktiken. Bielefeld: Transcript, 29-51. Georgakopoulou, Alexandra (2016). From narrating the self to posting self(ies): A small stories approach to selfies. Open Linguistics 2, 300-317. Georgakopoulou, Alexandra/ Iversen, Stefan/ Stage, Carsten (2020). Quantified Storytel‐ ling. A Narrative Analysis of Metrics on Social Media. Aarhus/ London: Springer Nature. Halliday, Michael A. K./ Hasan, Ruqayia (1994). Cohesion in English. London: Routledge. Jaffe, Alexandra (2009). Introduction: The Sociolinguistics of Stance. In: Jaffe, Alexandra (Hrsg.). Stance: Sociolinguistic Perspectives. New York: Oxford University Press, 3-28. Körpersemantisierungen im #bodylove-Diskurs 253 <?page no="254"?> Jones, Rodney H./ Hafner, Christoph A. (2021). Understanding Digital Literacies. A Practical Introduction. 2. Auflage. London: Routledge. König, Katharina (2019). Stance taking with ‘laugh’ particles and emojis - Sequential and functional patterns of ‘laughter’ in a corpus of German WhatsApp chats. Journal of Pragmatics 142, 156-170. Kress, Gunther R. (2003). Literacy in the new media age. London: Routledge. Kress, Gunther R. (2010). Multimodality. A social semiotic approach to contemporary communication. London: Routledge. Leech, Geoffrey (1997). Introducing corpus annotation. In: Garside, Roger/ Leech, Geoffrey/ McEnery, Anthony (Hrsg.). Corpus Annotation: Linguistic Information from Computer Text Corpora. London: Longman, 1-17. Locher, Miriam A./ Bolander, Brook (2017). Face work and identity. In: Hoffmann, Christian R./ Bublitz, Wolfram (Hrsg.). Pragmatics of Social Media. Berlin/ Boston: De Gruyter, 407-434. Lucius-Hoene, Gabriele/ Deppermann, Arnulf (2004). Narrative Identität und Positionie‐ rung. Gesprächsforschung Online 5, 166-183. Matley, David (2020). „I can’t believe #Ziggy #Stardust died“: Stance, fan identities and multimodality in reactions to the death of David Bowie on Instagram. Pragmatics 30 (2), 247-276. Merten, Marie-Luis (2022). Ritualisierte Anschlusskommunikation auf Instagram. For‐ melhafte Komplimente und ihre Erwiderung als Online-Interaktion. Deutsche Sprache 50 (4), 309-334. Müller, Marion/ Geise, Stephanie (2015). Grundlagen der Visuellen Kommunikation. Theorieansätze und Analysemethoden. 2. Auflage. Konstanz: UTB. Norris, Sigrid (2014). Modal density and modal configurations. In: Jewitt, Carey (Hrsg.). The Routledge Handbook of Multimodal Analysis. London/ New York: Routledge, 86-99. Nymoen, Ole/ Schmitt, Wolfgang M. (2021). Influencer: Die Ideologie der Werbekörper. Frankfurt a.M.: Suhrkamp. Pflaeging, Jana (2020). On the Emergence of Image-Centric Popular Science Stories in National Geographic. In: Stöckl, Hartmut/ Caple, Helen/ Pflaeging, Jana (Hrsg.). Shifts toward image-centricity in con-temporary multimodal practices. London/ New York: Routledge, 97-122. Plewa, Moritz (2021). Me, My Selfie and I. Eine Genealogie digitalfotografischer Prak‐ tiken. Digitale Praktiken. Mittelweg 36. Zeitschrift des Hamburger Instituts für Sozialforschung 30 (1), 15-39. Siromaa, Maarit/ Rauniomaa, Mirka (2021). Stance and evaluation. In: Haugh, Mi‐ chael/ Kádár, Daniel Z./ Terkourafi, Marina (Hrsg.). The Cambridge handbook of Sociopragmatics. Cambridge: Cambridge University Press, 95-116. 254 Marie-Luis Merten <?page no="255"?> Spitzmüller, Jürgen/ Flubacher, Mi-Cha/ Bendl, Christian (2017). Soziale Positionierung: Praxis und Praktik. Einführung in das Themenheft. Wiener Linguistische Gazette 81, 1-18. Stöckl, Hartmut (2016). Multimodalität - Semiotische und textlinguistische Grundlagen. In: Klug, Nina-Maria/ Stöckl, Hartmut (Hrsg.). Handbuch Sprache im multimodalen Kontext. Berlin/ Boston: De Gruyter, 3-35. Stöckl, Hartmut (2020a). Multimodality and mediality in an image-centric semiosphere - A rationale. In: Thurlow, Crispin/ Dürscheid, Christa/ Diémoz, Federica (Hrsg.). Visualizing Digital Discourse. Interactional, Institutional and Ideological Perspectives. Berlin/ Boston: De Gruyter, 189-202. Stöckl, Hartmut (2020b). Image-Centricity - When Visuals Take Center Stage: Analyses and Interpretations of a Current (News) Media Practice. In: Stöckl, Hartmut/ Caple, Helen/ Pflaeging, Jana (Hrsg.). Shifts toward image-centricity in contemporary multi‐ modal practices. London/ New York: Routledge, 19-41. Stöckl, Hartmut/ Caple, Helen/ Pflaeging, Jana (Hrsg.) (2020). Shifts toward image-cent‐ ricity in contemporary multimodal practices. London/ New York: Routledge. Stöckl, Helmut/ Pflaeging, Jana (2022). Multimodal Coherence Revisited: Notes on the Move From Theory to Data in Annotating Print Advertisements. Frontiers in Com‐ munication 7.900994, 1-17. Tiggemann, Marika/ Anderberg, Isabella/ Brown, Zoe (2020). #Loveyourbody: The effect of body positive Instagram captions on women’s body image. Body Image 33, 129-136. Valeiras-Jurado, Julia/ Bernad-Mechó, Edgar (2022). Modal density and coherence in science dissemination: Orchestrating multimodal ensembles in online TED talks and youtube science videos. Journal of English for Academic Purposes 58.101118. Warfield, Katie/ Abidin, Crystal/ Cambre, Carolina (2020). Mediated Interfaces. The Body on Social Media. New York: Bloomsbury Academic. Weinrich, Harald (2001). Tempus. Besprochene und erzählte Welt. 6. Auflage. München: C.H. Beck. Yus, Francisco (2019). Multimodality in Memes: A Cyberpragmatic Approach. In: Bou-Franch, Patricia/ Garcés-Conejos Blitvich, Pilar (Hrsg.). Analyzing Digital Dis‐ course. New Insights and Future Directions. Cham/ Schweiz: Palgrave Macmillan, 105-131. Zappavigna, Michele (2011). Ambient affiliation: A linguistic perspective on Twitter. New Media & Society 13 (5), 788-806. Zappavigna, Michele (2017). Evaluation. In: Hoffmann, Christian R./ Bublitz, Wolfram (Hrsg.). Pragmatics of Social Media. Berlin/ Boston: De Gruyter, 435-458. Zappavigna, Michele/ Ross, Andrew S. (2021). Instagram and intermodal configurations of value: Ideology, aesthetics, and attitudinal stance in #avotoast posts. Internet Pragmatics 5 (2), 197-226. Körpersemantisierungen im #bodylove-Diskurs 255 <?page no="256"?> Zhao, Sumin/ Zappavigna, Michele (2018). Beyond the self: Intersubjectivity and the social semiotic interpretation of the selfie. New Media & Society 20 (5), 1735-1754. 256 Marie-Luis Merten <?page no="257"?> Vom kommunikativen Phänomen zum gesellschaftlichen Problem Wie Antisemitismus durch Memes viral wird Marcus Scheiber, Hagen Troschke & Jan Krasni Abstract: Environmental mediatisation and digitalisation generate new ways of semiotic patterns and innovative information delivery. Memes are one kind of these new communication formats. Each individual meme is i) to be regarded as the sedimentation of a discursive production process in the form of narratively pre-structured communication offers, ii) manifests itself as a multimodal structure that contributes to a crystallisation and a reformulation of the values or concepts existing in collective memory and iii) is based on collective semiosis processes that find their origin in current social practices of society. Memes can be used by all kind of actors, also those who hold antisemitic beliefs. Hence, memes are also used in order to promote aspects of antisemitic world views within digital communication and can achieve such a degree of dissemination through virality that they enter the mainstream. Consequently, this article aims to explore the discourse-semiotic conditioned virality of the antisemitic Happy Merchant-Meme as an expression of the normative re-semiotisation strategies of actors within digital communication spaces. Keywords: memes, antisemitism, anti-semitism, virality, multimodality, Happy Merchant 1 Einleitung Während sich die im Alltag fest etablierten digitalen Kommunikationsformen als ein pluralistisches Instrumentarium von unbegrenzten Möglichkeiten der Meinungsdistribution gestalten, zeigt sich, dass sie ebenfalls als Brutstätte men‐ <?page no="258"?> 1 Die Radikalisierungsprozesse in den „Echo-Chambers“ der digitalen Kommunikation beschränken sich nicht auf antisemitische Weltbilder, sondern umschließen alle Formen der gruppenbezogenen Diskriminierung (Runkehl 2013: 59 f.). Diese Radikalisierungen finden aber unabhängig von einer Ideologie statt und sind ein medienspezifisches soziales Phänomen. 2 Auch wenn antisemitische Memes keinen (allzu) beträchtlichen Anteil an beliebten Memes ausmachen, lassen sich diese dennoch in so großer Zahl identifizieren, dass ihnen eine kommunikative Realität zukommt, welche zumindest in Hinblick auf die Etablierung und Verbreitung von Antisemitismus relevant ist. Hinzu kommt, dass hasserfüllte (und somit auch antisemitische) Memes ein wichtiger Bestandteil der Kommunikation von Fringe Communities sind. schenverachtender Ideologien nutzbar gemacht werden können: So erwächst aus der Mediatisierung und Digitalisierung unserer Lebenswelt auch eine zu‐ nehmende Verbreitung - und Normalisierung - antisemitischer Vorstellungen, wenn Stereotype und andere Topoi sowohl durch explizite als auch implizite multimodale Zeichenhandlungen ihren Eingang in gesellschaftliche Debatten (online) finden. Antisemitische Vorstellungen manifestieren sich in digitalen Kommunikationsräumen und treffen auf weltweiter Ebene in unzähligen Reso‐ nanzräumen auf Bestätigung. 1 Vor diesem Hintergrund zielt dieser Beitrag da‐ rauf aufzuzeigen, wie Memes über virale Mechanismen normativ Verwendung finden, um antisemitische Vorstellungen innerhalb digitaler Kommunikation zu etablieren. 2 Derjenige Bedeutungsinhalt, der einem Meme zugeschrieben wird, richtet sich dabei nach den geltenden Werten der jeweiligen diskursiven Wissensge‐ meinschaft. Denn die Produktion und Rezeption eines Memes unterliegen den Regeln des betreffenden Diskurses: Die Organisation der Zeichenhandlungen eines konkreten multimodalen Artefaktes ist von den diskursiv konventiona‐ lisierten (kommunikativen) Handlungsabläufen abhängig. Das antisemitische Meme realisiert eine kommunikative Ereignisstruktur, welche vor dem Hinter‐ grund seiner medialen Einbettung einen Einblick in die diskursiven Strategien der Akteur: innen zu eröffnen vermag: Für die Konstitution einer bestimmten (antisemitischen) Wirklichkeit bzw. die Codierung bestimmter Vorstellungen im kulturellen Gedächtnis offenbaren sich die bereitgestellten Handlungsimplika‐ tionen auf der Darstellungsebene als durch den Diskurs bzw. seine Akteur: innen vorgegebene Interpretationsmuster. „Memes are about making a point - parti‐ cipation in a normative debate about how the world should look and the best way to get there“ (Shifman 2013: 120). Gerade die agitatorischen Kommunikations‐ strategien von Akteur: innen antisemitischer Couleur geben ein eindrucksvolles Zeugnis davon, dass auch durch Memes der Versuch unternommen wird, normativ auf Diskurse einzuwirken. Denn über den Gebrauch von Memes 258 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="259"?> 3 Viralität stellt kein notwendiges Merkmal von Memes dar, insofern sich die Genese eines Memes nicht allein aus der Imitation, sondern aus der Imitation und Variation speist (Shifman 2013: 56). Zugleich können Memes durchaus viral werden und dadurch einer breiteren Öffentlichkeit zugänglich werden, was wiederum zur Verbreitung von Antisemitismus beiträgt. 4 Wir weisen darauf hin, dass der Artikel im Folgenden antisemitisches Bildmaterial beinhaltet. konstatieren jene Akteur: innen einen vermeintlichen Ist-Zustand und richten zugleich eine implizite Handlungsaufforderung an die Rezipient: innen, sich im Sinne einer antisemitischen Weltanschauung gegen diesen Ist-Zustand zu engagieren. Im Zuge dessen kann sich das Moment der Viralität - verstanden als Verbreitungskaskade, die sich auf semiotische, kommunikative und kognitive Praktiken gründet - als eine relevante Bedingung des Erfolgs eines bestimmten antisemitischen Memes erweisen. 3 Denn Viralität ist als eine metapragmatische Strategie zu verstehen (Blommaert 2015), die sich im Spannungsfeld der (dis‐ kurs-)semiotischen Qualitäten eines Memes und den Handlungsroutinen der User: innen bewegt, die von der Nutzung der plattformspezifischen Funktionen der Verbreitbarkeit (Spreadability) profitieren (Marino 2015). Vor diesem Hintergrund sucht die Analyse viraler Memes, die normativen Praktiken aufzuzeigen, welche innerhalb digitaler Kommunikation einen Raum für diffamierende, diskriminierende und hasserfüllte multimodale Zeichen‐ handlungen schaffen. Denn diese erlangen sowohl in qualitativer Hinsicht (Formenreichtum von antisemitischen Konzepten) als auch in quantitativer Hinsicht (Verbreitung und Zugänglichkeit dieser Formen) eine neue Dimension. Memes werden somit nicht ausschließlich als kommunikatives Phänomen, sondern als Ausdruck gesellschaftlicher Dynamiken betrachtet. Den Ausgangspunkt des Beitrags bildet eine Darstellung der wesentlichen Charakteristika sowie der Produktions- und Rezeptionsbedingungen des mul‐ timodalen Kommunikationsformates Meme. Daran anschließend werden die kommunikativen Bedingungen und die Vollzugswirklichkeit von Viralität be‐ trachtet. Eine kurze Einführung zu antisemitischen Topoi und deren Funktionen bildet schließlich den Übergang zur beispielhaften Analyse von antisemitischen Memes. Innerhalb derselben soll aufgezeigt werden, auf welche Art und Weise über das virale Happy Merchant-Meme antisemitische Weltbilder innerhalb des Diskurses um den Ukraine-Krieg verbreitet, gestärkt oder etabliert werden sollen. 4 Vom kommunikativen Phänomen zum gesellschaftlichen Problem 259 <?page no="260"?> 5 „Von einem Internet-Meme spricht man eigentlich erst dann, wenn sowohl der Variati‐ onsgrad als auch die Anzahl der Verbreitung dermaßen zunimmt und einen bestimmten ‚Tipping Point‘ […] überschritten hat, dass die Quantität der Verbreitung für die beobachtenden Internetnutzer als Trend wahrgenommen wird“ (Breitenbach 2015: 36). 2 Memes: Ein multimodales Kommunikationsformat Das Kommunikationsformat Meme offenbart sich zum einen als dynamisches Moment und zum anderen als mögliche Konsequenz der vielfältigen semio‐ tischen und medialen Möglichkeiten, welche das Internet offeriert. Indem dieses nämlich kollaborative Praktiken zur Teilhabe am gesellschaftlichen Ge‐ schehen ermöglicht und zugleich „relativ niedrige Barrieren zur Teilnahme an verschiedentlichen Online-Kommunikationspraxen“ (Merten/ Bülow 2019: 197) aufweist, konstituieren sich Memes als Kommunikationsformate, welche als kommunikative Schablonen für soziale Interaktion online fungieren. Memes als Kommunikationsformate zu erfassen, bedeutet zunächst diese ganz allgemein als Muster semiotischer Ressourcen zu verstehen mit denen „die spezifischen Möglichkeiten und Grenzen der [jeweiligen] Kommunikation“ (Klemm/ Michel 2014: 188) aufgezeigt werden. So lassen sich Memes als medial tradierte Muster multimodalen Zeichenhandelns beschreiben, die sich durch i) kollektive Semi‐ oseprozesse ( Johann/ Bülow 2019), ii) Möglichkeiten der Re-Semiotisierung (Iedema 2003), iii) eine funktionale Matrix der Produktionsbedingungen und Rezeptionsmöglichkeiten, iv) eine Familienähnlichkeit der einzelnen Exemp‐ lare und v) diskurssemantische Netzwerkstrukturen auszeichnen. Ausgehend von dieser Auflistung formaler Eigenschaften, (diskurs-)semiotischer Voraus‐ setzungen und pragmatischer Nutzungsmöglichkeiten ist die prototypische Erscheinungsform eines Memes als Sprache-Bild-Gefüge zu bestimmen, das innerhalb seiner konkreten Erscheinungsform eine funktional organisierte Komposition der partizipierenden Zeichenhandlungen realisiert. Memes entstehen über kollaborative Bedeutungskonstruktionen durch die Teilhabe verschiedener und zumeist unbestimmter Akteur: innen (i), welche aus einem singulären Artefakt über Re-Semiotisierungen (Reproduktion, Imitation und Variation) ein wiederkehrendes multimodales Muster generieren (ii) (Klug 2023: 206). 5 Diese Sprache-Bild-Gefüge zeichnen sich durch eine immanente Musterhaftigkeit aus. Zugleich geht die wechselseitige Integration der betei‐ ligten Zeichenmodalitäten mit einer „Reduktion von Informationskomplexität“ (Breitenbach 2015: 37) einher, d. h. einer strukturellen wie inhaltlichen Einfach‐ heit. In der Folge tritt das einzelne Sprache-Bild-Gefüge den Rezipient: innen als ein mehrdeutiger Erlebnisraum entgegen, innerhalb dessen die wechselseitige Integration der Zeichenhandlungen eine emergente Bedeutung generiert. Damit 260 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="261"?> die intendierte Lesart eines Memes abgeleitet werden kann, stellen Memes auf der Darstellungsebene Interpretationsmuster für den Rezeptionsprozess bereit, welche sowohl regulatorisch im Hinblick auf die pragmatische Verwendbarkeit als auch selektiv im Hinblick auf die Nutzung der semiotischen Ressourcen für die jeweiligen Arrangements wirken. Denn das produktive Wechselspiel der Zeichenhandlungen legt innerhalb des Memes „musterhaft bestimmte Bedeu‐ tungspotenziale [nahe], nach denen sich die Produzenten […] und Rezipienten richten“ (Fraas et al. 2012: 17). Memes errichten also „gemeinsame Sphären kulturellen Wissens“ (Breitenbach 2015: 45), sodass sie durch Rezipient: innen, welche aufgrund ihrer Mediensozialisation mit dem Kommunikationsformat vertraut sind, decodiert werden (können). Anders formuliert: Die Produktion eines Memes unterliegt einer funktionalen Matrix, die einen Rahmen für semantische sowie pragmatische Strukturierungs‐ entscheidungen vorgibt, sodass in der Konsequenz auch die Rezeption durch das Kommunikationsformat limitiert ist (iii). Denn sowohl die Produktion als auch die Rezeption eines Memes stehen in Abhängigkeit - nebst dem Weltwissen - zum Wissen der jeweiligen Kommunikationsteilnehmer: innen um die Relationen zu anderen Sprache-Bild-Gefügen des gleichen Musters. Sie stehen also in Abhängigkeit zu der typischerweise erwarteten Korrelation zwischen den bildlichen und sprachlichen Zeichenhandlungen desselben Mus‐ ters. Die Bedeutungskonstitution eines Memes vollzieht sich somit auch über die Familienähnlichkeit der einzelnen Artefakte (iv) und offenbart darin eine diskurssemantische Verweisstruktur zwischen den einzelnen Elementen. Man betrachte folgende Beispiele: Abb. 1: Galaxy Brain - Abb. 2: Galaxy Brain Vom kommunikativen Phänomen zum gesellschaftlichen Problem 261 <?page no="262"?> Aus der vertikalen Anordnung der bildlichen und sprachlichen Elemente so‐ wohl in Abb. 1 als auch in Abb. 2 erwächst eine konsekutive Interpretation der dargestellten Inhalte, die sich zudem durch ein Moment der Steigerung auszeichnen. Während diese Steigerung in Abb. 1 zum einen in der (fiktiven) syntaktischen Erweiterung des Ausdrucks who sowie der Illumination der abgebildeten Schädel und zum anderen in der Korrelation dieser sprachlichen und bildlichen Darstellungen ihre Umsetzung erfährt, vermag Abb. 2 diese Interpretation über entsprechende Ellipsen zu evozieren. So rekurrieren die gebrauchten Verknüpfungsmuster zwischen sprachlichen und bildlichen Zei‐ chenhandlungen in Abb. 2 metakommunikativ auf das Wissen um die pro‐ totypischen Realisierungsmöglichkeiten des Memes in Abb. 1 und nehmen damit Bezug auf die Wissensbestände und kommunikativen Erwartungen des Rezipienten an das Kommunikationsformat. Demnach kann Abb. 2 ebenfalls als Steigerung interpretiert werden, obschon sprachliche und bildliche Ellipsen gesetzt wurden. Folglich ist festzustellen, dass wiederkehrende Kompositionsbzw. Verknüpfungsmuster ganz bestimmte Nutzungspraktiken sowie kommu‐ nikative Handlungsmuster im Meme sowohl forcieren als auch restringieren. Memes und deren Realisierungsmöglichkeiten sind als Ausdruck diskursiver Praktiken zu verstehen, insofern die Organisation der Elemente in einem Sprache-Bild-Gefüge Aufschluss über die diskursive Praxis geben, in welcher sich jene bewegen: „At all points, design realizes and projects social orga‐ nisation and is affected by social and technological change“ (Kress 2010: 139). So aktualisiert die Organisation der einzelnen Zeichenmodalitäten zum einen kommunikative Handlungsstrukturen, konstituiert zum anderen soziale Bezüge durch Kompositionsmuster und realisiert kommunikative Funktionali‐ täten durch die Verbindung oder Trennung von kommunikativen Elementen (Kress/ van Leeuwen 2006: 177). Indem sich Akteure nun unterschiedlichster Memes bedienen, um Bedeu‐ tungsinhalte zu konstituieren, präsentiert sich das Kommunikationsformat Meme als diskursive Praktik der Wissensgenerierung: First, memes may best be understood as pieces of cultural information that pass along from person to person, but gradually scale into a shared social phenomenon. Although they spread on a micro basis, their impact is on the macro level: memes shape the mindsets, forms of behaviour, and actions of social groups (Shifman 2013: 18). Memes sind also als Sedimentierung eines diskursiven Produktionsprozesses zu betrachten. Denn die Kontextualisierung eines Memes darf nicht auf intrase‐ miotische Bezugsstellen innerhalb des Sprache-Bild-Gefüges reduziert werden. So besitzen Memes einen weiteren Skopus als diese Relationen, indem „sie 262 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="263"?> 6 Auch wenn dieses Konzept auf den ersten Blick hinter der biologistischen Metaphorik die Agentivität der realen Autoren (Nutzer: innen) von Content-Beiträgen verschleiert, wird in der Forschung davon ausgegangen, dass es hier um eine objektive und wiederholbare Eigenschaften der Darstellung geht. Wegen der Fülle an Nutzer: innen und Akteur: innen verschiedener viraler Kampagnen, die oft nicht erfolgreich sind, und des häufigen Erfolgs jener Inhalte, die nicht durch Kampagnen getragen, sondern von [das einzelne Meme] transzendieren und […] Diskurse als Zugriffsformat für die Ableitung möglicher [Memes] ansetzen“ (Wrede 2013: 120). In der Konsequenz, dass nun die unterschiedliche inhaltliche Gestaltung eines Memes Interpretationen unterliegt, welche von Hypothesen über die Kontextualisie‐ rung der verwendeten Prädikationen im Diskurs entscheidend mitgestaltet sind, vollzieht sich die Bedeutungskonstitution als ein Prozess der doppelten Emergenz: Das multimodale Artefakt muss als solches decodiert sowie die daraus resultierenden Interpretationsmuster in Relation zur Rahmenstruktur des Kommunikationsformates gesetzt werden. Das einzelne Meme wird somit als ein punktuelles Ereignis aktualisiert, welches als Zeichengefüge mit einer kommunikativen Funktion in sich Bedeutung trägt, aber im Prozess der Rezep‐ tion als Kommunikationsformat eine flächige Bedeutung aufweist, die eine diskurssemantische Netzwerkstruktur (v) und eine damit einhergehende explo‐ rative Semantik offenbart: Bedingung ihrer Konstitution ist die Relation zu anderen Memes des gleichen Musters. Indem die Genese sowie die Interpretation eines Memes den kommunikativen Bedingungen digitaler Kommunikation - Schnelllebigkeit, Anonymität, Mehr‐ dimensionalität, Amalgamierung der Teilnehmerrollen sowie Multimodalität im Sinne inter- und intrasemiotischer Referenzstrukturen - unterliegen und Memes in der Auseinandersetzung mit den habitualisierten Nutzungspraktiken der Netzgemeinde in diskursiv entwickelten multimodalen Handlungsmustern aktualisiert werden, können sie für die verschiedensten Zwecke und Hand‐ lungen nutzbar gemacht werden. 3 Viralität: Infektiöse Inhalte im Internet Hasserfüllte und darunter antisemitische multimodale Inhalte erfahren über digitale Kommunikationsformen plattform- und diskursübergreifend eine neue Welle der Verbreitung, die in der Kommunikation- und Medienwissenschaft, sowie in einem Zweig der Marketing Studies mit dem Konzept der Viralität beschrieben wird. Viralität (virality) bezeichnet etwas vereinfacht jene Dar‐ stellungsformen, die viele Menschen ansprechen und dazu bringen, diese zu reproduzieren und insofern „ansteckend“ (contagious) wirken. 6 Sie wird als Vom kommunikativen Phänomen zum gesellschaftlichen Problem 263 <?page no="264"?> „normalen“ Nutzer: innen stammen, wurde die Viralität als eine besondere Qualität der digitalen Inhalte bzw. Kommunikate (im Sinne von nutzergenerierten kommunikativen Einheiten, die der Plattforminfrastruktur eigen sind) verstanden. Diese Qualität bzw. die Faktoren deren Erscheinung galt und gilt es sowohl qualitativ (Sampson 2012, Gonzales Hernandez et al. 2019) als auch quantitativ (Weng et al. 2013; Ling et al. 2021) überwiegend interdisziplinär zu erforschen, ohne sie aber disziplingerecht spezifiziert wirklich definieren zu können oder oft gar zu wollen. 7 Da Memes dieserart in einem Bottom-Up-Prozess in Online-Communitys durch die Partizipation der einzelnen User: innen über gemeinsame Aktivitäten entstehen, haben sie gleichzeitig eine entscheidende Rolle bei der Politisierung dieser User: innen (siehe hierzu Simons 2016). Aus eben diesem Grund sind die antisemitisch aufgeladenen Memes Gegenstand unserer Analyse. eine Qualität der Kommunikate begriffen, die sich aus der Perspektive der Pragmatik beschreiben lässt (Blommaert 2015; Blommaert/ Varis 2015). Diese kommunikative Qualität von Online-Inhalten wird von den User: innen für die Konstruktion ihrer Subjektposition beim (Inter-)Agieren durch Anwendung bestimmter (plattformimmanenter) Techniken der Verbreitung angestrebt. Da dies vor allem durch Imitation und Variation von formalen Charakteristika von bereits viral verbreiteten Inhalten erfolgt, liegt der Schwerpunkt einer pragmatisch ausgerichteten Analyse von Viralität darauf, diese Techniken der Verbreitung und deren verschiedene Anwendungen unter den spezifischen Bedingungen der multimodalen Online-Interaktion beschreibend und im inter‐ aktiven Zusammenhang zu analysieren. Wie im vorherigen Kapitel dargestellt wurde, kann ein Sprache-Bild-Gefüge erst dann als Meme bezeichnet werden, wenn es über die Online-Praktiken der User: innen im Sinne von „Aggregation, Kuration und Archivierung“ einen gewissen Verbreitungsgrad erreicht hat (Simons 2016). 7 Diese Praktiken sind an die Infrastruktur der Kommunikation gebunden, denn nur darin können sie durchgeführt werden - man darf nicht vergessen, dass Memes der Kultur der sozialen Medien eigen sind. Durch Kommunikationspraktiken, die den Ideologien der jeweiligen Community und der Kommunikationsinfrastruktur inhärent sind, wird ein Meme oder ein Element davon in der Kommunikation etabliert und verbreitet. In dieser Sicht ist Viralität auch in einem Zusammen‐ hang von kommunikativen und infrastrukturbedingten Nutzungspraktiken zu verstehen - die alle plattformimmanent sind. Anders gesagt, können weder Memes noch Viralität ohne ein Verständnis über die Infrastruktur, welche ihre Verbreitung ermöglicht, verstanden bzw. erklärt werden. Insofern kann von einem viralen Kommunikat gesprochen werden, wenn die multimodale Einheit in den verschiedensten Milieus einer Kommunikations-Infrastruktur reproduziert wird. Die Voraussetzung ihrer ansteckenden Qualität wird durch 264 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="265"?> 8 Eine tiefere Beschreibung der Plattformen würde den Rahmen dieses Textes sprengen. Deswegen sei hier darauf hingewiesen, dass die Plattformen hier im Sinne eines kommunikationsformenden Mediumdispositivs verstanden werden. Anders gesagt werden darunter ihre jeweiligen Logiken, die Ideologien und die Funktionsweisen als eines sozio-technischen Apparats mitgemeint. 9 „Ideology construes indexicality. In so doing ideology inevitably biases its metaprag‐ matic ‘take’ so as to create another potential order of effective indexicality that bears what we can appreciate sometimes as a truly ironic relation to the first“ (Silverstein 1992: 315). die Top-Down-Eigenschaft der gegebenen Plattformen bedingt, 8 welche die Spreadability dieser Einheiten erst ermöglicht. Einerseits beschränken die vorgegebenen Designparameter in technischer Hinsicht, ob und wie ein Inhalt verbreitet werden kann, andererseits erwachsen aus dem technisch-medialen Kontext die möglichen kommunikativen Praktiken, welche ein virales Moment generieren können (z. B. ein Meme anstelle einer sprachlich elaborierten Reaktion). Eine „Meme-Pragmatik“ (abgesehen von pragmatisch-linguistischen Überle‐ gungen über Memes wie bei Blommaert 2015), ergäbe sich also einerseits aus der Affordanz der Memes bezüglich der Viralität und andererseits aus der Kompetenz der User: innen, durch die richtige Nutzung der (ungeschriebenen) Regeln Viralität zu erreichen ( Jenkins et al. 2013; Marino 2015: 60 f.). Vor diesem Hintergrund ist Viralität als metapragmatische kommunikative Strategie anzu‐ sehen, welche die jeweilige kontextbezogene Bedeutung in einem perlokutiven Miteinander aus medialer Umgebung, Zeichenform und Nutzungspraktiken der Online-Communitys entstehen lässt. Dabei ist unter Perlokution in diesem Zusammenhang zu verstehen, dass die kommunikativen Zeichenhandlungen keinen vorhersehbaren, sondern einen approximativen und relationalen Cha‐ rakter aufweisen (siehe Gumperz 1982; Blommaert 2015: vor allem 22 ff.). Anders gesagt ist es schwer vorhersehbar, ob ein Inhalt viral wird, obwohl Viralität angestrebt und pragmatisch (unter anderem im Sinne der erwähnten referentiellen Metafunktion) verfolgt wird. Ein häufiger Weg, nach Viralität zu streben, ist, Strategien anderer erfolgreicher, d. h., viraler Inhalte nachzuahmen. Imitationen gehören dabei zu den pragmatischen Handlungen, die Memes selbst inhärent sind (und welche durch die Infrastruktur der Plattform unterstützt werden). Die Viralität hat selbstverständlich einen hohen Stellenwert bezüglich der den sozialen Medien inhärenten asymmetrischen Kommunikation - oder eher Dissemination von Inhalten (siehe Silverstein 1992: 315). 9 Die User: innen einer Community - wie lose auch immer diese unter medialen Bedingungen der Plattformkommunikation sei - fügen sich der darin herrschenden Kommu‐ nikationsideologie, welche in diesem Fall die Viralität als eine anzustrebende Vom kommunikativen Phänomen zum gesellschaftlichen Problem 265 <?page no="266"?> Qualität versteht. Sie ist nämlich in den jeweiligen Communitys mit der Anerkennung durch die jeweilige Gruppe von User: innen gleichzustellen - eben, weil die Anerkennung, die durch Generierung oder Teilen von viralen Inhalten entsteht, „verdient“ wird. Unabhängig von der pragmatischen und medienwissenschaftlichen Perspek‐ tive wird Viralität auch als ein wichtiger Bereich der Marketing- und der Kommunikationswissenschaft betrachtet. Innerhalb dieser wurde die wirkungs- und medienästhetische Dimension viraler Elemente bereits durch die quantita‐ tive Forschung in ihrer Existenz bestätigt und für den eigenen Forschungsbe‐ reich nutzbar gemacht. So zeigen Guadagno et al. (2013), dass die emotionale Infektiosität (emotional contagion) und soziale Validierung (Anerkennung) als wichtige Viralitätsfaktoren eines Online-Inhaltes gelten. Dies ist vor allem bei der für Online-Aktivismus charakteristischen gegenseitigen Unterstützung und Bestätigung der User: innen unter den besonderen Bedingungen einer sozialen Emergenz sichtbar. Bei der Bereitschaft der User: innen, bestimmte Online-Inhalte zu teilen, erweist sich die emotionale Intensität in Relation zu emotional neutraleren Inhalten aus dem unmittelbaren medialen Kontext als eine wichtige, aber nicht ausschlaggebende Bedingung. Denn die Faktoren der Intensität und der Qualität (positiv/ negativ) sind bei weitem nicht die einzig relevanten für Viralität, da beide als relational innerhalb einer heterogenen Gruppe gelten. Aus der Sicht der Milieus, in welchen z. B. antisemitische Memes Verbreitung finden, steht das antisemitische Meme für eine positive Positionie‐ rung im Diskurs, da es zu gegenseitiger Bestärkung mit all ihren sozialen und inhaltlichen Konsequenzen führt. Außerdem können User: innen emotional durch Humor angesprochen werden, was zu einer weiteren ideologischen Involvierung führt (Soh 2020: 1118). Die Mitglieder solcher Milieus erfahren die Validierung durch die Reaktionen ihrer Gruppe, indem die ausgelösten Emotionen auch von den anderen Mitgliedern der Gruppe geteilt werden, was sich in Kommentaren, Likes sowie in der imitativen Reproduktion des Materials manifestiert. Jene Inhalte wiederum, die in der Forschung mit Emotionen wie „Angry and Disgusting“ bezeichnet werden, weisen wesentliche Korrelationen mit Interessen der meisten User: innen einer Community auf und somit mit der Bereitschaft, diese weiterzuleiten, besonders wenn diese Inhalte von außerhalb der Milieus stammen (Guadagno et al. 2013: 2318). Anders gesagt: Die soziale Validierung der Gruppenmitglieder ist bei einem potenziell „infektiösen“ Inhalt höher, wenn dieser von außerhalb der Gruppe stammt, aber als verwandt mit dem eigenen Gedankengut erkannt wird. Dadurch lässt sich auch die Verbreitung von antisemitischen Inhalten erklären - die fringe communities sind zwar für die meisten User: innen fremd, sie verbreiten aber bekannte 266 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="267"?> 10 Zu diesen Ideologien zählen bspw. die christliche Religion, der Islam, verschiedene (ra‐ dikalisierte) Nationalismen, der Nationalsozialismus etc. Für Geschichte und Funktion des Antisemitismus siehe u. a. Nirenberg (2015), Sartre (2017: 9-36), zu Stereotypen siehe u. a. Schoeps und Schlör (1995), Benz (2010) und zu Verschwörungstheorien Wetzel (2022). 11 Wenn Bezug auf das Konzept J U D E N als Objekt des Antisemitismus genommen wird, welches eine imaginierte Entität darstellt und sich nicht auf reale Menschen bezieht, wird es mit Kapitälchen geschrieben. Muster, die zwar auf der konzeptuellen und vielen anderen Ebenen abgelehnt werden können (z. B. bei extrem blutigen oder hasserfüllten Darstellungen), aber dennoch emotional hingenommen und dadurch normalisiert werden, sobald sie in den Mainstream eingedrungen sind, d. h. einen gewissen Sättigungsgrad erreicht haben. Die Verwendung eines antisemitischen (oder anders radikalen, hasserfüllten) Memes stellt somit eine diskursive Handlung dar, die der sozialen Validierung innerhalb der jeweiligen Online-Community (oder ihrer angrenz‐ enden verwandten Gruppen) dient. 4 Antisemitismus: Funktionen und Bildwerke Antisemitische Vorstellungen sind Verleumdungen, die nicht einfach wahllos erdacht und kommuniziert werden. Sie sind gesellschaftlich geteilte und ver‐ breitete Deutungen. Sie bilden Muster und sie sind Teil einer kollektiven Praxis, die auf dem Teilen gemeinsamer Glaubenssätze beruht. Die Vorstellungsmuster haben sich historisch etabliert, weil sie von bestimmten Ideologien getragen wurden bzw. werden und weil mit dem Glauben an sie bestimmte psychische Bedürfnisse befriedigt werden können. 10 Durch den Bezug auf eine durch diskursiven Gebrauch scheinbar legitimierte und autorisierte Vorstellung von J U D E N11 wird - auf kollektiver sowie individueller Ebene - versucht, Erklärungen für Weltgeschehen und gesellschaftliche Prozesse zu erlangen, Sinn zu stiften, den eigenen psychischen Haushalt auszubalancieren, Zweifel, Unsicherheit und Angst zu minimieren, zu vermeiden, sich selbst bzw. der eigenen Wahrheit zu nahe zu kommen, sich selbst aufzuwerten oder auch sich als Person bzw. die eigene Zugehörigkeit zu definieren. Die Vorstellungen basieren auf simplen Dichotomien von Gut und Böse und haben mit J U D E N eine Instanz geschaffen, die als gemeinsame Ursache verschiedener Phänomene das Böse vereinen soll. Damit sind dessen Ort, Charakteristika und Absichten vermeintlich bestimmbar und mit diesem „Wissen“ wird eine imaginierte Handlungsfähigkeit gegen das als bedrohlich Empfundene hergestellt. Diese antisemitischen Positionierungen und die jeweils daraus gezogene Befriedigung führen wiederum zur Beteiligung an einer antisemitischen dis‐ Vom kommunikativen Phänomen zum gesellschaftlichen Problem 267 <?page no="268"?> 12 Diese Funktionen umfassen bspw. angebliche Erklärungen für einen Sachverhalt bzw. überhaupt erst die Imagination eines solchen zu Zwecken wie (politischen) Schuldzu‐ weisungen und Diffamierungen, siehe auch die Erläuterungen zu Abb. 5 unten. 13 Zu Geschichte der Namensgebung und weiteren Bezeichnungen des Memes siehe Oboler (2014) und Bernstein (2015). kursiven Praxis und in Folge zu deren Stärkung. Diese Praxis ist als sich permanent erneuernder Kreislauf zu verstehen, der von neu Hinzukommenden unterstützt wird, die in Antisemitismus Attraktivität für ihre Auseinanderset‐ zung mit sich selbst und der Welt finden. Memes sind ein wichtiger Teil dieser Praxis geworden. Der Rückgriff auf ein komplexes, kanonisiertes Set an antisemitischen Wissensbeständen ist auch im Fall der Memes die Grundlage für ihre massenhafte Verbreitung über Re-Semiotisierungspraktiken und damit ebenfalls Voraussetzung für das Aufkommen einer viralen Qualität derselben. Die Verarbeitung antisemitischer Vorstellungen in Memes dient neben den oben genannten Bedürfnissen auch dem Zweck, Bestätigung innerhalb der eigenen Community zu erfahren. Im Bild manifestiert sich der antisemitische Glaube in einem Artefakt, der diesen Glauben visuell erfahrbar macht und ihn durch die Möglichkeit des Wiedererkennens zu bestätigen scheint. Antisemitische Bildwerke sind negative Ikonen - solche, die das (vorgeblich machtvolle) Abgelehnte und Verhasste zeigen anstatt das Heilige, aber dabei ebenso mit an das Objekt geknüpfter Leidenschaft verbunden sind. Besonders wirkungsvoll sind diese Bildwerke auch, weil Bedeutungen in Bildern unmittelbarer wahrgenommen werden als in Sprache (Sachs-Hombach 2003; Engelkamp 2004; Nöth 2016). In der digitalen Kommunikation antisemitischer Bedeutungen nehmen Memes als Kommunikationsformate, die prototypisch ein bildliches Element realisieren, daher eine besondere Stellung ein. Antisemitische Memes gewinnen ihren persuasiven Charakter durch wiedererkennbare (tradierte) Inhalte, eine schnelle Erfassbarkeit der Elemente und ihre (binnenlogischen, d. h. intra- und interse‐ miotischen) Beziehungen, wodurch die antisemitische Bedeutung transportiert bzw. weitere mit dieser verbundene oder auf dieser aufbauende Funktionen 12 realisiert werden können. 5 Viralität antisemitischer Inhalte in memebasierten Internet-Interaktionen: Happy Merchant-Meme Wir ziehen das Happy Merchant-Meme 13 als illustratives Beispiel für die Ge‐ nese und Viralität eines antisemitischen Memes heran, da für genau dieses Meme bereits eine virale Wirkungsgeschichte nachgewiesen wurde. So haben 268 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="269"?> 14 Die Dynamik der Viralität bezieht sich auf genau dieses Meme und ist für jedes (virale) Meme eine andere. 15 Internet Archive: https: / / web.archive.org/ web/ 20010224211856/ https: / / www.jrbookso nline.com/ leese.htm. Zannettou et al. (2020) mittels einer quantitativen Analyse gezeigt, wie die Ver‐ breitung des Memes zwischen verschiedenen Webcommunitys beschaffen ist und dass sich die Viralität des Memes je nach Ursprungs- und Zielcommunity in unterschiedlichem Ausmaß entwickelt: Im Wesentlichen ist die Verbreitung von rechtsextremen Communitys zu anderen rechtsextremen oder nicht rechtsext‐ remen Communitys bzw. Plattformen gerichtet. 14 Die Verbreitung ist zugleich als Teil einer Profilierungsstrategie der User: innen zu verstehen, die auf den als viral erkannten Inhalten zurückgreift und den User: innen dazu verhilft, die Anerkennung (das soziale Kapital) im Rahmen der Massenkommunikation zu verdienen. Das Basismuster des Happy Merchant-Memes (Abb. 3) geht auf einen Cartoon zurück, der eine antisemitische Darstellung eines J U D E N und eine rassistische Darstellung eines S C HWA R Z E N kombiniert zeigt, diese mit Ratten und Kakerlaken vergleicht und einen Vernichtungswunsch gegenüber beiden Gruppen formu‐ liert (Oboler 2014). Die kollaborative Bedeutungskonstruktion setzte sich nach der Schaffung dieses initialen multimodalen Artefakts darin fort, dass der Bild‐ ausschnitt mit der antisemitischen Darstellung aus dem Cartoon entnommen und (stilistisch leicht vergröbert) 2001 zum ersten Mal nachweisbar auf einer Neonazi-Website gepostet wurde ( JRBooksOnline). 15 In der Folge wurde dieses Bild in rechtsextremen Foren reproduziert und mit Text verknüpft (Oboler 2014), zunehmend weiterverbreitet und dabei über den Prozess der Re-Semiotisierung mit einer sehr großen Zahl von Variationen versehen (Know Your Meme 2022), bei denen jedoch die visuelle Grundstruktur (Körperhaltung) und in den meisten Fällen auch das Basismuster (Details und Proportionen) der dargestellten Figur erhalten blieben. Weitere Re-Semiotisierungen vollziehen sich darin, dass Ele‐ mente des Happy Merchant-Memes in andere populäre Memes eingefügt, diese gewissermaßen „infiziert“ werden (Zannettou et al. 2020), wodurch diese jeweils zu Trägern einer antisemitischen Bedeutung umgestaltet werden. Dabei wird das Happy Merchant-Meme nicht immer als Sprache-Bild-Gefüge realisiert. In vielen Fällen wird einzig auf das bildliche Muster zurückgegriffen. Obschon es damit vom prototypischen Meme abweicht, erfüllt es dennoch alle anderen Kriterien (siehe Abschnitt 2), welche dem Bild den Status eines Memes verleihen. Zudem erscheint auch das bildliche Muster des Happy Mer‐ chant-Memes zumeist sprachlich kontextualisiert, d. h. die jeweilige Dimension der antisemitischen Deutung, welche das Bild offeriert, wird erst über die Vom kommunikativen Phänomen zum gesellschaftlichen Problem 269 <?page no="270"?> sprachlichen Anteile spezifiziert, indem Sprache ein konkretes antisemitisches Konzept zuschreibt. Das Meme hat sich - mit all seinen Variationen - in den 10er Jahren v. a. im englischen Sprachraum zur populärsten bildlichen antisemitischen Darstel‐ lung entwickelt (Bernstein 2015). In bestimmten Kommunikationsräumen bzw. Teilöffentlichkeiten ist es besonders verbreitet. Große Popularität hat es in rechtsextremen Communitys: In einer Untersuchung von Zannettou et al. (2018) war es auf 4chans Subboard / pol/ (politically incorrect) das dritthäufigst vertretene Meme und auf Gab das sechsthäufigste. Abb. 3: Happy Merchant-Meme, Basismuster Die Figur ist aus bekannten Stereotypen über einen jüdischen Körper und Charakter zusammengesetzt und ist für diejenigen, die damit vertraut sind bzw. diese Stereotype affirmieren, leicht zu dechiffrieren. Eine riesige, gebogene Nase, ein krummer, verwachsener Körper, ein übergroßer Mund mit dicken Lippen und Vollbart gehören zu den Elementen, mit denen Erkennbarkeit geschaffen wird; dazu kommen Mimik und Gestik: Ein stechender, getriebener Blick, intrigantes Händereiben und ein böses Grinsen sollen Verschlagenheit, hinterlistiges Pläneschmieden und Besessenheit aus‐ drücken. Diese zugeschriebenen Eigenschaften können durch das Hinzufügen von sprachlichen Elementen, durch multimodale Beziehungen im Kontext, in dem das Meme verortet ist, oder durch weitere Re-Semiotisierungen Veränderung erfahren. Dabei hat keines der Details für sich genommen eine antisemitische Bedeutung. Diese entsteht erst durch deren Zusammenwirken, im Zuge dessen die über Jahrhunderte 270 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="271"?> praktizierte stigmatisierende Darstellung jüdischer Körper aufgegriffen wird (Gilman 1991). Zusätzlich wird die Figur durch die Kippa eindeutig als jüdisch identifiziert. Die Bezeichnung als Happy Merchant greift mit der Zuschreibung Kaufmann eine seit dem Mittelalter diskursiv tradierte stereotype Vorstellung des Berufsbilds von J U D E N auf. Damit einher geht die Anschuldigung, Juden würden durch Geldge‐ schäfte nichtjüdischen Menschen schaden. Die Namensgebung ist hier demnach die (sarkastisch) attestierte Zufriedenheit (happy) eines J U D E N in der Rolle eines Kaufmanns über das Gelingen seiner Pläne, die zulasten von Nichtjuden gehen. Ein Schaden für Nichtjuden erscheint damit als Bedingung für den Erfolg oder das Glück von J U D E N und insofern als das Ziel dieser Figur. Kaufmann ist bei der Betitelung jedoch nicht als eine ausschließliche Festlegung der Figur auf diese bestimmte Rol‐ lenfunktion zu verstehen. Vielmehr wurde dieses stereotype Attribut gewählt, weil es aufgrund seiner Verbreitung im Repertoire des antisemitischen Wissens eingängig und anschlussfähig ist. Dabei wird Kaufmann als repräsentativ für andere mögliche Rollen von J U D E N bestimmt, da jene alle unter einem generellen antisemitischen Bild von jüdischem Handeln und dessen Zielen vereinen soll. Wir haben es hier also mit einer Darstellung zu tun, die prototypisch Repräsentativität herstellen soll. Der hohe Verbreitungsgrad des Memes sowie die in die Tausende gehenden Variationen (als Spielarten ein und desselben Darstellungsbedürfnisses), bei denen die semiotische Komposition und wesentliche Details der visuellen Struktur des originalen Cartoons über zwei Jahrzehnte erhalten blieben, bestätigen, dass eine solche Repräsentativität innerhalb des antisemitischen Diskurses als gegeben akzeptiert wird: Die Figur wurde universalisiert. Zudem werden das visuelle Muster und seine Variationen in Postings meist mit sprachlichen Elementen versehen, die das ganze Spektrum antisemitischer Konzepte bedienen und dabei gegebenenfalls vom Basismuster, d.-h. vom ursprünglichen Artefakt abweichende Konzepte aufrufen. Diese semantische Variabilität gründet sich ihrerseits auf der diskurssemantischen Verweisstruktur eines Memes und zeigt zugleich die tiefe Verankerung des Happy Merchant-Memes im antisemitischen Diskurs. Vom kommunikativen Phänomen zum gesellschaftlichen Problem 271 <?page no="272"?> Abb. 4: Happy Merchant, Re-Semiotisierungen Die Variationen sind als immer neue Ableger, die z.T. auch ihrerseits semiotisch sowie konzeptuell weiterentwickelt werden, Teil der Viralität des Memes. Im Zuge dessen hat das wiederkehrende multimodale Muster und seine spezi‐ fische Verwendungsweise auch Eingang in nicht traditionell antisemitische Online-Milieus gefunden. Einige dieser durch Re-Semiotisierung entstandenen Variationen des Memes möchten wir nachfolgend vorstellen. Die Memes in Abb. 4 illustrieren den Repräsentativitätsanspruch in der Kombination aus Musterhaftigkeit und Variation idealtypisch und vereinen gleich neun Variati‐ onen des prototypischen Basismusters, mit denen verschwörungstheoretisch behauptet wird, dass J U D E N in bestimmten gesellschaftlichen Bereichen Einfluss bzw. Kontrolle ausüben würden, die sprachlich explizit benannt werden. Für das Decodieren der Bedeutung der jeweiligen Memes müssen diese antisemiti‐ schen Vorstellungen - und ihre bildlichen Realisierungen - bekannt sein und es muss Wissen um das Kommunikationsformat Meme vorliegen. Darüber hinaus ist jedoch wenig zusätzliches Weltwissen erforderlich. Zentral ist das Stereotyp von (verdeckter) Macht und Kontrolle: finanziell, medial, juristisch, politisch und militärisch. Die Behauptung einer führenden Rolle von J U D E N in der Pornoindustrie und Zwangsprostitution geht auf Unterstellungen aus dem 19. Jahrhunderts zurück, die prominent bis in den Nationalsozialismus reichten, nach denen J U D E N Mädchenhandel betrieben und durch Pornographie 272 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="273"?> 16 In Social Media wurden Ereignisse um die Invasion in der Ukraine länderübergreifend mit antisemitischen Deutungen versehen (Ascone et al. 2022). Chen et al. (2023) zeigen, die Sexualmoral zersetzen oder gar das (deutsche) Volk zerstören würden (Gehmacher 1998; von Braun 2004). Die Verantwortung für eine sogenannte „Krebsindustrie“ bezieht sich auf das Konstrukt „Germanische Neue Medizin“, das u. a. die Verschwörungstheorie verbreitet, dass J U D E N Nichtjuden mittels der gängigen Behandlungsmethoden gegen Krebs gezielt töten würden (Grotepass 2016). Gerade für die unterstellten Handlungssphären bzw. zugewiesenen Rollen von Macht und Kontrolle ist ein hoher Grad an Professionalität nötig. Dieser wird mit der impliziten Voraussetzung des Stereotyps jüdischer Intelligenz zugestanden, jedoch an die Vorstellung geknüpft, dass diese eingesetzt werde, um sich selbst zu bereichern und anderen zu schaden. Der Hintergrund des Memes suggeriert, J U D E N würden im Dunklen agieren, bzw. unterstreicht die Vorstellung finsterer Machenschaften. Die einzelnen multimodalen Argumen‐ tationen innerhalb der jeweiligen Sprache-Bild-Gefüge stehen dabei nicht für sich allein, sondern können über Familienähnlichkeit, d. h. über intersemioti‐ sche Relationen zueinander, als zusammengehörig interpretiert werden und realisieren dieserart ein Konzeptgeflecht, das einen Einblick in die Bandbreite antisemitischer Vorstellungswelten gibt bzw. diese als wahr darzustellen sucht. Ein weiterer Indikator für den Repräsentativitätsanspruch der Darstellungen ist der im Hintergrund des Memes schwach erkennbare Davidstern, der von einem Symbol des Judentums in ein Symbol für J U D E N als Objekt des Antisemitismus umgedeutet und als gemeinsame Klammer ausgegeben wird, die mit allen denkbaren antisemitischen Zuschreibungen im Zusammenhang stünde. 6 Fallbeispiel: Aktualisierung des Happy Merchant-Memes Als drittes Beispiel wird etwas eingehender eine Re-Semiotisierung des Memes vorgestellt, die sich auf die 2022 begonnene Invasion Russlands in der Ukraine bezieht (Abb. 5). Darin wird eine grundsätzlich ablehnende Haltung gegenüber dem ukrainischen Präsidenten Wolodymyr Selenskyj, seiner Politik sowie der Verteidigung der Ukraine über das Arrangement der Zeichenhandlungen ausgedrückt. Das Meme zeigt - wie im Folgenden ausgeführt - einmal mehr, wie politische Ereignisse (oder historische Entwicklungen) zum Gegenstand antisemitischer Deutungen und Unterstellungen werden, die vorgeben, Erklä‐ rungen für jene zu liefern, wobei diese scheinbaren Erklärungen tatsächlich stets ausschließlich eine Funktion im Dienst der Ziele einer bestimmten Agenda erfüllen. 16 Vom kommunikativen Phänomen zum gesellschaftlichen Problem 273 <?page no="274"?> wie Memes im Diskurs über den Ukraine-Krieg zur Beeinflussung der öffentlichen Meinung eingesetzt werden. 17 Dies zeigte sowohl eine Nachverfolgung der aufeinander bezugnehmenden Beiträge in verschiedenen Threads in / pol/ als auch eine Google-Bildersuche. Abb. 5: Happy Merchant, Selenskyj Die früheste identifizierbare Veröffentlichung des Memes erfolgte am 2. März 2022 auf 4chans Subboard / pol/ als Teil eines Bildes, in dem acht verschiedene Memes mit politischem Bezug zusammengefasst sind (4chan 2022a). Am 6. März schnitt ein User auf 4chan / pol/ in Reaktion auf einen Post mit dem obigen Bild dieses Sprache-Bild-Gefüge aus und präsentiert es erstmals belegt allein‐ stehend (4chan 2022b). In den darauffolgenden Wochen und Monaten wurde es wiederholt in / pol/ genutzt und verbreitete sich auch auf anderen Plattformen, 17 da abermals die Musterhaftigkeit des Kommunikationsformates eine einfache Identifikation und damit rasante Distribution des Inhaltes ermöglichte. Die Variation der Grundstruktur des Happy Merchant besteht darin, dass die Figur mit einer Porträtzeichnung von Selenskyj ausgestattet, dessen Gesicht mit einem angespannten, lauernden Ausdruck versehen und die Figur in einen Anzug gekleidet wurde (wie ihn Selenskyj vor Invasionsbeginn trug). Der Grundstruktur des Memes wurden eine ukrainische Flagge und ein Text zur Seite gestellt, die jeweils in Wechselwirkung mit jener stehen: Durch die 274 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="275"?> 18 Danach setzten in größerem Umfang Waffenlieferungen v. a. aus NATO-Staaten ein. Diese veränderten das Kräfteverhältnis tatsächlich, jedoch erfolgt die Unterstützung, die die NATO leistet, auf Bitten der Ukraine. 19 Diese Vorstellung erfuhr in Russland 2021/ 2022 angesichts der Erklärungen westlicher Staaten, die Ukraine zu unterstützen, neue Konjunktur, wobei nun wahlweise die USA oder der Westen bezichtigt wurden. Das Aufgreifen und Verbreiten dieses Ar‐ gumentationsmusters durch hochrangige (pro-)russische Protagonisten (u. a. durch den prorussischen ehemaligen ukrainischen Präsidenten Janukowitsch, Präsident Putin, Verteidigungsminister Schoigu, Kremlsprecher Peskow und Vize-Außenminister Rjabkow) über Monate hinweg (RedaktionsNetzwerk Deutschland 2022a, b, c; Spiegel Online 2022; Stern 2022; Tagesschau.de 2022) führte dazu, dass es über die Berichter‐ stattung weltweit verbreitet wurde und sich zum festen Bestandteil einer prorussischen Perspektivierung des Krieges oder auch von Skepsis gegenüber der Unterstützung der Ukraine entwickelte und regelmäßig in Social Media-Kommentaren (als Reaktion auf Berichterstattung zu diesem Krieg) aufgegriffen wird. Eine Google-Suche für „bis zum letzten Ukrainer“ erzielt bspw. auf Deutsch 24.100, auf Englisch 59.800, auf Spanisch 22.700 und auf Russisch 330.000 Ergebnisse (Stand 15.10.2022). Platzierung von Davidstern (als Symbol für J U D E N ) und NATO-Symbol auf der ukrainischen Flagge wird der Kriegsgegner Ukraine in einer verschwörungsthe‐ oretischen Deutung mit (im Fall von J U D E N : angeblichen) Mächten assoziiert, die die ukrainische Souveränität gekapert hätten und die Ukraine zu Handlungen treiben würden, die diese von sich aus nicht ausführen würde. Selenskyj wird einerseits prominent als Protagonist dargestellt; andererseits wird durch den Davidstern impliziert, er sei zugleich ausführendes Organ von J U D E N , die hinter ihm stehen würden. Mittels der Implikationen beider Symbole wird der Krieg gegen die Ukraine mit einer weiteren Begründung zu rechtfertigen gesucht: Die eigentlichen Gegner seien andere und sie würden lediglich auf dem Territorium der Ukraine bekämpft. Mit dem Hinweis auf deren Intervention besteht zudem auch die Möglichkeit, eine Erklärung zu präsentieren, weshalb Russland trotz größter Kriegsanstrengungen im Frühjahr 2022 (zur Hauptzeit der Zirkulation des Memes) keinen Sieg über die kräftemäßig unterlegene Ukraine vorweisen konnte, 18 und die aus diesem Unvermögen herrührende Kränkung abzumildern. Mit diesen beiden Aspekten wird insbesondere darauf abgezielt, Sympathisant: innen von Russlands Krieg anzusprechen. Die Selenskyj im sprachlichen Anteil des Sprache-Bild-Gefüges untergescho‐ bene Absicht, er wolle „bis zum letzten Ukrainer kämpfen“, geht auf die seit 2014 in Russland wortgleich zirkulierende Unterstellung zurück (u. a. Komsomolskaja Prawda 2014), die USA würden Russland mittels der Ukraine angreifen und schwächen wollen und würden dafür Ukrainer: innen instrumen‐ talisieren und deren Tod in Kauf nehmen. 19 Dieses Argumentationsmuster setzt eine mit absolutem Verlust einhergehende ukrainische Niederlage voraus Vom kommunikativen Phänomen zum gesellschaftlichen Problem 275 <?page no="276"?> und impliziert, dass jede Unterstützung der Ukraine deshalb vergeblich wäre und - schlimmer noch - die Tötung von Ukrainer: innen (für im jeweiligen Kontext genannte Zwecke wie die Schwächung Russlands) berechnend in Kauf genommen würde. Neben dem konkreten Inhalt unterstützt die Nutzung dieses Argumentationsmusters (auch durch dessen eigenständige Viralität) die Wirksamkeit des Memes in entsprechenden Milieus und stellt über so generierte Zustimmung ein Einfallstor für Zustimmung auch zu den anderen Inhalten und darunter dem antisemitischen Gehalt dar. Im Zusammenhang mit den antisemitischen Deutungen, die das Meme vereint, werden dem sprachlichen Anteil über eine nachgestellte Erklärung weitere Bedeutungsdimensionen hinzugefügt. Der Hinweis auf eine angebliche ausschließliche Fokussierung auf „slawische Männer“ impliziert, dass ukraini‐ sche Männer gezielt eingezogen bzw. als Soldaten an die Front geschickt würden, weil sie slawische Männer sind. Die Unterstellung einer gezielten Opferung slawischer Männer wird eingesetzt, um ein Opferkollektiv slawischer Männer zu konstruieren. Mit diesem können bzw. sollen sich slawische (u. a. auch russische) Männer identifizieren bzw. angesichts dessen als betroffen empfinden - verbunden mit der Erwartung, dass diese auf die ihnen vermeintlich zuge‐ dachte Rolle mit Ablehnung reagieren. Außerdem kann von dem Szenario auch eine Botschaft an Rezipient: innen mit Auffassungen von überlegener Männlich‐ keit bzw. nationalistischen Perspektiven abgeleitet werden: Das Fehlen dieser Männer würde für das Ende der ukrainischen Nation mit slawischer Herkunft sorgen. Auch hier ist von einem Versuch auszugehen, Widerspruch gegen Selenskyjs vermeintliches Handeln zu erzeugen. Die Unterstellung der Absicht der Opferung hat eine weitere Bedeutungs‐ ebene: Ein J U D E (selbst wenn Selenskyj jüdisch ist, wird er nicht als realer Mensch adressiert, sondern als Figur und Projektionsfläche (Salzborn 2010) funktionalisiert) würde einen „Bruderkrieg“ mit u. a. dem Kriegsziel der Dezi‐ mierung slawischer Bevölkerung befeuern. Darin spiegelt sich die bereits aus dem 19. Jahrhundert stammende Behauptung, J U D E N würden als „Antirasse“ außerhalb der „Rassenhierarchie“ stehen und sich aus dieser Position am „Ras‐ senkampf “ beteiligen und sich gegen letztlich alle Rassen wenden (popularisiert von Chamberlain 1899). Auch der letzte Zusatz („Frauen und Migrant: innen können [das Land verlassen]“) verdient Beachtung. Wiewohl es selbstverständlich ist, dass Mig‐ rant: innen (ohne Staatsbürgerschaft) nicht für einen Kriegsdienst verpflichtet werden, klingt mithilfe der Kontrastierung zwischen ukrainischen Männern, die in den Krieg und Tod gezwungen würden, während die Unversehrtheit von Migrant: innen garantiert würde, eine Anspielung auf die Verschwörungstheorie 276 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="277"?> des „Großen Austauschs“ durch (Deltau 2022). Nach dieser würden u. a. J U D E N Migration fördern, um langfristig weiße Bevölkerungen zu verdrängen. Auch ein misogyner Aspekt ist zu beobachten: der Unwille darüber, dass Frauen der Schrecken des Krieges an der Front erspart würde. Das antisemitische Meme wird also auch über Rassismus und Sexismus re-semiotisiert und damit der Diskurs um eine angebliche jüdische Verschwörung mit einer weiteren Bedeutungsnuance aktualisiert. Die Analyse des Memes zeigt, dass neben Wissen zu antisemitischen Vorstel‐ lungen vielfältiges Diskurswissen (in diesem Fall zum Krieg in der Ukraine) sowie Wissen um das Kommunikationsformat Meme nötig ist, um die Bedeu‐ tungen von Sprache, Symbolik, Illustration und deren Bezügen untereinander zu dechiffrieren. Die sprachlich realisierten Argumentationsmuster, das Porträt von Selenskyj, die ukrainische Flagge und das NATO-Symbol überschreiten das Repertoire kanonisierter antisemitischer Formen und gehen mit diesen zugleich eine (neue) Verbindung ein. Das Hinzufügen dieser Elemente aktuali‐ siert das Meme für den gewählten thematischen Kontext, indem das Meme spezifisch neue Botschaften verbreitet. Mit diesen wird zunächst ein Publikum zu erreichen versucht, welches diese Elemente und deren Zusammenhang deuten kann und den kommunizierten Bedeutungen zustimmt. Die Adaptionen bergen jedoch mit zunehmender (Themen-)Spezifik und Komplexität auch das Risiko, dass sich bestimmte intendierte Bedeutungen der Rezeption entziehen, da das nötige Wissen nicht vorhanden ist, und damit der Validierung durch die Community und in Folge der Verbreitung (Viralität) des Memes Grenzen gesetzt werden. Diese potentielle Lücke wäre auch in die Gegenrichtung möglich: Wenn in einem Diskurskontext mit kaum oder wenig Berührungspunkten zu Antisemitismus, in dem bspw. Informationsaustausch zum Krieg in der Ukraine im Vordergrund steht, mit dem Happy Merchant-Template auf ein antisemitisches Deutungsangebot zugegriffen wird, hängt die wirksame Ver‐ mittlung dieser Perspektivierung auf Seite der Rezipient: innen insbesondere von der Vertrautheit derselben mit den diskurssemantischen und kommunikativen Praktiken des Memes ab. Dieses Meme hat eine mit seinem antisemitischen Charakter verbundene wichtige konkrete, politische Funktion (die spezifischer ist, als die der zuvor besprochenen Variationen und des Originals): Es ist der Versuch, auf dem Weg multimodaler antisemitischer Zuschreibungen - den Unterstellungen einer Vernichtungsabsicht gegenüber dem ukrainischen Kollektiv und einer Verschwörung der fremden Mächte J U D E N und NATO, die zu diesem Zweck mit dem Präsidenten die zentrale ukrainische Entscheidungsposition usurpieren würden - Selenskyj (in der Ukraine und in der weltweiten Wahrnehmung) Vom kommunikativen Phänomen zum gesellschaftlichen Problem 277 <?page no="278"?> und die Verteidigung der Ukraine durch die Ukrainer: innen zu delegitimieren, Ukrainer: innen den Eindruck zu vermitteln, sie wären Werkzeuge für fremde Interessen, zum Aufbegehren gegen Selenskyj, seine Politik und seine Unter‐ stützer: innen anzustacheln, Sympathisant: innen von Russlands Krieg zu mobili‐ sieren und die Unterstützung für die Ukraine zu diskreditieren und zum Erliegen zu bringen. Das Meme bildet innerhalb des Diskurses, der auf die Schwächung des ukrainischen Widerstands zielt, eine illustrative Komponente und trägt dazu bei, indirekt die russische Seite in diesem Krieg zu unterstützen. Die Nutzung eines bereits viralen Meme-Templates steigert die Wahrscheinlichkeit der Verbreitung der vermittelten Diskursposition und damit der gewünschten Einflussnahme. 7 Fazit Im Rahmen dieses Beitrages konnte aufgezeigt werden, wie innerhalb digitaler Kommunikationsräume über das Kommunikationsformat Meme der Versuch unternommen wird, regulierend auf Diskurse einzuwirken, d. h. in diesem Fall Deutungen in Form von antisemitischen Weltbildern normativ zu setzen. Das Happy Merchant-Meme wird seit zwei Jahrzehnten als Muster zur Verbreitung von Antisemitismus genutzt und hat sich in diesem Zeitraum viral in bestimmten Webcommunitys und über verschiedene Plattformen verbreitet und wurde tausendfach variiert. Dieser Befund belegt die Popularität des Memes in der antisemitischen Kommunikation. Der Ready-made-, Template- und Sample-Charakter von Memes offenbart sich dabei als eine grundlegende Bedingung für dessen Viralität. Denn das infektiöse Moment der Viralität speist sich zum einen aus dem Umstand, dass die re-semiotisierten Artefakte weiterhin einen hohen Widererkennungswert und damit einhergehende Validierung für die enthaltenden Deutungen innerhalb der Communitys besitzen. Zum anderen kann das virale Meme - infolgedessen es über seine Viralität bereits innerhalb der Communitys etabliert ist - über Re-Semiotisierungen nutzbar gemacht werden, um die verschiedensten Kontexte zu modellieren - wie hier am Beispiel des Selenskyj-Memes sichtbar geworden ist, welches in den Dienst einer spezifischen Diskursposition gestellt wurde. Sowohl der Grad der Re-Semiotisierung, d. h. der Grad der Variation als auch damit einhergehend die Rezeptivität des Publikums entscheiden mit darüber, ob ein entsprechend re-semiotisiertes Artefakt auf Akzeptanz oder Ablehnung bzw. Interesse oder Desinteresse stößt und so zur Verbreitung von Antisemitismus beiträgt. Für User: innen ist es ein Leichtes, das Muster des Happy Merchant-Memes selbst zu gebrauchen, zu variieren und in verschiedenen neuen Kontexten einzusetzen. 278 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="279"?> Die Analyse fokussierte sich deshalb besonders auf die (konzeptuellen) Bedin‐ gungen und Muster der Verbreitung, die spezifische semiotische Organisation sowie die jeweils realisierten bzw. reproduzierten antisemitischen Konzepte wie sie in den Re-Semiotisierungen des viralen Happy Merchant-Memes zu Tage treten. Die Re-Semiotisierungspraktiken des Happy Merchant-Memes umfassen sowohl eine Diversifizierung des Memes, d. h. die Illustration der Bandbreite der antisemitischen Zuschreibungen - in immer neuen visuellen Realisierungen (und Kombinationen), als auch - und gegebenenfalls damit verbunden - Aktu‐ alisierungen des Memes, mit denen auf bestimmte Ereignisse reagiert wird, Deutungen für diese propagiert werden sowie versucht wird, die jeweiligen Memes durch spezifische (ggf. über die Propagierung von Antisemitismus hinausgehende) Perspektivierungen dieser Ereignisse für die Verbreitung einer Diskursposition in Bezug auf diese Ereignisse nutzbar zu machen. Literatur (Online-)Datenquellen 4chan (2022a). Abrufbar unter: https: / / archive.4plebs.org/ pol/ thread/ 364585087/ #364588 941 (Stand: 13.10.2022) 4chan (2022b). Abrufbar unter: https: / / archive.4plebs.org/ pol/ thread/ 365467433/ (Stand: 13.10.2022) Know Your Meme (2022). Abrufbar unter: https: / / knowyourmeme.com/ memes/ happy-m erchant/ photos (Stand: 06.10.2022) RedaktionsNetzwerk Deutschland (2022a). Ex-Präsident der Ukraine fordert Selenskyj zum Aufgeben auf. Abrufbar unter: https: / / www.rnd.de/ politik/ ukraine-krieg-ex-p raesident-janukowitsch-ruft-selenskyj-zur-kapitulation-auf-AZSXBKEOQHMLUGQ USEZ5EMRLRA.html (Stand: 13.10.2022) RedaktionsNetzwerk Deutschland (2022b). Vorwurf aus Moskau: Westen will mit Waf‐ fenlieferungen Krieg verlängern. Abrufbar unter: https: / / www.rnd.de/ politik/ krie g-in-der-ukraine-russland-wirft-westen-verlaengerung-durch-waffenlieferungen-vo r-H7PO7CGAYN2ITQQAXL2PSRAOBM.html (Stand: 13.10.2022) RedaktionsNetzwerk Deutschland (2022c). Wladimir Putin: Haben in Ukraine noch nicht mal angefangen. Abrufbar unter: https: / / www.rnd.de/ politik/ putin-droht-w esten-haben-in-ukraine-noch-nicht-mal-angefangen-L4QTABVTYVAKLK4KKBAGT OIPZ4.html (Stand: 13.10.2022) Spiegel Online (2022). Krieg in Osteuropa am Mittwoch. Abrufbar unter: https: / / w ww.spiegel.de/ ausland/ ukraine-news-am-mittwoch-wolodymyr-selenskyj-fordert-w eitere-sanktionen-gegen-russland-a-e0485bc9-248a-4a61-a2ed-a803df573f64 (Stand: 13.10.2022) Vom kommunikativen Phänomen zum gesellschaftlichen Problem 279 <?page no="280"?> Stern (2022). Moskau sieht in Ukraine-Konflikt wachsendes Risiko einer Konfrontation mit den USA. Abrufbar unter: https: / / www.stern.de/ politik/ ausland/ ukraine-news--m oskau-warnt-wegen-waffenlieferungen-vor-usa-russland-konfrontation-31911498.ht ml (Stand: 13.10.2022) Tagesschau.de (2022). Liveblog: Krieg gegen die Ukraine. Abrufbar unter: https: / / www. tagesschau.de/ newsticker/ liveblog-ukraine-dienstag-115.html (Stand: 13.10.2022) JRBooksOnline (2001). Ohne Titel. Abrufbar unter: https: / / www.jrbooksonline.com/ lees e.htm (Stand: 06.10.2022) Sekundärliteratur Ascone, Laura/ Becker, Matthias J./ Bolton, Matthew/ Chapelan, Alexis/ Krasni, Jan/ Plac‐ zynta, Karolina/ Scheiber, Marcus/ Troschke, Hagen/ Vincent, Chloé (2022). Decoding Antisemitism: Eine KI-gestützte Untersuchung von Hassrede und -bildern im Internet. Diskursreport 4. Berlin: Technische Universität Berlin. Zentrum für Antisemitismus‐ forschung. Abrufbar unter: https: / / decoding-antisemitism.eu/ wp-content/ uploads/ 20 22/ 10/ TU_DA4_DE-web.pdf ? x94795 (Stand: 19.10.2022) Benz, Wolfgang (Hrsg.) (2010). Handbuch des Antisemitismus. Judenfeindschaft in Geschichte und Gegenwart. Bd.-3, Begriffe, Theorien, Ideologien. 6 Bde. Berlin/ New York: De Gruyter Saur. Bernstein, Joseph (2015). The Surprisingly Mainstream History Of The Internet’s Favo‐ rite Anti-Semitic Image. Abrufbar unter: https: / / www.buzzfeednews.com/ article/ jo sephbernstein/ the-surprisingly-mainstream-history-of-the-internets-favorit (Stand: 06.10.2022) Blommaert, Jan (2015). Meaning as a Nonlinear Effect. The Birth of Cool. AILA Review 28, 7-27. Blommaert, Jan/ Varis, Piia (2015). Enoughness, Accent and Light Communities: Essays on Contemporary Identities. Tilburg Papers in Culture Studies 139. Breitenbach, Patrick (2015). Memes. Das Web als kultureller Nährboden. In: Breitenbach, Patrick/ Stiegler, Christian/ Zorbach, Thomas (Hrsg.). New Media Culture. Mediale Phänomene der Netzkultur. Bielefeld: transcript, 29-49. Chamberlain, Houston Stewart (1899). Die Grundlagen des Neunzehnten Jahrhunderts. Bd.-1 & 2. München: Bruckmann. Chen, Keyu/ Feng, Ashley/ Aanegola, Rohan/ Saha, Koustuv/ Wong, Allie/ Schwitzky, Zach/ Lee, Roy/ Ka-Wie/ O’Hanlon, Robin/ De Choudhury, Munmun/ Altice, Frederick L./ Khoshnood, Kaveh/ Kumar, Navin (2023). Categorizing Memes About the Ukraine Conflict. In: Dinh, Thang N./ Li, Minming (Hrsg.). Computational Data and Social Networks. CSoNet 2022. Lecture Notes in Computer Science, vol 13831. Cham: Springer Nature Switzerland, 27-38. 280 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="281"?> Deltau, Max (2022). Renaud Camus: Revolte gegen den Großen Austausch. In: Meiering, David (Hrsg.). Schlüsseltexte der ‚Neuen Rechten‘. Edition Rechtsextremismus. Wies‐ baden: Springer VS. Engelkamp, Johannes (2004). Gedächtnis für Bilder. In: Sachs-Hombach, Klaus/ Reh‐ kämper, Klaus (Hrsg.). Bild - Bildwahrnehmung - Bildverarbeitung. Wiesbaden: Deutscher Universitätsverlag, 227-242. Fraas, Claudia/ Pentzold, Christian/ Meier, Stefan (2012). Online-Kommunikation. Grund‐ lagen, Praxisfelder und Methoden. München: Oldenbourg Verlag. Gehmacher, Johanna (1998). Die Eine und der Andere. Moderner Antisemitismus als Geschlechtergeschichte. In: Bereswill, Mechthild/ Wagner, Leonie (Hrsg.). Bürgerliche Frauenbewegung und Antisemitismus. Tübingen: Ed. diskord, 101-120. Gilman, Sander L. (1991). The Jew’s Body. New York: Routledge. Grotepass, Christoph (2016). Die „Germanische Neue Medizin“ von Ryke Geerd Hamer. Abrufbar unter: https: / / sekten-info-nrw.de/ information/ artikel/ verschwoerungstheo rien/ die-germanische-neue-medizin-von-ryke-geerd-hamer (Stand: 17.10.2022) Gonzalez Hernandez, Eva Maria/ Figueroa Daza, Jaime Eduardo/ Meyer, Jan-Hinrich (2019). Los Memes Y La política. ¿Por Qué Algunos Memes Se Vuelven Virales Y Otros No? IC Revista Científica De Información Y Comunicación 16, 579-613. https: / / icjou rnal-ojs.org/ index.php/ IC-Journal/ article/ view/ 468 Guadagno, Rosanna E./ Rempala, Daniel M./ Murphy, Shannon/ Okdie, Bradley M. (2013). What Makes a Video Go Viral? An Analysis of Emotional Contagion and Internet Memes. Computers in Human Behavior 29 (6), 2312-2319. Gumperz, John (1982). Discourse Strategies (Studies in Interactional Sociolinguistics). Cambridge: Cambridge University Press. doi: 10.1017/ CBO9780511611834 Iedema, Rick (2003). Multimodality, resemiotization: extending the analysis of discourse as multi-semiotic practice. Visual Communication 2 (1), 29-57. Jenkins, Henry/ Ford, Sam/ Green, Joshua (2013). Spreadable Media: Creating Value and Meaning in a Networked Culture. New York/ London: New York University Press. Johann, Michael/ Bülow, Lars (2019). Politische Internet-Memes: Erschließung eines in‐ terdisziplinären Forschungsfeldes. In: Johann, Michael/ Bülow, Lars (Hrsg.). Politische Internet-Memes - Theoretische Herausforderungen und empirische Befunde. Berlin: Frank & Timme, 13-40. Klemm, Michael/ Michel, Sascha (2014). Medienkulturlinguistik. Plädoyer für eine holis‐ tische Analyse von (multimodaler) Medienkommunikation. In: Benitt, Nora/ Koch, Christopher/ Müller, Katharina/ Saage, Sven/ Schüler, Lisa (Hrsg.). Korpus - Kommu‐ nikation - Kultur: Ansätze und Konzepte einer kulturwissenschaftlichen Linguistik. Trier: WVT, 183-215. Vom kommunikativen Phänomen zum gesellschaftlichen Problem 281 <?page no="282"?> Klug, Nina-Maria (2023). Verstehen auf den ersten Blick - oder doch nicht? Zur (ver‐ meintlichen) Einfachheit kleiner Texte am Beispiel von Internet-Memes. In: Schrott, Angela/ Wolf, Johanna/ Pflüger, Christine (Hrsg.). Textkomplexität und Textverstehen. Berlin: De Gruyter, 195-230. Komsomolskaja Prawda (2014). США будут воевать с Россией до последнего украинца [Die USA werden Russland bis zum letzten Ukrainer bekämpfen]. Abrufbar unter: https: / / www.kp.ru/ daily/ 26243.3/ 3124522/ (Stand: 08.10.2022) Kress, Gunther/ van Leeuwen, Theo (2006). Reading Images. The Grammar of Visual Design. London/ New York: Routledge. Kress, Gunther (2010). Multimodality. A social semiotic approach to contemporary communication. London: Routledge. Ling, Chen/ AbuHilal, Ihab/ Blackburn, Jeremy/ De Cristofaro, Emiliano/ Zannettou, Savvas/ Stringhini, Gianluca (2021). Dissecting the Meme Magic: Understanding Indi‐ cators of Virality in Image Memes. https: / / doi.org/ 10.48550/ arXiv.2101.06535 Marino, Gabriele (2015). Semiotics of spreadability: A systematic approach to Internet memes and virality. Punctum 1 (1), 43-66. Merten, Marie-Luis/ Bülow, Lars (2019). Zur politischen Internet-Meme-Praxis: Bild-Sprache-Texte kognitiv-funktional. In: Bülow, Lars/ Johann, Michael (Hrsg.). Po‐ litische Internet-Memes - Theoretische Herausforderungen und empirische Befunde. Berlin: Frank & Timme, 195-227. Nirenberg, David (2015). Anti-Judaismus: eine andere Geschichte des westlichen Den‐ kens. München: CH Beck. Nöth, Winfried (2016). Verbal-Visuelle Semiotik. In: Klug, Nina-Maria/ Stöckl, Hartmut (Hrsg.). Handbuch Sprache im multimodalen Kontext. Berlin: De Gruyter, 190-216. Oboler, Andre (2014). The antisemitic meme of the Jew. Caulfield South, Vic: Online Hate Prevention Institute. Abrufbar unter: https: / / nla.gov.au/ nla.obj-888640442/ view (Stand: 06.10.2022) Runkehl, Jens (2013). Die Unordnung digitaler Ordnung. In: Konstanze, Marx/ Schwarz-Friesel, Monika (Hrsg.). Sprache und Kommunikation im technischen Zeit‐ alter. Wieviel Internet (v)erträgt unsere Gesellschaft? Berlin: De Gruyter, 53-67. Sachs-Hombach, Klaus (2003). Das Bild als kommunikatives Medium. Elemente einer allgemeinen Bildwissenschaft. Köln: Herbert von Halem. Salzborn, Samuel (2010). Zur Politischen Psychologie des Antisemitismus. Journal für Psychologie 18 (1). Abrufbar unter: https: / / journal-fuer-psychologie.de/ article/ down load/ 169/ 203/ 213 (Stand: 10.05.2023) Sampson, Tony D. (2012). Virality: Contagion Theory in the Age of Networks. Mineapolis: University of Minnesota Press. Sartre, Jean-Paul (2017). Überlegungen zur Judenfrage. 3. Aufl. Reinbek bei Hamburg: Rowohlt Taschenbuch Verlag. 282 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="283"?> Schoeps, Julius H./ Schlör, Joachim (Hrsg.) (1995). Antisemitismus: Vorurteile und My‐ then. München/ Zürich: Piper. Shifman, Limor (2013). Memes in Digital Culture. Cambridge: MIT Press. Silverstein, Michael (1992). The uses and utility of ideology: Some reflections. Pragmatics 2 (3), 311-323. Simons, Sascha (2016). Mobilizing Memes: The Contagious Socio-Aesthetics of Parti‐ cipation. In: Denecke, Mathias/ Ganzert, Anne/ Otto, Isabell/ Stock, Robert (Hrsg.). ReClaiming Participation: Technology - Mediation - Collectivity. Media Studies. Wiesbaden: transcript, 231-245. Soh, Wee Yang (2020). Digital protest in Singapore: the pragmatics of political Internet memes. Media, Culture & Society 42 (7-8), 1115-1132. von Braun, Christina (2004). Einleitung. In: von Braun, Christina/ Ziege, Eva-Maria (Hrsg.). Das „bewegliche“ Vorurteil: Aspekte des internationalen Antisemitismus. Würzburg: Königshausen und Neumann, 11-42. Weng, Lilian/ Menczer, Filippo/ Ahn Yong-Yeol (2013). Virality Prediction and Community Structure in Social Networks. Scientific Reports 3 (1), 2522. https: / / doi.org/ 10.1038/ sr ep02522 Wetzel, Juliane (2022). Verschwörungstheorien. In: Benz, Wolfgang (Hrsg.). Handbuch des Antisemitismus Online. Berlin/ Boston: De Gruyter Oldenbourg. https: / / www.de gruyter.com/ database/ HDAO/ entry/ hdao.3.214/ html (Stand: 29.03.2023) Wrede, Julia (2013). Bedingungen, Prozesse und Effekte der Bedeutungskonstruktion. Der sprachliche Ausdruck in der Kotextualisierung. Duisburg: Rhein-Ruhr Verlag. Zannettou, Savvas/ Caulfield, Trista/ Blackburn, Jeremy/ De Cristofaro, Emiliano/ Sirivi‐ anos, Michael/ Stringhini, Gianluca/ Suarez-Tangil, Guillermo (2018). On the origins of memes by means of fringe web communities. Proceedings of the Internet Measu‐ rement Conference 2018, 188-202. Zannettou, Savvas/ Finkelstein, Joel/ Bradlyn, Barry/ Blackburn, Jeremy (2020). A Quanti‐ tative Approach to Understanding Online Antisemitism. Proceedings of the Interna‐ tional AAAI Conference on Web and Social Media 14 (1), 786-797. Abbildungsverzeichnis Abb. 1: Know Your Meme (2020). https: / / knowyourmeme.com/ photos/ 1217719-whomst (Stand: 30.10.2022) Abb. 2: Know Your Meme (2020). https: / / knowyourmeme.com/ photos/ 1755097-galaxy-b rain (Stand: 30.10.2022) Vom kommunikativen Phänomen zum gesellschaftlichen Problem 283 <?page no="284"?> Abb. 3: Bernstein, Joseph (2015). The Surprisingly Mainstream History Of The Inter‐ net’s Favorite Anti-Semitic Image. Abrufbar unter: https: / / www.buzzfeednews.com/ a rticle/ josephbernstein/ the-surprisingly-mainstream-history-of-the-internets-favorit (Stand: 06.10.2022) Abb. 4: Know Your Meme (2018). https: / / knowyourmeme.com/ photos/ 1371493-happy-m erchant (Stand: 06.10.2022) Abb. 5: Know Your Meme (2022). https: / / knowyourmeme.com/ photos/ 2358229-volodym yr-zelenskyy (Stand: 06.10.2022) 284 Marcus Scheiber, Hagen Troschke & Jan Krasni <?page no="285"?> Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen Elisabeth Zima Abstract: This chapter presents an analysis of the strategies that participants of ZOOM video conferences apply to organize turn-taking. It is well known that in face-to-face interaction, gaze is the most important means to manage turn transition and to select next speakers. However, in video conferences, gaze cannot be used to select next speakers because recipients cannot identify speakers’ precise gaze targets on their computer screens. Interactants thus need to apply alternative strategies to manage smooth turn-taking. The analysis reveals that one such strategy is to select next speakers by addressing them by name. This is the most straightforward way to single out one participant as next speaker. However, in other situations more than one participant may act as next speaker and turn-taking needs to be negotiated between co-addressed recipients. A case in point are questions that are pronominally addressed to multiple participants. It is shown that in these cases, gaze to and away from the screen is employed to negotiate turn-taking. In the case of open information requests that are not addressed to any (group of) participant(s) in particular, epistemics and participants’ awareness of epistemic authorities regulate turn-taking. Keywords: gaze, turn-taking, self-selection, other-selection, ZOOM video conferences 1 Einleitung Die Entwicklung von Videokonferenzsystemen begann bereits in den 1930er Jahren (Schulte et al. 2001), aber erst im Laufe des 21. Jahrhunderts wurden sie zu einer in privaten und beruflichen Kontexten breit genutzten Form der technisch vermittelten Kommunikation. Mit dem Beginn der COVID-19-Pandemie im Winter 2020 gewann die Videokonferenz als Kommunikationsmittel schlagartig <?page no="286"?> 1 Siehe hierzu und zu vielen anderen Videokonferenzsystemen die von Similiarweb Research Intelligence gesammelten und auf https: / / de.statista.com/ statistik/ daten/ stu die/ 1113081/ umfrage/ anzahl-der-visits-pro-monat-von-zoom/ veröffentlichten Daten; Webseite zuletzt konsultiert am 3.5.2022 2 Das impliziert aber nicht, dass wir genau das möglicherweise dennoch tun (siehe die Diskussion zur Perspektivenreziprozität in Lanwer 2019). und weltweit an Bedeutung. Private Treffen, Schulstunden, Universitätssemi‐ nare und berufliche Meetings wurden zum Zweck der Kontaktreduktion und der Eindämmung des Virus in den digitalen Raum verlegt. Binnen kürzester Zeit wurden damit Plattformen, Software-Tools und Apps wie ZOOM, Microsoft Teams, Adobe Connect, WebEx u. a. Teil des privaten und beruflichen Alltags von Milliarden Menschen. So verzeichnete etwa die Webadresse https: / / zoom.us im Zeitraum zwischen dem März 2020 und dem März 2022 mehr als 50 Milliarden Aufrufe. 1 In diesem Beitrag beschäftigen wir uns mit der Frage, wie Interaktions‐ teilnehmer: innen ihre Interaktion und insbesondere den Sprecherwechsel in ZOOM-Videokonferenzen organisieren. Jahrzehntelange Forschung zum Turn-Taking-System in face-to-face Interaktionen hat gezeigt, dass hier vor allem der Blick eine ganz entscheidende Rolle spielt und nächste Sprecher: innen durch Ansehen gegen Ende des Turns ausgewählt werden (siehe Auer 2020, 2021a und Abschnitt 2). Auch in ZOOM-Videokonferenzen sehen wir einander (zumindest, wenn wir das wollen, die Webcam einschalten und unser Video mit den anderen Teilnehmer: innen teilen). Dieser Bildausschnitt ist aber beschränkt; in unseren Aufnahmen zumeist auf den Oberkörper. Licoppe/ Morel (2012) sprechen deshalb von „talking heads arrangements“. Ein wesentlicher Unter‐ schied zur nicht medial vermittelten face-to-face Interaktion liegt aber nicht nur im begrenzten Bildausschnitt, sondern auch in der eingeschränkten Wahrneh‐ mungswahrnehmung. Zwar können wir sehen, ob jemand den Blick auf den Bildschirm gerichtet hat oder nicht, wir können aber das genaue Blickziel nicht eruieren. Wir wissen somit - zumindest in Mehrparteiengesprächen - nicht, auf welche spezifische Teilnehmerkachel jemand auf seinem/ ihrem Bildschirm sieht. Darüber hinaus sind die Videokacheln nicht bei allen Teilnehmer: innen in derselben Reihenfolge angeordnet, sodass wir aus der Anordnung am eigenen Bildschirm keine Schlüsse bezüglich der Anordnung auf den Bildschirmen der anderen Interaktionsteilnehmer: innen ziehen können. 2 Mit anderen Worten, der Blick kann in Videokonferenzen, allen voran in Interaktionen mit mehr als zwei 286 Elisabeth Zima <?page no="287"?> 3 Das schließt nicht aus, dass Sprecher: innen versuchen, durch Ansehen nächste Spre‐ cher: innen auszuwählen. Um dieser Frage nachzugehen, wären aber Eyetracking-Daten der Teilnehmer: innen nötig, die für diese Studie jedoch nicht vorliegen. Teilnehmer: innen, per se keine Fremdwahlfunktion ausüben, weil Angesehene nicht (sicher) wissen, dass sie angesehen werden. 3 Dennoch laufen Videokonferenzen nicht vollkommen chaotisch ab und unsere Daten zeigen, dass es den Teilnehmer: innen im Allgemeinen durchaus gelingt, das Gespräch so zu organisieren, dass sich Sprecher: innen ohne andau‐ ernde Simultanstarts, lange Überlappungsphasen oder extrem lange Pausen in ihrer Rede abwechseln. Der vorliegende Beitrag stellt deshalb die Frage nach den Methoden der Fremd- und der Selbstwahl, die hier zur Anwendung kommen. Dabei liegt ein spezifischer Fokus auf der Frage, ob der Blick tatsäch‐ lich gar keine Rolle im Prozess der Aushandlung von Turnübergaben und Turnübernahmen spielt. Die Vermutung, dass dem nicht so ist, liegt nahe, denn obwohl es stimmt, dass Videokonferenzteilnehmer: innen nicht wissen, wen ihre Gesprächspartner: innen ansehen, können sie durchaus sehen, wenn Sprecher: innen oder Rezipient: innen wegsehen. Das ist relevant, weil sich auch Wegsehen an TCU-Grenzen bzw. TRPs für die Organisation des Sprechwechsels in face-to-face Interaktionen als bedeutsam erwiesen hat, insbesondere als Zeichen der Vorbereitung einer Turnübernahme (Kendon 1967; Goodwin 1980; Auer 2021a). Zudem stellt sich die Frage nach den Strategien, die Sprecher: innen anwenden, um mit eventuellen Problemen beim Sprecherwechsel umzugehen, d. h. wie sie nachträglich nach einem nicht reibungslosen Turnübergang be‐ stimmte Gesprächsteilnehmer: innen als nächste Sprecher: innen auswählen. Unser Ausgangspunkt ist dabei zunächst unser inzwischen recht großes Wissen über das Turn-Taking-System und die Rolle des Blicks und anderer verbaler und nonverbaler Ressourcen zur Fremd- und Selbstwahl in der face-to-face Interak‐ tion. Der folgende Abschnitt fasst die wichtigsten Erkenntnisse zusammen. 2 Turn-Taking und Blick in der face-to-face Kommunikation Dass der Blick eine entscheidende Rolle für die Sprecherwechselorganisation spielen könnte, wurde bereits in ersten Studien aus den 1960er und 70er Jahren vermutet. Wegweisend waren hier insbesondere die Arbeiten von Kendon (1967) und Duncan (1972). Sie beide konstatieren für dyadische Interaktionen, dass Sprecher: innen zu Beginn eines Turns zumeist wegsehen, zu Ende hingegen den Blick auf die Gesprächspartner: innen ausrichten. Während die beiden Autoren diesem Blickverhaltensmuster von Sprecher: innen eine regulative Funktion (Turnbeanspruchung bzw. Turnzuweisung) zuschreiben, sieht Beattie (1978, Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 287 <?page no="288"?> 4 Darüber hinaus gibt es auch kulturelle Unterschiede (siehe Rossano 2012b). Wir beschränken uns hier auf jene Blickmuster, die für englischsprachige und deutschspra‐ chige Interaktionen beschrieben wurden. 1979) eher kognitive Gründe für diese Blickverhaltensmuster. So erklärt er Wegsehen zu Beginn eines Turns mit dem erhöhten kognitiven Aufwand bei der Äußerungsplanung und komplementär dazu die Blickzuwendung gegen Ende des Turns damit, dass genau dieser Aufwand wieder reduziert ist und kognitive Ressourcen für das Monitoring und die Verarbeitung von Rezipientenreaktionen bereitstehen. Zu den empirischen Beobachtungen von Kendon (1967) und Duncan (1972) im Widerspruch stehen aber, zumindest was den Sprecherblick vor bzw. zu Beginn eines Turns angeht, die Beobachtungen Goodwins (1980), wonach Sprecher: innen kurz vor oder spätestens zu Beginn ihres Turns nicht wegsehen, sondern im Gegenteil versuchen, den Blick der Rezipient: innen auf sich zu ziehen, um deren Aufmerksamkeit zu sichern. Dieser Widerspruch resultiert, wie Rossano (2012a) argumentiert, aber vor allem daraus, dass das Blickverhalten aktivitäts- und sequenzabhängig ist und dies v. a. für das Blickverhalten an TCU-Grenzen relevant ist. 4 So erfüllt die Ausrichtung des Sprecherblicks auf Rezipient: innen etwa in Erzählungen, in denen der Turn prinzipiell bis zum Ende der Erzählung nicht zur Disposition steht (Sacks 1992), keine Fremdwahlfunktion, sondern eine Monitoringfunktion (siehe auch Sweetser/ Stec 2016; Zima 2020) oder in Mehr‐ parteienkonstellationen auch eine Adressierungsfunktion (Auer 2021a; Zima 2018). Auch Frage-Antwort-Sequenzen weisen spezifische Blickmuster auf. So zeigen Rossano (2012a, b), Stivers/ Rossano (2010) und Stivers et al. (2009), dass Rezipient: innen, die während des ersten Paarteils einer Frage-Antwort-Sequenz von Sprecher: innen angesehen werden, den zweiten Paarteil nicht nur häufiger, sondern auch schneller liefern als nicht-angesehene Rezipient: innen. Hier scheint der Blick demnach der Rezipientenmobilisierung zu dienen. Wie auch Lerner (2004) argumentiert, muss allerdings grundsätzlich bedacht werden, dass nicht in allen Konstellationen überhaupt verhandelt werden muss, wer als nächste(r) Sprecher: in agieren soll. So wird etwa in Dyaden immer nur die Turnübernahme an sich verhandelt, aber nicht, wer diese Turnübernahme ausführen soll. Der Blick wählt in Zweierinteraktionen - insbesondere in Frage-Antwort-Sequenzen - also prinzipiell keine nächsten Sprecher: innen aus, weil diese gar nicht ausgewählt werden müssen. 288 Elisabeth Zima <?page no="289"?> 5 Einen äußerst detaillierten Überblick zur Blickforschung mit Bezug zum Turn-Ta‐ king-System, der auch die eingeschränkte Vergleichbarkeit der vielen Studien in diesem Bereich thematisiert, geben Degutyte und Astell (2021). 6 TCU ist die in der Konversationsanalyse gängige Abkürzung für turn constructional unit (Turnkonstruktionseinheit). Darunter werden die Bausteine, aus denen sich Turns (Redebeiträge) zusammensetzen, bezeichnet. Mit dem TRP (transition relevance place) wird jene Stelle bezeichnet, an dem ein Rederechtswechsel, also Turn-Taking, prinzipiell möglich ist. Dies impliziert, dass eine vorangegangene TCU beendet wurde bzw. sich eine laufende TCU ihrem Ende nähert (siehe Imo/ Lanwer 2019: 173). 7 Dazu passen auch die Ergebnisse von Stivers und Rossano (2010) zum Blick als Mittel um Rezipientenreaktionen zu mobilisieren und von Auer und Zima (2021) zum Blickverhalten bei Wortsuchen. In Interaktionen mit mehr als zwei Teilnehmer: innen kommt dem Blick hingegen eine gewichtige Rolle im Turn-Taking-System zu. 5 Dies bestätigen zahlreiche Studien aus den letzten Jahren. So bieten u. a. die Untersuchungen von Streeck (2014), Brône et al. (2017), Auer (2018, 2021a, b), Zima (2018) und Weiß (2018, 2020) vielfältige Evidenz dafür, dass die Ausrichtung des Sprecherblicks auf einen Rezipienten/ eine Rezipientin zu Ende des Turns der Blickselegierung dient: Angesehene Teilnehmer: innen werden als nächste Spre‐ cher: innen ausgewählt bzw. präferiert (siehe Auer 2021a zum Unterschied von „auswählen“ und „präferieren“ im Zusammenhang der Fremdwahl). Dazu kom‐ plementär zeigt Weiß (2018), dass blickselegierte Sprecher: innen, die den Turn nicht übernehmen wollen oder können, durch ihr verbales und nonverbales Verhalten deutlich machen, dass sie sich durchaus als ausgewählte nächste Sprecher: innen verstehen. Sie wissen demnach, dass von ihnen eine entspre‐ chende nächste Handlung erwartet wird und versuchen etwa, den Turn an andere Teilnehmer: innen weiterzugeben. Eine wichtige Rolle für diese Blickselegierung spielt jedoch die zeitliche Platzierung der Blickzuwendung. Grundsätzlich erfüllt nicht jedes Ansehen im Turn eine Selegierungsfunktion, sondern nur Blickzuwendungen in der Nähe einer TCU-Grenze bzw. eines TRPs. 6 Dieses Argument führt Auer (2018, 2021a) genauer aus. Er argumentiert, dass in Mehrparteienkonstellationen generell zwischen Blick zur Adressatenwahl und Blick zur Auswahl nächster Sprecher: innen unterschieden werden muss. So dient ein während eines Turns zwischen Rezipient: innen alternierender Sprecherblick deren gleichzeitiger Adressierung. Nur wenn Sprecher: innen zu Ende einer TCU auf eine(n) spezi‐ fischen Interaktionsteilnehmer: in sehen, kommt diesem Blick eine Fremdwahl‐ funktion zu. Diese ist besonders stark, wenn Sprecher: innen den Blick auf ausgewählte nächste Sprecher: innen in einer Pause an einem TRP halten. 7 Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 289 <?page no="290"?> Ein besonders überzeugendes Argument für die Relevanz des Blicks für das Turn-Taking bietet auch die Studie von Auer (2021b) zu ihr-Fragen in triadischen Interaktionen. Darunter versteht er Fragen, die über die Verwendung des Plu‐ ralpronomens ihr an mehr als einen Rezipienten/ eine Rezipientin gerichtet sind. In den von ihm untersuchten Daten liefern in 74 % der Fälle zuletzt angesehene Rezipient: innen die Antwort bzw. die erste Antwort auf eine ihr-Frage. Die restlichen 16 % der Fälle können nach Auer durch den Interaktionsverlauf erklärt werden (z. B. Simultanstarts nur bei ja/ nein-Antworten; wenn blickselegierte Sprecher: innen verzögern, antwortet stattdessen der/ die Andere). Er schließt daraus, dass auch in den Fällen, in denen verbal mehr als eine Person adressiert ist, keine Selbstwahl stattfindet (wie in der Turn-Taking Machinery von Sacks et al. 1974 angenommen wird), sondern die blickselegierten Sprecher: innen (zuerst) zum Zug kommen. Basierend auf seinen zahlreichen Studien zur Rolle des Blicks zur Fremdwahl kommt Auer (explizit dazu: 2021a, b) zu dem Schluss, dass echte Selbstwahl (Regel 1b der Turn-Taking-Machinery von Sacks et al. 1974) eine sehr seltene Ausnahme und Fremdwahl die Regel ist. Dabei muss aber auch betont werden, dass der Blick nicht die einzige und auch nicht in allen Konstellationen die stärkste Ressource zur Organisation des Sprecherwechsels darstellt. Lerner (2004) hält ähnlich wie Auer (2018) fest, dass der Blick eine insgesamt eher unzuverlässige Ressource für die Fremdwahl darstellt, denn Rezipient: innen müssen den Blick nicht erwidern bzw. sie können unaufmerksam sein und/ oder auf eine Blickselegierung nicht reagieren. Weitaus effizienter und auch Auer (2021b: 4) zufolge, „the prototy‐ pical and best current-speaker-selects-next-technique in multiparty interaction“ ist die Kombination von Ansehen und pronominaler oder namentlicher Anrede. Als besonders ‚wirksam‘ gelten in diesem Zusammenhang turn-initial oder auch turn-final platzierte namentliche Adressierungen, die aber allgemein in Gesprächen sehr selten sind. Sie können außerdem eine ganze Reihe von Funktionen erfüllen, wie etwa Handlungsaufforderung, personifizierte Zuwen‐ dung, Tadel, Aufmerksamkeitselizitierung u. a. (Schwitalla 1993; Lerner 2004; Rendle-Short 2007; Clayman 2012; Günthner 2019; Droste/ Günthner 2021). Im Kontext der Sprecherwechselorganisation dienen sie zudem nicht direkt der Sprecherauswahl, sondern zunächst nur der Aufmerksamkeitselizitierung und der Adressierung. Nur in besonderen sequenziellen Kontexten wie in Frage-Antwort-Sequenzen fungieren sie unmittelbar als Mittel zur Auswahl nächster Sprecher: innen. Hier gelten sie allerdings als besonders starkes Mittel (Lerner 2004; Auer 2021b). 290 Elisabeth Zima <?page no="291"?> 3 Interaktion in Videokonferenzen: technische und wahrnehmungsbezogene Restriktionen und ihre Auswirkungen auf die Interaktion Viele der grundlegendsten Unterschiede zwischen face-to-face Interaktionen in Ko-Präsenz der Teilnehmer: innen und Interaktionen in Videokonferenzen sind wahrnehmungsbezogen (Licoppe/ Morel 2012; Hausendorf 2013, 2015; Lanwer 2019). Zwar erlaubt uns die Videokonferenz einander zu sehen und bietet dadurch Zugang zu wichtigen Informationen zur Aufmerksamkeit un‐ serer Interaktionspartner: innen, zu deren mimischen und in beschränktem Maße gestischen Verhalten sowie ihren nonverbalen Rezipientenreaktionen, die uns zum Beispiel beim Telefonieren fehlen. Ein großes Problem für die Organisation glatter Sprecherwechsel stellen jedoch die Einschränkungen der Wahrnehmungswahrnehmung dar. So nehmen wir in der ko-präsenten Interaktion stets wahr, was unsere Interaktionspartner: innen wahrnehmen bzw. wahrnehmen können bzw. wir machen Annahmen dazu, indem wir ihre Perspektive modellieren (siehe Hausendorf 2015: 5). Diese Annahmen sind Teil des common grounds (Clark 1996) der Gesprächsteilnehmer: innen. In der Videokonferenz fehlt uns hingegen der Zugang zur Wahrnehmung unserer Gesprächspartner: innen. Dies schließt das erwähnte Problem ein, dass wir ihre Blickziele nicht genau eruieren können. Wir wissen also nicht, wohin sie auf ihren Bildschirmen schauen, und wen sie ansehen. Darüber hinaus sehen wir im Bildausschnitt unserer Interaktionspartner: innen zumeist nur den Ober‐ körper oder auch nur den Kopf der Interaktionspartner: innen (talking heads, Licoppe/ Morell 2012) und auch unser Zugang zur ihrer Interaktionsumgebung ist sehr beschränkt, da wir keinen physischen Interaktionsraum miteinander teilen. Das hat weitreichende Konsequenzen (Heath/ Luff 1993; Luff et al. 2016), denn wenn wir in einem Raum mit anderen Interaktionsteilnehmer: innen ko-präsent sind, nehmen wir - meist automatisch, unbewusst und im peripheren Blickfeld - deren Bewegungen wahr. Dies ist für das Turn-Taking relevant, weil uns etwa Kopfbewegungen oder auch Repositionierungen des Oberkörpers (z. B. Aufrichten) anzeigen können, dass sich Interaktionspartner: innen auf einen Turn vorbereiten (Mondada 2007; Jokinen 2010; Holler/ Kendrick 2015). Sie geben uns also Hinweise dazu, was in den nächsten Millisekunden in der Interaktion passieren könnte. Aufgrund der Beschränkungen des Bildaus‐ schnitts und des Fehlens eines geteilten physischen Raums entgehen uns diese Informationen in der Videokonferenz zumindest teilweise. Gerade mit Bezug zu den Möglichkeiten, Zukünftiges zu antizipieren und vorausschauend zu agieren (etwa durch Planung einer eigenen Äußerung), stellen außerdem technische Probleme wie Verzögerungen in der Übertragung von Audio- und Videosignal Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 291 <?page no="292"?> weitere Hürden dar (siehe dazu explizit auch mit Bezug zu daraus resultierenden Sprecherwechselturbulenzen die Studie von Seuren et al. 2021). Das Videobild ist zudem eindimensional, d. h. es hat keine Tiefe, wodurch man die Körper der Gesprächspartner: innen nicht als Körper im Raum wahrnehmen kann. In der face-to-face Interaktion verlassen wir uns aber z. B. auch auf unser räumliches Hören, um Sprecherbeiträge zuzuordnen oder auch, um zu antizi‐ pieren, welche Gesprächspartner: innen sich etwa auf einen Turn vorbereiten (z. B. durch hörbares Einatmen). Das Audiosignal der Videokonferenz liefert im Gegensatz dazu keine Informationen zur Richtung, aus der ein Geräusch/ eine Stimme kommt. Dass dieser Mangel an räumlichen Zuordnungsmöglichkeiten von akustischen Signalen problematisch sein kann, weil er zum Beispiel zur falschen Zuordnung von Äußerungen führen kann, werden wir in Abschnitt 5.1 anhand eines Beispiels sehen. Bevor wir uns den Auswirkungen dieser wahrnehmungsbezogenen Ein‐ schränkungen und der Frage zuwenden, wie Gesprächsteilnehmer: innen in Videokonferenzen Fremd- und Selbstwahl organisieren, gibt der folgende Ab‐ schnitt einen Einblick in das Datenmaterial und die Auswahl der analysierten Sequenzen. 4 Korpus und Methode Die vorliegende Untersuchung stützt sich auf ein Korpus von drei ZOOM-Ge‐ sprächsaufnahmen von insgesamt 105 Minuten Länge. Eine der drei Aufnahmen umfasst eine ZOOM-Interaktion zwischen drei Teilnehmer: innen. An einer weiteren Aufnahme waren vier Proband: innen und an der dritten Aufnahme fünf Personen beteiligt, wobei aber eine Teilnehmerin zunächst recht lange Probleme mit ihrer Internetverbindung hatte und das Gespräch somit über einen längeren Zeitraum nur von vier Gesprächsteilnehmer: innen geführt wurde. Alle Mitwirkenden sind Muttersprachler: innen des Deutschen, einander sehr gut bekannt und im Alter zwischen 20 und 30 Jahren. Alle Gesprächsaufnahmen stammen aus dem Winter 2021/ 22. Die Gesprächsaufnahmen wurden jeweils auf einem Endgerät eines Teilnehmers/ einer Teilnehmerin gestartet und geben deshalb deren Bildschirmansicht wieder. Abb. 1 zeigt zur Illustration ein Stand‐ bild aus der Aufnahme mit fünf Gesprächsteilnehmer: innen. Die Transkription und Annotation der Videos und der dazugehörigen Audiofiles erfolgte im Vide‐ oannotationstool ELAN (Wittenberg et al. 2006) nach den GAT-2 Konventionen (Selting et al. 2009). 292 Elisabeth Zima <?page no="293"?> Abb. 1: Screenshot aus einer Zoom-Konferenzaufnahme mit fünf Teilnehmer: innen Im Sinne einer ersten Annäherung an das Sprecherwechselsystem in Videokon‐ ferenzen liegt der Fokus in diesem Beitrag auf besonders markierten Fällen. Dazu zählen onymische Anreden, die sowohl proaktiv zur Auswahl nächster Sprecher: innen als auch reaktiv nach einem problematischen Sprecherwechsel gebraucht werden, sowie ihr-Fragen und schließlich Fragen, die verbal an keine spezifische(n) Person(en) adressiert sind. Diese Fragen könnten also - zumindest theoretisch - von mehreren Interaktionsteilnehmer: innen beantwortet werden und sind deshalb mit Hinblick auf den Sprecherwechsel potenziell besonders problematisch. Die Gründe für die Beschäftigung mit ihr-Fragen ebenso wie mit verbal nicht adressierten Fragen liegen nicht zuletzt auch in der Möglichkeit zum Vergleich mit Auers Befunden zu face-to-face Interaktionen (Auer 2021b). Dabei muss bezüglich der Fragen, die an keine spezifische(n) Person(en) adressiert werden, betont werden, dass das Fehlen einer verbalen Adressierung nicht ausschließt, dass es andere Gründe dafür gibt, warum Fragende, ebenso wie andere Gesprächsteilnehmer: innen, eine bestimmte Person als Antwor‐ tende besonders geeignet empfinden, und sie somit implizit selegieren (siehe die Möglichkeiten des tacit addressing, Lerner 2004). Hier spielt vor allem Epistemik, d. h. individuelle „territories of knowledge“ (Labov/ Fanshel 1997) und das gemeinsame Wissen der Interaktionsteilnehmer: innen über diese territories of knowledge als Teil des common grounds (Clark 1996) eine Rolle. So argumentiert Auer (2021b) für face-to-face Interaktionen, dass dort alle Fälle, in denen keine Blickselegierung stattfindet oder der/ die vom Fragenden nicht angesehene Spre‐ cher: in antwortet, auf die epistemische Ordnung (Heritage 2012) des Gesprächs, d. h. auf den Interaktionsteilnehmer: innen bekannte Wissensasymmetrien bzw. unterschiedliche epistemische Rechte, zurückgeführt werden können. Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 293 <?page no="294"?> 8 Das schließt alle Namensnennungen in anderen Funktionen, z. B. Thematisierung des Gesprächsteilnehmers/ der Gesprächsteilnehmerin aus. 9 In der triadischen Zoom-Videointeraktion von 50 Minuten Länge wird der Name eines Gesprächsteilnehmers/ einer Gesprächsteilnehmerin hingegen fünf Mal genannt. Aus dem Analysefokus explizit ausgenommen wurden all jene Fragen, die sich eindeutig an vorangegangene oder aktuelle Sprecher: innen richten. Da‐ runter fallen z. B. Nachfragen zum aktuellen Gesprächsthema oder zu einer Erzählung. Diese Fragen sind für diese Untersuchung nicht von Interesse, da der Fokus dieses Beitrags auf der Organisation des Sprechwechsels in ZOOM-Videokonferenzen liegt, unter der Annahme, dass es hier aufgrund der wahrnehmungsbezogenen Einschränkungen entscheidende Unterschiede zur face-to-face Interaktion gibt. In Frage-Antwortsequenzen, bei denen der sequenzielle Kontext vorgibt, welche Gesprächsteilnehmer: innen als Antwor‐ tende präferiert sind, spielt auch in der ko-präsenten face-to-face Interaktion der Blick zur Auswahl dieser Teilnehmer: innen nur eine untergeordnete Rolle. Trotz der recht geringen Größe des Korpus befinden sich in ihm fünfzehn Namensnennungen, die der Auswahl nächster Sprecher: innen dienen, zehn Informationsfragen, die über die Verwendung des Pronomens ihr an alle oder zumindest zwei Interaktionsteilnehmer: innen adressiert werden, und zehn offene, verbal an keine spezifischen Gesprächsteilnehmer: innen adressierte Informationsfragen. 5 Fremd- und Selbstwahl in ZOOM-Videokonferenzen 5.1 Fremdwahl mittels onymischer Anredeformen Zu den auffälligsten, wenn auch wenig überraschenden Beobachtungen bei der Analyse der ZOOM-Gesprächsdaten gehört, dass namentliche Anreden eines Interaktionsteilnehmers als Mittel zur Fremdwahl weitaus häufiger sind als in face-to-face Interaktionen. So finden sich in den 105 Minuten Daten‐ material fünfzehn Namensnennungen in der Funktion der Auswahl nächster Sprecher: innen. 8 In einem Vergleichskorpus von triadischen face-to-face Inter‐ aktionen von 310 Minuten Länge erfüllt hingegen nur eine einzige Namensnen‐ nung diese Funktion. 9 Dabei werden in den Zoom-Daten Namen sowohl proaktiv zur Aufmerksam‐ keitselizitierung und Adressierung eines nächsten Turns an einen spezifischen Teilnehmer/ eine Teilnehmerin als auch reaktiv, d. h. als Reaktion auf einen ver‐ unglückten Sprecherwechsel, eingesetzt. Die quantitative Verteilung ist dabei recht eindeutig. 87 % der Namensnennungen sind als proaktiv zu kategorisieren, 294 Elisabeth Zima <?page no="295"?> 10 Die im Transkript eingefügten Rautenzeichen mit Nummernangabe markieren die Zeitpunkte im Gespräch, zu denen die Standbilder entnommen wurden. und nur in 13 % der Fälle (= zwei Sequenzen) wird der Turn nachträglich einer Person per Namensnennung zugewiesen. Beispiel (1) aus der ZOOM-Konferenz mit fünf Teilnehmer: innen ist ein Beispiel für den proaktiven Gebrauch einer onymischen Anrede. Die Sequenz ist nicht zuletzt deshalb ein repräsentatives Beispiel, weil die Namensnennung, wie in den meisten Fällen in unseren Daten, nach einem Sequenzabschluss‐ punkt steht und einen Themenwechsel einläutet. Ausnahmslos alle Fälle von namentlichen Anreden in den untersuchten Daten sind außerdem Teil von Frage-Antwort-Sequenzen. Dies war keine Vorgabe bei der Erstellung der Kollektion, sondern es stellt ein erstes Ergebnis zu unserer Untersuchung von Namensnennungen dar. Beispiel (1), Geburtstag, 5er-Interaktion, 21: 53.574-21: 58: 620 01 Martin: GEnau. 02 - gehst mal EInem abend vorbei. 03 - <<allgemeines Lachen>> 04 - (2.22) 05 Lola: ähm #1 10 (.) FElix, 06 - #2(-) WO geht ihr nochmal hin auf (.) äh ullas äh, 07 - den #3 geburtstag von der Oma? 08 Felix: (0.64 #4) JA ja. Die fünf Freunde, die sich alle noch aus der Schulzeit kennen, nun aber an unterschiedlichen Orten in Deutschland leben und unterschiedliche Be‐ rufsausbildungen begonnen haben, sprechen zunächst recht lange über Felix Vorbereitungen für die Aufnahmeprüfung für die Polizeiakademie. Im Zuge dessen kommt zur Sprache, dass Felix schon in der Schule durch schlechte topografische Kenntnisse aufgefallen sei und deshalb für die Aufnahmeprüfung vielleicht Nachhilfestunden bei einer allen Teilnehmer: innen bekannten Geo‐ grafielehrerin nehmen sollte. Martin stimmt dem diesbezüglichen Vorschlag von Hans zu und meint scherzhaft, er solle mal einen Abend bei seiner ehema‐ ligen Geografielehrerin vorbeigehen (Zeilen 01-02). Darauf folgen allgemeines Lachen und eine längere Pause von etwas mehr als zwei Sekunden. Danach ergreift Lola das Wort und wählt sich damit selbst als nächste Sprecherin. Sie zögert aber zunächst (ähm gefolgt von einer Mikropause), was darauf Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 295 <?page no="296"?> hindeuten könnte, dass sie nicht sicher ist, ob es nicht noch zu einer Expansion der Sequenz kommt, oder ob der Floor nun tatsächlich offen ist und sie sich selbst wählen darf. Nachdem ihr aber niemand den Turn streitig macht, nennt sie Felix - das Ironieziel der abgeschlossenen Sequenz - beim Namen und elizitiert somit dessen Aufmerksamkeit. Der Angesprochene richtet daraufhin seinen Blick, den er in der Pause und während Lolas Häsitation noch vom Bildschirm abgewandt hatte (Abb. 2, Standbild #1), auf den Bildschirm aus (Abb. 3, Standbild #2). Dies interpretiert Lola offensichtlich als Zeichen, dass Sie nun seine Aufmerksamkeit hat und sie formuliert daraufhin den ersten Paarteil einer Frage-Antwortsequenz (siehe die Zeilen 06-07 und Abb. 4, Standbild #3, Lola und Felix schauen beide auf den Bildschirm). Felix antwortet in weiterer Folge auf Lolas Frage, ob er am Wochenende zur Geburtstagsfeier der Oma seiner Freundin gehe, bestätigend mit JA ja. Sein kurzes Wegsehen in der Pause (0.64) in Zeile 08 vor seiner Antwort (Abb. 5) zeigt dabei schon, bevor er verbal aktiv wird, an, dass er sich auf seinen Turn vorbereitet und also die Fremdwahl annehmen wird. Abb. 2: Standbild #1 296 Elisabeth Zima <?page no="297"?> Abb. 3: Standbild #2 Abb. 4: Standbild #3 Abb. 5: Standbild #4 Ein weiteres Beispiel für eine Namensnennung zur Adressierung einer Frage an eine spezifische Person aus dem Kreis der Interaktionsteilnehmer: innen ist Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 297 <?page no="298"?> Beispielsequenz (2). Auch hier initiiert die namentlich adressierte Frage ein neues Thema nach einem Sequenzabschluss. Beispiel (2) Fahrrad, 4er-Interaktion, 20: 58: 010-21: 14: 230 01 Max: man sieht immer diese blauen SCHILder,= 02 - =und denkt sich so ! WOW! . 03 Franz: JA. 04 - [ist ECHT. ] - 05 Nora: [<<lachend> man DENKT sich so,] 06 - hier könnt ich SITzen; 07 - hätt ich was andRES studiert.> 08 Lisa: <<lachend> ja.> 09 Franz: ((lacht)) 10 - (1.8) 11 Nora: #5 fährst du eigentlich immer noch mim FAHRrad lisa? #6 12 Lisa: (1.3) zur Uni? 13 Nora: JA. 14 Lisa: NEE. 15 - ich hab mir jetzt ein seMESterticket gekauft. In Zeile 01 setzt Max das bisherige Gesprächsthema fort, wonach der Univer‐ sität Freiburg in der Innenstadt auffällig viele Gebäude gehörten. Er erwähnt in diesem Zusammenhang, dass man [im Stadtzentrum] immer diese blauen SCHILder sehe, und referiert dabei metonymisch auf die Uni Freiburg. Franz stimmt seiner Beobachtung zu, während Lisa Franz Bemerkung und [man] denkt sich so ! WOW! . witzelnd elaboriert (siehe die Zeilen 05-07). Nachdem Nora und Franz beide kurz lachen, folgt eine Pause von 1,8 Sekunden. Nora wählt sich daraufhin selbst als nächste Sprecherin und formuliert eine Frage, die sie mittels turn-finaler Namensnennung an die Gesprächsteilnehmer: in Lisa adressiert. Lisa nimmt diese Fremdwahl an, fragt aber zunächst nach einer Pause von 1,3 Sekunden nach, ob sich die Frage auf den Weg zur Uni beziehe. Nachdem Nora dies bestätigt, beantwortet Lisa die Frage aus Zeile 11 in den Zeilen 14 und 15. Wie die beiden Standbilder #5 und #6 zeigen, sehen sowohl die fragende Nora (oben rechts), als auch die angesprochene Lisa (rechts unten) zu Beginn, während und nach Ende der Frage durchgehend auf den Bildschirm. Ob sie sich beide tatsächlich ansehen (bzw. die Videokachel der jeweiligen Gesprächspartnerin), kann nicht eruiert werden. 298 Elisabeth Zima <?page no="299"?> Abb. 6: Standbild #5 Abb. 7: Standbild #6 Ein etwas anderes Beispiel für die Nennung eines Namens der Gesprächsteil‐ nehmer: innen, um eine Frage an die spezifische, genannte Person zu adressieren, ist Beispiel (3). Beispiel (3), die erste Frage geht an, 4er-Interaktion, 00: 05: 330-00: 18: 640 01 Nora: am anfang ist es immer so ein bisschen KOmisch zu reden. 02 - aber mit der ZEIT kommt man da bestimmt rein. 03 - (1.1) 04 Max: ALso (.), 05 - die erste frage geht an FRANZ. 06 Nina: ((lacht)) Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 299 <?page no="300"?> 07 Franz: [WELCHE? ] 08 Max: [WO hast du] wo hast du dein auto abgeholt? 09 Franz: WO? 10 - im sinne von welcher STADT, oder was? 11 Max: ja NEE,= 12 - =weil nora meinte du hast es ABgeholt. Mit der Konstruktion die erste Frage geht an Franz wird eine für natürliche, private Interaktionen wohl eher ungewöhnliche Formulierung gewählt, deren Gebrauch hier aber durch den Interaktionsverlauf erklärt werden kann: Die Aufnahme wurde gerade erst gestartet und Nora thematisiert, dass es wohl am Anfang komisch sei, sich nun ungezwungen zu unterhalten, man aber mit der Zeit wohl reinkomme. Genau diese Ungewöhnlichkeit der Situation greift Max dann ironisch auf, indem er eine sehr markierte Konstruktion zur Interaktions‐ initiierung wählt und dabei den genannten Teilnehmer Franz als präferierten nächsten Sprecher markiert. Franz nimmt diese Form der Fremdwahl an und übernimmt den Turn in den Zeilen 09 und 10. Dabei formuliert er, ähnlich wie zuvor Lisa in Beispiel (2), aber zunächst eine Nachfrage, die sequenziell an Max gerichtet ist und auch von ihm beantwortet wird. In den Beispielen (1) bis (3) werden also proaktiv spezifische Gesprächs‐ teilnehmer: innen namentlich angesprochen und als nächste Sprecher: innen ausgewählt. Beispiel (4) illustriert hingegen den Fall, dass eine Gesprächsteil‐ nehmerin namentlich genannt wird, um ihr explizit das Rederecht zuzuweisen, weil es davor zu einem Simultanstart von zwei Interaktionsparter: innen (Nina und Franz in den Zeilen 07 und 08) und somit zu einem problematischen Sprecherwechsel gekommen ist. Beispiel (4), Colmar, 4er-Interaktion, 3: 42: 010-3: 51: 650 01 Nina: HALbe stunde oder (.) ja, 02 - halbe DREIviertel stunde. 03 Max: das zieht sich halt mehr durch das LÄNDliche; - - da fährt man durch die ganzen [ORTschaften]. 04 Franz: - [((nickt)) ] 05 - ja. 06 Max: das_s ein bisschen- 07 Nina: [WART ihr schon mal in colmar? ] 08 Franz: [ja das DAUert wohl. ] - - - (2.84) 09 Max: LIsa? 300 Elisabeth Zima <?page no="301"?> 11 Die Äußerung könnte natürlich auch nonverbal, etwa mimisch vervollständigt werden. Max Mimik bleibt aber sehr neutral und er wendet seinen Blick vom Bildschirm ab. 10 Lisa [WA, ]#7 11 Nina: <<lachend [WART] ihr schon mal da? ] Thema der Interaktion an dieser Stelle ist die Frage, wie lange man mit dem Auto von Freiburg nach Colmar fahre, denn Nina und Lisa planen einen gemeinsamen Ausflug dorthin. Nina meint zunächst, man benötige etwa eine halbe bis dreiviertel Stunde (Zeilen 01 und 02), was Max um die Bemerkung ergänzt, dass es sich etwas ziehe und man vor allem durch Ortschaften fahre. Parallel zu ORTschaften nickt Franz und stimmt Max schließlich auch noch verbal zu. Max expandiert daraufhin seinen Turn in Zeile 06, bricht ihn aber ab, bevor er einen syntaktischen und semantisch-pragmatischen Abschlusspunkt erreicht. 11 Nina und Franz wählen sich daraufhin beide selbst als nächste Sprecher: innen. Es kommt zu einem Simultanstart und einer Überlappungsphase von 800 Milli‐ sekunden Dauer, während derer beide vollständige Äußerungen produzieren. Darauf folgt eine Pause von fast drei Sekunden, bis Max mit Frageintonation LIsa? äußert. Er nennt also den Namen der vierten Interaktionsteilnehmerin, die allerdings an dem Simultanstart gar nicht beteiligt war. Er scheint Ninas Stimme fälschlicherweise Lisa zugeordnet zu haben und möchte ihr deshalb den Turn zuweisen, damit sie ihren Redebeitrag noch einmal ohne Überlappung wiederholen kann. Lisa, die nun namentlich selegierte nächste Sprecherin, reagiert darauf mit WA, und zeigt auch mimisch über die hochgezogenen Augenbrauen an (siehe Abb. 8, rechts unten), dass sie nicht erwartet hatte, an dieser Stelle ihren Namen zu hören und also als nächste Sprecherin ausgewählt zu werden. Dass Nina von einem Irrtum seitens Max ausgeht und sich als eigentlich selegierte und legitime nächste Sprecherin sieht, zeigt sich daran, dass sie parallel zu Lisas Nachfrage ihre bereits zuvor gestellte Frage zu wiederholen beginnt. An diesem Beispiel zeigt sich demzufolge besonders deutlich, wie vor allem die Einschränkung des räumlichen Hörens in der Videokonferenz zu Sprecherwechselturbulenzen und einem Missverständnis führt. Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 301 <?page no="302"?> Abb. 8: Standbild #7 Nach diesen ersten Beobachtungen zur Rolle von Namensnennungen zur Aus‐ wahl nächster Sprecher: innen in ZOOM-Videokonferenzen, widmen wir uns nun der Frage, wie Gesprächsteilnehmer: innen auf ihr-Fragen reagieren und hier die Turnübernahme untereinander verhandeln. 5.2 Sprecherwechseldynamiken nach ihr-Fragen Im Datenmaterial finden sich zehn Fragen, die über die Verwendung des Pluralpronomens ihr an mehr als einen Gesprächsteilnehmer/ eine Gesprächs‐ teilnehmerin adressiert sind und also zumindest potenziell eine Antwort von mehreren Gesprächsteilnehmer: innen relevant setzen. Wie Auer (2021b) gezeigt hat, spielt bei ihr-Fragen in der face-to-face Interaktion der Blick eine ganz entscheidende Rolle für die Turnzuweisung, denn in ca. drei Viertel der Fälle antworten die zuletzt vom Fragenden Angesehenen (zuerst) auf die ihr-Frage. Nachdem der Sprecherblick diese Fremdwahlfunktion in der Videokonferenz nicht übernehmen kann, stellt sich also die Frage, wie hier mit solchen Fragen umgegangen wird. Theoretisch müssten massive Sprechwechselturbulenzen auftreten, da ja mindestens zwei Teilnehmer: innen gleichermaßen selegiert sind und dasselbe Recht, aber auch dieselbe Plicht haben, den Turn zu übernehmen. Die Analyse der zehn Fälle zeigt aber, dass es an diesen Stellen keineswegs zu besonders markierten Sprechwechselturbulenzen kommt, sondern dem Blick‐ verhalten eine ganz entscheidende Rolle zur Aushandlung der Rederechtsinan‐ spruchnahme zwischen den ko-adressierten Gesprächsteilnehmer: innen zukommt. Werfen wir aber zunächst einen Blick auf die quantitative Verteilung mit Bezug zur Frage, wer auf ihr-Fragen antwortet. Diese zeigt, dass in drei Fällen nur eine(r) der ihr-adressierten Gesprächsteilnehmer: innen antwortet. In sechs 302 Elisabeth Zima <?page no="303"?> Fällen antworten beide, wobei es in drei Fällen zu einem Simultanstart kommt und in weiteren drei Fällen beide Adressierten nacheinander antworten. In einem weiteren Fall antwortet niemand bzw. die Antwort ist gemeinsames Lachen (auf die Frage: seht ihr Max [= einer der Gesprächsteilnehmer: innen] auch so? (= als Kandidat bei der TV-Sendung der Bachelor)). Zunächst fällt auf, dass alle Fragen, auf die letztlich nur eine Person antwortet, eine längere Antwort erfordern, also nicht mit ja oder nein beantwortet werden können. In allen Fällen zeigt dabei einer der ko-selegierten Teilnehmer: innen den Turnverzicht durch sein/ ihr multimodales Verhalten an. Ein Beispiel ist die Sequenz (5) aus den triadischen Daten. Beispiel (5), Klausuren, 25: 39: 000-25: 44: 260 01 Laura: was schreibt #8IHR alles? 02 - #9(1.0) #10(0.33) 03 Sandra: #11 hmm (.) ich schreib #12 irgendwie ! SU! per wenig, 04 - ich hab ja dieses be er de hab ich ja NOCHmal geschrieben, Die drei Freundinnen Laura, Sandra und Mara sind Studentinnen und Laura hat gerade erzählt, dass sie sich für sehr viele Klausuren angemeldet hat, aber überlegt, von zumindest einer zurückzutreten. Sowohl Mara als auch Sandra ermutigen sie dazu. Im Gegenzug fragt nun Laura, für welche Klausuren sich ihre Gesprächspartner: innen angemeldet haben und formuliert die ihr-Frage was schreibt IHR denn alles? . Während Laura die Frage stellt, schauen sowohl Mara als auch Sandra auf ihren jeweiligen Bildschirm (Abb. 9, Standbild #8). Es folgt eine Pause von 1.33 Sekunden, in der zunächst keine der beiden Ange‐ sprochenen antwortet. Ihre Körperhaltungen bleiben ebenso wie ihre Mimik und die Blickausrichtungen beinahe unverändert (Abb. 10). Nach einer Sekunde beginnt Sandra jedoch den Blick vom Bildschirm nach rechts oben abzuwenden (Abb. 11), während Mara weiterhin in ihrer Haltung verharrt. Dass Sandra wegsieht und sich in weiterer Folge zu bewegen beginnt, macht eine Antwort von ihr erwartbar und tatsächlich übernimmt sie auch den Turn und beginnt die Frage zu beantworten. Mara hingegen bleibt in der Rezipientinnenrolle. Sie wird nicht verbal aktiv und auch ihr Verharren in der gleichen Position sowie ihre unveränderte Mimik lassen darauf schließen, dass sie Sandra den Vortritt lässt und auf ihren legitimen Turnanspruch verzichtet. Mara konkurriert also nicht um das Rederecht und tatsächlich beantwortet sie die Frage auch im weiteren Gesprächsverlauf nicht. Das Beispiel zeigt also, dass hier Blick und Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 303 <?page no="304"?> 12 In dieser Aufnahme sind die Ränder der Videokacheln der aktuellen Sprecherinnen bzw. der Sprecherin, die sich gerade auf ihren Turn vorbereitet, zur besseren Orientierung farbig markiert. Bewegung des Oberkörpers und Kopfes relevante Informationen dazu liefern, wer einen Turn zu übernehmen bereit(er) ist. Diese Informationen sind den Interaktionsteilnehmer: innen zugänglich, denn Mara sieht, dass Sandra sich offensichtlich auf die Turnübernahme vorbereitet und sie also im Moment trotz verbaler Ko-Selegierung nicht aktiv werden muss bzw. dies auch ab einem gewissen Punkt nicht mehr kann, ohne eine Überlappung zu provozieren. Abb. 9: 12 Standbild #8 Abb. 10: Standbild #9 304 Elisabeth Zima <?page no="305"?> Abb. 11: Standbild #10 Abb. 12: Standbild #11 Abb. 13: Standbild #12 Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 305 <?page no="306"?> 13 Dies ist nicht zuletzt deshalb auch ein bisschen überraschend, weil Maras Turn in Zeile 06, wie Abb. 14 zeigt, mit den Rezipientenreaktionen Lachen (Laura) und Lächeln (Sophie) bedacht wird und man somit eigentlich davon ausgehen könnte, dass dies als Ratifizierung des story prefaces seitens der Rezipientinnen und somit als Turnzuweisung gelten könnte. Auch in Beispiel (6) aus derselben Videokonferenz zeigt Mara wenig Interesse am Turn. Zwar antwortet sie zuerst auf die Erzählaufforderung in Zeile 03 (°hh und wie war bei euch WEIHnachten leute? ), aber ihre Antwort ! VIE: L! . in Zeile 06 ist keine vollständige, adäquate Antwort auf die gestellte Frage. Zwar könnte man hier von einem story preface (Sacks 1992) sprechen, das eine elaborierte Erzählung projiziert, aber als auch Lara in Zeile 07 über das turnvorbereitende ahm anzeigt, dass sie gerne erzählen würde, macht Mara mit ihrem nonverbalen Verhalten deutlich, dass sie den Turn Laura überlässt. So lässt sie ihr auch mimisch stark akzentuiertes ! VIE: L! . (siehe Abb. 14) danach ohne weitere Erläuterung im Raum stehen, atmet hörbar aus und nimmt, als Laura zu sprechen beginnt (Abb. 15), 13 körperlich und verbal wiederum die Rezipientenrolle ein. Dabei hält sie den Blick auf dem Bildschirm und kehrt zu ihrer physischen Ausgangsposition (vor der Antwort) zurück. Laura zeigt hingegen das für Sprecher: innen, die sich in Konkurrenzsituationen durchsetzen wollen, typische Blickverhalten: Sie sieht weg. Dabei spricht sie weiter und beginnt zu erzählen (siehe Zima et al. 2019). Beispiel (6), Weihnachten, 10: 54: 980-11: 07: 660 01 Sandra: ja voll GUT. 02 Laura: ! JA! . 03 Sandra: °hh und wie war bei euch WEIHnachten leute? 04 Laura: ((lacht)) 05 Sandra: erZÄHLT. 06 Mara: ! VIE: #13[L! .] ((atmet hörbar aus)) 07 Laura: - [ahm] 08 - ((lacht)) 09 - wah #14 ich WEIß nich; = 10 - =also ich find WEIHnachten ist bei uns immer relativ harmOnisch, 11 - im vergleich zu ANderen (.) 12 - ANderen 13 Sandra: ((lacht)) 14 Laura: ahm (.) TAgen. 306 Elisabeth Zima <?page no="307"?> Abb. 14: Standbild #13 Abb. 15: Standbild #14 Während in den Beispielen (5) und (6) nur eine der eigentlich selegierten Teilnehmer: innen eine (adäquate) Antwort liefert, antworten in zwei Drittel der Fälle alle Angesprochenen. Dabei zeigt sich ein grundsätzlicher Unterschied zwischen den ihr-Fragen, die von nur einer Person beantwortet werden und den Fragen, die von allen beantwortet werden. In die erste Kategorie fallen jene Fragen, die eine elaboriertere Antwort erfordern. Das trifft etwa auf Beispiel (6) zu, denn die Frage fordert zu einer Erzählung auf. Informationsfragen, die auch mittels einer kurzen Antwort beantwortet werden können, werden hingegen nacheinander oder auch gleichzeitig von allen Angesprochenen beantwortet. Ein Beispiel dafür ist die ihr-Frage aus der Sequenz (4) (Wart ihr schon mal in Colmar? ), auf die aber nur zwei der möglichen drei selegierten Sprecher: innen antworten, wobei die Antworten einander ohne Überlappung folgen. Auch Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 307 <?page no="308"?> Sequenz (7) ist ein Beispiel für eine Informationsfrage, die von beiden Ange‐ sprochenen beantwortet wird. Allerdings kommt die dispräferierte Antwort im Vergleich zur präferierten Antwort verzögert und nur auf Nachfrage, dann aber in recht elaborierter Form. Beispiel (7), Gym, 22: 55: 410-22: 58: 380 01 Sandra: oh FREUNde, 02 - habt ihr euch jetzt unser GYM einen monat länger gewünscht? 03 Laura: ! JA: ! 04 - (0.93) 05 Sandra: ja? 06 Mara: ((verzieht das Gesicht))#15 07 Sandra: ICH schon. 08 - (0.87) 09 Mara: ich [kauf_s mir aber ] TROTZdem. 10 Laura: - [ich hab_s von meinem] 11 Mara: ((lacht)) 12 Laura: also ich hab_s mir nicht geWÜNSCHT, 13 - aber ich hab halt- 14 Sandra: du GÖNNST es dir. Sandra fragt, ob sich Laura und Mara, die sie zunächst kollektiv in Zeile 01 mit oh Freunde adressiert, die Monatsgebühren für das Fitnesscenter, das sie alle besuchen, zu Weihnachten gewünscht haben. Dies scheint so abgesprochen gewesen zu sein. Laura antwortet sofort mit einem lauten, betonten und Enthu‐ siasmus vermittelnden ! JA: ! . Mara schweigt hingegen für fast eine Sekunde, worauf Sandra sequenziell offensichtlich an Mara gerichtet mit ja? nachfragt. Mara antwortet darauf mimisch verneinend (siehe Abb. 16, Standbild #15), bevor sie hinzufügt, dass sie die Mitgliedschaft jedoch selbst bezahlen werde (siehe Zeile 09). In diesem Fall ist eine Antwort von beiden sicherlich zwingend gewesen, geht es doch an dieser Stelle nicht nur darum, dass jemand den Turn übernimmt und das Gespräch damit fortsetzt, sondern hier wird Information erfragt, die für die Planung gemeinsamer Aktivitäten in der Zukunft bedeutsam ist und somit von beiden geliefert werden muss. Dabei wird die präferierte Antwort zuerst gegeben und die dispräferierte nachgeliefert. 308 Elisabeth Zima <?page no="309"?> Abb. 16: Standbild #15 Ein Sonderfall ist hier vielleicht Beispiel (8), denn in diesem Fall würde es ei‐ gentlich reichen, wenn nur eine der beiden Angesprochenen eine Antwort gäbe. Tatsächlich reagieren aber beide simultan auf die Frage nach dem Termin der Prüfung, die sie beide absolvieren möchten. Dabei beantwortet Laura die Infor‐ mationsfrage zunächst dahingehend, dass sie die genaue Antwort nicht kennt. Da sie aber eigentlich durchaus in ihr „epistemisches Gebiet“ fällt - schließlich sprechen die drei schon länger über diese Prüfung - und hier Nicht-Wissen tendenziell gesichtsbedrohend ist, schwächt sie ihre Nicht-Wissensbekundung nach der Antwort Maras etwas ab. Dabei stimmt sie Mara zunächst zu und antwortet schließlich mit irgendwann im FEbruar. Diese Antwort ist sowohl mit ihrer eigenen ersten Reaktion als auch mit Maras Antwort kompatibel. Beispiel (8), Didaktikprüfung, 35: 03: 870-35: 09: 560 01 Sandra: wann HABT ihr die denn? 02 - (1.1) 02 Laura: [das weiss ich AUCH nicht genau.] 03 Mara: [ende FEbruar. ] - 04 Laura: wenn das prüf- 05 - ja geNAU. 06 - irgendwann im FEbruar. Die Untersuchung der Sprecherwechseldynamiken nach ihr-Fragen in den ZOOM-Daten zeigt also, dass im Unterschied zur der face-to-face Interaktion, wo der Sprecherblick präferierte Antwortende bzw. Erstantwortende selegiert (Auer 2021b), hier untereinander ausgehandelt werden muss, wer antwortet bzw. wer zuerst antwortet. Dabei setzen die Interkationsteilnehmer: innen aber Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 309 <?page no="310"?> 14 Weiß (2018) beschreibt für face-to-face Interaktionen darüber hinaus die Möglichkeit, dass blickselegierte Sprecher: innen den Blick noch vor dem TRP vom Sprecher/ der Sprecherin abwenden, um nicht ausgewählt zu werden. In den ZOOM-Daten sehen wir dieses Blickverhalten nicht. Dies mag an der recht geringen Datenmenge und der Fokussierung auf onymische Anreden und Frage-Antwort-Sequenzen liegen. Die Frage, ob dieses Blickverhalten zur Anzeige, dass man den Turn nicht will, auch in Videokonferenzen zum Einsatz kommt, bleibt also im Moment offen. grundsätzlich dieselben multimodalen Strategien ein, die auch in der face-to-face Interaktion zur Anwendung kommen (siehe Weiß 2018; Zima et al. 2019): Wenn sie den Turn nicht wollen, sehen sie weiterhin auf den Bildschirm und somit auf ihre Gesprächspartner: innen. Sie verändern ihre körperliche Position nicht und zeigen auch gestisch oder mimisch nicht an, dass sie einen Turn vorbereiten. Vor allem werden sie verbal nicht aktiv. Diejenigen, die die Antwort übernehmen wollen, wenden hingegen ihren Blick vom Bildschirm ab und positionieren sich auch körperlich als neue Sprecher: innen, d. h. sie rücken z. B. in die Bildmitte, setzen sich auf, nehmen Hände aus dem Gesicht etc. (siehe Beispiel (5)). Somit wird bereits vor dem eigentlichen Sprechbeginn für alle ersichtlich, dass sie den Turn zu übernehmen beabsichtigen. Kommt es zu einem Simultanstart mehrerer Sprecher: innen, setzen sich jene Sprecher: innen durch, die den Blick vom Bildschirm abwenden und ohne Rücksicht auf die konkurrierenden Sprecher: innen den Turn zu Ende bringen. Dies entspricht dem Muster, das Zima et al. (2019) für Simultanstarts in triadischen face-to-face Interaktionen beschrieben haben. Mit Bezug zur Frage, wie frequent Selbstwahl in Videokonferenzinterakti‐ onen ist, zeigen die ihr-adressierten Fragen demnach, dass die Fragenden hier tatsächlich keine Einzelpersonen als nächste Sprecher: innen auswählen. An dieser Stelle kommt es aber nicht unbedingt zur Selbstwahl aller möglichen Antwortenden, sondern mögliche, selegierte nächste Sprecher: innen können sehr deutlich ihren Turnverzicht anzeigen bzw. den Turn an andere Personen weiterweisen. 14 Eine weitere interessante sequenzielle Umgebung, um sich der Frage zu nähern, wie Gesprächsteilnehmer: innen in Videokonferenzen Turnübernahmen untereinander aushandeln, sind zudem Informationsfragen, die verbalsprach‐ lich an gar keine spezifischen Gesprächsteilnehmer: innen adressiert sind und somit dem Turn-Taking-System nach Sacks et al. (1974) zufolge zwingend über die Selbstwahl einer oder mehrerer Gesprächsteilnehmer: innen gelöst werden müssten. Aufgrund der Vorgaben zur Länge des Beitrags können diesbezüglich hier aber nur ein paar allgemeine Beobachtungen vorgestellt werden. 310 Elisabeth Zima <?page no="311"?> 15 Aus dem Interaktionsverlauf heraus wird hier deutlich, dass dieses „du“ hier generisch gebraucht wird. 5.3 Verbal nicht adressierte Informationsfragen Das Datenmaterial umfasst zehn Informationsfragen, die Sprecher: innen stellen, ohne eine Präferenz für eine spezifische Person oder mehrerer Personen als Ant‐ wortende anzuzeigen. Dabei ist klar, dass mehrere Gesprächsteilnehmer: innen das Wissen hätten, um die Frage zu beantworten. Dazu gehören die folgenden Fragen: (9) „mit der herz ZEHN hast du 15 kEInen bedienzwang oder doch? “ (4er-Interaktion, alle vier Teilnehmer: innen spielen Skat, wohl auch regelmäßig gemeinsam) (10) „wie lang FÄHRT man nach straßburg? “ (4-er Interaktion; zwei der Teilnehmer: innen haben gerade von einem gemeinsamen Shopping-Ausflug nach Straßburg erzählt) (11) „machen wir jetzt einfach WEIter? “ (3-er Interaktion; eine der Teilnehmer: innen war wegen technischer Probleme für ein paar Minuten aus der Videokonferenz ausgestiegen und fragt nach dem Wiedereintritt, ob das Gespräch/ die Aufnahme nun einfach fortgesetzt werden soll.) (12) „wann ist denn DAS gewesen? am DIENStag? “ (4er-Interaktion, Frage zu Treffen der vier Gesprächsteilnehmer: innen vor einigen Tagen) (13) „wieso heißt es nicht einfach HAID? in der STADT steht noch haid; Oder? “ (4er-Interaktion, alle vier wohnen in Freiburg und kennen somit den Stadtteil Haid) (14) „apropos WEIHnachtsmarkt; (-) findet der in freiburg dieses mal STATT? “ (4er-Interaktion, alle vier wohnen in Freiburg) Wie diese nicht exhaustive Liste zeigt, sind hier nur Fragen berücksichtigt worden, für die man aus dem Interaktionsverlauf heraus schließen kann, dass potenziell mehrere Gesprächsteilnehmer: innen die epistemischen Vorausset‐ zungen mitbringen, um sie zu beantworten. Es ist nicht auszuschließen, dass dies auf weitere Fragen im Datenmaterial zutrifft, dies aber aus der Beobachter‐ perspektive nicht erschlossen werden kann, weil nur eine: r antwortet und das Turn-Taking glatt verläuft. Die nachfolgenden Analysen und Bemerkungen sind deshalb als erste Beobachtungen zu lesen. Aus ihnen lassen sich Hypothesen ableiten, die schließlich an einem größeren Datenset zu testen wären. So legt die Analyse dieser zehn Fälle nahe, dass bei der Selbstwahl der jeweiligen Antwortenden bzw. der Akzeptanz dieser Selbstwahl nicht nur das Wissen der Gesprächsteilnehmer: innen, sondern vor allem ihre epistemische Autorität eine Rolle spielen. Dies trifft auf die Fragen (9) bis (11) und ähnliche Fragen zu, weniger aber auf Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 311 <?page no="312"?> Fragen, die gar kein Expertenwissen voraussetzen (Fragen (12) bis (14)). So antwortet beispielsweise in der Interaktion mit vier Teilnehmer: innen, in der lange über Skatpartien gesprochen wird, immer derselbe Teilnehmer auf Regelnachfragen (siehe Frage (9)). Er scheint also in der Interaktion als Skatexperte zu gelten. Auf die Frage nach der Fahrtdauer von Freiburg nach Straßburg (10) antwortet die Teilnehmerin, die auf der Fahrt am Steuer saß. Die beiden anderen Gesprächsteilnehmer: innen bestätigen danach ihre Angaben zur Fahrtdauer. Auf die Frage, wie man sich nach den technischen Störungen der ZOOM-Konferenz verhalten solle (Frage (11)), antwortet jene Teilnehmerin, die die Aufnahme organisiert hat und aufzeichnet. Auch hier stimmt danach die dritte Gesprächsteilnehmerin dem Vorschlag der zuerst Antwortenden zu. Für die Beantwortung der Fragen (12) bis (14) ist hingegen eher kein Expertenwissen von Nöten. Auch kann man hier annehmen, dass alle Ge‐ sprächsteilnehmer: innen gleichermaßen berechtigt wären zu antworten. Dies scheint zu erklären, warum es in diesen Fällen tatsächlich auch zu mehr Simultanstarts ebenso wie Mehrfachantworten kommt. So antworten zwei Gesprächsteilnehmer: innen etwa auf die Frage, ob der Weihnachtsmarkt in Freiburg stattfinden wird (Frage (12)), in Überlappung wortgleich mit ich GLAUB schon. Der Dritte antwortet nicht. Auf die Frage, ob bei einer Straßenbahnlinie in Freiburg der Stadtteil Haid als Ziel angegeben steht (Frage (13)), antworten zwei Teilnehmer: innen nacheinander mit ja. Auf die Frage, ob das letzte gemeinsame Treffen am Dienstag stattgefunden habe (Frage (14)), antworten sogar alle drei Interaktionspartner: innen, eine mit einem zögernden ja, eine weitere in Überlappung dazu mit mhm, während der dritte Teilnehmer mimisch epistemische Unsicherheit anzeigt (siehe Abb. 17, Sprecher Franz, oben links). Abb. 17: Standbild #16 312 Elisabeth Zima <?page no="313"?> Die Analyse dieser zehn Frage-Antwort-Sequenzen legt demnach folgende, tentative Schlussfolgerung nahe: In all jenen Fällen, in denen nicht aufgrund epistemischer Autoritäten, die Teil des common grounds der Gesprächsteil‐ nehmer: innen sind, klare Präferenzen für spezifische Personen als Antwortende bestehen, kommt es in den Videokonferenzen zu mehr Überlappungen und Mehrfachantworten. In der face-to-face Interaktion antworten hingegen in der großen Mehrheit der Fälle die zuletzt angesehenen und somit blickselegierten Teilnehmer: innen. Nachdem der Blick in Videokonferenzen nicht selegieren kann, kommt hier demnach Regel 1b der Turn-Taking-Machinery nach Sacks et al. (1974) zur Anwendung: Eine oder mehr Gesprächsteilnehmer: innen wählen sich selbst. 6 Fazit Die hier präsentierte Untersuchung zu Aspekten des Turn-Takings in ZOOM-Vi‐ deokonferenzen zeigt, dass Gesprächspartner: innen in Videokonferenzen an‐ dere Mittel zur Auswahl nächster Sprecher: innen anwenden als in Interakti‐ onen, in den Teilnehmer: innen einen Interaktionsraum miteinander teilen. Bei der Aushandlung der Turnübernahme zwischen ko-selegierten Gesprächsteil‐ nehmer: innen sehen wir hingegen ähnliche Muster, wie sie für die face-to-face Interaktion beschrieben wurden. So zeigt sich etwa, dass die Auswahl nächster Sprecher: innen in Videokon‐ ferenzen weitaus frequenter über Namensnennung erfolgt als in ko-präsenten face-to-face Interaktionen. Dabei wird der Name zumeist (87 % der Fälle) proaktiv und als erster Paarteil einer Frage-Antwort-Sequenz genannt. Diese läuten zudem oft einen Themenwechsel ein und werden nach Sequenzabschlus‐ spunkten (eventuell inklusive einer längeren Pause) platziert. Seltener (13 % der Fälle) wird der Turn nachträglich, d. h. nach einem problematischen Turnüber‐ gang, über eine Namensnennung spezifischen Teilnehmer: innen zugewiesen. Ihr-Fragen berechtigen prinzipiell alle adressierten Gesprächsteil‐ nehmer: innen zur Antwort bzw. sie fordern eine Antwort von allen Adressierten ein. Für triadische face-to-face Interaktionen hat Auer (2021b) gezeigt, dass hier zuletzt vom Fragenden Angesehene blickselegiert sind und eine (erste) Antwort von ihnen präferiert wird. In der Videokonferenz kann der Sprecherblick diese Auswahlfunktion nicht erfüllen. Die Analyse der ihr-Fragen und ihrer Bean‐ twortungen zeigt hier, dass in den Fällen, in denen die Frage eine längere Ant‐ wort oder gar eine Erzählung relevant setzt, nur ein Gesprächsteilnehmer/ eine Gesprächsteilnehmerin antwortet. Diese wählen sich aber nicht einfach selbst, sondern ko-selegierte Teilnehmer: innen zeigen den Turnverzicht an. Hier findet Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 313 <?page no="314"?> also offensichtlich gezieltes Monitoring der ko-selegierten Teilnehmer: innen statt. Die Mittel der Anzeige zum Turnverzicht sind dabei die gleichen, die für die ko-präsente, face-to-face Interaktion beschrieben wurden (allen voran Halten des Blicks auf den Bildschirm, d. h. Nicht-Wegsehen; keine motorische Aktivität). Informationsfragen, die mit einer kurzen Antwort (meist ja/ nein) beantwortet werden können, werden hingegen von allen ihr-adressierten Ge‐ sprächsteilnehmer: innen beantwortet, entweder simultan und in Überlappung oder nacheinander. Das multimodale Verhalten ähnelt dabei stark dem für face-to-face Interaktionen beschriebenen Verhalten in Situationen, in denen um das Rederecht konkurriert wird (siehe Zima et al. 2019; Weiß 2020). Abschließend zeigt die Analyse der Reaktionen auf Fragen, die zumindest verbal an keine spezifischen Gesprächstteilnehmer: innen adressiert sind, aber von mehr als einem Teilnehmer/ einer Teilnehmerin beantwortet werden könnten, eine etwas stärkere Tendenz zu mehr Sprecherwechselturbulenzen, wobei hier die Epistemik für die Selbstwahl der Antwortenden und der Akzep‐ tanz dieser Selbstwahl entscheidend zu sein scheint. So ist zu beobachten, dass jene Sprecher: innen, die die größte epistemisches Autorität zur Beant‐ wortung der Frage zu haben scheinen, (zuerst) antworten. Da dieses Wissen um die epistemische Autoritäten Teil des common grounds der Gesprächsteil‐ nehmer: innen ist, läuft der Sprecherwechsel glatt ab, offensichtlich weil sich jene Sprecher: innen, die die größte epistemische Autorität besitzen, sich dessen bewusst sind und sich selegiert fühlen, während die anderen Gesprächsteil‐ nehmer: innen diese Einschätzung teilen und nicht infrage stellen. Mit anderen Worten: Sprecher: innen, die sich nicht selbst wählen, wissen, dass andere Teil‐ nehmer: innen eine größere epistemische Autorität haben. Sie warten deshalb ab und wählen sich nicht selbst. Dies ist anders bei Fragen, deren Beantwortung kein Expertenwissen oder besondere epistemische Rechte vorausbzw. relevant setzen. Hier kommt es tatsächlich vermehrt zu Selbstwahlen und Mehrfachant‐ worten (sowohl in Überlappung als auch nacheinander geäußert). Die Studie zeigt also, dass auch in Videokonferenzen das Turn-Taking keineswegs chaotisch abläuft und sich nicht ständig mehrere Gesprächsteil‐ nehmer: innen selbst wählen. Rezipientenseitig sehen wir sehr ähnliche Ver‐ haltensmuster wie in Interaktionen ko-präsenter Teilnehmer: innen. Dies ist tatsächlich auch keineswegs unerwartet, da es sich hier um implizite, erlernte und verinnerlichte Muster handelt, die wir auch in neuen Kommunikationsme‐ dien anwenden, wenn und solange sie erfolgreich sind. Das erklärt auch, warum wir zur Fremdwahl mehr onymische Anreden finden. Hier handelt es sich um eine Anpassung an die Gegebenheiten des Mediums, das uns daran hindert, den Blick zur Fremdwahl einzusetzen. Dabei bleibt die Frage offen, ob wir 314 Elisabeth Zima <?page no="315"?> eine Blickselegierung nicht trotzdem versuchen, d. h. als Sprecher: in bestimmte Interaktionsteilnerhmer: innen (bzw. deren Videokachel) gegen Ende unseres Turns fokussieren, um sie mit dem Blick zu selegieren. Dies wäre erwartbar, da in uns allen, auch nach den vielen Videokonferenzen während der COVID19-Pan‐ demie, die multimodalen Funktionsweisen des Turn-Taking-Systems in der ko-präsenten Interaktion sehr stabil verankert sind. Dazu könnten aber letztlich nur Eyetracking-Studien Aufschluss geben. Literatur Auer, Peter (2018). Gaze, addressee selection and turn-taking in three-party interaction. In: Brône, Geert/ Oben, Bert (Hrsg.). Eye-tracking in Interaction. Studies on the role of eye gaze in dialogue. Amsterdam: Benjamins, 197-231. Auer, Peter (2020). Die Struktur von Redebeiträgen und die Organisation des Spreche‐ rwechsels. In: Auer, Peter/ Birkner, Karin/ Bauer, Angelika/ Kotthoff, Helga (Hrsg.). Einführung in die Konversationsanalyse. Berlin: De Gruyter, 106-253. Auer, Peter (2021a). Turn-allocation and gaze: A multimodal revision of the “cur‐ rent-speaker-selects-next” rule of the turn-taking system of conversation analysis. Discourse Studies 23 (2), 117-140. Auer, Peter (2021b). Gaze selects the next speaker in answers to questions pronominally addressed to more than one co-participant. Interactional Linguistics 1 (2), 154-182. Auer, Peter/ Zima, Elisabeth (2021). On word searches, gaze, and co-participation. Ge‐ sprächsforschung - Online-Zeitschrift zur verbalen Interaktion 22 (2021), 390-425. Beattie, Geoffrey (1978). Floor apportionment and gaze in conversational dyads. British Journal of Social and Clinical Psychology 17 (1), 7-15. Beattie, Geoffrey (1979). Contextual constraints on the floor-apportionment function of speaker-gaze in dyadic conversations. British Journal of Social & Clinical Psychology 18 (4), 391-392. Brône, Geert/ Oben, Bert/ Vranjes, Jelena/ Jehoul, Annelies/ Feyaerts, Kurt (2017). Eye gaze and viewpoint in multimodal interaction management. Cognitive Linguistics 28 (3), 449-484. Clark, Herbert (1996). Using Language. Cambridge: Cambridge University Press. Clayman, Steven (2012). Address terms in the organization of turns at talk: The case of pivotal turn extensions. Journal of Pragmatics 44 (13), 1853-1867. Degutyte, Ziedune/ Astell, Arlene (2021). The Role of Eye Gaze in Regulating Turn Taking in Conversations: A Systematized Review of Methods and Findings. Front Psychol. 12, 616471. doi: 10.3389/ fpsyg.2021.616471. Duncan, Starkey (1972). Some signals and rules for taking speaking turns in conversa‐ tions. Journal of Personality and Social Psychology 23, 283-292. Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 315 <?page no="316"?> Droste, Pepe/ Günthner, Susanne (2021). Entacting ‘being with you’: vocative uses of du (‘you’) in German everyday interaction. Pragmatics 31 (1), 87-113. Goodwin, Charles (1980). Restarts, Pauses, and the Achievement of a State of Mutual Gaze at Turn-Beginning. Sociological Inquiry 50 (3-4), 272-302. Günthner, Susanne (2019). Namentliche Anreden in onkologischen Aufklärungsgesprä‐ chen: eine interaktional ausgerichtete Studie zu Formen und Funktionen onymischer Anreden. Abrufbar unter: https: / / arbeitspapiere.sprache-interaktion.de/ 82-susanne-g uenthner-03-2019.pdf (Stand: 2.5.2022) Hausendorf, Heiko (2013). On the Interactive Achievement of Space - and Its Possible Meanings. In: Auer, Peter/ Hilpert, Martin/ Stukenbrock, Anja/ Szmrezcsanyi, Benedikt (Hrsg.). Space in Language and Linguistics: Geographical, Interactional and Cognitive Perspectives. Berlin: De Gruyter, 276-303. Hausendorf, Heiko (2015). Interaktionslinguistik. In: Eichinger, Ludwig M. (Hrsg.). Sprachwissenschaft im Fokus. Positionsbestimmungen und Perspektiven. Berlin: De Gruyter, 43-69. Heath, Christian/ Luff, Paul (1993). Disembodied conduct: interactional asymmetries in video-mediated communication. In: Button, Graham (Hrsg). Technology in Working Order: Studies of Work, Interaction, and Technology. London: Rank Xeror Research Centre, 35-54. Heritage, John (2012). The Epistemic Engine: Sequence Organization and Territories of Knowledge. Research on Language and Social Interaction 45, 30-52. Holler, Judith/ Kendrick, Kobin (2015). Unaddressed participants’ gaze in multi-person interaction: Optimizing recipiency. Frontiers in Psychology 6, 98. doi: 10.3389/ fpsyg.2015.00098. Imo, Wolfgang/ Lanwer, Jens (2019). Interaktionale Linguistik. Berlin: J.B. Metzler. Jokinen, Kristiina (2010). Non-verbal signals for turn-taking and feedback. Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC), 2961-2967. Kendon, Adam (1967). Some functions of gaze direction in social interaction. Acta Psychologica 26, 22-63. Labov, William/ Fanshel, Daniel (1977). Therapeutic discourse: Psychotherapy as conver‐ sation. New York: Academic Press. Lanwer, Jens (2019). Erzählen Im Virtuellen Interaktionsraum. Networx, 84. Abrufbar unter: http: / / www.mediensprache.net/ networx/ networx-84.pdf (Stand: 2.5.2022) Lerner, Gene (2004). Selecting next speaker: The context-sensitive operation of a con‐ text-free organization. Language in Society 32 (2), 177-201. Licoppe, Christian/ Morell, Julien (2012). Video-In-Interaction. “Talking Heads” and the Multinodal Organization of Mobile and Skype Video Calls. Research on Language and Social Interaction 45 (5), 399-429. 316 Elisabeth Zima <?page no="317"?> Luff, Paul/ Heath, Christian/ Yamashita, Naomi/ Kuzuoka, Hideaki/ Jirotka, Marina (2016). Embedded reference: translocating gestures in video-mediated interaction. Research on Language and Social Interaction 49 (4), 342-361. Mondada, Lorenza (2007). Multimodal resources for turn-taking: pointing and the emergence of possible next speakers. Discourse Studies 9 (2), 194-225. Rendle-Short, Johanna (2007). “Catherine, you’re wasting your time”: address terms within the Australian political interview. Journal of Pragmatics 39, 1503-1525. Rossano, Frederico (2012a). Gaze behaviour in face-to-face interaction. Ph.D. dissertation. Max Planck Institute for Psycholinguistics Series. Rossano, Frederico (2012b). Gaze in conversation. In: Sidnell, Jack/ Stivers, Tanya (Hrsg.). The Handbook of Conversation Analysis. Oxford: Wiley-Blackwell, 308-329. Sacks, Harvey (1992). Lectures on conversation. Vol. 1 & 2 Oxford: Basil Blackwell. Sacks, Harvey/ Schegloff, Emanuel A./ Jefferson, Gail (1974). A simplest systematics for the organization of turn-taking for conversation. Language 50 (4), 696-735. Schulte, Olaf A./ Friebel, Martin/ Klotzek, Christian (2001). Aufzeichnung technisch vermittelter Kommunikation -das Beispiel Videokonferenz. Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 2 (2001), 222-242. Schwitalla, Johannes (1993). Namensverwendung und Gesprächskonstitution. In: Löffler, Heinrich (Hrsg.). Dialoganalyse IV, Teil 1: Referate der 4. Arbeitstagung, Basel 1992. Berlin/ Boston: Max Niemeyer, 359-366. Selting, Magret/ Auer, Peter/ Barth-Weingarten, Dagmar/ Bergmann, Jörg/ Bergmann, Pia/ Birkner, Karin/ Couper- Kuhlen, Elisabeth/ Deppermann, Arnulf/ Gilles, Peter/ Günthner, Susanne/ Hartung, Martin/ Kern, Friederike/ Mertzlufft, Christine/ Meyer, Christian/ Morek, Miriam/ Oberzaucher, Frank/ Peters, Jörg/ Quasthoff, Uta/ Schütte, Wilfried/ Stukenbrock, Anja/ Uhmann, Susanne (2009). Gesprächsanalytisches Trans‐ kriptionssystem 2 (GAT 2). Gesprächsforschung Online-Zeitschrift zur verbalen Interaktion, 353-402. Seuren, Lucas M./ Wherton, Joseph/ Greenhalgh, Trisha/ Shaw, Sara E. (2021). Whose turn is it anyway? Latency and the organization of turn-taking in video-mediated interaction. Journal of Pragmatics 172, 63-78. Similiarweb Research Intelligence (2022). Anzahl der Visits pro Monat von Zoom. Abrufbar unter: https: / / de.statista.com/ statistik/ daten/ studie/ 1113081/ umfrage/ anza hl-der-visits-pro-monat-von-zoom/ (Stand: 03.05.2022) Stivers, Tanya/ Rossano, Frederico (2010). Mobilizing responses. Research on Language and Social Interaction 43, 3-31. Multimodale Analysen zu Fremd- und Selbstwahl in ZOOM-Videokonferenzen 317 <?page no="318"?> Stivers, Tanya/ Enfield, Nick.J./ Brown, Penelope/ Englert, Christina/ Hayashi, Ma‐ koto/ Heinemann, Trine/ Hoymann, Gertie/ Rossano, Frederico/ De Ruiter, Jan Peter/ Yoon, Kyung-Eun./ Levinson, Steven C. (2009). Universals and cultural variation in turn-taking in conversation. Proceedings of the National Academy of Sciences 106 (26), 10587-10592. Streeck, Jürgen (2014). Mutual gaze and recognition: Revisiting Kendon’s ‘Gaze direction on two-person interaction’. In: Seyfeddinipur, Mandana/ Gullberg, Marianne (Hrsg.). From Gesture in Conversation to Gesture as Visible Utterance: Essays in Honor of Adam Kendon. Amsterdam: Benjamins, 35-55. Sweetser, Eve/ Stec, Kashmiri (2016). Maintaining multiple viewpoints with gaze. In: Dancygier, Barbara/ Lu, Wie-Iun/ Verhagen, Arie (Hrsg.). Viewpoint and the Fabric of Meaning: Form and Use of Viewpoint Tools across Languages and Modalities. Berlin: De Gruyter, 237-258. Weiß, Clarissa (2018). When gaze-selected next speakers do not take the turn. Journal of Pragmatics 133, 28-44. Weiß, Clarissa (2020). Blick und Turn-Taking in Face-to-Face-Interaktionen. Multimodale Interaktionsanalysen triadischer Gesprächssituationen mit Hilfe von Eye-Tracking. Göttingen: Verlag für Gesprächsforschung. Wittenburg, Peter/ Brugman, Hennie/ Russel, Albert/ Klassmann, Alex/ Sloetjes, Han (2006). ELAN: a Professional Framework for Multimodality Research. Proceedings of LREC 2006, Fifth International Conference on Language Resources and Evaluation, 1556-1559. Zima, Elisabeth (2018). Multimodale Mittel der Rederechtsaushandlung im gemeinsamen Erzählen. Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 18, 241- 273. Zima, Elisabeth (2020). Gaze and recipient feedback in triadic storytelling activities. Discourse Processes 57 (9), 725-748. Zima, Elisabeth/ Weiß, Clarrisa/ Brône, Geert (2019). Gaze and overlap resolution in triadic interactions. Journal of Pragmatics 140, 49-69. 318 Elisabeth Zima <?page no="319"?> Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows Lisa Rhein & Sina Lautenschläger Abstract: With the onset of the SARS-CoV-2 pandemic, scientific knowledge (and non-knowledge) has become a publicly presented, discussed, questioned and problematised commodity. Numerous political talk shows offer a space for such debates, in which scientists communicate their ever-expanding knowledge about the virus to the population. In this chapter, we want to focus on linguistic and multimodal practices that occur above all when scientists draw a border between science, politics and the media. The aim is to analyse the complex interplay of the different actors, linguistic practices and bodily actions as well as the media staging of the guests by the programme editors and camera work focusing on such boundary-drawing practices. Keywords: science communication, expert, role, stance-taking, political talk show, multimodality 1 Einleitung Durch die Sars-CoV-2-Pandemie ist das Wissen unterschiedlichster Fachdis‐ ziplinen, allen voran das der Virologie, von politischer und gesamtgesell‐ schaftlicher Relevanz geworden und wird durch die Virolog: innen selbst in massenmedialen Auftritten unterschiedlichster Art (Podcasts, Polit-Shows, Pressekonferenzen etc.) vermittelt. In und vor den Augen der Öffentlichkeit wechseln die Wissenschaftler: innen damit von der Rolle der Forscher: innen, die Wissen generieren, in die Rolle der Expert: innen, die Wissen vermitteln, und zwar insbesondere „in wissenschaftsfremde Bereiche, allen voran in die Politik“ (Bogner 2021: 79). Die Virolog: innen befinden sich somit an einem Schnitt‐ stellendiskurs, nämlich dem zwischen Wissenschaft, Politik und (Massen-)Me‐ dien. Vor diesem Hintergrund widmet sich unser Beitrag der Selbst- und Fremdpositionierung von Wissenschaftler: innen in Polit-Talkshows, in der jene <?page no="320"?> 1 Der vorliegende Artikel resultiert aus einem Forschungsprojekt zur Wissenschaftskom‐ munikation während der Pandemie („Zwischen Elfenbeinturm und rauer See - zum prekären Verhältnis zwischen Wissenschaft und Politik und seiner Mediatisierung am Beispiel der ‚Corona-Krise‘“, gefördert 2020-2022 von der Klaus Tschira Stiftung) und steht im Kontext verschiedener anderer Studien zu Grenzziehungspraktiken und der Bedeutung diskursiver Rollen und Rollenwechsel von Wissenschaftler: innen im massenmedial vermittelten Corona-Diskurs (siehe Lautenschläger/ Rhein 2022a; Rhein/ Lautenschläger 2022; Lautenschläger et al. i. Dr.). Wir danken der Klaus Tschira Stiftung für die Förderung, die diese Analysen und Studien möglich macht. wissenschaftliche, politische und mediale Logiken und Darstellungspraktiken aufeinandertreffen. Im Fokus steht die Analyse von Vereinnahmungs-, Instru‐ mentalisierungs- und insbesondere Abgrenzungsprozessen zwischen Wissen‐ schaft und Politik. Es geht dabei ganz gezielt nicht um die Politiker: innen, sondern um wissenschaftliche Akteur: innen, die mit dem Beginn der Pandemie gewissermaßen aus dem Elfenbeinturm getreten sind und sich in die raue See begeben haben. 1 Mit diesem Beitrag wollen wir uns eines Forschungsdesiderats annehmen, das wir in vorangegangenen Aufsätzen formuliert haben (Lautenschläger/ Rhein 2022a; Rhein/ Lautenschläger 2022), nämlich der Frage, welche Rolle Multimo‐ dalität bei den von uns untersuchten Grenzziehungspraktiken und Positionierungen der Wissenschaftler: innen in Polit-Talkshows spielt. Mit Multimoda‐ lität meinen wir dabei sowohl die in der medialen Inszenierung genutzten Ressourcen als auch die Multimodalität im Sinne leiblichen Handelns, sprich „Vokalität (einschließlich Sprache und Prosodie), Gestik, Blick, Mimik, die Einnahme von Körperposituren, die Bewegung im Raum und der Umgang mit Objekten“ (Deppermann 2018: 58). Vor diesem Hintergrund möchten wir daher zum einen analysieren, wie sich Moderator: innen und Virolog: innen leiblich und gesprochen-sprachlich zu einander verhalten, vor allem mit Blick auf die Verhandlung von epistemischer Autorität und Zuständigkeit und die damit verbundenen Grenzziehungsprak‐ tiken und Positionierungen. Zum anderen ist relevant, dass die Zuschauer: innen vor den Endgeräten eine audiovisuell transkribierte (Holly 2010) Version des im Studio geführten Gesprächs rezipieren und daher - ebenso wie wir als Analytikerinnen - das leibliche Handeln der geladenen Gäste stets perspekti‐ viert durch die Art der Kameraführung und die Auswahl der ausgestrahlten Sequenzen verfolgen; das gilt für Live-Sendungen ebenso wie für die hier betrachteten aufgezeichneten Polit-Talkshows. Denn nicht nur die Gesprächs‐ organisation wird redaktionell geplant, sondern auch die filmische Darstellung und Inszenierung der Gäste (siehe z. B. Luginbühl 2021). Nach der Aufnahme des Gesprächs werden die einzelnen Einheiten zusammengeschnitten und dabei 320 Lisa Rhein & Sina Lautenschläger <?page no="321"?> 2 Unter einer Bauchbinde ist eine Einblendung meist am unteren Bildrand zu verstehen, in der die eingeblendeten Gäste genannt und knapp charakterisiert werden (z. B. Titel und Funktion, zugehörige Institution) (zur Bedeutsamkeit dieser Inserts siehe Lautenschläger/ Rhein 2022b). 3 Für einen Überblick über Auftritte von Wissenschaftler: innen in Polit-Talkshows während der Pandemie, die unterschiedlichen Logiken der Domänen Wissenschaft, Politik und Medien sowie Rollenkonflikte, Verortungs-, Positionierungs- und Grenz‐ ziehungspraktiken siehe Lautenschläger/ Rhein 2022a, b; Rhein/ Lautenschläger 2022; Janich et al. 2023; Lautenschläger et al. i. Dr.) bestimmte Kameraperspektiven gewählt, die z. B. bestimmte Beteiligungsrollen der Gäste sowie deren Beziehungen untereinander andeuten bzw. gar erst herstellen (siehe Holly 2012). Auch hier kommt Multimodalität als Analyseper‐ spektive zum Tragen: Das Zusammenspiel verschiedener Elemente wie der Kameraführung und den daraus hervorgehenden sichtbaren Bildausschnitten, das Abspielen von Einspielern und kurzen Clips, aber auch Einblendungen von Bauchbinden, 2 Grafiken, Statistiken und Bildern etc., sorgt bei der Rezeption der jeweiligen Sendung für eine bestimmte Wahrnehmung, die sich von der des anwesenden Studiopublikums unterscheidet. Somit gilt es bei der Analyse ebenfalls zu berücksichtigen und zu hinterfragen, wie durch Multimodalität (zusätzliche) Bedeutungskomponenten generiert werden und wie durch Pro‐ duktion und Redaktion sprachliche Äußerungen „anders lesbar“ (Holly 2010: 374) gemacht, d. h. kommentiert und überformt werden. Diese Fragen wollen wir angesichts der multimodalen Komplexität des (Polit-)Talkshow-Formats exemplarisch anhand einer einzelnen Sendung, nämlich Markus Lanz vom 01.04.2021, beantworten, wobei wir uns im Hinblick auf genuin sprachliche Praktiken von Wissenschaftler: innen in Polit-Talkshows bereits auf Vorstudien stützen können. Im Folgenden wird zunächst auf die Multimodalität von Polit-Talkshows eingegangen (Kap. 2). Im Anschluss werden die besonders relevanten Praktiken des Verortens, Positionierens und des Grenzziehens vorgestellt (Kap. 3), bevor das Korpus und die Methode dargelegt werden (Kap. 4), um in Kap. 5 detailliert auf die multimodale Stützung und Inszenierung dieser Praktiken einzugehen. Der Beitrag schließt mit einem Fazit, in dem Perspektiven sowie Potenziale einer möglichen Anschlussforschung aufgezeigt werden (Kap. 6). 2 Zur Multimodalität von Polit-Talkshows In diesem Beitrag soll vor allem die Multimodalität von Polit-Talkshows fokus‐ siert werden. 3 Bei Gesprächen in Polit-Talkshows handelt es sich um solche, die „in ihrer Machart von Anfang an medienspezifischen Regeln“ folgen, bei Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 321 <?page no="322"?> 4 Die redaktionelle und rollenbezogene Verortung von Personen in Bauchbinden haben wir am Beispiel von Karl Lauterbach analysiert (siehe Lautenschläger/ Rhein 2022b). denen also genau geplant wird, „wer wann wo worüber und auf welche Art miteinander spricht und wie das Ganze filmisch dargestellt wird“ (Luginbühl 2021: 248). Entsprechend werden Fernsehgespräche als „eine Art Aufführung bzw. eben eine Performanz für das Publikum vor dem Fernseher“ (Luginbühl 2021: 249) verstanden, die vor allem auf Unterhaltsamkeit zielt. Für Polit-Talkshows und deren Rezeption ist maßgeblich, dass durch die au‐ diovisuelle Transkriptivität „dem Sprecher die alleinige Auktorialität entzogen wird und er die ‚performative Letztfassung‘ seiner Äußerungen nicht mehr selbst kontrolliert“ (Holly 2010: 374). Akteur: innen sind demnach teilweise „an Instanzen technischer Medialität aus[ge]liefert, die dann auch nahezu un‐ merklich auf den Rezipienten wirken können“ (Holly 2010: 374). Das Gesprächs‐ geschehen wird stets durch die Kameraarbeit vermittelt, daher müssen die Zuschauer: innen vor den Endgeräten diesem transkribierenden ‚Blick der Ka‐ mera‘ folgen; sie können lediglich Aus- und Zusammenschnitte betrachten und werden somit in spezifischer Weise bei der Rezeption gelenkt. Diese audiovisuelle Transkriptivität erfüllt nach Holly (2015) drei Funkti‐ onen, die ineinander übergehen: Die erste transkriptive Funktion der Kamera‐ arbeit besteht in der Makrogliederung und Mikrodynamisierung der Sendung durch Einspieler, durch das Einblenden von Bauchbinden, durch Kamerafahrten sowie den Wechsel von Kameraeinstellungen und -bewegungen (siehe Holly 2015: 131). Bauchbinden haben eine kontextualisierende Funktion: In ihnen werden „nicht nur Namen, Parteizugehörigkeiten und Funktionen der Teil‐ nehmer, sondern auch ihre inhaltlichen Positionen“ (Holly 2015: 131) genannt. 4 Die Gäste werden somit spezifisch „in ihrer sendungsrelevanten Funktion“ (Burger/ Luginbühl 2014: 183) charakterisiert. Ebenso wird das Sendungsthema eingeblendet, sodass die Rezipient: innen an den Anlass des Gesprächs erinnert werden. Kamerafahrten und der Wechsel von Kameraeinstellungen dienen der Abwechslung: So wie man im Face-to-Face-Gespräch die Blickrichtung stetig verändert, simuliert und imitiert die Kamera das menschliche Blickverhalten für die Zuschauenden, indem unterschiedliche Personen aus verschiedenen Perspektiven eingeblendet werden (siehe Holly 2015: 132). Die zweite transkriptive Funktion besteht in der Inszenierung von Interak‐ tion, d. h. in der Kommentierung und Dramatisierung des Gesagten (siehe Holly 2015: 125). Durch die Kameraarbeit werden Beteiligungsrollen inszeniert: Personen werden als Adressat: innen, als Unterstützer: innen oder Gegner: innen von Äußerungen im Bild gezeigt (siehe Holly 2015: 126). Deswegen werden auch 322 Lisa Rhein & Sina Lautenschläger <?page no="323"?> Gesprächsteilnehmer: innen eingeblendet, die gerade nicht sprechen, um ihnen entweder eine bestimmte Beteiligungsrolle zuzuschreiben oder um generell das Rückmeldeverhalten der Hörer: innen zu zeigen, da diese „durch Mimik, Blick, Nicken, Körperpositur etc. zur Konstitution des interaktiven Handelns bei[tragen]“ (Deppermann 2018: 63). Die Kamera bearbeitet bzw. inszeniert und konstruiert somit auch die Beziehungsebene der Akteur: innen, wobei Ka‐ meraeinstellungen sozialsemiotisch interpretiert werden: Beispielsweise kann eine in Großaufnahme frontal und von unten gezeigte Person Intensität, ein hohes Involvement und einen überlegenen Status nahelegen - ganz wie in nicht kameravermittelten sozialen Situationen auch, wobei die Deutung hochgradig ambivalent sein kann (siehe Holly 2015: 134). Die dritte transkriptive Funktion besteht in der Darstellung der Akteur: innen: Die Bildregie entscheidet, wer sichtbar ist. Wird eine Person in den Fokus gerückt, geht dies in der Regel mit der „Zuschreibung einer bestimmten Beteili‐ gungsrolle“ (Holly 2015: 139) und damit einer Selbst- oder Fremdpositionierung einher (s. Kap. 3). Durch die Einblendung von „markierten Hörern“ (Holly 2012: 186; s. o.) und die Sichtbarmachung ihrer Mimik wird das Gesprochene gleichzeitig oder nachträglich transkribiert: Je nachdem, wer eingeblendet wird, können die mimischen und gestischen Reaktionen genutzt werden, um Sprecher: in und Hörer: in als Antagonist: innen oder Verbündete zu inszenieren. Die Kameraführung mit der jeweils einzelnen Einblendung von Personen im Wechsel oder über die Schulter hinweg wird konkret dazu genutzt, diese Beziehungen zu konstruieren (siehe Holly 2015: 140). Diese knappe Übersicht zeigt, dass die „Kameraeinstellungen und ihre Mon‐ tage durch Umschnitt […] als kulturelle Praktiken der Bedeutungskonstitution verstanden werden“ (Holly 2015: 127) können und damit massiv auf das ein‐ wirken, was und vor allem wie die Zuschauer: innen vor den Endgeräten das Gespräch und die dort Interagierenden wahrnehmen. Ein zentrales Element von Polit-Talkshows sind ebenso die hinter oder neben den Gesprächsbeteiligten eingeblendeten Bilder, Grafiken und Statistiken. Oft‐ mals sollen letztere spontan von den anwesenden Wissenschaftler: innen aus‐ gewertet, für die Rezipient: innen verständlich erläutert und mit Hintergrundinformationen versehen werden. Da in den folgend analysierten Sequenzen solche Grafiken und Statistiken keine Rolle spielen, soll hier in gebotener Kürze ausschließlich auf Bilder (siehe Abb. 1 bis 4) und deren kommunikative Funktion(en) eingegangen werden. Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 323 <?page no="324"?> 5 Zur detaillierten vergleichenden Darstellung der Stärken und Schwächen von Sprache und Bild siehe z.-B. Klug (2016, 2021), Holly (2011) und Stöckl (2004, 2011). Jedes Zeichensystem hat semiotische Stärken und Schwächen, 5 wobei Bilder bzw. Bildzeichen „als besonders wahrnehmungsnahe Zeichen begriffen [werden] […], denen ein deutlich höherer Aufmerksamkeitswert zukommt als sprachlichen Zeichen“ (Klug 2016: 173, Herv. i. O.). Sie werden, wie auch Emotionen, in der rechten Hirnhemisphäre verarbeitet und haben daher „die Eigenschaft, Inhalte leichter emotionalisieren zu können als sprachliche Zei‐ chen“ (Klug 2016: 173, Herv. i. O.). Sie sind durch die simultane, ganzheitliche Wahrnehmung schnell zu perzipieren, semantisch dicht, wahrnehmungsnah sowie gedächtnis- und wirkungsstark (siehe Stöckl 2011: 48 f.); im kommunika‐ tiven Gebrauch lassen sie sich mit ihnen vielzählige „illokutive Intentionen verfolgen“ (Stöckl 2004: 380), allen voran „emotionale Appelle“ (Stöckl 2011: 49). Bilder können sehr gut Konkretes, z. B. äußere Charakteristika von Objekten, darstellen; Abstraktes hingegen visualisieren sie nur metonymisch und meta‐ phorisch (siehe Klug 2016: 174). In der gegenseitigen Bezugnahme sind Sprache und Bild „semantisch parallelisiert“ (Stöckl 2004: 358): Metonymien kommen immer dann vor, wenn sich nur Teile bzw. assoziativ verknüpfte Inhalte zum begleitenden Text visualisieren lassen. Metaphorische Sprach-Bild- Bezüge liegen z. B. dort vor, wo die übertragene Bedeutung eines sprachlichen Ausdrucks im Bild dargestellt wird (Stöckl 2004: 385). Durch ihre semantische Dichte sind Bilder in der Lage, Emotionen zu konkre‐ tisieren, denn [g]enau da, wo es nicht nur um die abstrakt-deskriptive ‚Vermittlung von Sachinfor‐ mationen‘, sondern eben auch um die Darstellung konkret-sichtbarer Details und die deontische ‚Vermittlung emotionaler Eindrücke‘ geht (Kroeber-Riel/ Esch 2015: 121), ist die bildliche […] Darstellung prägnanter bzw. effizienter als die sprachliche. Hier kann das Bild tatsächlich ‚mehr als 1000 Worte sagen‘ (Klug 2021: 211, Herv. i.-O.). Außerdem kommt Bildern durch ihre Wahrnehmungsnähe „ein Glaubwürdig‐ keitsbonus“ (Klug 2016: 176, Herv. i. O.) zu, nach dem Credo „Was ich zeige, hat Beweiskraft“ (Holly 2011: 243). Kurzum: Ihre ganz grundlegenden Funktionen „sind das Auslösen unmittelbarer emotionaler Reaktionen sowie das Abbilden von Weltausschnitten und die damit verbundene dokumentarische Evidenz“ (Stöckl 2004: 382). Bildrhetorische Funktionen im Covid-19-Diskurs haben Gräf und Hennig (2020) anhand von Corona-Sondersendungen der öffentlich-rechtlichen Sender 324 Lisa Rhein & Sina Lautenschläger <?page no="325"?> analysiert. Sie zeigen, wie und mit welchen semiotischen Ressourcen die Sondersendungen Weltmodelle und -entwürfe vermitteln, z. B. durch die Aus‐ wahl von „Drehorte[n], Kameraeinstellungen, Möglichkeiten der Lichtsetzung, potenzielle[n] InterviewpartnerInnen und Interviewfragen, den Inhalt von Bauchbinden etc., unter denen jeweils ausgewählt wird und die im filmischen Syntagma kombiniert auftreten“ (Gräf/ Hennig 2020: 15). Sie attestieren der Berichterstattung „eine hyperbolische Krisenrhetorik“, „die Protokollierung der Auswirkungen des Virus im Sinne der politischen Maßnahmen“ und die Inszenierung „einer vollständig negativen Weltsicht“, wobei die gewählten Bilder diese „einseitige Krisenrhetorik“ unterstützen (Gräf/ Hennig 2020: 15 f.). Auch diese Formen der Bildrhetorik findet sich in den Polit-Talkshows, was in der Ergebnisdarstellung gezeigt wird. 3 Verortungen, Positionierungen und Grenzziehungen von Wissenschaftler: innen Wissenschaftler: innen bilden im Laufe ihrer akademischen Karriere nicht nur Kompetenz und Expertise, sondern auch eine Fachidentität aus, die eng an fachinterne Konventionen, Selbstbilder, Werte etc. geknüpft ist (siehe Rhein 2015: 286). In Kontexten der Wissensvermittlung und -aushandlung treten sie als Repräsentant: innen ihrer Disziplin auf, wobei es nötig sein kann, die eigene Fachidentität zu thematisieren, wie bereits gezeigt werden konnte (siehe Lautenschläger/ Rhein 2022a). Das Nennen der eigenen Fachidentität erfüllt in interdisziplinären, wissenschaftlichen Diskussionen verschiedene Funktionen, die sich auch für Äußerungen in den Polit-Talkshows nachweisen lassen: Perspektivierung des Redebeitrags aus einer ganz bestimmten Rolle heraus (z. B. als Virolog: in, als Bürger: in etc., siehe Lautenschläger/ Rhein 2022a, b), Kon‐ trastierung von Disziplinen, Reflexion von und Identifikation mit der eigenen Fachkultur und ihrer Arbeitsweise, Distanzierung von der eigenen Disziplin, Einleitung oder Rechtfertigung von Kritik (siehe Rhein 2015: 289-317). Solche Nennungen der Fachidentität, sei es durch die Wissenschaftler: innen selbst oder durch die Moderator: innen der Polit-Talkshows oder andere Gäste, beschreiben wir als Praktik des Verortens. Darunter fallen nicht nur Äußerungen, in denen die Sprecher: innen explizit auf „den spezifischen sozialen Ort, von dem aus sie ihre […] Urteile fällen“ (Roth 2018: 303), verweisen, sondern auch solche, in denen sie - als Fremd-Verortung - extern von den Moderator: innen in Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 325 <?page no="326"?> 6 Am Beispiel von Karl Lauterbach, der bis zu seinem Amtsantritt als Gesundheitsmi‐ nister sowohl in seiner Rolle als (SPD-)Politiker als auch als Mediziner in Sendungen eingeladen wurde, konnte gezeigt werden, wie diese Fremd-Positionierung abgelehnt bzw. bestätigt wird (siehe Lautenschläger/ Rhein 2022b). einer bestimmten Weise adressiert und sichtbar gemacht werden. 6 Verortungen sind basal und erfolgen in den betrachteten Polit-Talkshows relativ früh: Wissenschaftler: innen verorten sich selbst in der Domäne Wissenschaft bzw. werden von den Moderierenden so vorgestellt und adressiert, und vollziehen unter dieser (Fremd- oder Selbst-)Verortung dann (positionierende) Sprech‐ handlungen. Zum Teil lassen sich diese als Inszenierungsressourcen für Exper‐ tise identifizieren, wie beispielsweise „ANALYSIEREN, ERKLÄREN, ZITIEREN, INTERPRETIEREN, BEGRÜNDEN, SCHLUSSFOLGERN, BEURTEILEN und BEWERTEN, PROGNOSTIZIEREN, den Adressaten ORIENTIEREN / EMPFEH‐ LUNGEN GEBEN“ (Klemm 2016: 184). Während ANAL Y S I E R E N , ZITI E R E N , INT E R P R E ‐ TI E R E N , P R O G N O S TIZI E R E N oder S C HL U S S F O L G E R N Sprechhandlungen sind, die sich zur Praktik Wissensgenerierung zählen lassen, gehören E R K LÄR E N und B E G RÜN D E N zur Praktik des Verständlichmachens von wissenschaftlichen Erkenntnissen. Virulent sind im massenmedial geführten Corona-Diskurs die bewertenden Sprechhandlungen ( B E U R T E IL E N , B E W E R T E N und E M P F E HL U N G E N G E B E N ), da sie jenseits der Wissenschaftlichkeit als politische Positionierung gedeutet werden (können). Mit Positionierung sind in Orientierung an Du Bois (2007) und Spitzmüller (2013) jene Äußerungen gemeint, die sich als bewertende bzw. stellungnehmende (zustimmende, ablehnende, korrigierende etc.) Äußerungen auf Vorangehendes beziehen und mit einer Verortung einhergehen können, aber nicht müssen. So ist beispielsweise Brinkmanns Äußerung zu den Maßnahmen, die von der Politik zur Eindämmung der Pandemie getroffen wurden, als politisches Statement mit einer starken Negativbewertung zu lesen: (1) Maischberger. Die Woche, 19.12.2020 Maischberger: Naja, der Einzelhandel schon, der ja heute auch gesagt hat, Ihre Empfehlungen sind der Todesstoß für ganz viele Läden, die jetzt gerade in dieser Zeit ihr Geschäft machen. Das heißt, es gibt natürlich auch andere Schäden, es gibt noch Leute, deren Existenz zugrunde geht, die übrigens deshalb auch krank werden. Es gibt Menschen, die die psychischen Erkrankungen haben in diesen, äh in dieser Zeit sehr zugenommen. Es gibt Gewalt zuhause an Kindern und Frauen. Brinkmann: ((unterbricht)) Deshalb ist ja diese Wischi-Waschi-Strategie, die wir grad fahren, einfach nicht richtig. 326 Lisa Rhein & Sina Lautenschläger <?page no="327"?> 7 Dass und wie die Zusammensetzung der Gäste Einfluss auf die (Selbst-)Verortung hat, konnte am Beispiel von Karl Lauterbach gezeigt werden (siehe Lautenschläger/ Rhein 2022b). 8 Beide Beispiele wurden bereits ausführlich in Lautenschläger und Rhein (2022a: 86 f.) diskutiert. Brinkmann positioniert sich in Opposition zu den Maßnahmen und bewertet sie als nicht richtige „Wischi-Waschi-Strategie“. Auch wenn diese Positionierung aus einer wissenschaftlichen Expertise heraus entstehen mag, ist dies hier nicht explizit angezeigt (z. B. durch eine entsprechende Begründung) und lässt damit die Verortungsbasis offen, von der aus Brinkmann ihr Urteil fällt. Mit Verortungen gehen nicht nur Positionierungs-, sondern auch Grenzzie‐ hungspraktiken einher. In anderen Studien konnte bereits gezeigt werden, dass und wie Wissenschaftler: innen wie Melanie Brinkmann, Hendrik Streeck oder Alexander Kekulé die Grenze zwischen Wissenschaft auf der einen und Politik bzw. Medien auf der anderen Seite ziehen bzw. verteidigen (Lauten‐ schläger/ Rhein 2022a; Rhein/ Lautenschläger 2022) und dass diese Grenzzie‐ hungen in ihrer Nachdrücklichkeit auch durch Unbehagen angesichts der Situation motiviert sind: Werden die Wissenschaftler: innen z. B. von den Moderierenden dazu aufgefordert, politische Bewertungen abzugeben oder konkrete Prognosen zu formulieren, reagieren sie oftmals mit erkennbarem Unbehagen (siehe Janich et al. 2023) und ablehnend-grenzziehend. Unter Grenzen verstehen wir mit Kleinschmidt (2014) interaktive Konstruktionen, denn sie beruhen „auf einer gemeinschaftlichen Übereinkunft. Ändert sich diese jedoch, und zwar dadurch, dass sie nicht mehr kontrolliert und praktiziert wird, verlieren auch die Erscheinungsformen ihre limitierende Funktion. Die Zuschreibung als Grenze erlischt.“ (Kleinschmidt 2014: o. S.) Grenzen müssen also von Akteur: innen wiederholt sichtbar gemacht, ge‐ wahrt und verteidigt werden, damit ihr Status gültig bleibt (siehe Kleinschmidt 2014: o. S.). Dennoch sind Grenzen sozial nicht immer wirksam und werden auch nicht von allen an einem Diskurs beteiligten Personen als solche wahr‐ genommen (siehe Komlosy 2011: 90). Ein solches ‚Erlöschen‘ oder zumindest Verwischen der Grenze zwischen den Domänen Politik und Wissenschaft wird durch die Art der Fragestellungen seitens der Moderator: innen und auch durch die Zusammensetzung der geladenen Gäste forciert. 7 Dadurch werden die Wissenschaftler: innen zu Grenzübertritten angeregt, was sie in den meisten Fällen aber ablehnen. Stattdessen kontrollieren und re-etablieren sie eine ihnen wichtige Grenze, indem sie sie sprachlich aufrechterhalten oder immer wieder ziehen (siehe Lautenschläger/ Rhein 2022a, b; Rhein/ Lautenschläger 2022), was das folgende Beispiel illustriert 8 : Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 327 <?page no="328"?> 9 Das Gesamtkorpus umfasst 100 Polit-Talkshows, die von Februar 2020 bis April 2021 auf den öffentlich-rechtlichen Sendern ausgestrahlt wurden: Anne Will, Maischberger. Die Woche (Das Erste), Markus Lanz, Maybrit Illner (ZDF), Phoenix Runde, Unter den Linden (Phoenix) und Hart aber fair (WDR). Die Sendungen wurden personenbe‐ zogen ausgewählt, wobei wir uns auf die Wissenschaftler: innen Melanie Brinkmann, (2) Markus Lanz, 28.05.2020 Lanz: ((richtet sich mit Körperzuwendung und Blickkontakt an Hendrik Streeck)): Aber äh zu Herrn Ramelow: Ist das, was Herr Ramelow macht, total leichtsinnig oder ist das, was Herr Ramelow macht, genau richtig und sind die anderen sozusagen viel zu ängstlich, viel zu streng? Weil das ist ja die Frage, die sich daraus ergibt. Streeck: Ja, aber ähm da haben Sie meine Rolle noch nicht verstanden. Ich bin Virologe äh ich kann nicht die Politik von Herrn Ramelow beurteilen und übrigens auch nicht die Politik von den anderen fünfzehn Ministerpräsi‐ denten. Ich möchte in keiner Haut von irgendeinem Ministerpräsidenten stecken. Lanz versucht Hendrik Streeck ein politik-bewertendes Statement zu entlocken (Bewertung von Ramelows Handeln), was Streeck aber mit Verweis auf seine Rolle verweigert. Streeck verortet sich explizit in der Wissenschaft, wenn er sich als Virologen bezeichnet und damit diese Rolle betont: Aus wissenschaftlicher Perspektive sei es ihm unmöglich, eine solche Bewertung vorzunehmen. Der Versuch von Lanz, Streeck zu einer Grenzüberschreitung zu bringen, scheitert, weil Streeck die Grenze zwischen Wissenschaft und Politik vor allem mit Hinweis auf Kompetenzgrenzen zieht bzw. aufrechterhält und eine konkrete Bewertung metakommunikativ verweigert. Die Grenzen werden durch vielfältige sprachliche Praktiken gezogen, z. B. durch die Thematisierung der unterschiedlichen Logiken, die sich durchaus auch als Politik- und Medienkritik niederschlägt (siehe Kap. 5.2). Generell zeigt sich bei den Grenzziehungen musterhaft, dass die Wissenschaftler: innen auf die eigene wissenschaftliche Rolle verweisen und sich in einer bestimmten Disziplin verorten, die gleichzeitig eine Aufgabenteilung und damit eine disziplinär begrenzte, dadurch fachlich aber gestärkte epistemische Autorität indizieren. 4 Datenkorpus, -aufbereitung und -analyse Um die Grenzziehungspraktiken von Wissenschaftler: innen im politisch-me‐ dialen Kontext auch multimodal und in ihrer szenischen Aufbereitung tiefer‐ gehend analysieren zu können, beschränken wir uns exemplarisch auf eine Polit-Talkshow und damit eine Virologin: 9 Es handelt sich um die Sendung 328 Lisa Rhein & Sina Lautenschläger <?page no="329"?> Sandra Ciesek, Christian Drosten, Alexander Kekulé, Karl Lauterbach, Michael Meyer- Hermann, Hendrik Streeck und Lothar H. Wieler fokussiert haben. Markus Lanz vom 01.04.2021 (Dauer: 77 Minuten), in der neben der Wissen‐ schaftlerin Melanie Brinkmann die zwei Politiker Michael Kretschmer und Wolfgang Kubicki sowie die Journalistin und politische Beobachterin Anja Maier zu Gast sind. Diese Sendung erscheint als besonders geeignet, weil sich in dieser Pandemiephase bereits eine gewisse Gereiztheit und Frustration auf Seiten der Wissenschaftler: innen eingestellt hat, die zu scharfen Grenzzie‐ hungen, Positionierungen und auch scharfer Kritik am politischen Geschehen geführt hat (siehe Lautenschläger et al. i. Dr.; Janich et al. 2023). Das Gesprochen-Sprachliche wurde mittels der Software f4x literal transkri‐ biert und händisch überarbeitet. In einem ersten Schritt wurde die Sendung mit Blick auf Positionierungs- und Grenzziehungspraktiken analysiert und re‐ levante Stellen markiert, um im zweiten Schritt diejenigen Stellen auszuwählen, die besonders markant sind mit Blick auf das leibliche Handeln, eingeblendete Bilder/ Grafiken und Kameraperspektiven. Visuelles wurde bestmöglich in Stills eingefangen, um daran weitere semiotisch-leibliche Ressourcen (Gestik, Mimik, Blick, Körperhaltung und Körperwendung) sowie die Kameraführung und damit einhergehende Bildausschnitte dokumentieren zu können, die auch die jeweils eingeblendeten Bilder und Grafiken enthalten. Zudem wurden die für die Ana‐ lyse relevanten Elemente im Transkript verschriftlicht. Die Datenaufbereitung orientiert sich an den Untersuchungszielen, da notwendigerweise aus der Fülle der vorhandenen Elemente verschiedener Modi eine Auswahl getroffen werden musste. Die Analyse der Sendung erfolgt vor dem Hintergrund der Interaktionalen Linguistik, um das interaktive Zusammenspiel der Beteiligten erfassen zu können. Dabei geht es nicht nur um das Gesprochene, sondern auch um die be‐ nannten Aspekte der multimodalen Interaktion, wie sie uns als Zuschauer: innen audiovisuell transkribiert präsentiert werden (siehe Deppermann 2018; Holly 2015). Der analytische Fokus liegt auf den Grenzziehungs-, Verortungs- und Positionierungspraktiken und auf der Manifestation des Zusammenspiels der semiotischen Ressourcen. Dabei schließen wir uns dem Praktiken-Begriff von Habscheid (2016) an, der diese generell als „Prozesse verkörperten Betragens“ (Habscheid 2016: 137) definiert und somit Leiblichkeit prominent setzt. Kom‐ munikative Praktiken sind dabei als eine Unterkategorie zu verstehen, „die 1. in einer allgemeinen ‚Infrastruktur‘ zwischenmenschlicher Interaktion verankert sind […], und die 2. u. a. aufgrund situierter Zeichenverwendungen als Handeln Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 329 <?page no="330"?> 10 Dabei handelt es sich um eine Entwicklung, die sich im Laufe des Pandemiegeschehens zugespitzt hat. Wurden politik- und medienkritische Äußerungen in den ersten beiden Pandemiewellen (Frühjahr und Herbst 2020) tendenziell vermieden oder nur äußerst zurückhaltend formuliert, zeigt sich im Frühjahr 2021 zunehmendes Unbehagen und steigende Frustration seitens der Wissenschaftler: innen (siehe dazu Janich et al. 2023; Lautenschläger et al. i. Dr.) 11 Die Transkripte werden in Tabellenform wiedergegeben; in der ersten Spalte findet sich die Nummerierung der Stills und des zugehörigen Redetextes, in der zweiten Spalte sind die Stills eingefügt, in der dritten die gesprochen-sprachlichen Äußerungen, und in der vierten werden weitere audiovisuelle Merkmale dokumentiert. Die unterstrichenen Wörter in der Tabelle zeigen an, ab wann das linksstehende Still zu sehen ist; die - und damit als Praxis - verständlich werden“ (Habscheid 2016: 137). Sprach‐ liche Praktiken wiederum sind in kommunikative Praktiken eingebettet, sie sind situierte zeichenhafte Verkörperung bzw. vom Körper gelöste (z. B. schriftliche) Materialisierung von Handeln - und damit von Praxis - durch Sprache als möglicher Bestandteil kommunikativer Praktiken. In diesem Sinne kann man mit Ehlich (1998) Sprache als ‚Medium‘ von Praxis auffassen (Habscheid 2016: 137). 5 Verorten, Positionieren, Grenzziehen als multimodale Praktiken Vor dem Hintergrund bisheriger Studien zu gesprochen-sprachlichen Grenz‐ ziehungspraktiken in Polit-Talkshows (siehe Lautenschläger/ Rhein 2022a, b; Rhein/ Lautenschläger 2022; Janich et al. 2023; Lautenschläger et al. i. Dr.) soll sich hier nun - wie so häufig als Desiderat formuliert - der Multimodalität dieser Sendungen angenommen werden. Die bereits als musterhaft erkannten Grenz‐ ziehungspraktiken werden im Folgenden sowohl im Hinblick auf Leiblichkeit, sprich Para- und Nonverbalität, als auch mit Blick auf die mediale Konstruk‐ tion bzw. audiovisuelle Transkriptivität analysiert. Im Zentrum stehen jene Sequenzen, in denen die grundsätzliche Unterscheidung des wissenschaftlichen und des politischen Handlungs- und Kompetenzfeldes grenzziehend expliziert wird. Dies geschieht zum einen durch Rollen- und Verantwortungszuschreibung (5.1), zum anderen auch durch explizite Medien- und vor allem Politik-Kritik 10 (5.2). 5.1 Grenzziehung durch Rollen- und Verantwortungszuschreibung In der ersten Beispielsequenz 11 (00: 18: 42-00: 19: 23) zieht Melanie Brinkmann eine Grenze durch die Zuschreibung von Verantwortlichkeiten, als sie von Kretschmer nach einem möglichen Szenario für den Sommer 2021 gefragt wird: 330 Lisa Rhein & Sina Lautenschläger <?page no="331"?> Kursivierungen hingegen markieren den Moment, in dem die rechts in der Tabelle ste‐ henden nonverbalen Aspekte (Gestik, Mimik) bzw. der Wechsel der Kameraperspektive einsetzen, sofern diese nicht mit dem Einsetzen der neuen Zeile beginnen. 12 1 Kretschmer: Was bedeutet, wir werden den Virus nicht los? Können wir es erreichen, dass der Alle Gäste und der Moderator sind im Bild zu sehen; im Hin‐ tergrund hinter Lanz ist ein Bild eingeblendet 12 2 Sommer 2021 so ähnlich wird wie 20, also mit sehr viel Freiheit, mit sehr viel auch Möglichkeiten im wirtschaftlichen Bereich. Gastronomie, Hotellerie, fragen die Leute ja. Dadurch, dass wir Kretschmer ist allein im Bild, schaut Brink‐ mann an 3 jetzt noch einmal wirklich das Infektionsgeschehen runterdrücken. Hilft uns dann diese vielleicht 30, 40 Prozent für Impfungen in der Bevölkerung? Also ist das ein Szenario, was Sie für möglich halten? - Kretschmer und Brinkmann wenden sich ei‐ nander zu und schauen ei‐ nander an 4 Brinkmann: Also wenn wir - Brinkmann lehnt sich zurück, blickt weiter zu Kretschmer Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 331 <?page no="332"?> 5 jetzt nicht Maßnahmen ergreifen, die die Kontakte reduzieren. Wie das genau aussieht, ist nicht mein Job. - Brinkmann blickt Kretschmer an, dieser nickt „hmh“ 6 Ich sag mal, Sie müssen die reduzieren. Wir wissen genau, wo es zu viel in Kontakten kommt. - Brinkmann lehnt sich wieder etwas hin zu Kretschmer, der sich eher distan‐ ziert positioniert Tabelle 1: Transkript 1.1: Grenzziehung durch Rollen- und Verantwortungszuschreibung Noch während seiner Ausführungen, die mehrfach in Frageform formuliert sind, wendet sich Kretschmer jedoch über seine Körperhaltung direkt an Melanie Brinkmann, d. h. er fordert speziell von Brinkmann als Expertin eine Einschätzung zur aktuellen Situation und zukünftigen Entwicklung („Also ist das ein Szenario, was Sie für möglich halten? “, Z. 3). Brinkmann lehnt sich, als sie mit ihrer Antwort ansetzt, zuerst in ihrem Sessel zurück (Z. 4). Ihre Antwort bleibt hinsichtlich des Agens zunächst vage: Es ist nicht eindeutig, auf welche Akteursgruppe das Pronomen wir in „wenn wir jetzt nicht Maßnahmen ergreifen, die die Kontakte reduzieren“ referiert. Unter Einbezug des danach Geäußerten lässt sich das Personalpronomen aber eindeutig als auf die Politik bezogen begreifen, da Brinkmann Wissenschaft („Wir wissen genau…“, Z. 6) und Politik („Wie das genau aussieht“, Z. 5) einander als Instanzen implizit ge‐ genüberstellt. In dem Moment, in dem Brinkmann eigene Entscheidungsmacht und -verantwortung verbal zurückweist („ist nicht mein Job“, Z. 5), wechselt die Kameraperspektive hin zu einer Frontalaufnahme von ihr (zuvor sind Kretschmer und Brinkmann von der Seite zu sehen). Durch ein Vorbeugen und die die Hinwendung zu Kretschmer in Kombination mit dem expliziten Hinweisen auf die Notwendigkeit politischer Entscheidungen („Sie müssen die reduzieren“, Z. 6) schreibt sie die Handlungsmacht ihm als Vertreter der Politik zu. Kretschmer stimmt dieser Zuschreibung durch Kopfnicken und zustimmendem Rückmeldesignal „hmh“ zwar zu, sein Zurücklehnen kann aber 332 Lisa Rhein & Sina Lautenschläger <?page no="333"?> 13 Dieser amüsierte Gesichtsausdruck von Kretschmer resultiert noch aus einer voran‐ gegangenen Verwirrung von Brinkmann und einem kurzen humorvollen Austausch zwischen den Gästen und ist nicht als Reaktion auf das in diesem Moment von Brinkmann Gesagte zu verstehen. angesichts dieser Verantwortungszuschreibung als Ausweichen interpretiert werden (Z. 6). Im weiteren Verlauf des Gesprächs findet sich eine ähnliche, aber mit Blick auf Verantwortungs- und Rollenzuschreibung wesentlich explizitere Sequenz (00: 45: 40-00: 45: 52): 1 Brinkmann: Wir haben es mit neuen Varianten zu tun, Kretschmer lä‐ chelt Brinkmann amüsiert an 13 2 und das muss man der Bevölkerung. Und das ist Brinkmann schaut Kretschmer ein‐ dringlich an, ges‐ tikuliert mit der rechten Hand 3 IHR Job. Ich muss forschen, ich muss andere Sachen machen. SIE als Politiker müssen das klar kommunizieren. Brinkmann blickt Kretschmer in die Augen, wendet sich ihm mit dem ge‐ samten Ober‐ körper zu, nimmt die rechte Hand zur Hilfe und zeigt kurz auf Kretschmer Tabelle 2: Transkript 1.2: Grenzziehung durch Rollen- und Verantwortungszuschreibung Brinkmann verortet sich hier selbst in der Rolle als Wissenschaftlerin („Ich muss forschen“, Z. 3) und schreibt Kretschmer als Vertreter der Politik die Aufgabe Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 333 <?page no="334"?> 14 Dieses Foto wird als Abb. 1 wieder aufgenommen und analysiert. zu, mit Blick auf notwendige Corona-Maßnahmen für Transparenz zu sorgen („Und das ist IHR Job […] SIE als Politiker müssen das klar kommunizieren“, Z. 3). Durch die Kretschmer zugewendete Körperhaltung und eine auf ihn gerichtete Zeigegeste wird diese personaldeiktische Adressierung vereindeutigt und die Zuschreibung unterstrichen. Auf der (para-)verbalen Ebene wird diese Nachdrücklichkeit auch durch den Wechsel vom unbetonten Indefinitpronomen man („das muss man der Bevölkerung“, Z. 2) zu den betonten Personalpronomen („IHR Job“, „SIE als Politiker“) deutlich. Durch Körpersprache, Mimik, intensiven Augenkontakt und scharfen, akzentuierten Tonfall gewinnt dieser Appell also multimodal an Eindringlichkeit, die durch den Kamerafokus auf Brinkmann in der Halbtotalen, der ihre Mimik und Gestik einfängt, verstärkt wird. Im folgenden Transkriptausschnitt (00: 20: 16-00: 22: 03) kontrastiert Brink‐ mann in ihren Redebeiträgen die unterschiedlichen Handlungsfelder von Wis‐ senschaft und Politik, die sich durch unterschiedliche Kompetenzbereiche (wis‐ senschaftliches Beraten vs. politisches Entscheiden und Umsetzen) begründen: 1 - Lanz: Aber noch mal, Herr Kretschmer hat ja ganz konkrete Frage gestellt nach Ihrem Gefühl, was wird das heißen? Wir werden bis ins nächste Jahr hinein damit Brinkmanns Kopf ist von der Seite zu sehen, im Hintergrund ist bildfüllend ein Foto 14 eingeblendet; ab diesem Standbild Herauszoomen bis zu nachfol‐ gendem Still 2 beschäftigt sein. Was heißt das von Lockdown zu Lockdown oder - -Brinkmann: Ja eben nicht. Das ist ja, das ist ja ein Brinkmann ist von hinten, Lanz von vorne und Kretschmer von der Seite zu sehen; das Foto befindet sich weiter im Hin‐ tergrund hinter Kretschmer 334 Lisa Rhein & Sina Lautenschläger <?page no="335"?> 3 Zustand, das hält ja kein Mensch mehr aus. Das, Brinkmann ist im Fokus, sie schaut nach unten und ist sehr involviert 4 also seien wir doch mal ganz ehrlich, was hat die Wissenschaft, jetzt habe ich Sie hier mal so nett neben mir sitzen, - Brinkmann richtet sich dabei auf und dreht sich mit dem Oberkörper zu Kretschmer, schaut ihn an 5 was hat die Wissenschaft im Oktober geraten? -Lanz: ((lacht)) Es steht eine Drohung im Raum. ---Kretschmer schaut über‐ rascht und amü‐ siert zu Brink‐ mann 6 Kretschmer: Ich habe dann entschieden im November einen Lockdown, zunächst mal für Sachsen, dann haben wir ihn in ganz Deutschland gemacht, und ich habe am 3. März, ist nicht ganz die Antwort auf Ihre Frage, aber sie erklärt ein bisschen, am 3. März gesagt, diese Öffnung und da bin ich bei Ihnen, die wir damals Ernster, kon‐ zentrierter Ge‐ sichtsausdruck von Kretschmer, Hände vor der Brust gefaltet; die ist Kamera‐ einstellung halb‐ total, Inszenie‐ Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 335 <?page no="336"?> 15 Mit talking head werden als im Zentrum stehende Personen bzw. Autoritäten be‐ zeichnet, denen man zuhört (siehe Klemm 2016: 185). vorgenommen haben, die ist rung als talking head 15 7 falsch, weil wir die Voraussetzungen nicht dafür geschaffen haben, ein recht hohes Infektionsgeschehen, sogar eine steigende Zahl. Und wir haben diese Testkapazitäten noch nicht geschaffen. Und es war der Versuch, der Bevölkerung zu entsprechen, die so sehr den Wunsch nach Öffnungen hat. Ich glaube, dass man damit mehr Schaden, auch um Vertrauen und natürlich auch im Bereich der Pandemie erreicht hat. -Brinkmann: Aber das ist doch ein bisschen so, als wenn mein Lanz, Kretschmer und Brinkmann sind gemeinsam zu sehen 8 Sechsjähriger rumquengelt und sagt: ich will aber keinen Fahrradhelm aufsetzen, Mama. - Brinkmann ist im Fokus, sie ist leicht in Rich‐ tung Lanz und Kretschmer ge‐ dreht 336 Lisa Rhein & Sina Lautenschläger <?page no="337"?> 16 Dieses Foto wird in Abb. 2 wieder aufgenommen und analysiert. 9 Kretschmer: Nein, das ist was anderes. -Brinkmann: Ja, und dann muss- Ne! Aber ich muss doch klar sagen: Hey Leute, und das ist, glaube ich, das Problem, das ist vielleicht noch nicht so klar war, also ich frage mich wirklich, wie man so eine Entscheidung treffen kann. Alle Gäste und der Moderator sind gemeinsam im Bild (fast die gesamte Bühne); im Hintergrund ist ein Foto ein‐ geblendet; 16 Ka‐ merafahrt hin zu folgendem Standbild 10 Erstmal im Januar ist klar: da kommt die Variante und die Modellierungen waren eindeutig. -Kretschmer: Ja, es stimmt. Brinkmann schlägt mit der rechten Hand‐ kante auf die linke, nach oben geöffnete Hand im Rhythmus der Silben von ein-deu-tig 11 Brinkmann: Es war eindeutig kommuniziert, und ich kann mir da auch keinen Vorwurf machen. Ich war auch laut genug mit vielen anderen Kollegen. So. Und es wurde nicht reagiert. - Kretschmer, Brinkmann und Maier sind im Bild; Brinkmann gestikuliert mit offenen, erho‐ benen Handflä‐ chen; Kretschmer hat einen ernsten Gesichtsaus‐ druck Tabelle 3: Transkript 1.3: Grenzziehung durch Rollen- und Verantwortungszuschreibung Lanz fragt zunächst nicht explizit nach wissenschaftlicher Evidenz, sondern nach Brinkmanns „Gefühl“ bezüglich der Corona-Lage im nächsten Jahr (Z. 1-2): Das von ihm verwendete Futur in Kombination mit der Frage signalisiert, dass Lanz eine Prognose von Brinkmann hören will („was wird das heißen? Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 337 <?page no="338"?> Wir werden bis ins nächste Jahr hinein damit beschäftigt sein? “). Er fordert eine wissenschaftliche Einschätzung und signalisiert, dass er die potenzielle Fehlerhaftigkeit anerkennt. Mit dem Adverb damit ist konkret die Pandemie und die dadurch ausgelöste Überlastung in den Krankenhäusern gemeint, was durch das im Hintergrund eingeblendete Foto aufgegriffen wird. Abb. 1: Foto neben/ hinter Brinkmann, in Tabelle 5: Z. 1 und 2 Dort erkennt man eine im Krankenhaus arbeitende Person, die mit der Hand (einer angedeuteten Faust) an der Stirn an einer Glasscheibe lehnt. Sie ist in voller Schutzmontur und hat die Augen geschlossen, was zusammen mit dem Blick und der Körperhaltung indexikalisch als Ausdruck der Erschöpfung gedeutet werden kann. Das Foto zeigt - hier seine semantische Dichte nutzend und direkt emotionsverbunden wirkend (siehe Stöckl 2011) - die durch das Adverb referenzierte fatale Situation in den Krankenhäusern: erschöpftes, überarbeitetes und überlastetes Personal (metonymisch steht die gezeigte eine Person für eine ganze Gruppe der Bevölkerung, nämlich die Krankenhausmit‐ arbeiter: innen), zu viele Todesfälle, Gefahr einer Triage etc. Ein hierdurch emotional aufgeladenes Bild symbolisiert die „Corona-Krise“ ganz im Stil der von Gräf und Hennig (2020) herausgearbeiteten „Krisenrhetorik“. Während Brinkmann die Frage von Lanz beantwortet, wendet sie sich an den neben ihr sitzenden Politiker Kretschmer (Z. 4-5) und adressiert ihn konkret mit einer von Lanz als Drohung („Es steht eine Drohung im Raum“, Z. 5) gewerteten Frage mit metakommunikativem Kommentar: „also seien wir doch mal ganz ehrlich, was hat die Wissenschaft, jetzt habe ich Sie hier mal so nett neben mir sitzen, was hat die Wissenschaft im Oktober geraten? “ Mit der Formel „seien wir doch mal ganz ehrlich“ markiert Brinkmann einen neuen Gesprächsabschnitt, in dem Kretschmer - hier in seiner Rolle als Stellvertreter der Politik adressiert - 338 Lisa Rhein & Sina Lautenschläger <?page no="339"?> zu mehr Ehrlichkeit aufgefordert wird. Dass das personaldeiktische Pronomen wir exklusiv gemeint ist, zeigt sich an der implizit bleibenden Opposition Wissenschaft versus Politik: Brinkmann verlangt von Kretschmer das ehrliche Ein- und Zugeständnis, dass die Wissenschaftler: innen bereits im Oktober entsprechende Ratschläge gegeben haben, die aber nicht in politische Praxis überführt wurden, was zu einer Verschlechterung der gesellschaftlichen und pandemischen Lage geführt hat. Kretschmer und Brinkmann sind während der kurzen Sequenz nicht gleich‐ zeitig im Bild, sondern sie werden durch jeweils Einzelaufnahmen in Kom‐ bination mit den konfrontativ-vorwurfsvollen Äußerungen Brinkmanns als Antagonist: innen inszeniert (Z. 3-6). Auf die Frage „was hat die Wissenschaft im Oktober geraten? “ erläutert Kretschmer das politische Handlungsfeld; er erklärt seine Entscheidung basierend auf der wissenschaftlichen Empfehlung im Oktober und gesteht Fehler ein (Z. 6-7). Brinkmann greift seine Erklärung, dass er mit der Öffnung dem Wunsch der Bevölkerung entsprochen habe, wieder auf und zieht eine Analogie zum kindischen Verhalten ihres Sohnes heran, der sich gegen das Aufsetzen eines Fahrradhelms wehrt, obwohl es dafür vernünftige Gründe gibt. Explizit („aber das ist doch ein bisschen so als wenn“) wird hier kindliche Unvernunft seitens der Bevölkerung mit fehlerhaften, weil zu nachgiebigen Entscheidungen der Politik (in der Mutter-Rolle) gleich‐ gesetzt. Anschließend rekonstruiert Brinkmann das Geschehen im Januar (Z. 10): „Erstmal im Januar ist klar: da kommt die Variante und die Modellierungen waren eindeutig“). Dabei verwendet sie eine Taktstock-Gestik (Fricke 2012: 26) und schlägt mit der rechten Handkante auf die linke, nach oben geöffnete Hand im Rhythmus der Silben von ein-deu-tig, wobei diese Taktung ihren Aussagen eine gewisse Schärfe verleiht. Kretschmer stimmt ihr zu („Ja, es stimmt“, Z. 10), ist dabei aber nicht im Bild zu sehen. Brinkmann setzt nach und verweist darauf, dass die Zahlen und Gefahren von den Wissenschaftler: innen „laut genug“ und „eindeutig kommuniziert“ worden seien, sodass man der Wissenschaft keinen Vorwurf machen könne - wohl aber der Politik: „So. Und es wurde nicht reagiert“ (Z. 11). Als Brinkmann sich fordernd und kritisch auf die Politik bezieht, ist im Hintergrund Abb. 2 eingeblendet. Das Bild kann einerseits als metaphorische Wiederaufnahme des Stillstands des öffentlichen Lebens durch das Virus im Allgemeinen interpretiert werden oder aber andererseits vor dem Hintergrund von Brinkmanns Äußerungen enggeführt werden auf politische (Fehl-)Entschei‐ dungen: Hätte die Politik auf die Wissenschaft gehört, wären die im Frühjahr 2021 umgesetzten Maßnahmen ggf. vermeidbar gewesen. Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 339 <?page no="340"?> Abb. 2: Ausschnitt des Bildes hinter Markus Lanz, in Tabelle 5: Z. 9 Brinkmann bringt in dieser Sequenz ihre Frustration über die beschränkte Wir‐ kungsmacht der wissenschaftlichen Empfehlungen zum Ausdruck. Die Frustra‐ tion über das spannungsgeladene Verhältnis zwischen Wissenschaft und Politik zieht sich durch die gesamte Sequenz, die in dem Transkript wiedergegeben ist. In Brinkmanns Gestik, Mimik und Körperhaltung ist dieser Frust deutlich erkennbar, die Opposition von ihr als Wissenschaftlerin und Kretschmer als Po‐ litiker wird durch die Kameraarbeit (Einstellungen und Umschnitte) verstärkt. Eingeblendete Bilder zeigen zudem die Resultate des politischen Nicht-Handelns (erschöpftes Klinikpersonal, zum Stillstand gekommenes öffentliches Leben) und tragen damit zusätzlich zur Emotionalisierung der Debatte bei. Brinkmann kontrastiert mittels Verortungs- und Positionierungspraktiken, die gesamtheitlich zur Grenzziehung genutzt werden, nicht nur einzelne Rollen- und Aufgabenbereiche, sondern auch Unterschiede im Verständnis der Quali‐ tätskriterien von Kommunikation, die im nächsten Abschnitt anhand einer anderen Sequenz genauer betrachtet werden. 5.2 Medien- und Politik-Kritik Im folgenden Transkriptteil (00: 15: 49-00: 16: 42) kritisiert Melanie Brinkmann aus ihrer wissenschaftlichen Perspektive die Art der Kommunikation, die von Medien und Politik betrieben wird. Im Zuge dessen stellt sie ein wissenschaftli‐ ches kommunikatives Ethos („offene und ehrliche Kommunikation“ von „Wahr‐ heit“; genauer s. u.) einer politischen und medialen Kommunikation gegenüber, die unverantwortlich Hoffnung schüre und nicht einhaltbare Versprechen gebe. Damit grenzt sie die Domäne Wissenschaft mitsamt dem dort postulierten kommunikativen Ethos von den Domänen Medien und Politik ab: 340 Lisa Rhein & Sina Lautenschläger <?page no="341"?> 1 Lanz: Sollte man auf jeden Fall aufnehmen und und und vielleicht auch mal den Ausblick wagen also. Ich habe einen Satz von Ihnen im Ohr, Frau Brinkmann, wo Sie sagen, auch das übrigens eines dieser Versprechen, das so durch die durch die Lande geistert und an das man sich ja so Brinkmann ist zusammen mit Kretschmer zu sehen, die Kör‐ perhaltung der beiden ist ent‐ spannt 2 klammert, wenn man sagt okay, wo ist das bisschen Hoffnung, das wir mal brauchen? Im Sommer wird das Ding durch sein. Sie sagen, ja schminkt euch das ab. Lanz ballt die Hände zu Fäusten, als würde er etwas festhalten und umklammern; er schaut dabei auf seine Hände 3 -- Brinkmann: Ja, es ist eine fatale Kommunikation, weil es einfach nicht eintreffen wird. Das ist genauso, wie: Wir beschaffen Tests für alle. Das ist auch nicht eingetroffen, also es das ist immer schlecht, was zu versprechen, ähm wo man eigentlich selber schon weiß, eh das können wir eigentlich gar nicht erreichen. Und dann enttäusch ich natürlich die Bevölkerung. Und ich glaube, eine ---Brinkmann: wi‐ schende Hand‐ bewegung vom Körper weg -Brinkmann hebt die Hand mit der Innenfläche auf Brusthöhe Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 341 <?page no="342"?> 4 offene und ehrliche Kommunikation. Also. Erstens, eh schätzt das Brinkmann ist allein in der Halbtotalen zu sehen 5 Volk das deutlich mehr als diese leeren Versprechen. Und auch wenn die Wahrheit unschön ist. Und die die Wahrheit ist, dass wir im -Brinkmann wendet sich mit Blick (ange‐ deutet auch mit dem Ober‐ körper) an Kretschmer 6 Sommer mit dieser Pandemie nicht durch sind. -- Brinkmann blickt zu Lanz, im Hintergrund ist das Foto von Menschen im Park zu sehen Tabelle 4: Transkript 2.1: Grenzziehung durch Medien- und Politik-Kritik Eingeleitet wird diese kurze Sequenz mit der Feststellung von Markus Lanz, dass man sich an die Hoffnung auf einen Corona-freien Sommer klammere und dass Brinkmann dies für unwahrscheinlich halte (Z. 1-2). Lanz verkörpert dieses ‚an die Hoffnung klammern‘ deutlich sichtbar durch die zu Fäusten geballten Hände, auf die sich auch sein Blick richtet (Z. 2). Diese Form der Koordination von Blick und Geste sorgt zum einen dafür, dass die „Geste zur Kenntnis genommen wird“ (Streeck 2016: 63), zum anderen wird eine imaginierte Realität performt (siehe Streeck 2016: 63): Wie bei einem Kinegramm (z. B. sich die Haare raufen) wird das Gesagte hier durch seinen vermeintlich wörtlichen Sinn kör‐ perlich verstärkt. Das dadurch entstehende gestische Symbolbild von Hoffnung wird zudem visuell bestätigt, gestärkt und quasi multipliziert, und zwar durch ein hinter Markus Lanz eingeblendetes Foto von größeren Menschengruppen 342 Lisa Rhein & Sina Lautenschläger <?page no="343"?> bei sonnigem Wetter in einem Park, teilweise oberkörperfrei, ohne Abstand und Masken: Abb. 3: Ausschnitt des Fotos hinter Markus Lanz, in Tab. 4: Z. 2 Die für die Pandemiebekämpfung so typischen großen Abstände zwischen Personen sind hier nicht zu erkennen, stattdessen stehen die Menschen in größeren und kleineren Gruppen zusammen. Das Bild erinnert an Sommertage aus einer Zeit vor Corona; es exemplifiziert die Hoffnungen und Wünsche nach dem von Lanz thematisierten „durch die Lande geisternde[n] Versprechen“ nach Normalität und verstärkt dadurch die emotionalisierende Wirkung des von Lanz Gesagten. Melanie Brinkmann wird nun als eine Art ‚Zerstörerin‘ dieser Hoffnung adressiert („Sie sagen, schminkt euch das ab“) und damit als Gegnerin einer großen Gemeinschaft von Hoffenden positioniert. Noch mit Kretschmer in der Halbtotalen erklärt sie diese Art der Kommunikation als „fatal“ (Z. 3), womit sie die von Lanz getätigte Positionierung annimmt und durch eine Selbstpositionierung bestätigt. Sie kritisiert dabei sowohl die Medien als auch die Politik, woraufhin die Kamera sie und Kretschmer einzeln in den Blick nimmt (zwischen halbnah und nah). An Brinkmanns Körperwendung hin zu Lanz erkennt man, wenn sie die „richtige“ Art der Kommunikation erläutert (Z. 4), dass nun eine Antwort bzw. Reaktion auf den Moderatorenbeitrag erfolgt. Damit wird sie als talking head inszeniert. Brinkmann plädiert für eine offene und ehrliche Kommunikation, um die Bevölkerung nicht zu enttäuschen und keine illusorischen Hoffnungen zu schüren. Damit fordert sie eine Kommuni‐ kationskultur, die sich (wie in der Wissenschaft üblich) an der Vermittlung von Wahrheit ausrichtet - eine Kommunikation, die weder täuscht noch enttäuscht. Bei dem Ausdruck „leeren Versprechen“ wendet sie sich körperlich Kretschmer zu (Kopf, Blick, teilweise Schultern) und signalisiert damit, dass Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 343 <?page no="344"?> 17 Dieses Einreißen der selbstgezogenen Grenzen ist musterhaft für die Äußerungen von Wissenschaftler: innen im späteren Stadium der Pandemie (siehe Janich et al. 2023; Lautenschläger et al. i. Dr.). sie ihm die leeren Versprechen persönlich oder als Vertreter der Politik (Z. 5) zuschreibt. Implizit stellt sie damit ihre eigene wissenschaftliche Haltung (Wahrheit) der politischen Praxis ([leere] Versprechen) als kommunikations‐ ethisch unvereinbar einander gegenüber. Gleichzeitig überschreitet sie durch die Kritik am politischen Handeln bzw. der mangelhaften Kommunikation die Grenze zwischen Wissenschaft und Politik, die zuvor noch gezogen wurde. 17 Durch die Kritik an der Art der Kommunikation von Politik und Medien (genauer bei Lautenschläger et al. i. Dr.), hier nonverbal unterstützt bzw. in der jeweiligen Adressierung vereindeutigt, vollzieht Brinkmann eine Grenzzie‐ hung in der Art einer Selbstvergewisserung - nicht zuletzt auch durch den Hinweis, dass es Aufgabe der Wissenschaft sei, auch eine unschöne Wahrheit auszusprechen. Damit verortet sie sich als Wissenschaftlerin und positioniert sich mittels einer negativen Bewertung gegenüber Medien und Politik. Dies erfolgt reaktiv als Rechtfertigung auf eine Fremdzuschreibung durch Lanz als ‚Opponentin‘ und ‚Zerstörerin‘ allgemeiner Hoffnungen: Jemand, in diesem Falle sie als Vertreterin der (Natur-)Wissenschaft, muss die Rolle derjenigen übernehmen, die die ungeschönte Wahrheit vermittelt. In einer weiteren Sequenz (00: 25: 42-00: 26: 41) kritisiert Brinkmann die Tat‐ sache, dass man es in Deutschland nicht geschafft habe, „ein einheitliches Ziel“ im Umgang mit dem Corona-Virus zu formulieren. Im Zuge dessen verweist sie auf unterschiedliche Zielsetzungen und nennt ein Ziel, das in der Gesprächs‐ runde und auch im politischen und medialen Diskurs bereits thematisiert wurde, nämlich die Verhinderung einer Überlastung der Intensivstationen. Dieses Ziel bewertet sie negativ durch die Pejorativa „bescheuert“ und „absolut falsch“ und verweist in diesem Zusammenhang auf vorliegende medizinische Erkenntnisse („es funktioniert auch nicht“) (Z. 1-4): 1 Brinkmann: Der Punkt ist doch, wir haben kein, noch nie in dieser Pandemie in Deutschland ein einheitliches Ziel formuliert. Ich kann mich nicht Die gesamte Bühne ist mit den Gästen und dem Moderator im Überblick zu sehen 344 Lisa Rhein & Sina Lautenschläger <?page no="345"?> 2 erinnern. Was ist das Ziel - die Intensivstation nicht zu - Brinkmann ist in der Halbtotalen zu sehen; sie blickt Lanz an und gestikuliert mit der rechten Hand (Zeige‐ finger, Mittel‐ finger und Daumen sind zu‐ sammengeführt) 3 überlasten? Das ist ein ziemlich Brinkmann ist in der Halbtotalen zu sehen; sie blickt nie‐ manden im Be‐ sonderen an und gestikuliert mit der rechten Hand (Zeige‐ finger, Mittel‐ finger und Daumen sind zu‐ sammengeführt) 4 bescheuertes und absolut falsches Ziel. Und wir haben gelernt, es funktioniert auch nicht. Wir kommen, Brinkmann und Kretschmer sind zu sehen, Brink‐ mann wendet sich Kretschmer leicht zu und fo‐ kussiert ihn 5 wir, wir kassieren viele tote Menschen, Brinkmann ist allein im Fokus, sie verwendet Aufzählungs‐ gestik und blickt dabei auf ihre ei‐ genen Hände Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 345 <?page no="346"?> 18 Diese Einblendung wird als Abb. 4 wieder aufgenommen und analysiert. 6 Familienangehörige, die kein die, die keine Eltern mehr haben oder Kretschmer ist im Fokus und schaut Brink‐ mann an 7 Egal. Und ähm zusätzlich sind wir im Dauerlockdown. Das ist das, was ich gesagt hab. Wir haben Brinkmann ist im Fokus, sie blickt auf ihre Hände während der Aufzäh‐ lungsgestik 8 den schlechtesten Weg gewählt. Und der richtige Weg Kretschmer ist im Fokus, der entweder Brink‐ mann anschaut oder zu Boden blickt 9 wäre doch gewesen, mal ein klares Ziel zu formulieren. Und wenn das Ziel, das Ziel Durchseuchung der Gesellschaft ist, bitte. Aber dann Kubicki und Maier werden gezeigt, zwi‐ schen/ hinter ihnen wird sehr groß ein Foto eingeblendet 18 346 Lisa Rhein & Sina Lautenschläger <?page no="347"?> 10 formulieren Sie das auch. Ich will mich gar nicht mit ihnen streiten. Ähm. Aber dann - Kubicki und Maier werden gezeigt, zwi‐ schen/ hinter ihnen wird sehr groß ein weiteres Foto eingeblendet 11 formulieren Sie das Schnitt zu Brink‐ mann, die weiter gestikuliert, diesmal mit of‐ fenen Handflä‐ chen; sie blickt dabei zu ihren Händen 12 auch so, ähm was wir jetzt hier machen, ist ein Durchseuchungskurs. Kretschmer schaut Brink‐ mann amüsiert und überrascht an Tabelle 5: Transkript 2.2: Grenzziehung durch Markierung unterschiedlicher Zielset‐ zungen Dass bei der Thematisierung dieser Uneinheitlichkeit der Zielformulierungen alle Studiogäste gemeinsam im Bild sind, könnte als Sinnbild für diese Mei‐ nungspluralität gewertet werden. Denn nicht nur die beiden anwesenden Politiker sind sich uneinig, auch die weiteren Gäste haben unterschiedliche Herangehensweisen bei der Pandemieeindämmung. Daraufhin wird Brinkmann kurz als talking head in Szene gesetzt (Z. 2-3), wenn sie das Beispielziel formuliert. Bei der Bewertung des Ziels hingegen wird ein anderer Kamerawinkel gewählt, und zwar eine Halbtotale, bei dem nur Brinkman und Kretschmer im Bild sind (Z. 4). Diese Ausweitung des Kamerablicks auf Kretschmer wird durch Brinkmann initiiert, die sich durch Körperhaltung, Mimik, Kopf- und Blickrichtung sowie durch Gestik (durch den „precision grip“, der spezifizierend und präzisierend wirkt; siehe Napier 1980; Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 347 <?page no="348"?> 19 Eine Zielformulierung schließt folgende Aspekte mit ein, die von Brinkmann themati‐ siert werden: 1. überhaupt ein Ziel zu haben, 2. ein angemessenes, adäquates, politisch und medizinisch richtiges Ziel zu haben, 3. dieses Ziel konsistent zu verfolgen und 4. transparent zu kommunizieren. Kendon 2015: 225-247) an Kretschmer wendet. Die Kamera geht den Schwenk mit, womit vereindeutigt wird, an wen sich Brinkmann richtet. Kretschmer als Stellvertreter für die „bescheuerten und absolut falschen Ziele“ nimmt die negativen Bewertungen zunächst hin, versucht aber im Folgenden regelmäßig erfolglos das Wort zu ergreifen, um Brinkmann zu widersprechen. Brinkmann erläutert weiter die negativen Konsequenzen der fehlenden Zielformulierung, 19 wobei sie im Sinne einer Klimax eine die Kern‐ aussage („schlechtester Weg“) verstärkende Aufzählungsgestik (Hochhalten einzelner Finger, Z. 5, 7) mit Blick auf die Konsequenzen entsprechender Fehlentscheidungen verwendet: eine hohe Zahl an Todesfällen, hinterbliebene Familienangehörige, Dauerlockdown. Die Betroffenheit bzw. Empathie in Kretschmers Blick korrespondiert mit dieser Klimax. Daraufhin konkretisiert Brinkmann, dass nicht nur die Zielformulierung an sich, sondern auch deren transparente und klare Formulierung in die Öffentlichkeit hinein wichtig sei (Z. 9-10). Dabei wird zwischen Maier und Kubicki ein Foto eingeblendet, auf dem eine pflegende Person am Bett eines offenbar an Covid erkrankten Menschen steht und diesen medizinisch versorgt: Abb. 4: Ausschnitt des Fotos zwischen Maier und Kubicki, in Tab. 5: Z. 9 Die Funktion des Bildes kann man zum einen als Emotionalisierung beschreiben, weil die gezeigte Situation an belastende Erfahrungen von Bürger: innen in Deutschland anknüpft. Zum anderen hat das Foto auch dokumentarischen 348 Lisa Rhein & Sina Lautenschläger <?page no="349"?> Charakter, indem es einen Weltausschnitt abbildet (siehe Stöckl 2004: 382). Im Zusammenhang mit dem von Brinkmann postulierten „schlechtesten Weg“ und der als fehlend kritisierten Zielformulierung repräsentiert das Bild gleichfalls ein Schreckensszenario, das - da es an Emotionen sowie an Berichte von Klinik‐ personal über katastrophale Zustände anknüpft - unbedingt zu vermeiden ist. Dadurch erhält das Bild das Krisengefühl aufrecht, weil es die Krisenhaftigkeit wieder aufruft (siehe Gräf/ Hennig 2020). Die Politik- und Medienkritik kommt durch Positionierungen zum Ausdruck, die der Grenzziehung dienen. Gegenstand der Kritik ist die als falsch gekenn‐ zeichnete Kommunikation von Medien und Politik, die jeweils unzulässig Hoff‐ nung schürten und Versprechen gäben, die aus wissenschaftlicher Perspektive nicht einhaltbar seien und die Bevölkerung täuschten. Das Zusammenspiel von Brinkmanns Gestik, Mimik und Körperwendung zu Kretschmer, ihr gereizter Tonfall und die Kameraführung, die die beiden Hauptakteur: innen Kretschmer und Brinkmann abwechselnd einzeln fokussiert, verstärkt auch hier die Oppo‐ sition Kritikerin vs. Kritisierter. 6 Zusammenfassung und Forschungsdesiderate Die Ausführungen haben gezeigt, dass und wie Grenzziehungs- und Positionierungspraktiken verbal, paraverbal und nonverbal vollzogen und in der Kamerainszenierung bzw. redaktionellen Nachbearbeitung für Zuschauer: innen sichtbar gemacht, überformt und kommentiert werden. Die von der Wissen‐ schaftlerin Melanie Brinkmann geäußerten Grenzziehungen und Positionie‐ rungen manifestieren sich nicht nur in Redetext und Tonfall, sondern in leibli‐ chen Ressourcen: Körperwendung hin zum Opponenten, Fixierung desselben durch den Blick sowie das Zeigen auf diesen, zudem Vorbeugen bei Engagement und Erregung. Interaktionen und damit auch die Grenzziehungspraktiken werden zudem durch audiovisuelle Transkription sichtbar, und zwar auf zweierlei Weise: Zum einen werden Beteiligungsrollen inszeniert, indem die beiden gegensätzlichen Positionen von Kretschmer und Brinkmann einander auch bildlich gegenüber‐ gestellt werden. Kretschmer wird als Adressat von Brinkmann eingeblendet, wenn diese sich körpersprachlich an ihn richtet, oder wenn er als Adressat ihrer kritischen Aussagen von der Regie identifiziert wird bzw. wenn er als Kritisierter inszeniert werden soll. Dabei steht er stellvertretend für ‚die Politik‘. Zum anderen lässt sich dies auch als Beleg für die sendungsrelevante „Etiket‐ tierung“ der Gäste lesen, denn die Personen werden vor allem dann mit ihren Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 349 <?page no="350"?> hörbegleitenden Reaktionen gefilmt, wenn sie als Antagonist: innen inszeniert werden (können). Die Sequenzen sind mit Blick auf ihre Multimodalität nicht vollumfänglich analysiert. Vor allem die Rolle der Gestik müsste eingehender untersucht werden (z. B. mit Streeck 2016; Fricke 2012). Die Ergebnisse dieser Fallstudie müssten kontrastierend überprüft werden, um Erkenntnisse über typische Verfahren zum Vollzug solcher Praktiken zu gewinnen. Auch das Publikum bzw. das fehlende Publikum im Studio während der Aufzeichnung hat eine wichtige Rückmeldungs- und Kommentierfunktion, die unter Umständen Einfluss nicht nur auf die Sprechhandlungen der Ge‐ sprächsteilnehmer: innen, sondern auch auf deren Rezeption und Bewertung durch die Zuschauenden zuhause hat. Dennoch zeigen die vorgestellten Ana‐ lysen, wie Haltungen, Aussagen und Interaktion multimodal gestützt oder gar verstärkt werden. Interessant wäre die hier noch nicht geprüfte Frage nach möglichen Brüchen und Inkonsistenzen zwischen Gesagtem und audiovisueller Transkription, die das Gesagte nicht konsistent verstärken, sondern in seinem Geltungsanspruch und seiner Wirksamkeit unterminieren (hierzu Holly 2012). Literatur Bogner, Alexander (2021). Die Epistemisierung des Politischen. Wie die Macht des Wissens die Demokratie gefährdet. Stuttgart: Reclam. Burger, Harald/ Luginbühl, Martin (2014). Mediensprache. Eine Einführung in Sprache und Kommunikationsformen der Massenmedien. 4. Aufl. Berlin/ Boston: De Gruyter. Deppermann, Arnulf (2018). Sprache in der multimodalen Interaktion. In: Deppermann, Arnulf/ Reineke, Silke (Hrsg.). Sprache im kommunikativen, interaktiven und kulturellen Kontext. Berlin/ Boston: De Gruyter, 51-86. Du Bois, John (2007). The stance triangle. In: Englebretson, Robert (Hrsg.). Stancetaking in discourse. Subjectivity, evaluation, interaction. Amsterdam: John Benjamins, 139- 182. Ehlich, Konrad (1998). Sprache als Medium. In: Strohner, Hans/ Sichelschmidt, Lorenz/ Hielscher, Martina (Hrsg.). Medium Sprache. Frankfurt a. M. u.a.: Peter Lang, 9-21. Fricke, Ellen (2012). Grammatik multimodal. Wie Wörter und Gesten zusammenwirken. Berlin/ Boston: De Gruyter. Gräf, Dennis/ Hennig, Martin (2020). Die Verengung der Welt. Zur medialen Konstruktion Deutschlands unter Covid-19 anhand der Formate ARD Extra - Die Coronalage und ZDF Spezial. Magazin des Graduiertenkollegs Privatheit der Universität Passau 14, 14-22. 350 Lisa Rhein & Sina Lautenschläger <?page no="351"?> Habscheid, Stephan (2016). Handeln in Praxis. Hinter- und Untergründe situierter sprachlicher Bedeutungskonstitution. In: Deppermann, Arnulf/ Feilke, Helmuth/ Linke, Angelika (Hrsg.). Sprachliche und kommunikative Praktiken. Berlin/ Boston: De Gruyter, 127-151. Holly, Werner (2010). Besprochene Bilder - bebildertes Sprechen. Audiovisuelle Trans‐ kriptivität in Nachrichtenfilmen und Polit-Talkshows. In: Deppermann, Arnulf/ Linke, Angelika (Hrsg.). Sprache intermedial. Stimme und Schrift, Bild und Ton ( Jahrbuch des Instituts für Deutsche Sprache 2009). Berlin/ New York: De Gruyter, 359-382. Holly, Werner (2011). Bildüberschreibungen. Wie Sprechtexte Nachrichtenfilme lesbar machen (und umgekehrt). In: Diekmannshenke, Hajo/ Klemm, Michael/ Stöckl, Hartmut (Hrsg.). Bildlinguistik. Theorien - Methoden - Fallbeispiele. Berlin: Erich Schmidt, 233-253. Holly, Werner (2012). Transkriptiv kontrollgemindert. Automatismen und Sprach-Bild-Überschreibungen in Polit-Talkshows. In: Conradi, Tobias/ Ecker, Gisela/ Eke, Norbert Otto/ Muhle, Florian (Hrsg.). Schemata und Praktiken. Paderborn: Wilhelm Fink, 161-189. Holly, Werner (2015). Bildinszenierung in Talkshows. Medienlinguistische Anmer‐ kungen zu einer Form von „Bild-Sprach-Transkription. In: Girnth, Heiko/ Michel, Sascha (Hrsg.). Polit-Talkshow. Interdisziplinäre Perspektiven auf ein multimodales Format. Stuttgart: ibidem, 123-144. Janich, Nina/ Lautenschläger, Sina/ Rhein, Lisa/ Roth, Kersten Sven (2023). Unbehagen und (politische) Positionierungen: wie Wissenschaftler: innen sich (nicht) positionieren. In: Dang-Anh, Mark (Hrsg.). Politisches Positionieren. Sprachliche und soziale Praktiken. Heidelberg: Winter. Kendon, Adam (2015). Gesture. Visible Action as Utterance. Cambridge: Cambridge University Press. Kleinschmidt, Christoph (2014). Semantik der Grenze. Abrufbar unter: https: / / www.bpb .de/ apuz/ 176297/ semantik-der-grenze (Stand: 30.10.2023) Klemm, Michael (2016). Die multimodale (De-)Konstruktion der Experten. Betrachtungen am Beispiel des Klimawandel-Diskurses im Fernsehen. In: Groß, Alexandra/ Harren, Inga (Hrsg.). Wissen in institutioneller Interaktion (= F.A.L. Bd. 55). Berlin u.a.: Peter Lang, 177-205. Klug, Nina-Maria (2016). Multimodale Text- und Diskurssemantik. In: Klug, Nina-Maria/ Stöckl, Hartmut (Hrsg.). Handbuch Sprache im multimodalen Kontext. Berlin/ Boston: De Gruyter, 165-189. Klug, Nina-Maria (2021). Kleine Texte des Alltags: Was uns z.-B. Zigarettenschachteln alles sagen und zeigen können. In: Pappert, Steffen/ Roth, Kersten Sven (Hrsg.). Kleine Texte (= F.A.L. Bd.-66). Berlin u.a.: Peter Lang, 189-223. Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 351 <?page no="352"?> Komlosy, Andrea (2011). Zwischen Sichtbarkeit und Verschleierung. Politische Grenzen im historischen Wandel. In: Kleinschmidt, Christoph/ Hewel, Christine (Hrsg.). Topo‐ graphien der Grenze Verortungen einer kulturellen, politischen und ästhetischen Kategorie. Würzburg: Königshausen & Neumann, 87-104. Lautenschläger, Sina/ Rhein, Lisa/ Janich, Nina/ Roth, Kersten Sven (i. Dr.). „wir sind wund‐ gescheuert tatsächlich alle“ - Wissenschaftskommunikation zwischen Anspruch und Frustration. In: Gräf, Dennis/ Hennig, Martin (Hrsg.). Corona und mediale Öffentlich‐ keiten. Lautenschläger, Sina/ Rhein, Lisa (2022a). Der geordnete Rückzug. Sprachliche Grenzzie‐ hungen von Virolog: innen in Polit-Talkshows. Zeitschrift für angewandte Linguistik 1, 64-92. Lautenschläger, Sina/ Rhein, Lisa (2022b). Zwischen den Welten? Karl Lauterbachs Rolle(n) in der Pandemie. In: Roth, Kersten Sven/ Wengeler, Martin (Hrsg.). Aptum. Zeitschrift für Sprachkritik und Sprachkultur 01/ 2022, 58-82. Luginbühl, Martin (2021). Fernsehgespräche. In: Hess-Lüttich, Ernest W. B. (Hrsg.). Handbuch Gesprächsrhetorik. Berlin/ Boston: De Gruyter, 247-278. Napier, John R. (1980). Hands. Princeton: Princeton University Press. Rhein, Lisa (2015). Selbstdarstellung in der Wissenschaft. Eine linguistische Untersu‐ chung zum Diskussionsverhalten von Wissenschaftlern in interdisziplinären Kon‐ texten. Frankfurt am Main u.a.: Peter Lang. Rhein, Lisa/ Lautenschläger, Sina (2022). Wissenschaftskommunikation im Spannungs‐ feld von Wissenschaft, Politik und Medien: zur Aushandlung von Gesprächsnormen in Pressekonferenzen und Polit-Talkshows. Fachsprache. Journal of Professional and Scientific Communication 1-2, 20-39. Roth, Kersten Sven (2018). Verortung. Zu Konstruktionen einer argumentativ-aukto‐ rialen Origo in laienlinguistisch-sprachkritischen Texten. In: Wengeler, Martin/ Ziem, Alexander (Hrsg.). Diskurs, Wissen, Sprache. Linguistische Annäherungen an kultur‐ wissenschaftliche Fragen. Berlin/ Boston: De Gruyter, 295-318. Spitzmüller, Jürgen (2013). Metapragmatik, Indexikalität, soziale Registrierung: Zur dis‐ kursiven Konstruktion sprachideologischer Position. Zeitschrift für Diskursforschung 3, 263-287. Stöckl, Hartmut (2004). Die Sprache im Bild - Das Bild in der Sprache. Zur Verknüpfung von Sprache und Bild im massenmedialen Text. Konzepte, Theorien, Analyseme‐ thoden. Berlin/ New York: De Gruyter. Stöckl, Hartmut (2011). Sprache-Bild-Texte lesen. Bausteine zur Methodik einer Grund‐ kompetenz. In: Diekmannshenke, Hajo/ Klemm, Michael/ Stöckl, Hartmut (Hrsg.). Bildlinguistik. Theorien - Methoden - Fallbeispiele. Berlin: Erich Schmidt, 45-70. 352 Lisa Rhein & Sina Lautenschläger <?page no="353"?> Streeck, Jürgen (2016). Gestische Praxis und sprachliche Form. In: Deppermann, Arnulf/ Feilke, Helmuth/ Linke, Angelika (Hrsg.). Sprachliche und kommunikative Praktiken. Berlin/ Boston: De Gruyter, 57-79. Multimodales Verorten, Positionieren und Grenzziehen in Polit-Talkshows 353 <?page no="355"?> Verzeichnis der Autorinnen und Autoren Prof. Dr. Geert Brône KU Leuven Faculty of Arts Blijde-Inkomststraat 21 bus 3308 BE-3000 Leuven geert.brone@kuleuven.be Prof. Dr. Lars Bülow LMU München Lehrstuhl für Germanistische Linguistik Schellingstraße 3 80799 München Lars.Buelow@germanistik.uni-muenchen.de Dr. Katharina Christ Universität Innsbruck Institut für Germanistik Innrain 52 A-6020 Innsbruck katharina.christ@uibk.ac.at Prof. Dr. Kurt Feyaerts KU Leuven Department of Linguistics Blijde-Inkomststraat 21 bus 3308 BE-3000 Leuven kurt.feyaerts@kuleuven.be Prof. Dr. Ellen Fricke Technische Universität Chemnitz Professur Germanistische Sprachwissenschaft Semiotik und Multimodale Kommunikation Thüringer Weg 11 09126 Chemnitz ellen.fricke@phil.tu-chemnitz.de <?page no="356"?> Prof. Dr. Stefan Hauser Pädagogische Hochschule Zug Zentrum Mündlichkeit Zugerbergstrasse 3 CH-6300 Zug stefan.hauser@phzg.ch Prof. Dr. Susanne Kabatnik Universität Trier Computerlinguistik und Digital Humanities Universitätsring 15 54296 Trier kabatnik@uni-trier.de Clara Kindler-Mathôt Europa-Universität Viadrina Kulturwissenschaftliche Fakultät Große Scharrnstraße 59 15230 Frankfurt (Oder) kindler@europa-uni.de Dr. Jan Krasni University of Tyumen Cultural Trends Lab 6 Volodarskovo Street RO-Tyumen y.krasni@utmn.ru Dr. Sina Lautenschläger Universität Magdeburg Fakultät für Humanwissenschaften, Bereich Germanistik Zschokkestraße 32 39104 Magdeburg sina.lautenschlaeger@ovgu.de Dr. Claudia Lehmann Universität Potsdam Institut für Anglistik und Amerikanistik Am Neuen Palais 10 14469 Potsdam claudia.lehmann@uni-potsdam.de 356 Verzeichnis der Autorinnen und Autoren <?page no="357"?> Prof. Dr. Simon Meier-Vieracker Technische Universität Dresden Professur für Angewandte Linguistik Helmholtzstr. 10 1069 Dresden simon.meier-vieracker@tu-dresden.de Prof. Dr. Marie-Luis Merten Universität Zürich Deutsches Seminar Schönberggasse 2 CH-8001 Zürich mlmerten@ds.uzh.ch Dr. Robert Mroczynski Universität Leipzig Institut für Germanistik Beethovenstraße 15 4107 Leipzig robert.mroczynski@uni-leipzig.de Dr. Lisa Rhein Technische Universität Darmstadt Institut für Sprach- und Literaturwissenschaft Residenzschloss, Marktplatz 15 64283 Darmstadt rhein@linglit.tu-darmstadt.de Marcus Scheiber M.A. Universität Vechta Fakultät Geistes- und Kulturwissenschaften Driverstraße 22 49377 Vechta marcus.scheiber@decoding-antisemitism.eu Dr. Steven Schoonjans Alpen-Adria-Universität Klagenfurt Institut für Germanistik Universitätsstraße 65-67 A-9020 Klagenfurt am Wörthersee (Österreich) steven.schoonjans@aau.at Verzeichnis der Autorinnen und Autoren 357 <?page no="358"?> Hagen Troschke Technische Universität Berlin Zentrum für Antisemitismusforschung Kaiserin-Augusta-Allee 104-106 10553 Berlin hagen.troschke@decoding-antisemitism.eu Line Winkelmans KU Leuven Warmoesberg 26 BE-1000 Brussel line.winkelmans@kuleuven.be Dr. Elisabeth Zima Albert-Ludwigs-Universität Freiburg Deutsches Seminar---Germanistische Linguistik Belfortstraße 18 79089 Freiburg elisabeth.zima@germanistik.uni-freiburg.de 358 Verzeichnis der Autorinnen und Autoren <?page no="359"?> Studien zur Pragmatik herausgegeben von Eva Eckkrammer, Claus Ehrhardt, Anita Fetzer, Rita Finkbeiner, Frank Liedtke, Konstanze Marx, Sven Staffeldt und Verena Thaler Pragmatik, das Studium der Sprachverwendung in all ihren Facetten, hat sich zu einer allgemein anerkannten sprachwissenschaftlichen Disziplin entwickelt. Sie hat viele Fragestellungen benachbarter Disziplinen wie der Semantik oder der Syntax in sich aufgenommen und unter neuem Vorzeichen vorangetrieben. Dabei bezieht sie den Spracherwerb und Sprachwandel mit ein und reflektiert die Bezüge zu anderen Wissenschaften, zum Beispiel der Philosophie, Psychologie und Soziologie. Eine Folge dieser Entwicklung ist eine starke Ausdifferenzierung der Pragmatik in unterschiedliche Forschungsstränge und Teilparadigmen. Von der experimentellen bis zur formalen Pragmatik, von der Gesprächsforschung bis zur Textanalyse, von der Soziopragmatik bis zur pragmatischen Syntax erstreckt sich das Feld der pragmatischen Untersuchungsansätze. Die Studien zur Pragmatik bieten zum ersten Mal im deutschsprachigen Raum ein Forum für qualitativ hochwertige Arbeiten zur Pragmatik in ihrer ganzen Breite. Sie sind theoretisch offen für die verschiedenen Strömungen dieser Disziplin und besonders geeignet für solche theoretisch und empirisch begründete Untersuchungen, die die pragmatische Diskussion weiter vorantreiben. Die Bände der Reihe werden einem Peer-Review Verfahren unterzogen. Bisher sind erschienen: 1 Detmer Wulf Pragmatische Bedingungen der Topikalität Zur Identifizierbarkeit von Satztopiks im Deutschen 2019, 260 Seiten €[D] 88,- ISBN 978-3-8233-8260-7 2 Eva-Maria Graf, Claudio Scarvaglieri, Thomas Spranz-Fogasy (Hrsg.) Pragmatik der Veränderung Problem- und lösungsorientierte Kommunikation in helfenden Berufen 2019, 306 Seiten €[D] 88,- ISBN 978-3-8233-8259-1 3 Simon Meier-Vieracker, Lars Bülow, Frank Liedtke, Konstanze Marx, Robert Mroczynski (Hrsg.) 50 Jahre Speech Acts Bilanz und Perspektiven 2019, 322 Seiten €[D] 88,- ISBN 978-3-8233-8347-5 4 Kristin Börjesson, Jörg Meibauer (Hrsg.) Pragmatikerwerb und Kinderliteratur 2021, 264 Seiten €[D] 68,- ISBN 978-3-8233-8446-5 5 Marie-Luis Merten, Susanne Kabatnik, Kristin Kuck, Lars Bülow, Robert Mroczynski (Hrsg.) Sprachliche Grenzziehungspraktiken Analysefelder und Perspektiven 2023, 374 Seiten €[D] 88,- ISBN 978-3-8233-8516-5 6 Lisa Soder Diskursmarker im schriftlichen Standard Status, Formen und Funktionen 2023, 520 Seiten €[D] 98,- ISBN 978-3-381-10271-6 7 Susanne Kabatnik, Lars Bülow, Marie-Luis Merten, Robert Mroczynski (Hrsg.) Pragmatik multimodal 2024, 358 Seiten €[D] 88,- ISBN 978-3-8233-8582-0 <?page no="360"?> ISBN 978-3-8233-8582-0 Sowohl Gespräche als auch Texte sind keinesfalls monomodale Kommunikationsanlässe und -angebote, sondern werden in Gestalt multimodaler Praktiken und Artefakte wahrnehmbar. Neben Sprache tragen Ausdrucksmodalitäten wie Gestik, Mimik, Körperhaltung und -bewegung, Stimme, also ganz grundsätzlich Körperlichkeit sowie Schriftbildlichkeit, Bilder, Emojis und mehr wesentlich zur Bedeutungsentfaltung im Kontext bei. Dieser Band nimmt sich der Bestimmung des Verhältnisses von Pragmatik- und Multimodalitätsforschung sowie einer multimodalen Pragmatik an. Die Zusammenführung von Studien zur multimodalen Pragmatik gibt einen Überblick über aktuelle und innovative Forschungsarbeiten, die sich aus einer pragmatischen Perspektive für multimodale Phänomene interessieren. www.narr.de
